Дифференциально-приватный анализ графов

Дифференциально-приватный анализ графов (англ. differentially private analysis of graphs)^[1] — область исследований, посвящённая разработке алгоритмов для вычисления точных статистик графов с сохранением дифференциальной приватности. Такие алгоритмы применяются к данным, представленным в виде графа, где вершины соответствуют индивидуумам, а рёбра — взаимоотношениям между ними. Например, рёбра могут обозначать дружбу или схемы коммуникаций. Сторона, обладающая конфиденциальными графовыми данными, может обработать их с помощью дифференциально-приватного алгоритма и опубликовать результаты. Цель дифференциально-приватного анализа графов — создавать алгоритмы для вычисления глобальной информации о графах при одновременной защите приватности индивидуумов, чьи данные хранятся в графе.

Дифференциальная приватность накладывает ограничение на алгоритм: интуитивно, требуется, чтобы распределения выходов алгоритма для соседних входов были примерно одинаковыми. Для графа существуют два естественных понятия соседних входов: смежность по рёбрам и смежность по вершинам, что даёт два варианта дифференциальной приватности на графах.

Пусть ε — положительное вещественное число, а ${\mathcal {A}}$ — случайный алгоритм, принимающий граф на вход и возвращающий результат из множества ${\mathcal {O}}$ . Алгоритм ${\mathcal {A}}$ называется $\epsilon$ -дифференциально-приватным, если для любых соседних графов $G_{1}$ и $G_{2}$ и всех подмножеств $S$ из ${\mathcal {O}}$ ,

$\Pr[{\mathcal {A}}(G_{1})\in S]\leq e^{\epsilon }\times \Pr[{\mathcal {A}}(G_{2})\in S],$

где вероятность берётся по случайности, используемой алгоритмом.

Дифференциальная приватность по рёбрам

Два графа считаются соседними по рёбрам, если они различаются ровно одним ребром. Алгоритм является $\epsilon$ -дифференциально-приватным по рёбрам, если в определении выше используется именно это понятие соседства. Интуитивно, такой алгоритм гарантирует схожие распределения выходов на любых парах графов, отличающихся лишь одним ребром, тем самым защищая изменения в структуре рёбер.

Дифференциальная приватность по вершинам

Два графа считаются соседними по вершинам, если один из них может быть получен из другого удалением одной вершины и всех прилежащих к ней рёбер. Алгоритм называется $\epsilon$ -дифференциально-приватным по вершинам, если в определении используется это понятие соседства. Интуитивно, такой алгоритм обеспечивает схожие распределения выходов для пар графов, различающихся одной вершиной и связанными с ней рёбрами, тем самым защищая сведения об отдельном индивидууме. Дифференциальная приватность по вершинам обеспечивает более сильную защиту, чем приватность по рёбрам.

Первый дифференциально-приватный по рёбрам алгоритм был разработан Ниссимом, Расходниковой и Смитом^[2]. Различие между дифференциальной приватностью по рёбрам и по вершинам было впервые обсуждено Хэем, Миклау и Йенсеном^[3]. Однако только спустя несколько лет появились первые дифференциально-приватные по вершинам алгоритмы: их опубликовали Блоки и соавторами^[4], Касивасванатан и др.^[5], и Чэнь и Чжоу^[6]. Во всех этих работах предлагались алгоритмы для публикации отдельной статистики, например, числа треугольников или других подграфов. Расходникова и Смит предложили первый алгоритм дифференциальной приватности по вершинам для публикации вектора статистик, в частности, подсчёта степеней и распределения степеней вершин^[7].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

Дифференциально-приватный анализ графов

Варианты

Дифференциальная приватность по рёбрам

Дифференциальная приватность по вершинам

История исследований

Примечания

Категории