Дифференциально-приватный анализ графов

Дифференциально-приватный анализ графов (англ. differentially private analysis of graphs)[1] — область исследований, посвящённая разработке алгоритмов для вычисления точных статистик графов с сохранением дифференциальной приватности. Такие алгоритмы применяются к данным, представленным в виде графа, где вершины соответствуют индивидуумам, а рёбра — взаимоотношениям между ними. Например, рёбра могут обозначать дружбу или схемы коммуникаций. Сторона, обладающая конфиденциальными графовыми данными, может обработать их с помощью дифференциально-приватного алгоритма и опубликовать результаты. Цель дифференциально-приватного анализа графов — создавать алгоритмы для вычисления глобальной информации о графах при одновременной защите приватности индивидуумов, чьи данные хранятся в графе.

Варианты

Дифференциальная приватность накладывает ограничение на алгоритм: интуитивно, требуется, чтобы распределения выходов алгоритма для соседних входов были примерно одинаковыми. Для графа существуют два естественных понятия соседних входов: смежность по рёбрам и смежность по вершинам, что даёт два варианта дифференциальной приватности на графах.

Пусть ε — положительное вещественное число, а  — случайный алгоритм, принимающий граф на вход и возвращающий результат из множества . Алгоритм называется -дифференциально-приватным, если для любых соседних графов и и всех подмножеств из ,

где вероятность берётся по случайности, используемой алгоритмом.

Дифференциальная приватность по рёбрам

Два графа считаются соседними по рёбрам, если они различаются ровно одним ребром. Алгоритм является -дифференциально-приватным по рёбрам, если в определении выше используется именно это понятие соседства. Интуитивно, такой алгоритм гарантирует схожие распределения выходов на любых парах графов, отличающихся лишь одним ребром, тем самым защищая изменения в структуре рёбер.

Дифференциальная приватность по вершинам

Два графа считаются соседними по вершинам, если один из них может быть получен из другого удалением одной вершины и всех прилежащих к ней рёбер. Алгоритм называется -дифференциально-приватным по вершинам, если в определении используется это понятие соседства. Интуитивно, такой алгоритм обеспечивает схожие распределения выходов для пар графов, различающихся одной вершиной и связанными с ней рёбрами, тем самым защищая сведения об отдельном индивидууме. Дифференциальная приватность по вершинам обеспечивает более сильную защиту, чем приватность по рёбрам.

История исследований

Первый дифференциально-приватный по рёбрам алгоритм был разработан Ниссимом, Расходниковой и Смитом[2]. Различие между дифференциальной приватностью по рёбрам и по вершинам было впервые обсуждено Хэем, Миклау и Йенсеном[3]. Однако только спустя несколько лет появились первые дифференциально-приватные по вершинам алгоритмы: их опубликовали Блоки и соавторами[4], Касивасванатан и др.[5], и Чэнь и Чжоу[6]. Во всех этих работах предлагались алгоритмы для публикации отдельной статистики, например, числа треугольников или других подграфов. Расходникова и Смит предложили первый алгоритм дифференциальной приватности по вершинам для публикации вектора статистик, в частности, подсчёта степеней и распределения степеней вершин[7].

Примечания