Чистая комната данных
Чистая комната данных (англ. data clean room, DCR) — это защищённый промежуточный облачный сервис, используемый компаниями для согласованного обмена и совместной работы с чувствительными данными первого уровня, то есть данными, собранными непосредственно от клиентов и потребителей[1]. В противном случае организации используют анонимизированные и искажённые данные для сохранения конфиденциальности таких данных, как персональная идентифицируемая информация (PII).
Чистые комнаты данных применяют бренды, издатели, рекламодатели, а также различные подразделения внутри компаний[2]. Каждая заинтересованная сторона разрабатывает соглашение, определяющее, что именно разрешено и запрещено делать с предоставленными данными. Благодаря использованию DCR для доступа к данным первого уровня других организаций (третичные данные), некоторые эксперты отмечают, что «третичные данные становятся полноправным элементом информационной экосистемы»[3].
Первые чистые комнаты данных появились как инструменты обмена данными в рамках ограждённых систем, в том числе Ads Data Hub от Google. В 2018 году этот продукт был единственным способом использования рекламных данных Google в Европе из-за введения Общего регламента по защите данных (GDPR).
5 июля 2023 года некоммерческая организация IAB Tech Lab, разрабатывающая открытые технические стандарты для цифровой экономики с поддержкой рекламы, выпустила набор общих принципов и операционных рекомендаций по использованию DCR[4].
Мотивы внедрения
Необходимость создания DCR возникла после прекращения поддержки третичных cookie-файлов и внедрения фреймворка AppTrackingTransparency (ATT) от Apple[5]. В 2023 году IAB Tech Lab выпустила спецификацию Open Private Join and Activation (OPJA), призванную обеспечить совместимость чистых комнат данных разных провайдеров[6].
Спрос на чистые комнаты данных также вырос из-за действия в Европе закона GDPR, опасений по поводу утечек данных и ситуаций, когда рекламодатели не знают, какие именно данные покупают[7].
Примеры
В 2019 году компания The Hershey Company предложила создать чистую комнату данных для ритейлеров, чтобы «получить данные, необходимые для оценки того, насколько реклама стимулирует продажи шоколадных плиток». Такой подход позволил бы хранить данные по программам лояльности клиентов совместно с данными о контакте с рекламой. Однако ритейлеры негативно отнеслись к этой инициативе, предпочитая использовать закрытые платформы[8].
В 2023 году Pinterest объявила о внедрении решения для чистой комнаты данных от компании LiveRamp для коллаборации с сетью супермаркетов Albertsons с целью превращения Pinterest в платформу электронной коммерции[5].
Colt Technology Services реализовала тревел-платформу с интеграцией третичных данных, чтобы сотрудники могли видеть данные об эмиссии выбросов и принимать решения для более устойчивых поездок[3].
В 2022 году Acrisure получила права на название стадиона клуба Питтсбург Стилерз Национальной футбольной лиги[9]. Гипотетически, для оценки эффекта от переименования стадиона Acrisure могла бы сотрудничать с Ticketmaster или Kraft Heinz, чтобы измерить отношение болельщиков к смене названия[10].
Преимущества
Использование DCR позволяет организациям совместно работать с другими компаниями и их данными для создания «новых деловых возможностей и улучшения клиентского опыта», а также потенциально «меняет способы взаимодействия организаций при анализе и получении инсайтов из данных, открывая новые возможности для роста и успеха»[3]. При этом участники обмена не имеют доступа к исходным данным друг друга.
Проблемы и ограничения
К основным проблемам использования чистых комнат данных относятся[2]:
- Определение объёма предоставляемых данных
- Управление и мониторинг процесса обмена
- Поиск партнёров для создания совместной DCR
- DCR не полностью решают вопросы приватности и совместного использования данных
- Технические трудности интеграции с остальным программным стеком организации
Проблемы приватности
По данным Федеральной торговой комиссии (FTC), DCR не всегда обеспечивают приватность данных, возможны случаи «приватизационного обмана»[1]. Privacy washing возникает, когда компания декларирует приоритет защиты данных пользователей, но фактически не реализует лучшие практики безопасности[11]. Другими словами, DCR могут содействовать обмену данными между недоверенными сторонами.
Операторы чистых комнат данных возражают против подобных опасений[1]. Мэтт Карасик, вице-президент по продукту компании LiveRamp, утверждает, что при корректной реализации DCR соблюдаются политики приватности, а автоматические механизмы защиты данных предотвращают передачу информации о потребителях. Влад Стесин, сооснователь и главный директор по стратегии Optable, подчёркивает, что DCR «должны быть частью более широкой стратегии сотрудничества с данными» для соблюдения приватности и достижения бизнес-ценности.
Критики считают, что более корректно называть DCR «безопасными», а не «приватными», поскольку операторы контролируют идентификационные графы данных, позволяющие устанавливать связи между идентифицируемыми сущностями[12].
Типы чистых комнат данных
Владелец чистой комнаты данных обладает расширенными полномочиями по управлению обменом информацией. DCR подразделяют на пять основных типов[2]:
- Специализированные DCR (относительно небольшие компании с ограниченным рынком)
- Хранилища данных и озёра данных (например, Snowflake, Google, AWS, Databricks)
- Ограждённые системы и медиакомпании (например, Google)
- Поставщики услуг по загрузке данных (также предоставляют сервисы разрешения идентичности и data marketplace)
- Платформы данных о клиентах (например, Adobe и Blueconic)
Компании
Некоторые компании, работающие с решениями для чистых комнат данных[1]:
- Ads Data Hub от Google
- Amazon Marketing Cloud от Amazon AWS[13][14]
- Roku[15]
- Paramount Pictures[16]
- The Walt Disney Company[17]
- NBCUniversal[18]
Рост популярности DCR привёл к консолидации компаний в данной сфере; в результате этого процесса упор был сделан на простоту интеграции, что сказалось на гибкости тарифов и совместимости сервисов различных провайдеров[19].
Список приобретений в области DCR:
Примечания
- ↑ 1 2 3 4 Schiff, Allison The FTC Thinks Data Clean Rooms May Have A Few Dusty Corners (англ.). AdExchanger (18 ноября 2024). Дата обращения: 9 декабря 2024.
- ↑ 1 2 3 Durga, Apoorv Data clean rooms: A beginner's guide (англ.). MarTech (12 июля 2023). Дата обращения: 29 января 2025.
- ↑ 1 2 3 Bridgwater, Adrian Third-Party Data Is Now First-Class (англ.). Forbes. Дата обращения: 14 января 2025.
- ↑ Hercher, James IAB Tech Lab Blesses Its First Set Of Data Clean Room Specs (англ.). AdExchanger (5 июля 2023). Дата обращения: 10 декабря 2024.
- ↑ 1 2 Boyle, Alyssa How Albertsons Is Piloting Pinterest's New Clean Room (англ.). AdExchanger (19 января 2023). Дата обращения: 2 января 2025.
- ↑ Data Clean Rooms: Separating Fact from Fiction (англ.). Federal Trade Commission (13 ноября 2024). Дата обращения: 7 декабря 2024.
- ↑ Joseph, Seb WTF is a data clean room? (англ.). Digiday (20 марта 2023). Дата обращения: 14 января 2025.
- ↑ Joseph, Seb Hershey's is pitching a 'clean room' for data sharing to retailers (англ.). Digiday (5 февраля 2019). Дата обращения: 14 января 2025.
- ↑ Osdol, Paul Van What is Acrisure? Steelers' stadium has new name; here's what we know about the company (англ.). WTAE (12 июля 2022). Дата обращения: 23 января 2025.
- ↑ Hercher, James AdExplainer: Data Clean Rooms (англ.). AdExchanger (25 июля 2022). Дата обращения: 23 января 2025.
- ↑ Joyce Privacy-Washing: What Is It And How To Stop It From Happening To Your Company (англ.). California Lawyers Association (3 мая 2021). Дата обращения: 10 декабря 2024.
- ↑ AdExchanger Don't Hate, Collaborate; Getting Closure On Disclosures (англ.). AdExchanger (25 октября 2024). Дата обращения: 2 января 2025.
- ↑ Bridgwater, Adrian AWS CEO Selipsky: We Are Making Cloud Easier To Use (англ.). Forbes. Дата обращения: 10 декабря 2024.
- ↑ Hercher, James After A Two-Year Quiet Phase, Amazon's Data Clean Room Service Enters The Market (англ.). AdExchanger (26 октября 2021). Дата обращения: 23 января 2025.
- ↑ McNally, Victoria Roku's Clean Room Evolves Into Its New Form: The Roku Data Cloud (англ.). AdExchanger (6 января 2025). Дата обращения: 23 января 2025.
- ↑ Boyle, Alyssa Paramount Wants Its Competitors To Use Its New Clean Room (англ.). AdExchanger (20 июня 2023). Дата обращения: 23 января 2025.
- ↑ Boyle, Alyssa Disney Integrates With VideoAmp To Bolster Its Clean Room With Measurement (англ.). AdExchanger (1 декабря 2022). Дата обращения: 23 января 2025.
- ↑ Boyle, Alyssa One23: NBCUniversal Highlights Measurement, Data And Playing Nice (англ.). AdExchanger (9 февраля 2023). Дата обращения: 23 января 2025.
- ↑ Frattaroli, Matt Will Clean Room Consolidation Actually Make Collaboration Easier? (англ.). AdExchanger (10 апреля 2024). Дата обращения: 23 января 2025.
- ↑ Hercher, James LiveRamp Acquires Habu, As Walled Gardens Put The Squeeze On Indie Data Collaboration Tech (англ.). AdExchanger (18 января 2024). Дата обращения: 10 декабря 2024.
- ↑ Snowflake Acquires Samooha (англ.). www.snowflake.com. Дата обращения: 2 января 2025.
- ↑ Whiting, Rick Snowflake To Expand Data Clean Room Service Offering With Acquisition. www.crn.com. Дата обращения: 23 января 2025.
Литература
- Guidance and Recommended Practices Version 1.0 — IAB Tech Lab (выпущено 5 июля 2023)
- Open Private Join and Activation (OPJA) specification (выпущено 14 февраля 2024)