Культура данных
Культура данных — понятие, возникшее в практике социального взаимодействия в частном секторе и государственном секторе. Изначально данный термин относился к необходимому условию для участников различных процессов и мероприятий — знанию и использованию источников данных для принятия решений в рамках организационных процессов[1]. Позднее, в ходе обсуждения этики данных, этот термин приобрёл более широкий смысл, затрагивая вопросы проектирования инфраструктур обработки данных, контроль и оценку практик, основанных на данных, а также необходимость изменений с целью сбалансировать влияние работы с данными в организации или сообществе.
История
Термин «культура данных» стал предметом внимания бизнеса и политики с начала XXI века и приобретает всё большую популярность. Изначально идея зародилась при анализе научной продуктивности, затем распространилась на разнообразные сферы оценки эффективности на микро- и макроэкономическом уровнях, после чего её значение укрепилось и в социально-гуманитарных практиках, в том числе — для развития систем образования и здравоохранения[2][3].
Ниже приведены некоторые важные события, повлиявшие на развитие культуры данных в организациях и сообществах:
- В 2000 году Джеффри Боукер (Geoffrey C. Bowker) предложил концепцию «локальной культуры данных» в работах по биоразнообразию[4].
- В 2014 году Microsoft объявила о намерении строить культуру данных в повседневной жизни через свои сервисы — Office 365, Azure, SQL Server[5].
- В 2015 году Microsoft провела серию семинаров о культуре данных совместно с компаниями Hortonworks и KPMG в Великобритании для аналитиков данных и других специалистов по большим данным, предлагая им перенять корпоративные подходы к формированию культуры данных[6].
- В 2017 году в Оттаве (университет Карлтон) состоялась конференция «Data Power», посвящённая способам расширения влияния данных в организациях[7].
- Рахул Бхаргава и Кэтрин Д’Иньяцио (MIT Media Lab) внесли вклад в развитие критической и «популярной» грамотности в данных, предложив более открытые, массовые практики генерации культур данных[8][9].
- В своей книге «Data Feminism» (2020) Кэтрин Д’Иньяцио и Стефани Клейн предложили примеры справедливого и инклюзивного подхода к сбору и использованию данных для расширения возможностей сообществ. Они сформулировали принципы «феминизма данных», включая: анализ и переосмысление власти, признание множественности и контекста, интеграцию человеческих факторов, видимость труда и др[10][11].
Компоненты и функции
Участники — это как производители данных, так и лица, способные изменить культуру данных благодаря своему влиянию. В процессе формирования культуры данных в организации именно участники (работники, члены сообщества, пользователи) на разных уровнях могут определять подходы к сбору данных, гарантировать приватность и качество представления, контролировать влияние их использования (например, в сервисах с алгоритмической обработкой данных или профилированием пользователей). Таким образом, участники могут принимать решения, основываясь на инновационных процессах работы с данными[12], а также участвовать в критической оценке и изменении систем данных[13].
Дата-сайентисты (специалисты по данным) играют важную роль в формировании культуры данных — они эксперты в анализе способов извлечения и обработки информации, в том числе на уровне инфраструктуры, статистики и вычислительных моделей. Они должны связать все элементы системы и поддерживать участие различных стейкхолдеров, одновременно учитывая ограничения собственного технического знания и открытость к диалогу с пользователями и заинтересованными сторонами. С одной стороны, присутствие дата-сайентистов способствует профессионализации принятия решений в организациях[14], однако излишний акцент на технической роли этих специалистов может привести к упрощённому, «наивному» пониманию проблем, которые призваны решать данные[15].
Это участники, обладающие полномочиями по изменению и определению направлений развития организации или сообщества. Их задача — не только использовать тренды и информацию из данных, но и создавать условия для открытого диалога, чтобы собирать и учитывать интересы и замечания относительно внедряемых систем обработки данных[16].
Это люди, инициирующие процессы «хакинга» и противодействия системам и практикам, основанным на данных. Дата-активизм — это проявление сопротивления тотальной датификации (datafication) жизни и массовому надзору. Он связан с анализом инфраструктур данных ради социальных изменений, гуманитарной и экологической деятельности и защиты прав человека[17].
Примеры формирования культуры данных в институтах
Microsoft под управлением Сатьи Наделлы широко применяет данные для принятия ключевых маркетинговых решений и организации повседневной работы команд. Компания использует инструменты визуализации данных (например, Power BI) для поддержки целей сотрудников и будущего развития компании, предоставляя доступ к необходимым данным и повышая вовлечённость работников[18].
Британская компания Capita с 1984 года помогает государственным учреждениям и бизнесу строить свою культуру данных путём внедрения методов анализа и управления информацией. Специалисты Capita сопровождают клиентов на пути к оптимальному использованию данных собственного производства[19][20].
Американская компания Socrata работает с государственными органами и гражданским обществом, оказывая помощь в генерации и публикации открытых государственных данных[21]. Компания предоставляет облачные сервисы для обмена данными между министерствами и населением, способствует внедрению публичных данных и расширяет возможности для вовлечения бизнеса и общества[22].
Datenkultur GmbH — немецкая компания, предлагающая решения в области бизнес-аналитики. Основана в 2003 году, с 2006 года специализируется на построении корпоративной культуры данных с использованием продуктов Microsoft (SQL Server, Power BI). Компания адаптирует инструменты анализа под конкретные бизнес-потребности, помогая сотрудникам формировать решения на основе актуальной внутренней информации.
Университет Эдинбурга стал одним из первых вузов, анализирующих и внедряющих политику культуры данных и аналитики обучения для студентов. С 2018 года университет разрабатывает педагогические стандарты, анализирует источники и методы работы с учебными данными, проводит эксперименты по вовлечению студентов и преподавателей в обсуждение вопросов прозрачности и приватности, доступа, хранения и качества данных, а также интерпретации результатов для поддержки педагогических интервенций[23].
Затруднения в формировании культуры данных
Многие компании считают важным сохранять приватность данных на управленческом уровне. Хотя все сотрудники могут в совокупности формировать и анализировать данные, не все сведения доступны широкой аудитории: часто реализуются ограничения через хранилище данных (data warehouse), когда доступ к ключевой информации имеют только уполномоченные лица, а для передачи данных прочим требуется одобрение хранителей[14].
Даже при открытом доступе к базам данных избыточная бюрократия и рост числа пользователей могут замедлить работу с информацией. Специализированные инструменты анализа сложны в применении, а по мере увеличения объёма данных актуален переход к централизованным хранилищам с ограничением доступа и контролем. Впрочем, такие ограничения могут обеспечивать надёжность и точность данных в долгосрочной перспективе[14].
Рационалистический подход к построению систем деятельности противопоставляется эмпирическому. Для рационалиста логика и личная картина мира важнее внешних факторов; принятие решений уходит от контроля конкретных пользователей, что затрудняет построение по-настоящему партисипативных («участнических») культур данных[24]. Помимо этого, сложность инфраструктуры и многоуровневых концепций приводит к тому, что многие организации слабо осознают свои практики и дискурс, опирающийся на данные, и не способны выстроить справедливую и конструктивную культуру работы с информацией.
Примечания
Литература
- Powers, Kristina. Cultivating a Data Culture in Higher Education : [англ.] / Kristina Powers, Angela E. Henderson. — Routledge, 2018. — ISBN 978-1-351-69451-3.
- Kitchin, Rob. Data and the city / Rob Kitchin, Tracey P. Lauriault, Gavin McArdle. — Abingdon, Oxon : Routledge, 2017. — ISBN 978-1138222632.
- Muller, Jerry Z. The tyranny of metrics. — 2018. — ISBN 978-0-691-19126-3.
- Tunguz, Tomasz. Winning with data: transform your culture, empower your people, and shape the future / Tomasz Tunguz, Frank Bien. — Hoboken, New Jersey : Wiley, 2016. — ISBN 9781119257394.
- Patil, DJ. Data driven: creating a data culture / DJ Patil, Hilary Mason. — Sebastopol, CA : O'Reilly Media, 2015. — ISBN 9781491921197.
- Barlow, Mike. The culture of big data. — Sebastopol, Calif. : O'Reilly Media, 2013. — ISBN 9781491946725.