Система распознавания лиц

Система распознавания лиц (англ. facial recognition system)[1] — это технология, способная сопоставлять лицо человека на цифровом изображении или видеокадре с базой данных лиц. Обычно такие системы применяются для аутентификации пользователей через сервисы верификации личности и работают за счёт определения и измерения характеристик лица на предоставленном изображении[2].

Схожие системы начали разрабатываться ещё в 1960-х годах как разновидность прикладных компьютерных программ. Сегодня распознавание лиц повсеместно используется в смартфонах, робототехнике, биометрических технологиях. Хотя точность биометрических систем распознавания лиц уступает технологиям распознавания радужки глаза, отпечатков пальцев, ладони или голоса, широкое распространение обеспечивает им бесконтактный способ работы[3]. Системы распознавания лиц применяются в человеко-компьютерном взаимодействии, видеонаблюдении, правоохранительных органах, при досмотре пассажиров, принятии решений о трудоустройстве и жилье, а также при автоматической индексации изображений[4].[5]

В настоящее время системы распознавания лиц используются государственными учреждениями и частными компаниями по всему миру[6]. Их эффективность сильно варьируется, а часть решений была снята с эксплуатации из-за низкой эффективности. Использование систем вызвало многочисленные споры, связанные с нарушением права на частную жизнь, ошибочной идентификацией, укреплением половых стереотипов[7][8] и расовым профилированием[9], а также недостаточной защитой биометрических данных. Появление синтетических медиа, таких как дипфейки, повысило опасения по поводу безопасности данных[10]. Эти проблемы привели к запрету использования таких систем в ряде городов США. В 2021 году компания Meta Platforms отключила свой сервис распознавания лиц в Facebook, удалив шаблоны лиц более чем миллиарда пользователей[11].[12] Аналогично компания IBM отказалась от предоставления услуг по распознаванию лиц[13].

История развития технологии распознавания лиц

Автоматическое распознавание лиц было впервые реализовано в 1960-х годах учёными Вуди Бледсо, Хелен Чан Вулф и Чарльзом Биссоном, которые занимались обучением компьютеров распознаванию человеческих лиц[14]. Их проект получил название «человек-машина», так как сначала человек с помощью графического планшета отмечал координаты ключевых точек лица, а затем компьютер обрабатывал эти данные, определяя расстояния между ними. Автоматизация процесса постепенно росла, но первоначально распознавание одной фотографии занимало несколько минут[14]

В 1970 году Такео Канада публично продемонстрировал систему распознавания, самостоятельно выявлявшую черты лица без вмешательства человека. В 1993 году DARPA и ARL инициировали проект FERET, сравнивший разные методы автоматического распознавания лиц и выявивший жилоспособность ряда алгоритмов в контролируемых условиях.[15]. Этот конкурс положил начало коммерческому распространению технологии и созданию первых компаний, продававших системы распознавания.

В 1990-х годах возникли методы на основе главных компонент или «eigenface», предложенные Мэттью Турком и Алексом Пентландом. Они позволили резко ускорить и упростить обработку изображений[16]. Дальнейшее развитие системы получили с 2001 года благодаря появлению алгоритма Виолы—Джонса, позволившего находить лица в видео в реальном времени.

В XXI веке системы распознавания лиц стали массовым инструментом в государственных и частных целях, от пограничного контроля до пользовательских приложений для смартфонов.

Технические особенности

Современные системы распознавания лиц состоят из четырёх основных этапов: обнаружение лица на изображении, выравнивание и нормализация фрагмента лица, извлечение характеристик (черты лица или feature vector), затем сопоставление с образцами из базы данных[17]. Используются как геометрические, так и фотометрические подходы (например, метод собственных лиц, ансамбли слабых классификаторов, нейросетевые алгоритмы глубокого обучения).

Помимо двумерных изображений используют трёхмерные модели, тепловизионные камеры, а также алгоритмы повышения разрешения (face hallucination) для работы с низкокачественными видео.

Алгоритмы и реализации

Классические алгоритмы включают:

  • Метод главных компонент (eigenfaces)
  • Дискриминантный анализ (Fisherfaces)
  • Сопоставление по шаблонам (template matching)
  • Скрытые марковские модели
  • Прогрессивные методы глубокого обучения и сверточные нейронные сети (deep learning).

Современные системы реализуются на таких языках как Python (библиотека OpenCV), MATLAB, C++, Java, а также на мобильных и встроенных платформах. Применяются реальные решения для идентификации по изображению, в том числе в отношении к сложным ситуациям (открытые/закрытые глаза, различные выражения лица, возрастные изменения).

Применение

Системы идентификации по лицу находят применение:

  • Верификация личности в смартфонах, компьютерах и биометрических банкоматах
  • Пограничный и паспортный контроль (автоматизированные турникеты, e-гейты)
  • Полицейские и антитеррористические задачи, розыск преступников
  • Социальные сети и медиа-приложения (узнавание на фото, визуальные фильтры)
  • Фотоархивы и управление изображениями (поиск по лицу)
  • Розничная торговля (аналитика поведения клиентов, предотвращение краж)
  • Медицина (диагностика наследственных заболеваний, контроль состояния пациентов)
  • Индексация видеоматериалов и автоматизация систем видеонаблюдения.

Преимущества и недостатки

Ключевым преимуществом распознавания лиц является возможность массовой идентификации без активного участия субъекта. Система может работать на объектах большого скопления людей (аэропорты, вокзалы) незаметно для окружающих. Однако, качество работы значительно зависит от условий съёмки: ракурса, освещенности, разрешения, выражения лица, наличия посторонних объектов (очки, маски), а также от разнообразия обучающих выборок.

Критики отмечают высокий риск ошибок (ложные срабатывания и пропуски), проблемы расовой и гендерной предвзятости алгоритмов, угрозу приватности и недостаточную защиту биометрических данных[5]. Также отмечаются сложности корректного распознавания лиц людей с особенностями внешности или с нарушениями развития.

В отличие от отпечатков пальцев и радужки, системы распознавания лиц демонстрируют более высокую частоту ошибок; ошибки тем чаще, чем беднее представлена разнообразная популяция в обучающих данных[5].

Примечания

Литература

  • Farokhi, Sajad; Shamsuddin, Siti Mariyam; Flusser, Jan; Sheikh, U.U; Khansari, Mohammad; Jafari-Khouzani, Kourosh (2014). “Near infrared face recognition by combining Zernike moments and undecimated discrete wavelet transform”. Digital Signal Processing. 31 (1): 13—27. DOI:10.1016/j.dsp.2014.04.008.
  • Garvie, Clare. Perpetual Line Up: Unregulated Police Face Recognition in America / Clare Garvie, Alvaro Bedoya, Jonathan Frankle. — Center on Privacy & Technology at Georgetown Law, 18 октября 2016.
  • Пресс, Эял, «В лицо: приводит ли технология распознавания лиц к игнорированию противоречивых доказательств полицией?», The New Yorker, 20 ноября 2023, с. 20-26.

Ссылки