Мультимодальные биометрические системы аутентификации
Мультимодальные биометрические системы аутентификации — один из способов улучшения точности распознавания в биометрии. Основная идея заключается в комбинировании нескольких методов унимодальной аутентификации для уменьшения количества ошибок.
Введение
Биометрия является одним из способов распознавания людей по физическим или поведенческим особенностям[1]. Данная область нашла своё применение в системах аутентификации и поиска людей (например, преступника по отпечаткам пальцев). В данной статье будет рассматриваться только первая область использования. Преимущество данного подхода по сравнению с классическими ключами и паролям состоит в том, что эти особенности нельзя потерять или забыть. А также их достаточно сложно подделать.
Различают два вида биометрических систем аутентификации: унимодальные — те, которые используют только одну особенность человека, и мультимодальные — использующие комбинацию унимодальных. В ходе различных исследований[2] [3] было показано, что использование мультимодальных методов аутентификации позволяет увеличить точность работы биометрических систем аутентификации[4] [5] [6].
Общая постановка задачи мультимодальной аутентификации
Задача мультимодальной аутентификации состоит из нескольких этапов:
- Получить результаты из отдельных систем.
- Произвести нормализацию этих результатов.
- Осуществить процедуру слияния[6] нормированных составляющих.
Таким образом, получается результат, который имеет такой же вид, как если бы производилась унимодальная аутентификация. При этом он содержит в себе информацию от всех составных частей мультимодальной модели.
Первым этап не является сложным в реализации, так как аутентификацию по отдельным системам можно производить одновременно. Например, можно просить пользователя одновременно зафиксировать палец на сканере отпечатков и произвести сканирование сетчатки глаза. Дальнейшие шаги же выполняются внутри общей системы.
Данный подход позволяет значительно увеличить уровень безопасности систем аутентификации[7]. В нем используется уже не одна характеристика человека, а несколько, что усложняет задачу подделки биометрических данных. Также существенным является то, что такие системы не только с большей точностью выявляют злоумышленников, но и имеют меньшее количество отказов для зарегистрированных пользователей (то есть более высокий True Positive Rate). Данное качество позволяет в значительной степени повысить качество решений в сфере аутентификации.
Способы нормализации
Необходимость этой части обусловлена тем, что при слиянии обычно происходит суммирование (часто с весами) результатов работы унимодальных методов аутентификации. Они представляют собой числа, которые при нормировке в шкалу [0, 1] интерпретируются как вероятность того, что пользователь имеет запрашиваемый им доступ. Таким образом, необходимо стандартизировать их перед слиянием, чтобы эффективно произвести процедуру слияния[8].
Данный метод позволяет отобразить сырые оценки на отрезок . При этом преобразование сохраняет форму исходного распределения. и являются граничными значениями для модели , должны поставляться поставщиком соответствующей унимодальной системы. Формула имеет вид:
, .
Данный метод приводит значения к распределению со средним равным нулю и среднеквадратичным отклонением равным единице. Если значения исходного распределения известны, то это позволяет без каких-либо проблем использовать данный метод. Однако если этой информации нет, то можно посчитать их с помощью обучающей выборки, которую мы используем для обучения нашей модели. Данное решение может быть не оптимальным, если в выборке присутствуют выбросы, так как получается смещённая оценка[8]. Метод описывается следующим выражением:
, где , .
Данный метод относят к так называемым надёжным статистическим методам[9][10]. В отличие от описанного выше подхода устойчив к выбросам и большим хвостам распределения, что делает его более сильным и надёжным инструментом нормализации. Формула имеет вид:
Ошибки аутентификации обусловлены тем, что истинное распределения и распределения самозванца перекрываются[11]. Данная область перекрытия описывается двумя характеристиками: центром и шириной . Основная идея данного подхода нормализации — увеличить различия между двумя этими распределениями путём уменьшения этого перекрытия, что позволит уменьшить вероятность ошибок.
Общий вид всех методов адаптивной нормализации:
, где − результат нормализации методом Min-Max, а функиция отображения.
Существует несколько видов функций отображения для адаптивной нормализации, которые будут описаны ниже.
Представляет собой функцию, вторая производная которой меняет знак в точке .
По форме график функции схож с графиком функции Two-Quadrics.
, где , .В выражениях для и символ обозначает константу, которая выбирается чаще всего малым числом (часто значением 0.01). При этом легко видеть, что .
В данном случае зона перекрытия остаётся неизменной (на графике это видно по линейному участку в центре). За её пределами используется Two-Quadrics функция отображения.
Способы слияния (fusion)
После того, как результаты работы отдельных алгоритмов аутентификации прошли через процесс нормировки, необходимо объединить их[14]. Для этого существует ряд способов слияния. Первые три из перечисленных далее являются классическими. Последние два более сложные за счёт того, что они используют логику того, что какие-то методы аутентификации являются более важными, а какие-то менее важными.
Введём обозначения для дальнейших определений. Пусть — нормализованный выход метода () для пользователя (). В данном случае — число унимодальных методов, используемых в мультиимодальном, а — число пользователей в базе данных.
Простое суммирование для пользователя нормализованных результатов всех аутентификаторов.
Выбирает минимум среди всех нормализованных результатов аутентификатора для данного пользователя.
Выбирает максимум среди всех нормализованных результатов аутентификатора для данного пользователя.
Данный метод слияния основан на использовании Equal Error Rate[18] (EER). Эта функция ошибки делает оценку ROC-кривой. Обозначим EER для метода как . Тогда весом для метода будет .
При этом из формулы ясно, что для всех верно ≤ ≤ , а также, что . Важным моментом является ещё и то, что чем выше значение ошибки , тем ниже соответствующий весовой коэффициент . Таким образом, более точные методы, будут вносить больший вклад в финальную оценку.
Финальная формула имеет вид:
Данный метод отличается от предыдущего тем, что мы производим взвешивание методов для каждого пользователя индивидуально. Изначально этот способ слияния был более сложным с точки зрения вычислений[19]. Позднее на его основе была предложена схема, уменьшающая число операций, которая и будет описана в этом разделе.
Обозначим вес для метода для пользователя как .
Рассмотри более детально, как вычислить искомы вес . Данный способ слияния берёт за основу концепцию волка-овцы[20]. Обозначим за овец пользователей, данные которых могут быть легко подделаны. Волками напротив обозначим пользователей, которые легко имитируют других клиентов. Как волки, так и овцы уменьшают эффективность работы процесса аутентификации, так как обе эти группы приводят к ложным срабатываниям.
Для того, чтобы использовать данный подход для мультимодального случая, необходимо ввести метрику lambness для каждой пары . Она показывает, насколько пользователь является овцой в рамках метода При её подсчёте предполагается, что параметры среднего и стандартного отклонения для подлинного распределения и распределения самозванцев известны. Для получения lambness происходит вычисление d-prime метрики[21], которая показывает, насколько различимы два распределения (в нашем случае истинное и поддельное). Обозначим для пары пользователь-метод среднее и стандартное отклонения подлинного распределения как , для поддельного соответственно. В данном случае индексы gen и imp обозначают genuine и impostor соответственно. .
При этом легко видеть, что чем меньше значение , тем в большей степени пользователь является овцой для некоторых волков. Это обусловленно тем, что в данном случае наблюдается сильное перекрытие распределений.
И, наконец, все готово для подсчёта весов для пользователя :
.
Формула слияния с полученными весами имеет вид:
Комбинирование методов
В ходе исследований[22][23] мультимодальных систем аутентификации было показано, что использование комбинации нескольких методов превосходят по качеству работы унимодальные системы. Причем прирост достигается даже при комбинировании с топовыми унимодальными системами. В некоторых случаях это может помочь снизить стоимость итоговой архитектуры за счет использования простых методов.
Также было показано[17], что в приложениях, где происходит постоянный приток новых людей (например, аэропорты), наиболее подходящая комбинация — это нормализация Min-Max и слияние Simple Sum. Если же работа происходит с ограниченным кругом лиц (например, лаборатория или офис), то наилучшая комбинация — это адаптивная нормализация Quadric-Line-Quadric и слияние User Weighting. Основная причина разницы результатов для двух случаев в том, что при работе с одними и теми же пользователями происходит постоянное повторение съёмов биометрических данных, что позволяет собирать их и аккумулировать в алгоритмы. Аналогичные результаты были получены также и в других исследованиях[24][25]. Описанные случаи являются исчерпывающими и описывают все возможные примеры использования систем аутентификации.
При решении прикладных задач стоит стоит пробовать различные комбинации методов создания мультимодалных систем. Это обусловленно тем, что из-за различий в том, какие унимодальные методы используются, какая аппаратура осуществляет аутентификацию и каких образом происходил сбор данных для обучения мультимодальной системы, результаты могут сильно отличаться от представленных в различных исследованиях. Однако в качестве базового решения стоит в первую очередь пробовать именно описанные выше.