Оптическое распознавание Брайля
Оптическое распознавание Брайля (англ. Optical braille recognition) — это технология, предназначенная для захвата и обработки изображений символов брайля с их последующим преобразованием в символы естественного языка. Она используется для конвертации документов, напечатанных по системе Брайля, в текст для людей, которые не могут самостоятельно их прочитать, а также для сохранения и тиражирования таких документов.
История
В 1984 году группа исследователей из Технологического университета Делфта разработала планшет для чтения брайля: считывающая головка с фоточувствительными элементами перемещалась вдоль специальных направляющих и построчно сканировала текст Брайля[1].
В 1988 году группа французских учёных из Лилльского университета науки и технологий разработала алгоритм, получивший название Lectobraille, который преобразовывал документы Брайля в обычный текст. Система фотографировала текст брайля с помощью низкоразрешающейся ПЗС-камеры и использовала методы пространственной фильтрации, медианной фильтрации, эрозии и дилатации для выделения брайлевских символов. Затем символы брайля преобразовывались в символы естественного языка с помощью адаптивного распознавания[2]. Для Lectobraille была зафиксирована погрешность в 1 % и среднее время обработки семь секунд на строку[1].
В 1993 году исследователи из Католического университета Лёвена разработали систему для распознавания брайля, напечатанного с помощью стандартного сканера[1]. Однако система не справлялась с искажениями в сетке точек брайля, поэтому требовались хорошо напечатанные документы[3].
В 1999 году группа при Гонконгском политехническом университете разработала метод оптического распознавания брайля с использованием обнаружения границ для перевода брайля на английский или китайский язык[4].
В 2001 году Мюррей и Даис создали портативную систему распознавания, которая сканировала небольшие участки документа[5]. Благодаря малой площади сканирования деформации сетки не были критичными, а алгоритмы можно было упростить и сделать более экономичными[3].
В 2003 году Моргави и Морандо разработали систему распознавания символов брайля с использованием искусственных нейронных сетей. Данная система показала лучшую устойчивость к ухудшению качества изображения по сравнению с другими подходами[3].
Проблемы и ограничения
Многие проблемы при обработке текстов Брайля обусловлены самой природой брайлевских документов. Обычно они печатаются на бумаге сплошного цвета без нанесения чернил, создающих контраст между выпуклыми символами и фоном. Вместе с тем, при сканировании или фотографировании могут появляться дефекты страницы.
Многие документы печатаются интерпойнт (двусторонняя печать), при этом вдавленные точки с одной стороны листа видны между выпуклыми точками с другой[6].
Технические особенности
Некоторые методы оптического распознавания Брайля используют боковое освещение и камеру, чтобы за счёт теней выявлять вдавленные и выпуклые точки брайля. Другие технологии опираются на стандартные сканеры документов[6].