Оптический бланк ответов

Оптический бланк ответов (англ. Optical mark recognition, OMR) — это технология сбора данных с бумажных форм, в которых пользователь отмечает необходимые ячейки или поля. OMR позволяет обрабатывать сотни и даже тысячи заполненных документов в час и широко применяется для автоматизированной проверки экзаменационных работ, где учащиеся отмечают ответы на специально размеченных бланках. Такая обработка обеспечивает быстрый и объективный анализ заполненных форм.

Основные сведения

undefined

Большинство устройств для оптического распознавания бланков используют специальный сканер, который освещает форму и замеряет отражённый свет в определённых точках. Чёрные метки отражают меньше света, чем незаполненные участки, и их легко определить.

Некоторые устройства OMR работают с формами, напечатанными на трансоптической бумаге — в таком случае измеряется количество света, проходящего сквозь лист, и любые тёмные метки на обеих сторонах листа снижают уровень светопропускания.

В отличие от специализированных устройств, настольное программное обеспечение OMR позволяет создавать свои бланки в текстовом редакторе или на компьютере и печатать их на обычном лазерном принтере. После заполнения формы, эти программы работают с обычными настольными сканерами и системой автоподачи документов для автоматической обработки.

OMR отличается от оптического распознавания символов (OCR) тем, что не требует сложных алгоритмов распознавания: распознаются лишь чётко определённые метки на бланках высокой контрастности — точная форма не всегда принципиальна. Схожей областью является распознавание штрихкодов, например, используются универсальные товарные коды (UPC).

Наиболее известный пример применения OMR — использование оптических бланков ответов («bubble sheets», или омр-бланков) в массовом тестировании. Обычно используется карандаш типа №2 (HB по европейской системе), которым заштриховываются соответствующие круги (или прямоугольные зоны) на бланке. Проверка анкеты затем осуществляется сканирующей машиной.

  • В США и большинстве стран Европейского союза применяется горизонтальная или вертикальная «галочка» в прямоугольной «капсуле» — наиболее распространённый формат OMR-бланка.
  • В Великобритании массово применяется форма для национальной лотереи.

Капсульные («lozenge») формы появились позже — их легче как заштриховывать, так и стирать. Крупные «пузыри» — наследие ранних технологий, когда для надёжного срабатывания устройства требовалась большая область метки. В большинстве стран Азии для заполнения бланков используется специальный маркер.

Большинство современных OMR-бланков тщательно проектируются для минимизации ошибок распознавания: точная регистрация при печати, оптимальная форма и расположение областей для отметок. Благодаря низкой стоимости, высокой точности и простоте применения, OMR остаётся популярным решением для подсчёта голосов и сбора массовых анкетных данных[1].

Метки OMR также размещаются на печатной почтовой корреспонденции, чтобы специализированное оборудование сортировщиков могло автоматизировать складывание и вставку бумаги в конверты.

Оптический бланк ответов

undefined

Оптический бланк ответов (или «bubble sheet») — это специализированная форма для массового тестирования с выбором из нескольких вариантов. OMR используется для автоматического определения выбранных ответов. Крупнейший производитель таких бланков — компания Scantron Corporation, хотя в ряде областей используются собственные решения.

На бланке обычно располагаются ряды пустых овалов или прямоугольников, соответствующих вопросам теста. Иногда на форму наносятся штрихкоды для автоматической обработки. По заполненным ячейкам автоматически учитываются ответы и/или идентифицируется тестируемый.

Принципы считывания

Первые оптические бланки ответов считывались по принципу пропускания света через лист: на обратной стороне располагались фототрубки, фиксировавшие степень ослабления света[2]. Так как большинство фототрубок были особенно чувствительны к синему концу спектра[3], маркеры с синими чернилами использовать было нельзя — синяя область проходит и отражает синий свет, а графит хорошо поглощает свет. Именно поэтому традиционно использовался карандаш HB[2].

Современные устройства анализируют отражённый свет, поэтому допускают использование разных пишущих средств (чёрнила, тонеры), но по-прежнему рекомендуются стандартные карандаши из-за наилучшего качества метки и отсутствия лишних пятен. Возможно использование двойных (двусторонних) бланков.

Большинство систем допускает небольшие ошибки человека при заполнении (неровное или неполное закрашивание), если разметка не выходит за пределы ячейки.

Проектирование и печать

Бланки OMR должны проектироваться с точностью до 0,05 мм; несоблюдение масштаба может привести к ошибкам чтения. Возможны варианты:

  • Однокомпонентные — печать одного листа на бумаге плотностью 105–120 г/м² на листах формата A4/Legal.
  • Двойные (самокопирующиеся) — печать двух листов, верхний — на 105 г/м², нижний — на 60–70 г/м². Листы химически обработаны, чтобы метки на первом копировались на второй.
  • Тройные — аналогично, только добавляется третий лист.

Ошибки

Неправильная печать формы (например, слишком толстый или неравномерный контур овала) может привести к тому, что система распознаёт все ячейки как заполненные. Подобная проблема наблюдалась, например, с более чем 19 000 открепительных бюллетеней в округе Гуиннетт (штат Джорджия, США) во время президентских выборов 2008 года; после обнаружения ошибки все бюллетени пришлось перепечатывать и переносить результаты вручную.

Программное обеспечение OMR

undefined

ПО для оптического распознавания бланков — это программное обеспечение, позволяющее реализовать OMR на стандартном компьютере с использованием офисного сканера для обработки анкет, тестов, табелей учёта и других форм, напечатанных на обычном лазерном принтере.

ПО OMR используется для извлечения данных из заполненных бланков. При обработке учитываются множество факторов — плотность бумаги, размеры и схема построения формы.

Промышленные решения

Одно из первых коммерческих решений для работы с изображениями, полученными с обычных сканеров, — Remark Office OMR компании Gravic, Inc. (ранее Principia Products, Inc.), версия 1.0 выпущена в 1991 году.

Ранее системы использовали только специализированные сканеры и заранее отпечатанные формы с регистрационными метками и специальными цветами, что делало процесс дорогим (до 0,10–0,19 $ за страницу). ПО позволяет создавать формы самостоятельно, печатать на обычном принтере и экономить существенные средства[4].

Для исключения ошибок при частичном стирании или неправильном заполнении, современные решения используют сравнение битовых изображений с порогом «чёрно-белого» или градации серого цвета.

ПО также применяется для нанесения служебных OMR-меток на почтовые документы для сортировки или фасовки. Пример — Mail Markup, разработанный компанией Funasset Limited.

История

Оптический бланк ответов — это технология сканирования бумажных форм для фиксации меток в определённых положениях[5]. Прообраз OMR появились в начале XIX—XX веков: патенты на устройства для помощи незрячим появились уже тогда[6].

В качестве прототипов OMR можно рассматривать перфоленты (использовались с 1857 года для телеграфа) и перфокарты (широко с 1890-х годов), где в качестве отметки использовалось отверстие[7]. С современным появлением OMR метки определяются именно по отражённому свету, а не по электрической проводимости или наличию отверстия.

Первая система, определявшая метку по проводимости графита — IBM 805 Test Scoring Machine, использовавшая пары контактных щёток. В 1930-х годах в IBM проводились эксперименты по оптическому распознаванию ответов, запатентованные к 1930-м годам. Первая успешная оптическая система была разработана Эвереттом Франклином Линдквистом (патент 1955–1962). С развитием техники решения распространились в образовании, инвентаризации и других сферах.

Среди компаний, предлагавших промышленные решения, выделяется Scantron Corporation (основана в 1972 году), первоначально распространявшая недорогие сканеры и получавшая доход от продажи бланков. Впоследствии рынок консолидировался: National Computer Systems (NCS) приобрела Westinghouse Learning Corporation (1983), а затем была куплена Pearson Education (2000), впоследствии — M&F Worldwide; всё это стало частью бренда Scantron.

Применение

Область применения OMR не ограничивается образовательными организациями или агентствами опросов: OMR широко используется компаниями, медицинскими учреждениями и другими организациями для быстрого и точного извлечения информации[8].

Примеры использования

undefined
undefined

Из наиболее распространённых сфер:

  • институциональные исследования,
  • массовые и потребительские опросы,
  • тесты и экзамены,
  • оценки и сбор отзывов,
  • инвентаризации и складской учёт,
  • учёт времени (табеля),
  • подписка,
  • проведение лотерей и голосование,
  • геокодирование (например, почтовые индексы),
  • банковские, ипотечные, страховые анкеты.

Типы полей

В бланках OMR допускаются различные типы разметки:

  • одиночный выбор (ABC..., 1-5, шкалы типа «согласен/не согласен»),
  • табличные поля (для ввода номера телефона, имени, идентификационного кода),
  • сумматорные поля (суммирование баллов),
  • булевы поля (ответ «да/нет» на каждое из отмеченных),
  • бинарные поля (ответ «да/нет» только на один вариант),
  • поля с пунктирными линиями (разработаны компанией Smartshoot OMR) — обеспечивают «обрезание» границ по аналогии с традиционным оптическим удалением цвета.

Особенности и требования

В прошлом большинстве систем требовало специальной бумаги, чернил и устройств ввода[9], что ограничивало свободу проектирования бланков. Современные технологии позволили использовать обычную печать и сканеры с автоподачей. Пользователь ам может проектировать формы под свои нужды[10]. Достигается высокая точность (около 99,9 %); на распознавание одной отметки требуется в среднем 5 миллисекунд[9]. Для области метки могут использоваться квадраты, круги, эллипсы, шестиугольники. Программное обеспечение распознаёт закрашенные области, крестики или галочки.

OMR нашёл применение в бытовых принтерах, которые позволяют печатать выбранные фотографии по заполненным bubbles-кодам на контрольной форме — пользователю достаточно отметить нужные параметры, отсканировать бланк, и устройство напечатает снимки согласно выбору.

Ограничения и недостатки

Недостатки OMR: технология непригодна для сбора больших объёмов текстовых данных, возможны потери информации при ошибках сканирования или неправильной нумерации страниц. Без достаточных мер защиты возможны повторные сканирования и дублирование данных[9].

Из-за широкого распространения OMR-форм стандартизированные тесты часто сводятся к заданиям на выбор из вариантов, что изменяет сам подход к проверке знаний.

Примечания

Категории