MICR

MICR (англ. Magnetic Ink Character Recognition, магнитное-чернильное распознавание символов) — это технология распознавания символов, основное применение которой связано с банковской сферой для ускорения обработки и клиринга чеков и других документов. Закодированная по стандарту MICR информация, называемая MICR-строкой, располагается в нижней части чеков и ваучеров. Она обычно содержит индикатор типа документа, банковский код, номер банковского счёта, номер чека, сумму чека (как правило, после его предъявления к оплате) и управляющий индикатор. Форматы банковских кодов и номеров счетов зависят от конкретной страны.

Технология позволяет считывать информацию с помощью специальных устройств (MICR-ридеров) непосредственно в систему сбора данных. В отличие от штрих-кодов и подобных технологий, символы MICR легко распознаются человеком визуально. Документы, закодированные по стандарту MICR, могут быть обработаны быстрее и точнее, чем документы, использующие только обычное OCR.

Международное распространение

В настоящее время используются два основных шрифта MICR: E-13B и CMC-7. Не существует международного согласия относительно того, какой шрифт применяют разные страны[1]. На практике это не создаёт существенных проблем, так как чеки и сопутствующие документы обычно циркулируют только внутри одной юрисдикции.

Шрифт E-13B принят в качестве международного стандарта ISO 1004-1:2013 и является стандартом в Австралии, Канаде, Великобритании, США, а также в Центральной Америке, значительной части Азии и ряде других стран[1].

Шрифт CMC-7 утверждён как международный стандарт ISO 1004-2:2013 и широко применяется в Европе, в частности во Франции и Италии, а также в Мексике и странах Южной Америки (Аргентина, Бразилия, Чили и др.).

Израиль — единственная страна, где разрешено использовать одновременно оба шрифта, однако это делает систему менее эффективной. Такая ситуация связана с тем, что в Израиле выбран CMC-7, а в Палестине — E-13B[1].

Шрифты

E-13B

undefined

E-13B содержит 14 символов: десять десятичных цифр и следующие символы:

  • ⑆ (transit: используется для выделения банковских кодов);
  • ⑈ (on-us: для выделения номеров счетов клиента);
  • ⑇ (amount: для выделения суммы операции);
  • ⑉ (dash: для разделения частей номеров, например маршрутизационных или счетов).

В полиграфической и банковской индустрии MICR-строка E-13B также известна как строка TOAD (от первых букв: Transit, Onus, Amount, Dash). По сравнению с CMC-7, некоторые пары символов E-13B (например, 2 и 5) могут давать схожие результаты при магнитном чтении; однако при необходимости оптического распознавания E-13B функционирует стабильно[1]

Набор E-13B включён в Unicode (см. ниже). До эпохи Unicode символы кодировались по ISO 2033:1983, где цифры размещались на привычных позициях ASCII, а остальные символы: transit — 0x3A, on us — 0x3C, amount — 0x3B, dash — 0x3D.[2]. Для систем EBCDIC кодовая страница IBM 1001 размещает управляющие символы по адресам: transit — 0xDB, on us — 0xEB, amount — 0xCB, dash — 0xFB[3].

Кодовая страница IBM 1032 расширяет 1001, добавляя альтернативные коды для transit (0x5C, 0x7A, 0xC1), on us (0x4C, 0x61, 0xC3), amount (0x5B, 0x5E, 0xC2), dash (0x60, 0x7E, 0xC4) и символ пробела нулевой ширины (0x5A)[4]. Такие альтернативы нужны для совместимости с принтерами Siemens и Océ[5].

CMC-7

undefined

CMC-7 содержит 10 десятичных цифр, 26 заглавных латинских букв[6],[7] а также 5 управляющих символов: S I (internal), S II (terminator), S III (amount), S IV (не используется), S V (routing).

CMC-7 визуально напоминает штрих-код: каждый символ образует уникальную комбинацию из двух широких промежутков и характерного рисунка штрихов, что минимизирует ошибки магнитного распознавания. Однако полосы слишком близки и тонки для надёжного оптического сканирования стандартными средствами. К тому же встречаются ложные распознавания при сканировании перевёрнутых MICR-строк CMC-7[1]

В Unicode управляющие символы CMC-7 отсутствуют. В кодовой странице IBM 1033 управляющие символы располагаются по следующим адресам:[8].

  • цифры и буквы на стандартных позициях EBCDIC,
  • S I (internal) — 0x5E, 0x61 или 0xCB,
  • S II (terminator) — 0x4C, 0x5B или 0xEB,
  • S III (amount) — 0x60, 0x7E или 0xFB,
  • S IV — 0x50, 0x7A или 0xDB,
  • S V (routing) — 0x5C, 0x6E или 0xBB.

MICR-ридеры

Символы MICR печатаются на документы двумя вышеописанными шрифтами с использованием магнитных (обычно на основе оксида железа) чёрнил или тонера. При сканировании документ проходит через MICR-ридер, последовательно намагничивающий чернила и затем распознающий символы. Считывание происходит с помощью головки, схожей с воспроизводящей головкой магнитофона: каждый символ вызывает уникальную волну сигнала, по которому система определяет знак.

MICR-ридеры широко применяются в сортировке чеков на всех стадиях обработки: например, продавец сортирует чеки по банкам и направляет их в клиринговую палату, где они перераспределяются в соответствующие банки. При получении банк выполняет следующую сортировку для определения владельца счёта и подразделения, куда отправить документ на возврат. Однако многие банки сейчас не возвращают бумажные чеки клиентам; вместо этого сканы чеков хранятся в электронном виде. Сортировка чеков организуется в соответствии с географической структурой банков данной страны[9].

До-Юникодные стандарты представления

Стандарт ISO ISO 2033:1983, а также японский промышленный стандарт JIS X 9010:1984 (первоначально JIS C 6229–1984) определяют кодировки символов для OCR-A, OCR-B и E-13B.

Юникод

Символы для OCR и MICR включены в стандарт Unicode начиная минимум с версии 1.1 (июнь 1993 года). Поскольку база символов Unicode ведётся начиная с версии 1.1, возможно, эти символы присутствовали и раньше[10].

Блок Unicode для OCR/MICR-символов называется Optical Character Recognition и охватывает диапазон U+2440–U+245F. Из них четыре символа относятся к шрифту MICR E-13B:

  • U+2446 — OCR BRANCH BANK IDENTIFICATION
  • U+2447 — OCR AMOUNT OF CHECK
  • U+2448 — OCR DASH (альтернативное название MICR ON US SYMBOL)[11]
  • U+2449 — OCR CUSTOMER ACCOUNT NUMBER (альтернативное название MICR DASH SYMBOL)[11]

Названия двух последних символов были ошибочно перепутаны в ISO/IEC 10646:1993[12], однако впоследствии им были присвоены корректные имена как формальные псевдонимы[11]. В соответствии с политикой стабильности Unicode старые названия сохраняются как идентификаторы[13]. Все четыре символа также имеют неформальные псевдонимы в документации Unicode: «transit», «amount», «on us», «dash».

До появления Unicode эти символы кодировали по ISO-IR-98 (ISO 2033:1983), где они назывались SYMBOL ONE‒FOUR и шли непосредственно за цифрами[2] Несмотря на то, что ISO 2033 также задаёт кодировки для OCR-A и OCR-B, кодировка для E-13B известна IANA как ISO_2033-1983.[14].

История

undefined

До середины 1940-х годов чеки обрабатывались вручную с помощью методов Sort-A-Matic и Top Tab Key. Этот процесс был трудоёмким и затратным. С увеличением объёмов операций банки стали искать способы автоматизации. Для единообразия разрабатывались единые отраслевые стандарты. В середине 1950-х Стэнфордский исследовательский институт и лаборатория General Electric[15] разработали первую автоматизированную систему для работы с чеками с использованием MICR и шрифт E-13B (буква «E» означает, что это была пятая версия из рассмотренных, «B» — вторая ревизия; «13» — шаг сетки 0,013 дюйма).

undefined

В 1956 году шрифт E-13B продемонстрировали Американской банковской ассоциации (ABA), в 1958 году он был принят в США в качестве MICR-стандарта для обращающихся документов. MICR был выбран ABA, потому что его можно было точно считывать автоматами и печатать существующими техническими средствами. Кроме того, метки MICR оставались считываемыми даже после повреждений, штампов и пометок. Первые чеки с MICR были выпущены до конца 1959 года. Несмотря на то, что в США соответствие стандарту было добровольным, к 1963 году MICR использовался практически повсеместно[16]. В 1963 году ANSI принял шрифт E-13B в качестве американского стандарта[17], а немного позже E-13B был утвержден в стандарт ISO 1004:1995.

В других странах разрабатывались собственные стандарты, хотя оборудование в основном производилось в США. MICR был внедрён в ряде стран с определёнными отличиями, но выбор шрифта схож: E-13B принят в США, Канаде, Великобритании, Австралии и многих других странах. В Австралии за систему отвечает Австралийская платёжная сеть.

undefined

Шрифт CMC-7 был разработан во Франции компанией Groupe Bull в 1957 году. Он принят как MICR-стандарт в Аргентине, Франции, Италии и ряде стран Европы.

В 1960-х шрифты MICR стали символом футуризма и служили прообразом для аналогичных «компьютерных» шрифтов, отличавшихся наличием полного набора символов (в отличие от настоящих MICR).

Шрифт MICR E-13B используется для кодирования информации не только на чеках, но и на купонах, кредитных и авиабилетах, квитанциях об оплате страховых взносов и др. E-13b разрабатывался специально для офсетной печати. Для высокой печати существовал схожий, но отличающийся шрифт E-13a. Параллельно разрабатывалась система 'Fred' (Figure Reading Electronic Device), использовавшая более привычные для глаз цифры.

Примечания