OCR Systems

OCR Systems — американская компания, занимавшаяся производством компьютерного оборудования и разработкой программного обеспечения, специализировавшаяся на технологиях оптического распознавания символов. Первый продукт компании, система System 1000, был выпущен в 1970 году и использовался крупными корпорациями для обработки счетов и сортировки почты.

История

OCR Systems была основана Теодором Герцлем Левиным. Левин служил в Сигнальном корпусе армии США во время Второй мировой войны на Соломоновых островах, где участвовал в разработке сонара для поиска катапультированных пилотов в океане. После войны Левин проработал 22 года в Пенсильванском университете, получив степень бакалавра в 1951 году, магистра по электротехнике в 1957 году и докторскую степень в 1968 году[1]. Параллельно с учёбой он преподавал статистику и математику в Университете Темпл, Ратгерском университете, Университете Ла Саль и филиале Пенсильванского университета в Абингтоне[1] В 1960-х годах Левин работал в компании Philco. Вместе с двумя коллегами он решил создать собственную компанию, специализирующуюся на оптическом распознавании символов, и в 1969 году основал OCR Systems в Бенсалеме, штат Пенсильвания.[2].

Первым продуктом OCR Systems стала система System 1000, анонсированная в 1970 году[3]. В марте 1973 года OCR Systems заключила партнёрское соглашение с 3M о распространении System 1000 по всей территории США, что стало для 3M входом на рынок ввода данных[4][5]. System 1000 быстро нашла применение в таких компаниях, как Texas Instruments, AT&T, Ricoh, Panasonic и Canon для обработки счетов и сортировки почты[2] В середине 1970-х неназванная компания из списка Fortune 500 отказалась от контракта на распространение System 1000, а позднее канадский дистрибьютор обанкротился, что едва не привело OCR Systems к банкротству, однако компания смогла восстановиться[6].

К началу 1980-х компания вновь оказалась на грани неплатёжеспособности. В 1983 году у Левина оставалось всего 8 тысяч долларов сбережений, и он тяжело заболел. Управление компанией он передал Григорию Болеславскому и Вадиму Брикману, эмигрантам из Советской Украины, которых нанял ранее. Болеславский был принят на работу как специалист по монтажу System 1000, а также как программист и бета-тестер для ReadRight[6] — программного пакета, разработанного Левиным на основе патентов компании Nonlinear Technology из Гринбелта, штат Мэриленд[7]. Болеславский порекомендовал Левину нанять Брикмана. Оба вскоре стали вице-президентами компании, пока Левин был прикован к постели; Болеславский работал по 14 часов в день более полугода ради получения этой должности. Они представили продукты OCR Systems на Национальной компьютерной конференции в Чикаго, где те пользовались большим успехом. Среди клиентов компании появились Allegheny Energy (Пенсильвания), почтовая служба Бельгии, а штат пополнился в основном выходцами из России, а также Польши, Южной Кореи и США[6]. Для размещения расширившегося штата Левин перевёл штаб-квартиру OCR Systems из Бенсалема в бизнес-парк Masons Mill в Брин-Этине.[8].

В 1987 году японская компания Chinon Industries подписала соглашение с OCR Systems о распространении программного обеспечения ReadRight 1.0 вместе со своими сканерами, начиная с модели N-205[9]. В 1988 году OCR Systems открыла распространение ReadRight и для других производителей сканеров, включая Canon, Hewlett-Packard, Skyworld, Taxan, Diamond Flower и Abaton[10]. В том же году доход компании составил 3 миллиона долларов[6] В 1989 году соглашение с Chinon было продлено, а также выпущена версия 2.0 ReadRight[11].

В начале 1990-х на рынке программного обеспечения для OCR усилилась конкуренция[2] В ноябре 1991 года канадская компания Delrina из Торонто подписала письмо о намерениях приобрести OCR Systems, рассчитывая завершить сделку в декабре и выпустить программное обеспечение к Рождеству[12]. OCR Systems должна была получить акции Delrina на сумму 3 миллиона долларов, однако сделка сорвалась в январе 1992 года[13]. Позднее Delrina выпустила собственный пакет Extended Character Recognition (XCR) в качестве конкурента ReadRight[14]. В июле 1992 года OCR Systems была приобретена компанией Adobe Inc. за нераскрытую сумму[7]

Продукция

System 1000

System 1000 была построена на 16-битном миникомпьютере Varian Data 620/i с 4 КБ оперативной памяти на магнитных сердечниках. Система использовала 620/i для управления подачей бумаги, интерпретации формата документов, процесса оптического распознавания символов, обнаружения ошибок, последовательности операций и вывода данных.[15]. Изначально система была запрограммирована на распознавание 1428 OCR, печати IBM 407, а также полных наборов символов OCR-A, OCR-B и Farrington 7B, оптических меток и рукописных цифр. OCR Systems обещала добавить поддержку новых шрифтов по запросу в 1970 году[16]. Количество поддерживаемых шрифтов ограничивалось объёмом памяти, который можно было увеличить до 32 КБ с шагом по 4 КБ[16][3][17]. Позднее System 1000 поддерживала обобщённые шрифты пишущих машинок и копировальных аппаратов[18].

Остальная часть System 1000 включала транспортировку документов, один или несколько сканирующих элементов, ЭЛТ-дисплей и телетайп Model 33 или 35[17] Листы подавались с помощью фрикционного резинового ремня.[3] За один проход можно было сканировать до трёх строк на документе, а остальная часть документа могла быть размещена произвольно при наличии достаточного пространства вокруг полей для чтения. Система изначально поддерживала страницы размером от 3,25×3,5 дюйма (позднее — 2,6×3,5 дюйма для квитанций) до стандартного формата ANSI letter (8,5×11 дюймов; позднее — 8,5×12 дюймов для акций).[17][3][16] Максимальная производительность первой версии составляла 420 документов в минуту на один транспорт (позднее — 500 документов), в зависимости от размера и содержания.[3][16]

Уникальной особенностью System 1000 по сравнению с другими OCR-системами того времени была функция оповещения оператора о нечитабельных или некорректных полях.[16] Эта функция, называемая Document Referral, помещала документ перед оператором и отображала пустое поле на экране ЭЛТ-монитора для ручного ввода с клавиатуры. После ввода данные могли быть выведены на 7- или 9-дорожечную магнитную ленту, перфоленту, перфокарты и другие носители, а также на мейнфреймы IBM System/360 для дальнейшей обработки.[17]

Полная система System 1000 продавалась по цене 69 000 долларов США. Аренда составляла 1 800 долларов в месяц при трёхлетнем контракте или 1 600 долларов в месяц при пятилетнем.[3] По данным журнала Computerworld, это было менее половины стоимости конкурентов при большей функциональности и удобстве. Среди конкурентов назывались Recognition Equipment Retina, Scan-Optics IC/20 и Scan-Data 250/350.[17]

ReadRight

ReadRight анализирует отдельные буквы топографически: разбивает отсканированную букву на части — штрихи, дуги, углы, выносные элементы вверх и вниз — и сопоставляет их с древовидной структурой для определения соответствующего кода символа.[19]. Программа была полностью программной и не требовала дополнительных плат расширения[20]. Версия 2.01, последняя для DOS[21], работала в реальном режиме при объёме памяти менее 640 КБ[19] В 1991 году была выпущена версия 3.0 только для Windows, при этом версия 2.01 для DOS продолжала поддерживаться[22][23]. В октябре 1991 года компания представила продукт ReadRight Personal для портативных сканеров, только для Windows[23]. Эта версия поддерживала сканирование в реальном времени — каждое слово отображалось на экране по мере сканирования строки.[24]. Начиная с версии 3.1 (1992), ReadRight стала выпускаться только для Windows[25].

Включение ReadRight 2.0 в комплект с планшетным сканером Canon IX-12F позволило журналу PC Magazine присудить ему награду «Выбор редакции» в 1989 году[26]. Тем не менее, рецензент Роберт Кендалл отмечал недостатки в распознавании пропорциональных шрифтов, таких как Helvetica и Times New Roman[27]. Митт Джонс из того же издания отмечал, что версия 2.01 улучшила работу с такими шрифтами, а также хвалил простоту использования и низкие требования к ресурсам[26]. Джонс критиковал невозможность обработки неравномерных колонок и графики, отмечая, что в руководстве рекомендовалось закрывать графику стикерами Post-it[26].

Версия 3.1 для Windows получила смешанные отзывы. Майк Хек из InfoWorld отмечал низкую стоимость и богатый набор функций, но среднюю скорость и точность[20]. Барри Саймон из PC Magazine называл программу экономичной, но неточной, неспособной исправлять нераспознанные ошибки, с несовершенным проверщиком орфографии и низкой скоростью по сравнению с WordScan Plus от Calera[22]. Гэри Берлайн из того же журнала писал, что ReadRight обеспечивает приемлемую точность на чистых файлах с простыми макетами, но работает медленно и не справляется с мелким шрифтом и много-колоночным текстом с узкими промежутками[25]. Программа также часто ошибочно интерпретировала графические элементы как текст[25]. В июле 1992 года OCR Systems анонсировала обновление, обещавшее исправить эти недостатки, однако оно не было выпущено из-за покупки компании Adobe[25].

Примечания

Литература