OCR Systems

OCR Systems — американская компания, занимавшаяся производством компьютерного оборудования и разработкой программного обеспечения, специализировавшаяся на технологиях оптического распознавания символов. Первый продукт компании, система System 1000, был выпущен в 1970 году и использовался крупными корпорациями для обработки счетов и сортировки почты.

OCR Systems была основана Теодором Герцлем Левиным. Левин служил в Сигнальном корпусе армии США во время Второй мировой войны на Соломоновых островах, где участвовал в разработке сонара для поиска катапультированных пилотов в океане. После войны Левин проработал 22 года в Пенсильванском университете, получив степень бакалавра в 1951 году, магистра по электротехнике в 1957 году и докторскую степень в 1968 году^[1]. Параллельно с учёбой он преподавал статистику и математику в Университете Темпл, Ратгерском университете, Университете Ла Саль и филиале Пенсильванского университета в Абингтоне^[1] В 1960-х годах Левин работал в компании Philco. Вместе с двумя коллегами он решил создать собственную компанию, специализирующуюся на оптическом распознавании символов, и в 1969 году основал OCR Systems в Бенсалеме, штат Пенсильвания.^[2].

Первым продуктом OCR Systems стала система System 1000, анонсированная в 1970 году^[3]. В марте 1973 года OCR Systems заключила партнёрское соглашение с 3M о распространении System 1000 по всей территории США, что стало для 3M входом на рынок ввода данных^[4]^[5]. System 1000 быстро нашла применение в таких компаниях, как Texas Instruments, AT&T, Ricoh, Panasonic и Canon для обработки счетов и сортировки почты^[2] В середине 1970-х неназванная компания из списка Fortune 500 отказалась от контракта на распространение System 1000, а позднее канадский дистрибьютор обанкротился, что едва не привело OCR Systems к банкротству, однако компания смогла восстановиться^[6].

К началу 1980-х компания вновь оказалась на грани неплатёжеспособности. В 1983 году у Левина оставалось всего 8 тысяч долларов сбережений, и он тяжело заболел. Управление компанией он передал Григорию Болеславскому и Вадиму Брикману, эмигрантам из Советской Украины, которых нанял ранее. Болеславский был принят на работу как специалист по монтажу System 1000, а также как программист и бета-тестер для ReadRight^[6] — программного пакета, разработанного Левиным на основе патентов компании Nonlinear Technology из Гринбелта, штат Мэриленд^[7]. Болеславский порекомендовал Левину нанять Брикмана. Оба вскоре стали вице-президентами компании, пока Левин был прикован к постели; Болеславский работал по 14 часов в день более полугода ради получения этой должности. Они представили продукты OCR Systems на Национальной компьютерной конференции в Чикаго, где те пользовались большим успехом. Среди клиентов компании появились Allegheny Energy (Пенсильвания), почтовая служба Бельгии, а штат пополнился в основном выходцами из России, а также Польши, Южной Кореи и США^[6]. Для размещения расширившегося штата Левин перевёл штаб-квартиру OCR Systems из Бенсалема в бизнес-парк Masons Mill в Брин-Этине.^[8].

В 1987 году японская компания Chinon Industries подписала соглашение с OCR Systems о распространении программного обеспечения ReadRight 1.0 вместе со своими сканерами, начиная с модели N-205^[9]. В 1988 году OCR Systems открыла распространение ReadRight и для других производителей сканеров, включая Canon, Hewlett-Packard, Skyworld, Taxan, Diamond Flower и Abaton^[10]. В том же году доход компании составил 3 миллиона долларов^[6] В 1989 году соглашение с Chinon было продлено, а также выпущена версия 2.0 ReadRight^[11].

В начале 1990-х на рынке программного обеспечения для OCR усилилась конкуренция^[2] В ноябре 1991 года канадская компания Delrina из Торонто подписала письмо о намерениях приобрести OCR Systems, рассчитывая завершить сделку в декабре и выпустить программное обеспечение к Рождеству^[12]. OCR Systems должна была получить акции Delrina на сумму 3 миллиона долларов, однако сделка сорвалась в январе 1992 года^[13]. Позднее Delrina выпустила собственный пакет Extended Character Recognition (XCR) в качестве конкурента ReadRight^[14]. В июле 1992 года OCR Systems была приобретена компанией Adobe Inc. за нераскрытую сумму^[7]

System 1000

System 1000 была построена на 16-битном миникомпьютере Varian Data 620/i с 4 КБ оперативной памяти на магнитных сердечниках. Система использовала 620/i для управления подачей бумаги, интерпретации формата документов, процесса оптического распознавания символов, обнаружения ошибок, последовательности операций и вывода данных.^[15]. Изначально система была запрограммирована на распознавание 1428 OCR, печати IBM 407, а также полных наборов символов OCR-A, OCR-B и Farrington 7B, оптических меток и рукописных цифр. OCR Systems обещала добавить поддержку новых шрифтов по запросу в 1970 году^[16]. Количество поддерживаемых шрифтов ограничивалось объёмом памяти, который можно было увеличить до 32 КБ с шагом по 4 КБ^[16]^[3]^[17]. Позднее System 1000 поддерживала обобщённые шрифты пишущих машинок и копировальных аппаратов^[18].

Остальная часть System 1000 включала транспортировку документов, один или несколько сканирующих элементов, ЭЛТ-дисплей и телетайп Model 33 или 35^[17] Листы подавались с помощью фрикционного резинового ремня.^[3] За один проход можно было сканировать до трёх строк на документе, а остальная часть документа могла быть размещена произвольно при наличии достаточного пространства вокруг полей для чтения. Система изначально поддерживала страницы размером от 3,25×3,5 дюйма (позднее — 2,6×3,5 дюйма для квитанций) до стандартного формата ANSI letter (8,5×11 дюймов; позднее — 8,5×12 дюймов для акций).^[17]^[3]^[16] Максимальная производительность первой версии составляла 420 документов в минуту на один транспорт (позднее — 500 документов), в зависимости от размера и содержания.^[3]^[16]

Уникальной особенностью System 1000 по сравнению с другими OCR-системами того времени была функция оповещения оператора о нечитабельных или некорректных полях.^[16] Эта функция, называемая Document Referral, помещала документ перед оператором и отображала пустое поле на экране ЭЛТ-монитора для ручного ввода с клавиатуры. После ввода данные могли быть выведены на 7- или 9-дорожечную магнитную ленту, перфоленту, перфокарты и другие носители, а также на мейнфреймы IBM System/360 для дальнейшей обработки.^[17]

Полная система System 1000 продавалась по цене 69 000 долларов США. Аренда составляла 1 800 долларов в месяц при трёхлетнем контракте или 1 600 долларов в месяц при пятилетнем.^[3] По данным журнала Computerworld, это было менее половины стоимости конкурентов при большей функциональности и удобстве. Среди конкурентов назывались Recognition Equipment Retina, Scan-Optics IC/20 и Scan-Data 250/350.^[17]

ReadRight

ReadRight анализирует отдельные буквы топографически: разбивает отсканированную букву на части — штрихи, дуги, углы, выносные элементы вверх и вниз — и сопоставляет их с древовидной структурой для определения соответствующего кода символа.^[19]. Программа была полностью программной и не требовала дополнительных плат расширения^[20]. Версия 2.01, последняя для DOS^[21], работала в реальном режиме при объёме памяти менее 640 КБ^[19] В 1991 году была выпущена версия 3.0 только для Windows, при этом версия 2.01 для DOS продолжала поддерживаться^[22]^[23]. В октябре 1991 года компания представила продукт ReadRight Personal для портативных сканеров, только для Windows^[23]. Эта версия поддерживала сканирование в реальном времени — каждое слово отображалось на экране по мере сканирования строки.^[24]. Начиная с версии 3.1 (1992), ReadRight стала выпускаться только для Windows^[25].

Включение ReadRight 2.0 в комплект с планшетным сканером Canon IX-12F позволило журналу PC Magazine присудить ему награду «Выбор редакции» в 1989 году^[26]. Тем не менее, рецензент Роберт Кендалл отмечал недостатки в распознавании пропорциональных шрифтов, таких как Helvetica и Times New Roman^[27]. Митт Джонс из того же издания отмечал, что версия 2.01 улучшила работу с такими шрифтами, а также хвалил простоту использования и низкие требования к ресурсам^[26]. Джонс критиковал невозможность обработки неравномерных колонок и графики, отмечая, что в руководстве рекомендовалось закрывать графику стикерами Post-it^[26].

Версия 3.1 для Windows получила смешанные отзывы. Майк Хек из InfoWorld отмечал низкую стоимость и богатый набор функций, но среднюю скорость и точность^[20]. Барри Саймон из PC Magazine называл программу экономичной, но неточной, неспособной исправлять нераспознанные ошибки, с несовершенным проверщиком орфографии и низкой скоростью по сравнению с WordScan Plus от Calera^[22]. Гэри Берлайн из того же журнала писал, что ReadRight обеспечивает приемлемую точность на чистых файлах с простыми макетами, но работает медленно и не справляется с мелким шрифтом и много-колоночным текстом с узкими промежутками^[25]. Программа также часто ошибочно интерпретировала графические элементы как текст^[25]. В июле 1992 года OCR Systems анонсировала обновление, обещавшее исправить эти недостатки, однако оно не было выпущено из-за покупки компании Adobe^[25].

Alumni: Obituaries (англ.). The Pennsylvania Gazette. University of Pennsylvania (ноябрь 2005). Дата обращения: 15 июня 2024. Архивировано 1 декабря 2005 года.
Cauley, Leslie (1 июля 1992). “Adobe Systems buys Nonlinear Technology Inc”. The Baltimore Sun [англ.]: 3B. Архивировано из оригинала 8 июля 2021. Дата обращения 15 июня 2024.
Endrijonas, Janet (22 августа 1989). “Chinon/OCR Systems extend agreement”. Newsbytes [англ.]. The Washington Post Company. Дата обращения 15 июня 2024.
Garza, Victor; Andre Kvitka; Tim Zittle; Elizabeth Eva (12 октября 1990). “OCR: Bringing It All into Focus”. InfoWorld [англ.]. IDG Publications. 12 (43): 73—90. Дата обращения 15 июня 2024.
Giles, David M. (25 сентября 1988). “Holding Company Agrees to Purchase Area Bank's Stock”. The Philadelphia Inquirer [англ.]. Philadelphia Media Network: H23. 1833104173. Дата обращения 15 июня 2024.
Graggs, Tuseda A. (21 октября 1991). “OCR Systems unveils packages for DOS, Windows at Comdex”. InfoWorld [англ.]. IDG Publications. 13 (42): 17. Дата обращения 15 июня 2024.
Grunin, Lori (30 октября 1990). “OCR Software Moves into the Mainstream”. PC Magazine [англ.]. Ziff-Davis. 9 (18): 299—356. Дата обращения 15 июня 2024.
Heck, Mike (22 июля 1991). “OCR software: end the paper chase”. InfoWorld [англ.]. IDG Publications. 13 (29): 51, 54. Дата обращения 15 июня 2024.
Jones, Mitt (июль 1992). “From Print to PC: OCR Gets You from Here to There”. PC Magazine [англ.]. Ziff-Davis. 11 (13): 267—319. Дата обращения 15 июня 2024. Проверьте дату в |date= (справка на английском)
Leitch, Carolyn (12 ноября 1991). “Delrina to Buy Two U.S. High-tech Firms”. The Globe and Mail [англ.]. Bell Globemedia Publishing: B2. 385490846. Дата обращения 15 июня 2024.
Nakamura, Roxanna Li (4 июня 1990). “OCR Systems to Ship ReadRight for Hand-held Scanners”. InfoWorld [англ.]. IDG Publications. 12 (23): 17. Дата обращения 15 июня 2024.
Perfidio, Lou (5 января 1989). “A Firm with a Slavic Accent”. The Philadelphia Inquirer [англ.]. Philadelphia Media Network: H4. 1834332624. Дата обращения 15 июня 2024.
Simon, Barry (11 июля 1991). “ReadRight for Windows Falls Short in OCR Competition”. PC Magazine [англ.]. Ziff-Davis. 10 (11): 52. Дата обращения 15 июня 2024.
Sims, Gayle Ronan (2 июня 2005). “Theodor Levine, Software Pioneer”. The Philadelphia Inquirer [англ.]. Philadelphia Media Network: B9. 1906206556. Дата обращения 15 июня 2024.
Staff writer (сентябрь 1970). “Optical, Mark Sense Scanners”. Business Automation [англ.]. Business Press International. 17 (9): 110—115. Дата обращения 15 июня 2024. Проверьте дату в |date= (справка на английском)
Staff writer (4 ноября 1970). “Low Cost Off-Line System Can Read Any OCR Font”. Computerworld [англ.]. CW Communications. 4 (44): 24. Дата обращения 15 июня 2024.
Staff writer (9 декабря 1970). “Mini Controls OCR System”. Computerworld [англ.]. CW Communications. 4 (49): 26. Дата обращения 15 июня 2024.
Staff writer (15 февраля 1971). “Optical Reader”. Datamation [англ.]. Technical Publishing Company. 17 (4): 62. Дата обращения 15 июня 2024.
Staff writer (март 1973). “News About Companies”. Graphic Arts Monthly [англ.]. The Graphic Arts Publishing Company. 45 (3): 148. Дата обращения 15 июня 2024. Проверьте дату в |date= (справка на английском)
Staff writer (апрель 1973). “3M Set to Distribute OCR System in United States”. Graphic Arts Unionist [англ.]. Graphic Arts International Union. 10 (3): 61. Дата обращения 15 июня 2024. Проверьте дату в |date= (справка на английском)
Staff writer (июнь 1973). “3M Signs Two Agreements”. Modern Lithography [англ.]. Publishers' Development Corporation. 41 (6): 45. Дата обращения 15 июня 2024. Проверьте дату в |date= (справка на английском)
Staff writer (1 декабря 1987). “Chinon's PC-, Mac-compatible Overhead Scanner Doesn't Require Special Lighting”. PC Week [англ.]. Ziff-Davis. 4 (48): 35. Дата обращения 15 июня 2024.
Staff writer (21 ноября 1988). “Vendor Profiles”. PC Week [англ.]. Ziff-Davis. 5 (47): 102. Дата обращения 15 июня 2024.
Staff writer (15 января 1992). “Delrina Drops Plans to Buy 2 U.S. Firms”. The Globe and Mail [англ.]. Bell Globemedia Publishing: B9. 385416440. Дата обращения 15 июня 2024.
Staff writer (30 ноября 2001). “Looking Back”. Computing Canada [англ.]. Plesman Publications. 27 (25): 13. 225014608. Дата обращения 15 июня 2024.
Stanton, Tom (28 марта 1989). “From Fax to Finish: Scanners Build a Better Image”. PC Magazine [англ.]. Ziff-Davis. 8 (6): 187—258. Дата обращения 15 июня 2024.
Waters, Crystal (февраль 1991). “Read It Right with ReadRight Personal”. Home Office Computing [англ.]. Curtco Freedom Group. 9 (2): 16. 200640462. Дата обращения 15 июня 2024. Проверьте дату в |date= (справка на английском)

Некролог Теодора Левина в The Pennsylvania Gazette

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

OCR Systems

История

Продукция

System 1000

ReadRight

Примечания

Литература

Ссылки