Умный захват данных

Умный захват данных (англ. Smart data capture, SDC), также известный как интеллектуальный захват данных или автоматизированный захват данных, — это направление технологий, связанное с использованием методов компьютерного зрения, таких как оптическое распознавание символов (OCR), сканирование штрихкодов, распознавание объектов и других схожих технологий для извлечения и обработки информации из полуструктурированных и неструктурированных данных. Согласно определению IDC, умный захват данных — это «интегрированная стратегия аппаратного и программного обеспечения и соединённости, позволяющая организациям эффективно, повторяемо, масштабируемо и с учётом будущих изменений осуществлять захват данных»^[1]. Данные захватываются визуально с помощью штрихкодов, текста, удостоверений личности и других объектов — часто из множества источников одновременно — после чего преобразуются и подготавливаются для цифрового использования, как правило, с помощью программного обеспечения на основе искусственного интеллекта^[2]. Важной особенностью SDC является не только повышение эффективности захвата данных, но и предоставление сотрудникам на передовой и офисным работникам оперативного доступа к релевантной информации в момент сбора данных, что способствует принятию решений и делает процесс двусторонним.

Умный захват данных автоматизирует и ускоряет сбор данных, применяя аналитику в реальном времени и автоматизируя процессы на основе извлечённой информации. Такие решения предназначены для многократного и масштабируемого использования с целью сокращения рутинных ручных операций и исключения человеческих ошибок. Для достижения этих целей решения умного захвата данных часто реализуются с помощью специализированного программного обеспечения, устанавливаемого на стандартное оборудование, например смартфоны^[3]. Однако некоторые решения могут опираться и на специализированное оборудование, такое как отдельные сканирующие устройства, носимые устройства^[4] или промышленные роботы^[5].

Приложения для оптического распознавания символов обычно сосредоточены непосредственно на процессе захвата данных; их задача — максимально точно воспроизвести текст, слова, буквы и символы с печатного документа. В отличие от этого, умный захват данных опирается на мультимодальное обучение^[6] и способен извлекать информацию из гораздо более широкого спектра полуструктурированных и неструктурированных источников, выходя за рамки простой текстовой обработки и открывая больше возможностей для применения. Благодаря расширенной функциональности, предоставляющей актуальные сведения непосредственно в момент сбора данных, SDC представляет собой двусторонний процесс (захват—отображение), тогда как традиционный OCR служит преимущественно для одностороннего ввода информации^[7].

Обычно решения в области умного захвата данных включают две ключевые составляющие:

Захват данных (включая OCR, сканирование штрихкодов, распознавание объектов);
Функции, позволяющие использовать полученные данные для предоставления оперативной информации в момент захвата.

Умный захват данных может быть применён практически в любой отрасли и сфере деятельности, где требуется фиксация и интерпретация визуальной информации. Примеры включают:

Розничная торговля^[8]
Управление складскими запасами
Логистика, транспортировка и отгрузка^[9]
Производство
Промышленное и сервисное обслуживание
Здравоохранение^[10]
Транспорт и путешествия^[11]
Выявление мошенничества
Иммерсивные впечатления с применением дополнённой реальности^[12]

В прошлом компания PriceWaterhouseCoopers описывала умный захват данных как «комбинацию роботизации бизнес‑процессов и интеллектуального распознавания символов»^[13]. Однако это определение больше не отражает современное состояние технологий, поскольку оно охватывает преимущественно текстовые системы захвата (автоматизированный OCR).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

Умный захват данных

Отличия от оптического распознавания символов

Применение

Примечания

Примечания