Умный захват данных

Умный захват данных (англ. Smart data capture, SDC), также известный как интеллектуальный захват данных или автоматизированный захват данных, — это направление технологий, связанное с использованием методов компьютерного зрения, таких как оптическое распознавание символов (OCR), сканирование штрихкодов, распознавание объектов и других схожих технологий для извлечения и обработки информации из полуструктурированных и неструктурированных данных. Согласно определению IDC, умный захват данных — это «интегрированная стратегия аппаратного и программного обеспечения и соединённости, позволяющая организациям эффективно, повторяемо, масштабируемо и с учётом будущих изменений осуществлять захват данных»[1]. Данные захватываются визуально с помощью штрихкодов, текста, удостоверений личности и других объектов — часто из множества источников одновременно — после чего преобразуются и подготавливаются для цифрового использования, как правило, с помощью программного обеспечения на основе искусственного интеллекта[2]. Важной особенностью SDC является не только повышение эффективности захвата данных, но и предоставление сотрудникам на передовой и офисным работникам оперативного доступа к релевантной информации в момент сбора данных, что способствует принятию решений и делает процесс двусторонним.

Умный захват данных автоматизирует и ускоряет сбор данных, применяя аналитику в реальном времени и автоматизируя процессы на основе извлечённой информации. Такие решения предназначены для многократного и масштабируемого использования с целью сокращения рутинных ручных операций и исключения человеческих ошибок. Для достижения этих целей решения умного захвата данных часто реализуются с помощью специализированного программного обеспечения, устанавливаемого на стандартное оборудование, например смартфоны[3]. Однако некоторые решения могут опираться и на специализированное оборудование, такое как отдельные сканирующие устройства, носимые устройства[4] или промышленные роботы[5].

Отличия от оптического распознавания символов

Приложения для оптического распознавания символов обычно сосредоточены непосредственно на процессе захвата данных; их задача — максимально точно воспроизвести текст, слова, буквы и символы с печатного документа. В отличие от этого, умный захват данных опирается на мультимодальное обучение[6] и способен извлекать информацию из гораздо более широкого спектра полуструктурированных и неструктурированных источников, выходя за рамки простой текстовой обработки и открывая больше возможностей для применения. Благодаря расширенной функциональности, предоставляющей актуальные сведения непосредственно в момент сбора данных, SDC представляет собой двусторонний процесс (захват—отображение), тогда как традиционный OCR служит преимущественно для одностороннего ввода информации[7].

Обычно решения в области умного захвата данных включают две ключевые составляющие:

  • Захват данных (включая OCR, сканирование штрихкодов, распознавание объектов);
  • Функции, позволяющие использовать полученные данные для предоставления оперативной информации в момент захвата.

Применение

Умный захват данных может быть применён практически в любой отрасли и сфере деятельности, где требуется фиксация и интерпретация визуальной информации. Примеры включают:

  • Розничная торговля[8]
  • Управление складскими запасами
  • Логистика, транспортировка и отгрузка[9]
  • Производство
  • Промышленное и сервисное обслуживание
  • Здравоохранение[10]
  • Транспорт и путешествия[11]
  • Выявление мошенничества
  • Иммерсивные впечатления с применением дополнённой реальности[12]

Примечания

В прошлом компания PriceWaterhouseCoopers описывала умный захват данных как «комбинацию роботизации бизнес‑процессов и интеллектуального распознавания символов»[13]. Однако это определение больше не отражает современное состояние технологий, поскольку оно охватывает преимущественно текстовые системы захвата (автоматизированный OCR).

Примечания