Умный захват данных
Умный захват данных (англ. Smart data capture, SDC), также известный как интеллектуальный захват данных или автоматизированный захват данных, — это направление технологий, связанное с использованием методов компьютерного зрения, таких как оптическое распознавание символов (OCR), сканирование штрихкодов, распознавание объектов и других схожих технологий для извлечения и обработки информации из полуструктурированных и неструктурированных данных. Согласно определению IDC, умный захват данных — это «интегрированная стратегия аппаратного и программного обеспечения и соединённости, позволяющая организациям эффективно, повторяемо, масштабируемо и с учётом будущих изменений осуществлять захват данных»[1]. Данные захватываются визуально с помощью штрихкодов, текста, удостоверений личности и других объектов — часто из множества источников одновременно — после чего преобразуются и подготавливаются для цифрового использования, как правило, с помощью программного обеспечения на основе искусственного интеллекта[2]. Важной особенностью SDC является не только повышение эффективности захвата данных, но и предоставление сотрудникам на передовой и офисным работникам оперативного доступа к релевантной информации в момент сбора данных, что способствует принятию решений и делает процесс двусторонним.
Умный захват данных автоматизирует и ускоряет сбор данных, применяя аналитику в реальном времени и автоматизируя процессы на основе извлечённой информации. Такие решения предназначены для многократного и масштабируемого использования с целью сокращения рутинных ручных операций и исключения человеческих ошибок. Для достижения этих целей решения умного захвата данных часто реализуются с помощью специализированного программного обеспечения, устанавливаемого на стандартное оборудование, например смартфоны[3]. Однако некоторые решения могут опираться и на специализированное оборудование, такое как отдельные сканирующие устройства, носимые устройства[4] или промышленные роботы[5].
Отличия от оптического распознавания символов
Приложения для оптического распознавания символов обычно сосредоточены непосредственно на процессе захвата данных; их задача — максимально точно воспроизвести текст, слова, буквы и символы с печатного документа. В отличие от этого, умный захват данных опирается на мультимодальное обучение[6] и способен извлекать информацию из гораздо более широкого спектра полуструктурированных и неструктурированных источников, выходя за рамки простой текстовой обработки и открывая больше возможностей для применения. Благодаря расширенной функциональности, предоставляющей актуальные сведения непосредственно в момент сбора данных, SDC представляет собой двусторонний процесс (захват—отображение), тогда как традиционный OCR служит преимущественно для одностороннего ввода информации[7].
Обычно решения в области умного захвата данных включают две ключевые составляющие:
- Захват данных (включая OCR, сканирование штрихкодов, распознавание объектов);
- Функции, позволяющие использовать полученные данные для предоставления оперативной информации в момент захвата.
Применение
Умный захват данных может быть применён практически в любой отрасли и сфере деятельности, где требуется фиксация и интерпретация визуальной информации. Примеры включают:
Примечания
В прошлом компания PriceWaterhouseCoopers описывала умный захват данных как «комбинацию роботизации бизнес‑процессов и интеллектуального распознавания символов»[13]. Однако это определение больше не отражает современное состояние технологий, поскольку оно охватывает преимущественно текстовые системы захвата (автоматизированный OCR).