Робототехнические системы с компьютерным зрением
Робототехнические системы с компьютерным зрением (англ. vision-guided robot, VGR) — это робототехнические системы, оснащённые одной или несколькими камерами, используемыми в качестве сенсоров для предоставления дополнительного сигнала обратной связи контроллеру робота с целью более точного перемещения к изменяющемуся положению цели. Технология VGR быстро трансформирует производственные процессы, обеспечивая высокую адаптивность роботов и упрощая их внедрение, при этом значительно снижая стоимость и сложность стационарной оснастки, необходимой для проектирования и настройки роботизированных ячеек для таких задач, как обработка материалов, автоматизированная сборка, применение в сельском хозяйстве, биомедицинских и других областях[1][2].
Классическим, хотя и устаревшим примером использования VGR на производстве служит система, где камера и программное обеспечение определяют положение объектов, подаваемых случайным образом на транспортёр для сортировки. Система зрения определяет точные координаты этих объектов, находящихся в зоне обзора камеры, что позволяет роботизированному манипулятору позиционировать захват и осуществлять подбор с движущегося конвейера. При этом транспортёр может быть остановлен под камерой для определения положения детали, либо, если цикл достаточно быстрый, возможен подбор без остановки посредством системы управления, отслеживающей перемещающийся объект программно — обычно с использованием энкодера на конвейере и передачи этого сигнала обратной связи в контур координации движения и зрения.
Подобный функционал сегодня является стандартом в области роботов с визуальным управлением. Эта динамично развивающаяся технология экономически выгодна для стран с высокими производственными расходами и дорогой рабочей силой, так как снижает необходимое ручное вмешательство, повышает безопасность, качество и производительность[3].
Распространение робототехнических систем с визуальным управлением обусловлено быстрым ростом рынка машинного зрения, который, как ожидается, к 2028 году достигнет $17,72 млрд. Такой рост связан с увеличением спроса на автоматизацию и точность, а также широким внедрением «умных» технологий в разных отраслях[4][5].
Системы технического зрения для управления роботами
Система технического зрения включает камеру и микропроцессор либо компьютер с соответствующим программным обеспечением. Это широкое определение охватывает разнообразные системы, предназначенные для решения большого спектра задач. Технические системы зрения могут использоваться практически в любой отрасли для самых разных целей: от контроля качества (измерения размеров, углов, цвета, структуры поверхности) до распознавания объектов, применяемого в VGR-системах.
В качестве камеры может выступать как стандартная компактная камера с интегрированным процессором обработки изображений, так и более сложные лазерные сенсоры или высокоскоростные камеры с высоким разрешением. Возможны и комбинации из нескольких камер для построения 3D-изображения объекта.
Ограничения систем зрения
При интеграции систем технического зрения часто возникают трудности, связанные с необходимостью соответствия камеры и параметров задачам системы. В большинстве случаев это вызвано недостатком знаний у интеграторов либо разработчиков машин. Хотя многие системы зрения могут быть успешно применены в любой производственной операции, требуется чёткое понимание параметров настройки системы. Однако такой этап настройки требует внушительных знаний специалиста и наличия множества опций, из-за чего решения становятся сложными. Дополнительной проблемой может стать освещение в промышленных условиях.
Преодоление ограничений освещения с помощью 3D-зрения
Одним из преимуществ 3D-технологий машинного зрения является их независимость от условий освещения. В отличие от 2D-систем, опирающихся на определённые условия освещённости для точного построения изображения, 3D-системы могут стабильно функционировать в самых разных световых обстановках. Это связано с тем, что в 3D-системах фиксируется пространственная информация, менее чувствительна к контрасту и теням по сравнению с двумя измерениями.
В последние годы на рынке появляются стартапы, предлагающие программные решения, упрощающие программирование и интеграцию 3D-систем, что делает их доступнее для промышленности. Используя трёхмерные технологии зрения, роботы могут перемещаться и выполнять задачи в средах со сложными или неконтролируемыми условиями освещения, что расширяет области их практического применения.
Подходы к реализации систем VGR
Обычно системы визуального наведения подразделяют на две категории: с фиксированным положением камеры и с камерой, установленной на манипуляторе робота. Стационарная камера, как правило, устанавливается на портале или другой конструкции, обеспечивая контроль всей рабочей зоны ячейки. Данный подход даёт стабильную точку отсчёта для всех операций внутри ячейки, однако требует затрат на инфраструктуру и может страдать от того, что рабочий орган робота загораживает вид камере. Для обзора всего рабочего пространства обычно требуются изображения большого разрешения (от 5 мегапикселей).
Стационарные камеры бывают как двухмерными (2D), так и трёхмерными (3D). Хотя 2D-системы по-прежнему широко распространены благодаря своей надёжности и экономической эффективности для задач на плоскости (контроль поверхностей, считывание кодов)[6], на рынке наблюдается уверенный рост применения 3D-технологий[7]. 3D-камеры необходимы для задач, требующих информации о глубине и объёме, таких как роботизированная выгрузка из контейнеров (bin picking) или навигация в сложном пространстве[8][6]. Ключевыми производителями 2D и 3D систем машинного зрения являются Cognex, Keyence, Basler, Sick, Omron, Teledyne и Sony[9]. В сегменте 3D-зрения также выделяются компании Zivid, Photoneo, ISRA Vision и др[9]. 3D-камеры с фиксированным монтажом создают большие файлы изображений и облака точек, требующие значительных вычислительных ресурсов для обработки.
Камера, установленная на манипуляторе, также имеет свои плюсы и минусы. Некоторые 3D-камеры слишком громоздки для установки на роботе, однако на рынке существуют компактные решения. Примером является 2D-камера Robotiq Wrist Camera, разработанная для коллаборативных роботов, в частности Universal Robots. Она весит всего 160 грамм, крепится на «запястье» манипулятора и позиционируется как «Plug + Play» решение, настраиваемое с пульта управления робота без внешнего ПК[10][11]. У камер на манипуляторе меньше поле зрения, что позволяет им удовлетворительно функционировать при более низком разрешении и сокращает время обработки изображения.
Однако такие камеры, будь то 2D или 3D, обычно сталкиваются с дезориентацией по осям XYZ, поскольку постоянно перемещаются и не имеют сведений о положении манипулятора. Обычным решением служит остановка цикла каждое движение — достаточно для съёмки новой фотографии и переориентации. Как видно практически из всех публикаций и видеозаписей выступлений таких камер, это увеличивает цикл работы примерно вдвое.
Использование потребительских сенсоров, таких как Kinect от Xbox, в промышленных системах является устаревшим подходом, так как их производство прекращено, а технические характеристики не отвечают современным требованиям[12][13]. Современные решения, такие как Pickit 3D, используют собственные промышленные 3D-камеры высокого разрешения, защищённые по стандарту IP65 и способные работать со сложными (например, блестящими или тёмными) объектами[14][15]. Хотя такие системы более эффективно решают 3D-задачи, проблема задержек, связанных с необходимостью остановки для захвата и обработки изображения, остаётся актуальной для многих приложений.
Компания Visual Robotics заявляет об устранении задержек при помощи своей технологии Vision-in-Motion. Их система сочетает 2D-матрицу, внутренний фотограмметрический блок и программное обеспечение для выполнения 3D-задач за счёт небольшого объёма изображений. Компания подала патентную заявку на технологию, позволяющую определять положение камеры в 3D-пространстве без необходимости останавливаться, что приводит к повышению производительности. Хотя система значительно быстрее аналогов, она не способна решать самые сложные объёмные задачи, подобно настоящей стереокамере. С другой стороны, большинство 3D-задач подразумевают простое определение объекта, и для них этого подхода достаточно. Пока что возможность захвата движущихся объектов (например, на транспортёре), визуально с помощью камеры на захвате, остаётся уникальной.
Новый подход к решению проблемы задержек и адаптации демонстрирует парижский стартап Inbolt (основан в 2019 году). Его платформа GuideNOW использует 3D-камеру, установленную на роботе, и искусственный интеллект для локализации объектов и коррекции траектории робота в режиме реального времени[16][17]. Это позволяет отказаться от жёсткой фиксации деталей. Система обучается на основе CAD-моделей менее чем за 10 минут и совместима с роботами ведущих производителей (FANUC, ABB, KUKA, Universal Robots)[16]. Inbolt заявляет о высокой скорости обработки, позволяющей достигать точности до 1 мм даже при работе с движущимися объектами[18]. По состоянию на 2025 год, технология уже внедрена на заводах крупных автопроизводителей, таких как Stellantis, Renault и Ford[19]. Например, Stellantis сообщила об экономии более 3,1 млн евро за год благодаря внедрению платформы[20]. В июне 2025 года компания объявила о выходе на рынки США и Японии[21].
Преимущества систем VGR
Классическая автоматизация подразумевает серийное производство с большими партиями продукции и низкой гибкостью. Автоматизированные линии обычно строятся под один или, в лучшем случае, небольшой семейство схожих изделий. Изменение компонента или переход к новому продукту требуют масштабных изменений в оснастке и часто продолжительной переналадки линии, а также новых приспособлений для подачи комплектующих (бункеры, вибропитатели, чашечные питатели и пр.). Стоимость комплекта приспособлений, хранения сменных частей и время переналадки могут быть существенной частью инвестиций.
Системы VGR работают с минимальными механическими доработками. В ряде случаев требуется лишь смена захвата, а необходимость точного позиционирования компонентов для захвата отпадает. Встроенная система зрения и управляющее ПО позволяют работать с деталями самой разнообразной формы и в любом положении, без перенастроек машины, что ускоряет переход между изделиями. Прочие достоинства систем VGR включают:[22]
- Переключение между изделиями и сериями происходит программно, быстро, без механических перенастроек.
- Высокая остаточная стоимость оборудования даже при смене продукции.
- Короткие сроки поставки и быстрая окупаемость.
- Высокая эффективность, надёжность и гибкость оборудования.
- Возможность интеграции вторичных операций (удаление заусенцев, продувка, мойка, измерение и др.).
- Снижение доли ручного труда.


