Интеграция систем искусственного интеллекта

Интеграция систем искусственного интеллекта — направление в области искусственного интеллекта, целью которого является обеспечение совместимости отдельных программных компонентов, таких как синтезаторы речи, с другими элементами, например, базами знаний для создания более масштабных, продвинутых и функциональных систем ИИ^[1]. К основным методам интеграции относят маршрутизацию сообщений и коммуникационные протоколы, позволяющие программным компонентам взаимодействовать, зачастую с использованием промежуточного программного обеспечения на основе «чёрной доски» (англ. blackboard architecture).

Большинство систем искусственного интеллекта включают интегрированные технологии, например, сочетание синтеза речи и распознавания речи. В последние годы наметилась тенденция к выделению интеграции систем в самостоятельное направление в ИИ. Среди её сторонников — исследователи Марвин Минский, Аарон Сломан, Деб Рой, Кристинн Р. Ториссон и Майкл Арбиб. Повышенный интерес объясняется тем, что для ряда узкоспециализированных задач — таких как компьютерное зрение или синтез речи — уже созданы относительно простые решения, и их интеграция выглядит более рациональным и экономичным способом создания широких ИИ-систем, чем построение монолитных решений «с нуля»^[1].

Подход, ориентированный на интеграцию систем, особенно в рамках модульных решений, обусловлен тем, что большинство крупномасштабных «интеллектов» функционирует посредством множества процессов и/или использует мультимодальные входные и выходные данные. Так, антропоморфная интеллектуальная система должна уметь говорить (синтез речи), воспринимать речь (распознавание), осмыслять информацию с помощью логических или иных механизмов. Поэтому для построения широкого искусственного интеллекта важно объединять различные функциональные модули.

Проблемы и решения

Вклад в успешную интеграцию ИИ-систем вносят коллективная работа и стандартизация, как это видно на примере крупных компаний и ИТ-отделов. Для поддержки совместной разработки используются процедуры и стандарты, направленные на обеспечение качества, надежности и совместимости, например, рекомендации W3C для веб-разработки. При этом в самой сфере искусственного интеллекта сотрудничество между разработчиками долгое время оставалось ограниченным отдельными школами, лабораториями и академическими институтами, а иногда и внутри них. Это затрудняет интеграционную деятельность, ведь исследователи вынуждены создавать новые платформы ради совместимости модулей. Негативно влияет сопротивлениие научного сообщества использованию наработок коллег.

В результате появляются (и до сих пор существуют) многочисленные «островки решений» — изолированные программные компоненты или механизмы, реализующие отдельные аспекты искусственного интеллекта:

Синтез речи
- FreeTTS от Университета Карнеги — Меллон
Распознавание речи
- Sphinx от Университета Карнеги — Меллон
Логический вывод
- OpenCyc от Cycorp
- Open Mind Common Sense (сеть здравого смысла) от MIT

Развитие движения за свободное программное обеспечение сделало значительную часть программных продуктов, включая ИИ-системы, доступными для открытого использования. Логичным дальнейшим шагом становится объединение независимых компонентов в целостные масштабные системы. Наиболее эффективным способом интеграции служит обеспечение простых механизмов взаимодействия каждого компонента с другими, превращая отдельные решения в тестируемые модули, пригодные для включения в крупную архитектуру.

Однако и здесь существуют серьёзные ограничения, в частности — непредсказуемые критические ошибки. Например, в высокоспециализированных областях, таких как онкология, были задокументированы опасные ошибки интегрированных ИИ. В статье журнала Oral Oncology Reports под названием «When AI goes wrong: Fatal errors in oncological research reviewing assistance» подробно описан критический сбой искусственного интеллекта на основе GPT в биофизических исследованиях^[2].

В интернете существуют сообщества разработчиков ИИ (функционируют форумы, публикуются обучающие материалы), однако единых, широко принятых стандартов взаимодействия и интеграции систем выработать пока не удалось.

Конструкционистская методология проектирования

Конструкционистская методология проектирования (англ. Constructionist Design Methodology, CDM) — формальный подход, предложенный в 2004 году для разработки когнитивной робототехники, коммуникативных гуманоидных роботов и широких ИИ-систем. Разработка подобных систем требует интеграции большого числа функций при тщательной координации их совместной работы, обеспечивающей целостное поведение. CDM основывается на итеративном проектировании, с построением именованных интерактивных модулей, обменивающихся явно типизированными потоками данных и дискретными сообщениями. Протокол обмена сообщениями OpenAIR был вдохновлён этой методологией и часто применяется для создания сложных ИИ-систем на базе CDM.

ASIMO — робот-гуманоид компании Honda, и QRIO — гуманоидный робот Sony
Cog — проект MIT по созданию гуманоидного робота под руководством Родни Брукса
AIBO — робот-пёс Sony, интегрирующий модули зрения, слуха и моторики
TOPIO — робот-гуманоид TOSY для игры в настольный теннис с людьми

Constructionist Design Methodology, публикация в журнале AI
MissionEngine: интеграция нескольких систем на Python в проекте Tactical Language

Cog — гуманоидный робот MIT
Библиотека Инициативы открытых знаний

[1]

[2]

Интеграция систем искусственного интеллекта

Интеграционный подход

Проблемы и решения

Методологии

Конструкционистская методология проектирования

Примеры

Примечания

Литература

Ссылки