Интеграция систем искусственного интеллекта
Интеграция систем искусственного интеллекта — направление в области искусственного интеллекта, целью которого является обеспечение совместимости отдельных программных компонентов, таких как синтезаторы речи, с другими элементами, например, базами знаний для создания более масштабных, продвинутых и функциональных систем ИИ[1]. К основным методам интеграции относят маршрутизацию сообщений и коммуникационные протоколы, позволяющие программным компонентам взаимодействовать, зачастую с использованием промежуточного программного обеспечения на основе «чёрной доски» (англ. blackboard architecture).
Большинство систем искусственного интеллекта включают интегрированные технологии, например, сочетание синтеза речи и распознавания речи. В последние годы наметилась тенденция к выделению интеграции систем в самостоятельное направление в ИИ. Среди её сторонников — исследователи Марвин Минский, Аарон Сломан, Деб Рой, Кристинн Р. Ториссон и Майкл Арбиб. Повышенный интерес объясняется тем, что для ряда узкоспециализированных задач — таких как компьютерное зрение или синтез речи — уже созданы относительно простые решения, и их интеграция выглядит более рациональным и экономичным способом создания широких ИИ-систем, чем построение монолитных решений «с нуля»[1].
Интеграционный подход
Подход, ориентированный на интеграцию систем, особенно в рамках модульных решений, обусловлен тем, что большинство крупномасштабных «интеллектов» функционирует посредством множества процессов и/или использует мультимодальные входные и выходные данные. Так, антропоморфная интеллектуальная система должна уметь говорить (синтез речи), воспринимать речь (распознавание), осмыслять информацию с помощью логических или иных механизмов. Поэтому для построения широкого искусственного интеллекта важно объединять различные функциональные модули.
Вклад в успешную интеграцию ИИ-систем вносят коллективная работа и стандартизация, как это видно на примере крупных компаний и ИТ-отделов. Для поддержки совместной разработки используются процедуры и стандарты, направленные на обеспечение качества, надежности и совместимости, например, рекомендации W3C для веб-разработки. При этом в самой сфере искусственного интеллекта сотрудничество между разработчиками долгое время оставалось ограниченным отдельными школами, лабораториями и академическими институтами, а иногда и внутри них. Это затрудняет интеграционную деятельность, ведь исследователи вынуждены создавать новые платформы ради совместимости модулей. Негативно влияет сопротивлениие научного сообщества использованию наработок коллег.
В результате появляются (и до сих пор существуют) многочисленные «островки решений» — изолированные программные компоненты или механизмы, реализующие отдельные аспекты искусственного интеллекта:
- Синтез речи
- FreeTTS от Университета Карнеги — Меллон
- Распознавание речи
- Sphinx от Университета Карнеги — Меллон
- Логический вывод
- OpenCyc от Cycorp
- Open Mind Common Sense (сеть здравого смысла) от MIT
Развитие движения за свободное программное обеспечение сделало значительную часть программных продуктов, включая ИИ-системы, доступными для открытого использования. Логичным дальнейшим шагом становится объединение независимых компонентов в целостные масштабные системы. Наиболее эффективным способом интеграции служит обеспечение простых механизмов взаимодействия каждого компонента с другими, превращая отдельные решения в тестируемые модули, пригодные для включения в крупную архитектуру.
Однако и здесь существуют серьёзные ограничения, в частности — непредсказуемые критические ошибки. Например, в высокоспециализированных областях, таких как онкология, были задокументированы опасные ошибки интегрированных ИИ. В статье журнала Oral Oncology Reports под названием «When AI goes wrong: Fatal errors in oncological research reviewing assistance» подробно описан критический сбой искусственного интеллекта на основе GPT в биофизических исследованиях[2].
В интернете существуют сообщества разработчиков ИИ (функционируют форумы, публикуются обучающие материалы), однако единых, широко принятых стандартов взаимодействия и интеграции систем выработать пока не удалось.
Методологии
Конструкционистская методология проектирования (англ. Constructionist Design Methodology, CDM) — формальный подход, предложенный в 2004 году для разработки когнитивной робототехники, коммуникативных гуманоидных роботов и широких ИИ-систем. Разработка подобных систем требует интеграции большого числа функций при тщательной координации их совместной работы, обеспечивающей целостное поведение. CDM основывается на итеративном проектировании, с построением именованных интерактивных модулей, обменивающихся явно типизированными потоками данных и дискретными сообщениями. Протокол обмена сообщениями OpenAIR был вдохновлён этой методологией и часто применяется для создания сложных ИИ-систем на базе CDM.