Система обнаружения (искусственный интеллект)

Система обнаружения — это система искусственного интеллекта, предназначенная для автоматического выявления новых научных идей, понятий или законов. Ключевая задача подобных систем — автоматизация анализа научных данных и процесса научного открытия. Идеально система искусственного интеллекта должна систематически исследовать пространство всех возможных гипотез и выдавать одну или несколько наиболее вероятных гипотез, которые наилучшим образом описывают сложные закономерности в данных^[1]^[2].

В период, известный как второе «лето искусственного интеллекта» (примерно 1978—1987 годы), были разработаны различные системы, родственные доминирующим в то время экспертным системам, призванные решать задачу извлечения научных гипотез из данных с участием или без участия человека-учёного. К числу этих систем относятся Autoclass^[3], Automated Mathematician^[4]^[5], Eurisko^[6], ориентированные на общую задачу поиска гипотез, и более специализированные программы, такие как Dalton, выявляющая свойства молекул из экспериментальных данных.

С усилением интереса к подсоболичным (subsymbolic) методам, например нейронным сетям, после наступления второго «зимы искусственного интеллекта», развитие систем для автоматического открытия закономерностей отошло на второй план. Подсоболичные методы акцентируют внимание на предсказании, а не объяснении, и приводят к моделям, работающим, но трудным или невозможным для интерпретации («Чёрный ящик», англ. black box). Такая «чёрная коробка» не может рассматриваться как полноценная научная гипотеза, а потому ряд исследователей полагает, что традиционная цель науки — получение объяснимых гипотез об устройстве реальности — становится устаревшей^[7]^[8]. Другие исследователи возражают: подсоболичные методы полезны в ряде случаев, но не подходят для генерации объяснимых научных теорий.^[9]^[10]^[11]

Autoclass — байесовская система классификации, созданная в 1986 году^[3]
Automated Mathematician — одна из первых успешных систем обнаружения, созданная в 1977 году; работала путём генерации и модификации небольших Lisp-программ
Eurisko — продолжение Automated Mathematician, разработанная в 1984 году
Dalton — поддерживаемая по сей день программа для вычисления различных молекулярных свойств; запущена первоначально в 1983 году, а с 2017 года доступна в виде открытого ПО
Glauber — научно-открывающая система, созданная в 1983 году в рамках вычислительной философии науки

После нескольких десятилетий затишья интерес к системам автоматического научного открытия возродился с работами Майкла Шмидта (Michael Schmidt), аспиранта по вычислительной биологии в Корнеллском университете. Шмидт и его научный руководитель Ход Липсон создали платформу Eureqa, которую описали как подход символической регрессии к «выделению свободных по форме физических законов из экспериментальных данных»^[12]. Этот подход продемонстрировал большой потенциал символической регрессии для научных открытий с помощью искусственного интеллекта.

С 2009 года символическая регрессия существенно развилась, и на сегодняшний день в научных исследованиях активно применяются как коммерческие, так и открытые системы. Среди наиболее заметных примеров: Eureqa (теперь часть DataRobot AI Cloud Platform), AI Feynman и QLattice^[13].

Революция искусственного интеллекта в научных исследованиях (англ.)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

Система обнаружения (искусственный интеллект)

Системы обнаружения 1970—1980-х годов

Современные системы обнаружения (с 2009 года)

Примечания

Ссылки