Система обнаружения (искусственный интеллект)

Система обнаружения — это система искусственного интеллекта, предназначенная для автоматического выявления новых научных идей, понятий или законов. Ключевая задача подобных систем — автоматизация анализа научных данных и процесса научного открытия. Идеально система искусственного интеллекта должна систематически исследовать пространство всех возможных гипотез и выдавать одну или несколько наиболее вероятных гипотез, которые наилучшим образом описывают сложные закономерности в данных[1][2].

В период, известный как второе «лето искусственного интеллекта» (примерно 1978—1987 годы), были разработаны различные системы, родственные доминирующим в то время экспертным системам, призванные решать задачу извлечения научных гипотез из данных с участием или без участия человека-учёного. К числу этих систем относятся Autoclass[3], Automated Mathematician[4][5], Eurisko[6], ориентированные на общую задачу поиска гипотез, и более специализированные программы, такие как Dalton, выявляющая свойства молекул из экспериментальных данных.

С усилением интереса к подсоболичным (subsymbolic) методам, например нейронным сетям, после наступления второго «зимы искусственного интеллекта», развитие систем для автоматического открытия закономерностей отошло на второй план. Подсоболичные методы акцентируют внимание на предсказании, а не объяснении, и приводят к моделям, работающим, но трудным или невозможным для интерпретации («Чёрный ящик», англ. black box). Такая «чёрная коробка» не может рассматриваться как полноценная научная гипотеза, а потому ряд исследователей полагает, что традиционная цель науки — получение объяснимых гипотез об устройстве реальности — становится устаревшей[7][8]. Другие исследователи возражают: подсоболичные методы полезны в ряде случаев, но не подходят для генерации объяснимых научных теорий.[9][10][11]

Системы обнаружения 1970—1980-х годов

  • Autoclass — байесовская система классификации, созданная в 1986 году[3]
  • Automated Mathematician — одна из первых успешных систем обнаружения, созданная в 1977 году; работала путём генерации и модификации небольших Lisp-программ
  • Eurisko — продолжение Automated Mathematician, разработанная в 1984 году
  • Dalton — поддерживаемая по сей день программа для вычисления различных молекулярных свойств; запущена первоначально в 1983 году, а с 2017 года доступна в виде открытого ПО
  • Glauber — научно-открывающая система, созданная в 1983 году в рамках вычислительной философии науки

Современные системы обнаружения (с 2009 года)

После нескольких десятилетий затишья интерес к системам автоматического научного открытия возродился с работами Майкла Шмидта (Michael Schmidt), аспиранта по вычислительной биологии в Корнеллском университете. Шмидт и его научный руководитель Ход Липсон создали платформу Eureqa, которую описали как подход символической регрессии к «выделению свободных по форме физических законов из экспериментальных данных»[12]. Этот подход продемонстрировал большой потенциал символической регрессии для научных открытий с помощью искусственного интеллекта.

С 2009 года символическая регрессия существенно развилась, и на сегодняшний день в научных исследованиях активно применяются как коммерческие, так и открытые системы. Среди наиболее заметных примеров: Eureqa (теперь часть DataRobot AI Cloud Platform), AI Feynman и QLattice[13].

Примечания