Ленат, Дуглас
Ду́глас Брюс Ле́нат[3] (англ. Douglas Bruce Lenat; 13 сентября 1950, род. 13 сентября 1950, Филадельфия, Пенсильвания[4]) — американский исследователь в области искусственного интеллекта, основатель и многолетний руководитель (CEO) компании Cycorp[5]. Умер в возрасте 72 лет от рака желчных протоков[6].
Выдающийся исследователь в сферах машинного обучения (разработал программы Automated Mathematician и Эвриско), представление знаний и «конструирования онтологий»[6]. В проекте Cyc, который он вёл с 1984 года до своей смерти, Ленат пытался построить основу искусственного интеллекта, вручную записывая знания о здравом смысле на формальном языке CycL[5].
Общие сведения
| Дуглас Ленат | |
|---|---|
| Douglas Bruce Lenat | |
| Имя при рождении | Douglas Bruce Lenat |
| Дата рождения | 13 сентября 1950[1][2] (75 лет) |
| Место рождения | |
| Место смерти | Остин, Техас, США |
| Страна | США |
| Научная сфера | Искусственный интеллект, машинное обучение, представление знаний |
| Место работы |
Университет Карнеги — Меллон Стэнфордский университет Cycorp |
| Образование |
Пенсильванский университет Стэнфордский университет |
| Учёная степень | доктор философии (PhD) |
| Учёное звание | профессор |
| Научный руководитель | Корделл Грин |
| Известен как | основатель проекта Cyc |
| Награды и премии | Премия IJCAI «Компьютеры и мысль» (1977) |
| Сайт | cyc.com |
Биография
В 1972 году Ленат окончил Пенсильванский университет, где получил степени бакалавра по математике и физике и магистра по прикладной математике[7]. В 1976 году получил степень доктора философии (PhD) в области компьютерных наук в Стэнфордском университете[7] (тезисы докторской опубликованы в «Knowledge-based systems in artificial intelligence», вместе с тезисами докторской Рэндела Дэвиса, McGraw-Hill, 1982). Научным руководителем его диссертации был профессор Корделл Грин, а Эдвард Альберт Фейгенбаум входил в состав диссертационного совета.
Карьера
После получения докторской степени в 1976 году Ленат преподавал в Университете Карнеги — Меллон и Стэнфордском университете. В 1984 году он покинул академическую среду, чтобы возглавить проект Cyc в рамках консорциума Microelectronics and Computer Technology Corporation (MCC) в Остине, Техас[8].
В этот период одним из его ключевых соратников стал Раманатан В. Гуха, который с 1987 по 1994 год был одним из со-руководителей проекта[9]. Гуха отвечал за разработку языка представления знаний CycL и впоследствии стал известен как один из создателей стандартов RDF и RSS[9].
В январе 1995 года Дуглас Ленат основал компанию Cycorp, Inc. в Остине, штат Техас, и стал её генеральным директором. Проект Cyc, начатый в 1984 году в рамках консорциума MCC, был выделен в самостоятельную коммерческую структуру для продолжения работы над созданием масштабной базы знаний, содержащей «здравый смысл». Этот процесс, названный Ленатом «онтологическим инжинирингом», заключался в ручном кодировании фактов и правил на языке CycL. В 1997 году Ленат изложил свои взгляды на проблему здравого смысла в ИИ в главе «From 2001 to 2001: Common Sense and the Mind of HAL» для книги «HAL's Legacy: 2001's Computer as Dream and Reality»[10].
К началу 2000-х годов проект достиг стадии, позволившей сделать его части доступными для широкой аудитории. Весной 2002 года Cycorp выпустила первую версию OpenCyc — общедоступную урезанную версию своей базы знаний, содержавшую около 6 000 понятий и 60 000 фактов и распространявшуюся под лицензией Apache. В 2004 году компания представила бета-версию ResearchCyc — более полную версию, предназначенную для научного сообщества, которая включала значительно больше семантических знаний, лексикон и инструменты для обработки естественного языка.
В этот период Cycorp также начала активно сотрудничать с правительственными и военными организациями США. Одним из заметных проектов стало создание Базы знаний о терроризме (Terrorism Knowledge Base, TKB), начатое в 2004 году при поддержке Министерства внутренней безопасности США. Проект использовал технологию Cyc для сбора и анализа информации о террористических группах, что позволяло аналитикам делать сложные логические выводы и находить неочевидные связи в данных[11].
В середине 2000-х годов Cycorp активно участвовала в создании «Базы знаний о терроризме» (Terrorism Knowledge Base, TKB)[12]. Проект, действовавший с сентября 2004 по март 2008 года, спонсировался Министерством внутренней безопасности США и Институтом по предотвращению терроризма (MIPT)[12]. В рамках проекта Cycorp кодировала знания о террористических группах, инцидентах и личностях в виде математической логики, что позволяло аналитикам разведки делать сложные запросы, выявлять связи и интегрировать данные[13][12].
Важным шагом для научного сообщества стал выпуск ResearchCyc. После бета-версии в феврале 2005 года, полноценная версия 1.0 стала доступна бесплатно для исследовательских целей в июле 2006 года. В отличие от более ранней и ограниченной OpenCyc, ResearchCyc включала значительно больше семантических знаний, большой лексикон, инструменты для анализа и генерации английского языка, а также интерфейсы для редактирования и запроса знаний[14]. Этот проект был поддержан DARPA[14].
Примерно с 2007 года начался постепенный переход от государственного финансирования к коммерческим приложениям[15]. Cycorp начала применять свою технологию в таких секторах, как финансовые услуги, энергетика и здравоохранение. Одним из знаковых проектов стало сотрудничество с Кливлендской клиникой, начавшееся в 2007 году. Технология Cyc использовалась для создания интерфейса на естественном языке для запросов к многолетним данным о кардиоторакальных операциях, что позволяло исследователям задавать сложные вопросы и анализировать большие массивы информации[16].
В июне 2012 года Cycorp выпустила новую версию своей общедоступной базы знаний — OpenCyc 4.0[16]. Она содержала около 239 000 понятий и 2,1 миллиона утверждений, связывающих их[17]. В основном это были таксономические утверждения, а не сложные правила, доступные в полной версии Cyc.
На протяжении всего этого периода Дуглас Ленат продолжал руководить Cycorp в качестве CEO, продвигая своё видение искусственного интеллекта, основанного на знаниях и здравом смысле, в противовес набиравшим популярность статистическим методам и машинному обучению[18].
В этот период Cycorp под руководством Лената совершила стратегический поворот, примерно к 2016 году полностью перейдя на финансирование за счёт коммерческих приложений. Этот шаг сопровождался повышением уровня закрытости: значительная часть открытой информации о проекте была удалена из публичного доступа. Компания сосредоточилась на разработке прикладных решений для крупных клиентов в таких отраслях, как здравоохранение, финансовые услуги и энергетика[19].
Несмотря на смещение фокуса, технологическое развитие продолжалось: в ноябре 2017 года была выпущена стабильная версия Cyc 6.1[20]. К 2024 году, по некоторым данным, база знаний Cyc насчитывала 25 миллионов правил и 1,5 миллиона концептов[21]. Однако, несмотря на заявления о коммерческом успехе, некоторые аналитики отмечали недостаток независимых подтверждений и высокую степень закрытости компании.
Сам Ленат продолжал активную интеллектуальную деятельность. В 2015 году он выступил с лекцией на TEDx, где изложил своё видение сотрудничества человека и ИИ[19]. В 2021 году он дал подробное интервью Лексу Фридману об истории и будущем проекта Cyc. Уже после его смерти, в 2023 году, была опубликована его совместная с Гэри Маркусом работа «От генеративного ИИ к надежному ИИ: чему большие языковые модели могут научиться у Cyc» (англ. From Generative AI to Trustworthy AI: What LLMs Can Learn from Cyc)[21]. В статье рассматривалась идея гибридизации символического подхода Cyc и современных больших языковых моделей для создания более надёжного общего искусственного интеллекта[21].
Дуглас Ленат скончался 31 августа 2023 года, до конца жизни оставаясь руководителем проекта, которому посвятил почти 40 лет.
Научный вклад
Основной сферой научных интересов Дугласа Лената был искусственный интеллект (ИИ)[22]. Его работа была сосредоточена на решении фундаментальных проблем в этой области, в частности, на представлении знаний, машинном обучении и наделении компьютеров «здравым смыслом»[23].
Наибольшую известность Ленату принёс проект Cyc, начатый в 1984 году, целью которого было создание масштабной базы знаний, содержащей фундаментальные понятия и правила об устройстве мира. Эта база должна была позволить ИИ рассуждать аналогично человеку. Подход, заключавшийся в ручном кодировании миллионов логических утверждений, Ленат назвал «онтологическим инжинирингом»[24].
В начале своей карьеры Ленат создал программы Automated Mathematician (AM) и Eurisko. Эти системы были одними из первых, способных к открытиям и обучению путём использования эвристик для поиска новых концепций и модификации собственных правил. За создание программы AM он был удостоен премии IJCAI «Компьютеры и мысль» в 1977 году[24].
На протяжении всей своей карьеры Ленат оставался убеждённым сторонником символьного подхода к ИИ в противовес набиравшим популярность статистическим методам, таким как нейронные сети[25]. Он считал, что для достижения подлинного интеллекта машинам необходимо понимать мир на уровне логических концепций, а не просто распознавать статистические закономерности в данных[25].
Награды и признание
За свою карьеру Дуглас Ленат был удостоен ряда наград и почётных званий:
- Премия IJCAI «Компьютеры и мысль» (1977) — за создание программы машинного обучения AM[26].
- Член (Fellow) Ассоциации по развитию искусственного интеллекта (AAAI) — был избран одним из первых членов в 1990 году за работу над проектом Cyc[27].
- Член (Fellow) Американской ассоциации содействия развитию науки (AAAS).
- Член (Fellow) Общества когнитивных наук (Cognitive Science Society).
- Включён в список «Wired 25» журнала Wired.
- Единственный человек, входивший в научные консультативные советы одновременно в Microsoft и Apple.
Публикации
- Davis, Randall, and Douglas B. Lenat." Knowledge-Based Systems in Artificial Intelligence". New York: McGraw-Hill International Book Co, 1982. ISBN 978-0070155572
- Hayes-Roth, Frederick, D. A. Waterman, and Douglas B. Lenat. «Building Expert Systems». Reading, Mass: Addison-Wesley Pub. Co, 1983. ISBN 978-0201106862
Примечания
Ссылки
- Douglas Биография на Cyc.com
- видео лекции «Beyond the Semantic Web» в NIPS 2008.
- «How David Beats Goliath» — статья в The New Yorker.
