Материал из РУВИКИ — свободной энциклопедии

Барто, Эндрю Герет

Эндрю Герет Барто
англ. Andrew Gehret Barto
Andrew G. Barto.jpg
Дата рождения 1948[1]
Страна
Научная сфера информатика, ИИ[2], информатика[d][2] и машинное обучение[2]
Место работы
Образование
Научный руководитель Бернард Зиглер[d][3]
Награды и премии
Сайт www-all.cs.umass.edu/… (англ.)

Э́ндрю Ге́рет Ба́рто (род. 1948) — американский специалист в области информатики, наиболее известный своими работами в области современных вычислительных методов обучения с подкреплением[4]. В 2025 году вместе со своим бывшим аспирантом Ричардом Саттоном удостоен премии Тьюринга от Ассоциации вычислительной техники.

Образование[править | править код]

Изучал математику в Мичиганском университете, который окончил с отличием в 1970 году. Первоначально специализировался на корабельной инженерии, однако после изучения ряда работ Майкла Арбиба, Маккалока и Питтса заинтересовался методами моделирования работы мозга при помощи искусственных нейронных сетей. Пять лет спустя получил учёную степень в области информатики за диссертацию о клеточных автоматах[5].

Начало карьеры[править | править код]

Постдокторантуру проходил в Колледже информатики и компьютерных наук Массачусетского университета в Амхерсте, куда поступил в 1977 году. В 1982 году стал доцентом, в 1991-м — профессором. С 2007 по 2011 год — заведующий кафедрой и основной преподаватель Программы по нейронаукам и поведению[6]. В этот же период возглавлял (как соруководитель) Лабораторию автономного обучения, где были обоснованы несколько ключевых подходов и разработаны важнейшие технологии в области обучения с подкреплением.

За свою карьеру Эндри Барто выпустил 27 аспирантов, 13 из которых получили учёное звание профессора. В числе его учеников был другой известный специалист в области машинного обучения с подкреплением Ричард Саттон.

Обучение с подкреплением[править | править код]

Барто и Саттон входили в группу исследователей, изучавших работу нейронов в мозге как основу для создания систем, имитирующих мыслительный процесс человека. Им удалось существенно развить идеи Гарри Клопфа — видного теоретика в области искусственного интеллекта — и предложить свою математическую концепцию («обучение с подкреплением»), которая стал ключевым элементом для создания современных систем искусственного интеллекта[7].

Барто и Саттон модернизировали марковский процесс принятия решений для объяснения того, как агенты (алгоритмические сущности) принимают решения в стохастической среде таким образом, что и среда и награды могли бы оставаться неизвестными — такой метод позволил применить этот алгоритм к широкому кругу задач[8]. Предложенный учёными подход совершенствовался и развивался, а первым крупным его применением стало создание программы AlphaGo, которая сумела обучиться игре в го и в 2016 году превзойти одного из сильнейших игроков мира[7].

Труды Барто и Саттона широко известны во всем мире, сами учёные признаны основоположниками современного метода обучения с подкреплением, сделавшим возможным создание современных больших языковых моделей[9].

Барто опубликовал более ста научных работ. Вместе с Ричардом Саттоном он является автором книги «Обучение с подкреплением: Введение», а также входит в редакторский коллектив книги «Справочник по обучению и приближённому динамическому программированию»[10].

Барто является членом Американской ассоциации содействия развитию науки, старшим членом IEEE[11], а также членом Американской ассоциации искусственного интеллекта и Общества нейронаук[12].

Барто был удостоен награды Университета Массачусетса за достижения в области нейронаук в 2019 году, премии IEEE Neural Network Society Pioneer Award в 2004 году[13] и IJCAI Award for Research Excellence в 2017 году. В его наградной цитате говорилось: «Профессор Барто признан за его новаторские и значимые исследования как в теории, так и в применении обучения с подкреплением»[14].

В 2025 году Барто и Саттон удостоены премии Тьюринга «за разработку концептуальных и алгоритмических основ обучения с подкреплением»[15][7][7].

Примечания

[править | править код]
  1. Agence bibliographique de l'enseignement supérieur (France) Système universitaire de documentation (фр.) — Montpellier: ABES, 2001.
  2. 1 2 3 Barto, Andrew G. // Чешская национальная авторитетная база данных
  3. Mathematics Genealogy Project (англ.) — 1997.
  4. UJCAI 2017 Awards (англ.) (10 марта 2025).
  5. Virtual History Interviews (англ.) (10 марта 2025).
  6. Эндрю Дж. Барто. Массачусетский университет в Амхерсте (17 февраля 2008). Дата обращения: 18 октября 2020. Архивировано 28 ноября 2020 года.
  7. 1 2 3 4 Мец, Кейд. Премия Тьюринга присуждена двум пионерам искусственного интеллекта (англ.), The New York Times (5 марта 2025). Дата обращения: 8 марта 2025.
  8. Премия А.М. Тьюринга. amturing.acm.org. Дата обращения: 8 марта 2025.
  9. Пионеры ИИ Эндрю Барто и Ричард Саттон получают премию Тьюринга 2025 года за новаторский вклад в обучение с подкреплением | NSF – Национальный научный фонд (англ.). www.nsf.gov (5 марта 2025). Дата обращения: 8 марта 2025.
  10. UMass Amherst: Кафедра информатики Архивировано 2 сентября 2006.
  11. Барто избран членом IEEE. Массачусетский университет в Амхерсте (22 ноября 2005). Дата обращения: 3 декабря 2019. Архивировано 3 декабря 2019 года.
  12. CMU CS – Семинар по ИИ. www.cs.cmu.edu. Дата обращения: 7 марта 2025.
  13. "IEEE Computational Intelligence Society Past Recipients" (6 сентября 2022). Дата обращения: 6 сентября 2022.
  14. Награды IJCAI 2017 (19 августа 2017). Дата обращения: 6 сентября 2022.
  15. Лауреаты премии Тьюринга – Дирекция по компьютерным и информационным наукам и инженерии (CISE) | NSF – Национальный научный фонд (англ.). www.nsf.gov (5 марта 2025). Дата обращения: 8 марта 2025.