Гуревич, Ирина

Ирина Гуревич (укр. Ірина Гуревич; род. 16 марта 1976, Винница) — немецкий учёный в области информатики и компьютерной лингвистики, профессор Дармштадтского технического университета и директор лаборатории Ubiquitous Knowledge Processing (UKP Lab)[1]. Также является адъюнкт-профессором Университета искусственного интеллекта имени Мохамеда бин Зайда и аффилированным профессором болгарского Института компьютерных наук, искусственного интеллекта и технологий (INSAIT)[2][3].

Считается одним из основателей области компьютерного аргументационного анализа[4]. Лауреат премии имени Лейбница (2023)[3] и премии Мильнера (2025)[5]. Член (Fellow) Ассоциации по вычислительной лингвистике (ACL, 2020) и Ассоциации вычислительной техники (ACM, 2022), обладательница гранта ERC Advanced Grant и президент ACL в 2023 году[3].

Что важно знать
Ирина Гуревич
укр. Ірина Гуревич
Дата рождения 16 марта 1976(1976-03-16) (50 лет)
Место рождения
Страна
Научная сфера компьютерные науки, лингвистика
Место работы Дармштадтский технический университет
Университет искусственного интеллекта имени Мохамеда бин Зайда
Институт компьютерных наук, искусственного интеллекта и технологий
Образование Винницкий государственный педагогический университет
Университет Дуйсбурга — Эссена
Учёная степень доктор философии (PhD)
Учёное звание профессор
Научный руководитель Вольфганг Хёппнер
Ученики Нильс Раймерс
Известен как один из основателей области компьютерного аргументационного анализа
Награды и премии Премия Готфрида Вильгельма Лейбница (2023)
Премия Мильнера (2025)
Член ACL (2020)
Член ACM (2022)

Биография

Родилась 16 марта 1976 года в Виннице. В 1998 году с отличием окончила Винницкий государственный педагогический университет по специальности «английская и немецкая филология»[6]. С 1998 по 2001 год продолжала обучение в Университете Дуйсбурга — Эссена (Германия) как стипендиат DAAD и земли Северный Рейн-Вестфалия[6]. В 2003 году получила степень доктора философии (PhD) по компьютерной лингвистике в Университете Дуйсбурга — Эссена под руководством профессора Вольфганга Хёппнера[7][6]. Во время работы над диссертацией, с 2001 по 2005 год, была научным сотрудником в European Media Laboratory (позже — HITS)[6].

С 2005 по 2007 год работала в Дармштадтском техническом университете в качестве научного сотрудника, где руководила исследовательским проектом в области электронного обучения[6]. С 2007 года возглавила исследовательскую группу Эмми Нётер Немецкого научно-исследовательского общества (DFG)[6]. В 2008 году получила профессорскую должность от Фонда Volkswagen (Lichtenberg Professor)[6]. В 2009 году была назначена на должность полного профессора (W3) в Дармштадтском техническом университете, где основала и возглавила лабораторию Ubiquitous Knowledge Processing (UKP Lab).

Помимо основной работы в Дармштадте, с 2023 года является аффилированным профессором болгарского Института компьютерных наук, искусственного интеллекта и технологий (INSAIT). Также занимает должность адъюнкт-профессора в Университете искусственного интеллекта имени Мохамеда бин Зайда (MBZUAI) в ОАЭ[6].

Научная деятельность

Научный вклад Ирины Гуревич сосредоточен на пересечении обработки естественного языка (NLP) и искусственного интеллекта, сочетая глубокое понимание человеческого языка с передовыми методами машинного обучения[8]. Её работа охватывает несколько ключевых направлений.

Аргументационный анализ (Argumentation Mining). Гуревич считается одним из основателей этой области. Направление нацелено на автоматическое извлечение и анализ аргументативных структур в тексте для поддержки принятия решений и проверки фактов[9]. Исследования её лаборатории UKP были направлены на анализ аргументации в неструктурированных текстах, таких как эссе и пользовательские комментарии в интернете.

Машинное обучение для понимания языка. Значительная часть её работ посвящена машинному обучению для широкомасштабного понимания текстов и текстовой семантике. В рамках проекта InterText, финансируемого грантом ERC, она разрабатывает первую в мире основу для моделирования межтекстуальных связей в NLP. Цель проекта — научить ИИ понимать сложные взаимосвязи между длинными текстами, что находит применение в анализе научных рецензий и разоблачении теорий заговора. Другим важным направлением является создание многоязычных технологий NLP, включая языки с ограниченными ресурсами, на основе больших языковых моделей с использованием многоязычных вложений предложений и так называемых «адаптеров».

Эффективные и доступные большие языковые модели (LLM). Гуревич внесла новаторский вклад в исследования по параметро-эффективной тонкой настройке больших трансформерных моделей, таких как BERT. Она является соавтором одной из влиятельных работ о трансформерной модели для сравнения семантической близости предложений[10]. Стремясь сделать технологии ИИ более доступными, её лаборатория разработала приложение AdapterHub Playground, которое позволяет исследователям без навыков программирования проводить классификацию текстов.

Применение NLP в гуманитарных науках. Ирина Гуревич известна инновационным применением методов NLP в гуманитарных и социальных науках. Она является соучредителем Центра цифровых основ исследований в гуманитарных, социальных и образовательных науках (CEDIFOR).

Ирина Гуревич является автором и соавтором более 600 научных публикаций[2].

Научная школа

Ирина Гуревич сформировала научную школу в области обработки естественного языка и искусственного интеллекта. Под её руководством было защищено более 25 докторских диссертаций[11]. Многие из её бывших аспирантов и постдоков занимают ведущие позиции в академических кругах и IT-индустрии[12].

Одним из наиболее известных учеников Гуревич является Нильс Раймерс, создатель популярной библиотеки sentence-transformers[13]. После работы в Hugging Face он занял должность директора по машинному обучению в компании Cohere[13].

Избранная библиография

Книги

  • Linked Lexical Knowledge Bases: Foundations and Applications (2016), в соавторстве с А. Панченко, К. М. Мейером и др[14].

Статьи

  • Extracting Opinion Targets in a Single- and Cross-Domain Setting with Conditional Random Fields (2010), в соавторстве с Н. Якобом[15].
  • The People’s Web meets Linguistic Knowledge: Automatic Sense Alignment of Wikipedia and WordNet (2011), в соавторстве с Э. Ниманн[16].
  • UBY — A Large-Scale Unified Lexical-Semantic Resource Based on LMF (2012), в соавторстве с Ю. Экле-Колер, С. Хартманн и др[17]..
  • Automatically Classifying Edit Categories in Wikipedia Revisions (2013), в соавторстве с Й. Даксенбергером[18].
  • Identifying argumentative discourse structures in persuasive essays (2014), в соавторстве с К. Стабом[19].
  • Exploiting Debate Portals for Semi-Supervised Argumentation Mining in User-Generated Web Discourse (2015), в соавторстве с И. Габерналом[20].
  • What is the best way to build a convincing argument? An empirical study on the role of convincingness in Web argumentation (2016), в соавторстве с И. Габерналом и К. Стабом[21].
  • Parsing argumentation structures in persuasive essays (2017), в соавторстве с К. Стабом[22].
  • Modeling Semantics with Gated Graph Neural Networks for Knowledge Base Question Answering (2018), в соавторстве с Д. Сорокиным[23].
  • Text Processing Like Humans Do: Visually Attacking and Shielding NLP Systems (2019), в соавторстве с Ш. Эгером, Й. Даксенбергером и др[24]..
  • Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation (2020), в соавторстве с Н. Раймерсом[25].
  • BEIR: A Heterogenous Benchmark for Zero-shot Evaluation of Information Retrieval Models (2021), в соавторстве с Н. Тхакуром, Н. Раймерсом и др[26]..
  • Missing Counter-Evidence Renders NLP Fact-Checking Unrealistic for Misinformation (2022), в соавторстве с Т. Шюстером и др[27]..
  • Efficient Methods for Natural Language Processing: A Survey (2023), в соавторстве с М. Фифером, Й. Пфайффером и др[28]..
  • M4: Multi-generator, Multi-domain, and Multi-lingual Black-Box Machine-Generated Text Detection (2024), в соавторстве с Ю. Вангом, Т. Шюстером и др[29]..

Награды и премии

Примечания