LLM в высшем образовании
LLM в вы́сшем образова́нии (от англ. Large Language Models, крупные языковые модели, КЯМ) — направление исследований и практики, рассматривающее применение крупномасштабных языковых моделей в сфере высшего образования. Использование КЯМ, таких как ChatGPT, вызывает вопросы относительно их вклада и потенциального влияния на образовательный процесс, включая вопросы автоматизации, академической честности и новых форм взаимодействия между студентами и преподавателями[1][2].
Данная сфера представляет собой междисциплинарную область, изучающую интеграцию, влияние и этические аспекты использования крупных языковых моделей в учебном процессе, научной деятельности и управлении университетами. Ключевые направления исследований включают технологические аспекты (изучение архитектуры и интерпретируемости моделей), педагогическую интеграцию (формирование новых компетенций и трансформация методов оценки), а также влияние на научную деятельность и академическую среду[3].[4]
Применение в образовательном процессе
Большие языковые модели применяются в высших учебных заведениях для автоматизации рутинных педагогических задач[5]. Одно из основных направлений — автоматическая оценка студенческих работ и предоставление обратной связи[6]. Использование LLM для проверки заданий позволяет преподавателям экономить время и быстрее оценивать результаты студентов (подобные решения применяются на образовательных платформах, таких как Coursera)[7]. При этом для обеспечения точности оценки требуется контроль со стороны человека, так как модели могут допускать ошибки или генерировать предвзятую информацию[6]. Искусственный интеллект также используется для автоматической генерации учебного контента, включая создание тестов и заданий по различным дисциплинам (практика автогенерации заданий с помощью LLM рассматривалась, в частности, в докладе НИУ ВШЭ за 2025 год)[6][8]. В административной сфере вузы тестируют решения на базе LLM для обработки больших объёмов данных. Модели помогают анализировать информацию, выявлять закономерности и подготавливать сводные отчёты для принятия управленческих решений, обеспечивая административную поддержку преподавателей и руководства[9]. Внедрение технологий сопровождается обучающими инициативами: так, Университет Иннополис[8] и Американская ассоциация колледжей и университетов (AAC&U) организуют программы повышения квалификации для помощи преподавателям в разработке планов по интеграции ИИ в учебный процесс[10]. При этом исследователи отмечают, что фундаментальной проблемой при автоматизации задач остаётся склонность моделей к генерации фактически неточного контента («галлюцинациям»)[7][11].
Большие языковые модели (LLM) применяются для создания платформ персонализированного обучения, способных адаптировать образовательный процесс под индивидуальные нужды студентов. Системы на основе искусственного интеллекта анализируют данные об успеваемости и предпочтениях учащихся, что позволяет выстраивать персональные образовательные траектории, динамически настраивать сложность заданий и генерировать уникальный учебный контент. Благодаря этому студенты получают возможность осваивать материал в собственном темпе[12].[13] Важным направлением является создание интеллектуальных виртуальных тьюторов и ассистентов. Подобные системы способны вести диалог, отвечать на вопросы студентов, давать развёрнутые объяснения по изучаемым темам и предлагать дополнительные материалы (например, инструмент Khanmigo от образовательной платформы Khan Academy). Разрабатываются также адаптивные системы поддержки в виде плагинов для систем управления обучением (LMS), которые автоматически адаптируют формулировки заданий под нужды конкретных учащихся. Для повышения эффективности персонализации осуществляется переход от универсальных моделей к специализированным решениям, дообученным для конкретных предметных областей (включая использование таких моделей, как DeepSeek-R1, Qwen3 и GLM-4.5V). Технологии адаптации учебного процесса внедряются на крупных международных образовательных платформах, таких как Coursera, edX и Duolingo. В России также проводятся исследования в этой области: в частности, в 2025 году в НИУ ВШЭ разрабатывался плагин для платформы Moodle на базе модели DeepSeek-R1, предназначенный для адаптивной поддержки студентов.
В архитектуре образовательных ИИ-платформ происходит технологический сдвиг от традиционного дообучения (fine-tuning) к модульным системам и технологии генерации, дополненной поиском (Retrieval-Augmented Generation, RAG)[14][15]. В отличие от дообучения, при котором знания интегрируются непосредственно в параметры нейросети, RAG позволяет языковой модели перед формированием ответа обращаться к внешним обновляемым базам знаний. Использование RAG даёт возможность интегрировать в образовательные сервисы актуальные данные вузов, включая учебные материалы, научные статьи и внутренние регламенты, без необходимости ресурсоёмкого переобучения модели[16][17]. Этот подход значительно снижает риск выдачи ложной информации («галлюцинаций»)[18][19], поскольку ответы опираются на конкретные проверяемые источники. В современных модульных архитектурах часто применяется гибридный подход: RAG обеспечивает доступ к фактическим данным, а дообучение используется для адаптации стиля общения и формата ответов[20][21].
Применение в научной деятельности
Большие языковые модели с длинным контекстом оказывают значительное влияние на процессы обзора научной литературы, трансформируя их в гибридный процесс, где исследователь выступает в роли эксперта-контролёра. Современные модели (например, с контекстным окном до 1 миллиона токенов) позволяют загружать и анализировать десятки научных статей, монографий или диссертаций одновременно. Это существенно ускоряет обработку больших объёмов данных, которая ранее требовала последовательного изучения каждого источника[22].[23][24] Специализированные системы автоматизируют рутинные этапы систематического обзора. Они способны генерировать точные поисковые запросы для научных баз данных (в частности, PubMed), а затем автоматически фильтровать найденные материалы по заданным критериям включения и исключения. Подобная автоматизация позволяет учёным сосредоточиться на интерпретации данных[25]. Для синтеза и структурирования информации применяются многоступенчатые фреймворки (например, LitLLM)[26]. Процесс создания обзора с их помощью включает поиск релевантных работ, переранжирование для отбора наиболее значимых источников и генерацию связного текста на основе проанализированных статей. При этом сохраняется необходимость экспертной проверки результатов для исключения фактических ошибок, неполноты поиска и неверной интерпретации концептуальных вопросов[25].[24]
Большие языковые модели достигли «золотого уровня» производительности в сложных академических задачах, требующих многоэтапных логических и математических рассуждений. Значимым событием стало успешное решение задач Международной математической олимпиады (IMO). В июле 2025 года модель Google Gemini DeepThink и экспериментальная система от OpenAI решили по 5 из 6 задач олимпиады, набрав по 35 баллов из 42 возможных, что соответствует результату золотой медали[27].
Современные модели с продвинутыми возможностями рассуждения (reasoning) интегрируются в ключевые этапы научного процесса. Искусственный интеллект применяется не только для вспомогательных задач, но и для формулирования научных гипотез, проектирования экспериментов и комплексного анализа данных[28].
Академическая честность и этика
В ответ на вызовы, связанные с академической честностью, университеты переходят от полного запрета нейросетей к регулированию их использования. В 2025—2026 годах вузы начали активно разрабатывать внутренние этические кодексы. В России эту инициативу в июне 2025 года поддержало Министерство науки и высшего образования, отказавшись от введения единого федерального регулирования. Параллельно разрабатываются общие стандарты: в марте 2026 года Совет Федерации начал подготовку «санитарных правил» использования ИИ в образовании, также был предложен проект общенационального кодекса с классификацией сценариев применения нейросетей по принципу «этического светофора»[29][30][31][32][33]. Ключевым требованием университетских политик (принятых, в частности, в НИУ ВШЭ, РГЭУ (РИНХ), Сколтехе и Томском государственном университете)[34][29][31][35] является обязательное декларирование студентами использования генеративных моделей. Учащиеся должны указывать, какие именно части учебной или научной работы выполнены с помощью искусственного интеллекта. Незадекларированное применение приравнивается к нарушению академических норм, при этом студенты несут полную ответственность за достоверность сгенерированной информации и обязаны проверять её на наличие фактических ошибок[36]. Вместо универсальных ограничений вузы внедряют дифференцированный подход к учебным заданиям. В зависимости от образовательных целей использование искусственного интеллекта может быть полностью запрещено (например, для проверки базовых знаний), разрешено в качестве вспомогательного инструмента для поиска идей или интегрировано как полноценный рабочий инструмент, умение управлять которым является самостоятельным объектом оценки[29][32].
Эффективность систем обнаружения текстов, сгенерированных искусственным интеллектом, остаётся низкой[37]. Несмотря на заявления разработчиков о высокой точности, на практике детекторы демонстрируют ненадёжные результаты. Они относительно успешно выявляют неотредактированный сгенерированный текст, однако их эффективность резко снижается при использовании студентами методов обхода: ручного перефразирования, изменения структуры предложений, смешивания машинного и авторского текста, а также применения специализированных сервисов-«гуманизаторов». Уязвимость детекторов связана с тем, что они анализируют не смысл текста, а статистические закономерности (предсказуемость слов и вариативность длины предложений), которые можно искусственно изменить[37]. Серьёзной проблемой является высокая частота ложных срабатываний, когда полностью написанный человеком текст ошибочно помечается как сгенерированный нейросетью. Это создаёт риск несправедливых обвинений студентов в нарушении академической этики. Наибольшей уязвимости подвержены тексты авторов, для которых язык написания не является родным, поскольку используемые ими более простые языковые конструкции могут восприниматься алгоритмами как признак машинной генерации[38][37]. В академической среде сложилась ситуация «гонки вооружений»: университеты внедряют системы проверки (например, «Антиплагиат.ВУЗ»)[39], а студенты находят новые способы их обхода. В связи с этим наблюдается тенденция к изменению методологии оценки знаний. Вместо попыток тотальной детекции ИИ-текста вузы смещают акцент на проведение устных экзаменов и защит, а также на разработку заданий, требующих критического мышления и глубокого личного анализа, выполнение которых с помощью нейросетей затруднительно[40].
Одной из фундаментальных проблем при использовании больших языковых моделей являются «галлюцинации» — генерация фактически неверной, вымышленной или не связанной с запросом информации. Это явление обусловлено как архитектурой самих моделей, так и качеством данных, на которых они обучались. Галлюцинации делятся на фактические ошибки, логические несоответствия и отход от заданного контекста. Нейронные механизмы, отвечающие за воспроизведение фактов и за галлюцинации, тесно связаны, что делает полное устранение этой проблемы крайне сложной задачей[41][42].
Для борьбы с галлюцинациями и повышения качества ответов применяется комплекс стратегий. Важным направлением является обучение пользователей: студентов и преподавателей учат правильному составлению запросов (промптов) и критической оценке полученной информации[43][29]. Технологические решения включают гибридные подходы, тонкую настройку (дообучение) базовых моделей на специализированных наборах данных, а также внедрение «когнитивных стратегий», позволяющих моделям проверять промежуточные результаты и разбивать задачи на подцели[44]. Кроме того, для оценки качества моделей используются специальные наборы тестов (бенчмарки)[45].
Взгляд преподавателей языков
Появление крупных языковых моделей открыло для преподавателей языков как перспективы, так и новые вызовы. Основные опасения связаны с вопросами академической честности и аутентичности студенческих работ (рефератов, эссе, пересказов и даже творческих заданий), а также с возможностью обхода самого процесса обучения[46]. Преподавателей предупреждают о рисках, связанных с возможностью подрыва учебного процесса через неосознанное использование КЯМ[47].
В связи с этим преподаватели языков вынуждены переосмыслить традиционные методы оценки и изменить критерии языковой компетенции. Акцент всё чаще делается на критической оценке информации, развитии индивидуального стиля и корректировке ИИ-сгенерированного текста, наряду с интеграцией ИИ-грамотности в учебные программы[48].
КЯМ находят применение в генерации тренировочных материалов, предоставлении мгновенных комментариев по грамматике и синтаксису и обеспечивают дополнительную поддержку студентам вне рамок учебных занятий. Несмотря на то, что такие технологии не могут полностью заменить экспертную обратную связь, они полезны для закрепления базовых языковых правил и предоставления персонализированного обучения, учитывающего индивидуальные потребности студентов[49][50][47].
В современной практике преподавания выделяется несколько ключевых методик применения языковых моделей. Адаптивное обучение позволяет создавать индивидуальные образовательные траектории, выявляя слабые места учащихся и автоматически предлагая целевые упражнения. Интерактивные диалоговые симуляции используются для практики устной и письменной речи в реалистичных сценариях. Кроме того, инструменты на базе искусственного интеллекта обеспечивают автоматизированную обратную связь в реальном времени, анализируя произношение, грамматическую правильность и структуру предложений[49][50].
Большие языковые модели также стали важным инструментом для студентов и исследователей в области лингвистического анализа текстов. Они применяются для обработки объёмных документов, извлечения точной информации и проведения специализированных исследований, включая детальный анализ речи самих нейросетей, контекстуальный перевод и помощь в структурировании академических работ[51][52][53].