Нерешённые проблемы лингвистики

Некоторые вопросы, перечисленные ниже, касаются нерешённых проблем лингвистики как таковых, то есть тех, для которых не существует решения. Другие могут быть обозначены как предмет дискуссий, следовательно, это те проблемы, единого решения для которых (пока) не существует, а имеются только мнения отдельных лингвистических школ и учёных.

Общие представления

  • Есть ли универсальное определение слова?
  • Есть ли универсальное определение предложения?
  • Существуют ли универсальные грамматические категории, которым подчиняются все языки? Масштабные статистические исследования подтверждают лишь часть из них, оставляя открытой дискуссию между генеративизмом и функциональным подходом[1].
  • Следуют ли одинаковым принципам морфемы (составляющие элементы слова) и синтагмы (смысловые элементы предложения)?
  • Возможно ли формально разграничить языки и диалекты? Формальное разграничение остаётся нерешённым, опираясь преимущественно на лексикостатистику и социополитические факторы[2].
  • Как появилась грамматика?
  • Как возникли креольские языки?
  • Закономерности и механизмы семантических переходов[3].
  • Проблема разграничения предложения и высказывания[4].
  • Отсутствие единых критериев типологии текста, особенно в связи с появлением новых цифровых форматов[5].[6]

Языки

  • Происхождение языка и происхождение речи всё ещё являются главными нерешёнными проблемами, даже после многовековых попыток разобраться в этих вопросах.
  • Из примерно 7674 живых языков выделяются неклассифицированные языки (чья генетическая принадлежность не выяснена из-за нехватки материала) и 183 изолированных языка, не показывающих связей с другими известными языковыми семьями[7].

Психолингвистика

  • Происхождение языка

Возникновение грамматики[10]

Усвоение первого языка детьми (начальное усвоение языка). Как именно / посредством чего дети учат язык? Дискуссия ведётся между двумя точками зрения: первая — психологический нативизм, то есть представление, что способность к языку «вшита» в мозг человека изначально, и вторая — обучение языку с «чистого листа», мнение, что язык мозгу не свойственен сам по себе, а приобретается в результате взаимодействия с окружающим миром. Успехи больших языковых моделей (LLM) обострили этот спор, противопоставив концепцию врождённой языковой способности (LAD) эмерджентным свойствам статистического обучения[11]. Механизм усвоения языка (англ. Language Acquisition Device): как язык располагается в мозгу? Современные нейробиологические данные свидетельствуют в пользу того, что языковая способность обеспечивается распределённой и пластичной нейронной сетью, а не единым локализованным центром[12]. Почему способности изъясняться на иностранном языке у взрослых, изучивших его, в конечном счёте несколько меньше, чем способности тех, для кого он нативен? Это объясняется комплексом когнитивных (перегрузка рабочей памяти), психологических (тревожность) и лингвистических (интерференция) факторов[13]. Усвоение языка животными: насколько можно обучить животных языку (например, синтаксису)? Среди методов коммуникации у животных, про сколько и про какие можно сказать, что они имеют те же или сходные черты, что и человеческие языки?

  • Общий вопрос: возможно ли провести психолингвистические эксперименты, отвечающие на эти вопросы?
  • Гипотеза Сепира — Уорфа: как влияет структура языка на мировосприятие и воззрения его носителей, а также на их когнитивные процессы. Современная наука фокусируется на «слабой» версии гипотезы, а перспективы её экспериментальной проверки связываются с использованием сред виртуальной реальности (VR).

Перевод

  • Есть ли объективные критерии качества перевода? В современных исследованиях фокус смещается от простой эквивалентности к таким параметрам, как читабельность, естественность и использование гибридных моделей оценки.
  • Нерешённой проблемой остаётся автоматизация художественного перевода, в частности, адекватная передача индивидуального авторского стиля и эстетических компонентов текста[14].
  • Большие языковые модели (LLM) демонстрируют существенные ограничения в адекватной передаче глубоких культурных кодов и контекстуальных смыслов[15].
  • Продолжается дискуссия вокруг объективной оценки машинного перевода, в которой новые нейросетевые метрики сопоставляются с необходимостью человеческой экспертизы[16].

Компьютерная и математическая лингвистика

  • Проблема «заземления» символов (англ. Symbol Grounding Problem): как языковые модели могут соотносить слова с физической реальностью. Поскольку модели обучаются на текстах, они лишены связи с физическим миром; в качестве потенциального решения для сопоставления символов с объектами и действиями рассматривается использование виртуальной реальности (VR)[17].[18][19]
  • Феномен «галлюцинаций» ИИ и отсутствие подлинного понимания: статистические модели генерируют текст на основе вероятностей, не обладая реальным пониманием смысла слов или здравым смыслом, что приводит к генерации правдоподобной, но фактически неверной информации[20].
  • Проблема композициональности и систематичности в математическом моделировании языка: современные модели испытывают трудности с систематической композицией в новых контекстах, оставляя открытой задачу создания математической модели, описывающей способность комбинировать языковые компоненты по правилам[21].
  • Сложности мультимодального взаимодействия в виртуальной реальности: создание систем, способных органично интерпретировать и генерировать коммуникацию, объединяющую речь, жесты и направление взгляда.
  • Проблема качественной обработки малоресурсных языков: обеспечение надёжной работы лингвистических моделей для языков с небольшим объёмом цифровых данных в платформенных решениях[22].[23]

Городская лингвистика

  • Изучение динамики многоязычия и «сверхразнообразия» (англ. super-diversity) в современных мегаполисах[24].[25]
  • Анализ лингвистического ландшафта города, включая мультимодальность (взаимодействие текста, символов и визуальной коммуникации) и коммерциализацию языка[26].

Примечания

  1. Не все языковые универсалии оказались универсальными. Элементы. Дата обращения: 25 марта 2026.
  2. Язык или диалект: к постановке проблемы. Вопросы языкознания (2017). Дата обращения: 25 марта 2026.
  3. Диахроническая трансформация семантической структуры концептов. Психолингвистические исследования. Дата обращения: 25 марта 2026.
  4. Предложение и высказывание. Studfile. Дата обращения: 25 марта 2026.
  5. Типология текста. evartist.narod.ru. Дата обращения: 25 марта 2026.
  6. Жанровое своеобразие интернет-коммуникации. libeldoc.bsuir.by. Дата обращения: 25 марта 2026.
  7. Glottolog 5.0. Glottolog. Дата обращения: 25 марта 2026.
  8. Новое исследование допускает, что рукопись Войнича представляет собой шифр. Gismeteo. Дата обращения: 25 марта 2026.
  9. ИИ поможет расшифровать письменность древней цивилизации? Oxu.az. Дата обращения: 25 марта 2026.
  10. «Искусственная эволюция языка: обзор», «Journal of Artificial Societies and Social Simulation», том 5, номер 2 (англ.). Дата обращения: 25 марта 2026. Архивировано 24 мая 2014 года.
  11. LLM-понимание: статистические корреляции против концептуального мышления. Habr. Дата обращения: 25 марта 2026.
  12. Специализированная языковая сеть мозга. Habr. Selectel. Дата обращения: 25 марта 2026.
  13. Факторы, влияющие на уровень языковой компетенции при изучении второго языка. Психологические исследования (2025). Дата обращения: 25 марта 2026.
  14. Машинный перевод и художественный текст. science.kuzstu.ru (2021). Дата обращения: 25 марта 2026.
  15. Попрошу не выражаться: как языковые модели ИИ адаптируются под культурный контекст. Наука и жизнь. Дата обращения: 25 марта 2026.
  16. Оценка качества машинного перевода: автоматизированные метрики и экспертная оценка. Известия Иркутского государственного технического университета. Дата обращения: 25 марта 2026.
  17. Symbol Grounding Problem in AI. Scaler. Дата обращения: 25 марта 2026.
  18. Проблема привязки символов в ИИ и философии. vc.ru. Дата обращения: 25 марта 2026.
  19. О решении Symbol Grounding Problem. anticomplexity.org. Дата обращения: 25 марта 2026.
  20. Галлюцинации LLM: фундаментальная проблема. Habr. Дата обращения: 25 марта 2026.
  21. Прорывы языковых моделей в математике. vc.ru. Дата обращения: 25 марта 2026.
  22. 31-я Международная конференция «Диалог». dialogue-conf.org. Дата обращения: 25 марта 2026.
  23. Почему большие языковые модели не всегда полезны. Forbes.ru. Дата обращения: 25 марта 2026.
  24. Mapping Urban Linguistic Diversity. ScholarSpace. Дата обращения: 25 марта 2026.
  25. Лингвистический ландшафт мегаполиса. Sher Media. Дата обращения: 25 марта 2026.
  26. Linguistic Landscape Research: A Hot Spot. SCIRP (25 июля 2022). Дата обращения: 25 марта 2026.

Дополнительно по теме