Нерешённые проблемы лингвистики

Некоторые вопросы, перечисленные ниже, касаются нерешённых проблем лингвистики как таковых, то есть тех, для которых не существует решения. Другие могут быть обозначены как предмет дискуссий, следовательно, это те проблемы, единого решения для которых (пока) не существует, а имеются только мнения отдельных лингвистических школ и учёных.

Общие представления

  • Есть ли универсальное определение слова?
  • Есть ли универсальное определение предложения?
  • Существуют ли универсальные грамматические категории, которым подчиняются все языки? Масштабные статистические исследования подтверждают лишь часть из них, оставляя открытой дискуссию между генеративизмом и функциональным подходом[1].
  • Следуют ли одинаковым принципам морфемы (составляющие элементы слова) и синтагмы (смысловые элементы предложения)?
  • Возможно ли формально разграничить языки и диалекты? Формальное разграничение остаётся нерешённым, опираясь преимущественно на лексикостатистику и социополитические факторы[2].
  • Как появилась грамматика?
  • Как возникли креольские языки?
  • Закономерности и механизмы семантических переходов[3].
  • Проблема разграничения предложения и высказывания[4].
  • Отсутствие единых критериев типологии текста, особенно в связи с появлением новых цифровых форматов[5].[6]

Языки

  • Происхождение языка и происхождение речи всё ещё являются главными нерешёнными проблемами, даже после многовековых попыток разобраться в этих вопросах.
  • Из примерно 7674 живых языков выделяются неклассифицированные языки (чья генетическая принадлежность не выяснена из-за нехватки материала) и 183 изолированных языка, не показывающих связей с другими известными языковыми семьями[7].

Психолингвистика

  • Происхождение языка

Возникновение грамматики[10]

Усвоение первого языка детьми (начальное усвоение языка). Как именно / посредством чего дети учат язык? Дискуссия ведётся между двумя точками зрения: первая — психологический нативизм, то есть представление, что способность к языку «вшита» в мозг человека изначально, и вторая — обучение языку с «чистого листа», мнение, что язык мозгу не свойственен сам по себе, а приобретается в результате взаимодействия с окружающим миром. Успехи больших языковых моделей (LLM) обострили этот спор, противопоставив концепцию врождённой языковой способности (LAD) эмерджентным свойствам статистического обучения[11]. Механизм усвоения языка (англ. Language Acquisition Device): как язык располагается в мозгу? Современные нейробиологические данные свидетельствуют в пользу того, что языковая способность обеспечивается распределённой и пластичной нейронной сетью, а не единым локализованным центром[12]. Почему способности изъясняться на иностранном языке у взрослых, изучивших его, в конечном счёте несколько меньше, чем способности тех, для кого он нативен? Это объясняется комплексом когнитивных (перегрузка рабочей памяти), психологических (тревожность) и лингвистических (интерференция) факторов[13]. Усвоение языка животными: насколько можно обучить животных языку (например, синтаксису)? Среди методов коммуникации у животных, про сколько и про какие можно сказать, что они имеют те же или сходные черты, что и человеческие языки?

  • Общий вопрос: возможно ли провести психолингвистические эксперименты, отвечающие на эти вопросы?
  • Гипотеза Сепира — Уорфа: как влияет структура языка на мировосприятие и воззрения его носителей, а также на их когнитивные процессы. Современная наука фокусируется на «слабой» версии гипотезы, а перспективы её экспериментальной проверки связываются с использованием сред виртуальной реальности (VR).

Перевод

  • Есть ли объективные критерии качества перевода? В современных исследованиях фокус смещается от простой эквивалентности к таким параметрам, как читабельность, естественность и использование гибридных моделей оценки.
  • Нерешённой проблемой остаётся автоматизация художественного перевода, в частности, адекватная передача индивидуального авторского стиля и эстетических компонентов текста[14].
  • Большие языковые модели (LLM) демонстрируют существенные ограничения в адекватной передаче глубоких культурных кодов и контекстуальных смыслов[15].
  • Продолжается дискуссия вокруг объективной оценки машинного перевода, в которой новые нейросетевые метрики сопоставляются с необходимостью человеческой экспертизы[16].

Компьютерная и математическая лингвистика

  • Проблема «заземления» символов (англ. Symbol Grounding Problem): как языковые модели могут соотносить слова с физической реальностью. Поскольку модели обучаются на текстах, они лишены связи с физическим миром; в качестве потенциального решения для сопоставления символов с объектами и действиями рассматривается использование виртуальной реальности (VR)[17].[18][19]
  • Феномен «галлюцинаций» ИИ и отсутствие подлинного понимания: статистические модели генерируют текст на основе вероятностей, не обладая реальным пониманием смысла слов или здравым смыслом, что приводит к генерации правдоподобной, но фактически неверной информации[20].
  • Проблема композициональности и систематичности в математическом моделировании языка: современные модели испытывают трудности с систематической композицией в новых контекстах, оставляя открытой задачу создания математической модели, описывающей способность комбинировать языковые компоненты по правилам[21].
  • Сложности мультимодального взаимодействия в виртуальной реальности: создание систем, способных органично интерпретировать и генерировать коммуникацию, объединяющую речь, жесты и направление взгляда.
  • Проблема качественной обработки малоресурсных языков: обеспечение надёжной работы лингвистических моделей для языков с небольшим объёмом цифровых данных в платформенных решениях[22].[23]

Городская лингвистика

  • Изучение динамики многоязычия и «сверхразнообразия» (англ. super-diversity) в современных мегаполисах[24].[25]
  • Анализ лингвистического ландшафта города, включая мультимодальность (взаимодействие текста, символов и визуальной коммуникации) и коммерциализацию языка[26].