Нерешённые проблемы лингвистики

Некоторые вопросы, перечисленные ниже, касаются нерешённых проблем лингвистики как таковых, то есть тех, для которых не существует решения. Другие могут быть обозначены как предмет дискуссий, следовательно, это те проблемы, единого решения для которых (пока) не существует, а имеются только мнения отдельных лингвистических школ и учёных.

Есть ли универсальное определение слова?
Есть ли универсальное определение предложения?
Существуют ли универсальные грамматические категории, которым подчиняются все языки? Масштабные статистические исследования подтверждают лишь часть из них, оставляя открытой дискуссию между генеративизмом и функциональным подходом^[1].
Следуют ли одинаковым принципам морфемы (составляющие элементы слова) и синтагмы (смысловые элементы предложения)?
Возможно ли формально разграничить языки и диалекты? Формальное разграничение остаётся нерешённым, опираясь преимущественно на лексикостатистику и социополитические факторы^[2].
Как появилась грамматика?
Как возникли креольские языки?
Закономерности и механизмы семантических переходов^[3].
Проблема разграничения предложения и высказывания^[4].
Отсутствие единых критериев типологии текста, особенно в связи с появлением новых цифровых форматов^[5].^[6]

Происхождение языка и происхождение речи всё ещё являются главными нерешёнными проблемами, даже после многовековых попыток разобраться в этих вопросах.
Из примерно 7674 живых языков выделяются неклассифицированные языки (чья генетическая принадлежность не выяснена из-за нехватки материала) и 183 изолированных языка, не показывающих связей с другими известными языковыми семьями^[7].

Нерасшифрованные письменности: несмотря на применение искусственного интеллекта, такие памятники, как манускрипт Войнича (для которого выдвигаются гипотезы о шифрах или стеганографии) и Линейное письмо А, пока не дешифрованы^[8].^[9]

Происхождение языка

Возникновение грамматики^[10]

Усвоение языка:

Усвоение первого языка детьми (начальное усвоение языка). Как именно / посредством чего дети учат язык? Дискуссия ведётся между двумя точками зрения: первая — психологический нативизм, то есть представление, что способность к языку «вшита» в мозг человека изначально, и вторая — обучение языку с «чистого листа», мнение, что язык мозгу не свойственен сам по себе, а приобретается в результате взаимодействия с окружающим миром. Успехи больших языковых моделей (LLM) обострили этот спор, противопоставив концепцию врождённой языковой способности (LAD) эмерджентным свойствам статистического обучения^[11]. Механизм усвоения языка (англ. Language Acquisition Device): как язык располагается в мозгу? Современные нейробиологические данные свидетельствуют в пользу того, что языковая способность обеспечивается распределённой и пластичной нейронной сетью, а не единым локализованным центром^[12]. Почему способности изъясняться на иностранном языке у взрослых, изучивших его, в конечном счёте несколько меньше, чем способности тех, для кого он нативен? Это объясняется комплексом когнитивных (перегрузка рабочей памяти), психологических (тревожность) и лингвистических (интерференция) факторов^[13]. Усвоение языка животными: насколько можно обучить животных языку (например, синтаксису)? Среди методов коммуникации у животных, про сколько и про какие можно сказать, что они имеют те же или сходные черты, что и человеческие языки?

Общий вопрос: возможно ли провести психолингвистические эксперименты, отвечающие на эти вопросы?
Гипотеза Сепира — Уорфа: как влияет структура языка на мировосприятие и воззрения его носителей, а также на их когнитивные процессы. Современная наука фокусируется на «слабой» версии гипотезы, а перспективы её экспериментальной проверки связываются с использованием сред виртуальной реальности (VR).

Есть ли объективные критерии качества перевода? В современных исследованиях фокус смещается от простой эквивалентности к таким параметрам, как читабельность, естественность и использование гибридных моделей оценки.
Нерешённой проблемой остаётся автоматизация художественного перевода, в частности, адекватная передача индивидуального авторского стиля и эстетических компонентов текста^[14].
Большие языковые модели (LLM) демонстрируют существенные ограничения в адекватной передаче глубоких культурных кодов и контекстуальных смыслов^[15].
Продолжается дискуссия вокруг объективной оценки машинного перевода, в которой новые нейросетевые метрики сопоставляются с необходимостью человеческой экспертизы^[16].

Проблема «заземления» символов (англ. Symbol Grounding Problem): как языковые модели могут соотносить слова с физической реальностью. Поскольку модели обучаются на текстах, они лишены связи с физическим миром; в качестве потенциального решения для сопоставления символов с объектами и действиями рассматривается использование виртуальной реальности (VR)^[17].^[18]^[19]
Феномен «галлюцинаций» ИИ и отсутствие подлинного понимания: статистические модели генерируют текст на основе вероятностей, не обладая реальным пониманием смысла слов или здравым смыслом, что приводит к генерации правдоподобной, но фактически неверной информации^[20].
Проблема композициональности и систематичности в математическом моделировании языка: современные модели испытывают трудности с систематической композицией в новых контекстах, оставляя открытой задачу создания математической модели, описывающей способность комбинировать языковые компоненты по правилам^[21].
Сложности мультимодального взаимодействия в виртуальной реальности: создание систем, способных органично интерпретировать и генерировать коммуникацию, объединяющую речь, жесты и направление взгляда.
Проблема качественной обработки малоресурсных языков: обеспечение надёжной работы лингвистических моделей для языков с небольшим объёмом цифровых данных в платформенных решениях^[22].^[23]

Изучение динамики многоязычия и «сверхразнообразия» (англ. super-diversity) в современных мегаполисах^[24].^[25]
Анализ лингвистического ландшафта города, включая мультимодальность (взаимодействие текста, символов и визуальной коммуникации) и коммерциализацию языка^[26].

↑ Не все языковые универсалии оказались универсальными (неопр.). Элементы. Дата обращения: 25 марта 2026.
↑ Язык или диалект: к постановке проблемы (неопр.). Вопросы языкознания (2017). Дата обращения: 25 марта 2026.
↑ Диахроническая трансформация семантической структуры концептов (неопр.). Психолингвистические исследования. Дата обращения: 25 марта 2026.
↑ Предложение и высказывание (неопр.). Studfile. Дата обращения: 25 марта 2026.
↑ Типология текста (неопр.). evartist.narod.ru. Дата обращения: 25 марта 2026.
↑ Жанровое своеобразие интернет-коммуникации (неопр.). libeldoc.bsuir.by. Дата обращения: 25 марта 2026.
↑ Glottolog 5.0 (неопр.). Glottolog. Дата обращения: 25 марта 2026.
↑ Новое исследование допускает, что рукопись Войнича представляет собой шифр (неопр.). Gismeteo. Дата обращения: 25 марта 2026.
↑ ИИ поможет расшифровать письменность древней цивилизации? (неопр.) Oxu.az. Дата обращения: 25 марта 2026.
↑ «Искусственная эволюция языка: обзор», «Journal of Artificial Societies and Social Simulation», том 5, номер 2 (англ.) (неопр.). Дата обращения: 25 марта 2026. Архивировано 24 мая 2014 года.
↑ LLM-понимание: статистические корреляции против концептуального мышления (неопр.). Habr. Дата обращения: 25 марта 2026.
↑ Специализированная языковая сеть мозга (неопр.). Habr. Selectel. Дата обращения: 25 марта 2026.
↑ Факторы, влияющие на уровень языковой компетенции при изучении второго языка (неопр.). Психологические исследования (2025). Дата обращения: 25 марта 2026.
↑ Машинный перевод и художественный текст (неопр.). science.kuzstu.ru (2021). Дата обращения: 25 марта 2026.
↑ Попрошу не выражаться: как языковые модели ИИ адаптируются под культурный контекст (неопр.). Наука и жизнь. Дата обращения: 25 марта 2026.
↑ Оценка качества машинного перевода: автоматизированные метрики и экспертная оценка (неопр.). Известия Иркутского государственного технического университета. Дата обращения: 25 марта 2026.
↑ Symbol Grounding Problem in AI (неопр.). Scaler. Дата обращения: 25 марта 2026.
↑ Проблема привязки символов в ИИ и философии (неопр.). vc.ru. Дата обращения: 25 марта 2026.
↑ О решении Symbol Grounding Problem (неопр.). anticomplexity.org. Дата обращения: 25 марта 2026.
↑ Галлюцинации LLM: фундаментальная проблема (неопр.). Habr. Дата обращения: 25 марта 2026.
↑ Прорывы языковых моделей в математике (неопр.). vc.ru. Дата обращения: 25 марта 2026.
↑ 31-я Международная конференция «Диалог» (неопр.). dialogue-conf.org. Дата обращения: 25 марта 2026.
↑ Почему большие языковые модели не всегда полезны (неопр.). Forbes.ru. Дата обращения: 25 марта 2026.
↑ Mapping Urban Linguistic Diversity (неопр.). ScholarSpace. Дата обращения: 25 марта 2026.
↑ Лингвистический ландшафт мегаполиса (неопр.). Sher Media. Дата обращения: 25 марта 2026.
↑ Linguistic Landscape Research: A Hot Spot (неопр.). SCIRP (25 июля 2022). Дата обращения: 25 марта 2026.

[Grambank2024-1] Не все языковые универсалии оказались универсальными (неопр.). Элементы. Дата обращения: 25 марта 2026.

[YazykDialektVJA-2] Язык или диалект: к постановке проблемы (неопр.). Вопросы языкознания (2017). Дата обращения: 25 марта 2026.

[SemanticShift-3] Диахроническая трансформация семантической структуры концептов (неопр.). Психолингвистические исследования. Дата обращения: 25 марта 2026.

[PredlozhenieVyskazyvanie-4] Предложение и высказывание (неопр.). Studfile. Дата обращения: 25 марта 2026.

[TipologiyaTeksta-5] Типология текста (неопр.). evartist.narod.ru. Дата обращения: 25 марта 2026.

[DigitalGenres-6] Жанровое своеобразие интернет-коммуникации (неопр.). libeldoc.bsuir.by. Дата обращения: 25 марта 2026.

[Glottolog2026-7] Glottolog 5.0 (неопр.). Glottolog. Дата обращения: 25 марта 2026.

[VoynichCipher2024-8] Новое исследование допускает, что рукопись Войнича представляет собой шифр (неопр.). Gismeteo. Дата обращения: 25 марта 2026.

[LinearA_AI2024-9] ИИ поможет расшифровать письменность древней цивилизации? (неопр.) Oxu.az. Дата обращения: 25 марта 2026.

[10] «Искусственная эволюция языка: обзор», «Journal of Artificial Societies and Social Simulation», том 5, номер 2 (англ.) (неопр.). Дата обращения: 25 марта 2026. Архивировано 24 мая 2014 года.

[LLM_LAD_Habr-11] LLM-понимание: статистические корреляции против концептуального мышления (неопр.). Habr. Дата обращения: 25 марта 2026.

[DistributedNetwork2024-12] Специализированная языковая сеть мозга (неопр.). Habr. Selectel. Дата обращения: 25 марта 2026.

[L2Factors2025-13] Факторы, влияющие на уровень языковой компетенции при изучении второго языка (неопр.). Психологические исследования (2025). Дата обращения: 25 марта 2026.

[ArtisticStyle2021-14] Машинный перевод и художественный текст (неопр.). science.kuzstu.ru (2021). Дата обращения: 25 марта 2026.

[LLMCulturalCodes-15] Попрошу не выражаться: как языковые модели ИИ адаптируются под культурный контекст (неопр.). Наука и жизнь. Дата обращения: 25 марта 2026.

[MPEvaluationMetrics-16] Оценка качества машинного перевода: автоматизированные метрики и экспертная оценка (неопр.). Известия Иркутского государственного технического университета. Дата обращения: 25 марта 2026.

[SymbolGroundingScaler-17] Symbol Grounding Problem in AI (неопр.). Scaler. Дата обращения: 25 марта 2026.

[SymbolGroundingVCRU-18] Проблема привязки символов в ИИ и философии (неопр.). vc.ru. Дата обращения: 25 марта 2026.

[SymbolGroundingVR-19] О решении Symbol Grounding Problem (неопр.). anticomplexity.org. Дата обращения: 25 марта 2026.

[HabrHallucinationFund-20] Галлюцинации LLM: фундаментальная проблема (неопр.). Habr. Дата обращения: 25 марта 2026.

[LLMMathVCRU-21] Прорывы языковых моделей в математике (неопр.). vc.ru. Дата обращения: 25 марта 2026.

[Dialogue2026Minority-22] 31-я Международная конференция «Диалог» (неопр.). dialogue-conf.org. Дата обращения: 25 марта 2026.

[LLMPlatformForbes-23] Почему большие языковые модели не всегда полезны (неопр.). Forbes.ru. Дата обращения: 25 марта 2026.

[ManoaMultilingualism-24] Mapping Urban Linguistic Diversity (неопр.). ScholarSpace. Дата обращения: 25 марта 2026.

[SherMediaMultilingualism-25] Лингвистический ландшафт мегаполиса (неопр.). Sher Media. Дата обращения: 25 марта 2026.

[ScirpLinguisticLandscape-26] Linguistic Landscape Research: A Hot Spot (неопр.). SCIRP (25 июля 2022). Дата обращения: 25 марта 2026.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

Нерешённые проблемы лингвистики

Общие представления

Языки

Психолингвистика

Перевод

Компьютерная и математическая лингвистика

Городская лингвистика

Примечания

Дополнительно по теме

Категории