Чемышев, Андрей Валерьевич
Андре́й Вале́рьевич Че́мышев (род. 6 июля 1970, Большая Мушка, Марийская АССР) — российский марийский лингвист и языковой активист, Лауреат Государственной премии Республики Марий Эл имени М.Н. Янтемира (2011, 2021), лауреат Всероссийской общественной премии «Гордость нации» в номинации «За вклад в сохранение и развитие родных языков» (2021).
Общие сведения
| Андрей Чемышев | |
|---|---|
| Дата рождения | 6 июля 1970 (55 лет) |
| Место рождения | Большая Мушка, Сернурский район, Марийская АССР, РСФСР, СССР |
| Страна | |
| Научная сфера | лингвистика |
| Место работы | Марийский институт языка, литературы и истории |
| Образование | |
| Награды и премии | Государственная премия Республики Марий Эл имени М. Н. Янтемира |
Биография
Родился 6 июля 1970 года в деревне Большая Мушка Сернурского района Марийской АССР. Отец, Чемышев Валерий Степанович, работал заместителем директора Сернурского межрайонного узла связи. Мать, Чемышева Валентиновна Ивановна, до пенсии проработала бухгалтером колхоза луговомар. «Чевер ӱжара» («Алая заря»). Старший сын в семье. С детства владеет марийским языком.
Первые три класса учился в местной начальной школе, после ходил в школу-восьмилетку деревни Большая Коклала, девятые-десятые классы обучался в школе посёлка Сернур (ныне Сернурская средняя общеобразовательная школа №1 имени героя Советского Союза А. М. Яналова). Школу окончил в 1987 году с серебряной медалью.
После школы поступил в Ленинградское высшее военное инженерное училище связи им. Ленсовета на факультет «Радио, радиорелейная, тропосферная и спутниковая связь» по специальности «Радиосвязь». В 1992 году окончил c красным дипломом уже переименованное Санкт-Петербургское высшее военное инженерное училище связи (СПВВИУС) с присвоением квалификации «радиоинженер»[1].
По окончании училища был направлен на службу в 16-й Центральный научно-исследовательский испытательный институт связи Министерства обороны (г. Мытищи). В институте начинал службу в должности младшего научного сотрудника, а затем стал научным сотрудником. 1 января 1997 года ушёл со службы в звании капитан.
Следующие пять лет работал в Москве. Вместе с коллегами устанавливал видеокамеры и спутниковое телевидение.
В декабре 2002 года вернулся в Йошкар-Олу. Сначала устроился в Центр марийской культуры, через три месяца перешёл в редакцию газеты «Марий Эл» — отвечал за компьютерную технику. Позже по совету Эрика Юзыкайна, в те времена сотрудника министерства культуры, начал собирать марийские песни и выпускать диски совместно с компанией «Барс-Медиа» (Казань)[1].
С 1 июля 2005 года по сентябрь 2011 года работал музыкальным редактором и звукорежиссёром на радиостанции «Марий Эл Радио». Уже тогда пытался создавать сайты на марийском языке, но из-за отсутствия марийских букв Ӓ, Ӧ, Ӹ, Ҥ, Ӱ в общедоступных шрифтах, слова на сайте отображались неправильно. Андрей Валерьевич начал разбираться в проблеме, так и появился интерес развивать марийский язык в интернете. В это же время вместе с Эриком Юзыкайном, Михаилом Пироговым и Вячеславом Килеевым Андрей Чемышев выпустил электронный словарь на базе 10 томного марийско-русского словаря.
В апреле 2011 года единомышленники провели мероприятие, куда были приглашены около 30 компьютерных лингвистов со всей России[2]. После мероприятия Андрей Чемышев окончательно решил развиваться по пути компьютерной лингвистики.
В сентябре 2011 года ушёл из «Марий Эл Радио», а в декабре того же года устроился в Центр инновационных языковых технологий Коми республиканской академии государственной службы и управления в Сыктывкаре, где занялся разработкой проекта FU-Lab — Межрегиональной лаборатории информационной поддержки функционирования финно-угорских языков. На сайте FU-Lab доступны оцифрованные словари коми, марийского, горномарийского, удмуртского и других языков; сервисы проверки орфографии, конвертеры и другие полезные инструменты. В Сыктывкаре проработал больше четырёх лет.
Вернулся в Йошкар-Олу и с 13 июня 2016 года начал работать в Республиканском центре марийской культуры, где специально для него был создан отдел инновационного развития марийского языка и культуры. Перед отделом стояла задача показать результат работы за полгода. Так началась работа по включению марийского языка (лугово-восточной и горномарийской литературных норм) в сервис Яндекс.Переводчик. Для этого начали собирать корпус параллельных текстов. За отведённое время смогли собрать 150-200 тысяч предложений[2]. В настоящее время собрано свыше 400 тысяч предложений. Переводом и вычиткой текстов занимался советский, российский и марийский писатель, прозаик, журналист и редактор Геннадий Сабанцев. Кроме того, была создана система проверки правописания.
Онлайн-сервис проверки правописания, марийская раскладка клавиатуры, онлайн словари и другие полезные инструменты, созданные Андреем Чемышевым и его командой, находятся в свободном доступе на сайте Mari-Lab.
С 1 июня 2017 года по настоящее время работает в Марийском научно-исследовательском институте языка, литературы и истории им. В. М. Васильева (МарНИИЯЛИ), где занимается лексикологическими исследованиями, составлением словарей и поддержкой использования марийского языка в интернете.
С 2017 года сотрудники Республиканского центра марийской культуры совместно с МарНИИЯЛИ под руководством Андрея Чемышева начали работу по созданию Национального корпуса марийского языка. К концу 2020 года в информационно-поисковой системе насчитывалось более 20 миллионов словоупотреблений[3]. Параллельно создавалась электронная библиотека луговомар. «Электрон книгагудо» («Электронная библиотека»), практическая польза которой была оценена в 2020 году, когда из-за коронавируса школьники и студенты перешли на дистанционное обучение.
Умная колонка «Айвика»
С 2021 года Андрей Чемышев начал работу над речевыми технологиями в три этапа: создание синтезатора речи, распознавания речи и использования искусственного интеллекта. Для создания синтезатора речи собирали аудиокорпус: озвучивали произведения марийских авторов, а также переведённые рассказы, повести, библию на марийском языке. Собрано 70 аудиопроизведений — свыше 15 часов записи голоса актёра Марийского национального театра драмы им. М. Шкетана Павла Ефимова. Записанные аудиокниги, часть которых использовалась для создания датасета, доступны в подкасте «Марий йогын»[4] во «ВКонтакте», «Яндекс.Музыке», Apple Podcasts[2].
20 февраля 2022 года в платформу Common Voice был включён марийский язык. Для разработки распознавания речи было записано более 300 часов речи марийского языка. Участвовали 489 челове[5]. Среди участников, которые записали 100, 1000 отдельных фраз проводился розыгрыш блютуз гарнитур и смартфонов от Федеральной национально-культурной автономии марийцев России. На базе собранных голосов программистом Айгизом Кунафиным создан чат-бот, распознающий марийскую речь.
К синтезатору мужской речи на основе голоса Павла Ефимова был добавлен женский голос, собрано 15 часов записи голоса.
В 2023 году под руководством А. В. Чемышева совместно с лабораторией национальной цифровой лингвистики при Марийском государственном университете началось обучение искусственного интеллекта[6]. Умную колонку назвали «Айвика» (iВика). Первый тест был проведён на базе башкирской умной колонки «Һомай». Айвика умеет отвечать на вопросы, но при ответе присутствует небольшая задержка, поэтому идёт процесс переобучения модели синтеза речи[7]. Планируется выпустить 250 колонок.
С 23 июня 2023 года по настоящее время работает в российской интернет-энциклопедии «РУВИКИ», ведёт марийский (луговой) раздел. С 2024 года возглавляет Отдел координации языков разделов.
Общественная деятельность
Является основным переводчиком интерфейса социальной сети «ВКонтакте»[8] и мессенджера Telegram[9] на марийский язык.
Консультирует языковых активистов по вопросам развития малых языков в цифровом пространстве и делится собственным опытом[10]. В 2023-24 гг. помогал разрабатывать программу цифровизации тувинского языка.
Семья
Женат, есть дочь — Эрвина.
Награды
- Лауреат Государственной премии Республики Марий Эл имени М. Н. Янтемира (2011),[11] (2021)[12];
- Лауреат Всероссийской общественной премии «Гордость нации» в 2021 году в номинации «За вклад в сохранение и развитие родных языков»[13];
- Почётная грамота Государственного Собрания Республики Марий Эл (2014, 2025);
- Почётная грамота Правительства Республики Марий Эл (2024)[14];
- Нагрудный знак Министерства культуры, печати и по делам национальностей Республики Марий Эл «За достижения в культуре» (2025)[15].
Примечания
Ссылки
- Окно в марийский интернет: йошкаролинец Андрей Чемышев о письме Биллу Гейтсу и создании марийской «Алисы». Марийская правда (13 июля 2020). Дата обращения: 24 сентября 2025.
Андрей Чемышев рассказал, что уже умеет умная колонка iВика или Айвика