Yandex SpeechKit
Yandex SpeechKit (произносится как Яндекс СпичКит) — технология распознавания речи и синтеза речи от российской компании Яндекс[1].
Общие сведения
| Yandex.SpeechKit | |
|---|---|
| Разработчик | Яндекс |
| Языки интерфейса | русский, турецкий, английский |
| Первый выпуск | 2013 |
| Сайт | tech.yandex.ru/speechkit… |
Краткие сведения
Разработками в области обработки естественной речи компания «Яндекс» занимается с 2012 года[2].
SpeechKit[3] был представлен 2 октября 2013 года на ежегодной технологической конференции Яндекса YaC[1].
Мобильный голосовой поиск на основе этой платформы доступен для смартфонов под управлением iOS, «Андроид» и Windows Phone 8[1] и понимает запросы на русском и турецком языках[4]. Поддерживаются две темы запросов: «общая» (обычные запросы) и «гео» (адреса и названия организаций), причём, по словам разработчиков, точность распознавания составляет 84 % и 94 % соответственно[5]. Скорость распознавания — 1,1 секунды[5].
SpeechKit[3] используется в приложениях «Яндекс Браузер», «Яндекс Город», «Яндекс Карты», «Яндекс Навигатор» и ещё около 400 приложениях[4].
4 августа 2014 годы был представлен облачный сервис SpeechKit Cloud SDK (произносится как СпичКит Клауд, СДК)[4]. Разработка предназначена для встраивания в игры, развлекательные и навигационные сервисы[4]. Первый месяц использования СДК бесплатный, далее стоимость будет рассчитываться, исходя из количества запросов[4].
Возможности
Система распознавания речи в миниатюре — возможность привязывать к любому слову или фразе любую команду для устройства; не требует доступа в интернет, для запуска не нужно нажимать какие-либо кнопки: программа постоянно работает в фоне[6].
Способность извлекать из слов смысл и анализировать контекст: к примеру, система поймёт, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город[6].
Преобразование текста в речь на базе скрытых марковских моделей[6].
Применение технологии
Комплекс речевых технологий Яндекса успешно применяется в различных направлениях[7]:
- Персональный помощник «Алиса»[8];
- Мультимедийная система голосового управления автомобилем, являющаяся конкурентом Car Play и Android Auto (подписаны контракты с «КАМАЗом», «Toyota» и «Honda»)[9];
- Перевод денежных средств голосом у Бинбанка[10];
- Автоматическое тегирование звонков впервые внедренное c Calltouch[11];
- Автоозвучка текстов (на сайте газеты «Известия»)[12].