Вокодер с выбираемым режимом
Воко́дер с выбира́емым режи́мом (англ. Selectable Mode Vocoder, SMV) — это стандарт кодирования речи с переменным битрейтом, используемый в сетях CDMA2000[1]. SMV использует различные режимы работы, которые выбираются в зависимости от особенностей поступающего речевого сигнала. Он представляет собой одну из версий речевых кодеков, используемых в радиотелефонии.
SMV — это кодек речи, обеспечивающий высокое качество кодирования и повышенную устойчивость к фоновому шуму, что особенно востребовано в новых поколениях радиотехнологий. Многорежимная работа кодека позволяет повысить эффективность использования полосы пропускания как в радиоэфирных, так и в кабельных сетях, позволяя операторам увеличивать число одновременных голосовых соединений в одном канале.
Введение
С развитием радиосвязи и ростом числа пользователей увеличился спрос на передачу данных, что привело к необходимости более эффективного использования полосы пропускания при проектировании CDMA2000 (англ. UMTS). Одним из способов решения этой задачи стала замена традиционных схем кодирования с фиксированной скоростью передачи на схемы с переменным битрейтом и многорежимные алгоритмы работы. Именно эти подходы реализованы в системе вокодера с выбираемым режимом.
Предпосылки кодирования в стандарте CDMA
На ранних этапах технология CDMA использовала линейное предсказание с возбуждением кодом (англ. code-excited linear prediction, CELP). Первым CELP-кодеком был IS-96C (известный как QCELP8K). Этот кодек поддерживал четыре скорости передачи данных: полная — 8,55 кбит/с, половинная — 4 кбит/с, четвертная — 2 кбит/с, и одна восьмая — 0,8 кбит/с. Использование этих режимов позволяло снизить среднюю скорость передачи данных (ADR) и, соответственно, уменьшить помехи.
Несмотря на то что QCELP8K достигал низкой средней скорости передачи данных (примерно 3,84 кбит/с) и обеспечивал приемлемо низкий уровень интерференции, он не получил широкого распространения из-за существования решений с лучшим качеством речи — например, GSM full-rate при 22,8 кбит/с и улучшенный full-rate при 12,2 кбит/с.
Для повышения качества коммуникации был разработан кодек с альтернативной шкалой скоростей (тип 2): полная скорость — 13,33 кбит/с; половинная — 6,2 кбит/с; четвертная — 2,7 кбит/с; одна восьмая — 1 кбит/с. Этот кодек, широко применявшийся в 2G, получил название IS-733 (QCELP13K) и обеспечивал качество, сравнимое со стандартом ITU-T G.726 на скорости 32 кбит/с, которую ITU считал достаточной для высококачественной передачи речи.
Однако улучшение качества при переходе ко второму кодеку сопровождалось уменьшением ёмкости канала и его защищённости от ошибок. Решением стало возвращение к решениям с более низкой средней скоростью передачи, но с улучшенным качеством — к так называемому улучшенному кодеку с переменной скоростью (англ. enhanced variable rate codec, EVRC). Используя новейшие методы кодирования, EVRC обеспечивал качество, близкое к QCELP13K, а зачастую превосходил стандарт G.729 ITU-T (фиксированный битрейт 8 кбит/с).
Кодек
Кодек SMV реализует три основных режима работы:
- Режим 0 — обеспечивает лучшее качество, чем EVRC, при той же средней скорости передачи данных (ADR).
- Режим 1 — обеспечивает аналогичное EVRC качество речи при меньшей средней скорости.
- Режим 2 — немного уступает EVRC по качеству, но позволяет значительно снизить ADR.
В настоящее время реализованы и дополнительные режимы:
- Двойной режим 3 — ориентирован на ещё большее снижение средней скорости.
- Особые варианты режимов 0 и 1 с максимальной скоростью передачи на половинной ставке (half-rate), соответственно называемые режимами 4 и 5.
Стандарт IS-893, определяющий спецификацию SMV, предусматривает возможность мгновенного переключения между различными режимами без разрыва соединения. Качество работы оценивается с помощью субъективных прослушиваний в различных акустических условиях. Ниже представлена сводная таблица:
| Режим | Тип скорости (%) | ADR (кбит/с) | Качество | |||
|---|---|---|---|---|---|---|
| R(8,55) | 1/2R(4,0) | 1/4R(2,0) | 1/8R(0,8) | |||
| 0 | 40 | 5 | 0* | 55 | 3,644 | Лучше G.726 |
| 1 | 22 | 10 | 11 | 57 | 2,536 | G.726 (32 кбит/с) |
| 2 | 9 | 23 | 11 | 57 | 1,951 | G.729 (8 кбит/с) |
| 3 | 2 | 26 | 10 | 62 | 1,91 | G.723.1 (6,3 кбит/с) |
| 4 | 0* | 38 | 0* | 62 | 2,02 | G.723.1 (5,3 кбит/с) |
В таблице видно, что режим 0 (англ. premium mode) обеспечивает субъективную оценку качества звука (MOS), превосходящую EVRC и в ряде случаев — G.711, при сохранении средней скорости кодирования 3,644 кбит/с, эквивалентной ADR EVRC.
В режиме 1 (англ. standard mode) достигается MOS, статистически эквивалентная EVRC, при уменьшении скорости кодирования на 30 %. Режим 2 (англ. economic mode) обеспечивает MOS, эквивалентную G.729, с 55 % ADR EVRC.
Режим 3 (англ. capacity saving mode) близок по качеству к стандарту G.723.1 при 6,3 кбит/с и занимает только 51 % ADR EVRC.
Режимы 4 и 5 были разработаны для приложений, где допустимая скорость передачи не превышает 4 кбит/с. В настоящее время режим 4 — это единственный стандарт, гарантирующий MOS при 4 кбит/с, предназначенный прежде всего для приложений с жёсткими ограничениями по полосе пропускания.
Применение
В настоящее время SMV разрабатывается как замена EVRC в CDMA, обеспечивая улучшенное качество речи и гибкость управления. Многообразие поддерживаемых режимов позволяет более эффективно компенсировать постоянно изменяющиеся условия радиосети между сотами. Возможность работы с пониженной скоростью (режимы 4 и 5) служит дополнительным средством контроля, снижая потери вызовов на границе сот.
SMV идеально подходит для всех поколений CDMA (2G, 2.5G, 3G), а также является универсальным решением для широкого спектра радиопакетных и кабельных сетей, таких как W-CDMA. Кодек может также легко заменить AMR в приложениях UMTS, обеспечивая при этом совместимость между голосовыми сетями 3GPP (стандарт AMR) и 3GPP2 (стандарт SMV).
Данный кодек может применяться и в пакетных сетях, таких как VoIP и VoATM, поскольку позволяет получать высокое качество речи при небольшом битрейте по сравнению с уже существующими широкополосными кодеками G.711, G.726 и G.729. Это позволяет кабельным сетям более эффективно использовать широкую полосу пропускания.


