Вокодер с выбираемым режимом

Воко́дер с выбира́емым режи́мом (англ. Selectable Mode Vocoder, SMV) — это стандарт кодирования речи с переменным битрейтом, используемый в сетях CDMA2000[1]. SMV использует различные режимы работы, которые выбираются в зависимости от особенностей поступающего речевого сигнала. Он представляет собой одну из версий речевых кодеков, используемых в радиотелефонии.

SMV — это кодек речи, обеспечивающий высокое качество кодирования и повышенную устойчивость к фоновому шуму, что особенно востребовано в новых поколениях радиотехнологий. Многорежимная работа кодека позволяет повысить эффективность использования полосы пропускания как в радиоэфирных, так и в кабельных сетях, позволяя операторам увеличивать число одновременных голосовых соединений в одном канале.

Введение

С развитием радиосвязи и ростом числа пользователей увеличился спрос на передачу данных, что привело к необходимости более эффективного использования полосы пропускания при проектировании CDMA2000 (англ. UMTS). Одним из способов решения этой задачи стала замена традиционных схем кодирования с фиксированной скоростью передачи на схемы с переменным битрейтом и многорежимные алгоритмы работы. Именно эти подходы реализованы в системе вокодера с выбираемым режимом.

Предпосылки кодирования в стандарте CDMA

На ранних этапах технология CDMA использовала линейное предсказание с возбуждением кодом (англ. code-excited linear prediction, CELP). Первым CELP-кодеком был IS-96C (известный как QCELP8K). Этот кодек поддерживал четыре скорости передачи данных: полная — 8,55 кбит/с, половинная — 4 кбит/с, четвертная — 2 кбит/с, и одна восьмая — 0,8 кбит/с. Использование этих режимов позволяло снизить среднюю скорость передачи данных (ADR) и, соответственно, уменьшить помехи.

Несмотря на то что QCELP8K достигал низкой средней скорости передачи данных (примерно 3,84 кбит/с) и обеспечивал приемлемо низкий уровень интерференции, он не получил широкого распространения из-за существования решений с лучшим качеством речи — например, GSM full-rate при 22,8 кбит/с и улучшенный full-rate при 12,2 кбит/с.

Для повышения качества коммуникации был разработан кодек с альтернативной шкалой скоростей (тип 2): полная скорость — 13,33 кбит/с; половинная — 6,2 кбит/с; четвертная — 2,7 кбит/с; одна восьмая — 1 кбит/с. Этот кодек, широко применявшийся в 2G, получил название IS-733 (QCELP13K) и обеспечивал качество, сравнимое со стандартом ITU-T G.726 на скорости 32 кбит/с, которую ITU считал достаточной для высококачественной передачи речи.

Однако улучшение качества при переходе ко второму кодеку сопровождалось уменьшением ёмкости канала и его защищённости от ошибок. Решением стало возвращение к решениям с более низкой средней скоростью передачи, но с улучшенным качеством — к так называемому улучшенному кодеку с переменной скоростью (англ. enhanced variable rate codec, EVRC). Используя новейшие методы кодирования, EVRC обеспечивал качество, близкое к QCELP13K, а зачастую превосходил стандарт G.729 ITU-T (фиксированный битрейт 8 кбит/с).

Кодек

Кодек SMV реализует три основных режима работы:

  • Режим 0 — обеспечивает лучшее качество, чем EVRC, при той же средней скорости передачи данных (ADR).
  • Режим 1 — обеспечивает аналогичное EVRC качество речи при меньшей средней скорости.
  • Режим 2 — немного уступает EVRC по качеству, но позволяет значительно снизить ADR.

В настоящее время реализованы и дополнительные режимы:

  • Двойной режим 3 — ориентирован на ещё большее снижение средней скорости.
  • Особые варианты режимов 0 и 1 с максимальной скоростью передачи на половинной ставке (half-rate), соответственно называемые режимами 4 и 5.

Стандарт IS-893, определяющий спецификацию SMV, предусматривает возможность мгновенного переключения между различными режимами без разрыва соединения. Качество работы оценивается с помощью субъективных прослушиваний в различных акустических условиях. Ниже представлена сводная таблица:

Таблица проектных характеристик
Режим Тип скорости (%) ADR (кбит/с) Качество
R(8,55) 1/2R(4,0) 1/4R(2,0) 1/8R(0,8)
0 40 5 0* 55 3,644 Лучше G.726
1 22 10 11 57 2,536 G.726 (32 кбит/с)
2 9 23 11 57 1,951 G.729 (8 кбит/с)
3 2 26 10 62 1,91 G.723.1 (6,3 кбит/с)
4 0* 38 0* 62 2,02 G.723.1 (5,3 кбит/с)

В таблице видно, что режим 0 (англ. premium mode) обеспечивает субъективную оценку качества звука (MOS), превосходящую EVRC и в ряде случаев — G.711, при сохранении средней скорости кодирования 3,644 кбит/с, эквивалентной ADR EVRC.

В режиме 1 (англ. standard mode) достигается MOS, статистически эквивалентная EVRC, при уменьшении скорости кодирования на 30 %. Режим 2 (англ. economic mode) обеспечивает MOS, эквивалентную G.729, с 55 % ADR EVRC.

Режим 3 (англ. capacity saving mode) близок по качеству к стандарту G.723.1 при 6,3 кбит/с и занимает только 51 % ADR EVRC.

Режимы 4 и 5 были разработаны для приложений, где допустимая скорость передачи не превышает 4 кбит/с. В настоящее время режим 4 — это единственный стандарт, гарантирующий MOS при 4 кбит/с, предназначенный прежде всего для приложений с жёсткими ограничениями по полосе пропускания.

Применение

В настоящее время SMV разрабатывается как замена EVRC в CDMA, обеспечивая улучшенное качество речи и гибкость управления. Многообразие поддерживаемых режимов позволяет более эффективно компенсировать постоянно изменяющиеся условия радиосети между сотами. Возможность работы с пониженной скоростью (режимы 4 и 5) служит дополнительным средством контроля, снижая потери вызовов на границе сот.

SMV идеально подходит для всех поколений CDMA (2G, 2.5G, 3G), а также является универсальным решением для широкого спектра радиопакетных и кабельных сетей, таких как W-CDMA. Кодек может также легко заменить AMR в приложениях UMTS, обеспечивая при этом совместимость между голосовыми сетями 3GPP (стандарт AMR) и 3GPP2 (стандарт SMV).

Данный кодек может применяться и в пакетных сетях, таких как VoIP и VoATM, поскольку позволяет получать высокое качество речи при небольшом битрейте по сравнению с уже существующими широкополосными кодеками G.711, G.726 и G.729. Это позволяет кабельным сетям более эффективно использовать широкую полосу пропускания.

Примечания