Общее описание процессов обработки речи в стандарте GSM PDF Print E-mail
Written by Administrator   
Friday, 04 May 2012 17:33

Общее описание процессов обработки речи

Процессы обработки речи в стандарте GSM направлены на обеспечение высокого качества передаваемых сообщений, реализацию дополнительных сервисных возможностей и повышение потребительских качеств абонентских терминалов.

Обработка речи осуществляется в рамках принятой системы прерывистой передачи речи. Система прерывистой передачи речи (DTX) обеспечивает включение передатчика только тогда, когда пользователь начинает разговор и отключает его в паузах и в конце разговора. DTX управляется детектором активности речи (VAD), который обеспечивает обнаружение и выделение интервалов передачи речи с шумом и шума без речи даже в тех случаях, когда уровень шума соизмерим с уровнем речи. В состав системы прерывистой передачи речи входит также устройство формирования комфортного шума, который включается и прослушивается в паузах речи, когда передатчик отключен. Экспериментально показано, что отключение фонового шума на выходе приемника в паузах при отключении передатчика раздражает абонента и снижает разборчивость речи, поэтому применение комфортного шума в паузах считается необходимым. DTX процесс з приемнике включает также интерполяцию фрагментов речи, потерянных из-за ошибок в канале.

Структурная схема процессов обработки речи в стандарте GSM показана на рис. 4.1, главным устройством в этой схеме является речевой кодек [4.1, 4.2, 4.3].

4.2. Выбор речевого кодека для стандарта GSM

Рабочей группой по разработке стандарта GSM были предъявлены следующие основные требования к речевому кодеку [4.3]:

- высокое качество речи, не уступающее качеству передачи речи в лучших существующих аналоговых сотовых системах связи;

- низкая скорость передачи речи, обеспечивающая возможность эффективного канального кодирования и результирующую скорость передачи в канале связи не выше 16 кбит/с,

- малую задержку сообщения в процессе преобразования речи;

- устойчивость к ошибкам в канале передачи;

- возможность работы в широком динамическом диапазоне входных воздействий как сигнала, так и шума;

- большой динамический диапазон выходных сигналов;

- незначительное снижение качества речи при каскадном соединении кодеков:

- прозрачность для сигналов данных;

- прямое сопряжение со смежными устройствами терминалов;

- простота реализации;

- малое потребление;

- низкая стоимость.

Для выбора речевого кодека GSM был организован конкурс проектов. Первоначально для рассмотрения было предложено 20 различных кодеков от 9 европейских стран. После международного формального тестирования это количество было сокращено до 6 из 6 стран. На следующем этапе два из четырех подполосных (SBC) кодеков (норвежский и итальянский) были сняты с рассмотрения, к окончательному этапу конкурса осталось два SBC кодека и два кодека в предикативным кодированием [4.4].

RPE-LPC - Regular-Pulse Excitation/Linear Predicative Coding (Германия, Philips) -кодек с регулярным импульсным возбуждением и линейным кодированием с предсказанием;

MPE-LTP - Multi-Pulse Excitation/Long-Term Prediction (Франция, IBM) -кодек с многоимпульсным возбуждением и долговременным предсказанием:

На втором этапе происходит дальнейшее снижение динамического диапазона за счет долговременного предсказания, в процессе которого каждый сегмент выравнивается до уровня следующих друг за другом сегментов речи. В принципе, LTP фильтр вычитает предыдущий период сигнала из текущего периода.

Этот фильтр характеризуется параметром задержки N и коэффициентом усиления Ь. Период вычисления этих параметров равен 5 мс.

Восемь коэффициентов r (i) LPC анализирующего фильтра и параметры фильтра LTP анализа кодируются и передаются со скоростью 3,6 кбит/с.

Для формирования последовательности возбуждения остаточный сигнал пропускают через фильтр нижних частот с частотой среза 3-4 кГц.

Окончательно периодическая последовательность фрагментов передается со скоростью 9,4 кбит/с. Общая скорость передачи составляет 3,6+9,4 = 13 кбит/с.

В декодере речевой сигнал восстанавливается по откликам последовательности регулярного импульсного возбуждения (RPE) двухступенчатым синтезирующим фильтром, как показано на рис. 4.3.

При этом качество речи соответствует качеству речи, передаваемой по ISDN, и превосходит качество речи в аналоговых радиотелефонных системах.

Теоретически время задержки речевого сигнала в кодекс равно длительности сегмента и составляет 20 мс. Реальное время задержки, с учетом операций канального кодирования и переме-жения, а также физического выполнения рассматриваемых операций, составляет 70-80 мс.