Статус документа
Статус документа

ГОСТ Р 53556.2-2012 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть 3 (MPEG-4 AUDIO). Кодирование речевых сигналов с использованием гармонических векторов - HVXC (Переиздание)

Приложение А
(справочное)

     
Инструменты кодера HVXC

А.1 Краткий обзор инструментов кодера

Речевой ввод при частоте дискретизации 8 кГц сформирован во фреймы с длиной и интервалом 256 и 160 отсчетов соответственно. Анализ LPC выполнен, используя windowed (обработанные методом окна) входные данные по одному фрейму. Остаточные сигналы LPC вычисляются обратной фильтрацией входных данных, используя параметры квантованного и интерполированного LSP. Остаточные сигналы затем подаются в блок оценки величины шага и спектра, где огибающие спектра для остаточного LPC оцениваются тем же способом, что и в кодере МВЕ, за исключением того, что используется только двухбитовое решение V/UV на фрейм. Огибающая спектра для речевого сегмента, затем - вектор, квантованный со взвешенной мерой искажения. Для неречевого сегмента выполняется поиск по замкнутому контуру для кодирования вектора возбуждения.

А.2 Нормализация
     


    А.2.1 Описание инструмента

Процесс нормализации составлен из трех операций, а именно, анализа LPC, квантования параметров LSP и обратной фильтрации.

А.2.2 Процесс нормализации

А.2.2.1 Анализ LPC

Для каждого фрейма вычисляются коэффициенты LPC 10-го порядка, используя входные сигналы Хемминга, обработанные методом окна, методом автокорреляции.

А.2.2.2 Квантование LSP

Используется тот же самый квантователь LSP, как в узкополосных CELP.

Коэффициенты LPC сначала преобразованы в параметры пары Line Spectral Pair (LSP). Параметры LSP затем квантуются Vector Quantization (VQ). В случае базового уровня есть два метода квантования LSPs, как описано в разделе декодирования; двухступенчатый VQ без межфреймового предсказания и комбинация VQ и VQ с межфреймовым прогнозированием. В процессе кодирования оба метода используются для квантования LSPs, и один из них выбирается путем сравнения ошибок квантования. Ошибка квантования вычисляется как взвешенное евклидово расстояние.

В случае уровня расширения 10-мерный векторный квантователь, у которого есть книга шифров на 8 битов, добавляется к основанию текущей схемы квантователя LSP кода на 2,0 Кбит/с. Битовая скорость LSPs увеличена с 18 бит/20 мс до 26 бит/20 мс.

Процесс кодирования базового уровня следующий.

Коэффициенты взвешивания (w [ ]) равны:

,


где - порядок анализа LP,

lsp [ ] s - конвертированные LSPs.

w_fact = 1.;

for (i = 0; i < 4; i++) w[i] *= w_fact;

for (i = 4; i < 8; i++) {
     w_fact *= .694;
     w[i] *= w_fact;
     }

for (i = 8; i < 10; i++) {
     w_fact *= .510;
     w[i] *= w_fact;
     }


Квантизатор первой стадии - тот же для каждого метода квантования. LSPs квантованы при использовании векторного квантователя, и соответствующий индекс сохранен в LSP1. Чтобы выполнить отсроченное решение, множественные индексы сохранены как кандидаты на вторую стадию. Ошибка квантования в первой стадии еrr1[ ] дается формулой