Статус документа
Статус документа

ГОСТ Р 54713-2011 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. MPEG-2, часть VII: усовершенствованное кодирование звука (MPEG-2 AAC)

     
Приложение В
(обязательное)

     
Кодер

В.1 Психоакустическая модель

В.1.1 Общие сведения

В этом приложении представлена психоакустическая модель для кодера ААС. Психоакустическая модель вычисляет максимальную энергию искажений, которая маскируется энергией сигнала. Эту энергию называют порогом маскирования. У процесса вычисления порога маскирования есть три входа:

1 Длина сдвига для процесса вычисления порога маскирования iblen. Параметр iblen должен оставаться постоянным. Так как необходимо вычислить пороги для двух различных длин сдвига, необходимо два процесса, каждый со своей фиксированной длиной сдвига. Для длинного быстрого преобразования Фурье (БПФ) iblen = 1024, для короткого БПФ iblen = 128.

2 Для каждого типа БПФ следующие iblen отсчетов сигнала с задержанными отсчетами (в банке фильтров или в блоке психоакустического расчета) располагаются таким образом, чтобы окно психоакустического расчета оказалось по центру окна частотно-временного преобразования.

3 Частота дискретизации. Существуют наборы таблиц, предусмотренные для стандартных частот дискретизации. Частота дискретизации так же, как iblen, должна оставаться постоянной в течение одной реализации процесса вычисления порога маскирования.

Выходы психоакустической модели:

1 Набор отношений сигнал-маска и значений порога, которые адаптируются к кодеру как описано ниже.

2 Задержанные временные данные (ИКМ-отсчеты), которые используются МДКП.

3 Тип блока МДКП (длинный, стартовый, стоповый или короткий).

4 Оценка количества битов, которое должно использоваться для кодирования в дополнение к среднему количеству доступных битов.

Задержка ИКМ отсчетов необходима, ибо алгоритм переключения обнаруживает резкую атаку, т.е. для фрейма должны использоваться короткие блоки, длинный блок перед короткими блоками должен быть изменен на стартовый.

Перед начальной реализацией модели массив с предыдущих данных БПФ и массивы и должны быть обнулены для обеспечения известной начальной точки.

В.1.2 Комментарии

В процессе вычисления порога маскирования используются три индекса для значений данных:

- индекс частотной линии спектра БПФ. Индекс 0 соответствует постоянной составляющей, индекс 1023 соответствует линии спектра на частоте Найквиста.

- индекс частотной полосы. Если вычисление включает свертку или сумму, используется в качестве переменной суммирования. Нумерация полос начинается с 0.

- индекс полосы масштабных коэффициентов. Индекс 0 соответствует самой низкой полосе масштабных коэффициентов.

В.1.3 Функция маскирования

В психоакустическом расчете используется "функция маскирования". Она вычисляется следующим образом:


где - значение, барк, определяющее расстояние от маскера, - значение, барк, соответствующее положению маскера, - временная переменная.

,

где - временная переменная, - функция, возвращающая большее отрицательное значение из и .

,

где - временная переменная.

B.1.4 Шаги при вычислении порога маскирования

Следующие шаги являются необходимыми для вычисления SMR (n) и xmin (n), используемыми в кодере для длинного и короткого БПФ.

1 Восстановить 2 * iblen отсчетов входного сигнала.