Статус документа

ГОСТ Р 54711-2011 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. MPEG-1 часть III (MPEG-1 audio)

Приложение В
(обязательное)

Процесс кодирования

В.1 Кодер

В.1.1 Краткий обзор

В данном приложении для каждого слоя приводится пример кодера с соответствующими блок-схемами. В кратком введении дается общая идея кодирования.

В.1.1.1 Введение

Алгоритм, приведенный в данном стандарте, является психоакустическим алгоритмом. На рисунке В.1 показаны основные блоки психоакустического алгоритма.

Рисунок В.1 - Блок-схема кодера

Четыре основные части психоакустического кодера описаны ниже.

В.1.1.1.1 Набор фильтров

Набор фильтров реализует частотно-временное преобразование. В алгоритме ISO/IEC 1117203 (MPEG Audio) используются два разных набора фильтров: полифазный набор и гибридный полифазный/МДКП набор. Каждый набор реализует определенное частотно-временное преобразование. Для данных наборов фильтров количество отсчетов в частотной области равно количеству отсчетов во временной области. Наборы фильтров обеспечивают основное частотное разделение в кодере и реконструкцию сигнала в декодере. Отсчеты на выходе наборов фильтров подлежат квантованию.

В.1.1.1.2 Психоакустическая модель

В блоке психоакустической модели вычисляется минимально заметный уровень шумов в каждой полосе набора фильтров. Этот уровень шумов используется при распределении битов или шума при определении фактических квантователей и уровней квантования. Есть две психоакустические модели, приведенные в приложении Г. Вто время как обе они могут использоваться с любым уровнем ISO/IEC 1117203 (MPEG Audio), на практике Модель 1 используется для Уровней I и II, а Модель 2 - для Уровня III. В обеих психоакустических моделях выходом является отношение сигнал-маска (SMR) для каждой полосы (Уровни I и II) или группы полос (Уровень III).

В.1.1.1.3 Распределение битов или шумов

Блок распределения анализирует выходные отсчеты набора фильтров и SMR психоакустической модели и распределяет биты (Уровни I и II) или шумы (Уровень III), чтобы одновременно удовлетворить и требование по скорости передачи и требования маскирования. На низких скоростях передачи эти методы нацелены на то, чтобы потратить биты на минимизацию искажений при невозможности удовлетворить психоакустические требования.

В.1.1.1.4 Блок форматирования потока битов

В блоке форматирования потока битов квантованные отсчеты набора фильтров вместе с данными о распределении битов (Уровни I и II) или шумов (Уровень III) и другой служебной информацией кодируются и форматируются определенным образом. В случае Уровня III дополнительно используется код Хаффмана.

В.1.1.2 Набор фильтров

На Уровнях I и II используется набор фильтров с 32 субполосами. В каждой субполосе 12 или 36 отсчетов группируются для обработки. На Уровне III набор фильтров обладает сигнально-зависимой разрешающей способностью с 632 или 1832 частотными линиями. Если есть 632 частотных полосы, группа из трех последовательных значений каждой частоты квантуется отдельно.

В.1.1.3 Метод распределения битов или шумов

В этом приложении описываются два различных способа управления скоростью передачи. На Уровнях I и II используется распределение битов, то есть определенное количество битов отводится каждому отсчету (или группе отсчетов) в каждой субполосе. На Уровне III используется распределение шумов, при котором квантователи изменяются по определенному закону, и управляемым параметром фактически является внесенный шум. В обоих случаях результатом являются набор параметров квантования и квантованные выходные отсчеты, которые подаются на блок формирования потока битов.

В.1.1.4 Формирование потока битов

Блок формирования потока битов зависит от выбранного уровня. На Уровнях I и II для каждого субполосного отсчета используется фиксированная ИКМ, за исключением возможности группировки квантуемых отсчетов на Уровне II. На Уровне III используется код Хаффмана с переменной длиной кодового слова для более эффективного кодирования за счет дополнительной сложности.

В.1.2 Входной фильтр верхних частот

Алгоритмы кодирования обеспечивают частотную характеристику вплоть до постоянной составляющей. Однако, если это не является обязательным требованием, рекомендуется включение фильтра верхних частот на входе кодера. Частота среза должна быть в диапазоне 2-10 Гц.

Использование такого фильтра верхних частот устраняет неоправданно высокие затраты на кодирование самой низкой субполосы и увеличивает общее качество звука.

В.1.3 Субполосный фильтр анализа

Приложение В(обязательное)

Приложение В
(обязательное)