Статус документа

ГОСТ Р 54712-2011 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи MPEG-2 часть III (MPEG-2 audio) (Переиздание)

Приложение Г
(обязательное)

Психоакустические модели

Г.1 Психоакустическая модель 1 для меньших частот дискретизации

Ниже приводится описание психоакустической модели 1 с адаптацией, необходимой для поддержки меньших частот дискретизации.

Вычисление психоакустической модели должно быть адаптировано к соответствующему уровню.

Нет принципиальных отличий в использовании психоакустической модели 1 на Уровнях I или II.

На уровне I новое распределение битов вычисляется для каждого блока из 12 субполосных отсчетов или 384 ИКМ-отсчетов.

На Уровне II новое распределение битов вычисляется для трех блоков [всего 36 субполосных отсчетов, соответствующих 3*384 (1152) входным ИКМ-отсчетам].

Распределение битов между 32 субполосами выполняется на основе отношений сигнал-маска во всех субполосах. Поэтому для каждой субполосы необходимо отпределить максимальный уровень сигнала и минимальный уровень порога маскирования. Минимальный порог маскирования определяется в результате психоакустического расчета на основе БПФ входного ИКМ-сигнала.

БПФ, выполняемое параллельно с субполосной фильтрацией, компенсирует недостаточную частотную селективность на низких частотах субполосного банка фильтров. Этот метод позволяет достичь достаточного разрешения во временной области для кодированного аудиосигнала (полифазный фильтр с оптимизированным окном для минимального преэха) и достаточного разрешения по частоте для вычисления порогов маскирования. Частоты и уровни шумов могут быть вычислены при наложении спектров, это необходимо для определения минимальной скорости передачи для тех субполос, которым требуются некоторые бите для устранения компонентов элайзинга в декодере. Дополнительное усложнение для вычисления оптимальной разрешающей способности по частоте необходимо только в кодере и не вызывает дополнительной задержки или усложнения декодера.

Вычисление отношения сигнал-маска основано на следующих процедурах:

шаг 1 - вычисление БПФ для преобразования сигнала из временного пространства в частотное;

шаг 2 - определение уровня звукового давления в каждой субполосе;

шаг 3 - определение абсолютного порога слышимости;

шаг 4 - обнаружение тональных (близких к синусоиде) и нетональных (близких к шуму) компонент аудиосигнала;

шаг 5 - прореживание маскеров для получения релевантных маскеров;

шаг 6 - вычисление индивидуальных порогов маскирования;

шаг 7 - определение глобального порога маскирования;

шаг 8 - определение минимального порога маскирования в каждой субполосе;

шаг 9 - вычисление отношения сигнал-маска в каждой субполосе.

Частота дискретизации по умолчанию равна 24 кГц. Для других двух частот дискретизации все упомянутые частоты должны измениться соответственным образом.

Шаг 1. Вычисление спектра.

БПФ по своему принципу аналогично используемому в ГОСТ Р 54711, но из-за различия частот дискретизации длины преобразования в мс также различны.

Технические данные БПФ:


Параметры	Уровень I	Уровень II
Длина преобразования	512 отсчетов	1024 отсчета
Размер окна при 24 кГц	21,33 мс	42,67 мс
Размер окна при 22,05 кГц	23,22 мс	46,44 мс
Размер окна при 16 кГц	32 мс	64 мс
Частотное разрешение	/512	/1024

Окно Хана

Приложение Г(обязательное)

Приложение Г
(обязательное)