Статус документа
Статус документа

ГОСТ Р 53556.4-2013 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 AUDIO). Основные методы кодирования звуковых сигналов (GA): усовершенствованное звуковое кодирование (AAC), взвешивающее векторное квантование (TwinVQ), побитовое арифметическое кодирование (BSAC)

    5.1 Декодирование специальной конфигурации GA

       

5.1.1 GASpecificConfig ()

  

Параметры вызовов 'samplingFrequencylndex', 'channelConfiguration', 'audioObjectType' передаются из специального элемента конфигурации аудио. Информация, содержавшаяся в этих параметрах, обязательна для процесса декодирования.

Если частота дискретизации не является одной из величин, перечисленных в правой графе таблицы 82, анализирующей полезную нагрузку потока битов, то должны быть выведены показатели зависимые от частоты дискретизации таблицы (таблицы кода, таблицы масштабного коэффициента полосы и т.д.). Так как данная частота дискретизации сопоставляется только с одной таблицей частоты дискретизации и так как требуется максимальная гибкость в диапазоне возможных частот дискретизации, чтобы связать подразумеваемую частоту дискретизации с требующимися таблицами зависимости от частоты дискретизации должна использоваться следующая таблица.


Таблица 82 - Отображение частоты дискретизации

Частотный диапазон, Гц

Частоты дискретизации, Гц


96000


88200


64000


48000


44100


32000


24000


22050


16000


12000


11025


8000

          

Если в таблице 82 частота дискретизации приведенная в правой графе, не будет определена, то должна использоваться самая близкая из определенных таблиц.

frameLengthFlag

Длина фрейма, число спектральных линий соответственно.
Для всех типов General Audio Object Types (общих аудио объектных типов), кроме ААС SSR и ER AAC LD:
если установлено в "0", используется IMDCT с 1024/128 линиями и frameLength устанавливается в 1024, если установлено в "1", используется IMDCT с 960/120 линиями и frameLength устанавливается в 960.
Для ER AAC LD: если установлено в "0", используется IMDCT с 512 линиями и frameLength устанавливается в 512, если установлено в "1", используется IMDCT с 480 линиями и frameLength устанавливается в 480.
Для AAC SSR: должно быть установлено в "0". Используется IMDCT с 256/32 линиями.

Примечание - Фактическое число линий для IMDCT (первое или второе значение) отличается значением window_sequence.

DependsOnCoreCoder

Сигнализирует о том, что в лежащей в основе базового уровня масштабируемой конфигурации ААС использовался базовый кодер.

CoreCoderDelay

Задержка в выборках, которая должна быть применена к сверхдискретизированному (если необходимо) выводу базового декодера, перед вычислением IMDCT.

extensionFlag

Должно быть '0' для аудио объектных типов 1, 2, 3, 4, 6, 7. Должно быть '1' для аудио объектных типов 17, 19, 20, 21, 22, 23.

layerNr

3-разрядное поле, указывающее номер уровня ААС в масштабируемой конфигурации. Первый уровень ААС обозначается значением 0.

numOfSubFrame

5-разрядное целочисленное значение без знака, представляющее число подфреймов, которые группируются и передаются в суперкадре.

layer_length

11-разрядное целочисленное значение без знака, представляющее среднюю длину уровней большого шага в байтах.

aacSectionDataResilienceFlag

Этот флаг сигнализирует о различных схемах кодирования данных раздела ААС. Если используется кодовая книга 11, эта схема передает дополнительную информацию о максимальном абсолютном значении для линий спектра. Это позволяет обнаруживать ошибки спектральных линий, которые больше, чем указанное значение.

aacScalefactorDataResilienceFlag

Этот флаг сигнализирует о различных схемах кодирования данных масштабного фактора ААС, которые более устойчивы к ошибкам, чем исходные.

aacSpectralDataResilienceFlag

Этот флаг сигнализирует о различных схемах кодирования (HCR) спектральных данных ААС, которые более устойчивы к ошибкам, чем исходные.

extensionFlag3

Флаг расширения для будущего использования. Должен быть '0'.


Ограничения: program_config_element () должен использоваться только для основных типов аудио объекта ААС, ААС SSR, ААС LC и ААС LTP.

     5.1.2 Элемент конфигурации программы (РСЕ)

   

Следующие изменения применяются в контексте MPEG-4:

program_config_element () может встретиться вне полезной нагрузки ААС, например, как часть GASpecificConfig () или adif_header (), но также и в составе полезной нагрузки ААС как синтаксический элемент в raw_data_block ().

Конфигурация канала, данная в program_config_element () в полезной нагрузке ААС, оценивается, если никакая конфигурация канала не дается вне полезной нагрузки ААС. Это имеет место только для MPEG-4 ADTS с channel_configation == 0.

sampling_frequency_index, данный в program_config_element (), может указывать номинальную частоту выборок, которая отличается от фактической частоты дискретизации, то есть, намеченной частоты дискретизации выходного сигнала декодера. Это является случаем, когда используется фактическая частота дискретизации, которая не может быть представлена посредством sampling_frequency_index в program_config_element (). Фактическая частота дискретизации сообщается в AudioSpecificConfig () или неявно известна системе. Отношение между фактической частотой дискретизации и номинальной частотой дискретизации определяется в таблице 82.

В любом случае в определенное время может быть сконфигурирована только одна программа.

object_type

Двухбитовый индекс объектного типа из таблицы 83.



Таблица 83 - Индекс типа объекта

Индекс

Объектный тип

0

ААС Main

1

ААС LC

2

ААС SSR

3

ААС LTP