Профессиональное решение
для инженеров-конструкторов и проектировщиков


ГОСТ Р 53556.4-2013

     

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Звуковое вещание цифровое

КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ

Часть III

(MPEG-4 AUDIO)

Основные методы кодирования звуковых сигналов (GA): усовершенствованное звуковое кодирование (ААС), взвешивающее векторное квантование (TwinVQ), побитовое арифметическое кодирование (BSAC)

Sound broadcasting digital. Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels. A part III (MPEG-4 audio). General audio coding (GA): advanced audio coding (AAC), weighing vector quantization (TwinVQ), bit-by-bit arithmetic coding (BSAC)

     

     ОКС 33.170

Дата введения 2014-09-01

     

Предисловие

1 РАЗРАБОТАН Санкт-Петербургским филиалом Центрального научно-исследовательского института связи "Ленинградское отделение" (ФГУП ЛО ЦНИИС)

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 480 "Связь"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 22 ноября 2013 г. N 2152-ст

4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009* "Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио" (ISO/IEC 14496-3:2009 "Information technology - Coding of audio-visual objects - Part 3: Audio", NEQ)

________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.

5 ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)

     1 Область применения


Подсистема кодирования общее аудио (GA) для MPEG-4 Audio предназначена для использования в качестве универсального аудиокодирования при самых низких скоростях передачи. Кодирование GA используется для сигналов сложного музыкального материала в моно от 6 Кбит/с на канал и для стерео от 12 Кбит/с на сигнал стерео до аудио вещательного качества при 64 Кбит/с или более на канал. Кодированный MPEG-4 материал может быть представлен или единственным набором данных, как в MPEG-1 и MPEG-2 Audio, или несколькими подмножествами, которые позволяют декодировать при различных уровнях качества, в зависимости от числа подмножеств, доступных на стороне декодера (масштабируемость скорости передачи).

Синтаксис усовершенствованного кодирования звука (ААС) MPEG-2 (включая поддержку многоканального аудио) полностью поддерживается кодированием MPEG-4 Audio GA. Все функции и возможности стандарта MPEG-2 ААС также применяются к MPEG-4. ААС был протестирован на предмет получения 'неотличимого' качества на скоростях передачи данных 320 Кбит/с для аудиосигналов с пятью полнодиапазонными каналами. В MPEG-4 инструменты, полученные из MPEG-2 ААС, доступны вместе с другими инструментами кодирования MPEG-4 GA, которые обеспечивают дополнительную функциональность, такую как масштабируемость скорости передачи и улучшенная эффективность кодирования на очень низких скоростях передачи. Масштабируемость скорости передачи достигается только инструментами кодирования GA или при использовании комбинации с внешним базовым кодером.

Кодирование MPEG-4 GA не ограничивается некоторыми фиксированными скоростям передачи и поддерживает широкий диапазон скоростей передачи и кодирование с переменной скоростью. В то время, как эффективное моно, стерео кодирование и многоканальное кодирование, возможно с использованием расширенных инструментов, получаемых из MPEG-2 ААС. Настоящий стандарт также обеспечивает расширение этого комплекта инструментов, которые позволяют масштабируемость моно/стерео, где сигнал моно может быть извлечен, декодируя только подмножества закодированного потока стерео.

     1.1 Технический обзор

          

    1.1.1 Кодер и декодер

 

Существуют связанные с MPEG-2 ААС инструменты с дополнениями MPEG-4 для некоторых из них и инструменты, связанные с квантованием TwinVQ и кодированием. TwinVQ является альтернативным модулем для квантования ААС-типа, это основано на чередующемся векторном квантовании и спектральной оценке LPC (кодирование с линейным предсказанием). Это работает от 6 Кбит/с и рекомендуется к использованию при менее 16 Кбит/с с постоянной скоростью передачи.

В функции декодера входят поиск и описание квантованных спектров звука в полезной нагрузке потока битов, декодирование квантованных значений и другой информации о реконструкции, восстановление квантованных спектров, обработка восстановленных спектров любыми инструментами, которые активны в полезной нагрузке потока битов, чтобы достигнуть фактических сигнальных спектров полезной нагрузкой входного потока битов и преобразовать спектры частотной области во временную область, с дополнительным инструментом регулировки усиления или без него. После начальной реконструкции и масштабирования реконструкции спектра есть множество дополнительных инструментов, которые изменяют один или более спектров, чтобы обеспечить более эффективное кодирование. Для каждого из дополнительных инструментов, которые работают в спектральной области, сохраняется опция "пройти", и во всех случаях, когда спектральная работа опускается, спектры при ее вводе передаются непосредственно через инструмент без модификации.

    1.1.2 Краткий обзор инструментов кодера и декодера

 

Вводом в инструмент демультиплексора полезной нагрузки потока битов является полезная нагрузка потока битов MPEG-4 GA. Демультиплексор разделяет полезную нагрузку потока битов на части для каждого инструмента и обеспечивает каждый из инструментов информацией о полезной нагрузке потока битов, связанного с этим инструментом.

Выводы из инструмента демультиплексора полезной нагрузки потока битов таковы:

- квантованные (и дополнительно бесшумно кодированные) спектры, представленные с помощью информации о разделении и бесшумно кодированных спектров (ААС) или ряда индексов векторов кода (TwinVQ) информации об арифметической модели и бесшумно кодированного спектра (BSAC);

- информация о решении M/S (дополнительная);

- информация о стороне прогнозирующего устройства (дополнительная);

- информация о перцепционной замене шума (PNS) (дополнительная);

- информация об интенсивности управления стерео и информация об управлении связывающего канала (обе дополнительные);

- информация о формировании временного шума (TNS) (дополнительная);

- информация об управлении гребенки фильтров;

- информация о регулировке усиления (дополнительная);

- дополнительная информация, связанная с масштабируемостью скорости передачи (дополнительная).

Инструмент декодирования бесшумности ААС берет информацию из демультиплексора полезной нагрузки потока битов, анализирует эту информацию, декодирует кодированные по Хафману данные и восстанавливает квантованные спектры и масштабные коэффициенты, кодированные по Хафману и DPCM.

Вводы в инструмент декодирования бесшумности таковы:

- информация о разделении для бесшумно кодированных спектров;

- бесшумно кодированные спектры.

Выводы инструмента декодирования бесшумности:

- декодированное целочисленное представление масштабных коэффициентов;

- квантованные значения для спектров.

Инструмент инверсного квантователя принимает квантованные значения для спектров и преобразовывает целочисленные значения в немасштабируемые, восстановленные спектры. Этот квантователь является неоднородным квантователем.

Ввод в инструмент инверсного квантователя - квантованные значения для спектров.

Вывод инструмента инверсного квантователя - немасштабированные, инверсно квантованные спектры.

Инструмент перемасштабирования преобразовывает целочисленное представление масштабных коэффициентов в фактические значения и умножает немасштабированные инверсно квантованные спектры на соответствующие масштабные коэффициенты.

Вводы в инструмент масштабных коэффициентов следующие:

- декодированное целочисленное представление масштабных коэффициентов;

- немасштабированные, инверсно квантованные спектры.

Вывод из инструмента масштабных коэффициентов - масштабированные, инверсно квантованные спектры.

Инструмент M/S преобразовывает пары спектров из Mid/Side в Left/Right под управлением информации о решении M/S, улучшая качество отображения стерео и иногда обеспечивая эффективность кодирования.

Вводы в инструмент M/S такие:

- информация о решении M/S;

- масштабированные, инверсно квантованные спектры, связанные с парами каналов.

Вывод из инструмента M/S - масштабированные, инверсно квантованные спектры, связанные с парами каналов, после декодирования M/S.

Примечание - Масштабированные, инверсно квантованные спектры индивидуально кодированных каналов не обрабатываются блоком M/S, скорее их пропускают прямо через блок без модификации. Если блок M/S не является активным, то все спектры проходят через этот блок неизмененными.


Инструмент прогноза инвертирует процесс прогноза, выполненный в кодере. Этот процесс прогноза заново вводит избыточность, которая была извлечена инструментом прогноза в кодере, под управлением информации о состоянии прогнозирующего устройства. Этот инструмент реализуется как обратное адаптивное прогнозирующее устройство второго порядка.

Вводы в инструмент прогноза следующие:

- информация о состоянии прогнозирующего устройства;

- информация о стороне прогнозирующего устройства;

- масштабируемые, инверсно квантованные спектры

Вывод из инструмента прогноза - масштабируемые, инверсно квантованные спектры, после того, как применяется прогноз.

Примечание - Если прогноз отключается, масштабируемые, инверсно квантованные спектры передают непосредственно через блок без модификации.


Альтернативно предусмотрен адаптивный в прямом направлении инструмент долгосрочного прогноза.

Вводы в инструмент долгосрочного прогноза:

- восстановленный вывод временной области декодера;

- масштабируемые, инверсно квантованные спектры.

Вывод из инструмента долгосрочного прогноза - масштабируемые, инверсно квантованные спектры, после того, как применен прогноз.

Примечание - Если прогноз отключается, масштабируемые, инверсно квантованные спектры передают непосредственно через блок без модификации.


Инструмент замены перцепционного (воспринимаемого) шума (PNS) реализует декодирование шумовой замены в спектре канала, обеспечивая эффективное представление компонентов шумоподобного сигнала.

Вводы в инструмент замены перцепционного шума такие:

- инверсно квантованные спектры;

- управляющая информация замены перцепционного шума.

Вывод из инструмента замены перцепционного шума - инверсно квантованные спектры.

Примечание - Если какая-либо часть этого блока отключается, масштабируемые, инверсно квантованные спектры передаются непосредственно через эту часть без модификации. Если блок замены перцепционного шума неактивен, все спектры передают через этот блок неизмененными.


Инструмент интенсивности стерео реализует декодирование интенсивности стерео на парах спектров.

Вводы в инструмент интенсивности стерео следующие:

- инверсно квантованные спектры;

- управляющая информация интенсивности стерео.

Вывод из инструмента интенсивности стерео - инверсно квантованные спектры после декодирования канала интенсивности.

Примечание - Масштабированные, инверсно квантованные спектры индивидуально кодированных каналов передаются непосредственно через этот инструмент без модификации. Инструмент интенсивности стерео и инструмент M/S располагаются так, чтобы работа M/S и интенсивности стерео была взаимоисключающей на любой данной полосе коэффициента масштабирования и группе одной пары спектров.

Инструмент спаривания для взаимозависимо коммутируемых спаренных каналов добавляет соответствующие данные из зависимо коммутируемых спаренных каналов к спектрам, как назначено управляющей информацией спаривания.