Профессиональное решение
для инженеров-конструкторов и проектировщиков

ГОСТ Р 53556.2-2012

     

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Звуковое вещание цифровое

КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ

Часть 3

(MPEG-4 AUDIO)

Кодирование речевых сигналов с использованием гармонических векторов - HVXC

Sound broadcasting digital. Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels. Part 3 (MPEG-4 audio). Harmonic Vector Excitation Coding



ОКС 33.170

Дата введения 2013-09-01

     

Предисловие

1 РАЗРАБОТАН Санкт-Петербургским филиалом Центрального научно-исследовательского института связи "Ленинградское отделение" (ФГУП ЛО ЦНИИС)

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 480 "Связь"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 20 ноября 2012 г. N 941-ст

4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009* "Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио" (ISO/IEC 14496-3:2009 "Information technology - Coding of audio-visual objects - Part 3: Audio", NEQ)

________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.

5 ВВЕДЕН ВПЕРВЫЕ

6 ПЕРЕИЗДАНИЕ. Июнь 2020 г.


Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

     1 Область применения


Параметрическое речевое кодирование MPEG-4 использует алгоритм гармонического кодирования с векторным возбуждением (HVXC), где используется гармоническое кодирование остаточных сигналов LPC для речевых сегментов и кодирование с векторным возбуждением (VXC) для неречевых сегментов. HVXC позволяет кодировать речевые сигналы на 2,0 Кбит/с и 4,0 Кбит/с масштабируемой схемой, где возможно декодирование потока 2,0 Кбит/с, используя поток битов 2,0 Кбит/с и поток битов 4,0 Кбит/с. HVXC также обеспечивает кодирование потока битов с варьируемой битовой скоростью, где типичная средняя скорость передачи информации в битах составляет приблизительно 1,2-1,7 Кбит/с. Возможно независимое изменение скорости и шага во время декодирования, которое является мощной функциональной возможностью для быстрого поиска в базе данных. Длина фрейма равна 20 мс, и может быть выбрана одна из четырех различных алгоритмических задержек 33,5 мс, 36 мс, 53,5 мс, 56 мс.

Кроме того, как расширение HVXC, тип объекта ER_HVXC предлагает эластичный синтаксис ошибок и режим с переменной скоростью передачи данных на 4,0 Кбит/с.

     2 Термины и определения


Термины и определения в соответствии с ГОСТ Р 53556.0-2009.

     3 Синтаксис потока битов


Естественный Звуковой Объектный HVXC/ER_HVXC передается в одном или двух элементарных потоках: потоке базового уровня и опционном потоке уровня расширения.

Когда инструмент HVXC используется с инструментом защиты от ошибок, таким как инструмент MPEG-4 ЕР, должен использоваться порядок битов, упорядоченных в соответствии с чувствительностью к ошибкам. HVXC с эластичным синтаксисом ошибок и режимом переменной скорости передачи данных на 4,0 Кбит/с, описанным в 3.3 и 3.4, называют ER_HVXC.

Синтаксис потока битов описан в коде pseudo-C.

     3.1 Конфигурация декодера (HvxcSpecificConfig)


Информация о конфигурации декодера для типа объекта HVXC передается в DecoderConfigDescriptor () базового уровня и Elementary Stream опционного уровня расширения.

Требуется следующий HvxcSpecificConfig ():

Тип объекта HVXC обеспечивает немасштабируемые режимы и масштабируемый режим базового уровня 2,0 Кбит/с плюс уровня расширения на 2,0 Кбит/с. В этом масштабируемом режиме конфигурация базового уровня должна быть следующей:

HVXCvarMode = 0

HVXC fixed bit rate

HVXCrateMode = 0

HVXC 2kbps

isBaseLayer = 1

base layer



Таблица 1 - Синтаксис HVXCconfig ()



Таблица 2 - Режим HVXCvarMode

HVXCvarMode

Описание

0

HVXC fixed bit rate

1

HVXC variable bit rate



Таблица 3 - Режим HVXCrateMode

HVXCrateMode

HVXCrate

Описание

0

2000

HVXC 2,0 Кбит/с

1

4000

HVXC 4,0 Кбит/с

2

3700

HVXC 3,7 Кбит/с



Таблица 4 - Константы HVXC

NUM_SUBF1

NUM_SUBF2

2

4

     

     3.2 Фрейм потока битов (alPduPayload)


Динамические данные для типа объекта HVXC передаются как полезная нагрузка AL-PDU в базовом уровне и опционном уровне расширения Elementary Stream.

Базовый уровень HVXC - полезная нагрузка Модуля Доступа.

alPduPayload {

HVXCframe();

}


Уровень расширения HVXC - полезная нагрузка Модуля Доступа.

Чтобы анализировать и декодировать уровень расширения HVXC, требуется информация, декодированная из базового уровня HVXC.

alPduPayload {

HVXCenhaFrame()

}



Таблица 5 - Синтаксис фрейма HVXCframe ()

3.2.1 Фрейм потока битов HVXC


Таблица 6 - Синтаксис HVXCfixframe (rate)


Таблица 7 - Синтаксис HVXCenhaFrame ()



Таблица 8 - Синтаксис idLsp1 ()



Таблица 9 - Синтаксис idLsp2 ()