ГОСТ Р 53556.2-2012
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Звуковое вещание цифровое
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ
Часть 3
(MPEG-4 AUDIO)
Кодирование речевых сигналов с использованием гармонических векторов - HVXC
Sound broadcasting digital. Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels. Part 3 (MPEG-4 audio). Harmonic Vector Excitation Coding
ОКС 33.170
Дата введения 2013-09-01
1 РАЗРАБОТАН Санкт-Петербургским филиалом Центрального научно-исследовательского института связи "Ленинградское отделение" (ФГУП ЛО ЦНИИС)
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 480 "Связь"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 20 ноября 2012 г. N 941-ст
4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009* "Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио" (ISO/IEC 14496-3:2009 "Information technology - Coding of audio-visual objects - Part 3: Audio", NEQ)
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.
5 ВВЕДЕН ВПЕРВЫЕ
6 ПЕРЕИЗДАНИЕ. Июнь 2020 г.
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
Параметрическое речевое кодирование MPEG-4 использует алгоритм гармонического кодирования с векторным возбуждением (HVXC), где используется гармоническое кодирование остаточных сигналов LPC для речевых сегментов и кодирование с векторным возбуждением (VXC) для неречевых сегментов. HVXC позволяет кодировать речевые сигналы на 2,0 Кбит/с и 4,0 Кбит/с масштабируемой схемой, где возможно декодирование потока 2,0 Кбит/с, используя поток битов 2,0 Кбит/с и поток битов 4,0 Кбит/с. HVXC также обеспечивает кодирование потока битов с варьируемой битовой скоростью, где типичная средняя скорость передачи информации в битах составляет приблизительно 1,2-1,7 Кбит/с. Возможно независимое изменение скорости и шага во время декодирования, которое является мощной функциональной возможностью для быстрого поиска в базе данных. Длина фрейма равна 20 мс, и может быть выбрана одна из четырех различных алгоритмических задержек 33,5 мс, 36 мс, 53,5 мс, 56 мс.
Кроме того, как расширение HVXC, тип объекта ER_HVXC предлагает эластичный синтаксис ошибок и режим с переменной скоростью передачи данных на 4,0 Кбит/с.
Термины и определения в соответствии с ГОСТ Р 53556.0-2009.
Естественный Звуковой Объектный HVXC/ER_HVXC передается в одном или двух элементарных потоках: потоке базового уровня и опционном потоке уровня расширения.
Когда инструмент HVXC используется с инструментом защиты от ошибок, таким как инструмент MPEG-4 ЕР, должен использоваться порядок битов, упорядоченных в соответствии с чувствительностью к ошибкам. HVXC с эластичным синтаксисом ошибок и режимом переменной скорости передачи данных на 4,0 Кбит/с, описанным в 3.3 и 3.4, называют ER_HVXC.
Синтаксис потока битов описан в коде pseudo-C.
Информация о конфигурации декодера для типа объекта HVXC передается в DecoderConfigDescriptor () базового уровня и Elementary Stream опционного уровня расширения.
Требуется следующий HvxcSpecificConfig ():
Тип объекта HVXC обеспечивает немасштабируемые режимы и масштабируемый режим базового уровня 2,0 Кбит/с плюс уровня расширения на 2,0 Кбит/с. В этом масштабируемом режиме конфигурация базового уровня должна быть следующей:
HVXCvarMode = 0 | HVXC fixed bit rate |
HVXCrateMode = 0 | HVXC 2kbps |
isBaseLayer = 1 | base layer |
Таблица 1 - Синтаксис HVXCconfig ()
Таблица 2 - Режим HVXCvarMode
HVXCvarMode | Описание |
0 | HVXC fixed bit rate |
1 | HVXC variable bit rate |
Таблица 3 - Режим HVXCrateMode
HVXCrateMode | HVXCrate | Описание |
0 | 2000 | HVXC 2,0 Кбит/с |
1 | 4000 | HVXC 4,0 Кбит/с |
2 | 3700 | HVXC 3,7 Кбит/с |
Таблица 4 - Константы HVXC
NUM_SUBF1 | NUM_SUBF2 |
2 | 4 |
Динамические данные для типа объекта HVXC передаются как полезная нагрузка AL-PDU в базовом уровне и опционном уровне расширения Elementary Stream.
Базовый уровень HVXC - полезная нагрузка Модуля Доступа.
alPduPayload { | ||
HVXCframe(); | ||
} |
Уровень расширения HVXC - полезная нагрузка Модуля Доступа.
Чтобы анализировать и декодировать уровень расширения HVXC, требуется информация, декодированная из базового уровня HVXC.
alPduPayload { | ||
HVXCenhaFrame() | ||
} |
Таблица 5 - Синтаксис фрейма HVXCframe ()
3.2.1 Фрейм потока битов HVXC
Таблица 6 - Синтаксис HVXCfixframe (rate)
Таблица 7 - Синтаксис HVXCenhaFrame ()
Таблица 8 - Синтаксис idLsp1 ()
Таблица 9 - Синтаксис idLsp2 ()