Профессиональное решение
для инженеров-конструкторов и проектировщиков

ГОСТ Р 53556.10-2014

     

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Звуковое вещание цифровое

КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ

ЧАСТЬ III (MPEG-4 AUDIO)

Передискретизация аудио

Sound broadcasting digital. Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels. Part III (MPEG-4 audio). Oversampled audio



ОКС 33.170

Дата введения 2015-01-01

Предисловие

1 РАЗРАБОТАН ТК 480 "Связь"

2 ВНЕСЕН Техническим комитетом по стандартизации N 480 "Связь"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 18 апреля 2014 г. N 386-ст

4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009* "Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио" (ISO/IEC 14496-3:2009 "Information technology - Coding of audio-visual objects - Part 3: Audio", NEQ) [1]

________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.

5 ВВЕДЕН ВПЕРВЫЕ

6 ПЕРЕИЗДАНИЕ. Июль 2020 г.


Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

     1 Область применения


Стандарт описывает алгоритм кодирования без потерь MPEG-4 для передискретизированных аудиосигналов.

     2 Термины и определения


В этом стандарте используются следующие термины и определения:

Audio Channel

Поток битов DSD, предназначенный для одного громкоговорителя.

Audio Frame

Фрейм (кадр), содержащий аудиоданные.

Audio Channel Number

Порядковый номер, присвоенный звуковому каналу. Номера звуковых каналов присваиваются непрерывно, начиная с единицы.

Frame

Блок данных, принадлежащий определенному временному коду. Время воспроизведения фрейма составляет 1/75 с.

Reserved

Все поля, маркированные Reserved (Зарезервировано), резервируются для будущей стандартизации. Все поля Reserved должны быть обнулены.

Silence Pattern

Сгенерированная в цифровой форме кодограмма DSD со следующими свойствами:

у всех аудиобайтов одно и то же значение;

каждый аудиобайт должен содержать 4 бита, равные нулю, и 4 бита, равные единице.

Direct Stream Digital

Однобитовое передискретизированное представление аудиосигнала.

Direct Stream Transfer

Метод кодирования без потерь, используемый для сигналов DSD в компакт-диске аудио высшего качества.

Half Probability

Половинная вероятность определяет для каждого звукового канала в аудиофрейме, кодируются ли первые биты DSD арифметически, используя значения Ptable, или используя вероятность, равную 1/2.

Mapping

Отображение определяет для каждого сегмента фильтр прогноза и таблицу вероятности.

Prediction Filter

Фильтр прогноза является трансверсальным фильтром, используемым, чтобы предсказать значение следующего бита DSD. Фильтр прогноза характеризуется порядком прогноза и коэффициентами.

Probability Table

Таблица вероятности содержит вероятность того, что для данного вывода фильтра прогноза значение бита DSD предсказывается ошибочно.

Sampling Frequency

Частота дискретизации сигнала DSD должна быть 64 * 44,1 кГц, 128 * 44,1 кГц или 256 * 44,1 кГц.

Segmentation

Каждый звуковой канал в аудиофрейме может быть разделен на сегменты.

     

     3 Условные обозначения

3.1 Арифметические и битовые операции

a>>b

Сдвиг а вправо на b битов. Новые биты msb устанавливаются в '0'.

a<<b

Сдвиг а влево на b битов. Новые биты Isb устанавливаются в '0'.

a|b

Поразрядное ИЛИ для а и b.

a&b

Поразрядное И для а и b.

min(a, b)

Наименьшее значение из а и b.

max(a, b)

Наибольшее значение из а и b.

mod b

Значение b по модулю.

trunc(a)

Значение а, округленное в меньшую сторону.

|a|

Абсолютное значение а.

a = = b

Оценить, равны ли а и b.

a!=b

Оценить, не равны ли а и b.

a=b

Переменная а устанавливается в значение b.

a++

а = а +1

a- = b

а = а - b

a + = b

а = а + b

3.2 Упорядочивание разрядов

Графическое изображение всех многоразрядных величин является таким, что старший значащий бит (msb) расположен слева, а младший значащий бит (Isb) - справа. Рисунок 1 определяет позицию двоичного разряда в байте.


Рисунок 1 - Упорядочивание бита в байте

3.3 Последовательность разрядов

Во всех местах, где используется последовательность битов, применяется нотация со старшим значащим разрядом на первом месте.

3.4 Десятичная запись

Всем десятичным величинам предшествуют пробел или индикатор диапазона (..), когда включено в диапазон. Старшая значащая цифра находится слева, младшая значащая цифра - справа.

3.5 Порядок битов DSD

Первый выбранный бит DSD сохраняется в старшем значащем бите байта.

3.6 Полярность DSD

Бит DSD, равный единице, означает "плюс". Бит DSD, равный нулю, означает "минус".

3.7 Шестнадцатеричная нотация

Всем шестнадцатеричным значениям предшествует $. Старший значащий полубайт располагается слева, младший значащий полубайт - справа.

3.8 Диапазон

Constant_1.. Constant_2 обозначают диапазон от и включая Constant_1 до и включая Constant_2, с инкрементами 1.

3.9 Until

Until используется в рисунках, чтобы указать, что для позиции байта структуры используются до, но не включая данное значение.

В позиции байта В1 выражение "until В2" определяет байты В2-В1. В позиции байта В1 выражение, "until esc" определяет число байтов от В1 до и включая последний байт текущего сектора. Позиция байта определяется относительно начала текущего или предыдущего сектора.

     4 Основные типы

4.1 BsMsbf

Последовательность битов, старший значащий бит сначала, должна интерпретироваться как строка битов.

4.2 Char

Закодированный однобайтовый символ. NUL (нулевой) символ ($00) не разрешен для Char.

4.3 SiMsbf

Последовательность битов должна интерпретироваться как целое число со знаком.

4.4 UiMsbf

Последовательность битов должна интерпретироваться как целое число без знака.

4.5 Uintn

Закодированный двоичный файл n битов, численное значение без знака.

4.6 Uint8

Двоично закодированное 8-битовое численное значение без знака. Значение Uint8 должно записываться в однобайтовом поле.

4.7 Uint16

Двоично закодированное 16-битовое численное значение без знака. Значение Uint16, представленное шестнадцатеричным представлением $wxyz, должно записываться в двухбайтовом поле как $wx $yz (старший значащий байт сначала).

4.8 Uint32

Двоично закодированное 32-битовое численное значение без знака. Значение Uint32, представленное шестнадцатеричным представлением $stuvwxyz, должно записываться в четырехбайтовом поле как $st $uv $wx $yz (старший значащий байт сначала).

     5 Полезные нагрузки для аудиообъекта

5.1 Конфигурация декодера (DSTSpecificConfig)

Таблица 1 - Синтаксис Audio_Frame ()