ГОСТ Р 53556.10-2014
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Звуковое вещание цифровое
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ
ЧАСТЬ III (MPEG-4 AUDIO)
Передискретизация аудио
Sound broadcasting digital. Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels. Part III (MPEG-4 audio). Oversampled audio
ОКС 33.170
Дата введения 2015-01-01
1 РАЗРАБОТАН ТК 480 "Связь"
2 ВНЕСЕН Техническим комитетом по стандартизации N 480 "Связь"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 18 апреля 2014 г. N 386-ст
4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009* "Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио" (ISO/IEC 14496-3:2009 "Information technology - Coding of audio-visual objects - Part 3: Audio", NEQ) [1]
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.
5 ВВЕДЕН ВПЕРВЫЕ
6 ПЕРЕИЗДАНИЕ. Июль 2020 г.
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
Стандарт описывает алгоритм кодирования без потерь MPEG-4 для передискретизированных аудиосигналов.
В этом стандарте используются следующие термины и определения:
Audio Channel | Поток битов DSD, предназначенный для одного громкоговорителя. |
Audio Frame | Фрейм (кадр), содержащий аудиоданные. |
Audio Channel Number | Порядковый номер, присвоенный звуковому каналу. Номера звуковых каналов присваиваются непрерывно, начиная с единицы. |
Frame | Блок данных, принадлежащий определенному временному коду. Время воспроизведения фрейма составляет 1/75 с. |
Reserved | Все поля, маркированные Reserved (Зарезервировано), резервируются для будущей стандартизации. Все поля Reserved должны быть обнулены. |
Silence Pattern | Сгенерированная в цифровой форме кодограмма DSD со следующими свойствами: у всех аудиобайтов одно и то же значение; каждый аудиобайт должен содержать 4 бита, равные нулю, и 4 бита, равные единице. |
Direct Stream Digital | Однобитовое передискретизированное представление аудиосигнала. |
Direct Stream Transfer | Метод кодирования без потерь, используемый для сигналов DSD в компакт-диске аудио высшего качества. |
Half Probability | Половинная вероятность определяет для каждого звукового канала в аудиофрейме, кодируются ли первые биты DSD арифметически, используя значения Ptable, или используя вероятность, равную 1/2. |
Mapping | Отображение определяет для каждого сегмента фильтр прогноза и таблицу вероятности. |
Prediction Filter | Фильтр прогноза является трансверсальным фильтром, используемым, чтобы предсказать значение следующего бита DSD. Фильтр прогноза характеризуется порядком прогноза и коэффициентами. |
Probability Table | Таблица вероятности содержит вероятность того, что для данного вывода фильтра прогноза значение бита DSD предсказывается ошибочно. |
Sampling Frequency | Частота дискретизации сигнала DSD должна быть 64 * 44,1 кГц, 128 * 44,1 кГц или 256 * 44,1 кГц. |
Segmentation | Каждый звуковой канал в аудиофрейме может быть разделен на сегменты. |
3.1 Арифметические и битовые операции
a>>b | Сдвиг а вправо на b битов. Новые биты msb устанавливаются в '0'. |
a<<b | Сдвиг а влево на b битов. Новые биты Isb устанавливаются в '0'. |
a|b | Поразрядное ИЛИ для а и b. |
a&b | Поразрядное И для а и b. |
min(a, b) | Наименьшее значение из а и b. |
max(a, b) | Наибольшее значение из а и b. |
mod b | Значение b по модулю. |
trunc(a) | Значение а, округленное в меньшую сторону. |
|a| | Абсолютное значение а. |
a = = b | Оценить, равны ли а и b. |
a!=b | Оценить, не равны ли а и b. |
a=b | Переменная а устанавливается в значение b. |
a++ | а = а +1 |
a- = b | а = а - b |
a + = b | а = а + b |
3.2 Упорядочивание разрядов
Графическое изображение всех многоразрядных величин является таким, что старший значащий бит (msb) расположен слева, а младший значащий бит (Isb) - справа. Рисунок 1 определяет позицию двоичного разряда в байте.
Рисунок 1 - Упорядочивание бита в байте
3.3 Последовательность разрядов
Во всех местах, где используется последовательность битов, применяется нотация со старшим значащим разрядом на первом месте.
3.4 Десятичная запись
Всем десятичным величинам предшествуют пробел или индикатор диапазона (..), когда включено в диапазон. Старшая значащая цифра находится слева, младшая значащая цифра - справа.
3.5 Порядок битов DSD
Первый выбранный бит DSD сохраняется в старшем значащем бите байта.
3.6 Полярность DSD
Бит DSD, равный единице, означает "плюс". Бит DSD, равный нулю, означает "минус".
3.7 Шестнадцатеричная нотация
Всем шестнадцатеричным значениям предшествует $. Старший значащий полубайт располагается слева, младший значащий полубайт - справа.
3.8 Диапазон
Constant_1.. Constant_2 обозначают диапазон от и включая Constant_1 до и включая Constant_2, с инкрементами 1.
3.9 Until
Until используется в рисунках, чтобы указать, что для позиции байта структуры используются до, но не включая данное значение.
В позиции байта В1 выражение "until В2" определяет байты В2-В1. В позиции байта В1 выражение, "until esc" определяет число байтов от В1 до и включая последний байт текущего сектора. Позиция байта определяется относительно начала текущего или предыдущего сектора.
4.1 BsMsbf
Последовательность битов, старший значащий бит сначала, должна интерпретироваться как строка битов.
4.2 Char
Закодированный однобайтовый символ. NUL (нулевой) символ ($00) не разрешен для Char.
4.3 SiMsbf
Последовательность битов должна интерпретироваться как целое число со знаком.
4.4 UiMsbf
Последовательность битов должна интерпретироваться как целое число без знака.
4.5 Uintn
Закодированный двоичный файл n битов, численное значение без знака.
4.6 Uint8
Двоично закодированное 8-битовое численное значение без знака. Значение Uint8 должно записываться в однобайтовом поле.
4.7 Uint16
Двоично закодированное 16-битовое численное значение без знака. Значение Uint16, представленное шестнадцатеричным представлением $wxyz, должно записываться в двухбайтовом поле как $wx $yz (старший значащий байт сначала).
4.8 Uint32
Двоично закодированное 32-битовое численное значение без знака. Значение Uint32, представленное шестнадцатеричным представлением $stuvwxyz, должно записываться в четырехбайтовом поле как $st $uv $wx $yz (старший значащий байт сначала).
5.1 Конфигурация декодера (DSTSpecificConfig)
Таблица 1 - Синтаксис Audio_Frame ()