Статус документа
Статус документа

ГОСТ Р 54712-2011 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи MPEG-2 часть III (MPEG-2 audio) (Переиздание)

          

Приложение Д
(обязательное)

     

Использование дополнительных данных

Д.1 Введение

Множество существующих приложений MPEG audio, включая международные стандарты (например [4] и [5]), определило форматы вспомогательного поля данных в соответствии с определенными требованиями этих приложений. В данном приложении даются некоторые примеры, которые могли бы представлять интерес для будущих приложений.

Каждый фрейм настоящего стандарта может содержать некоторое количество дополнительных байт данных. Эти данные могут быть размещены в двух отдельных полях фрейма кодированных данных. Одно поле располагается в конце основного фрейма для совместимости с определением дополнительных данных ГОСТ Р 54711, другое поле располагается в конце фрейма расширения.

Наиболее популярные из дополнительных данных - данные о программе (Programme Associated Data - PAD), тесно связанные с аудиосигналом.

Д.2 Типичные данные о программе

- Типичные примеры использования данных о программе:

- индикация типа звукового контента (музыки или речи);

- текстовая информация, имеющая отношение к программе (ITTS);

- универсальный код изделия/европейский номер изделия (UPC/EAN);

- специальные синхронные команды для ресивера/декодера;

- информация для управления динамическим диапазоном (DRC).

Сигнал DRC может дополнительно применяться в ресивере для сжатия динамического диапазона звукового сигнала. Указанные данные могут быть востребованы при отсутствии задержки в передаче данных.

Все функции, предоставляемые PAD, и длина полей PAD определяются пользователем. Поэтому любая информация может быть размещена в поле PAD.

Д.3 Управление динамическим диапазоном

Продолжительные исследования показали, что в условиях, далеких от идеальных, прослушивание звуковых программ не требует полного динамического диапазона, обеспечиваемого цифровым аудио. Методы передачи данных в кодированном потоке битов с целью сократить динамический диапазон аудио были определены в ГОСТ Р 54711, Уровень II для использования в цифровом радиовещании DAB [4].

При помощи управления динамическим диапазоном (DRC) ресивер может уменьшить динамический диапазон звукового сигнала. Цель этого состоит в том, чтобы адаптировать динамический диапазон звукового сигнала к прослушиванию в шумной среде или к прослушиванию программ, обладающих большим динамическим диапазоном (звуковые дорожки фильмов) для домашнего прослушивания. Декодеры настоящего стандарта дополнительно позволяют обеспечить сжатие динамического диапазона путем получения управляющей информации непосредственно из самого аудиосигнала или из подходящего сигнала DRC, переданного во вспомогательном поле данных. Передача сигнала DRC является опцией провайдера программы и не является требованием системы.

В спецификации DAB часть дополнительных данных, передаваемых вместе с аудио (F-PAD), кроме всего прочего, может содержать поле данных DRC размером шесть битов, которое должно использоваться для изменения усиления воспроизводимого аудиосигнала. В текущих вариантах [4], когда передается управление динамическим диапазоном, шесть битов соответствуют усилению, которое будет применено к восстановленному звуковому сигналу в диапазоне 0-15,75 дБ с шагом 0,25 дБ. Размер шага 0,25 дБ, как показали эксперименты, был наиболее приемлем с точки зрения обеспечения плавного регулирования усиления во время медленных изменений усиления в классической музыке. Верхний предел усиления 15,75 дБ позволяет достичь подходящего сокращения динамического диапазона для не очень сложных условий прослушивания. Если требуется дальнейшее сокращение динамического диапазона из-за чрезвычайно неблагоприятных условий, сообщенные значения могут масштабироваться при незаметном увеличении размера шага. Информация для управления динамическим диапазоном передается при помощи шести битов один раз в 24 мс. Это соответствует скорости передачи 250 бит/с (без учета данных, необходимых для сигнализации использования DRC).

Д.4 Индикация музыки/речи

Эти два флага указывают, состоит ли переданный звук из музыки или речи. Ресивер может использовать эту информацию для управления любой схемой звуковой обработки. Определенная комбинация флагов сигнализирует об отсутствии индикации. Индикация музыки/речи обычно требует двух битов, повторяемых приблизительно 10 раз в секунду.

Д.5 Команды для ресивера/декодера

Отдельный канал может быть выделен для передачи специальных команд для ресивера/декодера синхронно с аудиосигналом. Такие команды используются, например, для инициирования асинхронного чтения изображения из буфера, который был заполнен ранее. Такой канал в состоянии переносить несколько байт в течение 0,2-0,5 секунд, через неравные интервалы.

Д.6 Текст, связанный с программой

Для передачи текстовых данных о песне, элементе программы, кодированный текст может быть передан вместе с аудиоинформацией. Этот текст может быть сгенерирован локальным провайдером программы, считан с помощью цифрового программного обеспечения и передан более или менее прозрачно, кроме того, при этом могут быть объединены различные источники. Емкость канала, требуемая для передачи текста, зависит от емкости услуги.

Д.7 Внутренняя информация

Каналы могут быть выделены как для коротких синхронных команд, так и для длинных строк асинхронных данных. Эти команды предназначены для внутреннего пользования только в пределах определенного приложения.