Статус документа
Статус документа

ГОСТ Р 53556.4-2013 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 AUDIO). Основные методы кодирования звуковых сигналов (GA): усовершенствованное звуковое кодирование (AAC), взвешивающее векторное квантование (TwinVQ), побитовое арифметическое кодирование (BSAC)

    6.17 Кодек с низкой задержкой

     

6.17.1 Введение


Функциональность низкой задержки кодирования обеспечивает возможность расширить использование универсального аудиокодирования на низкой скорости передачи приложениям, требующим очень низкой задержки цепочки кодирования/декодирования (например, полнодуплексная (двухсторонняя) связь в реальном времени).

Этот подпункт определяет кодер аудио с низкой задержкой, предоставляющий режим с алгоритмической задержкой не превышающей 20 мс.

Полная алгоритмическая задержка общего аудио кодера определяется следующими факторами:

- длина фрейма.

Для основанной на блоке обработки должно пройти определенное количество времени, чтобы собрать выборки, принадлежащие одному блоку;

- задержка Filterbank:

Использование пары блока фильтров анализа-синтеза вызывает определенной величины задержку;

- предвидение для решения о переключении блока:

Из-за лежащих в основе принципов схемы переключения блока, обнаружение переходных процессов должно использовать определенную степень предвидения, чтобы гарантировать, что все части переходного сигнала покрываются должным образом короткими окнами;

- использование разрядного резервуара.

В то время как разрядный резервуар облегчает использование локально варьируемой скорости передачи, это накладывает дополнительную задержку в зависимости от размера разрядного резервуара относительно средней скорости передачи на блок.

Полная алгоритмическая задержка может быть вычислена как

,


где является частотой дискретизации кодера, является размером фрейма, является задержкой из-за блока фильтров (), соответствует задержке прогноза переключения блока и является задержкой из-за использования разрядного резервуара.

Кодек с низкой задержкой получается из аудио объектного типа ААС LTP, то есть кодер, состоящий из кодека ААС низкого уровня сложности плюс инструменты PNS (перцепционная шумовая замена) и LTP (долгосрочное прогнозирующее устройство).

6.17.2 Описание кодера

Кодер с низкой задержкой определяется следующими модификациями относительно стандартного алгоритма (то есть аудио объектный тип ААС LTP), чтобы достигнуть низкой задержки работы.

6.17.2.1 Размер фрейма/длина окна


Длина аналитического окна уменьшается до 1024 или 960 выборок временного интервала, соответствующих 512 и 480 спектральным значениям, соответственно. Последний выбор позволяет кодеру иметь размер фрейма, который соразмерен с широко используемыми кодеками для разговорных сигналов (20 мс). Соответствующие таблицы полосы масштабного коэффициента даются в 5.4.

6.17.2.2 Переключение блока


Из-за влияния времени предварительного прогноза на полную задержку никакое переключение блока не используется.

6.17.2.3 Форма окна