6.17.1 Введение
Функциональность низкой задержки кодирования обеспечивает возможность расширить использование универсального аудиокодирования на низкой скорости передачи приложениям, требующим очень низкой задержки цепочки кодирования/декодирования (например, полнодуплексная (двухсторонняя) связь в реальном времени).
Этот подпункт определяет кодер аудио с низкой задержкой, предоставляющий режим с алгоритмической задержкой не превышающей 20 мс.
Полная алгоритмическая задержка общего аудио кодера определяется следующими факторами:
- длина фрейма.
Для основанной на блоке обработки должно пройти определенное количество времени, чтобы собрать выборки, принадлежащие одному блоку;
- задержка Filterbank:
Использование пары блока фильтров анализа-синтеза вызывает определенной величины задержку;
- предвидение для решения о переключении блока:
Из-за лежащих в основе принципов схемы переключения блока, обнаружение переходных процессов должно использовать определенную степень предвидения, чтобы гарантировать, что все части переходного сигнала покрываются должным образом короткими окнами;
- использование разрядного резервуара.
В то время как разрядный резервуар облегчает использование локально варьируемой скорости передачи, это накладывает дополнительную задержку в зависимости от размера разрядного резервуара относительно средней скорости передачи на блок.
Полная алгоритмическая задержка может быть вычислена как
,
где является частотой дискретизации кодера, является размером фрейма, является задержкой из-за блока фильтров (), соответствует задержке прогноза переключения блока и является задержкой из-за использования разрядного резервуара.
Кодек с низкой задержкой получается из аудио объектного типа ААС LTP, то есть кодер, состоящий из кодека ААС низкого уровня сложности плюс инструменты PNS (перцепционная шумовая замена) и LTP (долгосрочное прогнозирующее устройство).
6.17.2 Описание кодера
Кодер с низкой задержкой определяется следующими модификациями относительно стандартного алгоритма (то есть аудио объектный тип ААС LTP), чтобы достигнуть низкой задержки работы.
6.17.2.1 Размер фрейма/длина окна
Длина аналитического окна уменьшается до 1024 или 960 выборок временного интервала, соответствующих 512 и 480 спектральным значениям, соответственно. Последний выбор позволяет кодеру иметь размер фрейма, который соразмерен с широко используемыми кодеками для разговорных сигналов (20 мс). Соответствующие таблицы полосы масштабного коэффициента даются в 5.4.
6.17.2.2 Переключение блока
Из-за влияния времени предварительного прогноза на полную задержку никакое переключение блока не используется.
6.17.2.3 Форма окна