Статус документа
Статус документа

ГОСТ Р 53556.8-2013 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 AUDIO). Параметрическое кодирование высококачественных звуковых сигналов (SSC) (Переиздание)

Приложение В
(справочное)

     
Темп и подача, масштабируемые в декодере


Темп, масштабирующий аудиосигнал, необходим, чтобы изменить (мгновенную) продолжительность сигнала, сохраняя воспринятую подачу. Как правило, в темпе декодера масштабирование обрабатывается для каждого объекта отдельно:

Переходные процессы; масштабирование темпа обычно не применяется к переходному объекту. Перцепционно переходные процессы характеризуются временами атаки и временами затухания. Намного более естественный результат получается, когда продолжительность переходного процесса сохраняется.

Синусоиды; для синусоидального объектного темпа масштабирование может быть получено, применяя два изменения в декодере. Прежде всего длина окна синтеза должна быть изменена согласно масштабному коэффициенту времени, гарантирующему, что унитарное перекрытие добавляется. Во-вторых, новое фазовое значение получается для продолжений, применяя непрерывную фазовую функцию.

Шум; в пределах объекта шума темп может масштабироваться, масштабируя оба окна синтеза.

Стерео: масштабирование темпа делается, изменяя позицию параметра согласно масштабному коэффициенту времени.

Поскольку подача главным образом определяется синусоидальными частотами, один подход должен масштабировать только частоты синусоид с масштабным коэффициентом подачи .

В.1 Непрерывная фаза

Так как фазовые значения зависят от размера подкадра , в случае темпа и масштабирования подачи декодер переключается на непрерывную фазу. Темп и масштабирующая подачу процедура для синусоидальных компонентов делаются следующим образом. Во-первых, исходная частота и фаза получаются процессом декодирования. В случае phase_jitter_present устанавливается в %1, полученная частота повторно квантуется, приводя к уровню представления . Уровень представления частоты становится и деквантуется. Эта частота умножается на масштабный коэффициент подачи и используется в непрерывном фазовом вычислении.

Непрерывная фаза вычисляется так, что фаза двух последовательных сегментов перекрывается в середине области.

Фазовая информация и определяется в течение середины сегмента . Где и представляют частоту в радианах.

Фаза продолжающегося синусоидального компонента в первом подкадре фрейма с refresh_sinusoids = = %1 не устанавливается в значение, считанное из потока (s_phi), а вычисляется из выражения для . Если процесс декодирования запускается в этом подкадре, наугад от отмеченного подкадра, фаза продолжающегося синусоидального компонента должна быть установлена в значение, считанное из потока.

В.2 Темп, масштабирующийся для стерео

Темп, масштабирующийся для параметрического инструмента стерео, может быть достигнут, адаптируя позицию параметров. - масштабный коэффициент темпа. Считываются предыдущее и текущее масштабируемыми позициями параметры и соответственно. Перемещая эти позиции в целочисленные позиции, декодирование стерео может быть выполнено как обычно. Метод, для отображения позиции параметра нецелого числа и к целочисленным позициям и дается, используя следующую рекурсию

,

где является предыдущей целочисленной позицией.

Затем текущая целочисленная позиция параметра вычисляется следующим образом:

.

Чтобы инициировать рекурсию 0.