ГОСТ Р 51061-97
Группа Э50
ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
СИСТЕМЫ НИЗКОСКОРОСТНОЙ ПЕРЕДАЧИ РЕЧИ ПО ЦИФРОВЫМ КАНАЛАМ
Параметры качества речи и методы измерений
Low biterate speech transmission systems.
Speech quality characteristics and their evaluation
ОКС 33.020
ОКСТУ 6609
Дата введения 1998-01-01
Предисловие
1 РАЗРАБОТАН И ВНЕСЕН Министерством связи Российской Федерации
2 ПРИНЯТ И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Госстандарта России от 24 июня 1997 г. N 223
3 ВВЕДЕН ВПЕРВЫЕ
Настоящий стандарт распространяется на системы низкоскоростной передачи речи по цифровым каналам, имеющим выход в телефонную сеть общего пользования, и устанавливает параметры и нормы качества передачи (воспроизведения) речи и методы измерений:
- слоговой разборчивости речи методом артикуляционных испытаний;
- фразовой разборчивости речи при ускоренном по сравнению с нормальным темпе произнесения;
- качества речи испытуемой системы низкоскоростной передачи речи по методу парных сравнений с качеством речи эталонного тракта по контрольным фразам;
- качества речи в реальных условиях работы методом абонентской оценки.
В настоящем стандарте использованы ссылки на следующие стандарты:
ГОСТ 7153-85 Аппараты телефонные общего применения. Общие технические условия
ГОСТ 17187-81 Шумомеры. Общие технические требования и методы испытаний
ГОСТ Р 50840-95 Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости
В настоящем стандарте применяются следующие термины с соответствующими определениями.
Низкоскоростные кодеки - устройства преобразования речевых сигналов в цифровой поток двоичных символов, следующих со скоростью менее 16 кбит/с, входящие в состав систем низкоскоростной передачи речи.
Разборчивость речи - относительное количество правильно принятых элементов речи (звуков, слогов, слов, фраз), выраженное в процентах от общего числа переданных элементов.
Качество речи - параметр, характеризующий субъективную оценку звучания речи в испытуемой системе низкоскоростной передачи речи, выраженную в баллах по пятибалльной шкале или в процентах предпочтения при сравнении с эталонным трактом.
Эталонный тракт - тракт, показатели качества речи которого известны и с которым сравнивают оцениваемую систему низкоскоростной передачи речи.
Нормальный темп речи - произнесение речи со скоростью, при которой средняя длительность контрольной фразы равна 2,4 с.
Ускоренный темп речи - произнесение речи со скоростью, при которой средняя длительность контрольной фразы равна 1,5-1,6 с.
Выход в сеть ТФОП - организация взаимодействия между низкоскоростной цифровой системой и сетью ТФОП, при котором становится возможным установление соединения и передачи речевой информации между пользователем низкоскоростной цифровой системы и абонентом ТФОП.
Узнаваемость голоса говорящего - возможность слушателей отождествлять звучание голоса, принимаемого из телефонного тракта, с конкретным лицом, известным слушателю ранее.
Смысловая разборчивость - показатель степени правильного воспроизведения информационного содержания речи.
Интегральное качество - показатель, характеризующий общее впечатление слушателя от принимаемой речи.
АЧХ - амплитудно-частотная характеристика.
ТФОП - телефонная сеть общего пользования.
ТЧ канал - канал тональной частоты с полосой пропускания 300-3400 Гц.
К низкоскоростным системам относят системы передачи речи, в которых речевой сигнал в цифровой форме передается со скоростью от 16 кбит/с и меньше до 0,6-0,8 кбит/с вместо стандартной скорости цифрового потока 64 или 32 кбит/с. При этом, в зависимости от метода обработки речевого сигнала и скорости цифрового потока, обеспечивается большой диапазон градаций разборчивости и качества переданной речи.
Все методы низкоскоростной передачи речи основаны на параметрическом кодировании, т.е. ее представлении не речевым колебанием, а набором медленно изменяющихся параметров, определяющих понятность речи и в ряде случаев узнаваемость говорящего, требующих для своей передачи меньшей скорости цифрового потока.
При представлении речи параметрическими методами из речевого сигнала, исключается часть имеющейся в нем избыточности, но одновременно происходит и изменение его структуры, приводящее к изменению характера звучания переданной речи. Это изменение обычно тем сильнее, чем меньше скорость передачи представляющего речь цифрового потока. При скорости менее 2 кбит/с речь, как правило, имеет механическое, "роботоподобное" звучание.
Применение низкоскоростных систем передачи речи для массового пользователя в телефонных сетях общего пользования возможно только при условии обеспечения достаточно высокого качества передачи речи, но существующие методы оценки и нормирования качества речи не учитывают специфики обработки речевых сигналов при их низкоскоростной передаче и потому не могут быть положены в основу оценки различных низкоскоростных систем, их сравнения друг с другом и определения возможности их применения на сетях ТФОП.
В настоящем стандарте в выбранных качественных показателях, методиках их оценок и критериях допустимости тех или иных искажений в максимальной степени учитываются особенности обработки речи при ее параметрическом представлении и возникающих при этом искажениях и отклонениях характера звучания. Эти показатели специально ориентированы на фиксацию этих явлений и их взвешенного учета при определении пригодности оцениваемой системы для выхода в сеть ТФОП.
Основным элементом систем низкоскоростной передачи речи являются низкоскоростные кодеки, преобразующие речевой сигнал в низкоскоростные цифровые потоки, передаваемые по цифровым каналам связи.
При условии передачи этих потоков с малыми ошибками (за счет соответствующей энергетики или помехоустойчивого кодирования) единственным источником возможных искажений или изменений звучания передаваемых речевых сигналов являются речевые кодеки и их стык с сетью ТФОП. Поэтому для упрощения испытаний при оценке качества речи, передаваемой в низкоскоростной системе, допускается использовать упрощенный тракт, составленный из двух кодеков, соединенных друг с другом по цифровым потокам, или одного кодека, у которого выходной цифровой поток кодера подается в качестве входного цифрового потока на вход декодера.
В настоящем стандарте для упрощения записи во всех случаях вместо термина "система низкоскоростной передачи речи" используется термин "низкоскоростной кодек" или "кодек".
Настоящий стандарт позволяет оценить пригодность низкоскоростных систем передачи речи для выхода в телефонную сеть общего пользования только по критерию качества звучания передаваемой речи.
Другие параметры речевого сигнала (например, его задержка), также являющиеся определяющими при выходе данной системы в ТФОП, установлены соответствующими нормативными документами Министерства связи РФ и Рекомендациями МСЭ.
В настоящем стандарте нормируют следующие параметры качества речи:
- слоговая разборчивость речи;
- фразовая разборчивость речи;
- качество речи по сравнению с качеством речи эталонного тракта;
- качество речи в реальных условиях работы.
6.1.1 При проведении испытаний должны быть использованы измерительные системы, испытательное оборудование и средства измерений:
- профессиональные магнитофоны;
- телефонный аппарат с динамическим или электретным микрофоном класса 2 по ГОСТ 7153;
- телефонный аппарат с угольным микрофоном класса 3 по ГОСТ 7153;
- шумомер по ГОСТ 17187, класс точности 3;
- искусственная абонентская линия по ГОСТ 7153;
- искусственная соединительная линия по ГОСТ 7153;
- питающий комплект по ГОСТ 7153;
- аттенюатор, позволяющий устанавливать уровень на 40 дБ ниже номинального;
- телефонный тракт с эффективной полосой пропускания 300-3400 Гц в соответствии с рекомендацией Р.48 МККТТ [1].
6.1.2 Измерения должны проводиться в нормальных климатических условиях по ГОСТ 15150.
6.1.3 .Уровень и форма спектра акустического шума в помещении для испытаний должны быть указаны в технических условиях на оцениваемую систему. При отсутствии указаний испытания проводят по ГОСТ 7153.
6.2.1 Полный комплекс испытаний включает в себя:
- измерение слоговой разборчивости речи методом артикуляционных испытаний;
- измерение фразовой разборчивости при нормальном и ускоренном темпах произнесения;
- оценку качества речи методом парных сравнений с качеством эталонного тракта по контрольным фразам;
- абонентскую оценку качества речи.
Полному комплексу испытаний по оценке качества речи подвергают опытные образцы вновь разрабатываемой аппаратуры системы низкоскоростной передачи речи или головные образцы серии.
Примечание - Допускается не оценивать фразовую разборчивость для систем низкоскоростной передачи речи со скоростью цифрового потока более 3 кбит/с.
6.2.2 Упрощенные испытания состоят из оценки качества речи методом парных сравнений с качеством аналогичного типа кодека, прошедшего полный комплекс испытаний по контрольным фразам.
Упрощенным испытаниям подвергают кодеки, головной образец серии которых прошел полный комплекс испытаний.
Примечание - Допускается замена упрощенных испытаний проверкой данного экземпляра кодека при помощи специально разработанных тестовых сигналов, позволяющих установить полную идентичность производимых в кодеке преобразований и электрических параметров преобразованиям и параметрам головного образца, прошедшего комплекс испытаний по 6.2.1.
6.2.3 К выходу в сеть ТФОП допускаются низкоскоростные цифровые сети или системы, обеспечивающие передачу речи с показателями качества по всем параметрам, указанным в разделе 5, не хуже установленных настоящим стандартом нижних границ оценок этих параметров с учетом 6.2.1 и 6.2.2.
6.3.1 Слоговую разборчивость измеряют по методике и таблицам слогов, приведенным в ГОСТ Р 50840.
Классы качества и нормы разборчивости речи в соответствии с ГОСТ Р 50840 приведены в таблице 1.
Таблица 1 - Классы качества и нормы разборчивости речи
Класс качества по разборчивости | Характеристика класса качества | Норма слоговой разборчивости речи для трактов с параметрическим кодированием, % | Норма слоговой разборчивости речи для трактов с кодированием волны речевого сигнала, % |
Высший | Понимание передаваемой речи без малейшего напряжения внимания | >93 | >80 |
I | Понимание передаваемой речи без затруднений | 86-93 | 56-80 |
II | Понимание передаваемой речи с напряжением внимания без переспросов и повторений | 76-85 | 41-55 |
III | Понимание передаваемой речи с некоторым напряжением внимания, редкими переспросами и повторениями | 61-75 | 25-40 |
IV | Понимание передаваемой речи с большим напряжением внимания, частыми переспросами и повторениями | 45-60 | <25 |