Метод оценки разборчивости речевой связи
F.1 Общие сведения
Качество канала передачи речи может быть определено с помощью субъективных испытаний (с участием говорящих и слушателей) или с помощью объективных методов (на основе физических свойств путей передачи сигнала и физического описания процесса разговора и прослушивания).
F.2 Субъективные методы испытаний
Для оценки систем речевой связи разработаны субъективные испытания на оценку разборчивости речи (см. [2], [3], [5], [6], [8], [9], [10]).
Субъективные испытания на оценку разборчивости речи могут быть разделены по категориям на основе текстового материала и процедуры оценки, используемой в испытаниях. Наименьшая единица речи при испытаниях (например, фонема) должна представлять собой сегмент (например, фонемы). Другими единицами являются сочетания СГ (согласная-гласная), ГС (гласная-согласная) и СГС (согласная-гласная-согласная), бессмысленные слова, смысловые слова, предложения и короткие разговоры (см. приложение В).
Испытания могут иметь процедуру с открытым или закрытым множеством ответов. Если используют закрытое множество ответов, то слушатель должен выбрать наиболее вероятный вариант из нескольких представленных альтернатив. Обычно такую процедуру используют в испытаниях речевых рифм (например, в МИР, Модифицированное испытание рифм [6]). При открытом множестве ответов слушатель может свободно давать ответы.
Помимо разборчивости с помощью анкет или методов шкалирования могут быть определены качество речи и голосовое усилие. Качество речи с субъективной точки зрения включает в себя общее впечатление слушателя, естественность речи, четкость, и т.д. Субъективную оценку качества речи обычно проводят для каналов связи с высокой разборчивостью речи, для которых невозможно использовать большинство других испытаний из-за "эффекта (измерительного) потолка".
F.3 Объективные методы испытаний
Объективные оценки разборчивости, как правило, основаны на важных физических свойствах пути передачи информации от говорящего к слушателям. При выявлении ухудшения качества может быть выполнено прогнозирование разборчивости речи. Объективная оценка учитывает аспекты разговора и прослушивания, такие как эффект Ломбарда, голосовое усилие, наличие маскирования, порог восприятия, наличие средств защиты слуха (учитывается при измерении индексов передачи и разборчивости речи, и частично уровня помех для речи и др.). Кроме того, при измерении индекса передачи речи учитывают временные искажения (реверберация, эхо, автоматическая регулировка усиления) и нелинейные искажения.
Прямое объективное измерение с применением установленных контрольных сигналов возможно при использовании метода измерения индекса передачи речи, который позволяет определить важные физические свойства канала передачи (функции передачи модуляции, нелинейные искажения). Алгоритм объективных измерений и прогнозирования одинаков, но влияние нелинейных искажений можно измерить только в фактических условиях эксплуатации.
Для любого спектра шума погрешность индекса передачи речи и индекса разборчивости речи должна составлять от 1 до 2 дБ. Оценка уровня помех для речи должна иметь погрешность от 2 до 3 дБ. При оценке уровня помех для речи может появляться систематическая погрешность, особенно для шумовых сигналов с прерывистым частотным спектром.
F.4 Связь между различными оценками разборчивости речи
Связь между оценкой разборчивости речи, а также субъективными и объективными оценками индексов передачи и разборчивости речи, приведена в таблице F.1. На рисунке F.1 показан эффективный диапазон для каждого метода испытаний.
- несмысловые слова имеют немного больший диапазон, чем смысловые контрольные слова (см. [2]). Предложения (а также связанные с ними цифры и символы) можно использовать для оценки "недостаточных" уровней разборчивости речи, но такой речевой материал нельзя использовать для оценки более хороших условий. Такой "эффект потолка" может возникать вследствие:
a) обилия слов в предложении;
b) ограниченного числа контрольных слов для цифр и символов;
c) условий, в которых правильное распознавание слов главным образом зависит от распознавания гласных.
________________
РС (равно-сбалансированное распределение фонем) часто используют для составления списков слов. Преимуществом является определение с равной точностью частоты ошибок для каждой фонемы и получение сбалансированной несмысловой матрицы неточностей.
Смысловые контрольные слова являются фонетически сбалансированными, поэтому распределение фонем является типичным для используемого языка. Обычно оценка разборчивости у таких слов выше, чем у несмысловых слов, из-за того что знакомые слова легче распознать.
Оценки и баллы разборчивости получены для слушателей с нормальным слухом. Влияние голосового усилия говорящего, наличия у него акцента и использования неродного языка (см. приложение A) также может быть учтено. Однако патологические дефекты и нарушения речи говорящего учесть невозможно.
Таблица F.1 - Оценка разборчивости речи и соотношение между различными индексами разборчивости речи
Оценка разборчивости речи | Баллы предло- | Баллы смыс- | Баллы несмысловых слов, % | Индекс передачи речи | Уровень помех для речи, дБ | Индекс разбор- |
Отлично | 100 | >98 | >81 | >0,75 | 21 | - |
Хорошо | 100 | 93-98 | 70-81 | 0,60-0,75 | 15-21 | >0,75 |
Удовлетворительно | 100 | 80-93 | 53-70 | 0,45-0,60 | 10-15 | - |
Недостаточно | 70-100 | 60-80 | 31-53 | 0,30-0,45 | 3-10 | >0,45 |
Плохо | <70 | <60 | <31 | <0,30 | <3 | - |
Классификация по пятибалльной шкале, см. [7], [8], [14]. Баллы для простых предложений [10], баллы для несмысловых слов с равно-сбалансированным распределением фонем [12], [13] и для ФС-слов (из фонетически сбалансированного Гарвардского списка) [2]. Согласно [2]. Индекс передачи речи (приложение E) и индекс разборчивости речи (приложение C) определяют только при наличии шума. Процедура оценки индекса разборчивости речи не позволяет определить интервалы классификации. Стандарт ANSI [1] позволяет определить только две оценки: хорошо >0,75 и недостаточно <0,45. |