Статус документа
Статус документа

ГОСТ Р 59879-2021 Эргономика. Проектирование и применение испытаний речевых технологий. Методика определения показателей качества распознавания голосовых команд управления

     Приложение В

     (обязательное)

Требования к текстовым данным 3



Тестовые данные формируются на основании голосовых команд, отсутствующих в заданном списке команд управления, и включают пары аудио- и текстовых файлов, содержащие произнесение и текст голосовой команды соответственно. Текст команд должен быть заранее подготовлен для предъявления дикторам. Количество команд должно быть равно количеству аудиофайлов в тестовых данных 1, при этом количество слов в команде должно быть равно количеству слов в соответствующей команде из заданного списка команд управления.

При формировании тестовых данных должны быть учтены следующие требования:

- все голосовые команды должны быть исполнены на одном языке (допускается акцентное произнесение);

- необходимо использовать слова, фонетически близкие к словам из заданного списка команд управления, в равном соотношении со словами, фонетически далекими от слов из заданного списка команд управления. Пример фонетически близких слов: "проход"-"пароход", далеких слов: "проход"-"магазин";

- количество дикторов должно быть равно 20: 10 мужчин и 10 женщин в возрасте от 20 до 50 лет;

- все аудиозаписи должны быть приведены к единому формату [рекомендуемый формат - Windows PCM (*.wav), 16 кГц, 16 бит];

- отношение сигнал/шум должно составлять от 5 до 25 дБ, но не превышать отношение сигнал/шум тестовых данных 1;

- длительность пауз не должна превышать 500 мс.

В речи дикторов могут присутствовать артефакты, описанные в требованиях к тестовым данным 2.