(обязательное)
Требования к текстовым данным 3
Тестовые данные формируются на основании голосовых команд, отсутствующих в заданном списке команд управления, и включают пары аудио- и текстовых файлов, содержащие произнесение и текст голосовой команды соответственно. Текст команд должен быть заранее подготовлен для предъявления дикторам. Количество команд должно быть равно количеству аудиофайлов в тестовых данных 1, при этом количество слов в команде должно быть равно количеству слов в соответствующей команде из заданного списка команд управления.
При формировании тестовых данных должны быть учтены следующие требования:
- все голосовые команды должны быть исполнены на одном языке (допускается акцентное произнесение);
- необходимо использовать слова, фонетически близкие к словам из заданного списка команд управления, в равном соотношении со словами, фонетически далекими от слов из заданного списка команд управления. Пример фонетически близких слов: "проход"-"пароход", далеких слов: "проход"-"магазин";
- количество дикторов должно быть равно 20: 10 мужчин и 10 женщин в возрасте от 20 до 50 лет;
- все аудиозаписи должны быть приведены к единому формату [рекомендуемый формат - Windows PCM (*.wav), 16 кГц, 16 бит];
- отношение сигнал/шум должно составлять от 5 до 25 дБ, но не превышать отношение сигнал/шум тестовых данных 1;
- длительность пауз не должна превышать 500 мс.
В речи дикторов могут присутствовать артефакты, описанные в требованиях к тестовым данным 2.