Статус документа
Статус документа

ГОСТ Р 52873-2021 Комплексы электронно-цифровые интерактивные, рассчитанные на использование людьми с инвалидностью и другими ограничениями жизнедеятельности. Системы вывода текстовой информации в форме синтезированной речи. Технические требования

Введение


По важности и объему воспринимаемой информации слух является второй, после зрения, системой восприятия человека, а в случае невозможности по тем или иным причинам воспользоваться зрением, роль слуха и звуковой информации резко возрастает и при взаимодействии между людьми, и при взаимодействии человека с информационными системами.

Все более широкое распространение получают электронно-цифровые интерактивные комплексы, предоставляющие информацию пользователю в виде синтезированной речи. Примерами таких комплексов являются специальное рабочее место для инвалида по зрению (ГОСТ Р 51645); персональный компьютер, смартфон или иное мобильное устройство, оснащенное программой экранного доступа и используемое людьми с нарушениями зрения в повседневной жизни; банковский терминал, оснащенный, помимо дисплея, еще и возможностью подключить аудиовоспроизводящее устройство для прослушивания информации о выполняемой транзакции; любой персональный компьютер или аналогичное по своим возможностям устройство, на котором установлены игровые, обучающие, информационные, навигационные и прочие приложения, использующие синтезированную речь для взаимодействия с пользователем; портативные и стационарные медицинские диагностические приборы с возможностью речевого вывода и многое другое.

Для целей настоящего стандарта все многообразие подобных аппаратно-программных комплексов было сведено к одной обобщенной схеме, в которую вошли аппаратно-техническая платформа, включающая все необходимые компоненты для функционирования операционной среды и прикладных программ; операционная среда (или операционная система), которая может содержать, а может и не содержать вспомогательные программные интерфейсы для поддержки синтеза речи по тексту; прикладное программное обеспечение, использующее синтез речи для взаимодействия с пользователем; система вывода текстовой информации в форме синтезированной речи или (для целей настоящего стандарта) система речевого вывода, которая предоставляет соответствующий прикладной программный интерфейс для создания синтезированной речи и вывода ее через аудиовоспроизводящее устройство, поддерживаемое аппаратно-технической платформой.

Систему речевого вывода, обозначенную в данной схеме, в свою очередь, также можно представить в виде набора взаимосвязанных функциональных модулей, одним из которых является синтезатор речи (иногда называемый "речевым движком"). Несмотря на ключевое значение синтезатора речи во всей системе речевого вывода, в настоящем стандарте особого внимания именно синтезатору речи не уделяется. Система речевого вывода рассматривается как единое целое, предоставляющее пользователю возможность получать текстовую информацию в виде звучащей синтезированной речи, параметры которой должны соответствовать настоящему стандарту. Внутренняя архитектура системы вывода текстовой информации в форме синтезированной речи, состав и структура ее модулей, принципы функционирования и методы, используемые для анализа входных текстовых данных, для синтеза звуковых данных и тому подобное, оставлено на усмотрение разработчика. Кроме того, разнообразие современных операционных платформ и их возможностей в части поддержки систем синтеза речи по тексту не позволяет ориентироваться лишь на одну из них.

Именно такой интегрированный подход и обеспечил ключевую роль понятия "система речевого вывода" вместо понятия "синтезатор речи" в настоящем стандарте.

Несмотря на то, что настоящий стандарт в первую очередь ориентирован на специально оборудованное компьютерное рабочее место, используемое людьми с инвалидностью по зрению, в том числе и как средство реабилитации, область его применения охватывает также любое прикладное программное обеспечение, взаимодействующее с пользователем с помощью системы вывода текстовой информации в форме синтезированной речи, причем речевой вывод может сочетаться с визуальным, тактильным и т.п. Примерами такого программного обеспечения могут служить программы экранного доступа, используемые людьми с нарушениями зрения на рабочем месте, в бытовых условиях и иных местах пребывания; игровые, обучающие, информационные, навигационные и прочие программы для широкого круга пользователей.

Любое торговое наименование, использованное в настоящем стандарте, является информацией, приводимой для удобства пользователей, и не является свидетельством в пользу того или иного товара.

Стандарт разработан авторским коллективом в следующем составе: юриста, сертифицированного тренера и консультанта по адаптивным информационным технологиям А.В.Зеленова, сооснователя и администратора Портала Tiflocomp (www.tiflocomp.ru), разработчика адаптивных решений А.Н.Камынина, начальника отдела социокультурных проектов и программ ГМКЦ "Интеграция" им.Н.А.Островского, представителя Российской Федерации в глобальной инициативе за инклюзивные ИКТ (G3ICT/Smart cities for all) А.Д.Попко.