Статус документа
Статус документа

ГОСТ Р 59897-2021

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

ДАННЫЕ ДЛЯ СИСТЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ОБРАЗОВАНИИ

Требования к сбору, хранению, обработке, передаче и защите данных

Data for artificial intelligence systems in education. Requirements for the collection, storage, processing, transmission and protection of data



ОКС 35.240.90

Дата введения 2022-03-01

Предисловие

     

1 РАЗРАБОТАН Федеральным государственным автономным образовательным учреждением высшего образования "Национальный исследовательский университет "Высшая школа экономики" (НИУ ВШЭ)

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 164 "Искусственный интеллект"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 26 ноября 2021 г. N 1619-ст

4 ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)

     1 Область применения

Настоящий стандарт устанавливает требования к процессам сбора, хранения, обработки, передачи и защиты данных, используемых в образовательных программно-технических системах с алгоритмами искусственного интеллекта.

     2 Нормативные ссылки

В настоящем стандарте использована ссылка на следующий стандарт:

ГОСТ Р ИСО 8000-2 Качество данных. Часть 2. Словарь

Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты" за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку

     3 Термины и определения

В настоящем стандарте применены термины по ГОСТ Р ИСО 8000-2, а также следующие термины с соответствующими определениями:

3.1 образовательный продукт с алгоритмами искусственного интеллекта: Программно-техническая система, использующая алгоритмы искусственного интеллекта для решения различных задач в области образования.

3.2 жизненный цикл данных (data lifecycle): Последовательность этапов, через которые проходят данные от начального этапа формирования до момента уничтожения.

3.3 основные данные [мастер-данные (master-data)]: Данные, описывающие основные объекты и субъекты, участвующие в образовательной деятельности.

Примечания

1 Помимо информации непосредственно о том или ином объекте, в основные данные входят взаимосвязи между этими объектами и субъектами и иерархии.

2 Каждая организация определяет самостоятельно, какие данные следует считать основными.

3.4 транзакционные данные: Данные, которые образовались в результате выполнения каких-либо операций.

3.5 очистка данных (data cleansing): Процесс исправления или удаления неверных, поврежденных, неправильно отформатированных, дублированных или неполных данных в наборе данных.

3.6

персональные данные: Любая информация, прямо или косвенно относящаяся к определенному или определяемому физическому лицу (субъекту персональных данных).

[1, статья 3]

3.7

репозиторий: Место, где хранятся и поддерживаются какие-либо данные вместе с историей их изменения и другой служебной информацией.

[ГОСТ Р 57723-2017, статья 3.1.21]

3.8 системы управления учебной деятельностью (LMS-системы): Программно-технические системы для организации учебного процесса и управления образовательными материалами.

     4 Общие требования

При организации сбора, хранения, обработки, передачи и защиты данных в образовательных продуктах с алгоритмами искусственного интеллекта:

а) сбор, хранение, обработка и передача персональных данных может осуществляться только с согласия пользователей образовательного продукта. Рекомендуется предусмотреть возможность пользователя ознакомиться с собираемыми о нем данными;

б) должны быть идентифицированы все заинтересованные стороны или их представители, на которых может быть оказано влияние в результате использования данных, определены их интересы и связанные с ними риски;

в) предприняты необходимые действия для минимизации выявленных рисков.

     5 Структура образовательной деятельности и модель данных

5.1 Образовательную деятельность с использованием образовательных продуктов с алгоритмами искусственного интеллекта можно представить в виде последовательности действий по планированию, осуществлению и оценке деятельности и ее результатов (см. рисунок 1).

Рисунок 1 - Этапы образовательной деятельности

5.2 Фактически осуществленная образовательная деятельность может отличаться от запланированной в силу объективных и субъективных обстоятельств.

5.3 Модель данных включает в себя основные и транзакционные данные, описывающие участников образовательной деятельности, их планируемую и фактическую деятельность, оценку деятельности обучающегося и результатов обучения.

5.4 Данные о планируемой деятельности включают в себя основные данные о структуре, содержании, планируемых результатах, организационно-педагогических условиях их реализации.

5.5 Выделяют три уровня данных о фактической образовательной деятельности:

- уровень деятельности (например, прохождение образовательной программы или курса в целом);

- уровень отдельного действия, имеющего смысл с точки зрения обучения (например, выполнение отдельной задачи в рамках курса, ответ на отдельный вопрос, просмотр видео и т.п.);

- уровень операции, не имеющей самостоятельного смысла с точки зрения обучения (например, взаимодействие с алгоритмами интерфейса в информационной системе).

5.6 В образовательную деятельность с использованием образовательных продуктов с алгоритмами искусственного интеллекта вовлечены обучающиеся и педагоги, а также инструменты и образовательные материалы продукта. Таким образом данные о действиях в процессе обучения могут относиться к деятельности обучающихся, педагогов, а также использованию образовательных модулей и элементов.

5.7 Отдельные элементы фактически осуществленной деятельности обучающегося описаны следующими параметрами:

участник образовательной деятельности;

цель деятельности;

инструменты, используемые в деятельности;

обстоятельства и условия деятельности;

предметная область деятельности;

состояние участника в момент деятельности;

результаты деятельности: образовательные и предметные (артефакты);

роли участника деятельности (в коллективной деятельности);

продемонстрированные или освоенные знания, умения, навыки.

Данные параметры также могут быть использованы для описания отдельных аспектов планируемой деятельности.

Примечание - Участник деятельности может быть представлен отдельным физическим лицом или группой лиц.

     6 Источники данных

6.1 Для эффективного функционирования образовательных продуктов с алгоритмами искусственного интеллекта необходимо обеспечить сбор и использование данных об участниках и объектах образовательного процесса из разнородных источников.

6.2 Источники данных можно разделить на внутренние и внешние.

6.3 Внутренними источниками данных являются отдельные модули и системы, входящие в состав образовательных продуктов с алгоритмами искусственного интеллекта. Внутренние источники обеспечивают сбор транзакционных данных о фактически осуществленной образовательной деятельности. Для успешного использования технологий искусственного интеллекта внутренние источники данных должны обеспечивать сбор разнородных данных, включая видео и аудиоданные, изображения, текстовые и неструктурированные данные.

6.4 Внешними источниками данных являются иные информационные системы, цифровые платформы и технические устройства. Источником внешних данных, необходимых для образовательных продуктов с алгоритмами искусственного интеллекта могут выступать:

- информационные системы образовательных организаций, в которых используются образовательные продукты с алгоритмами искусственного интеллекта;

- государственные информационные системы;

- информационные системы иных организаций, а также отраслевые информационные системы;

- цифровые социальные платформы.

6.5 Для функционирования образовательных продуктов с алгоритмами искусственного интеллекта необходимо использовать только верифицированные источники данных, гарантирующие достоверность, правильность и точность предоставляемой информации.

     7 Жизненный цикл данных

7.1 Жизненный цикл данных включает следующие этапы: сбор, хранение, обработка, использование, архивация и уничтожение данных.

7.2 Сбор данных представляет собой формирование новых данных, получаемых от источников данных.

7.3 Хранение данных представляет собой обеспечение сохранности и доступа к данным.

7.4 Обработка данных представляет собой манипуляции сданными на протяжении всего жизненного цикла, обеспечивающие их качество. На этапе обработки данные могут быть очищены, преобразованы, подвергнуты слиянию, улучшены или агрегированы.

7.5 Использование данных представляет собой применение данных для решения различных задач.

7.6 Архивация данных представляет собой копирование данных в специализированную систему (среду), в которой будет обеспечено их долгосрочное хранение, и удаление этих данных из активной системы. Архивация обеспечивает возможность повторного использования исторических данных, если они понадобятся вновь.

7.7 Уничтожение данных представляет собой необратимое удаление данных, исключающее их использование и восстановление.

Нужен полный текст и статус документов ГОСТ, СНИП, СП?
Попробуйте «Техэксперт: Лаборатория. Инспекция. Сертификация» бесплатно
Реклама. Рекламодатель: Акционерное общество "Информационная компания "Кодекс". 2VtzqvQZoVs