Статус документа
Статус документа

ГОСТ Р ИСО/МЭК 24668-2022 Информационные технологии (ИТ). Искусственный интеллект. Структура управления процессами аналитики больших данных

     6.4 Процессы управления данными

Таблицы 10-13 содержат описания соответствующих процессов, имеющих отношение к управлению данными:

- таблица 10: DMP1 Выявление данных;

- таблица 11: DMP2 Качество данных;

- таблица 12: DMP3 Стратегическое управление данными;

- таблица 13: DMP4 Инфраструктура больших данных.

Таблица 10 - DMP1 Выявление данных

Идентификатор

DMP1

Название

Выявление данных

Описание

Данный процесс охватывает ключевой этап выявления элементов данных. Он включает в себя выявление элементов данных таким образом, чтобы группой не упускались из виду какие-либо важные параметры/факторы, которые играют ключевую роль при анализе результатов.

Цель

Целью процесса DMP1 является выявление, определение, классификация и сбор данных для всех элементов данных, получение информации о которых возможно в контексте проекта/подразделения/отдела.

Результаты

Результаты данного процесса включают следующее:


a) выявлены элементы данных, относящиеся к процессу/подразделению/отделу;


b) элементы данных могут быть классифицированы по категориям, таким, например, как неструктурированные, транзакционные, иерархические и справочные данные;


c) собираются метаданные (операционное описание данных), такие, как единицы измерения, частота/периодичность, источник(и), функциональное определение, диапазон, возможная функциональная корреляция, производитель/потребитель/владелец/куратор;


d) выявляются новые источники данных;


e) выполняется сбор данных.

Таблица 11 - DMP2 Качество данных

Идентификатор

DMP2

Название

Качество данных

Описание

Данный процесс охватывает ключевые аспекты практичной, всесторонней и хорошо управляемой стратегии обеспечения качества данных, которая позволяет избежать разрозненных усилий в различных деловых подразделениях и помогает обеспечить наличие у деловых пользователей во всей организации доступа к согласованной и точной информации.

Цель

Целью процесса DMP2 является определение комплекса мер, которые должны устранять основные причины несогласованности данных, исправлять ошибки посредством очистки данных и объединять отдельные инициативы по обеспечению качества данных.

Результаты

Результаты данного процесса включают следующее:


a) структурированные данные имеют нормализованное реляционное отображение;


b) неструктурированные данные имеют корректные ссылки на структурированные данные;


c) данные соответствуют требованиям к точности, полноте, своевременности, достоверности, согласованности, целостности и т.д.


d) утратившие взаимосвязи (orphaned) или несогласованные данные либо должны быть вычищены из результирующего набора данных, либо должны отфильтровываться, если набор данных формируется в реальном времени (live dataset).

Таблица 12 - DMP3 Стратегическое управление данными

Идентификатор

DMP3

Название

Стратегическое управление данными

Описание

Данный процесс охватывает ключевые этапы налаживания в организации стратегического управления данными. Важным аспектом является правильное установление владельца данных, что иногда может оказаться весьма сложной задачей. Многие организации полагают, что ИТ-служба должна нести основную ответственность за данные, поскольку именно ИТ-служба является владельцем системы, в которой данные хранятся, однако ИТ-служба редко является настоящим владельцем данных.


При установлении владельца данных важно понимать, кто может ответить на вопросы о данных, предоставить определения атрибутов и определить достоверность данных. Такие лица обычно являются настоящими владельцами данных, и их необходимо вовлекать в разработку бизнес-правил для очистки, исправления, сопоставления и консолидации данных.

Цель

Целью процесса DMP3 является выявление инструментов и определение широкого диапазона процессов для реализации эффективного стратегического управления данными в организации.

Результаты

Результаты данного процесса включают следующее:


a) создан совет по вопросам стратегического управления (governing council);


b) определены кураторы данных;


c) определены бизнес-правила, касающиеся консолидации и обновления данных;


d) определены планы внедрения и поддержки.