Статус документа
Статус документа

ГОСТ Р ИСО/МЭК 24668-2022 Информационные технологии (ИТ). Искусственный интеллект. Структура управления процессами аналитики больших данных

     5 Обзор эталонной модели процесса

ИСО/МЭК 33001:2015 определяет эталонную модель процесса (PRM) как модель, включающую определения процессов, описанных с точки зрения их целей и результатов, вместе с архитектурой, описывающей взаимосвязи между процессами. Чтобы сформулировать эталонную модель процесса, следует выполнить требования, приведенные в ИСО/МЭК 33004:2015.

Описание процесса должно отвечать следующим требованиям:

a) процесс должен быть описан с точки зрения его цели и результатов;

b) набор результатов процесса должен быть необходимым и достаточным для достижения цели процесса;

c) описания процессов не должны содержать или подразумевать аспекты характеристики качества процесса, выходящие за рамки базового уровня соответствующих систем измерения процесса, соответствующих ИСО/МЭК 33003:2017.

На рисунке 1 показаны категории процессов, являющихся ключевыми для развития аналитики данных в организации. Эти ключевые категории процессов оказывают взаимное влияние друг на друга с точки зрения готовности организации к внедрению и развертыванию аналитики больших данных.

Существует 5 категорий процессов, а именно, процессы заинтересованных сторон внутри организации, процессы развития компетенций, процессы управления данными, процессы развития аналитики и процессы интеграции технологий. Эти процессы опираются на фундамент технологической инфраструктуры и их развитие направляется стратегией лидерства и культурой организации. Процессы аналитики больших данных и их категории не зависят от специфики конкретной организации, и их реализация не является обязательной.

Процессы заинтересованных сторон внутри организации - высшее руководство организации является ключевой стимулирующей силой, проявляющей себя по-разному, начиная от формирования общего понимания потребностей в аналитике данных и до увязывания отдачи от выполнения таких проектов со стратегическими целями организации. Предоставление заинтересованным сторонам прав на принятие решений и установление их ответственности играет ключевую роль в обеспечении общей успешности долгосрочных проектов аналитики данных. Желательно, чтобы высшее руководство также способствовало выявлению ключевых поставщиков данных, потребителей данных, требований к приложениям и качеств данных, а также правил управления, с тем чтобы быстро начать движение по пути внедрения аналитики данных. Также желательно обратить внимание на формирование ориентированной на данные культуры и на ослабление сопротивления изменениям в подобной ситуации.

Процессы развития компетенций - проекты аналитики данных нуждаются в возможностях, связанных с деятельностью сервис-провайдеров приложений больших данных (BDAP), сервис-провайдеров среды обработки больших данных (BDFP), партнеров сервиса больших данных (BDSP), которые описаны в ИСО/МЭК 20547-3:2020. Эти возможности могут быть либо обеспечены посредством аутсорсинга, либо развиты внутри организации. Если предпочтение отдается аутсорсингу, то требуется дополнительная компетенция по управлению аутсорсингом. Таким образом, наращивание соответствующих возможностей, их непрерывная поддержка и усиление имеют критически важное значение для успеха проектов аналитики данных.

Процессы управления данными - данные требуют эффективного стратегического и оперативного управления, предпочтительно интегрированного со стратегическим и оперативным управлением ИТ, информацией и информационной безопасностью, которое включает отслеживание (мониторинг) новых источников данных, измерение показателей качества данных и выполнение роли владельца данных. Следует обеспечить неприкосновенность частной жизни (защиту персональных данных), безопасность, исполнение политик и законодательно-нормативных требований.

Процессы развития аналитики - процессы развития аналитики данных включают в себя исследование данных, проверку данных (выявление выбросов и отсутствующих значений), настройку и адаптацию алгоритмов, разработку и совершенствование алгоритмов, тонкую настройку алгоритмов, оценку индекса стабильности популяции (population stability index, PSI) и т.д. Процессы развития аналитики данных на всем протяжении их жизненного цикла опираются на тесное сотрудничество с ИТ-службой организации.

Процессы интеграции технологий - для реализации аналитики данных требуется соответствующая технологическая инфраструктура. Следует убедиться, что результаты отформатированы и оптимальным образом представлены целевым потребителям/заинтересованным сторонам. Возможности должны быть интегрированы с функциональной архитектурой. Процессы выбора этих функциональных компонентов и их интеграции в общую архитектуру аналитики данных имеют ключевое значение. Эти процессы включают оценку зрелости технологий, определение подхода к реализации (например, использование PaaS или SaaS) и управление конфигурацией/версиями (например, применение подхода DevOps, предусматривающего интеграцию процессов разработки и эксплуатации).

На рисунке 1 показаны категории процессов аналитики больших данных и входящие в них процессы.