Статус документа
Статус документа

ГОСТ Р 70466-2022/ISO/IEC TR 20547-1:2020

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Информационные технологии

ЭТАЛОННАЯ АРХИТЕКТУРА БОЛЬШИХ ДАННЫХ

Часть 1

Структура и процесс применения

Information technology. Big data reference architecture. Part 1. Framework and application process



ОКС 35.020

Дата введения 2023-03-01

Предисловие

     

1 ПОДГОТОВЛЕН Научно-образовательным центром компетенций в области цифровой экономики Федерального государственного бюджетного образовательного учреждения высшего образования "Московский государственный университет имени М.В.Ломоносова" (МГУ имени М.В.Ломоносова) и Автономной некоммерческой организацией "Институт развития информационного общества" (ИРИО) на основе собственного перевода на русский язык англоязычной версии документа, указанного в пункте 4

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 164 "Искусственный интеллект"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 8 ноября 2022 г. N 1257-ст

4 Настоящий стандарт идентичен международному документу ISO/IEC TR 20547-1:2020* "Информационные технологии. Эталонная архитектура больших данных. Часть 1. Структура и процесс применения" (ISO/IEC TR 20547-1:2020 Information technology - Big data reference architecture - Part 1: Framework and application process, IDT).

________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.


При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении ДА

5 ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)

Введение


Парадигма больших данных относится к быстро развивающейся предметной области со стремительно меняющимися технологиями. Эта динамическая ситуация порождает две существенные проблемы для потенциальных разработчиков технологий. Первая проблема состоит в том, что не хватает стандартных определений терминов, включая ключевое понятие больших данных. Вторая заключается в том, что нет единого подхода к описанию архитектуры больших данных и ее реализации. Первая проблема разрешена в стандарте ИСО/МЭК 20546. Разработка серии стандартов ИСО/МЭК 20547 нацелена на разрешение второй проблемы и представление описания структуры и эталонной архитектуры, которые могут применяться организациями в своих предметных областях для эффективного и последовательного описания архитектуры и ее реализации с учетом лежащих в ее основе технологических решений, а также ролей/исполнителей и связанных с ними интересов (проблем). В настоящем стандарте описаны структура эталонной архитектуры, процесс отображения требований/вариантов использования в эталонной архитектуре, а также оценка этого отображения.

     1 Область применения

Настоящий стандарт содержит описание структуры эталонной архитектуры больших данных и процесса применения стандарта в рассматриваемой предметной области.

     2 Нормативные ссылки

В настоящем стандарте использована нормативная ссылка на следующий стандарт [для датированных ссылок применяют только указанное издание ссылочного стандарта, для недатированных - последнее издание (включая все изменения)]:

ISO/IEC/IEEE 42010:2011, Systems and software engineering - Architecture description (Системная и программная инженерия. Описание архитектуры).

     3 Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями.

ИСО и МЭК поддерживают терминологические базы данных для использования в стандартизации, расположенные по следующим адресам:

- платформа ИСО для онлайн-просмотра материалов по стандартам (Online Browsing Platform, OBP) доступна по адресу https://www.iso.org/obp/ui;

- Электропедия МЭК (IEC Electropediа) доступна по адресу http://www.electropedia.org/.

3.1 большие данные (big data): Большие массивы данных, отличающиеся главным образом такими характеристиками, как объем, разнообразие, скорость обработки и/или вариативность, которые требуют использования технологии масштабирования для эффективного хранения, обработки, управления и анализа.

Примечание - Большие данные повсеместно используются множеством различных способов, например в качестве названия технологии масштабирования, используемой для обработки обширных массивов данных.

[ИСО/МЭК 20546:2019, 3.1.2]

3.2 эталонная архитектура (reference architecture): В сфере архитектуры программного обеспечения или архитектуры предприятия определяемое понятие устанавливает проверенное типовое решение для архитектуры определенной предметной области, а также задает словарь общепринятых понятий для обсуждения реализаций этой архитектуры.

[ISO TR 14639-2:2014, 2.65]

3.3 структура (framework): Определенный набор утверждений (концепций, понятий) или идей для описания сценария или решения задачи.

[ИСО/МЭК 15638-6-2014, 4.30]

3.4 защищенность (security): защита от преднамеренной подрывной деятельности или отказа. Соединение четырех атрибутов - конфиденциальности, целостности, доступности и подотчетности, и аспектов пятого атрибута - практичности, у каждого из которых имеется соответствующий источник обеспечения.

[ISO/IEC/IEEE 15288:2015, 4.1.39]

3.5 конфиденциальность персональных данных (privacy): право отдельных лиц контролировать или влиять на то, какая информация, связанная с ними (персональные данные), подлежит сбору и хранению, а также кем эта информация может быть раскрыта.

[ИСО/МЭК 26927:2011,3.34]

3.6 происхождение (provenance): Сведения о месте и времени появления, извлечения или создания ресурса, записи, доказательства подлинности или принадлежности в прошлом.

[ИСО/МЭК 11179-7:2019, 3.1.10]

3.7 SQL: Язык баз данных, описанный в ИСО/МЭК 9075.

Примечание - Аббревиатура SQL иногда расшифровывается как "язык структурированных запросов" (Structured Query Language), но это название не используется в серии стандартов ИСО/МЭК 9075.

3.8 жизненный цикл (life cycle): Развитие системы, продукта, услуги, проекта или другой создаваемой человеком сущности от замысла до списания.

[ISO/IEC/IEEE 15288:2015, 4.1.19]

     4 Сокращения

BDA -

аудитор больших данных (Big Data Auditor);

BDAcP -

сервис-провайдер доступа к большим данным (Big Data Access Provider);

BDAnP -

сервис-провайдер аналитики больших данных (Big Data Analytics Provider);

BDAP -

сервис-провайдер приложения больших данных (Big Data Application Provider);

BDCP -

сервис-провайдер сбора коллекций больших данных (Big Data Collection Provider);

BDFP -

сервис-провайдер среды обработки больших данных (Big Data Framework Provider);

BDIP -

сервис-провайдер инфраструктуры больших данных (Big Data Infrastructure Provider);

BDPlaP -

сервис-провайдер платформы больших данных (Big Data Platform Provider);

BDPreP -

сервис-провайдер предобработки больших данных (Big Data Preparation Provider);

BDProP -

сервис-провайдер обработки больших данных (Big Data Processing Provider);

BDRA -

эталонная архитектура больших данных (Big Data Reference Architecture);

BDSD -

разработчик сервиса больших данных (Big Data Service Developer);

BDSO -

оркестратор системы больших данных (Big Data System Orchestrator);

BDSP -

партнер сервиса больших данных (Big Data Service Partner);

BDVP -

сервис-провайдер визуализации больших данных (Big Data Visualization Provider);

GDPR -

Общий регламент по защите данных (General Data Protection Regulation);

JSON -

обозначение объектов и правил JavaScript (JavaScript Object Notation);

RDF -

структура описания ресурсов (Resource Description Framework);

SQuaRE -

требования и оценка качества систем и программного обеспечения (Systems and software Quality Requirements and Evaluation);

XML -

расширяемый язык разметки (Extensible Markup Language).

     5 Обзор документа

Настоящий стандарт предназначен для ознакомления с понятиями в сфере эталонной архитектуры больших данных в целях применения других стандартов серии стандартов ИСО/МЭК 20547 к конкретным системам и наборам задач.

Разделы с 6-го по 9-й включают:

- описание мотивации и целей стандартизации больших данных;

- введение в эталонные архитектуры и сведения об их назначении;

- обзор эталонной архитектуры больших данных и объяснение ее ключевых понятий;

- описание процесса применения эталонной архитектуры больших данных.

При использовании серии стандартов ИСО/МЭК 20547 настоящий стандарт будет полезен в следующих случаях:

- для получения общего представления о применении эталонной архитектуры больших данных необходимо использовать содержание разделов 5-7;

- для разработки архитектуры больших данных и приведения ее в соответствие с эталонной архитектурой необходимо использовать описание процесса, рассмотренного в разделе 8.

     6 Стандартизация больших данных: мотивация и цели

В отчете за 2019 г. международная исследовательская и консалтинговая компания International Data Corporation (IDC) прогнозировала мировые доходы от использования и аналитики больших данных в размере 189,1 млрд долл. США, что на 12% больше, чем в 2018 г., а также совокупный ежегодный рост за 5 лет на 13,2% с доходами, превышающими 274,3 млрд долл. США в 2022 г. [15].

Покупатели и потенциальные пользователи систем больших данных вынуждены иметь дело со взрывным ростом областей применения новых технологий в условиях, когда определение и понимание термина "большие данные" еще не устоялось. Для того чтобы заинтересованные стороны понимали, что они покупают и внедряют, необходимы четко выстроенные процессы их взаимодействия с потенциальными поставщиками технологий и услуг.

Примечания

1 Понятие "система больших данных" предусматривает использование парадигмы и инженерии больших данных.

2 Понятие "инженерия больших данных" предусматривает перспективные способы использования независимых ресурсов для построения масштабируемых систем данных в тех случаях, когда требуется создание новых архитектур для эффективного хранения, обработки и анализа с учетом характеристик массивов данных.

3 Понятие "парадигма больших данных" предусматривает распределение систем данных по горизонтально связанным независимым ресурсам для обеспечения масштабируемости в целях эффективной обработки больших массивов данных.

Нужен полный текст и статус документов ГОСТ, СНИП, СП?
Попробуйте «Техэксперт: Лаборатория. Инспекция. Сертификация» бесплатно
Реклама. Рекламодатель: Акционерное общество "Информационная компания "Кодекс". 2VtzqvQZoVs