ГОСТ Р 70466-2022/ISO/IEC TR 20547-1:2020
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Информационные технологии
ЭТАЛОННАЯ АРХИТЕКТУРА БОЛЬШИХ ДАННЫХ
Часть 1
Структура и процесс применения
Information technology. Big data reference architecture. Part 1. Framework and application process
ОКС 35.020
Дата введения 2023-03-01
1 ПОДГОТОВЛЕН Научно-образовательным центром компетенций в области цифровой экономики Федерального государственного бюджетного образовательного учреждения высшего образования "Московский государственный университет имени М.В.Ломоносова" (МГУ имени М.В.Ломоносова) и Автономной некоммерческой организацией "Институт развития информационного общества" (ИРИО) на основе собственного перевода на русский язык англоязычной версии документа, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 164 "Искусственный интеллект"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 8 ноября 2022 г. N 1257-ст
4 Настоящий стандарт идентичен международному документу ISO/IEC TR 20547-1:2020* "Информационные технологии. Эталонная архитектура больших данных. Часть 1. Структура и процесс применения" (ISO/IEC TR 20547-1:2020 Information technology - Big data reference architecture - Part 1: Framework and application process, IDT).
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении ДА
5 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)
Парадигма больших данных относится к быстро развивающейся предметной области со стремительно меняющимися технологиями. Эта динамическая ситуация порождает две существенные проблемы для потенциальных разработчиков технологий. Первая проблема состоит в том, что не хватает стандартных определений терминов, включая ключевое понятие больших данных. Вторая заключается в том, что нет единого подхода к описанию архитектуры больших данных и ее реализации. Первая проблема разрешена в стандарте ИСО/МЭК 20546. Разработка серии стандартов ИСО/МЭК 20547 нацелена на разрешение второй проблемы и представление описания структуры и эталонной архитектуры, которые могут применяться организациями в своих предметных областях для эффективного и последовательного описания архитектуры и ее реализации с учетом лежащих в ее основе технологических решений, а также ролей/исполнителей и связанных с ними интересов (проблем). В настоящем стандарте описаны структура эталонной архитектуры, процесс отображения требований/вариантов использования в эталонной архитектуре, а также оценка этого отображения.
Настоящий стандарт содержит описание структуры эталонной архитектуры больших данных и процесса применения стандарта в рассматриваемой предметной области.
В настоящем стандарте использована нормативная ссылка на следующий стандарт [для датированных ссылок применяют только указанное издание ссылочного стандарта, для недатированных - последнее издание (включая все изменения)]:
ISO/IEC/IEEE 42010:2011, Systems and software engineering - Architecture description (Системная и программная инженерия. Описание архитектуры).
В настоящем стандарте применены следующие термины с соответствующими определениями.
ИСО и МЭК поддерживают терминологические базы данных для использования в стандартизации, расположенные по следующим адресам:
- платформа ИСО для онлайн-просмотра материалов по стандартам (Online Browsing Platform, OBP) доступна по адресу https://www.iso.org/obp/ui;
- Электропедия МЭК (IEC Electropediа) доступна по адресу http://www.electropedia.org/.
3.1 большие данные (big data): Большие массивы данных, отличающиеся главным образом такими характеристиками, как объем, разнообразие, скорость обработки и/или вариативность, которые требуют использования технологии масштабирования для эффективного хранения, обработки, управления и анализа.
Примечание - Большие данные повсеместно используются множеством различных способов, например в качестве названия технологии масштабирования, используемой для обработки обширных массивов данных.
[ИСО/МЭК 20546:2019, 3.1.2]
3.2 эталонная архитектура (reference architecture): В сфере архитектуры программного обеспечения или архитектуры предприятия определяемое понятие устанавливает проверенное типовое решение для архитектуры определенной предметной области, а также задает словарь общепринятых понятий для обсуждения реализаций этой архитектуры.
[ISO TR 14639-2:2014, 2.65]
3.3 структура (framework): Определенный набор утверждений (концепций, понятий) или идей для описания сценария или решения задачи.
[ИСО/МЭК 15638-6-2014, 4.30]
3.4 защищенность (security): защита от преднамеренной подрывной деятельности или отказа. Соединение четырех атрибутов - конфиденциальности, целостности, доступности и подотчетности, и аспектов пятого атрибута - практичности, у каждого из которых имеется соответствующий источник обеспечения.
[ISO/IEC/IEEE 15288:2015, 4.1.39]
3.5 конфиденциальность персональных данных (privacy): право отдельных лиц контролировать или влиять на то, какая информация, связанная с ними (персональные данные), подлежит сбору и хранению, а также кем эта информация может быть раскрыта.
[ИСО/МЭК 26927:2011,3.34]
3.6 происхождение (provenance): Сведения о месте и времени появления, извлечения или создания ресурса, записи, доказательства подлинности или принадлежности в прошлом.
[ИСО/МЭК 11179-7:2019, 3.1.10]
3.7 SQL: Язык баз данных, описанный в ИСО/МЭК 9075.
Примечание - Аббревиатура SQL иногда расшифровывается как "язык структурированных запросов" (Structured Query Language), но это название не используется в серии стандартов ИСО/МЭК 9075.
3.8 жизненный цикл (life cycle): Развитие системы, продукта, услуги, проекта или другой создаваемой человеком сущности от замысла до списания.
[ISO/IEC/IEEE 15288:2015, 4.1.19]
BDA - | аудитор больших данных (Big Data Auditor); |
BDAcP - | сервис-провайдер доступа к большим данным (Big Data Access Provider); |
BDAnP - | сервис-провайдер аналитики больших данных (Big Data Analytics Provider); |
BDAP - | сервис-провайдер приложения больших данных (Big Data Application Provider); |
BDCP - | сервис-провайдер сбора коллекций больших данных (Big Data Collection Provider); |
BDFP - | сервис-провайдер среды обработки больших данных (Big Data Framework Provider); |
BDIP - | сервис-провайдер инфраструктуры больших данных (Big Data Infrastructure Provider); |
BDPlaP - | сервис-провайдер платформы больших данных (Big Data Platform Provider); |
BDPreP - | сервис-провайдер предобработки больших данных (Big Data Preparation Provider); |
BDProP - | сервис-провайдер обработки больших данных (Big Data Processing Provider); |
BDRA - | эталонная архитектура больших данных (Big Data Reference Architecture); |
BDSD - | разработчик сервиса больших данных (Big Data Service Developer); |
BDSO - | оркестратор системы больших данных (Big Data System Orchestrator); |
BDSP - | партнер сервиса больших данных (Big Data Service Partner); |
BDVP - | сервис-провайдер визуализации больших данных (Big Data Visualization Provider); |
GDPR - | Общий регламент по защите данных (General Data Protection Regulation); |
JSON - | обозначение объектов и правил JavaScript (JavaScript Object Notation); |
RDF - | структура описания ресурсов (Resource Description Framework); |
SQuaRE - | требования и оценка качества систем и программного обеспечения (Systems and software Quality Requirements and Evaluation); |
XML - | расширяемый язык разметки (Extensible Markup Language). |
Настоящий стандарт предназначен для ознакомления с понятиями в сфере эталонной архитектуры больших данных в целях применения других стандартов серии стандартов ИСО/МЭК 20547 к конкретным системам и наборам задач.
Разделы с 6-го по 9-й включают:
- описание мотивации и целей стандартизации больших данных;
- введение в эталонные архитектуры и сведения об их назначении;
- обзор эталонной архитектуры больших данных и объяснение ее ключевых понятий;
- описание процесса применения эталонной архитектуры больших данных.
При использовании серии стандартов ИСО/МЭК 20547 настоящий стандарт будет полезен в следующих случаях:
- для получения общего представления о применении эталонной архитектуры больших данных необходимо использовать содержание разделов 5-7;
- для разработки архитектуры больших данных и приведения ее в соответствие с эталонной архитектурой необходимо использовать описание процесса, рассмотренного в разделе 8.
В отчете за 2019 г. международная исследовательская и консалтинговая компания International Data Corporation (IDC) прогнозировала мировые доходы от использования и аналитики больших данных в размере 189,1 млрд долл. США, что на 12% больше, чем в 2018 г., а также совокупный ежегодный рост за 5 лет на 13,2% с доходами, превышающими 274,3 млрд долл. США в 2022 г. [15].
Покупатели и потенциальные пользователи систем больших данных вынуждены иметь дело со взрывным ростом областей применения новых технологий в условиях, когда определение и понимание термина "большие данные" еще не устоялось. Для того чтобы заинтересованные стороны понимали, что они покупают и внедряют, необходимы четко выстроенные процессы их взаимодействия с потенциальными поставщиками технологий и услуг.
Примечания
1 Понятие "система больших данных" предусматривает использование парадигмы и инженерии больших данных.
2 Понятие "инженерия больших данных" предусматривает перспективные способы использования независимых ресурсов для построения масштабируемых систем данных в тех случаях, когда требуется создание новых архитектур для эффективного хранения, обработки и анализа с учетом характеристик массивов данных.
3 Понятие "парадигма больших данных" предусматривает распределение систем данных по горизонтально связанным независимым ресурсам для обеспечения масштабируемости в целях эффективной обработки больших массивов данных.