Статус документа
Статус документа

          

ГОСТ Р 59926-2021/
ISO/IEC TR 20547-2:2018

     

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Информационные технологии

ЭТАЛОННАЯ АРХИТЕКТУРА БОЛЬШИХ ДАННЫХ

Часть 2

Варианты использования и производные требования

Information technology. Big data reference architecture. Part 2. Use cases and derived requirements

     

Дата введения 2022-03-01

     

Предисловие

1 ПОДГОТОВЛЕН Федеральным государственным бюджетным образовательным учреждением высшего образования "Московский государственный университет имени М.В.Ломоносова" (МГУ имени М.В.Ломоносова) в лице Научно-образовательного центра компетенций в области цифровой экономики МГУ и Автономной некоммерческой организацией "Институт развития информационного общества" (ИРИО) на основе собственного перевода на русский язык англоязычной версии документа, указанного в пункте 4

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 164 "Искусственный интеллект"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 2 декабря 2021 г. N 1685-ст

4 Настоящий стандарт идентичен международному документу ISO/IEC TR 20547-2:2018* "Информационные технологии. Эталонная архитектура больших данных. Часть 2. Варианты использования и производные требования" (ISO/IEC TR 20547-2:2018 "Information technology - Big data reference architecture - Part 2: Use cases and derived requirements", IDT).     

________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.


При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении ДА.

Дополнительные сноски в тексте стандарта, выделенные курсивом, приведены для пояснения текста стандарта

5 ВВЕДЕН ВПЕРВЫЕ


Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)

Введение


Международная организация по стандартизации (ИСО) и Международная электротехническая комиссия (МЭК) вместе образуют специализированную систему всемирной стандартизации. Национальные органы по стандартизации, являющиеся членами ИСО или МЭК, принимают участие в разработке международных стандартов через технические комитеты, созданные соответствующей организацией для рассмотрения вопросов, касающихся конкретных областей технической деятельности. Технические комитеты ИСО и МЭК сотрудничают в областях, представляющих взаимный интерес. Другие международные правительственные и неправительственные организации в сотрудничестве с ИСО и МЭК также принимают участие в этой работе. В области информационных технологий ИСО и МЭК создали Совместный технический комитет ИСО/МЭК СТК1 (ISO/IEC JTC1).

Процедуры, как использованные при подготовке настоящего стандарта, так и те, что будут применяться для его последующей поддержки, описаны в части 1 Директив ИСО/МЭК. Следует в первую очередь обратить внимание на отличающиеся критерии утверждения для различных типов документов. Данный стандарт был подготовлен в соответствии с правилами редактирования, установленными частью 2 Директив ИСО/МЭК (см. www.iso.org/directives).

Следует иметь в виду возможность того, что некоторые элементы данного стандарта могут подпадать под действие патентного права. ИСО и МЭК не несут ответственности за идентификацию соответствующих патентных прав. Детальные сведения о патентных правах, выявленных в ходе разработки настоящего стандарта, будут содержаться во введении и/или в публикуемом ИСО списке полученных патентных деклараций (см. www.iso.org/patents).

Любые торговые марки, использованные в данном стандарте, представляют собой информацию, приводимую для удобства пользователей, и их упоминание не является формой поддержки или одобрения.

Разъяснение добровольного характера стандартов, объяснение смысла специфических терминов и выражений ИСО, связанных с оценкой соответствия, а также сведения о приверженности ИСО принципам Всемирной торговой организации (ВТО) в отношении технических барьеров в торговле (TBT), см. www.iso.org/iso/foreword.html.

Настоящий стандарт был подготовлен Совместным техническим комитетом ИСО/МЭК СТК1 "Информационные технологии".

Список всех частей стандарта ИСО/МЭК 20547 можно найти на веб-сайте ИСО.

Данный документ направлен на формирование сообщества, объединяющего интересы представителей промышленности, академических кругов и правительства, с целью подготовки согласованного перечня технических аспектов в области больших данных всех заинтересованных сторон. Эта работа включала сбор и изучение вариантов использования в различных областях (то есть областях применения). Для достижения этой цели были решены следующие задачи:

- собраны материалы, связанные с техническими аспектами работы с большими данными всех заинтересованных сторон;

- проанализирован и приоритизирован перечень технических проблем, возникающих в сложных вариантах использования, которые могут привести к задержке или помешать внедрению технологий больших данных;

- подготовлен всеобъемлющий перечень обобщенных технических аспектов в области работы с большими данными для стандарта ИСО/МЭК 20547-3 "Информационные технологии. Эталонная архитектура больших данных. Часть 3. Эталонная архитектура" (Information technology - Big data reference architecture - Part 3: Reference architecture);

- полученные результаты зафиксированы в настоящем стандарте.

     1 Область применения


Настоящий стандарт содержит анализ вариантов использования больших данных в различных областях применения, а также выводы, сделанные на основе этого анализа.

     2 Нормативные ссылки


В настоящем стандарте использованы нормативные ссылки на следующие стандарты [для датированных ссылок применяют только указанное издание ссылочного стандарта, для недатированных - последнее издание (включая все изменения)]:

ISO/IEC 20546, Information technology - Big data - Definition and vocabulary (Информационные технологии. Большие данные. Обзор и словарь).

     3 Термины и определения


В настоящем стандарте применены термины и определения, представленные в ИСО/МЭК 20546 и приведенные ниже.

Терминологические базы данных для использования в стандартизации поддерживаются ИСО и МЭК по следующим адресам:

- Электропедия МЭК доступна по адресу http://www.electropedia.org/;

- платформа онлайн-просмотра ИСО: доступна по https://www.iso.org/obp/.

     3.1 Термины, определенные в других источниках


Отсутствуют.

     3.2 Термины, определенные в настоящем стандарте

3.2.1 вариант использования (use case): Типичное применение, сформулированное на высоком уровне для выделения технических особенностей или сравнения практики использования в различных областях.

     3.3 Сокращения

2D

-

двумерный;

3D

-

трехмерный;

6D

-

шестимерный;

AOD

-

данные по объекту анализа (Analysis Object Data);

API

-

интерфейс программирования приложений (Application Programming Interface);

ASDC

-

центр обработки атмосферных данных (Atmospheric Science Data Center);

_______________

Подразделение научно-исследовательского центра НАСА в Лэнгли, США.

ASTM

-

Американское общество испытаний и материалов (American Society for Testing and Materials);

AWS

-

платформа облачных сервисов компании Амазон (Amazon Web Services);

BC/DR

-

непрерывность деятельности и восстановление после чрезвычайных ситуаций (Business Continuity and Disaster Recovery);

BD

-

большие данные (Big data);

BER

-

Управление биологических и экологических исследований Министерства энергетики США (Biological and Environmental Research);

BNL

-

Брукхейвенская национальная лаборатория, США (Brookhaven National Laboratory);

CAaaS

-

аналитика климата как сервис (Climate Analytics as a Service);

CADRG

-

формат для оцифрованных растровых изображений с ARC-сжатием (ARC Digitized Raster Graphic (ADRG);

CBSP

-

провайдер облачного брокерского сервера (CBSP Cloud Brokerage Service Provider);

CERES

-

проект НАСА "Система для изучения облачности и излучения Земли" (Clouds and Earth's Radiant Energy System);

CERN

-

Европейский центр ядерных исследований (The European Organization for Nuclear Research), ЦЕРН;

CESM

-

модель климатической системы Земли (Community Earth System Model);

CFTC

-

Комиссия по торговле товарными фьючерсами (Commodity Futures Trading Commission), США;

CIA

-

конфиденциальность, целостность и доступность (Confidentiality, Integrity and Availability);

CINET

-

цифровая инфраструктура для исследований и анализа сетей и графов (Cy-berinfrastructure for Network (Graph) Science and Analytics);

CMIP

-

проект сопоставления связанных климатических моделей (Coupled Model Intercomparison Project);

CMIP5

-

пятая фаза проекта сопоставления связанных комплексных климатических моделей (Coupled Model Intercomparison Project 5);

CMS

-

компактный мюонный соленоид (Compact Muon Solenoid);

COSO

-

Комитет спонсорских организаций Комиссии Тредвея (Committee of Sponsoring Organizations of the Treadway Commission), США);

CPU

-

центральный процессор (Central Processing Unit);

CReSIS

-

Центр дистанционного зондирования ледяного покрова Университета Канзаса (Center for Remote Sensing of Ice Sheets), США;

CRTS

-

каталинский обзор оптических переходных процессов в режиме реального времени (Catalina Real-Time Transient Survey);

CSP

-

провайдер облачного сервиса (Cloud Service Provider);

CSS

-

каталинский обзор неба (Catalina Sky Survey);

CV

-

контролируемый словарь (Controlled Vocabulary);

DFC

-

Консорциум федеративных сетей данных (DataNet Federation Consortium);

DHTC

-

распределенные вычисления с высокой пропускной способностью (Distributed High Throughput Computing);

DNA

-

дезоксирибонуклеиновая кислота; ДНК (DeoxyriboNucleic Acid);

DOE

-

Министерство энергетики США;

DOJ

-

Министерство юстиции США;

DPO

-

онлайновые инструменты работы с данными Центра обработки атмосферных данных (Data Products Online);

EBAF - TOA

баланс и накопление энергии верхних слоев атмосферы (Energy Balanced and Filled-Top of Atmosphere). Средство генерации данных проекта НАСА "Система для изучения облачности и излучения Земли";

EC2

-

эластичное вычислительное облако (Elastic Compute Cloud);

EDT

-

хранилище данных в Клинике Мейо (Enterprise Data Trust), США;

EHR

-

электронные данные (карта) здоровья (Electronic Health Record);

EMR

-

электронная медицинская карта (Electronic Medical Record);

EMSO

европейская междисциплинарная обсерватория исследования морского дна и слоев воды (European Multidisciplinary Seafloor and Water Column Observatory);

ENVRI

совместная деятельность европейских сетевых инфраструктур в области экологических исследований (Common Operations of Environmental Research Infrastructures);

ENVRI RM

-

эталонная модель ENVRI (ENVRI Reference Model);

EPOS

-

европейская исследовательская инфраструктура для слежения за [геологическими] плитами (European Plate Observing System);

ESFRI

-

европейский стратегический форум по исследовательским инфраструктурам (European Strategy Forum on Research Infrastructures);

ESG

-

грид-система обработки данных о Земле (Earth System Grid);

ESGF

-

федеративная грид-система обработки данных о Земле (Earth System Grid Federation);

FDIC

-

Федеральная корпорация страхования депозитов (U.S. Federal Deposit Insurance Corporation), США;

Fl

-

финансовый сектор (Financial Industries);

FLUXNET

-

сеть вышек для наблюдения за газовыми потоками (Flux Tower Network);

FMV

-

формат высококачественного видео (Full Motion Video);

FNAL

-

Национальная ускорительная лаборатория имени Ферми Fermi National Accelerator Laboratory, Fermilab), США;

GAAP

-

общепринятые принципы бухгалтерского учета США (U.S. Generally Accepted Accounting Principles);

GB

-

Гигабайт;

GCM

-

модель общей циркуляции (General Circulation Model);

GEOS-5

-

годдардовская система наблюдения Земли, 5-я версия (Goddard Earth Observing System version 5);

GeoTiff

-

Tiff-формат изображения с указанием местоположения (Geo Tagged Image File Format);

GEWaSC

-

проект моделирования водоразделов с использованием генома (Genome-Enabled Watershed Simulation Capability);

GHG

-

парниковый газ (Green House Gas);

GMAO

-

Отдел глобального моделирования и ассимиляции Центра управления полетами имени Годдарда, НАСА (Global Modeling and Assimilation Office);

GPFS

-

общая параллельная файловая система (General Parallel File System);

GPS

-

глобальная навигационная система (Global Positioning System);

GPU

-

графический процессор (Graphics Processing Unit);

GRC

-

стратегическое управление, управление рисками и соблюдение требований (Governance, Risk management, and Compliance);

GSFC

-

Центр управления полетами имени Годдарда, США (Goddard Space Flight Center);

HDF5

-

иерархический формат данных, 5-я версия (Hierarchical Data Format);

HDFS

-

распределенная файловая система Hadoop (Hadoop Distributed File System);

HPC

-

высокопроизводительные вычисления (High-Performance Computing);

HTC

-

вычисления с высокой пропускной способностью (High-Throughput Computing);

HVS

-

хостинговый виртуальный сервер (Hosted Virtual Server);

I/O

-

ввод-вывод (Input Output);

IaaS

-

инфраструктура как сервис (Infrastructure as a Service);

IAGOS

-

использование самолетов в глобальной системе наблюдений (In-service Aircraft for a Global Observing System);

ICD

-

международная классификация болезней (International Classification of Dis eases);

ICOS

-

интегрированная система наблюдения за выбросами углерода (Integrated Carbon Observation System);

IMG

-

проект "Интегрированные микробные геномы" Объединенного института генома Министерства энергетики США (Integrated Microbial Genomes);

INPC

-

инфраструктура клинических данных по уходу за пациентами штата Индиана (Indiana Network for Patient Care), США;

IPCC

-

Межправительственная группа экспертов по изменению климата (Intergovernmental Panel on Climate Change);

iRODS

-

интегрированная система управления данными, основанная на использовании правил (integrated Rule-Oriented Data System);

ISACA

-

Международная ассоциация аудита и контроля информационных систем (Information Systems Audit and Control Association);

isc2

-

Международный консорциум по сертификации в области безопасности информационных систем (International Security Computer and Systems Auditors);

ISO

-

Международная организация по стандартизации (International Organization for Standardization);

ITIL

-

библиотека инфраструктуры информационных технологий (Information Technology Infrastructure Library);

JGI

-

объединенный институт генома Министерства энергетики США (Joint Genome Institute);

KML

-

язык разметки Keyhole (Keyhole Markup Language);

kWh

-

киловатт-час;

LaRC

-

Исследовательский центр в Ленгли, НАСА (Langley Research Center);

LBNL

-

Национальная лаборатория имени Лоуренса в Беркли (Lawrence Berkeley National Laboratory), США;

LDA

-

латентное размещение Дирихле (latent Dirichlet allocation)

LHC

-

большой адронный коллайдер (Large Hadron Collider);

LPL

-

Лаборатория изучения Луны и планет в Университете Аризоны (Lunar and Planetary Laboratory), США;

LSST

-

большой синоптический обзорный телескоп в Обсерватории имени Веры Рубин (Large Synoptic Survey Telescope), Чили;

MERRA

-

система для ретроспективного анализа современной эры для исследований и приложений (Modern Era Retrospective Analysis for Research and Applications);

MERRA/AS

-

аналитические сервисы MERRA (MERRA Analytic Services);

MPI

-

интерфейс передачи сообщений (Message Passing Interface);

MRI

-

магнитно-резонансная томография (Magnetic Resonance Imaging);

NARA

-

Национальные архивы США (National Archives and Records Administration);

NARR

-

реанализ метеорологических данных для региона Северной Америки (North American Regional Reanalysis);

NaaS

-

сеть как сервис (Network as a Service);

NASA

-

Национальное управление по аэронавтике и исследованию космического пространства (National Aeronautics and Space Administration), США;

NCAR

-

Национальный центр атмосферных исследований (National Center for Atmospheric Research), США;

NCBI

-

Национальный центр биотехнологической информации (National Center for Biotechnology Information);

NCCS

-

Центр моделирования климата НАСА (Center for Climate Simulation);

NERSC

-

Национальный научно-исследовательский вычислительный центр энергетических исследований Министерства энергетики США (National Energy Research Scientific Computing Center);

NetCDF

-

NetCDF-формат представления данных (Network Common Data Form);

NEX

-

платформа НАСА для обмена данными о Земле (NASA Earth Exchange);

NFS

-

сетевая файловая система (Network File System);

NIKE

-

интегрированная сеть управления знаниями Национального института стандартов и технологий США (NIST Integrated Knowledge Editorial Net);

NIST

-

Национальный институт стандартов и технологий США (National Institute of Standards and Technology);

NITF

-

национальный формат передачи изображений (National Imagery Transmission Format);

NLP

-

обработка естественного языка (Natural Language Processing);

NRT

-

почти в режиме реального времени (Near Real Time);

NSF

-

Национальный научный фонд (National Science Foundation), США;

ODP

-

открытая распределенная обработка (Open Distributed Processing);

OGC

-

Открытый геопространственный консорциум (Open Geospatial Consortium);

PB

-

петабайт;

PCA

-

метод главных компонентов (Principal Component Analysis);

PCAOB

-

Некоммерческая организация по надзору за отчетностью публичных компаний (Public Company Accounting and Oversight Board), США;

PID

-

присвоение постоянного идентификатора (persistent identificator);

PII

-

персональные данные (Personally Identifiable Information);

PNNL

-

Тихоокеанская северо-западная национальная лаборатория (Pacific Northwest National Laboratory), США;

RDBMS

-

система управления реляционными базами данных (relational database management system);

RDF

-

среда описания ресурсов (Resource Description Framework);

RECOVER

-

система поддержки принятия решений по восстановлению экосистем (Rehabilitation Capability Convergence for Ecosystem Recovery);

ROI

-

возврат инвестиций (return on investment);

RPI

-

интерферометрия повторного хода (Repeat Pass Interferometry);

RPO

-

заданная точка восстановления (Recovery Point Objective);

RTO

-

заданное время восстановления (Recovery Time Objective);

SAN

-

сеть хранения данных (Storage Area Network);

SAR

-

радар с синтезируемой апертурой (Synthetic Aperture Radar);

SDN

-

программно-конфигурируемая сеть [передачи данных] (software-defined networking);

SIOS

-

интегрированная система наблюдений за Арктикой на Шпицбергене (Svalbard Integrated Arctic Earth Observing System);

SPADE

-

поддержка аудита происхождения в распределенных средах (Support for Provenance Auditing in Distributed Environments);

SSH

-

защищенная командная среда (Secure Shell);

SSO

-

технология единого входа (Single Sign-On);

TB

-

терабайт;

tf-idf

-

частота встречаемости термина в документе - обратная величина частоты документов с данным термином (term frequency-inverse document frequency);

UA

-

Университет Аризоны (University of Arizona), США;

UAVSAR

-

радар с синтезируемой апертурой для беспилотного летательного аппарата (Unmanned Air Vehicle Synthetic Aperture Radar);

UC

-

вариант использования (Use Case);

UI

-

пользовательский интерфейс (User Interface);

UPS

-

транснациональная компания, специализирующаяся на экспресс-доставке и логистике, США (United Parcel Service);

UQ

-

количественная оценка неопределенности (Uncertainty Quantification);

VASP

-

венский пакет для "ab initio" моделирования материалов на атомарном уровне (Vienna Ab initio Simulation Package);

vCDS

-

виртуальный сервер климатических данных (virtual Climate Data Server);

VO

-

виртуальная обсерватория (Virtual Observatory);

VOIP

-

передача голоса с использованием IP-протокола (Voice over IP);

WALF

-

WALF-формат видео с высоким разрешением (Wide Area Large Format Imagery);

WLCG

-

глобальная грид-инфраструктура Большого адронного коллайдера (Worldwide LHC Computing Grid);

XBRL

-

расширяемый язык разметки для деловой отчетности (Extensible Business Reporting Language);

XML

-

расширяемый язык разметки (Extensible Markup Language);

ZTF

-

обзор "Фабрика транзиентов Цвики" (Zwicky Transient Factory).

Нужен полный текст и статус документов ГОСТ, СНИП, СП?
Попробуйте «Техэксперт: Лаборатория. Инспекция. Сертификация» бесплатно
Реклама. Рекламодатель: Акционерное общество "Информационная компания "Кодекс". 2VtzqvQZoVs