ГОСТ Р 59926-2021/
ISO/IEC TR 20547-2:2018
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Информационные технологии
ЭТАЛОННАЯ АРХИТЕКТУРА БОЛЬШИХ ДАННЫХ
Часть 2
Варианты использования и производные требования
Information technology. Big data reference architecture. Part 2. Use cases and derived requirements
Дата введения 2022-03-01
1 ПОДГОТОВЛЕН Федеральным государственным бюджетным образовательным учреждением высшего образования "Московский государственный университет имени М.В.Ломоносова" (МГУ имени М.В.Ломоносова) в лице Научно-образовательного центра компетенций в области цифровой экономики МГУ и Автономной некоммерческой организацией "Институт развития информационного общества" (ИРИО) на основе собственного перевода на русский язык англоязычной версии документа, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 164 "Искусственный интеллект"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 2 декабря 2021 г. N 1685-ст
4 Настоящий стандарт идентичен международному документу ISO/IEC TR 20547-2:2018* "Информационные технологии. Эталонная архитектура больших данных. Часть 2. Варианты использования и производные требования" (ISO/IEC TR 20547-2:2018 "Information technology - Big data reference architecture - Part 2: Use cases and derived requirements", IDT).
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении ДА.
Дополнительные сноски в тексте стандарта, выделенные курсивом, приведены для пояснения текста стандарта
5 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)
Международная организация по стандартизации (ИСО) и Международная электротехническая комиссия (МЭК) вместе образуют специализированную систему всемирной стандартизации. Национальные органы по стандартизации, являющиеся членами ИСО или МЭК, принимают участие в разработке международных стандартов через технические комитеты, созданные соответствующей организацией для рассмотрения вопросов, касающихся конкретных областей технической деятельности. Технические комитеты ИСО и МЭК сотрудничают в областях, представляющих взаимный интерес. Другие международные правительственные и неправительственные организации в сотрудничестве с ИСО и МЭК также принимают участие в этой работе. В области информационных технологий ИСО и МЭК создали Совместный технический комитет ИСО/МЭК СТК1 (ISO/IEC JTC1).
Процедуры, как использованные при подготовке настоящего стандарта, так и те, что будут применяться для его последующей поддержки, описаны в части 1 Директив ИСО/МЭК. Следует в первую очередь обратить внимание на отличающиеся критерии утверждения для различных типов документов. Данный стандарт был подготовлен в соответствии с правилами редактирования, установленными частью 2 Директив ИСО/МЭК (см. www.iso.org/directives).
Следует иметь в виду возможность того, что некоторые элементы данного стандарта могут подпадать под действие патентного права. ИСО и МЭК не несут ответственности за идентификацию соответствующих патентных прав. Детальные сведения о патентных правах, выявленных в ходе разработки настоящего стандарта, будут содержаться во введении и/или в публикуемом ИСО списке полученных патентных деклараций (см. www.iso.org/patents).
Любые торговые марки, использованные в данном стандарте, представляют собой информацию, приводимую для удобства пользователей, и их упоминание не является формой поддержки или одобрения.
Разъяснение добровольного характера стандартов, объяснение смысла специфических терминов и выражений ИСО, связанных с оценкой соответствия, а также сведения о приверженности ИСО принципам Всемирной торговой организации (ВТО) в отношении технических барьеров в торговле (TBT), см. www.iso.org/iso/foreword.html.
Настоящий стандарт был подготовлен Совместным техническим комитетом ИСО/МЭК СТК1 "Информационные технологии".
Список всех частей стандарта ИСО/МЭК 20547 можно найти на веб-сайте ИСО.
Данный документ направлен на формирование сообщества, объединяющего интересы представителей промышленности, академических кругов и правительства, с целью подготовки согласованного перечня технических аспектов в области больших данных всех заинтересованных сторон. Эта работа включала сбор и изучение вариантов использования в различных областях (то есть областях применения). Для достижения этой цели были решены следующие задачи:
- собраны материалы, связанные с техническими аспектами работы с большими данными всех заинтересованных сторон;
- проанализирован и приоритизирован перечень технических проблем, возникающих в сложных вариантах использования, которые могут привести к задержке или помешать внедрению технологий больших данных;
- подготовлен всеобъемлющий перечень обобщенных технических аспектов в области работы с большими данными для стандарта ИСО/МЭК 20547-3 "Информационные технологии. Эталонная архитектура больших данных. Часть 3. Эталонная архитектура" (Information technology - Big data reference architecture - Part 3: Reference architecture);
- полученные результаты зафиксированы в настоящем стандарте.
Настоящий стандарт содержит анализ вариантов использования больших данных в различных областях применения, а также выводы, сделанные на основе этого анализа.
В настоящем стандарте использованы нормативные ссылки на следующие стандарты [для датированных ссылок применяют только указанное издание ссылочного стандарта, для недатированных - последнее издание (включая все изменения)]:
ISO/IEC 20546, Information technology - Big data - Definition and vocabulary (Информационные технологии. Большие данные. Обзор и словарь).
В настоящем стандарте применены термины и определения, представленные в ИСО/МЭК 20546 и приведенные ниже.
Терминологические базы данных для использования в стандартизации поддерживаются ИСО и МЭК по следующим адресам:
- Электропедия МЭК доступна по адресу http://www.electropedia.org/;
- платформа онлайн-просмотра ИСО: доступна по https://www.iso.org/obp/.
Отсутствуют.
3.2.1 вариант использования (use case): Типичное применение, сформулированное на высоком уровне для выделения технических особенностей или сравнения практики использования в различных областях.
2D | - | двумерный; |
3D | - | трехмерный; |
6D | - | шестимерный; |
AOD | - | данные по объекту анализа (Analysis Object Data); |
API | - | интерфейс программирования приложений (Application Programming Interface); |
ASDC | - | центр обработки атмосферных данных (Atmospheric Science Data Center); |
_______________ Подразделение научно-исследовательского центра НАСА в Лэнгли, США. | ||
ASTM | - | Американское общество испытаний и материалов (American Society for Testing and Materials); |
AWS | - | платформа облачных сервисов компании Амазон (Amazon Web Services); |
BC/DR | - | непрерывность деятельности и восстановление после чрезвычайных ситуаций (Business Continuity and Disaster Recovery); |
BD | - | большие данные (Big data); |
BER | - | Управление биологических и экологических исследований Министерства энергетики США (Biological and Environmental Research); |
BNL | - | Брукхейвенская национальная лаборатория, США (Brookhaven National Laboratory); |
CAaaS | - | аналитика климата как сервис (Climate Analytics as a Service); |
CADRG | - | формат для оцифрованных растровых изображений с ARC-сжатием (ARC Digitized Raster Graphic (ADRG); |
CBSP | - | провайдер облачного брокерского сервера (CBSP Cloud Brokerage Service Provider); |
CERES | - | проект НАСА "Система для изучения облачности и излучения Земли" (Clouds and Earth's Radiant Energy System); |
CERN | - | Европейский центр ядерных исследований (The European Organization for Nuclear Research), ЦЕРН; |
CESM | - | модель климатической системы Земли (Community Earth System Model); |
CFTC | - | Комиссия по торговле товарными фьючерсами (Commodity Futures Trading Commission), США; |
CIA | - | конфиденциальность, целостность и доступность (Confidentiality, Integrity and Availability); |
CINET | - | цифровая инфраструктура для исследований и анализа сетей и графов (Cy-berinfrastructure for Network (Graph) Science and Analytics); |
CMIP | - | проект сопоставления связанных климатических моделей (Coupled Model Intercomparison Project); |
CMIP5 | - | пятая фаза проекта сопоставления связанных комплексных климатических моделей (Coupled Model Intercomparison Project 5); |
CMS | - | компактный мюонный соленоид (Compact Muon Solenoid); |
COSO | - | Комитет спонсорских организаций Комиссии Тредвея (Committee of Sponsoring Organizations of the Treadway Commission), США); |
CPU | - | центральный процессор (Central Processing Unit); |
CReSIS | - | Центр дистанционного зондирования ледяного покрова Университета Канзаса (Center for Remote Sensing of Ice Sheets), США; |
CRTS | - | каталинский обзор оптических переходных процессов в режиме реального времени (Catalina Real-Time Transient Survey); |
CSP | - | провайдер облачного сервиса (Cloud Service Provider); |
CSS | - | каталинский обзор неба (Catalina Sky Survey); |
CV | - | контролируемый словарь (Controlled Vocabulary); |
DFC | - | Консорциум федеративных сетей данных (DataNet Federation Consortium); |
DHTC | - | распределенные вычисления с высокой пропускной способностью (Distributed High Throughput Computing); |
DNA | - | дезоксирибонуклеиновая кислота; ДНК (DeoxyriboNucleic Acid); |
DOE | - | Министерство энергетики США; |
DOJ | - | Министерство юстиции США; |
DPO | - | онлайновые инструменты работы с данными Центра обработки атмосферных данных (Data Products Online); |
EBAF - TOA | баланс и накопление энергии верхних слоев атмосферы (Energy Balanced and Filled-Top of Atmosphere). Средство генерации данных проекта НАСА "Система для изучения облачности и излучения Земли"; | |
EC2 | - | эластичное вычислительное облако (Elastic Compute Cloud); |
EDT | - | хранилище данных в Клинике Мейо (Enterprise Data Trust), США; |
EHR | - | электронные данные (карта) здоровья (Electronic Health Record); |
EMR | - | электронная медицинская карта (Electronic Medical Record); |
EMSO | европейская междисциплинарная обсерватория исследования морского дна и слоев воды (European Multidisciplinary Seafloor and Water Column Observatory); | |
ENVRI | совместная деятельность европейских сетевых инфраструктур в области экологических исследований (Common Operations of Environmental Research Infrastructures); | |
ENVRI RM | - | эталонная модель ENVRI (ENVRI Reference Model); |
EPOS | - | европейская исследовательская инфраструктура для слежения за [геологическими] плитами (European Plate Observing System); |
ESFRI | - | европейский стратегический форум по исследовательским инфраструктурам (European Strategy Forum on Research Infrastructures); |
ESG | - | грид-система обработки данных о Земле (Earth System Grid); |
ESGF | - | федеративная грид-система обработки данных о Земле (Earth System Grid Federation); |
FDIC | - | Федеральная корпорация страхования депозитов (U.S. Federal Deposit Insurance Corporation), США; |
Fl | - | финансовый сектор (Financial Industries); |
FLUXNET | - | сеть вышек для наблюдения за газовыми потоками (Flux Tower Network); |
FMV | - | формат высококачественного видео (Full Motion Video); |
FNAL | - | Национальная ускорительная лаборатория имени Ферми Fermi National Accelerator Laboratory, Fermilab), США; |
GAAP | - | общепринятые принципы бухгалтерского учета США (U.S. Generally Accepted Accounting Principles); |
GB | - | Гигабайт; |
GCM | - | модель общей циркуляции (General Circulation Model); |
GEOS-5 | - | годдардовская система наблюдения Земли, 5-я версия (Goddard Earth Observing System version 5); |
GeoTiff | - | Tiff-формат изображения с указанием местоположения (Geo Tagged Image File Format); |
GEWaSC | - | проект моделирования водоразделов с использованием генома (Genome-Enabled Watershed Simulation Capability); |
GHG | - | парниковый газ (Green House Gas); |
GMAO | - | Отдел глобального моделирования и ассимиляции Центра управления полетами имени Годдарда, НАСА (Global Modeling and Assimilation Office); |
GPFS | - | общая параллельная файловая система (General Parallel File System); |
GPS | - | глобальная навигационная система (Global Positioning System); |
GPU | - | графический процессор (Graphics Processing Unit); |
GRC | - | стратегическое управление, управление рисками и соблюдение требований (Governance, Risk management, and Compliance); |
GSFC | - | Центр управления полетами имени Годдарда, США (Goddard Space Flight Center); |
HDF5 | - | иерархический формат данных, 5-я версия (Hierarchical Data Format); |
HDFS | - | распределенная файловая система Hadoop (Hadoop Distributed File System); |
HPC | - | высокопроизводительные вычисления (High-Performance Computing); |
HTC | - | вычисления с высокой пропускной способностью (High-Throughput Computing); |
HVS | - | хостинговый виртуальный сервер (Hosted Virtual Server); |
I/O | - | ввод-вывод (Input Output); |
IaaS | - | инфраструктура как сервис (Infrastructure as a Service); |
IAGOS | - | использование самолетов в глобальной системе наблюдений (In-service Aircraft for a Global Observing System); |
ICD | - | международная классификация болезней (International Classification of Dis eases); |
ICOS | - | интегрированная система наблюдения за выбросами углерода (Integrated Carbon Observation System); |
IMG | - | проект "Интегрированные микробные геномы" Объединенного института генома Министерства энергетики США (Integrated Microbial Genomes); |
INPC | - | инфраструктура клинических данных по уходу за пациентами штата Индиана (Indiana Network for Patient Care), США; |
IPCC | - | Межправительственная группа экспертов по изменению климата (Intergovernmental Panel on Climate Change); |
iRODS | - | интегрированная система управления данными, основанная на использовании правил (integrated Rule-Oriented Data System); |
ISACA | - | Международная ассоциация аудита и контроля информационных систем (Information Systems Audit and Control Association); |
isc2 | - | Международный консорциум по сертификации в области безопасности информационных систем (International Security Computer and Systems Auditors); |
ISO | - | Международная организация по стандартизации (International Organization for Standardization); |
ITIL | - | библиотека инфраструктуры информационных технологий (Information Technology Infrastructure Library); |
JGI | - | объединенный институт генома Министерства энергетики США (Joint Genome Institute); |
KML | - | язык разметки Keyhole (Keyhole Markup Language); |
kWh | - | киловатт-час; |
LaRC | - | Исследовательский центр в Ленгли, НАСА (Langley Research Center); |
LBNL | - | Национальная лаборатория имени Лоуренса в Беркли (Lawrence Berkeley National Laboratory), США; |
LDA | - | латентное размещение Дирихле (latent Dirichlet allocation) |
LHC | - | большой адронный коллайдер (Large Hadron Collider); |
LPL | - | Лаборатория изучения Луны и планет в Университете Аризоны (Lunar and Planetary Laboratory), США; |
LSST | - | большой синоптический обзорный телескоп в Обсерватории имени Веры Рубин (Large Synoptic Survey Telescope), Чили; |
MERRA | - | система для ретроспективного анализа современной эры для исследований и приложений (Modern Era Retrospective Analysis for Research and Applications); |
MERRA/AS | - | аналитические сервисы MERRA (MERRA Analytic Services); |
MPI | - | интерфейс передачи сообщений (Message Passing Interface); |
MRI | - | магнитно-резонансная томография (Magnetic Resonance Imaging); |
NARA | - | Национальные архивы США (National Archives and Records Administration); |
NARR | - | реанализ метеорологических данных для региона Северной Америки (North American Regional Reanalysis); |
NaaS | - | сеть как сервис (Network as a Service); |
NASA | - | Национальное управление по аэронавтике и исследованию космического пространства (National Aeronautics and Space Administration), США; |
NCAR | - | Национальный центр атмосферных исследований (National Center for Atmospheric Research), США; |
NCBI | - | Национальный центр биотехнологической информации (National Center for Biotechnology Information); |
NCCS | - | Центр моделирования климата НАСА (Center for Climate Simulation); |
NERSC | - | Национальный научно-исследовательский вычислительный центр энергетических исследований Министерства энергетики США (National Energy Research Scientific Computing Center); |
NetCDF | - | NetCDF-формат представления данных (Network Common Data Form); |
NEX | - | платформа НАСА для обмена данными о Земле (NASA Earth Exchange); |
NFS | - | сетевая файловая система (Network File System); |
NIKE | - | интегрированная сеть управления знаниями Национального института стандартов и технологий США (NIST Integrated Knowledge Editorial Net); |
NIST | - | Национальный институт стандартов и технологий США (National Institute of Standards and Technology); |
NITF | - | национальный формат передачи изображений (National Imagery Transmission Format); |
NLP | - | обработка естественного языка (Natural Language Processing); |
NRT | - | почти в режиме реального времени (Near Real Time); |
NSF | - | Национальный научный фонд (National Science Foundation), США; |
ODP | - | открытая распределенная обработка (Open Distributed Processing); |
OGC | - | Открытый геопространственный консорциум (Open Geospatial Consortium); |
PB | - | петабайт; |
PCA | - | метод главных компонентов (Principal Component Analysis); |
PCAOB | - | Некоммерческая организация по надзору за отчетностью публичных компаний (Public Company Accounting and Oversight Board), США; |
PID | - | присвоение постоянного идентификатора (persistent identificator); |
PII | - | персональные данные (Personally Identifiable Information); |
PNNL | - | Тихоокеанская северо-западная национальная лаборатория (Pacific Northwest National Laboratory), США; |
RDBMS | - | система управления реляционными базами данных (relational database management system); |
RDF | - | среда описания ресурсов (Resource Description Framework); |
RECOVER | - | система поддержки принятия решений по восстановлению экосистем (Rehabilitation Capability Convergence for Ecosystem Recovery); |
ROI | - | возврат инвестиций (return on investment); |
RPI | - | интерферометрия повторного хода (Repeat Pass Interferometry); |
RPO | - | заданная точка восстановления (Recovery Point Objective); |
RTO | - | заданное время восстановления (Recovery Time Objective); |
SAN | - | сеть хранения данных (Storage Area Network); |
SAR | - | радар с синтезируемой апертурой (Synthetic Aperture Radar); |
SDN | - | программно-конфигурируемая сеть [передачи данных] (software-defined networking); |
SIOS | - | интегрированная система наблюдений за Арктикой на Шпицбергене (Svalbard Integrated Arctic Earth Observing System); |
SPADE | - | поддержка аудита происхождения в распределенных средах (Support for Provenance Auditing in Distributed Environments); |
SSH | - | защищенная командная среда (Secure Shell); |
SSO | - | технология единого входа (Single Sign-On); |
TB | - | терабайт; |
tf-idf | - | частота встречаемости термина в документе - обратная величина частоты документов с данным термином (term frequency-inverse document frequency); |
UA | - | Университет Аризоны (University of Arizona), США; |
UAVSAR | - | радар с синтезируемой апертурой для беспилотного летательного аппарата (Unmanned Air Vehicle Synthetic Aperture Radar); |
UC | - | вариант использования (Use Case); |
UI | - | пользовательский интерфейс (User Interface); |
UPS | - | транснациональная компания, специализирующаяся на экспресс-доставке и логистике, США (United Parcel Service); |
UQ | - | количественная оценка неопределенности (Uncertainty Quantification); |
VASP | - | венский пакет для "ab initio" моделирования материалов на атомарном уровне (Vienna Ab initio Simulation Package); |
vCDS | - | виртуальный сервер климатических данных (virtual Climate Data Server); |
VO | - | виртуальная обсерватория (Virtual Observatory); |
VOIP | - | передача голоса с использованием IP-протокола (Voice over IP); |
WALF | - | WALF-формат видео с высоким разрешением (Wide Area Large Format Imagery); |
WLCG | - | глобальная грид-инфраструктура Большого адронного коллайдера (Worldwide LHC Computing Grid); |
XBRL | - | расширяемый язык разметки для деловой отчетности (Extensible Business Reporting Language); |
XML | - | расширяемый язык разметки (Extensible Markup Language); |
ZTF | - | обзор "Фабрика транзиентов Цвики" (Zwicky Transient Factory). |