Статус документа
Статус документа

ГОСТ Р 59926-2021/ISO/IEC TR 205472:2018 Информационные технологии (ИТ). Эталонная архитектура больших данных. Часть 2. Варианты использования и производные требования

     6.2 Сводные итоги анализа требований


Были выделены 35 общих требований [1] на основе анализа и обобщения 439 специфических технических проблем, извлеченных из 52 вариантов использования. В графе 2 таблицы 1 указано количество специфических технических проблем, послуживших основой для выделения соответствующего общего требования.


Таблица 1 - Общие технические требования, сформулированные на основе специфических технических проблем

#

Количество вариантов

Требование

Требования к поставщику данных

1

26

Необходимо поддерживать надежную, в реальном времени и/или асинхронную, потоковую и/или пакетную обработку с целью сбора данных из централизованных, распределенных и/или облачных источников, от датчиков и/или приборов

_______________

Исправлена неверная цифра, здесь и в приложении D.

2

22

Необходимо поддерживать передачу данных - медленную и/или неравномерную с периодическими пиковыми нагрузками и/или с высокой пропускной способностью - между источниками данных и вычислительными кластерами

3

28

Необходимо поддерживать данные разнообразных типов и видов, включая структурированные и неструктурированные тексты, документы, графы, веб-материалы, геопространственные данные, сжатые, с привязкой ко времени, пространственные, мультимедийные данные, данные моделирования и показания измерительных инструментов

Требования к провайдеру сервиса преобразования данных

1

36

Необходимо поддерживать разнообразные вычислительно-интенсивные методы аналитической обработки и методы машинного обучения

_______________

Исправлена неверная цифра, здесь и в приложении D.

2

7

Необходимо поддерживать аналитическую обработку в реальном времени и/или пакетную

3

14

Необходимо поддерживать обработку большого объема разнородных данных и данных моделирования

_______________

Исправлена неверная цифра, здесь и в приложении D.

4

6

Необходимо поддерживать обработку данных в движении (потоковая передача, доставка нового контента, отслеживание и т.д.)

Требования к провайдеру вычислительных возможностей

1

27

Необходимо поддерживать как унаследованные, так и продвинутые пакеты программ (ПО)

_______________

Исправлена неверная цифра, здесь и в приложении D.

2

16

Необходимо поддерживать как унаследованные, так и продвинутые вычислительные платформы (платформа)

_______________

Исправлена неверная цифра, здесь и в приложении D.

3

23

Необходимо поддерживать как унаследованные, так и продвинутые распределенные вычислительные кластеры, сопроцессоры, обработку ввода-вывода (инфраструктура)

_______________

Исправлена неверная цифра, здесь и в приложении D.

4

14

Необходимо поддерживать гибкую передачу данных (сети)

5

28

Необходимо поддерживать унаследованные, крупномасштабные и продвинутые распределенные хранилища данных (хранение)

_______________

Исправлена неверная цифра, здесь и в приложении D.

6

13

Необходимо поддерживать как унаследованные, так и продвинутые исполняемые программы: приложения, инструменты, утилиты и библиотеки (ПО)

Требования к потребителю данных

1

4

Необходимо поддерживать быстрый поиск по обработанным данным - с высокой релевантностью, точностью и полнотой результатов поиска

2

13

Необходимо поддерживать различные форматы выходных файлов для визуализации, рендеринга и создания отчетов

_______________

Исправлена неверная цифра, здесь и в приложении D.

3

2

Необходимо поддерживать визуальную разметку для представления результатов

4

9

Необходимо поддерживать пользовательский интерфейс с широкими функциональными возможностями для доступа с помощью браузера и средства визуализации

_______________

Исправлена неверная цифра, здесь и в приложении D.

5

20

Необходимо поддерживать инструменты многомерной, с высоким разрешением визуализации данных

6

1

Необходимо поддерживать потоковую передачу результатов клиентам

Требования по обеспечению безопасности и защиты персональных данных

1

30

Необходимо обеспечить безопасность и конфиденциальность чувствительных данных

_______________

Исправлена неверная цифра, здесь и в приложении D.

2

12

Необходимо поддерживать изолированную среду ("песочницу"), обеспечивать контроль доступа и многоуровневую аутентификацию на основе политик в отношении подлежащих защите данных

Требования к управлению жизненным циклом

1

20

Необходимо поддерживать курирование качества данных, включая предварительную обработку, кластеризацию, классификацию, редуцирование (преобразование к физическим величинам) и преобразование форматов

2

2

Необходимо поддерживать динамическое обновление данных, профилей пользователей и ссылок

3

6

Необходимо поддерживать жизненный цикл данных и политику обеспечения долговременной сохранности, включая отслеживание происхождения данных

4

4

Необходимо поддерживать валидацию данных

5

4

Необходимо поддерживать аннотирование данных человеком для их валидации

6

3

Необходимо принимать меры для предотвращения утраты или порчи данных

7

1

Необходимо поддерживать географически распределенные (multi-site) архивы

8

2

Необходимо поддерживать постоянные идентификаторы и прослеживаемость данных

9

1

Необходимо поддерживать стандартизацию, агрегирование и нормализацию данных из разнородных источников

Иные требования

1

6

Необходимо поддерживать пользовательский интерфейс с широкими возможностями для мобильных платформ с целью обеспечения доступа к обработанным результатам

2

2

Необходимо поддерживать мониторинг с использованием мобильных платформ и учетом производительности аналитической обработки

3

13

Необходимо поддерживать визуальный поиск по контенту с широкими функциональными возможностями и отображение контента на мобильных платформах

4

1

Необходимо поддерживать сбор данных с использованием мобильных устройств

5

1

Необходимо обеспечивать безопасность на мобильных устройствах