Статус документа
Статус документа

ПНСТ 848-2023 Искусственный интеллект. Большие данные. Обзор и требования по обеспечению сохранности данных

     4.2 Сохранность данных в экосистеме больших данных

В экосистеме больших данных сохранность данных, как правило, включает в себя комплекс мероприятий, стратегий и политик, направленных на обеспечение доступности и использования ценной информации сервис-провайдером больших данных.

В дальнейшем термин "сохранность больших данных" использован для обозначения сохранности данных в экосистеме больших данных.

4.2.1 Проблемы сохранности больших данных

Следующие характеристики больших данных (см. 6.1 [1]) создают проблемы для сохранности больших данных:

a) объем: характеризует объемы собранных, сохраненных, проанализированных и визуализированных данных, которыми необходимо оперировать с помощью технологий больших данных. С этой характеристикой связаны следующие проблемы:

1) как масштабировать хранилища данных и

2) как определять данные, подлежащие сохранению.

Примечание - Данные, которые напрямую не используют, могут представлять собой ценность косвенно, например для аналитики. Поэтому может быть сложнее принять решение о том, что сохранять и когда предпринимать действия по обеспечению сохранности больших объемов данных;

b) разнообразие: характеризует различные типы и форматы данных, которые обрабатываются с помощью технологий больших данных. Для каждого типа данных может потребоваться отдельная программно-аппаратная среда для оперирования данными. С этой характеристикой связана следующая проблема:

1) как сохранять различные медиа и контекст их обработки;

c) скорость обработки данных: характеризует то, с какой скоростью происходит комплектование данных и с какой скоростью обрабатываются данные с помощью технологий больших данных для получения ожидаемых результатов. С этой характеристикой связана еще одна проблема сохранности больших данных: