В экосистеме больших данных сохранность данных, как правило, включает в себя комплекс мероприятий, стратегий и политик, направленных на обеспечение доступности и использования ценной информации сервис-провайдером больших данных.
В дальнейшем термин "сохранность больших данных" использован для обозначения сохранности данных в экосистеме больших данных.
4.2.1 Проблемы сохранности больших данных
Следующие характеристики больших данных (см. 6.1 [1]) создают проблемы для сохранности больших данных:
a) объем: характеризует объемы собранных, сохраненных, проанализированных и визуализированных данных, которыми необходимо оперировать с помощью технологий больших данных. С этой характеристикой связаны следующие проблемы:
1) как масштабировать хранилища данных и
2) как определять данные, подлежащие сохранению.
Примечание - Данные, которые напрямую не используют, могут представлять собой ценность косвенно, например для аналитики. Поэтому может быть сложнее принять решение о том, что сохранять и когда предпринимать действия по обеспечению сохранности больших объемов данных;
b) разнообразие: характеризует различные типы и форматы данных, которые обрабатываются с помощью технологий больших данных. Для каждого типа данных может потребоваться отдельная программно-аппаратная среда для оперирования данными. С этой характеристикой связана следующая проблема:
1) как сохранять различные медиа и контекст их обработки;
c) скорость обработки данных: характеризует то, с какой скоростью происходит комплектование данных и с какой скоростью обрабатываются данные с помощью технологий больших данных для получения ожидаемых результатов. С этой характеристикой связана еще одна проблема сохранности больших данных: