Применение
Прием государственных данных на хранение, поиск, извлечение и обеспечение их долговременной сохранности.
Текущий подход
Данные в настоящее время обрабатываются следующим образом:
- передача данных под физический контроль Национальных архивов и переход к Национальным архивам юридической ответственности за их сохранность;
- предварительная обработка данных, включающая проверки на наличие вирусов, определение файловых форматов и удаления пустых файлов;
- индексирование данных;
- категоризация документов (выделяются, например, чувствительные конфиденциальные, неконфиденциальные, персональные данные);
- преобразование устаревших файловых форматов в современные;
- проведение электронного раскрытия;
- поиск и извлечение данных в рамках исполнения специальных запросов;
- поиск и извлечение государственных документов представителями общественности.
Сотни терабайт информации хранятся централизованно в коммерческих базах данных, поддерживаемых кастомизированным программным обеспечением и коммерческими поисковыми продуктами.
Планы на будущее
Федеральные органы исполнительной власти США располагают многочисленными распределенными источниками данных, которые в настоящее время должны быть переданы в централизованное хранилище. В будущем эти источники данных могут находиться в ряде облачных сред. В этом случае в рамках передачи Национальным Архивам ответственности за физическую сохранность желательно избегать перемещения больших данных из одного облака в другое либо из облака в центр обработки данных.