Все большему числу областей науки, техники и бизнеса требуется эффективный доступ к большим объемам данных в распределенной среде. Многие из них нуждаются также в поддержке совместного использования и интеграции распределенных данных, например для обеспечения доступа к информации, хранящейся в базах данных, которые управляются независимо друг от друга, с соответствующими гарантиями безопасности. Архивирование данных и управление данными являются необходимыми требованиями. СОАОГС должна упростить создание приложений, ориентированных на обработку данных, и сделать их устойчивыми к изменениям в гетерогенной среде.
Требования, необходимые для сервисов данных, включают в себя следующее.
1) Спецификация политики и управления. Возможность специфицировать политики является ключом к развитию самоуправляемых, масштабируемых, эффективных Грид-систем данных. Политики проникают в архитектуру. Примеры этого включают спецификации, определяющие, кто может получить доступ к данным, когда данные будут затребованы, какие преобразования допускаются с данными, является ли использование эксклюзивным, какие требуются производительность и доступность, сколько ресурсов может быть использовано, какое разрешено взаимодействие между копиями данных, другие подобные ограничения.
2) Хранилища данных. Сюда входят дисковые, ленточные и многие другие системы хранения данных. Общеупотребительные интерфейсы поддерживают обеспечение хранения, управления квотами, жизненным циклом и свойствами, такими как шифрование и устойчивость.
3) Доступ к данным. Требуется простой и эффективный доступ пользователей к различным типам данных (таким как базы данных, файлы, потоки, интегрированные и обобщенные данные), обеспечиваемый посредством однообразного набора интерфейсов, независимых от физического расположения или платформы, путем абстрактного описания основных информационных ресурсов. Также необходимы механизмы для работы интерфейсов в существующей инфраструктуре безопасности, или, если таковая отсутствует, для контроля прав доступа на различных уровнях детализации.
4) Передача данных. Требуется высокая пропускная способность передачи данных независимо от физических атрибутов источников и приемников данных, которая при необходимости может использовать соответствующие особенности этих источников и приемников. Должны поддерживаться передача байтов типа "точка-точка", а также более сложные схемы передачи, которые могут обслуживать множество конечных точек и сохранять семантику данных.
5) Управление расположением данных. Эти сервисы управляют физическим расположением данных. СОАОГС должна поддерживать множественные методы, дающие пользователям возможность получать доступ к данным в конкретном месте, согласно требованиям политики как пользователя, так и ресурса данных.
6) Обновление данных. Хотя некоторые ресурсы данных доступны только для чтения, многие, если не большинство, предоставляют некоторым пользователям привилегии, позволяющие обновлять данные. СОАОГС должна обеспечить наличие средств обновления, позволяющих поддерживать должное согласование данных в случае, если кэшированные или скопированные данные были изменены.
7) Устойчивость данных. Данные должны быть защищены в соответствии с указанной политикой. Связь локальных данных с их метаданными также должна быть защищена согласно соответствующей политике. Должна существовать возможность использования одной из многих допустимых моделей устойчивости данных.
8) Объединение данных. СОАОГС должна поддерживать интеграцию гетерогенных и распределенных данных. В состав гетерогенных должны включаться данные, организованные в соответствии со всевозможными схемами и информацией, хранящейся с использованием различных технологий (например, реляционные, обычные файлы). Для этого следует иметь возможность поиска необходимых данных унифицированным образом в гетерогенных и распределенных информационных ресурсах и выбора соответствующего формата ответа.