Классификация типов открытых данных представляется по следующим основным критериям:
- предметная область;
- формат данных;
- структура данных (линейная, иерархическая и т.д.);
- объем данных;
- способ публикации;
- способ хранения;
- периодичность обновления и актуальности данных.
Часть критериев классификации включено в качестве метаинформации к паспорту набора данных:
- формат данных;
- объем данных;
- способ публикации;
- способ хранения;
- периодичность обновления и актуальности данных.
Критерий предметной области выделяет специфические особенности публикации открытых данных по специализированным тематикам.
Тематики наборов предполагают использование различных справочников и стандартов для связывания наборов открытых данных между собой. Для связывания наборов открытых данных возможно использование международных общепринятых стандартов, систем и справочников, таких как: ISO 8601 (международный стандарт, описывающий формат даты и времени), EPSG: 4326 (система координат геоданных). При использовании общепринятых стандартов, систем и справочников обязательным требованием является указание данных онтологии в структуре набора открытых данных (например, для формата xsd структуры - <xs:documentation xml:lang="ru">Дата первой публикации набора данных в формате ISO 8601.</xs:documentation>). При использовании собственных справочников (например, ОКАТО или другой специализированный справочник) необходимо указывать ссылку на справочник или на онтологию справочника в структуре набора открытых данных. Используемые общепринятые стандарты, системы и справочники не должны иметь никаких ограничений в использовании.
В том случае, если в рамках перечисленных тематик используются различные и/или закрытые справочники и стандарты, необходимо согласование и утверждение единых открытых спецификаций в рамках тематики. Процедура выработки технических спецификаций осуществляется посредством Совета по открытым данным.
В соответствии с перечнем наиболее важных сегментов открытых данных, выделенных в Хартии открытых данных, классификация наборов может проводиться по следующим тематикам:
Категория данных | Примеры массивов данных |
Компании | Компании/реестр предприятий |
Преступность и правосудие | Статистика преступности, безопасность |
Наблюдение за планетой | Метеорологические данные/сведения о погоде, сельском хозяйстве, лесоводстве, рыбной ловле и охоте |
Образование | Список школ; результативность работы школ, цифровые навыки |
Энергетика и окружающая среда | Уровни загрязнения, энергопотребление |
Финансовые и контрактные вопросы | Заключенные сделки, подписанные контракты, поданные заявки на участие в тендере, будущие тендеры, местный бюджет, национальный бюджет (планируемый и расходуемый) |
Геопространственные данные | Топография, почтовые индексы, национальные карты, местные карты |
Международное развитие | Предоставление помощи, продовольственная безопасность, добывающая промышленность, землепользование |
Подотчетность правительственного аппарата и демократия | Контактная информация для связи с правительством, результаты выборов, нормативно-законодательные акты и уставы, заработные платы (ставки заработной платы), знаки признательности/подарки |
Здравоохранение | Данные о назначаемых препаратах, данные о результатах |
Наука и исследования | Данные о геномах, исследовательская и образовательная деятельность, результаты экспериментов |
Статистика | Национальная статистика, перепись, инфраструктура, уровень благосостояния, профессиональные навыки |
Социальная мобильность и благосостояние | Жилищное обеспечение, медицинское страхование и пособие по безработице |
Транспорт и инфраструктура | Расписание общественного транспорта, точки доступа к широкополосным каналам |