Действующий

Методические рекомендации по публикации открытых данных государственными органами и органами местного самоуправления, а также технические требования к публикации открытых данных (Версия 3.0)

Общие требования к публикации машиночитаемого представления набора открытых данных

а. открытые данные должны публиковаться в форматах CSV, XML, JSON, RDF или с применением API (в случае наборов открытых данных со специфическими особенностями). В формате CSV рекомендуется публиковать данные, имеющие плоскую табличную форму, при этом в содержании записи не допускается использование символа перевода строки. Сложные иерархические данные рекомендуется публиковать в форматах XML, JSON. Для облегчения последующего процесса связывания наборов данных рекомендуется публиковать в одном из открытых форматов, реализующих модель RDF. Подробная схема представления связей между метаданными, открытыми данными и онтологиями представлена в Приложении 1;

б. в случае если размер набора имеет значительный объем данных (более 30 Мбайт), рекомендуется архивировать его с помощью алгоритма архивирования, имеющего спецификацию в виде открытого стандарта (см. п.8.1.4);

в. для представления наборов открытых данных, содержащих сведения из различных предметных областей, должны использоваться существующие форматы разметки типовых данных (schema.org, YMapsML, XAL и т.п.), имеющие опубликованную спецификацию;

г. необходимо избегать смены формата представления открытых данных, так как это может затруднить процесс автоматической обработки. В случае смены формата необходимо заранее уведомлять потребителей и фиксировать суть изменений (например, путем установки соответствующего значения параметра "Содержание последнего изменения" в "Изменение структуры данных" набора открытых данных);

д. атрибуты каждого набора открытых данных должны иметь краткое англоязычное представление (в виде англоязычных имен или краткого текста транслитерации);

е. машиночитаемое представление набора открытых данных (в соответствующем формате или через API) должно обеспечивать возможность автоматической идентификации и обработки информационными системами составных элементов набора (записей, сущностей и т.д.) и атрибутов этих элементов; не допускается представление данных в неструктурированной форме, затрудняющей автоматическую обработку (например, недопустимо представление набора данных в виде бинарных данных, включенных в файл офисного документа).

Полные требования и примеры к машиночитаемому представлению открытых данных представлены в Приложениях 7-10.