ГОСТ Р 57773-2017
(ИСО 19157:2013)
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
ПРОСТРАНСТВЕННЫЕ ДАННЫЕ
Качество данных
Spatial data. Data quality
ОКС 35.240.70
Дата введения 2018-06-01
1 ПОДГОТОВЛЕН Федеральным государственным бюджетным учреждением "Федеральный научно-технический центр геодезии, картографии и инфраструктуры пространственных данных" (ФГБУ "Центр геодезии, картографии и ИПД") на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 394 "Географическая информация/геоматика"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 6 октября 2017 г. N 1367-ст
4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 19157:2013* "Географическая информация - Качество данных" (ISO 19157:2013 "Geographic information - Data quality, MOD") путем включения дополнительных фраз, слов, ссылок и внесения изменений по отношению к тексту применяемого международного стандарта, которые выделены курсивом**, подчеркиванием сплошной горизонтальной линией, а также невключения отдельных структурных элементов, ссылок и дополнительных элементов. Объяснения причин внесения этих технических отклонений приведены во введении.
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей.
** В оригинале обозначения и номера стандартов и нормативных документов в разделах 3 "Нормативные ссылки", 6 "Обзор качеств данных", 7 "Компоненты качества данных", 9 "Оценка качества данных", 10 "Отчетность о качестве данных", Приложении А, Приложении В, Приложении С и отмеченные в разделе "Предисловие" знаком "**" выделены курсивом, остальные по тексту документа приводятся обычным шрифтом. - Примечания изготовителя базы данных.
Сопоставление структуры настоящего стандарта со структурой указанного международного стандарта приведено в дополнительном приложении ДА.
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5).
Сведения о соответствии ссылочных национальных стандартов международным стандартам, использованным в качестве ссылочных в примененном международном стандарте, приведены в дополнительном приложении ДБ
5 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации"**. Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячном информационном указателе "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
Пространственные данные все чаще распространяют, обменивают и используют для целей, отличных от тех, которые предусматривались разработчиком. Информация о качестве доступных данных имеет важнейшее значение для процесса отбора наборов данных, в которых ценность данных напрямую связана с их качеством. Пользователям пространственных данных представляется множество наборов данных на выбор. В связи с этим возникает необходимость сравнения качества наборов данных с целью определения тех, которые наилучшим образом отвечают потребностям пользователя.
Цель описания качества пространственных данных состоит в облегчении сравнения и выбора набора данных, которые наилучшим образом удовлетворяют потребностям или требованиям приложений. Полные описания качества наборов данных будут способствовать распространению, обмену и использованию соответствующих наборов данных. Информация о качестве пространственных данных позволяет их разработчику оценить, насколько точно данный набор отвечает критериям, изложенным в спецификации продукта, и помогает пользователям данных оценить способность продукта удовлетворять требованиям его конкретного приложения. Для осуществления такой оценки используется ряд четко определенных процедур в последовательном порядке.
С целью облегчения сравнения важно, чтобы результаты в отчетах информации о качестве данных были выражены в сопоставимом виде, а также чтобы было общее понимание использованных мер качества данных. Эти меры качества обеспечивают дескрипторы качества пространственных данных путем сравнения с данными предметной области. Использование несовместимых мер делает сравнение качества данных невозможным. Настоящий стандарт устанавливает требования к компонентам и структуре мер качества данных и определяет общие базовые меры качества данных.
В настоящем стандарте отмечается, что мнение производителя и мнение пользователя о качестве данных могут не совпадать. Уровень соответствия качеству может быть установлен с помощью спецификации на продукт производителя данных или требований к качеству пользователя данных. Если пользователю данных требуется больше информации о качестве данных, чем предусмотрено их производителем, то пользователь данных может ознакомиться с ходом процесса оценки качества данных у производителя, чтобы получить дополнительную информацию. В этом случае требования пользователя данных рассматриваются как спецификация продукта с целью использования в процессе производства данных.
Цель настоящего стандарта - установить принципы описания качества пространственных данных и концепций обработки информации о качестве пространственных данных, а также последовательные и стандартные методы определения и выдачи информации о качестве наборов данных. Задачей стандарта также является обеспечение руководящими принципами процедур оценки количественной информации о качестве пространственных данных.
Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 19157:2013 "Географическая информация - Качество данных" (ISO 19157:2013 "Geographic information - Data quality"). В настоящий стандарт внесены изменения, необходимые для приведения его в соответствие современным международным и национальным стандартам, в частности изменен раздел нормативных ссылок, уточнена библиография, в тексте стандарта приведены ссылки на национальные стандарты.
Настоящий стандарт устанавливает принципы описания качества пространственных данных, в том числе:
- определяет компоненты для описания качества данных;
- устанавливает компоненты и структуру содержания реестра для мер качества данных;
- описывает общие процедуры оценки качества пространственных данных;
- устанавливает принципы составления отчетности о качестве данных.
Настоящий стандарт также определяет меры качества данных для использования при оценке и составлении отчетности об их качестве. Он предназначен для разработчиков данных, обеспечивающих информацию о качестве, для описания и оценки того, насколько набор данных соответствует спецификации продукта, а также для пользователей данных, пытающихся определить, обладают ли конкретные пространственные данные достаточным качеством, необходимым для их частного применения.
Настоящий стандарт не преследует цель определения минимально приемлемых уровней качества пространственных данных.
Любой продукт, заявляющий о соответствии настоящему стандарту, должен отвечать всем требованиям, описанным в комплексе проверок, который приведен в приложении A, а именно:
- процесс оценки качества данных должен пройти проверку, изложенную в разделе A.1 приложения A;
- метаданные о качестве данных должны пройти проверку, изложенную в разделах A.2 и A.3 приложения A;
- независимый отчет о качестве должен пройти проверку, изложенную в разделе A.4 приложения A;
- меры качества данных должны пройти проверку, изложенную в разделе A.5 приложения A.
В настоящем стандарте использованы нормативные ссылки на следующие стандарты:
ГОСТ Р 50779.72-99 Статистические методы. Процедуры выборочного контроля по альтернативному признаку. Часть 2. Планы выборочного контроля отдельных партий на основе предельного качества LQ
ГОСТ Р 57668-2017 Пространственные данные. Метаданные. Часть 1. Основные положения
ГОСТ Р 57656-2017 Пространственные данные. Метаданные. Часть 2. Расширения для изображений и матричных данных
ГОСТ Р 57657-2017 Пространственные данные. Спецификация информационного продукта
ГОСТ Р ИСО 2859-3-2009 Статистические методы. Процедуры выборочного контроля по альтернативному признаку. Часть 3. Контроль с пропуском партий
ГОСТ Р ИСО 3951-1-2015 Статистические методы. Процедуры выборочного контроля по количественному признаку. Часть 1. Требования к одноступенчатым планам на основе AQL при контроле последовательных партий по единственной характеристике и единственной AQL
Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячно издаваемого информационного указателя "Национальные стандарты" за текущий год. Если заменен ссылочный документ, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого документа с учетом всех внесенных в данную версию изменений. Если заменен ссылочный документ, на который дана датированная ссылка, то рекомендуется использовать версию этого документа с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный документ, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.
4.1 точность (accuracy): Степень соответствия результата проверки или измерений принятому истинному значению.
Примечание - В настоящем стандарте истинным значением может выступать эталонное значение, принятое за истинное.
4.2 каталог (catalogue): Набор элементов (4.18) либо электронный или бумажный документ, который содержит информацию о наборе элементов.
4.3 соответствие (conformance): Выполнение заданных требований.
4.4 уровень соответствия качества (conformance quality level): Пороговое значение или набор пороговых значений для результирующих оценок качества данных (4.21), по которым определяют степень соответствия набора данных (4.8) спецификации информационного продукта (4.6) или потребностям пользователя.
4.5 корректность (correctness): Соответствие предметной области (4.24).
4.6 спецификация информационного продукта (data product specification): Детальное описание набора данных (4.8) или ряда наборов данных, а также дополнительная информация, которая обеспечивает его (их) создание, поставку и использование другой стороной.
4.7 базовая мера качества данных (data quality basic measure): Универсальная мера качества данных (4.21), используемая как основа для специализированных мер качества данных.
Примечание - Базовые меры качества данных - абстрактные типы данных. Непосредственное их использование при составлении отчета о качестве данных не представляется возможным.
4.8 набор данных (dataset): Идентифицируемая совокупность данных.
Примечание - Набором данных может быть также малая группа данных, которая, хотя и имеет некоторые ограничения в виде пространственной протяженности или типа объекта (4.15), физически расположена в пределах более крупного набора данных. Теоретически набором данных могут быть отдельный объект (4.11) или атрибут объекта (4.12), расположенные в пределах большого набора данных. Печатная копия топографической или морской карты может рассматриваться как набор данных.
4.9 комплект наборов данных (dataset series): Совокупность наборов данных (4.8), обладающих одинаковыми характеристиками.
4.10 метод прямой оценки (direct evaluation method): Метод оценки качества (4.21) набора данных (4.8), основанный на проверке элементов (4.18) набора данных.
4.11 пространственный объект, объект (feature): Абстракция явления реального мира.
Примечание - Объект может быть представлен как тип или экземпляр. Тип объекта (4.15) или экземпляр объекта (4.13) используются в зависимости от назначения.
4.12 атрибут пространственного объекта (feature attribute): Характеристика объекта (4.11).
Примечание - Атрибут объекта имеет имя, характеризуется определенным типом данных и имеет область допустимых значений. Атрибут экземпляра объекта (4.13) также имеет значение атрибута, принадлежащее области допустимых значений.
4.13 экземпляр объекта (feature instance): Объект данного типа (4.15), имеющий определенные значения атрибутов объекта (4.12).
4.14 операция с объектом (feature operation): Операция, которую может выполнить любой экземпляр некоторого типа пространственного объекта.
4.15 тип объекта (feature type): Класс объектов (4.11), имеющих общие характеристики.
4.16 пространственные данные (spatial data): Данные о пространственных объектах, включающие сведения об их форме, местоположении и свойствах, в том числе представленные с использованием координат.
4.17 метод косвенной оценки (indirect evaluation method): Метод оценки качества (4.21) набора данных (4.8), основанный на дополнительных знаниях.
Примечание - Примером дополнительных знаний служит происхождение набора данных, таких как метод производства или исходные данные.
4.18 элемент (item): To, что может быть описано и рассмотрено отдельно.
Примечание - Элемент может являться любой частью набора данных (4.8), такой как объект (4.11), отношения объектов, атрибут объекта (4.12) или их комбинация.
4.19 метаданные (metadata): Данные о данных.
4.20 метакачество (metaquality): Информация, описывающая качество (4.21) оценки качества данных.
4.21 качество (quality): Степень соответствия совокупности собственных характеристик заявленным требованиям.
4.22 реестр (register): Набор файлов, содержащий идентификаторы элементов (4.18) с описанием соответствующих элементов.
4.23 самостоятельный отчет о качестве (standalone quality report): Свободный текстовый документ, содержащий подробную информацию о примененных методах оценки качества данных (4.21), результатах и мерах.
4.24 предметная область (universe of discourse): Отображение реального или гипотетического мира, которое включает все, что представляет интерес.