Статус документа
Статус документа

ГОСТ Р 57773-2017 (ИСО 19157:2013) Пространственные данные. Качество данных

Приложение D
(обязательное)

Перечень стандартизированных мер качества данных

D.1 Введение

В данном приложении устанавливается и определяется перечень стандартизированных мер качества данных. Настоящее приложение определяет меры качества данных. С целью получения четко определенной и сравнимой информации о качестве настоятельно рекомендуется проводить оценку и отчетность по качеству данных с использованием таких мер качества.

D.2 Полнота

D.2.1 Присутствие

Меры качества данных для присутствия элементов качества данных представлены в таблицах D.1-D.4.


Таблица D.1 - Избыточный элемент

N

Компонент

Описание

1

Название

Избыточный элемент

2

Краткое название

-

3

Название элемента

Присутствие

4

Базовая мера

Индикатор ошибок

5

Определение

Признак того, что элемент неверно представлен в данных

6

Описание

-

7

Параметр

-

8

Тип значения

Булева переменная (значение "true" указывает на то, что элемент является избыточным)

9

Структура значения

-

10

Ссылка на источник

-

11

Пример

True (в наборе данных в качестве зданий классифицировано больше элементов, чем в предметной области)

12

Идентификатор

1



Таблица D.2 - Количество избыточных элементов

N

Компонент

Описание

1

Название

Количество избыточных элементов

2

Краткое название

-

3

Название элемента

Присутствие

4

Базовая мера

Подсчет ошибок

5

Определение

Количество элементов в наборе данных или выборке, которые не должны быть представлены

6

Описание

-

7

Параметр

-

8

Тип значения

Integer (целое)

9

Структура значения

-

10

Ссылка на источник

-

11

Пример

2 (в наборе данных содержится 12 зданий, в то время как в предметной области только 10)

12

Идентификатор

2



Таблица D.3 - Коэффициент избыточных элементов

N

Компонент

Описание

1

Название

Коэффициент избыточных элементов

2

Краткое название

-

3

Название элемента

Присутствие

4

Базовая мера

Частота ошибок

5

Определение

Число избыточных элементов в наборе данных или выборке по отношению к числу элементов, которые должны быть представлены

6

Описание

-

7

Параметр

-

8

Тип значения

Real (вещественное)

9

Структура значения

-

10

Ссылка на источник

-

11

Пример

10% (в наборе данных представлено на 10% больше зданий, чем в предметной области)

12

Идентификатор

3



Таблица D.4 - Количество повторяющихся экземпляров объекта

N

Компонент

Описание

1

Название

Количество повторяющихся экземпляров объекта

2

Краткое название

-

3

Название элемента

Присутствие

4

Базовая мера

Подсчет ошибок

5

Определение

Общее количество точных дубликатов экземпляров объектов в данных

6

Описание

Количество всех элементов в наборе данных с дублированной геометрией, которые определяются некорректно

7

Параметр

-

8

Тип значения

Integer

9

Структура значения

-

10

Ссылка на источник

-

11

Пример

Объекты с идентичными атрибутами и координатами:


две (или более) точки, расположенные поверх друг друга;

две (или более) кривые, расположенные поверх друг друга;

две (или более) поверхности, расположенные поверх друг друга

12

Идентификатор

4

D.2.2 Отсутствие

Меры качества данных для элемента качества данных "отсутствие" представлены в таблицах D.5-D.7.


Таблица D.5 - Отсутствующий элемент

N

Компонент

Описание

1

Название

Отсутствующий элемент

2

Краткое название

-

3

Название элемента

Отсутствие

4

Базовая мера

Индикатор ошибок

5

Определение

Признак того, что элемент отсутствует в данных

6

Описание

-

7

Параметр

-

8

Тип значения

Булева переменная (значение "true" указывает на то, что элемент отсутствует)

9

Структура значения

-

10

Ссылка на источник

-

11

Пример

Спецификацией информационного продукта задается отбор всех башен выше 300 м. Мера качества данных "отсутствующий элемент" позволяет оценщику данных или их пользователю выдать отчет о том, что конкретный элемент, в данном случае объект типа "башня" (название зависит от схемы приложения), отсутствует.

Область определения качества данных: все башни высотой >300.

Пример результата оценки полноты определенного набора данных:

Отсутствующий элемент = true для r

Имя башни = Эйфелева башня

12

Идентификатор

5



Таблица D.6 - Число отсутствующих элементов