Перечень стандартизированных мер качества данных
D.1 Введение
В данном приложении устанавливается и определяется перечень стандартизированных мер качества данных. Настоящее приложение определяет меры качества данных. С целью получения четко определенной и сравнимой информации о качестве настоятельно рекомендуется проводить оценку и отчетность по качеству данных с использованием таких мер качества.
D.2 Полнота
D.2.1 Присутствие
Меры качества данных для присутствия элементов качества данных представлены в таблицах D.1-D.4.
Таблица D.1 - Избыточный элемент
N | Компонент | Описание |
1 | Название | Избыточный элемент |
2 | Краткое название | - |
3 | Название элемента | Присутствие |
4 | Базовая мера | Индикатор ошибок |
5 | Определение | Признак того, что элемент неверно представлен в данных |
6 | Описание | - |
7 | Параметр | - |
8 | Тип значения | Булева переменная (значение "true" указывает на то, что элемент является избыточным) |
9 | Структура значения | - |
10 | Ссылка на источник | - |
11 | Пример | True (в наборе данных в качестве зданий классифицировано больше элементов, чем в предметной области) |
12 | Идентификатор | 1 |
Таблица D.2 - Количество избыточных элементов
N | Компонент | Описание |
1 | Название | Количество избыточных элементов |
2 | Краткое название | - |
3 | Название элемента | Присутствие |
4 | Базовая мера | Подсчет ошибок |
5 | Определение | Количество элементов в наборе данных или выборке, которые не должны быть представлены |
6 | Описание | - |
7 | Параметр | - |
8 | Тип значения | Integer (целое) |
9 | Структура значения | - |
10 | Ссылка на источник | - |
11 | Пример | 2 (в наборе данных содержится 12 зданий, в то время как в предметной области только 10) |
12 | Идентификатор | 2 |
Таблица D.3 - Коэффициент избыточных элементов
N | Компонент | Описание |
1 | Название | Коэффициент избыточных элементов |
2 | Краткое название | - |
3 | Название элемента | Присутствие |
4 | Базовая мера | Частота ошибок |
5 | Определение | Число избыточных элементов в наборе данных или выборке по отношению к числу элементов, которые должны быть представлены |
6 | Описание | - |
7 | Параметр | - |
8 | Тип значения | Real (вещественное) |
9 | Структура значения | - |
10 | Ссылка на источник | - |
11 | Пример | 10% (в наборе данных представлено на 10% больше зданий, чем в предметной области) |
12 | Идентификатор | 3 |
Таблица D.4 - Количество повторяющихся экземпляров объекта
N | Компонент | Описание | |
1 | Название | Количество повторяющихся экземпляров объекта | |
2 | Краткое название | - | |
3 | Название элемента | Присутствие | |
4 | Базовая мера | Подсчет ошибок | |
5 | Определение | Общее количество точных дубликатов экземпляров объектов в данных | |
6 | Описание | Количество всех элементов в наборе данных с дублированной геометрией, которые определяются некорректно | |
7 | Параметр | - | |
8 | Тип значения | Integer | |
9 | Структура значения | - | |
10 | Ссылка на источник | - | |
11 | Пример | Объекты с идентичными атрибутами и координатами: | |
две (или более) точки, расположенные поверх друг друга; | |||
две (или более) кривые, расположенные поверх друг друга; | |||
две (или более) поверхности, расположенные поверх друг друга | |||
12 | Идентификатор | 4 |
D.2.2 Отсутствие
Меры качества данных для элемента качества данных "отсутствие" представлены в таблицах D.5-D.7.
Таблица D.5 - Отсутствующий элемент
N | Компонент | Описание |
1 | Название | Отсутствующий элемент |
2 | Краткое название | - |
3 | Название элемента | Отсутствие |
4 | Базовая мера | Индикатор ошибок |
5 | Определение | Признак того, что элемент отсутствует в данных |
6 | Описание | - |
7 | Параметр | - |
8 | Тип значения | Булева переменная (значение "true" указывает на то, что элемент отсутствует) |
9 | Структура значения | - |
10 | Ссылка на источник | - |
11 | Пример | Спецификацией информационного продукта задается отбор всех башен выше 300 м. Мера качества данных "отсутствующий элемент" позволяет оценщику данных или их пользователю выдать отчет о том, что конкретный элемент, в данном случае объект типа "башня" (название зависит от схемы приложения), отсутствует. |
12 | Идентификатор | 5 |
Таблица D.6 - Число отсутствующих элементов