9.2.1 Классификация методов оценки качества данных
Процедура оценки качества данных включает один или более методов оценки качества данных. Методы оценки качества данных можно разделить на два основных класса: прямая (direct) оценка и косвенная (indirect) оценка. Методы прямой оценки определяют качество данных путем сравнения данных с внутренней и/или внешней информацией. Методы косвенной оценки выводят или оценивают качество данных, используя информацию о данных, такую как происхождение. Применение методов прямой оценки предпочтительнее косвенной оценки. Методы прямой оценки, в свою очередь, классифицируются по источнику информации, необходимой для выполнения оценки внутренней или внешней.
На рисунке 13 представлены классы описываемых методов оценки.
Примечание - Происхождение описано в ГОСТ Р 57668.
Рисунок 13 - Методы оценки качества данных
9.2.2 Прямая оценка (direct evaluation)
Метод прямой оценки - это метод оценки качества набора данных, основанный на проверке элементов в наборе данных.
Методы прямой оценки могут быть классифицированы на внутренние и внешние. Внутренняя прямая (internal direct) оценка качества данных использует только те данные, которые содержатся в оцениваемом наборе данных. Внешняя прямая (external direct) оценка качества требует применения эталонных данных, внешних по отношению к тестируемому набору данных.
Примечание - Эталонные данные - это данные, принятые как представляющие предметную область.
Как для внешних, так и для внутренних методов оценки может использоваться один из следующих методов проверки:
- полный контроль (full inspection);
- выборочный контроль (sampling).
При полном контроле тестируется каждый элемент в генеральной совокупности, определенной областью качества данных.
Примечание - Полный контроль больше всего подходит для небольших генеральных совокупностей или для тестов, которые могут быть выполнены в автоматическом режиме.
Выборочный контроль выполняется для проверки поднаборов пространственных данных, заданных областью качества данных.
Примечание - Примеры методов выборочной оценки даны в приложении F.
9.2.3 Косвенная оценка (indirect evaluation)
Метод косвенной оценки - это метод оценки качества набора данных на основе внешних знаний или накопленного опыта работы с информационным продуктом и может быть субъективным.
Эти внешние знания могут включать (но не ограничиваться ими) неколичественную информацию по качеству, такую как использование, происхождение и назначение (см. ГОСТ Р 57668) или другую отчетную информацию о качестве набора данных или данных, использованных для набора данных. Качество данных может быть оценено, например, на основе знаний об источнике, инструментах и методах, использованных для сбора данных и оцененных по отношению к процедурам и спецификациям, разработанным для этого продукта. Косвенная оценка качества данных также может быть основана только на опыте. Если указывается, что выполнена косвенная оценка, то должно быть указано также, как эта оценка была осуществлена.
В некоторых случаях может быть затруднительно или даже невозможно описать косвенно оцененное качество данных в виде количественного результата. В таких случаях качество данных может быть описано в текстовой форме с использованием описательного результата (см. 7.4.4.4).