Прецизионность и определение систематической погрешности
А.1 Предварительные испытания
В процессе создания набора из пяти пластиковых эталонов была проведена серия межлабораторных испытаний. На основе результатов этой работы были сделаны выводы:
a) пластиковые эталоны оказались предпочтительнее стандартов-фотографий;
b) пластиковые эталоны не изменили уровень оценок;
c) отсутствие бокового освещения повысило уровень оценок;
d) оценка на уровне 0,5 балла шкалы улучшила прецизионность.
Эти выводы послужили основой для принятия набора пластиковых эталонов, использования бокового освещения и применения оценок с точностью до 0,5 балла.
А.2 Прецизионность
Используя принятый набор пластиковых эталонов, пять тканей, охватывающих диапазон оценок от 1 до 5 баллов, по три образца на ткань, были оценены шестью экспертами в каждой отдельной лаборатории (декабрь 1985 г.). В условиях, одинаковых для шести экспертов, этот набор данных предоставил несмещенную оценку распределения частоты оценок экспертов относительно ожидаемого значения оценки (или изменчивость, которая ожидается в оценках экспертов). Вследствие ограниченной и дискретной шкалы оценок эталонов был сделан вывод, что анализ методом дисперсий не применим к этому набору данных, но такая шкала не накладывает таких ограничений относительно распределения частот.
Из этого набора данных было определено, что эксперты оценивают индивидуальные образцы относительно ожидаемой оценки со следующей частотой:
оцененные как целый балл, ниже ожидаемого значения | 0,01111; | |||
оцененные как 0,5 балла, ниже ожидаемого значения | 0,13334; | |||
оцененные как ожидаемое значение (Е) | 0,60000; | |||
оцененные как 0,5 балла, выше ожидаемого значения | 0,20000; | |||
оцененные как целый балл, выше ожидаемого значения | 0,05555; | |||
в сумме | 1,00000. |
Начав с распределения оценок экспертов, близкого к нормальному (обозначенного как распределение 1), эти данные были использованы для расчета приведенных ниже дополнительных распределений: 2) вероятности различий между экспертами (единичное определение); 3) распределения результатов экспертов при трех оценках относительно ожидаемого значения; 4) вероятности различий между экспертами (три оценки на результат); 5) распределения результатов лаборатории, состоящих из результатов трех экспертов (девять оценочных определений, три на каждого из трех экспертов) относительно ожидаемого значения и 6) вероятности различий между результатами лабораторий (девять определений на один результат).
Придерживаясь принятых ограничений, основанных на обычном 0,05 (или, в некоторых случаях, немного более благоприятных), были установлены критические различия из трех разных распределений (см. таблицу А.1).
Таблица А.1 - Критические различия
Источник | Критическое различие (среднее) | Вероятность |
Между двумя экспертами (одно наблюдение на каждого) | 1 | 0,03 |
Между двумя экспертами (три наблюдения на каждого) | 0,67 | 0,02 |
Между двумя лабораториями (девять наблюдений на каждую) | 0,33; 0,50 | 0,05; 0,01 |
Вышеприведенные цифры основаны на результатах, полученных экспертами и лабораториями одного и того же уровня. Когда две или более лаборатории хотят сравнить результаты испытаний, рекомендуется, чтобы между ними был установлен лабораторный уровень путем оценок складок тканей известного происхождения и способа нанесения. Различия, превышающие критические (на той же самой ткани, с использованием тех же самых условий стирки и сушки), означают различия в уровнях лабораторий и указывают на необходимость устранения такой систематической погрешности.
А.3 Систематическая погрешность
Истинное значение внешнего вида складок после домашней стирки может быть определено только в терминах метода испытаний. Независимого метода определения истинного значения не существует.