Р 50.1.100-2014
Группа Т80
РЕКОМЕНДАЦИИ ПО СТАНДАРТИЗАЦИИ
Статистические методы
ТРИ ПОДХОДА К ИНТЕРПРЕТАЦИИ И ОЦЕНКЕ НЕОПРЕДЕЛЕННОСТИ ИЗМЕРЕНИЙ
Statistical methods. Three approaches for the interpretation and assessment of measurement uncertainty
ОКС 17.020
Дата введения 2015-12-01
Предисловие
1 РАЗРАБОТАНЫ Открытым акционерным обществом "Научно-исследовательский центр контроля и диагностики технических систем" (АО "НИЦ КД")
2 ВНЕСЕНЫ Техническим комитетом по стандартизации ТК 125 "Применение статистических методов"
3 УТВЕРЖДЕНЫ И ВВЕДЕНЫ В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 11 ноября 2014 г. N 1579-ст
4 Настоящие рекомендации разработаны с учетом основных нормативных положений международного документа ISO/TR 13587:2012* "Три статистических подхода к оценке и интерпретации неопределенности измерений" (ISO/TR 13587:2012 "Three statistical approaches for the assessment and interpretation of measurement uncertainty", NEQ)
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.
5 ВВЕДЕНЫ ВПЕРВЫЕ
Правила применения настоящих рекомендаций установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящим рекомендациям публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящих рекомендаций соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
Принятие Руководства ИСО/МЭК 98-3 (GUM) привело к возрастающему признанию необходимости включать указание неопределенности в результаты измерений. Аккредитация лабораторий на основе ГОСТ ИСО/МЭК 17025ускорила этот процесс. Признавая, что указание неопределенности необходимо для принятия решений, метрологи в лабораториях всех типов (от национальных институтов метрологии до коммерческих лабораторий калибровки) проявляют значительные усилия по разработке соответствующих оценок неопределенности для различных типов измеряемых величин и методов, приведенных в GUM.
_______________
Национальный стандарт ГОСТ Р 54500.3-2011/Руководство ИСО/МЭК 98-3:2008 "Неопределенность измерения. Часть 3. Руководство по выражению неопределенности измерения" идентичен ISO/IEC Guide 98-3:2008 (см. [1]).
Национальный стандарт ГОСТ ИСО/МЭК 17025-2009 "Общие требования к компетентности испытательных и калибровочных лабораторий" идентичен ISO/IEC 17025:2005 (см. [2]).
Некоторым преимуществом процедур, описанных и популяризированных в GUM, является стандартизированный подход к определению оценки неопределенности с адаптацией к источникам неопределенности, которая может быть статистической (тип А) или нестатистической (тип В), с акцентом на отчетах обо всех источниках рассматриваемой неопределенности. В основе подхода распространения неопределенности GUM лежит линейная аппроксимация функции измерений. Во многих практических ситуациях такой подход дает результаты, аналогичные полученным более формальными методами. Таким образом, принятие GUM произвело революцию в оценке неопределенности.
Конечно, необходимо много усилий для улучшения оценки неопределенности в практических ситуациях. Совместный комитет по руководствам в метрологии (JCGM), ответственный за GUM с 2000 года, закончил Дополнение 1 к GUM, а именно "Неопределенность измерения. Часть 3. Руководство по выражению неопределенности измерения. Дополнение 1. Трансформирование распределений с использованием метода Монте-Карло" (называемый GUMS1). В настоящее время JCGM разрабатывает также другие дополнения к GUM в таких направлениях, как моделирование и модели с любым количеством выходных величин.
Применительно к широкому кругу измерительных задач в Руководстве ИСО/МЭК 99:2007 (см. [4]) приведено достаточно общее определение неопределенности измерения как неотрицательного параметра, характеризующего разброс значений, приписываемых измеряемой величине, на основе используемой информации. В результате определение и понимание функций различных статистических величин при определении оценки неопределенности, даже в хорошо понятных применениях измерений особенно интересны как статистикам, так и метрологам.
Ранее проводились исследования этих проблем с метрологической точки зрения. Некоторые авторы исследовали статистические свойства процедур, установленных в GUM. В [5] показано, что к этим процедурам непосредственно не применимы байесовская и фидуциальная интерпретация. В [6] предложено несколько модифицированных процедур GUM, которые дают результаты, более согласованные с интерпретацией Байеса в некоторых случаях. В [7] рассмотрено соотношение между процедурами определения оценки неопределенности, предложенной в GUMS1 (см. [3]) и результатами байесовского анализа для моделей особого вида. В [8] рассмотрены возможные вероятностные интерпретации интервалов охвата и даны рекомендации по аппроксимации апостериорного распределения для этого класса байесовского анализа распределений вероятностей семейства распределений Пирсона.
В [9] приведено сопоставление частотного и байесовского подходов для определения оценки неопределенности. Однако исследование выполнено только для измерительных систем, причем для всех источников неопределенности могут быть использованы оценки типа А. Напротив, в настоящих рекомендациях рассмотрены и иллюстрированы несколькими примерами измерительные системы с источниками неопределенности, для которых использованы оценки типа А и В.
Статистики потратили много сил на использование методов определения оценок неопределенности, имеющих вероятностное обоснование или интерпретацию. В результате их работы (часто вне метрологии) было разработано несколько подходов, относящихся к оценке неопределенности. В настоящих рекомендациях представлены некоторые из этих подходов и со статистической точки зрения рассмотрена их связь с методами, используемыми в настоящее время в метрологии. Статистическими подходами, для которых описаны различные методы определения оценки неопределенности, являются частотный, байесовский и фидуциальный подходы, рассмотренные в настоящих рекомендациях.
В настоящих рекомендациях рассмотрены три основных статистических подхода к интерпретации и оценке неопределенности измерений: частотный подход, байесовский подход и фидуциальный подход. Общая черта этих подходов - четкая вероятностная интерпретация интервалов неопределенности. Для каждого подхода описаны основной метод, предположения и вероятностная интерпретация неопределенности. В настоящих рекомендациях также рассмотрено соотношение этих статистических подходов с методами, предложенными в ГОСТ Р 54500.3-2011 (далее GUM).
В настоящих рекомендациях использованы нормативные ссылки на следующие стандарты:
ГОСТ ИСО/МЭК 17025-2009 Общие требования к компетентности испытательных и калибровочных лабораторий
ГОСТ Р 50779.10-2000 Статистические методы. Вероятность и основы статистики. Термины и определения
ГОСТ Р 50779.11-2000 Статистические методы. Статистическое управление качеством. Термины и определения
ГОСТ Р 54500.3-2011/Руководство ИСО/МЭК 98-3:2008 Неопределенность измерения. Часть 3. Руководство по выражению неопределенности измерения
ГОСТ Р 54500.3.1-2011/Руководство ИСО/МЭК 98-3:2008 Дополнение 1:2008 Неопределенность измерения. Часть 3. Руководство по выражению неопределенности измерения по выражению неопределенности измерения. Дополнение 1. Трансформирование распределений с использованием метода Монте-Карло
Примечание - При пользовании настоящими рекомендациями целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты" за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящих рекомендаций в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.
В настоящих рекомендациях применены термины по ГОСТ Р 50779.10, ГОСТ Р 50779.11, а также следующие термины с соответствующими определениями.
3.1 эмпирическая функция распределения, эмпирическая интегральная (кумулятивная) функция распределения (empirical distribution function, empirical cumulative distribution function): Функция распределения, присваивающая вероятность 1/ каждому из элементов случайной выборки и представляющая собой ступенчатую функцию вида
,
где {, ..., } - выборка, и - количество элементов, удовлетворяющих условию
3.2 байесовский анализ (Bayesian sensitivity analysis): Анализ влияния априорных распределений параметров статистической модели на апостериорное распределение измеряемой величины.
3.3 достаточная статистика (sufficient statistic): Функция выборки , ..., из распределения, функция плотности вероятностей которой зависит от параметра , а условное распределение , ..., при заданном значении статистики не зависит от .
Примечание - Достаточная статистика содержит всю информацию о параметре , как функции , ..., .
3.4 модель наблюдений (observation model): Математическая связь результатов измерений (наблюдений) измеряемой величины и соответствующей случайной ошибки погрешности измерений.
3.5 структурное уравнение (structural equation): Статистическая модель, связывающая наблюдаемую случайную величину с неизвестными параметрами и ненаблюдаемой случайной величиной, распределение которой известно и не зависит от неизвестных параметров.
3.6 нецентральное хи-квадрат распределение (non-central chi-squared distribution): Нецентральное распределение вероятностей, представляющее собой обобщение центрального -распределения.
Примечание 1 - Для нормально распределенных случайных величин со средним и дисперсией случайная величина имеет нецентральное -распределение. Нецентральное -распределение имеет два параметра: - число степеней свободы (количество ) и , который зависит от средних случайных величин и называется параметром нецентральности.
Примечание 2 - Плотность -распределения представляет собой смесь плотностей центральных распределений:
,
где подчиняется -распределению с степенями свободы.
В настоящих рекомендациях использованы для обозначений греческие и латинские буквы. Греческие буквы использованы для обозначения параметров статистической модели (например, измеряемых величин), которые могут быть и случайными величинами и постоянными величинами в зависимости от используемого статистического подхода и модели. Прописные латинские буквы использованы для обозначения случайных величин, которые могут принимать различные значения при наблюдениях, и строчные латинские буквы для обозначения наблюдаемых значений величин (например, результатов измерений). В некоторых случаях использованы другие обозначения. Однако в этом случае смысл обозначений ясен из контекста.
5.1 В настоящих рекомендациях рассмотрена модель измерений:
, (1)
где , ..., - входные величины;
- выходная величина;
- функция измерений.
Функция определена математически в виде формулы или алгоритма вычислений. В GUM (примечание 1, 4.1) те же самые функциональные зависимости определены соотношением
, (2)
которое сложно отличить от функции измерений, определяющей зависимость случайной величины от результатов наблюдений входной величины.
В соответствии с процедурой, рекомендованной GUM, для неизвестных величин определяют оценки , .., по значениям , ..., полученным при выполнении измерений или из других источников. Соответствующие стандартные неопределенности также получают по имеющимся данным с помощью статистических методов или плотностей вероятностей, построенных на основе экспертных знаний о переменных. В GUM (см. также п.4.5 в [11]) модель измерений, связывающую измеряемую величину с входными величинами , ..., рекомендовано использовать также для вычисления функции, описывающей зависимость от , ..., . Таким образом, результат измерений (или оценка) для имеют вид