Число степеней свободы и уровни доверия
G.1 Введение
G.1.1 В настоящем приложении рассматривается общий вопрос получения из оценки измеряемой величины и суммарной стандартной неопределенности этой оценки расширенной неопределенности , которая определяет интервал , соответствующий некоторой высокой заданной вероятности охвата или уровню доверия . Таким образом, задача состоит в получении значения коэффициента охвата , определяющего интервал вокруг результата измерения, который предположительно охватывает большую заданную долю распределения значений, обоснованно приписываемых измеряемой величине (см. раздел 6).
G.1.2 В большинстве практических измерительных ситуаций расчет интервалов с заданными уровнями доверия (фактически оценивание наиболее характерных составляющих неопределенности для конкретных измерительных ситуаций) может быть выполнен только в некотором приближении. Так, даже выборочное стандартное отклонение среднего арифметического по 30 повторным наблюдениям нормально распределенной величины имеет собственную неопределенность около 13% (см. таблицу Е.1 приложения Е).
В большинстве случаев не имеет смысла различать интервал с уровнем доверия 95% (один шанс из 20, что значение измеряемой величины находится вне этого интервала) и интервал с уровнем доверия 94 или 96% (один шанс из 17 или 25 соответственно). Особенно трудно получить обоснованные оценки интервалов с уровнями доверия 99% (один шанс из 100) и выше (даже если допустить, что все систематические эффекты были приняты во внимание), поскольку это требует детальной информации о "хвостах" распределения входных величин, которая обычно недоступна.
G.1.3 Чтобы получить значение коэффициента охвата , образующего интервал с заданным уровнем доверия , необходимо иметь подробные сведения о законе распределения, характеризуемом результатом измерения и его суммарной стандартной неопределенностью. Например, для величины , описываемой нормальным распределением с математическим ожиданием и стандартным отклонением , легко можно рассчитать значение коэффициента охвата , который образует интервал , включающий долю этого распределения и, следовательно, имеющий вероятность охвата и уровень доверия . Некоторые примеры приведены в таблице G.1.
Таблица G.1 - Значения коэффициента охвата , образующего интервал с уровнем доверия для нормально распределенной случайной переменной
Уровень доверия , % | Коэффициент охвата |
68,27 | 1 |
90 | 1,645 |
95 | 1,960 |
95,45 | 2 |
99 | 2,576 |
99,73 | 3 |
Примечание - Для сравнения, если описывается прямоугольным распределением вероятностей с математическим ожиданием и стандартным отклонением , где - полуширина распределения, то уровень доверия будет равен 57,74% для 1; 95% для 1,65; 99% для 1,71 и 100% для . Прямоугольное распределение "уже" нормального в том смысле, что оно обладает конечной протяженностью и не имеет "хвостов".
G.1.4 Если известны распределения вероятностей входных величин , , ..., [их математические ожидания, дисперсии, а также, если эти величины не являются нормальными, моменты высших порядков (см. С.2.13 и С.2.22)], от которых зависит измеряемая величина , и если является линейной функцией входных величин, , то распределение вероятностей может быть получено сверткой распределений вероятностей входных величин (см. [10]). Таким образом, значения , образующие интервалы с заданным уровнем доверия , могут быть рассчитаны по этой свертке.
G.1.5 Если функциональная зависимость между и входными величинами нелинейна и ограничение членами первого порядка разложения в ряд Тейлора этой зависимости не может рассматриваться в качестве допустимого приближения (см. 5.1.2 и 5.1.5), то распределение вероятностей не является сверткой распределений входных величин. В таких случаях необходимо использовать другие аналитические или численные методы расчета.
G.1.6 На практике процедура свертки при расчете интервалов с заданными уровнями доверия не используется или используется крайне редко по следующим причинам: параметры распределения входной величины обычно не известны точно, а являются лишь оценками; трудно ожидать, что уровень доверия для данного интервала может быть известен с высокой точностью; реализация этой процедуры сложна с математической точки зрения. Вместо этого применяют приближения, основанные на центральной предельной теореме.
G.2 Центральная предельная теорема
G.2.1 Если измеряемая величина представляет собой линейную функцию входных величин, , и все входные величины распределены по нормальному закону, то распределение , являющееся сверткой распределений входных величин, также будет нормальным. Однако даже если распределения не являются гауссовыми, распределение все равно часто может быть аппроксимировано нормальным распределением, что следует из центральной предельной теоремы. Эта теорема гласит, что распределение будет приблизительно нормальным с математическим ожиданием и дисперсией , если - независимые случайные переменные, а много больше, чем вклад в общую сумму от любой случайной переменной , распределение которой отлично от нормального.
G.2.2 Особое значение центральной предельной теоремы обусловлено тем, что она демонстрирует очень важную роль, которую играют дисперсии распределений вероятностей входных величин по сравнению с моментами более высокого порядка при формировании свертки распределений, т.е. результирующего распределения вероятностей выходной величины . Более того, из центральной предельной теоремы следует, что свертка распределений стремится к нормальному распределению при увеличении числа элементов свертки, т.е. числа входных величин, вносящих свой вклад в ; что эта сходимость будет тем быстрее, чем ближе значения друг к другу (на практике это означает, что все оценки входных величин вносят сравнимую неопределенность в неопределенность оценки измеряемой величины ); и что чем ближе распределения к нормальному, тем меньшее число входных величин требуется, чтобы получить нормальное распределение для .
Пример - Прямоугольное распределение (см. 4.3.7 и 4.4.5) является примером распределения, весьма далекого от нормального, но свертка всего трех таких распределений, имеющих одинаковую ширину, позволяет получить почти нормальное распределение. Если обозначить полуширину такого прямоугольного распределения через так, что его дисперсия будет равна , то дисперсия свертки трех прямоугольных распределений будет иметь дисперсию , а границы интервалов с доверительной вероятностью 95 и 99% равны 1,937 и 2,379 соответственно, в то время как для нормального распределения с тем же стандартным отклонением эти границы определяются как 1,960 и 2,576 (см. таблицу G.1) [10].
Примечание 1 - Для интервала с уровнем доверия , превышающим приблизительно 91,7%, соответствующее значение для нормального распределения будет больше, чем для свертки любого количества прямоугольных распределений произвольной ширины.
Примечание 2 - Из центральной предельной теоремы следует, что распределение вероятностей среднего арифметического по наблюдениям случайной переменной с математическим ожиданием и конечным стандартным отклонением при приближается к нормальному распределению с математическим ожиданием и стандартным отклонением независимо от вида распределения вероятностей .
G.2.3 Практическим следствием центральной предельной теоремы является то, что, убедившись в соблюдении ее требований, в частности подтвердив на основе всего лишь нескольких наблюдений (для получения оценок стандартных неопределенностей по типу А) или на основе предположения о равномерном распределении (для получения оценок стандартных неопределенностей по типу В), что ни одна из составляющих неопределенности не является доминирующей, можно в качестве разумного первого приближения для расчета расширенной неопределенности , определяющей интервал с уровнем доверия , использовать значения для нормального распределения. Наиболее часто применяемые значения для нормального распределения приведены в таблице G.1.
G.3 -распределение и число степеней свободы
G.3.1 Чтобы получить приближение лучшее, чем обеспечивает использование значения для нормального распределения (см. G.2.3), следует понять, что расчет интервала с заданным уровнем доверия требует знания распределения не величины , а величины . Это связано с тем, что на практике известными являются не параметры распределения, а значения статистик: - оценки , полученной по формуле , где - оценка ; и суммарной дисперсии оценки , полученной по формуле , где - стандартная неопределенность (оценка стандартного отклонения) оценки .
Примечание - Строго говоря, в выражении под следует понимать . Для упрощения такая строгая запись была использована только в некоторых местах настоящего Руководства. Таким образом, в настоящем Руководстве одно и то же обозначение может использоваться для обозначения величины, для обозначения случайной переменной, представляющей данную величину, и для обозначения математического ожидания этой случайной переменной.
G.3.2 Если - нормально распределенная случайная переменная с математическим ожиданием и стандартным отклонением , - среднее арифметическое независимых наблюдений величины , а - выборочное стандартное отклонение от [см. формулы (3) и (5)], то случайная переменная описывается -распределением, иначе называемым распределением Стьюдента, (С.3.8) с степенями свободы.
Если рассмотреть простейший случай, когда измеряемая величина совпадает с нормально распределенной величиной , , в качестве оценки берется среднее арифметическое по независимым наблюдениям величины с выборочным стандартным отклонением , наилучшей оценкой является , а выборочное стандартное отклонение этой оценки есть , то величина будет иметь -распределение, и, соответственно,
(G.1a)