БЕСПЛАТНО проверьте актуальность своей документации
с «Кодекс/Техэксперт АССИСТЕНТ»

ГОСТ Р ИСО 5479-2002

     

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

     

Статистические методы

     

ПРОВЕРКА ОТКЛОНЕНИЯ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

     

Statistical methods. Tests for departure of the probability distribution from the normal distribution



ОКС 03.120.30

Дата введения 2002-07-01


Предисловие

1 ПОДГОТОВЛЕН Акционерным обществом "Научно-исследовательский центр контроля и диагностики технических систем" (АО "НИЦ КД") на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4

2  ВНЕСЕН Техническим комитетом по стандартизации ТК 125 "Статистические методы в управлении качеством продукции"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Госстандарта России от 22 января 2002 г. N 25-ст

4 Настоящий стандарт представляет собой аутентичный текст международного стандарта ИСО 5479-97* "Статистическое представление данных. Проверка отклонения распределения вероятностей от нормального распределения" (ISO 5479:1997 "Statistical interpretation of data - Tests for departure from the normal distribution")

________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.

5 ВВЕДЕН ВПЕРВЫЕ

6 ПЕРЕИЗДАНИЕ. Март 2020 г.


Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

Введение


Настоящий стандарт устанавливает критерии, с помощью которых можно проверить, подчиняется ли генеральная совокупность данных нормальному закону распределения. Это следующие виды критериев: графический метод, направленный критерий, многонаправленный критерий, многосторонний критерий, совместный критерий для нескольких независимых выборок.

Целью настоящего стандарта является приведение критериев, удобных для использования специалистами в промышленности для проверки на нормальность различных данных в ходе проведения измерений, контроля и испытаний.

В настоящем стандарте рассматриваются способы построения статистик и правила принятия решений для критериев проверки на нормальность.

     1 Область применения

1.1 Настоящий стандарт устанавливает методы и критерии для проверки отклонения распределения вероятностей от нормального распределения при независимых наблюдениях.

1.2 Применение критерия на отклонение от нормального распределения необходимо во всех случаях, когда есть сомнение, нормально ли распределены наблюдения. В случае робастных методов (то есть таких, что результаты наблюдений незначительно изменяются, когда реальное распределение вероятностей наблюдений ненормально) критерий на отклонение от нормального распределения не применяют. Например, случай, когда выборочное среднее арифметическое единственной случайной выборки, полученной в результате наблюдений, необходимо сопоставить с данным теоретическим значением с использованием -критерия.

1.3 Необязательно использовать такой критерий при каждом обращении к статистическим методам, основанным на гипотезе нормальности. Существуют случаи, когда в нормальности распределения наблюдений нет сомнения: есть теоретические (например физические) обоснования, подтверждающие гипотезу, или гипотезу считают приемлемой согласно априорной информации.

1.4 Критерии на отклонение от нормального распределения, установленные в настоящем стандарте, в основном рассчитаны на полные, несгруппированные данные.

     2 Нормативные ссылки


В настоящем стандарте использована нормативная ссылка на следующий стандарт:

ГОСТ Р 50779.10 (ИСО 3534.1-93) Статистические методы. Вероятность и основы статистики. Термины и определения   

____________________

         Заменен. Действует ГОСТ Р ИСО 3534-1-2019.


Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты" за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.

     3 Определения и обозначения

3.1 Определения

В настоящем стандарте применены термины по ГОСТ Р 50779.10.

3.2 Обозначения

В настоящем стандарте использованы следующие обозначения:


- коэффициент критерия Шапиро-Уилка;

;

- вспомогательные величины для критерия Эппса-Палли;


- эмпирическая кривизна;


- эмпирическая асимметрия;


- математическое ожидание;


- вспомогательная величина для совместного критерия, использующего несколько независимых выборок;


- число последовательных выборок;


- нулевая гипотеза;


- альтернативная гипотеза;

- порядковый номер значений в выборке, упорядоченной в порядке неубывания;


- выборочный центральный момент порядка ;


- объем выборки;


- вероятность, связанная с -квантилью распределения вероятностей;


- вероятность;

- вероятность, связанная с ;


- вспомогательная величина для критерия Шапиро-Уилка;


- статистика критерия;


- статистика критерия Эппса-Палли;


- -квантиль стандартного нормального распределения;

- вспомогательная величина для совместного критерия, использующего несколько независимых выборок;


- статистика критерия Шапиро-Уилка;

- вспомогательная величина для совместного критерия, использующего несколько независимых выборок;


- случайная переменная;


- значение случайной переменной ;


- -е значение в выборке, упорядоченной в порядке неубывания;


- -e значение в выборке, упорядоченной в порядке неубывания;


- среднее арифметическое;


- уровень значимости;


- вероятность ошибки второго рода;


- кривизна совокупности;


- эксцесс совокупности;


- асимметрия совокупности;

; ;

- вспомогательные величины для совместного критерия, использующего несколько независимых выборок;

; ;

- коэффициенты совместного критерия, использующего несколько независимых выборок;


- математическое ожидание (центральный момент первого порядка);


- дисперсия совокупности (центральный момент второго порядка);


- центральный момент совокупности третьего порядка;


- центральный момент совокупности четвертого порядка;

- стандартное отклонение совокупности ().

     

     4 Общие положения

4.1 Существуют различные критерии на отклонение от нормальности. В настоящем стандарте установлены графические методы, моментные критерии, регрессионные критерии и критерии характеристических функций. Критерии хи-квадрат подходят только для сгруппированных данных, и так как группирование приводит к потере информации, в данном стандарте они не рассмотрены.

4.2 Если о выборке нет дополнительной информации, рекомендуется сначала построить нормальный вероятностный график, то есть построить кумулятивную функцию распределения значений, полученных в результате наблюдений, на бумаге для нормальных вероятностных графиков с осями координат, в которых кумулятивная функция нормального распределения представлена прямой линией.

Этот метод, установленный в разделе 5, позволяет сразу видеть, близко ли полученное распределение к нормальному. Используя данную дополнительную информацию, необходимо решить, какой критерий можно применить: направленный, регрессионный, критерий характеристической функции или никакой. Такое графическое представление нельзя рассматривать как строгий критерий, но даваемая им суммарная информация является существенным дополнением к любому критерию на отклонение от нормального распределения. В случае отклонения нулевой гипотезы эта информация дает возможность определить тип альтернативной гипотезы, которая могла бы быть применима.

4.3 Критерий на отклонение от нормального распределения имеет нулевую гипотезу, состоящую в том, что выборка содержит значений независимых наблюдений, подчиняющихся одному и тому же нормальному распределению. Он заключается в вычислении функции от этих значений, называемой статистикой критерия. Нулевую гипотезу о нормальности распределения принимают или отклоняют в зависимости от того, лежит ли статистика в области ожидаемых значений, соответствующих нормальному распределению.

4.4 Критическая область критерия - это совокупность значений , ведущих к отклонению нулевой гипотезы. Уровень значимости критерия - это вероятность получения значения в критической области, когда нулевая гипотеза верна. Этот уровень дает вероятность ошибочного отклонения нулевой гипотезы (вероятность ошибки первого рода).

Граница критической области (или в случае двустороннего критерия - границы критической области) - это критическое значение(я) статистики критерия.

4.5 Мощность критерия - это вероятность отклонения нулевой гипотезы, когда она неверна. Высокая мощность соответствует низкой вероятности ошибочного применения нулевой гипотезы (вероятности ошибки второго рода).