Статус документа
Статус документа

ГОСТ Р ИСО 3534-1-2019 Статистические методы. Словарь и условные обозначения. Часть 1. Общие статистические термины и термины, используемые в теории вероятностей

     1 Общие статистические термины

1.1 (генеральная) совокупность: Множество всех рассматриваемых единиц.

en

population

fr

population

Примечание 1 - Совокупность может состоять из реальных объектов и быть конечной, может состоять из реальных объектов и быть бесконечной или может быть полностью гипотетической. Иногда используют термин "конечная совокупность", особенно в ситуациях, связанных с получением конечных выборок. Подобным образом термин "бесконечная совокупность" используют в случае выборки из континуума. В главе 2 совокупность рассматривается в вероятностном контексте как пространство элементарных событий (2.1).

Примечание 2 - Гипотетическая совокупность позволяет делать различные предположения о природе ожидаемых данных. Таким образом, гипотетическая совокупность полезна на стадии статистических исследований, особенно при выборе подходящего объема выборки. Гипотетическая совокупность может состоять из конечного или бесконечного числа элементов. Ее использование особенно полезно при работе с аналитическими статистиками в статистических исследованиях.

Примечание 3 - Область применения исследований определяет свойства совокупности. Например, если для демографического или медицинского исследования выбраны три населенных пункта, то генеральная совокупность состоит из жителей данных конкретных населенных пунктов. Однако если эти три населенных пункта выбраны случайным образом среди всех населенных пунктов заданного региона, то совокупность состоит из всех жителей данного региона.

1.2 выборочная единица: Одна из конкретных единиц, из которых состоит генеральная совокупность (1.1).

en

sampling unit

Примечание - В зависимости от обстоятельств единицей может быть человек, семья, учебное заведение, административное подразделение и т.д.

fr

-
nage

1.3 выборка: Подмножество генеральной совокупности (1.1), состоящее из одной выборочной единицы (1.2) или более.

en

sample

Примечание 1 - В зависимости от рассматриваемой генеральной совокупности выборочными единицами могут быть предметы, числовые значения или даже абстрактные объекты.

Примечание 2 - Определение выборки, приведенное в ИСО 3534-2, включает пример схемы отбора выборки, которая необходима при отборе случайной выборки из конечной совокупности.

fr

1.4 наблюдаемое значение: Значение исследуемой характеристики, полученное в результате единичного наблюдения.

en

observed value

Примечание 1 - Часто используемые синонимы данного понятия - это "реализация" и "данная величина". Множественное число от понятия "данная величина" - данные.

Примечание 2 - Определение не указывает на происхождение или способ получения данного значения. Значение может представлять только одну реализацию случайной величины (2.10), но это не является общей ситуацией. Последующему статистическому анализу может быть подвергнута одна из нескольких реализаций случайной величины. Несмотря на то что соответствующие выводы требуют некоторого статистического обоснования, ничто не препятствует вычислительной обработке или графическому представлению наблюдаемых значений. Только при появлении таких вопросов, как определение вероятности появления конкретного набора реализаций случайной величины, применение статистических методов обработки данных становится уместным и важным. Предварительный этап изучения наблюдаемых значений, как правило, относят к анализу данных.

fr

valeur

1.5 описательная статистика: Краткое представление наблюдаемых значений (1.4) в графическом, численном или ином виде.

en

descriptive statistics

Пример 1 - Численные сводки включают выборочное среднее (1.15), выборочный размах (1.10), выборочное стандартное отклонение (1.17) и т.д.

Пример 2 - Примеры графических представлений включают "ящики с усами", диаграммы, графики "квантиль-квантиль", графики нормального квантиля, диаграммы рассеяния, множественные диаграммы рассеяния и гистограммы.

fr

statistique descriptive

1.6 случайная выборка: Выборка (1.3), отобранная методом случайного отбора.

en

random sample

________________

Случайный отбор - метод образования выборки из генеральной совокупности, при котором для каждого элемента генеральной совокупности существует предполагаемая вероятность попасть в выборку.


Примечание 1 - Данное определение имеет меньше ограничений, чем приведенное в ИСО 3534-2, которое допускает наличие бесконечной генеральной совокупности.

Примечание 2 - Когда выборка из выборочных единиц отобрана из конечного пространства элементарных событий (2.1), каждая из возможных комбинаций выборочных единиц имеет свою вероятность (2.5) быть отобранной. Для выборочных планов данных опроса конкретная вероятность каждой возможной комбинации может быть вычислена заранее.

Примечание 3 - Для выборочных планов данных опроса, составляемых для конечного пространства элементарных событий, случайная выборка может быть отобрана с помощью различных планов отбора выборки, таких как планы отбора стратифицированной случайной выборки, систематической случайной выборки, групповой выборки, выборки с вероятностью отбора пропорционально величине вспомогательной переменной, а также с помощью различных других планов.

Примечание 4 - Как правило, определение относят к фактическим наблюдаемым значениям (1.4). Эти наблюдаемые значения считают реализациями случайных величин (2.10), и каждое наблюдаемое значение соответствует одной случайной величине. Если оценки (1.12), статистические критерии для проверки статистических гипотез (1.48) и доверительные интервалы (1.28) получены на основе случайной выборки, определение дополняют ссылкой на случайные величины, возникающие в большей степени на основе абстрактных объектов выборки, чем на основе фактически наблюдаемых значений этих случайных величин.

Примечание 5 - Случайные выборки из бесконечной генеральной совокупности часто генерируют путем многократного отбора из пространства элементарных событий таким образом, что выборка состоит из независимых одинаково распределенных случайных величин в соответствии с интерпретацией данного определения, приведенной в примечании 4.

fr

1.7 простая случайная выборка: Случайная выборка (1.6) из конечной генеральной совокупности, такая, что всем подмножествам заданного объема соответствует одна и та же вероятность быть отобранными.

en

simple random sample

Примечание - Данное определение гармонизировано с определением, приведенным в ИСО 3534-2, хотя и имеет немного отличную формулировку.

fr

simple

1.8 статистика: Полностью определенная функция случайных величин (2.10).

en

statistic

fr

statistique

Примечание 1 - Для случайной выборки (1.6), понимаемой в смысле примечания 4 к 1.6, статистика представляет собой функцию случайных величин.

Примечание 2 - В соответствии с примечанием 1, если - случайная выборка из нормального распределения (2.50) с неизвестным математическим ожиданием (2.35) и неизвестным стандартным отклонением (2.37) , то выражение представляет собой статистику, называемую выборочным средним (1.15), тогда как выражение не является статистикой, так как включает неизвестное значение параметра (2.9) .

Примечание 3 - Приведенное определение является формальным и соответствует трактовке, используемой в математической статистике. В приложениях многочисленные статистические данные, в частности статистики, могут иметь отношение к различным областям технических знаний, включающим анализ действий, представленный в международных стандартах ISO/TC 69.

1.9 порядковая статистика: Статистика (1.8), определяемая порядковым номером случайной величины (2.10) в ряду случайных величин, расположенных в неубывающем порядке.

en

order statistic


Пример - Пусть выборка состоит из наблюдаемых значений (1.4): 9, 13, 7, 6, 13, 7, 19, 6, 10 и 7. Наблюдаемые значения в порядке неубывания: 6, 6, 7, 7, 7, 9, 10, 13, 13, 19. Эти значения являются реализациями порядковых статистик , ..., .

Примечание 1 - Пусть наблюдаемые значения (1.4), составляющие случайную выборку (1.6), образующие множество , при сортировке в неубывающем порядке обозначены следующим образом: . Тогда представляют собой наблюдаемые значения порядковой статистики , а - наблюдаемое значение -й порядковой статистики.

Примечание 2 - На практике определение порядковых статистик для набора данных сводится к сортировке данных, как формально описано в примечании 1. Отсортированные данные применяют для определения полезных сводных статистик, как представлено в нескольких следующих определениях.

Примечание 3 - Порядковая статистика представляет собой выборочное значение, соответствующее его позиции в последовательности данных после их ранжирования в неубывающем порядке. Как показано в примере, легче понять сортировку выборочных значений (реализаций случайных величин), чем сортировку ненаблюдаемых случайных величин. Тем не менее можно представлять случайные величины из случайной выборки (1.6), упорядоченной в неубывающем порядке. Например, максимальное значение набора из случайных величин может быть изучено заранее на основе его реализованного значения.

Примечание 4 - Отдельная порядковая статистика представляет собой полностью заданную функцию случайной величины. Эта функция является идентификатором положения или ранга случайной величины в отсортированном наборе случайных величин.

Примечание 5 - Потенциальную проблему представляет ранжирование совпадающих значений, особенно для дискретных случайных величин и для значений, полученных с низкой точностью. Формулировка "неубывающий порядок" точнее, чем "возрастающий порядок", при учете всех тонкостей процесса ранжирования данных. Необходимо акцентировать внимание на том, что совпадающие значения сохраняют при обработке данных, а не заменяют одним значением. В примере, представленном выше, две реализации, "6" и "6", представляют собой совпадающие значения.

Примечание 6 - Упорядочивание выполняют на основе фактических значений, а не на основе абсолютных значений случайных величин.

Примечание 7 - Полный набор порядковых статистик составляет случайную величину размерности , где - число наблюдений в выборке.

Примечание 8 - Компоненты порядковой статистики также рассматривают как порядковые статистики, но снабженные спецификатором, указывающим их номер в упорядоченной последовательности значений в выборке.

Примечание 9 - Минимальное и максимальное значения, а также при нечетном объеме выборки выборочная медиана (1.13) представляют собой частные случаи порядковых статистик. Например, для выборки объема 11 единиц, - минимум, - максимум и - выборочная медиана.

en

statistique d’ordre

1.10 выборочный размах: Разность между значениями наибольшей и наименьшей порядковых статистик (1.9).

en

sample range

Пример - Для примера, рассмотренного в 1.9, выборочный размах, полученный на основе наблюдений, равен 19-6=13.

Примечание - В статистическом управлении процессами выборочный размах часто используют для отслеживания дисперсии процесса, особенно при относительно небольших объемах выборки.

fr

1.11 середина размаха: Среднее арифметическое (1.15) наименьшей и наибольшей порядковых статистик (1.9).

en

mid-range

Пример - В примере, рассмотренном в 1.9, середина размаха на основе наблюдений равна (6+19)/2=12,5.

Примечание - Середина размаха дает быструю и простую оценку середины небольших наборов данных.

fr

milieu de

1.12 оценка: статистика (1.8), используемая для оценивания (1.36) параметра .

en

estimator

fr

estimateur

Примечание 1 - Оценкой может быть выборочное среднее (1.15) при определении оценки математического ожидания (2.35) генеральной совокупности, которое может быть обозначено . Для такого распределения (2.11), как нормальное распределение (2.50), естественной оценкой математического ожидания генеральной совокупности является выборочное среднее.

Примечание 2 - При определении оценок характеристик генеральной совокупности [например, моды (2.27) для одномерного распределения (2.16)] подходящей оценкой может быть функция оценки(ок) параметра распределения или сложная функция случайной выборки (1.6).

Примечание 3 - Термин "оценка" использован в широком смысле. Он включает в себя как точечную, так и интервальную оценки параметра, которые могут быть использованы для прогнозирования (иногда их рассматривают как прогностические факторы). Оценка также может включать в себя такие функции, как ядерные оценки и другие специальные статистики. Дополнительная информация приведена в примечаниях к 1.36.

1.13 выборочная медиана: Значение -й порядковой статистики (1.9) при нечетном объеме выборки (см. ИСО 3534-2:2006, 1.2.26); значение суммы -й и -й порядковых статистик, деленной на два, при четном объеме выборки .

en

sample median


Пример - В примере, приведенном в 1.9, значение 8 представляет собой реализацию выборочной медианы. В этом случае (четный объем выборки равен 10) 5-е и 6-е значения составили 7 и 9, их среднее равно 8. На практике это заносят в отчет в виде "выборочная медиана равна 8", хотя, строго говоря, выборочная медиана является случайной величиной.

Примечание 1 - Для случайной выборки (1.6) объема случайные величины (2.10), которые расположены в неубывающем порядке от 1 до , выборочная медиана - это -я случайная величина в случае нечетного объема выборки. При четном объеме выборки выборочная медиана равна среднему арифметическому -й и -й случайных величин.

Примечание 2 - Упорядочивание случайных величин, для которых наблюдения отсутствуют, может казаться невозможным. Тем не менее в рамках работы с порядковыми статистиками данный анализ может быть произведен. На практике получают наблюдаемые значения и, сортируя эти значения, реализации порядковых статистик. Данные реализации могут быть проинтерпретированы исходя из структуры порядковых статистик случайной выборки.

Примечание 3 - Выборочная медиана является оценкой середины распределения, с каждой стороны от которой лежит половина выборки.

Примечание 4 - На практике выборочная медиана полезна как оценка, не чувствительная к наличию в выборке сильно удаленных крайних значений. Например, в обзорах в качестве "среднего дохода" и "средней цены на жилье" часто указывает медиану.

fr

1.14 выборочный момент порядка ; : Сумма -х степеней случайных величин (2.10) случайной выборки (1.6), деленная на число наблюдений в выборке (1.3).

en

sample moment of order k


Примечание 1 - Для случайной выборки объема , т.е. для , выборочный момент порядка , - это

.


Примечание 2 - Кроме того, данное понятие можно характеризовать как начальный выборочный момент порядка .

Примечание 3 - Выборочный момент порядка 1, представленный в следующем определении, является выборочным средним (1.15).

Примечание 4 - Хотя определение дано для произвольного , на практике, как правило, рассматривают следующие значения : 1 [выборочное среднее (1.15)], 2 [связано с выборочной дисперсией (1.16) и выборочным стандартным отклонением (1.17)], 3 [связано с выборочным коэффициентом асимметрии (1.20)] и 4 [связано с выборочным коэффициентом эксцесса (1.21)].

Примечание 5 - Использование буквы "" в записи связано с тем, что с этой буквы начинается английская запись понятий "ожидаемое значение" ("expected value") и "ожидание" ("expectation").

fr

moment d’ordre k

1.15 выборочное среднее; среднее арифметическое: Сумма случайных величин (2.10) случайной выборки (1.6), деленная на число слагаемых в этой сумме.

en

sample mean (average, arithmetic mean)

Пример - В примере, приведенном в 1.9, значение выборочного среднего составляет 9,7, т.к. сумма наблюдаемых значений равна 97, а объем выборки равен 10.

Примечание 1 - Рассматриваемое как статистика выборочное среднее представляет собой функцию случайных величин из случайной выборки в смысле, указанном в примечании 3 к 1.8. Необходимо отличать функцию от численного значения выборочного среднего, вычисленного на основе наблюдаемых значений (1.4) случайной выборки.

Примечание 2 - Рассматриваемое как статистика выборочное среднее часто используют как оценку математического ожидания (2.35) генеральной совокупности. Часто используемым синонимом является арифметическое среднее.

Примечание 3 - Для случайной выборки объема , т.е. для , выборочное среднее - это

.


Примечание 4 - Выборочное среднее является моментом первого порядка.

Примечание 5 - Для выборки объема, равного двум, выборочное среднее, выборочная медиана (1.13) и середина размаха (1.11) совпадают.

fr

moyenne (moyenne, moyenne )

1.16 выборочная дисперсия; : Сумма квадратов отклонений случайных величин (2.10) случайной выборки (1.6) от их выборочного среднего (1.15), деленная на число слагаемых в этой сумме минус один.

en

sample variance

Пример - Для примера, приведенного в 1.9, значение выборочной дисперсии составляет 17,57. Сумма квадратов отклонений от выборочного среднего равна 158,10; данная сумма поделена на число 9, что составляет объем выборки 10 минус один.

Примечание 1 - Рассматриваемая как статистика (1.8) выборочная дисперсия является функцией случайных величин случайной выборки. Данную статистику (1.12) следует отличать от численного значения выборочной дисперсии, вычисленной на основе наблюдаемых значений (1.4) случайной выборки. Это численное значение называют эмпирической выборочной дисперсией или наблюдаемой выборочной дисперсией и обычно обозначают .

Примечание 2 - Для случайной выборки объема , т.е. для , с выборочным средним , выборочная дисперсия - это

.


Примечание 3 - Выборочная дисперсия - это статистика, которая "почти" совпадает со средним арифметическим квадратных отклонений случайных величин (2.10) от их выборочного среднего (так как сумму делят не на , а на ). Использование дает несмещенную оценку (1.34) дисперсии генеральной совокупности (2.36).

Примечание 4 - Величину называют числом степеней свободы (2.54).

Примечание 5 - Выборочная дисперсия является вторым выборочным моментом случайных величин нормализованной выборки (1.19).

fr

variance

1.17 выборочное стандартное отклонение; : Неотрицательное значение квадратного корня из выборочной дисперсии (1.16).

en

sample standard deviation

Пример - Для примера, приведенного в 1.9, значение выборочного стандартного отклонения составляет 4,192, т.к. полученная выборочная дисперсия составляет 17,57.

Примечание 1 - На практике выборочное стандартное отклонение используют для определения оценки стандартного отклонения (2.37). также является случайной величиной (2.10), а не значением, полученным по реализации случайной выборки (1.6).

Примечание 2 - Выборочное стандартное отклонение является мерой разброса распределения (2.11).

fr

-type

1.18 выборочный коэффициент вариации: Выборочное стандартное отклонение (1.17), деленное на выборочное среднее (1.15).

en

sample coefficient of variation

Примечание - Как и в случае коэффициента вариации (2.38), полезность этой статистики ограничена генеральными совокупностями, содержащими положительные значения. Величину выборочного коэффициента вариации обычно представляют в процентах. На практике выборочный коэффициент вариации, как правило, применяют, когда вариация возрастает пропорционально среднему.

fr

coefficient de variation

1.19 стандартизованная выборочная случайная величина: Разность случайной величины (2.10) и ее выборочного среднего (1.15), деленная на выборочное стандартное отклонение (1.17).

en

standardized sample random variable

Пример - Для примера, приведенного в 1.9, полученное выборочное среднее составляет 9,7, а полученное выборочное стандартное отклонение - 4,192; таким образом, полученные значения стандартизованной выборки составляют: -0,17; 0,79; -0,64; -0,88; 0,79; -0,64; 2,22; -0,88; 0,07; -0,64.

Примечание 1 - Стандартизованную выборочную случайную величину следует отличать от ее теоретического аналога - стандартизованной случайной величины (2.33). Целью стандартизации случайной величины является ее преобразование в случайную величину с нулевым математическим ожиданием и стандартным отклонением, равным единице; данное преобразование проводят для простоты интерпретации и сравнения данных.

Примечание 2 - Стандартизованные наблюдаемые значения имеют нулевое наблюдаемое среднее и наблюдаемое стандартное отклонение, равное единице.

fr

variable

1.20 выборочный коэффициент асимметрии: Среднее арифметическое стандартизованных выборочных случайных величин (1.19) случайной выборки (1.6) в третьей степени.

en

sample coefficient of skewness

Пример - Для примера, приведенного в 1.9, получен выборочный коэффициент асимметрии 0,97188. Для такого объема выборки (n=10) выборочный коэффициент асимметрии имеет высокую изменчивость, поэтому требует осторожности при использовании. Применение альтернативной формулы, представленной в примечании 1, дает значение 1,34983.

Примечание 1 - Определению соответствует следующая формула:

.


Некоторые программы статистической обработки данных с целью корректировки смещения (1.33) используют для вычисления выборочного коэффициента асимметрии следующую формулу:

,


где .

При больших объемах выборок разность значений этих двух оценок пренебрежимо мала. Отношение несмещенной оценки к смещенной для 10 составляет 1,389, для 100-1,031 и для 1000.

Примечание 2 - Асимметрия характеризует симметричность распределения. Близкие к нулю значения данной статистики указывают на то, что рассматриваемое распределение очень близко к симметричному, тогда как ненулевые значения соответствуют тому, что, вероятно, существуют случайные всплески значений по одну сторону от центра распределения. Асимметричность данных также отражает различие в значениях выборочного среднего (1.15) и выборочной медианы (1.13). Положительная асимметрия (правосторонняя асимметрия) данных указывает на возможное наличие нескольких экстремально больших значений. Подобным образом отрицательная асимметрия указывает на возможное наличие нескольких экстремально малых значений.

Примечание 3 - Выборочный коэффициент асимметрии является третьим выборочным моментом стандартизованной выборочной случайной величины (1.19).

fr

coefficient

1.21 выборочный коэффициент эксцесса; выборочный эксцесс: Среднее арифметическое стандартизованных выборочных случайных величин (1.19) случайной выборки (1.6).

en

sample coefficient of kurtosis

Пример - Для примера, приведенного в 1.9, получен выборочный коэффициент эксцесса 2,67419. Для выборки такого же объема, как и в данном примере, выборочный коэффициент эксцесса (n=10) имеет высокую изменчивость, поэтому при использовании требуется осторожность. Программные пакеты статистической обработки позволяют варьировать настройки при вычислении выборочного коэффициента эксцесса (см. примечание 3 к 2.40). При использовании альтернативной формулы, приведенной в примечании 1, вычисленное значение составляет 0,43605. Два полученных значения, 2,67419 и 0,43605, непосредственно не сопоставимы. Для их сравнения рассматривают разность 2,67419-3 (3 вычитают для сопоставления с эксцессом нормального распределения), которая равна -0,32581, эту величину можно сравнивать с 0,43605.

Примечание 1 - Определению соответствует следующая формула:

.


В некоторых программных пакетах статистической обработки данных с целью корректировки смещения (1.33) и определения отклонения от эксцесса нормального распределения выборочный коэффициент эксцесса вычисляют по следующей формуле:

,


где ;

Второй член формулы при достаточно больших приближается к значению 3. Иногда эксцессом считают выражение, приведенное в 2.40, минус 3 для сопоставления с эксцессом нормального распределения. Специалист, работающий с программами статистической обработки данных, может регулировать соответствующие настройки.

Примечание 2 - Эксцесс характеризует тяжесть хвостов унимодального распределения. Для нормального распределения (2.50) с учетом вариабельности выборки выборочный коэффициент эксцесса приблизительно равен 3. На практике эксцесс нормального распределения представляет собой эталонное или базовое значение. Распределения (2.11), у которых значение эксцесса менее 3, имеют более легкие хвосты, чем хвосты нормального распределения; распределения (2.11), у которых значение эксцесса более 3, имеют более тяжелые хвосты, чем у нормального распределения.

Примечание 3 - Для наблюдаемых значений эксцесса, значительно превосходящих 3, существует вероятность того, что хвосты рассматриваемого распределения значимо тяжелее, чем хвосты нормального распределения. Выборка может содержать наблюдения из другого источника или ошибочные записи.

Примечание 4 - Выборочный коэффициент эксцесса является 4-м выборочным моментом стандартизованных выборочных случайных величин.

fr

coefficient d’aplatissement

1.22 выборочная ковариация; : Сумма произведений отклонений пар случайных величин (2.10) случайной выборки (1.6) от их выборочных средних (1.15), деленная на число слагаемых минус единица.

en

sample covariance


Пример 1 - Наблюдаемые значения представляют собой десять групп упорядоченных чисел, по три числа в каждой группе. Для настоящего примера использованы только первые два числа группы (x, y).


Таблица 1 - Результаты наблюдений для примера 1

fr

covariance

i

1

2

3

4

5

6

7

8

9

10

x

38

41

24

60

41

51

58

50

65

33

y

73

74

43

107

65

73

99

72

100

48

z

34

31

40

28

35

28

32

27

27

31

Выборочное среднее для X составляет 46,1, а для Y составляет 75,4. Соответствующая выборочная ковариация равна:

[(38-46,1)·(73-75,4)+(41-46,1)·(74-75,4)+...+(33-46,1)·(48-75,4)]/9=257,178.

Пример 2 - В таблице, представленной в первом примере, рассматривают значения y и z. Выборочное среднее для Z составляет 31,3. Соответствующая выборочная ковариация равна:

[(73-75,4)·(34-31,3)+(74-75,4)·(74-31,3)+...+(48-75,4)·(31-31,3)]/9=-54,356.

Примечание 1 - Рассматриваемая как статистика (1.8) выборочная ковариация представляет собой функцию пар случайных величин случайной выборки объема в смысле примечания 3 к 1.6. Данную статистику (1.12) следует отличать от численного значения выборочной ковариации, вычисленной по наблюденным парам значений выборочных единиц (1.2) случайной выборки. Числовое значение, как правило, называют эмпирической выборочной ковариацией или наблюдаемой выборочной ковариацией.

Примечание 2 - В соответствии с определением выборочная ковариация имеет вид:

.


Примечание 3 - Деление на позволяет получить несмещенную оценку (1.34) ковариации (2.43) генеральной совокупности.

Примечание 4 - В примере, данные для которого представлены в таблице 1, приведены три переменные несмотря на то, что в определении говорится о парах переменных. На практике стандартными являются ситуации, в которых присутствует несколько переменных.

1.23 выборочный коэффициент корреляции; : Выборочная ковариация (1.22), деленная на произведение соответствующих выборочных стандартных отклонений (1.17).

en

sample correlation coefficient

Пример 1 - В примере 1, приведенном в 1.22, стандартное отклонение составляет 12,948 для X и 21,329 для Y. Поэтому полученный выборочный коэффициент корреляции (для X и Y) равен:

257,178/(12,948·21,329)=0,9312.


Пример 2 - В примере 2, приведенном в 1.22, стандартное отклонение составляет 21,329 для Y и 4,165 для Z. Поэтому выборочный коэффициент корреляции (для Y и Z) равен:

-54,356/(21,329·4,165)=-0,612.


Примечание 1 - В соответствии с определением выборочный коэффициент корреляции имеет следующий вид:

.


Данное выражение представляет собой отношение выборочной ковариации к квадратному корню из произведения стандартных отклонений. Иногда символ используют для обозначения выборочного коэффициента корреляции. Наблюдаемый выборочный коэффициент корреляции основан на реализациях , , ..., соответствующих случайных величин.

Примечание 2 - Наблюдаемый выборочный коэффициент корреляции может принимать значения в промежутке [-1, 1], при этом значения, близкие к 1, указывают на сильную положительную корреляцию, а значения, близкие к -1, - на сильную отрицательную корреляцию. Выборочный коэффициент корреляции показывает степень близости к линейной зависимости между переменными со значениями -1 или 1 в случае линейной зависимости, значения, близкие к 0, указывают на слабую линейную зависимость.

fr

coefficient de

1.24 стандартная ошибка; : Стандартное отклонение (2.37) оценки (1.12) .

en

standard error

fr

erreur type

Пример - Если выборочное среднее (1.15) является оценкой математического ожидания (2.35) генеральной совокупности и - стандартное отклонение одной случайной величины (2.10), то стандартная ошибка выборочного среднего равна , где n - объем выборки. Оценкой стандартной ошибки является , где S - выборочное стандартное отклонение (1.17).

Примечание 1 - Практически стандартная ошибка является естественной оценкой стандартного отклонения оценки.

Примечание 2 - Не существует (целесообразного) понятия "нестандартная ошибка". Стандартную ошибку можно рассматривать как сокращение выражения "стандартное отклонение оценки". На практике под стандартной ошибкой неявно подразумевают стандартное отклонение выборочного среднего. Для стандартной ошибки выборочного среднего применяют обозначение .

1.25 интервальная оценка: Интервал, ограниченный верхней и нижней границами статистики (1.8).

en

nterval* estimator

________________

* Текст документа соответствует оригиналу. - Примечание изготовителя базы данных.

Примечание 1 - Одной из граничных точек интервала могут быть , или естественная граница значений параметра. Например, ноль - естественная нижняя граница интервальной оценки дисперсии (2.36) генеральной совокупности. В подобных случаях интервал часто называют односторонним интервалом.

Примечание 2 - Интервальная оценка может быть представлена при определении оценки (1.36) параметра (2.9). Предполагается, что интервальная оценка накрывает значение параметра в установленной доле случаев в условиях многократного повторения отбора выборки или в ином вероятностном смысле.

Примечание 3 - Три часто используемых вида интервальных оценок включают доверительные интервалы (1.28) для параметра, предикционные интервалы (1.30) для будущих наблюдений и статистические толерантные интервалы (1.26) на долю распределения (2.11).

fr

estimateur par intervalle

1.26 толерантный интервал: Интервал, определяемый по случайной выборке (1.6) таким образом, что с заданным уровнем доверия он накрывает, по меньшей мере, установленную долю генеральной совокупности (1.1).

en

statistical tolerance interval

Примечание - Уровнем доверия в данном случае является доля интервалов, построенных таким образом, что включают, по крайней мере, заданную долю выборки при многократном повторении процедуры.

fr

intervalle statistique de dispersion

1.27 толерантная граница: Статистика (1.8), представляющая собой конечную точку толерантного интервала (1.26).

en

statistical tolerance limit

Примечание - Толерантные интервалы могут быть:

- односторонними (когда одна из границ является фиксированной естественной границей случайной величины); в этом случае интервал имеет либо верхнюю, либо нижнюю статистическую толерантную границу;

- двусторонними, когда интервал имеет обе границы.

Естественная граница случайной величины может представлять собой предельное значение односторонней границы.

fr

limite statistique de dispersion

1.28 доверительный интервал: Интервальная оценка (1.25) (, ) параметра (2.9) со статистиками (1.8) и в качестве границ интервала, для которых

en

confidence interval

.


Примечание 1 - Уровень доверия отражает долю случаев, когда доверительный интервал накрывает истинное значение параметра для длинной серии повторяемых случайных выборок (1.6) при одинаковых условиях. Доверительный интервал не отражает вероятность (2.5) того, что полученный по наблюдениям доверительный интервал содержит истинное значение параметра (интервал может как накрывать, так и не накрывать истинное значение).

Примечание 2 - По отношению к доверительному интервалу используют показатель %, где - малое положительное число. Этот показатель называют коэффициентом или уровнем доверия, часто его задают равным 95% или 99%. Неравенство верно для всех неизвестных значений параметра генеральной совокупности .

fr

intervalle de confiance

1.29 односторонний доверительный интервал: Доверительный интервал (1.28), одна из конечных точек которого равна или либо является естественной границей значений случайной величины.

en

one-sided confidence interval

Примечание 1 - Определение 1.28 применимо и в том случае, когда значение , и в том случае, когда значение . Односторонние доверительные интервалы используют в тех ситуациях, когда объектом исследования являются только нижние или только верхние значения параметра. Например, при проверке громкости звука в целях обеспечения безопасности сотовых телефонов верхнюю доверительную границу рассматривают для назначений верхней границы громкости звука в предполагаемых условиях безопасности. В случае механических испытаний может представлять интерес нижняя доверительная граница усилия, при котором устройство отказывает.

Примечание 2 - Односторонние доверительные интервалы встречаются в ситуациях, когда исследуемый параметр имеет натуральную естественную границу значений, например равную нулю. Для распределения Пуассона (2.47), используемого при моделировании поступления жалоб потребителей, ноль является нижней границей. Другой пример - доверительный интервал для вероятности безотказной работы электронного компонента в виде (0,98;1), где единица - естественная верхняя граница значений вероятности.

fr

intervalle de confiance

1.30 предикционный интервал: Диапазон значений переменной случайной выборки (1.6), отобранной из непрерывной генеральной совокупности, для которого с установленным уровнем доверия можно утверждать, что не менее заданного числа значений будущей случайной выборки из той же самой генеральной совокупности (1.1) попадет в данный диапазон.

en

prediction interval

Примечание 2 - Как правило, исследуют единственное будущее наблюдение, получаемое в тех же условиях, что и наблюдения, используемые для построения предикционного интервала. На практике предикционные интервалы применяют также в регрессионном анализе, в котором предикционный интервал строят для спектра независимых значений.

fr

intervalle de

1.31 значение оценки: Наблюдаемое значение (1.4) оценки (1.12).

en

estimate

Примечание - Значение оценки представляет собой численное значение, полученное на основе наблюдаемых значений. По отношению к определению оценки (1.36) параметра (2.9) гипотетического распределения вероятностей (2.11) оценка связана со статистикой (1.8), предназначенной для определения оценки параметра, при этом значение оценки получают на основании наблюдаемых значений. Иногда после слова "значение" употребляют прилагательное "точечной", чтобы подчеркнуть, что получено только одно значение (значение точечной оценки), а не интервал значений. Подобным образом прилагательное "интервальной" употребляют перед словом "оценки" в том случае, когда определяют интервал значений.

fr

estimation
()

1.32 ошибка оценивания: Разность значения оценки (1.31) и оцениваемого параметра (2.9), характеризующего свойство генеральной совокупности.

en

error of estimation

Примечание 1 - Свойство генеральной совокупности может быть функцией параметра или параметров или другой величины, связанной с распределением вероятностей (2.11).

Примечание 2 - Ошибка может включать составляющие, связанные с отбором выборки, неопределенностью результатов измерений, округлением результатов вычислений и др. По сути ошибка оценивания характеризует достоверность результатов. Определение основных составляющих ошибки оценивания является важным для повышения качества обработки данных.

fr

erreur d’estimation

1.33 смещение: Математическое ожидание (2.12) ошибки оценивания (1.32).

en

bias

Примечание 1 - Данное определение отличается от приведенного в [2] (3.3.2) и [4] (5.25, 5.28). Смещение рассмотрено в общем смысле, как указано в примечании 1 к 1.34.

Примечание 2 - На практике наличие смещения может привести к нежелательным последствиям. Например, заниженная оценка прочности материала, вызванная смещением, может стать причиной неожиданных отказов устройства.

fr

biais

1.34 несмещенная оценка: Оценка (1.12), смещение (1.33) которой равно нулю.

en

unbiased estimator

Пример 1 - Для случайной выборки (1.36) n независимых случайных величин (2.10), подчиненных одному и тому же нормальному распределению (2.50) с математическим ожиданием (2.35) и стандартным отклонением (2.37) , выборочное среднее (1.15) и выборочная дисперсия (1.16) являются несмещенными оценками математического ожидания и дисперсии (2.36) соответственно.

Пример 2 - Как упомянуто в примечании 1 к 1.37, оценка максимального правдоподобия (1.35) дисперсии включает знаменатель n вместо n-1, что дает смещенную оценку. В приложениях выборочное стандартное отклонение (1.17) имеет значительное применение, однако важно иметь в виду, что квадратный корень из выборочной дисперсии, использующей знаменатель n-1, является смещенной оценкой стандартного отклонения (2.37) генеральной совокупности.

Пример 3 - Для случайной выборки из n независимых пар случайных величин, где каждая пара имеет одно и то же двумерное нормальное распределение (2.65) с ковариацией (2.43), равной , выборочная ковариация (1.22) представляет собой несмещенную оценку ковариации генеральной совокупности. Оценка максимального правдоподобия, где в знаменателе использовано n вместо n-1, дает смещенную оценку.

Примечание - Несмещенные оценки предпочтительны, т.к. в среднем их значения корректны. Данные оценки являются начальной точкой поиска "оптимальных" оценок параметров генеральной совокупности. Приведенное определение имеет статистический характер.

В повседневной практике исследователи стараются избегать внесения смещения в исследование, например путем обеспечения репрезентативности случайной выборки по отношению к рассматриваемой генеральной совокупности.

fr

estimateur sans biais

1.35 оценка максимального правдоподобия: Оценка (1.12), приписывающая параметру (2.9) значение, при котором функция правдоподобия (1.38) достигает максимального значения или является его приближением.

en

maximum likelihood estimator

fr

estimateur du

Примечание 1 - Оценка максимального правдоподобия - общепринятый подход определения значений оценок параметров распределения в том случае, когда установлен вид распределения (2.11), например нормальное распределение (2.50), гамма-распределение (2.56), распределение Вейбулла (2.63) и т.д. Эти оценки имеют желаемые статистические свойства (например, инвариантность при монотонном преобразовании) и во многих ситуациях обеспечивают метод определения оценки. Когда оценка максимального правдоподобия является смещенной, иногда возможна простая коррекция смещения (1.33). Как упомянуто в примере 2 к 1.34, оценка максимального правдоподобия для дисперсии (2.36) является смещенной, однако она может быть скорректирована путем использования знаменателя вместо . В этом случае смещение убывает с увеличением объема выборки.

Примечание 2 - Английскую аббревиатуру MLE, как правило, используют как для обозначения оценки максимального правдоподобия (англ. "maximum likelihood estimator"), так и для способа получения оценки максимального правдоподобия (англ. "maximum likelihood estimation"), при этом выбор соответствующего варианта зависит от контекста.

maximum de vraisemblance

1.36 определение оценки: Процедура, с помощью которой получают статистическое представление генеральной совокупности (1.1) на основе случайной выборки (1.6), полученной из данной генеральной совокупности.

en

estimation


Примечание 1 - В частности, процедура определения значения оценки (1.31) на основе выражения для оценки (1.12) относится к определению оценки.

Примечание 2 - Определение оценки следует понимать в широком смысле, включая определение точечных оценок, интервальных оценок или оценок свойств генеральной совокупности.

Примечание 3 - Часто статистическое представление генеральных совокупностей связано с определением оценки параметра (2.9) или параметров или функции параметров предполагаемой модели. В более общем виде представление генеральной совокупности может быть менее конкретным, например в случае статистик, относящихся к воздействию природных катастроф (несчастные случаи, травмы, гибель людей, сельскохозяйственные потери и т.п.).

Примечание 4 - Рассмотрение описательных статистик (1.5) может показать, что предполагаемая модель дает неадекватное представление данных, что может быть выявлено путем применения критериев согласия используемой модели полученным данным. В таких случаях могут быть рассмотрены другие модели, и процесс определения оценки может быть продолжен.

fr

estimation ()

1.37 определение оценки максимального правдоподобия: Определение оценки (1.36), в результате которого получают оценку максимального правдоподобия (1.35).

en

maximum likelihood estimation

Примечание 1 - Для нормального распределения (2.50) выборочное среднее (1.15) является оценкой максимального правдоподобия (1.35) параметра (2.9) , тогда как выборочная дисперсия (1.16), вычисляемая по формуле, в которой знаменатель равен , а не , дает оценку максимального правдоподобия . Однако обычно используют знаменатель , так как он дает несмещенную оценку (1.34).

Примечание 2 - Оценку максимального правдоподобия иногда используют для описания отклонения оценки (1.12) от функции правдоподобия.

Примечание 3 - В некоторых случаях определение оценки максимального правдоподобия математически может представлять собой решение одного уравнения, однако имеют место ситуации, в которых получение оценки максимального правдоподобия требует итеративного решения нескольких уравнений.

Примечание 4 - Английскую аббревиатуру MLE, как правило, используют как для обозначения оценки максимального правдоподобия (англ. "maximum likelihood estimator"), так и для обозначения определения оценки максимального правдоподобия (англ. "maximum likelihood estimation"), при этом выбор соответствующего варианта зависит от контекста.

fr

estimation du maximum de vraisemblance

1.38 функция правдоподобия: Функция плотности распределения (2.26), вычисляемая на основе наблюдаемых значений (1.4) и рассматриваемая как функция параметров (2.9) семейства распределений (2.8).

en

likelihood function


Пример 1 - Из генеральной совокупности (1.1) очень большого размера случайным образом отобрана выборка объема 10 единиц; установлено, что три выборочные единицы имеют некоторую определенную характеристику. Из рассмотрения данной выборки следует, что интуитивное значение оценки (1.31) доли генеральной совокупности, обладающей данной характеристикой, составляет 0,3 (три из десяти). В предположении о том, что генеральной совокупности соответствует биномиальная функция распределения (2.46), функция правдоподобия (функция вероятности, рассматриваемая как функция p, где в качестве n взято 10, а в качестве x - три) достигает своего максимума при p=0,3, что согласуется с интуитивным предположением.

[Ниже, полученные по отношению к p результаты проверены с помощью построения графика функции вероятности биномиального распределения (2.46) ].

Пример 2 - Для нормального распределения (2.50) с известным стандартным отклонением (2.37) в общем случае показано, что функция правдоподобия принимает максимальное значение при , равном выборочному среднему.

fr

fonction de vraisemblance

1.39 функция правдоподобия профиля: Функция правдоподобия (1.38), рассматриваемая как функция одного неизвестного параметра (2.9), если всем остальным параметрам присвоены значения, максимизирующие функцию правдоподобия.

en

profile likelihood function

fr

fonction de vraisemblance partielle

1.40 гипотеза : Утверждение о свойствах генеральной совокупности (1.1).

en

hypothesis

Примечание - Как правило, утверждение относительно генеральной совокупности связано с одним или несколькими параметрами (2.9) семейства распределений (2.8) или с семейством распределений.

fr

1.41 нулевая гипотеза : Гипотеза (1.40), проверяемая с помощью статистического критерия (1.48).

en

null hypothesis

Пример 1 - Для случайной выборки (1.6) независимых случайных величин (2.10) из одного и того же нормального распределения (2.50) при неизвестных математическом ожидании (2.35) и стандартном отклонении (2.37) нулевая гипотеза может состоять в том, что математическое ожидание не превосходит заданного значения , что записывают следующим образом: .

Пример 2 - Нулевая гипотеза может иметь следующий вид: статистической моделью генеральной совокупности (1.1) является нормальное распределение. Для данного типа нулевой гипотезы математическое ожидание и стандартное отклонение не определены.

Пример 3 - Нулевая гипотеза может иметь следующий вид: статистической моделью генеральной совокупности является симметричное распределение. Для данного типа нулевой гипотезы форма распределения не определена.

Примечание 1 - Очевидно, что нулевая гипотеза может включать подмножество множества возможных распределений вероятности.

Примечание 2 - Данное определение не может быть рассмотрено изолированно от определений альтернативной гипотезы (1.42) и статистического критерия (1.48), т.к. корректное применение процедур поверки гипотез требует наличия всех составляющих.

Примечание 3 - На практике нулевую гипотезу никогда не доказывают; скорее, полученная в рассматриваемой ситуации оценка может не давать оснований для отклонения нулевой гипотезы.

Примечание 4 - То обстоятельство, что нулевая гипотеза не отклонена, не является доказательством ее справедливости, а лишь указывает на то, что достаточные основания оспаривать ее отсутствуют. В данном случае либо нулевая гипотеза (или близкое ее приближение) является истинной, либо объем выборки недостаточен для обнаружения отклонений от нее.

Примечание 5 - В некоторых ситуациях первоначально интерес направлен на нулевую гипотезу, однако затем предметом интереса могут стать отклонения от нулевой гипотезы. Надлежащее внимание к объему выборки и мощности обнаружения характерного отклонения или альтернативы может привести к построению процедуры критерия для соответствующей оценки нулевой гипотезы.

Примечание 6 - Принятие альтернативной гипотезы в противоположность принятию нулевой гипотезы является положительным результатом в том смысле, что оно поддерживает рассматриваемую гипотезу. Отклонение нулевой гипотезы в пользу альтернативной представляет собой более однозначный результат, чем невозможность отклонить нулевую гипотезу в данном случае.

Примечание 7 - Нулевая гипотеза служит основанием для построения соответствующей статистики критерия (1.52), используемой при проверке нулевой гипотезы.

Примечание 8 - Нулевую гипотезу часто обозначают ( имеет нижний индекс, равный нулю).

Примечание 9 - Набор параметров, задающих нулевую гипотезу, по возможности выбирают таким образом, чтобы они были несовместимыми с исследуемой гипотезой (см. примечание 2 к 1.48 и пример, приведенный в 1.49).

fr

nulle

1.42 альтернативная гипотеза , : Утверждение относительно множества или подмножества возможных допустимых распределений (2.11), которое не относится к нулевой гипотезе (1.41).

en

alternative hypothesis

Пример 1 - Альтернативная гипотеза для нулевой гипотезы, представленной в примере 1 к 1.41, состоит в том, что математическое ожидание (2.35) превосходит заданное значение, что записывают в следующем виде: .

Пример 2 - Альтернативная гипотеза для нулевой гипотезы, представленной в примере 2 к 1.41, состоит в том, что статистической моделью генеральной совокупности не является нормальное распределение (2.50).

Пример 3 - Альтернативная гипотеза для нулевой гипотезы, представленной в примере 3 к 1.41, состоит в том, что статистической моделью генеральной совокупности является асимметричное распределение. Для данной альтернативной гипотезы не важен конкретный вид асимметричного распределения.

Примечание 1 - Альтернативная гипотеза является дополнением к нулевой гипотезе.

Примечание 2 - Альтернативная гипотеза может быть обозначена или без явного предпочтения одного из обозначений по аналогии с обозначением нулевой гипотезы.

Примечание 3 - Альтернативная гипотеза является утверждением, которое опровергает нулевую гипотезу. Для выбора между нулевой и альтернативной гипотезами используют соответствующую статистику критерия (1.52).

Примечание 4 - Альтернативная гипотеза не может быть рассмотрена отдельно как от нулевой гипотезы, так и от статистического критерия (1.48).

Примечание 5 - Принятие альтернативной гипотезы в противовес невозможности принятия нулевой гипотезы является положительным результатом, состоящим в том, что в данном случае исследуемая гипотеза подтверждена.

fr

alternative

1.43 простая гипотеза: Гипотеза (1.40), устанавливающая единственное распределение в семействе распределений (2.8).

en

simple hypothesis

Примечание 1 - Простой гипотезой является либо нулевая гипотеза (1.41), либо альтернативная гипотеза (1.42), для которых выбранное подмножество возможных подходящих распределений составляет только одно распределение (2.11).

Примечание 2 - Для случайной выборки (1.6) независимых случайных величин (2.10) с одним и тем же нормальным распределением (2.50) при неизвестных математическом ожидании (2.35) и стандартном отклонении (2.37) простая гипотеза может состоять в том, что математическое ожидание равно заданному значению , что записывают следующим образом: .

Примечание 3 - Простая гипотеза полностью определяет распределение (2.11).

fr

simple

1.44 сложная гипотеза: Гипотеза, задающая более одного распределения (2.11) из семейства распределений (2.8).

en

composite hypothesis

Пример 1 - Нулевая гипотеза (1.41) и альтернативная гипотеза (1.42), представленные в примерах 1.41 и 1.42, являются примерами сложных гипотез.

Пример 2 - В примере 3 к 1.48 (случай 3) нулевая гипотеза является простой гипотезой. В примере 4 к 1.48 нулевая гипотеза также является простой гипотезой. Остальные гипотезы, представленные в 1.48, являются сложными.

Примечание - Сложной гипотезой являются нулевая гипотеза (1.41) и/или альтернативная гипотеза (1.42), для которых выбранное подмножество распределений составляет более одного распределения (2.11).

fr

composite

1.45 уровень значимости; : Для статистического критерия максимальная вероятность (2.5) отклонения нулевой гипотезы (1.41) в том случае, когда она верна.

en

significance level

Примечание - Если нулевая гипотеза является простой гипотезой (1.43), то вероятность ошибочного отклонения нулевой гипотезы представляет собой единственное значение.

fr

niveau de signification

1.46 ошибка первого рода: Отклонение нулевой гипотезы (1.41) в том случае, когда она верна.

en

Type I error

Примечание 1 - Фактически ошибка первого рода является принятием неверного решения. Поэтому предпочтительно, чтобы вероятность (2.5) такой ошибки была настолько мала, насколько это возможно. При нулевой вероятности ошибки первого рода нулевая гипотеза никогда не будет отвергнута, т.е. она будет принята безотносительно к каким-либо основаниям.

Примечание 2 - Возможно, что в некоторых ситуациях (например, исследование биномиального параметра ) установленный уровень значимости, такой как 0,05, не может быть достигнут вследствие дискретности результатов.

fr

erreur de

1.47 ошибка второго рода: Принятие нулевой гипотезы (1.41) в том случае, когда она не верна.

en

Type II error

Примечание - Фактически ошибка второго рода является принятием неверного решения. Поэтому желательно, чтобы вероятность (2.5) такой ошибки была настолько мала, насколько это возможно. Ошибка второго рода, как правило, имеет место в тех ситуациях, когда объем выборки недостаточен для выявления отклонений от нулевой гипотезы.

fr

erreur de seconde

1.48 статистический критерий, критерий значимости: Процедура, предназначенная для принятия решения о том, может ли быть отклонена нулевая гипотеза (1.41) в пользу альтернативной гипотезы (1.42).

en

statistical test

Пример 1 - Например, если непрерывная случайная величина (2.29) принимает значения от до и существует предположение, что истинное распределение не является нормальным распределением (2.50), то могут быть сформулированы следующие гипотезы:

- рассмотрению подлежат все непрерывные распределения (2.23), у которых соответствующая случайная величина принимает значения от до ;

- существует предположение о том, что истинное распределение не является нормальным;

- нулевая гипотеза: распределение наблюдаемой случайной величины является нормальным распределением;

- альтернативная гипотеза: распределение наблюдаемой случайной величины не является нормальным распределением.

fr

test statistique


Пример 2 - Если случайная величина подчиняется нормальному распределению с известным стандартным отклонением (2.37) и существует предположение, что значение математического ожидания отличается от заданного значения , то гипотезы могут быть сформулированы в соответствии со случаем 3, приведенным в примере 3.

Пример 3 - В примере рассмотрены три случая, которые могут возникнуть при применении статистического критерия.

Случай 1 - Существует предположение, что математическое ожидание процесса больше заданного целевого значения . Данное предположение ведет к следующим гипотезам.

Нулевая гипотеза: .

Альтернативная гипотеза: .



Случай 2 - Существует предположение, что математическое ожидание процесса меньше заданного целевого значения . Данное предположение ведет к следующим гипотезам.

Нулевая гипотеза: .

Альтернативная гипотеза: .

Случай 3 - Существует предположение, что математическое ожидание процесса не совпадает с заданным целевым значением , но при этом не известно, какое из значений больше (или меньше). Данное предположение ведет к следующим гипотезам.

Нулевая гипотеза: .

Альтернативная гипотеза: .

Во всех трех случаях гипотезы сформулированы на основе предположений относительно альтернативной гипотезы и ее отклонения от базового условия.

Пример 4 - В данном примере рассмотрены все доли дефектных изделий и , от нуля до единицы, в партиях 1 и 2. Если предположить, что две партии отличаются между собой, то скорее всего доли дефектов в этих двух партиях различны. Данное предположение приводит к следующим гипотезам.

Нулевая гипотеза: .

Альтернативная гипотеза: .

Примечание 1 - Статистический критерий - это процедура, выполнение которой с заданными условиями на основе выборочных данных позволяет принимать решения о том, какая из гипотез относительно распределения наблюдаемой случайной величины (нулевая или альтернативная) является истинной.

Примечание 2 - Перед применением статистического критерия на основе доступной информации определяют набор возможных функций распределений. Затем определяют распределения, которые на основе выдвинутого предположения могут быть истинными распределениями и составляют альтернативную гипотезу. Затем формулируют нулевую гипотезу как дополнение к альтернативной гипотезе. Во многих случаях возможная совокупность функций распределения, а следовательно, нулевая и альтернативная гипотезы могут быть определены на основе набора значений соответствующих параметров.

Примечание 3 - Так как решение принимают на основе наблюдений из случайной выборки, то может иметь место ошибка первого рода (1.46), т.е. отклонение нулевой гипотезы, когда она верна, или ошибка второго рода (1.47), т.е. принятие нулевой гипотезы, когда альтернативная гипотеза верна.

Примечание 4 - Случаи 1 и 2, рассмотренные в примере 3, представляют собой примеры односторонних критериев. Случай 3 - пример двустороннего критерия. Во всех трех случаях выбор применения одностороннего или двустороннего статистического критерия основан на рассмотрении области изменения значения параметра , соответствующего альтернативной гипотезе. В более общем случае односторонние и двусторонние критерии могут быть обусловлены областью нулевой гипотезы, соответствующей выбранному статистическому критерию. Для статистики критерия существует критическая область показания значений, которая соответствует отклонению нулевой гипотезы в пользу альтернативной гипотезы, но это может быть не связано напрямую с простым описанием области изменения параметров, как в случаях 1, 2 и 3.

Примечание 5 - Выдвигаемые предположения тщательно продумывают, иначе применение статистического критерия может быть некорректным. Статистические критерии, позволяющие получить решения, на которые не влияет наличие неточностей в выдвигаемых предположениях, относятся к робастным. Считают, что -критерий для математического ожидания по единственной выборке обладает хорошей робастностью при ненормальном распределении данных. Критерий однородности дисперсий Бартлетта - пример неробастного статистического критерия, который может привести к слишком частому ошибочному отклонению предположения о равенстве дисперсий.

1.49 p-значение: Вероятность (2.5) того, что наблюдаемое значение статистики критерия (1.52) или наблюдаемое значение некоторого соответствующего параметра не благоприятствует принятию нулевой гипотезы (1.41).

en

p-value


Пример - Рассмотрим пример, приведенный в 1.9. Для наглядности наблюдаемые значения - значения параметра процесса, для которого номинальное значение математического ожидания составляет 12,5, и в соответствии с предположением специалиста, обслуживающего процесс, наблюдаемые значения процесса стабильно ниже номинального значения. Проведено исследование процесса, отобрана случайная выборка объема 10 единиц (соответствующие значения взяты из примера в 1.9). Выдвинуты следующие гипотезы.

Нулевая гипотеза: 12,5.

Альтернативная гипотеза: 12,5.

Выборочное среднее составляет 9,7, что согласуется с предположением, но достаточно далеко от значения 12,5. Для данного примера статистика критерия (1.52) составляет -1,9764, что соответствует p-значению 0,040. Это означает, что менее чем в четырех случаях из 100 наблюдений значение статистики критерия составит -1,9764 и ниже, если в действительности истинное среднее процесса составляет 12,5. Если исходный заданный уровень значимости составляет 0,05, то нулевую гипотезу отвергают в пользу альтернативной.

В качестве еще одного примера задача может быть рассмотрена иначе. Высказано предположение о том, что процесс отклоняется от своего целевого значения, составляющего 12,5, но направление отклонения не известно. Данное предположение приводит к следующим гипотезам.

fr

valeur p


Нулевая гипотеза: 12,5.

Альтернативная гипотеза: 12,5.

В качестве рассматриваемых данных взята ранее приведенная выборка, значение статистического критерия также составляет -1,9764. При выдвинутой альтернативной гипотезе важен ответ на вопрос: "какова вероятность появления такого или еще более отклоняющегося значения?" В данном случае существуют две соответствующие области значений: значения, меньшие или равные -1,9764, и значения, большие или равные -1,9764. Вероятность того, что статистика t критерия попадет в одну из этих областей, составляет 0,080 (дважды одностороннее значение). В восьми случаях из 100 значение статистики критерия равно или превосходит данное значение. Таким образом, при уровне значимости 0,05 нулевую гипотезу не отклоняют.

Примечание 1 - Если, например, -значение оказывается равным 0,029, то менее трех шансов из 100, что такое или еще более экстремальное значение может возникнуть при нулевой гипотезе. На основе этой информации, так как -значение довольно мало, может быть принято решение об отклонении нулевой гипотезы.

Примечание 2 - Термин -значение иногда рассматривают как вероятность значимости, которую не стоит путать с уровнем значимости (1.45), являющимся заданным значением в прикладных статистических исследованиях.

1.50 мощность критерия: Единица минус вероятность (2.5) ошибки второго рода (1.47).

en

power of a test

Примечание 1 - Мощность критерия для заданного значения неизвестного параметра (2.9) в семействе распределений (2.8) равна вероятности отклонения нулевой гипотезы (1.41) при данном значении параметра.

Примечание 2 - На практике в большинстве случаев увеличение объема выборки приводит к увеличению мощности критерия. Другими словами, вероятность отклонения нулевой гипотезы, когда верна альтернативная гипотеза (1.42), возрастает вместе с увеличением выборки, тем самым снижая вероятность ошибки второго рода.

Примечание 3 - Предпочтительно, чтобы объем выборки был достаточно большим, это важно для обнаружения даже небольших отклонений от нулевой гипотезы и, как следствие, для отклонения нулевой гипотезы. Другими словами, мощность критерия должна приближаться к единице для каждой альтернативы нулевой гипотезы вместе с неограниченным увеличением объема выборки. Такие критерии называют состоятельными. При сравнении двух критериев по мощности критерий с более высокой мощностью считают более эффективным при условии, что уровни значимости идентичны, а также совпадают нулевые и альтернативные гипотезы. Более формальное математическое описание состоятельности и эффективности критерия выходит за рамки настоящего стандарта. Для получения подобной информации могут быть использованы книги и справочники по статистике и математической статистике.

fr

puissance d’un test

1.51 кривая мощности: Набор значений мощности критерия (1.50) как функция параметра (2.9) генеральной совокупности из семейства распределений (2.8).

en

power curve


Примечание - См. также термин "кривая оперативной характеристики" (ИСО 3534-2:2006, 4.5.1).

fr

courbe de puissance

1.52 статистика критерия: Статистика (1.8), используемая вместе со статистическим критерием (1.48).

en

test statistic

Примечание - Статистику критерия используют для определения того, какой гипотезе - нулевой (1.41) или альтернативной (1.42) - соответствует распределение (2.11).

fr

statistique de test

1.53 графическая описательная статистика: Описательная статистика (1.5), представленная в графической форме.

en

graphical descriptive statistics

Примечание - Как правило, описательную статистику используют для редуцирования большого количества значений до небольшого управляемого числа или для представления в наглядной форме. Примерами графических представлений данных являются "ящики с усами", график вероятности, график "квантиль-квантиль", график нормального квантиля, точечная диаграмма, диаграмма рассеяния и гистограмма (1.61).

fr

statistique descriptive graphique

1.54 числовая описательная статистика: Описательная статистика (1.5), представленная в числовой форме.

en

numerical descriptive statistics

Примечание - Числовыми описательными статистиками являются выборочное среднее (1.15), выборочный размах (1.10), выборочное стандартное отклонение (1.17), интерквантильный размах и т.п.

fr

statistique descriptive

1.55 классы

en

classes

Примечание - Предполагают, что классы полны и не пересекаются. Действительная прямая представляет собой все действительные числа между и .

fr

classes

1.55.1 класс (качественная характеристика): Подмножество элементов выборки (1.3).

en

class

fr

classe

1.55.2 класс (порядковая характеристика): Множество, состоящее из одной или нескольких смежных категорий на порядковой шкале.

en

class

fr

classe

1.55.3 класс (количественная характеристика): Отрезок действительной прямой.

en

class

fr

classe

1.56 границы класса; пределы класса (количественная характеристика): Значения, определяющие верхнюю и нижнюю границы класса (1.55).

en

class limits, class boundaries

Примечание - Данное определение относится к классам с количественной характеристикой.

fr

bornes de classe, de classe

1.57 середина класса (количественная характеристика): Среднее арифметическое верхней и нижней границ класса (1.56).

en

mid-point of class

fr

centre de classe

1.58 ширина класса (количественная характеристика): Верхняя граница класса минус нижняя граница класса (1.55).

en

class width

fr

effectif de la classe

1.59 частота: Количество событий или наблюдаемых значений (1.4) в заданом классе (1.55).

en

frequency

fr


1.60 распределение частот: Эмпирическое соотношение между классами (1.55) и количеством событий или наблюдаемых значений (1.4) в классах.

en

frequency distribution

fr

distribution de

1.61 гистограмма: Графическое представление распределения частот (1.61) в виде прилегающих друг к другу прямоугольников, основаниями которых служат отрезки, равные ширине классов (1.58), а площади прямоугольника пропорциональны частотам в этих классах.

en

histogram


Примечание - Осторожности требуют ситуации, в которых анализируемые данные относятся к классам с разной шириной класса.

fr

histogramme

1.62 столбиковая диаграмма: Графическое представление распределения частот (1.61) номинальной характеристики, состоящее из прямоугольников, имеющих одинаковую ширину и высоту, пропорциональную частоте (1.59).

en

bar chart


Примечание 1 - Иногда, очевидно в эстетических целях, диаграммы изображают как трехмерные объекты, хотя это не добавляет никакой дополнительной информации и не является рекомендуемым представлением диаграмм. В столбиковой диаграмме прямоугольники могут не прилегать друг к другу.

Примечание 2 - Различие между гистограммой и столбиковой диаграммой становится все более размытым, что поддерживается в ряде программных пакетов статистической обработки данных, где данные понятия не разграничены приведенными выше определениями.

fr

diagramme en

1.63 кумулятивная частота: Частота (1.59) для классов с накоплением, включая их установленные границы.

en

cumulative frequency

Примечание - Это определение применимо только для заданных значений, соответствующих границам класса.

fr

1.64 относительная частота: Частота (1.59), деленная на общее число событий или наблюдаемых значений (1.4).

en

relative frequency

fr

relative

1.65 кумулятивная относительная частота: Кумулятивная частота (1.59), деленная на число событий или наблюдаемых значений (1.4).

en

cumulative relative frequency

fr

relative