Действующий

Р 50.1.082-2012 Статистические методы. Примеры применения. Часть 4. Простые статистические приемы анализа данных

     3 Пояснения к применяемым статистическим терминам


Группу единиц или значений величины, отобранных из совокупности большего объема, в статистике называют выборкой. Единственное наблюдение можно рассматривать как выборку объема 1. Таким образом, выборка может состоять из 1, 2, 3.... единиц или наблюдений.

Выборку, отобранную случайным образом, называют случайной выборкой. Множество объектов (единиц), из которых отбирают выборку (например, всех студентов в колледже), называют совокупностью или генеральной совокупностью. Совокупность ограничена перечнем формирующих ее единиц, объектов (например, колледж, реестр, женщины старше 50 лет и т.п.). Существуют статистические показатели, которые могут быть применены и к группе единиц, и к совокупности.

Для группы объектов наблюдений важное значение имеют:

а) параметр положения;

б) параметр изменчивости;

в) модель изменчивости.

Существуют различные методы оценки параметров положения и изменчивости в пределах группы наблюдений. При этом важно учитывать модель изменчивости. Например, при исследовании возможностей процесса часто используют предположение о нормальности распределения, при формировании требований к надежности оборудования - о постоянной интенсивности отказов.

Обычно положение центра наблюдаемых данных характеризуют с помощью:

1) среднего арифметического (или выборочного среднего, представляющего собой сумму наблюдаемых значений, деленную на их количество);

2) медианы (значения, расположенного в центре выборки, если данные расположены в порядке неубывания или невозрастания);

3) моды (наиболее часто появляющегося в наблюдениях значения).

Два наиболее часто используемых показателя изменчивости:

- размах (разность между наибольшим и наименьшим значениями в выборке);

- стандартное отклонение (мера разброса данных вокруг среднего). Чем меньше изменчивость, тем меньше значение стандартного отклонения. Выборочная оценка стандартного отклонения имеет вид:

,

где - -е наблюдаемое значение;

- выборочное среднее (среднее арифметическое);

- количество наблюдений;

- выборочное стандартное отклонение.

Преимущества и недостатки этих показателей приведены в таблице 1.


Таблица 1 - Преимущества и недостатки используемых статистических показателей

Показатель

Преимущества

Недостатки

Среднее

Легкость понимания, частое применение

Зависит от очень высоких или очень низких значений

Медиана

Не зависит от наибольшего и наименьшего значений

Необходимо использовать для вычисления все данные

Мода

Не зависит от наибольшего и наименьшего значений

Распределение может быть многомодальным

Размах

Легкость вычисления

Использует экстремальные значения

Стандартное отклонение

Более эффективно, чем размах

В простых случаях может быть вычислено вручную



Для выборки, состоящей из значений 7, 5, 10, 7 и 6.

Среднее арифметическое: (7+5+10+7+6)/5=7.

Медиана (центральное значение упорядоченной выборки 5, 6, 7, 7, 10): 7.

Мода (наиболее часто появляющееся значение в данных наблюдений): 7.