План выборки был определен исходя из требований обеспечения репрезентативности оценок показателей обследования для типов организаций "крупные и средние", "малые", по видам экономической деятельности (приложение 1); территориальной представительности; фактического осуществления формирования списка организаций для наблюдения на региональном уровне; предоставления итоговых выборочных оценок показателей на федеральном уровне; минимизации объема выборки.
Для формирования выборочной совокупности используется многомерный расслоенный (стратифицированный) отбор со случайным и механическим отбором единиц наблюдения в слоях.
- Расслоение единиц наблюдения генеральной совокупности организаций осуществляется по четырем признакам:
- тип организации ("крупные и средние", "малые") - 2 слоя;
- вид экономической деятельности (код ОКВЭД) - 18 слоев (приложение 1);
- для категории "крупные и средние организации" группы по численности занятых - 11 слоев (приложение 2);
- территория (код ОКАТО) - 77 слоев.
Объем выборки (n) для каждого типа организации и вида экономической деятельности определяется по формуле расчета объема выборки для доли признака (показателя):
, где (1)
- объем генеральной совокупности (количество организаций в разрезе разработки);
- доля признака (показателя);
= 1,96 - квантиль нормального распределения, соответствующий фиксированной доверительной вероятности (95%)
- предельная ошибка выборки оценки доли признака .
Заданная точность выборочной оценки показателя, измеряемой в долях единицы или процентах, должна составлять: = 0,03 (3%).
При пропорциональном размещении общего объема выборки по слоям (тип организации - вид экономической деятельности - группа по численности занятых) общий объем выборки вычисляется по следующей формуле:
, при (2)
В формуле (2) суммирование ведется по слоям, задаваемым категориями территориального признака и цензом по численности;
- объем выборки (количество организаций, включенных в выборку, относимых к данному типу организаций и виду экономической деятельности);
- объем генеральной совокупности (количество организаций, относимых к данному типу организаций и виду экономической деятельности);
- объем генеральной совокупности в слое h;
- доля признака (показателя) в слое h (средняя доля признака);
- желательное значение дисперсии при оценивании доли признака (). Величина V может быть вычислена как квадрат отношения предельной ошибки выборки (=0,03) к коэффициенту (=1,96), соответствующему фиксированной доверительной вероятности (95%).
Далее для каждого вида экономической деятельности определяется доля отбора:
(3)
- объем выборки по виду экономической деятельности;