Выборочная совокупность представляет собой объединение всех единиц наблюдения, включенных в первый массив, и независимых расслоенных случайных выборок из второго и третьего массивов.
Список единиц второго массива на региональном уровне расслаивается по кодам ОКВЭД2 на уровне 3 знаков для оптовой торговли и 4 знаков для розничной торговли. Для расслоения по показателю выручки используется алгоритм, основанный на правиле Экмана. Согласно ему для достижения минимальной дисперсии оценки показателя границы слоев нужно выбирать такими, чтобы наилучшим образом выполнялось следующее приближенное равенство:
, (1)
где - объемы слоев;
, h = 1, ..., H, - границы слоев;
= , = - минимальное и максимальное значение расслаивающего признака.
Таким образом, из 2 массива производится расслоенный случайный отбор, предусматривающий группировку по следующим признакам:
- коды okved 3 или 4 знака (подклассы),
- выручка.
Для субъектов Российской Федерации, в составе которых есть автономные округа, вводится дополнительный признак расслоения - по автономным округам и территории области без автономных округов. При этом сначала проводится расслоение по этому признаку, а затем по кодам ОКВЭД2:
- коды okato;
- коды okved 3 или 4 знака (подклассы);
- выручка.
Объем выборки из второго массива составляет не более 20% от числа предприятий, включенных в данный массив. В целях распределения установленного объема выборки по слоям используется метод оптимального размещения по Нейману по показателю выручка.
Оптимальное размещение задается соотношением:
, (2)
где n - объем выборки;
H - число слоев,
h = 1, 2 ... H - номер слоя;
n - объем выборки из h-го слоя;
N - объем h-го слоя;
- дисперсия h-го слоя, рассчитывается по формуле:
,
где
x - значение признака (выручки) элемента k основы выборки,