Действующий

Об утверждении форм федерального статистического наблюдения для организации федерального статистического наблюдения за деятельностью в сфере образования, науки и инноваций (с изменениями на 10 октября 2024 года)

Раздел 4. Источники массивов больших данных в отчетном году

Раздел заполняют организации, указавшие код 1 в строке 108 графы 3.

Раздел заполняется на основании проектной документации, технической документации и других документов первичного учета.

25. В графе 3 по каждой из строк 401-409 организации предлагается указать, из каких источников в отчетном году формировались используемые большие данные. По каждой строке в графе 3 проставляется код 1 в случае использования организацией в отчетном году соответствующих источников формирования больших данных. В противном случае проставляется код 2.

В строке 409 в графе 3 организации предлагается указать, использовала ли она в отчетном году синтезированные (специально сгенерированные) наборы данных (датасеты). В случае положительного ответа на поставленный вопрос проставляется код 1, в противном случае - код 2.

Синтезированные (специально сгенерированные) наборы данных (датасеты) - искусственно созданные наборы данных, имитирующие объекты и/или процессы реального мира, для разработки моделей машинного обучения, когда получение реальных данных затруднено (например, симуляция логов (записей событий) работы систем обслуживания клиентов в различных граничных режимах, аугментация (дополнение) изображений для задачи повышения устойчивости моделей компьютерного зрения к неблагоприятным условиям съемки/сканирования).

Определение массивов больших данных приведено в пункте 13 настоящих Указаний.