Статус документа
Статус документа

ПНСТ 441-2020 (ИСО/МЭК 21972:2020) Информационные технологии (ИТ). Умный город. Онтология верхнего уровня для показателей умного города

Введение


Как отмечал Уильям Кельвин, невозможно управлять тем, что не измеряется [1]. Решения умных городов должны приниматься на основе точно определенных и измеренных показателей. При использовании ИКТ в принятии решений умного города модели цифровых данных должны точно отражать то, что они представляют, и способ их измерения. Настоящий стандарт определяет модель данных для определений показателей города. Модель данных определена с использованием языка описания онтологий для семантической паутины (OWL). На рисунке 1 представлены два варианта предполагаемого использования настоящего стандарта.

     Рисунок 1 - Варианты предлагаемого использования настоящего стандарта


На рисунке 1а) показано определение показателя, которое используется для автоматизации расчета значения показателя. Определение показателя и данные о городе вводятся в приложение расчета, независимое от показателя, которое использует указанное определение для выбора данных о городе, необходимых для расчета. Такой подход позволяет создать приложение для расчета показателей, которое не запрограммировано для определенного набора показателей. На рисунке 1b) показана система диагностики, которая использует определение показателя для определения причины отклонений значений показателя в зависимости от места или времени. Для определения причин отклонений в системе диагностики должна быть предоставлена информация, какие данные выбраны, и как они объединены.

Тенденцией развития города является принятие решений на основе данных.

ГОСТ Р ИСО 37120 предоставляет набор показателей для измерения эффективности городских услуг и качества жизни по 17 областям, включая образование, финансы, жилье, транспорт и окружающую среду.

Определения показателей предоставляются на естественном языке, а не на формальном машиночитаемом языке. Определение интерпретируется пользователем на основе своего понимания языка и среды проживания (например, в зависимости от определения терминов конкретным городом).

Так, термин "соотношение обучающихся и учителей" введен в [2]. Далее термин был расширен Всемирным банком путем указания того, что числителем является "число обучающихся", а знаменателем - "число учителей". Возникают вопросы, "обучающийся" имеет очную или заочную форму обучения? Включаются ли в понятие обучающийся с особыми потребностями и обучающиеся детского сада? Также сложно сравнить показатель для одного города во времени, если определение обучающегося меняется. Например, сегодня в систему образования входят обучающиеся с особыми потребностями, но 30 лет назад они, возможно, не были учтены. Без более точного определения терминов трудно сравнивать показатели по городам, где каждый город проводит собственную интерпретацию терминов, или по временной шкале при изменении определений.

Определение и документирование показателей могут быть расширены, как это сделано в ГОСТ Р ИСО 37120 для определения соотношения обучающихся и учителей. Согласно ГОСТ Р ИСО 37120, соотношение обучающихся и учителей в сфере начального образования рассчитывается делением количества зачисленных в начальную школу обучающихся (числитель) на количество полных штатных единиц учителей начальной школы (знаменатель). В результате определяется количество обучающихся на одного учителя. Частные учебные заведения при расчете соотношения обучающихся и учителей не учитываются. Обучающиеся по очно-заочной форме учитываются как обучающиеся по очной форме, то есть обучающийся, который присутствует в учебном заведении полдня, учитывается как обучающийся полный день. Если город в отчете представляет данные в эквиваленте зачисленных на очное отделение (согласно которому двое обучающихся очно-заочного отделения приравниваются к одному учащемуся очного отделения), то это должно быть указано. К числу учителей и прочего преподавательского персонала (например, ассистентов учителей, консультантов по профориентации) не должны относиться администраторы или прочий не преподавательский персонал. Преподаватели и персонал детских садов или дошкольных образовательных учреждений не учитываются. Количество учителей рассчитывается с шагом в одну пятую; например, учителя, работающего один день в неделю, следует учитывать как 0,2 учителя, а учителя, работающего три дня в неделю, следует учитывать как 0,6 учителя.

Указанное определение соотношения обучающихся и учителей однозначно решает некоторые вопросы, поднятые выше. Тем не менее, всегда будет разрыв между фактическим значением показателя города и используемыми для его измерения источниками данных и процессами. Это происходит, поскольку значение показателя записывается в машиночитаемой форме (например, в базе данных или в семантической паутине), а источники и процессы измерения находятся в наборах данных и документах, которые недоступны или доступны только для чтения человеком. Результатом является запись значений показателя без понимания того, что они на самом деле измеряют, и как были измерены.

Целью настоящего стандарта является поддержка точной и однозначной спецификации определений показателей с использованием технологии онтологий [3], реализованной в семантической паутине [4]. Это обеспечит:

- компьютерное представление точных определений, что уменьшит неоднозначность интерпретаций;

- вывод показателей из области человеческого восприятия в компьютерную область, где для анализа и интерпретации данных могут использоваться технологии больших данных, программное обеспечение с открытым исходным кодом, мобильные приложения и т.д.;

- семантическую совместимость, а именно возможность доступа, понимания, объединения и использования показателей из наборов данных, распространенных по семантической паутине;

- публикацию определений показателей, значений показателей и их вспомогательных данных с использованием стандартов семантической паутины и онтологии;

- разработку приложений расчета, независимых от показателей;

- автоматическое обнаружение несогласованности данных показателя и основных причин отклонений.

Без однозначной семантики определений показателей не может быть выполнен анализ согласованности. Без определения согласованности отсутствует возможность проверки любых сравнений на основе показателей.

Настоящий стандарт представляет онтологию верхнего уровня для показателей (IULO). IULO предоставляет понятия и свойства для представления базовой структуры определений показателей (см. раздел 6). Настоящий стандарт не определяет понятия для отдельных секторов, таких как образование, финансы, жилье и т.д.

IULO разработана для передачи значения данных. IULO не предоставляет понятия для описания метаданных показателей, например, достоверности и происхождения данных.

IULO не заменяет существующие модели данных. Путем сопоставления локальной модели с IULO может быть достигнута семантическая совместимость данных.

IULO позволяет представлять объединенный уровень показателя, например, для районов, деревень, городов, штатов/провинций и/или стран. IULO позволяет представлять любой показатель.

Настоящий стандарт предназначен для организаций, которые определяют показатели, для организаций ИКТ, которые предоставляют услуги городам, округам и странам и управляют полученными данными, а также для разработчиков ИКТ и открытых данных.