ГОСТ Р 71487.7-2024
(ISO/TS 8000-81:2021)
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Цифровая промышленность
КАЧЕСТВО ПРОМЫШЛЕННЫХ ДАННЫХ
Часть 81
Оценка качества промышленных данных. Профилирование
Data industrial quality. Part 81. Data industrial quality assessment. Profiling
ОКС 25.040.40
Дата введения 2025-07-01
1 ПОДГОТОВЛЕН ФГБУ "Институт стандартизации" на основе собственного перевода на русский язык англоязычной версии документа, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 459 "Информационная поддержка жизненного цикла изделий"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 24 октября 2024 г. № 1496-ст
4 Настоящий стандарт является модифицированным по отношению к международному документу ISO/TS 8000-81:2021* "Качество данных. Часть 81. Оценка качества данных: профилирование" (ISO/TS 8000-81:2021 "Data quality - Part 81: Data quality assessment: Profiling", MOD) путем изменения отдельных фраз (слов, ссылок), которые выделены в тексте курсивом. При этом в него не включено приложение А примененного международного документа, которое нецелесообразно (преждевременно) применять в российской национальной стандартизации в связи с приведенными в них примерами зарубежных практик в области цифровой промышленности, использование которых в национальной системе стандартизации без значительной адаптации не представляется возможным.
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей;
** В оригинале обозначения и номера стандартов и нормативных документов в разделах "Введение", 3 "Термины и определения" и отмеченные в разделе "Предисловие" знаком "**" выделены курсивом, остальные по тексту документа приводятся обычным шрифтом. - Примечания изготовителя базы данных..
Указанное приложение, не включенное в основную часть настоящего стандарта, приведено в дополнительном приложении ДА.
Наименование настоящего стандарта изменено относительно наименования указанного международного документа для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5).
Сведения о соответствии ссылочных национальных стандартов международным стандартам, использованным в качестве ссылочных в примененном международном документе, приведены в дополнительном приложении ДБ.
Сопоставление структуры настоящего стандарта со структурой указанного международного документа приведено в дополнительном приложении ДВ
5 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. № 162-ФЗ "О стандартизации в Российской Федерации"**. Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)
Формирование, развитие и реализация процессов цифровой трансформации определили необходимость внедрения новых подходов и моделей в области создания эффективных производственных систем и формирования экосистемы цифровой промышленности. Основополагающие принципы цифровой промышленности изложены в концепции Индустрия 4.0, получившей широкое признание и реализуемой во многих развитых странах мира. Практическая реализация новых подходов и моделей в области создания умных производств и цифровых предприятий (фабрик), предусматривающая необходимость новых форм цифрового взаимодействия организаций для формирования цепей добавленной стоимости, обусловила необходимость разработки и применения большого числа стандартов (международных, региональных, межгосударственных, национальных стандартов и стандартов организаций).
Настоящий стандарт входит в серию национальных стандартов под общим наименованием "Цифровая промышленность", имеющей важное значение для обеспечения технологического суверенитета и повышения конкурентоспособности отечественной промышленности с применением системного подхода, в том числе методов опережающей стандартизации требований к ключевым компонентам формируемой экосистемы цифровой промышленности. Разрабатываемые в рамках данной серии стандарты имеют высокий уровень гармонизации с международными стандартами и учитывают специфику развития и перспективные потребности отечественной промышленности и сектора информационных технологий.
Использование цифровых данных позволяет улучшить все аспекты организационной деятельности, включая:
- операционную эффективность и результативность;
- безопасность;
- репутацию у клиентов и широкой общественности;
- соблюдение законодательных норм;
- потребительские расходы, выручку и цены акций.
Влияние на производительность исходит от данных, являющихся формализованным представлением информации, которая позволяет организациям принимать надежные решения. Принятие решений может осуществляться людьми напрямую, а также с помощью автоматизированной обработки данных, включая системы искусственного интеллекта.
Благодаря широкому внедрению цифровых вычислений и связанных с ними коммуникационных технологий организации становятся зависимыми от цифровых данных. Эта зависимость усиливает негативные последствия отсутствия качества этих данных. Эти последствия заключаются в снижении организационной эффективности.
Наибольшее влияние цифровых данных исходит от данных, имеющих структуру, отражающую характер предмета, и от того, что данные также могут быть обработаны компьютером (машиночитаемы), а не просто предназначены для чтения и понимания человеком.
Согласно ГОСТ Р ИСО 9000 качество не является абстрактным понятием абсолютного совершенства. Качество на самом деле представляет собой соответствие характеристик требованиям, и, таким образом, любой элемент данных может быть высокого качества для одного использования, но не для другого использования, к которому предъявляются другие требования.
Пример - При сохранении времени начала совещаний приложение календаря требует меньшей точности, чем система управления для хранения времени включения двигательной установки во время космического полета.
Природа цифровых данных имеет основополагающее значение для установления требований, относящихся к конкретным решениям, принимаемым каждой организацией.
Пример - ГОСТ Р 56214 определяет, что данные имеют синтаксические (формат), семантические (значение) и прагматические (полезность) характеристики.
Для обеспечения пользователей высококачественными данными серия стандартов на цифровую промышленность описывает:
- управление данными, управление качеством данных и оценку зрелости.
Пример - ГОСТ Р 71487.1 определяет эталонную модель процесса для управления качеством данных;
- создание и применение требований к данным и информации.
Пример - ГОСТ Р ИСО 8000-110 определяет, как обмениваться характеристическими данными, которые являются основными данными;
- мониторинг и измерение качества данных и информации.
Пример - [1] определяет подходы к измерению качества данных и информации;
- улучшение данных и, следовательно, качества информации.
Пример - Настоящий стандарт определяет подход к профилированию данных, который определяет возможности улучшения качества данных;
- проблемы, характерные для типа контента в совокупности данных.
Пример - [2] определяет, как учитывать требования к качеству для данных о форме продукта.
Управление качеством данных охватывает все аспекты обработки данных, включая создание, сбор, хранение, обслуживание, передачу, использование и представление данных для предоставления информации.
Эффективное управление качеством данных носит системный и систематический характер и требует понимания коренных причин проблем с качеством данных. Это понимание является основой не только для исправления существующих несоответствий, но и для реализации решений, которые предотвращают повторение этих несоответствий в будущем.
Пример - Если совокупность данных включает даты в нескольких форматах, включая "гггг-мм-дд", "мм-дд-гг" и "дд-мм-гг", то очистка данных может исправить согласованность значений. Однако такая очистка требует дополнительной информации для разрешения неоднозначных записей (например, "04-05-20") и не может решить какие-либо проблемы с процессом и людьми, включая обучение, которые вызвали несоответствие.
В качестве вклада в эти общие возможности серии стандартов на цифровую промышленность настоящий стандарт определяет подход к профилированию данных, который включает применение методов анализа к фактически используемым данным. Этот анализ создает профиль, состоящий из структуры, столбцов и взаимосвязей данных. Профиль обеспечивает основу для определения возможностей улучшения качества данных путем установления новых явных правил для данных. Этот подход также обычно дает больший эффект от многократного применения для постепенного выявления проблем.
Организации могут использовать настоящий стандарт отдельно или в сочетании с другими частями серии стандартов на цифровую промышленность.
Настоящий стандарт описывает действия, которые влияют:
- на одну или несколько информационных систем;
- потоки данных внутри организации и с внешними организациями;
- любые фазы жизненного цикла данных.
Внедряя части серии стандартов на цифровую промышленность, организация получает следующие преимущества:
- создание надежных основ цифровой трансформации;
- признание того, как данные в цифровой форме стали фундаментальным классом активов, на который полагаются организации для создания ценности;
- обеспечение основанной на фактических данных достоверности данных и информации для всех заинтересованных сторон;
- создание переносимых данных, защищающих от потери интеллектуальной собственности и допускающих повторное использование в организации и приложениях;
- достижение прослеживаемости данных до первоисточников;
- обеспечение того, чтобы все заинтересованные стороны работали с общим пониманием явных требований к данным.
ГОСТ Р 56214 предоставляет подробное объяснение структуры и области действия серии стандартов на цифровую промышленность.