ГОСТ Р 55021-2012/ISO/IEC TR 9789:1994
Группа П85
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Информационная технология
РУКОВОДСТВО ПО ОРГАНИЗАЦИИ И ПРЕДСТАВЛЕНИЮ ЭЛЕМЕНТОВ ДАННЫХ ПРИ ОБМЕНЕ ДАННЫМИ
Методы и принципы кодирования
Information technology. Guidelines for the organization and representation of data elements for data interchange. Coding methods and principles
ОКС 35.100.01
Дата введения 2014-01-01
1 ПОДГОТОВЛЕН Федеральным государственным унитарным предприятием "Государственный научно-исследовательский и конструкторско-технологический институт "ТЕСТ" (ФГУП ГосНИИ "ТЕСТ") на основе собственного перевода на русский язык англоязычной версии международного документа, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 22 "Информационные технологии"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 24 сентября 2012 г. N 417-ст
4 Настоящий стандарт идентичен международному документу ISO/IEC TR 9789:1994* "Информационная технология. Руководство по организации и представлению элементов данных при обмене данными. Методы и принципы кодирования" (ISO/IEC TR 9798:1994 "Information technology - Guidelines for the organization and representation of data elements for data interchange - Coding methods and principles", IDT).
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении ДА
5 ВВЕДЕН ВПЕРВЫЕ
6 ПЕРЕИЗДАНИЕ. Декабрь 2018 г.
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
Настоящий стандарт представляет общее руководство по способам, которыми данные могут быть выражены в виде кодов.
В стандарте описаны цели кодирования, характеристики, преимущества и недостатки различных методов кодирования, особенности кодов и дано руководство по проектированию кодов.
Настоящий стандарт не предназначен непосредственно для какой-либо конкретной прикладной области и не зависит от какого-либо конкретного метода проектирования прикладных систем или обмена данными.
В настоящем стандарте использованы ссылки на следующие стандарты*:
____________
* Таблицу соответствия национальных стандартов международным см. по ссылке. - Примечание изготовителя базы данных.
ISO/IEC 646:1991, Information technology - ISO 7-bit coded character set for information interchange (Информационные технологии. 7-битный набор кодированных символов ISO для обмена информацией)
ISO 2375:1985, Data processing - Procedure for registration of escape sequences (Обработка данных. Процедура регистрации выходной последовательности)
________________
Заменен на ИСО/МЭК 2375:2003.
ISO 2382-4:1987, Information processing systems - Vocabulary - Part 4: Organization of data Bilingual edition (Системы обработки информации. Словарь. Часть 4. Организация данных)
________________
Заменен на ИСО/МЭК 2382-4:2015.
ISO 3166:1993, Codes for the representation of names of countries (Коды для представления названий стран)
________________
Заменен на ИСО 3166-1:2013.
ISO 7064:1983, Data processing; Check character systems (Обработка информации. Системы контрольных символов)
________________
Заменен на ИСО/МЭК 7064:2003.
ISO 8601:1988, Data elements and interchange formats - Information interchange - Representation of dates and times (Элементы данных и форматы для обмена информацией. Обмен информацией. Представление дат и времени)
________________
Заменен на ИСО 8601:2004.
ISO 9735:1988, Electronic data interchange for administration, commerce and transport (EDIFACT) - Application level syntax rules (Электронный обмен данными в управлении, торговле и на транспорте (EDIFACT). Синтаксические правила для прикладного уровня)
ISO/IEC 11179-3:1994, Information technology. Specification and standardization of data elements. Part 3: Basic attributes of data elements (Информационные технологии. Спецификация и стандартизация элементов данных. Часть 3. Базовые атрибуты элементов данных)
________________
Заменен на ИСО 11179-3:2003.
В настоящем стандарте применены следующие термины с соответствующими определениями:
3.1 атрибут (attribute): Характеристика объекта.
3.2 набор символов (character set): Конечное множество различных символов, которое является полным для заданной цели.
Пример - Международная базовая версия набора символов ИСО 646.
3.3 код (code): Совокупность правил, которые отображают элементы одного набора в элементы другого набора.
Примечания
1 Элементы могут быть символами или строками символов.
2 Первый набор называется кодируемым, а второй - закодированным набором элементов.
3 Элемент закодированного набора может относиться к нескольким кодируемым.
3.4 закодированный элемент (code element): Результат применения кода к элементу в кодируемом наборе.
Примеры
1 "CDG" является представлением парижского аэропорта имени Шарля де Голля (Paris Charles de Gaulle) в коде для трехбуквенного представления названий аэропортов.
2 Семь двоичных цифр, представляющих удаление символа в ИСО 646.
3.5 закодированный набор элементов (code element set): Результат применения кода ко всем элементам кодируемого набора.
Пример - Все трехбуквенные международные представления названий аэропортов.
3.6 закодированный набор (code set): Синоним закодированного набора элементов.
3.7 закодированное значение (code value): Синоним закодированного элемента.
3.8 закодированное представление (coded representation): Синоним закодированного элемента.
3.9 кодируемый набор (coded set): Набор элементов, который отображается в другой набор в соответствии с кодом.
Пример - Перечень названий аэропортов, который отображается в соответствующий набор трехбуквенных сокращений.
3.10 схема кодирования (coding scheme): Синоним кода.
3.11 данные кода (data code): См. предпочтительный термин закодированный элемент.
3.12 экземпляр элемента данных (data element instance): Экземпляр типа элемента данных.
3.13 тип элемента данных (data element type): Категория данных, которая представляет понятие и свойства которой выражаются как набор атрибутов типа элемента данных, допускающий обеспечение информационного обмена.
3.14 разделитель (delimiter): Один или несколько символов, используемых для указания начала или окончания строки символов.
3.15 сущность (entity): Любое конкретное или абстрактное рассматриваемое понятие, включая ассоциации между самими понятиями.
3.16 поле (field): Специфицированная область в среде данных или в памяти, используемая для конкретного класса элементов данных.
3.17 идентификатор (identifier): Один или несколько символов, используемых для идентификации или наименования типа элемента данных и, возможно, для указания некоторых его свойств.
3.18 ключ (key): Идентификатор в наборе типов элементов данных.
3.19 позиция (position): Любое положение в строке, которое может быть занято элементом и которое идентифицировано порядковым номером.
3.20 строка (string): Рассматриваемая как единое целое последовательность элементов одной и той же природы, таких как символы.
3.21 таблица (table): Упорядоченные данные, каждый элемент которых может быть идентифицирован с помощью аргументов или ключей.
В повседневной жизни информация понимается как факты и утверждения о рассматриваемых конкретных или абстрактных объектах, выраженные: данными, сообщениями, последующими уточнениями. Информация необходима для надлежащего выполнения любой возможной задачи, будь то в управлении, торговле, транспорте, науке и т.д. Точная, объективная и недвусмысленная информация является предварительным требованием в компьютерных информационных системах и при обмене данными между ними.
В формальных информационных системах данные выражены символами (обычно цифрами и буквами), арифметическими числами и описаниями, которые должны иметь фиксированный, неизменный смысл для каждого участника и, тем самым должны быть пригодными для целей обработки и коммуникации.
Пользователи, независимо от их функций и задач, должны быть способны корректно понимать, интерпретировать и обрабатывать свою информацию. Информация, совместно используемая разными группами пользователей или прикладными системами, должна иметь согласованное определение, т.е. семантическое значение понятия (коннотацию), все экземпляры понятия (денотацию) и согласованное представление.
Кодирование охватывает способы и формы выражения данных. Необходимо установить четкие соглашения об этих представлениях. Объяснение форм представления и закодированных элементов является частью спецификации данных.
Под кодированием понимается основанное на правилах упорядоченное присваивание закодированных элементов поименованному и определенному набору элементов. Кодирование осуществляется главным образом с помощью символов (обычно цифр и букв) и приводит к сжатому представлению.
Пример - Присваивание закодированного элемента "CDG" для краткого представления названия аэропорта "Paris Charles de Gaulle" (парижский аэропорт имени Шарля де Голля). Это название аэропорта относится к перечню названий аэропортов, поддерживаемому Международной ассоциацией воздушного транспорта (International Air Transport Association - IATA). Эта организация имеет свод правил для установления кратких представлений.