ГОСТ Р 7.0.52-2010
Группа Т62
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Система стандартов по информации, библиотечному и издательскому делу
ФОРМАТ ДЛЯ ОБМЕНА БИБЛИОГРАФИЧЕСКИМИ ДАННЫМИ
Поисковый образ документа
System of standards on information, librarianship and publishing. Format for bibliographic data exchange. Search pattern of a document
ОКС 01.140.40
Дата введения 2011-07-01
1 РАЗРАБОТАН Всероссийским институтом научной и технической информации Российской академии наук (ВИНИТИ РАН)
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 191 "Научно-техническая информация, библиотечное и издательское дело"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 9 ноября 2010 г. N 349-ст
4 ВВЕДЕН ВПЕРВЫЕ
5 ПЕРЕИЗДАНИЕ. Декабрь 2018 г.
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
Настоящий стандарт устанавливает правила представления поискового образа документа (далее - ПОД) в записях на машиночитаемом носителе в формате МЕКОФ по ГОСТ 7.19. Стандарт распространяется на поисковые образы документов, выраженные средствами информационно-поисковых языков (ИПЯ) с лексическими единицами на естественном языке (вербальные ИПЯ), которые представлены элементами данных с метками 630 (дескрипторы), 640 (ключевые слова) и 670 (предметные рубрики).
Настоящий стандарт предназначен для органов научно-технической информации, а также для других организаций и предприятий, осуществляющих информационную деятельность, включая создателей и провайдеров информационных ресурсов.
В настоящем стандарте использованы нормативные ссылки на следующие стандарты:
ГОСТ 7.19 Система стандартов по информации, библиотечному и издательскому делу. Формат для обмена данными. Содержание записи
ГОСТ 7.25 Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления
ГОСТ 7.74 Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения
Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты" за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.
В настоящем стандарте применены термины по ГОСТ 7.74, а также следующие термины с соответствующими определениями:
3.1 иерархический код: Элемент данных, определяющий положение лексической единицы или синтаксической конструкции в иерархической структуре ПОД.
3.2 структурированный ПОД: Поисковый образ документа, записанный при помощи ИПЯ, использующего объединение лексических единиц в синтаксические конструкции.
3.3 синтаксическая конструкция ПОД: Объединение двух или более лексических единиц ПОД, которые при поиске информации должны рассматриваться совместно или в связи друг с другом.
4.1 Каждая библиографическая запись должна содержать ПОД, состоящий из лексических единиц одного из следующих типов: дескрипторов, ключевых слов, предметных рубрик. Допускается в пределах одной записи применять ПОД из лексических единиц разных типов.
4.2 Лексические единицы в ПОД и их синтаксические конструкции снабжают специальными пометами, характеризующими их семантику и структуру.
4.3 Дескрипторы и предметные рубрики сопровождаются информацией о словаре, использованном при индексировании.
5.1 ПОД может иметь линейную или иерархическую структуру.
Линейный ПОД представляет собой простой перечень лексических единиц с соблюдением или без соблюдения алфавитного порядка. Рекомендуется располагать лексические единицы в ПОД в порядке относительной важности.
ПОД с иерархической структурой называется структурированным. В нем перечень отдельных лексических единиц образует исходный нижний уровень иерархии. Объединение лексических единиц (условно - "предложение") образует второй уровень. Объединение предложений (условно - "абзац") образует третий уровень. Количество уровней иерархии не ограничено. Структурированный ПОД состоит из синтаксических конструкций (объединений лексических единиц) одного или разных уровней иерархии, а также наряду с синтаксическими конструкциями может включать отдельные лексические единицы.
Примеры
1 ПОД состоит из простого перечня лексических единиц: А1А2А3А4.
2 ПОД состоит из предложений: (А1А2) (А3А4) (А5А6А7).
3 ПОД состоит из абзацев [(А1А2) (А3А4)] [(А5А6) (А7А8А9) (А10А11)].
4 ПОД состоит из предложения и отдельных лексических единиц: (А1А2)А3А4А5.
5 ПОД состоит из абзаца и предложения: [(А1А2) (А3А4)] (А5А6А7).
6 ПОД состоит из абзаца, предложения и отдельной лексической единицы: [(А1А2) (А3А4)] (А5А6) А7.
_______________
В этих примерах обозначения А1, А2, ..., А11 соответствуют различным терминам, выступающим лексическими единицами ПОД.
Структурированные ПОД применяют, чтобы отобразить логическую связь лексических единиц и избежать ложной координации терминов при информационном поиске.
Пример
Тема "Экономическая эффективность для малого бизнеса контейнерных перевозок водным транспортом" выражается ключевыми словами:
А1 - экономическая эффективность;
А2 - малый бизнес;
A3 - контейнерные перевозки;
А4 - водный транспорт.
В данном случае целесообразно сформировать структурированный ПОД, в котором экономическая эффективность была бы тесно объединена с контейнерными перевозками и отнесена к малому бизнесу следующим образом: ((А1АЗ)А2)А4. Такая структура исключает образование ложных сочетаний: "экономическая эффективность водного транспорта", "экономическая эффективность малого бизнеса", "малый бизнес в контейнерных перевозках", "малый бизнес на водном транспорте".
5.2 Лексическими единицами ПОД на языке предметных рубрик являются простые предметные рубрики, заголовки сложных предметных рубрик и уточняющие их элементы (подзаголовки) различного уровня иерархии.
Подзаголовки предметной рубрики объединяют с соответствующим заголовком в иерархическую синтаксическую конструкцию. Форму представления предметных рубрик и взаимное подчинение их элементов устанавливает словарь (список) предметных рубрик.
Пример
ПОД состоит из двух предметных рубрик (Р). Первая рубрика включает заголовок (3) и подзаголовок (ПЗ). Вторая рубрика включает заголовок, подзаголовок и подподзаголовок (ППЗ).
Р: З- ПЗ
Р: З- ПЗ - - ППЗ.
5.3 Данные, относящиеся к одному дескриптору, записывают в одном поле с меткой 63, которое может содержать подполя согласно 6.2. Каждое поле с меткой 63 должно содержать один дескриптор и не более одного вхождения каждого из прочих подполей, которые расположены в порядке, указанном в 6.2.
_______________
Здесь и далее в составе элементов данных цифра ноль обозначается символом для отличия от буквы О.
5.4 Данные, относящиеся к одному ключевому слову, записывают в одном поле с меткой 64, которое может содержать подполя согласно 6.3. Каждое поле с меткой 64 должно содержать одно ключевое слово и не более одного вхождения каждого из прочих подполей, которые расположены в порядке, указанном в 6.3.
5.5 Каждый заголовок и подзаголовок предметной рубрики записывают в отдельном поле с меткой 67 согласно 6.4. Связь отдельных элементов сложной рубрики выражается иерархическим кодом. Каждое поле с меткой 67 должно содержать одну предметную рубрику и не более одного вхождения каждого из прочих подполей, которые располагают в порядке, указанном в 6.4.
5.6 Данные о связи лексических единиц, а также информационный вес синтаксических конструкций записывают в полях данных с меткой 42 согласно 6.5. Каждой синтаксической конструкции (каждой вершине графа синтаксических связей) соответствует отдельное поле, содержащее два подполя с идентификаторами Е и N, которые расположены в порядке, указанном в 6.5.
5.7 В пределах одного ПОД рекомендуется при каждой лексической единице приводить одинаковый набор подполей.
6.1 Для идентификации элементов данных ПОД в соответствии с ГОСТ 7.19 используют метку, порядковый номер элемента данных в подзаписи (второй и третий символы части справочника, определяемой при применении), индикатор и идентификатор.
Индикатор для элементов данных ПОД принимает значение (пробел).
В настоящем разделе элементы данных описываются в следующем порядке:
обозначение элемента данных: метка, индикатор и идентификатор (его второй символ);
наименование элемента данных;
признак обязательности (О - обязательный, Н - необязательный);
пояснение содержания;
способ записи;
пример записи.
Примеры записи приведены в табличной форме, где указано содержание компонентов справочника (метка и порядковый номер поля данных) и полей данных (индикатор, идентификатор и содержание элемента данных).
6.2 Спецификация элементов данных поля с меткой 63
Перечень подполей с меткой 63 и порядок их следования в записи указаны в таблице 1.
Таблица 1
Идентификатор | Наименование элемента данных |
С | Дескриптор тезауруса |
Е | Код дескриптора |
N | Иерархический код дескриптора |
S | Дополнительная информация о дескрипторе |
А | Наименование тезауруса |
М | Регистрационный номер тезауруса |