Статус документа
Статус документа

ГОСТ Р 7.0.91-2015
(ИСО 25964-1:2011)

          

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Система стандартов по информации, библиотечному и издательскому делу

ТЕЗАУРУСЫ ДЛЯ ИНФОРМАЦИОННОГО ПОИСКА

System of standards for information, librarianship and publishing. Thesauri for information retrieval

ОКС 01.140.20     

Дата введения 2016-07-01

     

Предисловие

1 ПОДГОТОВЛЕН Федеральным государственным бюджетным учреждением науки Всероссийским институтом научной и технической информации Российской академии наук (ВИНИТИ РАН) на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 191 "Научно-техническая информация, библиотечное и издательское дело"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 15 декабря 2015 г. N 2163-ст

4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 25964-1:2011* "Информация и документация. Тезаурусы и их совместимость с другими словарями. Часть 1. Тезаурусы для информационного поиска" (ISO 25964-1:2011 "Information and documentation - Thesauri and interoperability with other vocabularies - Part 1: Thesauri for information retrieval", MOD). При этом дополнительные показатели и требования, включенные в текст стандарта для учета потребностей экономики Российской Федерации, выделены подчеркиванием. В настоящий стандарт не включены графы таблицы 2, содержащие сокращения на немецком, датском, финском, норвежском, шведском и испанском языках, поскольку они не применяются в практике национальной стандартизации и информатики. Не включены также информационные приложения и предметный указатель. Поскольку вопросы построения многоязычных тезаурусов регулирует ГОСТ 7.24-2007, раздел 9 и подразделы 12.3 и 12.4 исключены из настоящего стандарта.

________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.


Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5)

5 ВВЕДЕН ВПЕРВЫЕ

6 ПЕРЕИЗДАНИЕ. Июнь 2020 г.


Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

     1 Область применения

В настоящем стандарте установлены рекомендации, касающиеся развития и ведения информационно-поисковых тезаурусов. Эти рекомендации могут быть применены и к другим словарям, используемым в процессе информационного поиска во всех типах информационных ресурсов. При этом возможность такого применения не зависит от типа средств, используемых при передаче информации (текст, звук, неподвижный или движущийся образ, физический или мультимедийный объект), включая базы знаний, порталы, базы библиографических данных, тексты, музейные или мультимедийные коллекции в целом и входящие в их состав самостоятельные единицы.

В этом стандарте даются рекомендации, касающиеся развития и ведения информационно-поисковых тезаурусов. Эти рекомендации могут быть применены и к другим словарям, используемым в процессе информационного поиска во всех типах информационных ресурсов.

Сферой применения настоящего стандарта являются как одноязычные, так и многоязычные тезаурусы.

В сферу действия настоящего стандарта не входит подготовка указателей, помещаемых в конце изданий, однако некоторые из предлагаемых настоящим стандартом рекомендаций могут быть использованы и для этой цели.

Хотя рекомендации настоящего стандарта не предназначены для создания баз данных или программного обеспечения, используемого непосредственно в процессе поиска или индексирования, однако содержащиеся в данном стандарте рекомендации по вопросам тезаурусного менеджмента предполагают возможность разработки таких приложений.

     2 Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями:

2.1 классификационный ряд (array): Группа соподчиненных понятий (2.52).

Пример - Соподчиненные понятия "outerwear" (верхняя одежда) и "underwear" (нижняя одежда) вместе с понятием "clothing" (одежда) формируют классификационный ряд:

    clothing

одежда

outerwear

верхняя одежда

overcoats

пальто

underwear

нижняя одежда

2.2 ассоциативные отношения (associative relationship): Отношения внутри пары понятий (2.11), которые не связаны иерархически, однако имеют сильную смысловую связь.

2.3 вышестоящий термин (broader term): Дескриптор (2.45), обозначающий более широкое понятие (2.11), чем обозначаемое данным дескриптором.

Примечание - Тематическая область более узкого понятия целиком находится внутри тематической области более широкого понятия. Отношения между этими двумя понятиями обычно обозначается меткой ВТ. Более подробные объяснения см. в 10.2.1.

2.4 основание деления (characteristic of division): Признак, по которому понятие (2.11) может разделяться на ряд (2.1) более узких понятий (2.21), каждое из которых имеет значение этого признака, отличное от других.

Примечание - Ср. фасетный анализ (2.21), узловая метка (2.38).


Пример - Возрастная группа является основанием деления понятия "люди":

люди

(по возрасту)
дети
молодежь
взрослые.

2.5 классификация (classification), классифицирование (classifying): Деятельность, подразумевающая объединение сходных и родственных объектов вместе; разъединение несходных и не имеющих родства объектов; и представление результирующих групп в логической и удобной последовательности.

2.6 классификационная схема (classification scheme): Таблица (2.49) понятий (2.11) и предкоординированных комбинаций понятий (2.11), организованная классификацией (2.5).

Примечание - В состав классификационной схемы часто входят также указатели понятий.

2.7 термин-неологизм (coined term): Новый термин (2.61), созданный для выражения понятия (2.11), для которого в соответствующем языке не существует подходящего термина (2.61).

Примечание - Более подробные объяснения см. в 6.6.5 и 8.3.3.3.

2.8 сложная эквивалентность (compound equivalence): Отношение или соответствие, в рамках которого один термин (2.61) или понятие (2.11) одного контекста представлено двумя или более терминами (2.61) или понятиями (2.11) в другом контексте.

2.9 составной термин (compound term): Термин (2.61), который в соответствие с морфологическими законами может быть разложен на самостоятельные отдельные компоненты.

Примеры -

1 В английском языке:

"Copper mine" можно расщепить на "сорре" и "mines";

"lawnmowers" можно расщепить на "lawns" и "mower"

2 Во французском языке:

"mine de cuivre" можно расщепить на "mine" и "cuivre";

"" можно расщепить на "biologie" и "".

3 В русском языке:

"медные шахты" можно расщепить на "медь" и "шахты";

"биоразнообразие" можно расщепить на "биология" и "разнообразие".

Примечание - Составной термин может состоять как из нескольких слов, так и из одного слова.

2.10 компьютерное приложение (computer application): Компьютерная программа или набор компьютерных программ, с помощью которых осуществляется обработка данных высокого уровня в соответствии с определенными потребностями пользователя.

Примечание - В настоящем стандарте компьютерное приложение часто называют просто "приложение".

2.11 понятие (concept): Единица мысли.

Примечание - Понятия часто имеют несколько разных способов выражения. Они существуют в сознании в виде абстрактных единиц, которые независимы от терминов, используемых для их выражения. Они варьируют в широком диапазоне от очень простых понятий, например, "ребенок", до очень сложных, например, "законодательство о защите детей".

2.12 контрольный словарь (controlled vocabulary): Рекомендуемый список терминов (2.61), рубрик или кодов, каждый из которых представляет понятие (2.11).

Примечание - Контрольные словари проектируются для приложений, в которых полезно идентифицировать каждое понятие с помощью одной и той же (постоянной) рубрики, когда проводят классифицирование, индексирование и/или поиск документов.

2.13 межъязыковая эквивалентность (cross-language equivalence): Отношение эквивалентности (2.18) между терминами (2.61), представляющими одно и то же понятие (2.11) в различных языках.

2.14 модель данных (data model): Абстрактная модель, описывающая то, как данные представляются и используются.

Примечание - Модель данных в настоящем стандарте обеспечивает общее определение структуры и семантики тезауруса. Она может быть использована в качестве основы для определения либо модели базы данных, либо обменного формата тезаурусов.

2.15 документ (document): Любой ресурс, который может быть классифицирован или индексирован для того, чтобы стал возможным поиск содержащихся в нем данных или информации.

Примечание - Это определение распространяется не только на материалы, написанные и отпечатанные на бумажном носителе или представленные в виде микрофильма (обычные книги, журналы, диаграммы, карты), но и на непечатные способы передачи информации. Например, такие как машиночитаемые носители и оцифрованные записи, ресурсы Интернета и интранета, фильмы, звукозаписи, люди и организации как носители научных знаний, здания (buildings), местности, монументы, трехмерные объекты действительности, а также собрания и составные части таких единиц.

2.16 входной термин, вводящий термин (entry term, lead-in term): Термин (2.61), представленный в контрольном словаре (2.12), но используемый не непосредственно в качестве метаданных (2.33), а для того, чтобы привести пользователя к другому термину (2.61), имеющему статус либо категориальной метки, либо предметного заголовка, либо дескриптора (2.45).

Примечание - Входной термин в составе тезауруса обычно трактуется как непредпочтительный термин, или аскриптор.

2.17 эквивалентное отображение (equivalence mapping): Соответствие, фиксирующее некоторое понятие (2.11) в целевом словаре (target vocabulary), которое признается идентичным по объему понятию (2.11) исходного словаря (source vocabulary).

Примечание - См. отношение эквивалентности (2.18).

2.18 отношение эквивалентности (equivalence relationship): Отношение между двумя терминами (2.61) в тезаурусе (2.62), показывающее, что оба эти термина обозначают одно и то же понятие (2.11).

Примечание - В обычном словоупотреблении это термины, являющиеся квазисинонимами, и они могут представлять собой слегка различающиеся понятия. Однако включение в тезаурус устанавливаемого между ними отношения эквивалентности определяет, что оба эти термина рассматриваются как представители одного и того же понятия. Когда в одноязычный или многоязычный тезаурус включены два или более термина одного и того же языка, то один из них выбирается в качестве дескриптора, а другой в качестве аскриптора; а когда два или более таких терминов являются представителями разных языков в многоязычном тезаурусе, каждый из них может выступать как дескриптор в своем собственном языке, и эти отношения принято называть межъязыковой эквивалентностью.

2.19 обменный формат (exchange format): Машиночитаемый формат для представления информации, предназначенный для облегчения обмена информацией между различными приложениями.

Примечание - Обменный формат для тезауруса часто использует язык разметки, например, на основе стандарта XML (Extensible Markup Language) [63, 64, 65, 66], и основывается на модели данных тезауруса. Если модель данных представляет собой общее описание структуры и семантики тезауруса, то обменный формат выражает это на формальном языке для задачи обмена тезаурусами.

2.20 фасет (facet): Группа однородных понятий (2.11) одной и той же природной категории.

Примеры -

1 Животные, мыши, нарциссы и бактерии могут рассматриваться как члены фасета живых организмов.

2 Копание, писание и кипячение могут рассматриваться как члены фасета действий.

3 Париж, Великобритания и Альпы могут рассматриваться как члены фасета территорий.

Примечания

Нужен полный текст и статус документов ГОСТ, СНИП, СП?
Попробуйте «Техэксперт: Лаборатория. Инспекция. Сертификация» бесплатно
Реклама. Рекламодатель: Акционерное общество "Информационная компания "Кодекс". 2VtzqvQZoVs