БЕСПЛАТНО проверьте актуальность своей документации
с «Кодекс/Техэксперт АССИСТЕНТ»

          
     ГОСТ Р 7.0.66-2010
(ИСО 5963:1985)

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ


Система стандартов по информации, библиотечному и издательскому делу

ИНДЕКСИРОВАНИЕ ДОКУМЕНТОВ

Общие требования к координатному индексированию

System of standards on information, librarianship and publishing. Indexing of documents. General requirements for coordinate indexing


ОКС 01.140.40

Дата введения 2011-07-01

Предисловие


1 ПОДГОТОВЛЕН Всероссийским институтом научной и технической информации Российской академии наук (ВИНИТИ РАН) и ФГУП "ВИМИ" на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 191 "Научно-техническая информация, библиотечное и издательское дело"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 9 ноября 2010 г. N 344-ст

4 Настоящий стандарт включает в себя модифицированные основные нормативные положения международного стандарта ИСО 5963:1985* "Документация. Методы анализа документов, определения их темы и подбора индексирующих терминов" (ISO 5963:1985 "Documentation - Methods for examining documents, determining their subjects and selecting indexing terms", MOD)

________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.   


Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5)

5 ВВЕДЕН ВПЕРВЫЕ

6 ПЕРЕИЗДАНИЕ. Январь 2019 г.


Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

     1 Область применения

Настоящий стандарт устанавливает общие требования к координатному индексированию документов, включая правила формирования поискового образа документа. Специфические требования к систематизации и предметизации документов - по ГОСТ 7.59*. Форма представления поискового образа документа - по ГОСТ Р 7.0.52.

Настоящий стандарт распространяется на информационно-поисковые системы, в которых содержание документов представлено в сжатой форме лексическими единицами информационно-поискового языка. Настоящий стандарт не распространяется на формирование фактографических записей в фактографических базах данных.

     2 Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты*:

_______________

* В разделе 2 обозначения и номера стандарта в бумажном оригинале приводятся курсивом. - Примечание изготовителя базы данных.


ГОСТ Р 7.0.52 Система стандартов по информации, библиотечному и издательскому делу. Формат для обмена библиографическими данными. Поисковый образ документа

ГОСТ 7.25 Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления

ГОСТ 7.59 Система стандартов по информации, библиотечному и издательскому делу. Индексирование документов. Общие требования к систематизации и предметизации

ГОСТ 7.74 Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения

Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты" за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.

     3 Термины и определения

В настоящем стандарте применены термины по ГОСТ 7.74, а также следующие термины с соответствующими определениями:

3.1 автоматизированное индексирование: Индексирование, технология которого предусматривает использование формальных процедур, осуществляемых с помощью вычислительной техники, и может включать в себя применение интеллектуальных процедур при принятии основных решений о составе поискового образа.

3.2 автоматическое индексирование: Составление поискового образа с использованием только формальных процедур обработки текста документа или запроса, осуществляемых средствами вычислительной техники.

3.3 ключевое слово: Слово или словосочетание (термин) в тексте документа или запроса, несущее в нем существенную информационную нагрузку, хотя бы по одной из тем, рассматриваемых в документе.

3.4 контролируемое индексирование (дескрипторное индексирование): Индексирование, при котором ключевые слова текста заменяются дескрипторами, указанными в соответствующем дескрипторном словаре.

3.5 координатное индексирование: Индексирование, цель которого состоит во всестороннем отражении содержания документа или запроса путем включения в поисковый образ всех необходимых для этого терминов индексирования.

3.6 свободное индексирование: Индексирование, технология которого не предусматривает замену ключевых слов текста в соответствии с рекомендациями специального словаря индексирования.

3.7 фактографическое индексирование: Индексирование, предусматривающее отражение в поисковом образе документа конкретных сведений (сообщений), являющихся смыслом данного документа.

    4 Общие положения

4.1 Процесс индексирования включает в себя следующие этапы, которые осуществляют в указанной ниже последовательности:

- анализ и определение содержания документа как объекта индексирования;

- выделение в документе тем, подлежащих отражению в виде отдельных тематических фрагментов;

- выбор понятий, характеризующих темы документа;

- выбор терминов индексирования для обозначения понятий;

- формирование поискового образа документа из терминов индексирования.

Перечисленные этапы могут быть объединены в составе технологических процедур при условии надлежащего выполнения каждого из этапов.

4.2 Поисковый образ документа (ПОД) формируют из выбранных терминов индексирования с помощью грамматических средств информационно-поискового языка (ИПЯ).

4.3 В процессе индексирования не рекомендуется описывать документ как физический объект (с точки зрения его формы, объема и пр.). Допускается отражать в ПОД подобную информацию, если она позволяет более точно установить соответствие документа информационной потребности пользователя системы.

    5 Анализ документа

5.1 При анализе документа индексатору должна быть предоставлена возможность ознакомиться с документом в полном объеме. При невозможности исчерпывающего ознакомления с документом индексатор должен изучить имеющиеся текстовые части документа (основные источники индексирования):

- справочный аппарат документа - заглавие (наименование), аннотацию, реферат, содержание (оглавление), предисловие, заключение и др.;

- введение;

- заголовки частей и глав;

- первые абзацы глав и параграфов;

- иллюстрации, схемы, таблицы и подписи к ним;

- слова и группы слов, которые в тексте подчеркнуты или выделены полиграфическими средствами.

Индексирование только по заглавиям является неполноценным. При индексировании по рефератам и аннотациям следует следить за адекватностью передачи в них содержания документа.

5.2 При анализе нетекстовых (аудиовизуальных и других) документов, которые, помимо чтения, требуют просмотра, прослушивания, испытания объекта в действии и других подобных процедур, допускается индексирование их по имеющемуся текстовому компоненту (наименованию, краткому описанию и т.п.), но и в этом случае индексатору должна быть предоставлена возможность полного ознакомления с документом, если текстовой материал представляется недостаточным.

    6 Выбор понятий, характеризующих содержание документа

6.1 Число характеристик и понятий, отраженных в ПОД, определяет его полноту и является важнейшим показателем качества индексирования.

6.1.1 В ПОД необходимо отразить все понятия всех тем, которые могут иметь ценность для пользователей системы.

В документе может быть выявлено более одной темы из сферы интересов пользователей. Эти темы должны рассматриваться раздельно.

6.1.2 Тематика, отражаемая при индексировании, не должна ограничиваться узкими рамками непосредственных интересов пользователей информационно-поисковой системы (ИПС). В ПОД также следует включать понятия, связанные с побочными аспектами документа (например, социальные и экономические аспекты научно-технических исследований).

6.1.3 При выборе понятий основным критерием является потенциальная ценность понятия для отражения темы документа или для его поиска. При этом необходимо ориентироваться на типичные запросы к ИПС:

- отбирать понятия, наиболее употребительные в коллективе пользователей ИПС;

- уточнять состав лексики и грамматические правила ИПЯ на основе обратной связи с пользователями.

Изменения, вносимые в ИПЯ, не должны нарушать общую структуру и логику, заложенные при его создании.

6.1.4 Число терминов индексирования, приписываемых одному документу, определяется количеством сведений, содержащихся в документе. Ограничение числа терминов должно быть основано на содержательном отборе наиболее важных понятий.

6.2 Полнота индексирования, принятая в каждой ИПС, определяется ее функциональным назначением. Объем документа сильно влияет на полноту индексирования. Необходимо учитывать указанные факторы и на их основе проводить экспертный отбор понятий из документа, не стремясь включить в ПОД все упомянутые в нем понятия.

6.3 Специфичность ПОД определяется тем, в какой мере понятия документа нашли точное отражение терминами индексирования, и также является одним из параметров качества индексирования. Представление понятия термином, имеющим более широкое значение, приводит к потере специфичности. Более широкие термины допускается использовать в случаях:

- если излишне специфичный термин непонятен пользователям, особенно когда соответствующее понятие применяется только в пограничных областях деятельности;

- если в документе понятие раскрыто недостаточно полно или является вспомогательным для изложения содержания документа.

6.4 Рекомендуется в каждой ИПС разрабатывать списки характеристик, которые признаются важными для отражения в ПОД. В зависимости от потребности конкретной ИПС этот список может быть как расширен, так и сокращен.

     7 Выбор терминов индексирования

7.1 В процессе выбора терминов индексирования понятия, характеризующие содержание документа, представляют:

- предпочтительными лексическими единицами (дескрипторами или ключевыми словами), выбранными по правилам конкретного ИПЯ;

- терминами, отражающими новые понятия, проверив их точность по словарям, энциклопедиям, справочникам, классификационным таблицам, информационно-поисковым тезаурусам, терминологическим стандартам и другим источникам, признанным авторитетными и в данной области.

7.2 Выбор терминов индексирования осуществляют согласно ГОСТ 7.25 или опубликованного информационно-поискового тезауруса, который используют при составлении запросов к ИПС.

При использовании тезауруса допускается сокращать число терминов, включаемых в ПОД, за счет исключения общих понятий, которые могут быть привлечены на этапе поиска документа или на этапе составления поискового предписания на основании ссылок в статьях тезауруса.

7.3 Понятия, не представленные в словаре индексирования, но необходимые для формирования ПОД, выражают одним из двух способов:

- новым специфическим термином, который включают в ПОД и в словарь;

- более общим термином, имеющимся в ИПЯ; при этом специфический термин направляют в службу ведения ИПЯ для включения в словарь.

Новые понятия представляют наиболее близкими из существующих в ИПЯ лексических единиц, а также оценивают полезность включения новых терминов в словарь с точки зрения эффективности поиска.

7.4 При индексировании свободными ключевыми словами, взятыми из текста документа, они должны быть приведены к канонической форме по ГОСТ 7.25. Длину словосочетаний рекомендуется ограничивать двумя-тремя словоформами.