Статус документа
Статус документа

ГОСТ Р 7.0.66-2010 (ИСО 5963:1985) СИБИД. Индексирование документов. Общие требования к координатному индексированию

    8 Формирование поискового образа документа

8.1 ПОД состоит из выбранных терминов индексирования, организованных с помощью грамматических средств ИПЯ данной ИПС.

8.2 В состав ПОД могут быть включены следующие категории данных, предусмотренные технологией индексирования конкретной ИПС:

- данные о степени нормализации терминов индексирования и применяемый для этого словарь;

- индивидуальные характеристики термина индексирования;

- связь терминов индексирования в синтаксических конструкциях ПОД.

Для включения в ПОД фактографических данных применяют грамматические категории, приведенные в разделе 9.

8.3 По степени нормализации различают два типа терминов координатного индексирования - дескрипторы и ключевые слова.

8.4 Термины индексирования должны быть представлены в ПОД в соответствии с орфографическими правилами используемого в системе естественного языка.

8.4.1 Дескрипторы допускается представлять условными кодами, которые указаны в используемом словаре индексирования. В этом случае ИПС должна обеспечивать автоматический поиск орфографических форм дескрипторов по их кодам.

8.4.2 Ключевые слова в многоязычных информационных системах с ПОД на основе различных национальных языков должны быть снабжены пометами о принадлежности к тому или иному естественному языку.

8.5 Индивидуальные характеристики терминов индексирования являются факультативными элементами ПОД, и их используют для уточнения содержания документа, организации процедур информационного поиска или дальнейшей аналитико-синтетической обработки документов в системе.

К индивидуальным характеристикам относят данные о семантической и морфологической категориях термина индексирования, его роли и информационном весе, способе получения и предполагаемом использовании.

8.5.1 Семантическая характеристика термина индексирования заключается в отнесении его к следующим лексикографическим категориям:

1) термин, выражающий научное или техническое понятие;

2) имя собственное, идентификатор;

3) наименование параметра;

4) значение параметра (выраженное текстом или именованной величиной);

5) числовое выражение;

6) обозначение единицы величины.

8.5.2 Морфологическая характеристика термина индексирования заключается в отнесении его к лексикографическим категориям:

1) производному слову;

2) сложному слову;

3) словосочетанию;

4) аббревиатуре;

5) фрагменту слова.

Морфологические характеристики используют в ПОД для реализации в ИПС смыслового анализа лексических единиц на основе их формальных признаков.

8.5.3 Роль термина индексирования указывают в ПОД для уточнения места соответствующего понятия в содержании документа. Для этого особыми указателями роли, принятыми в ИПС, отмечают термины индексирования, отражающие следующие аспекты документа:

а) объект исследования, описания;

б) характеристики, свойства, параметры объекта;