8.1 ПОД состоит из выбранных терминов индексирования, организованных с помощью грамматических средств ИПЯ данной ИПС.
8.2 В состав ПОД могут быть включены следующие категории данных, предусмотренные технологией индексирования конкретной ИПС:
- данные о степени нормализации терминов индексирования и применяемый для этого словарь;
- индивидуальные характеристики термина индексирования;
- связь терминов индексирования в синтаксических конструкциях ПОД.
Для включения в ПОД фактографических данных применяют грамматические категории, приведенные в разделе 9.
8.3 По степени нормализации различают два типа терминов координатного индексирования - дескрипторы и ключевые слова.
8.4 Термины индексирования должны быть представлены в ПОД в соответствии с орфографическими правилами используемого в системе естественного языка.
8.4.1 Дескрипторы допускается представлять условными кодами, которые указаны в используемом словаре индексирования. В этом случае ИПС должна обеспечивать автоматический поиск орфографических форм дескрипторов по их кодам.
8.4.2 Ключевые слова в многоязычных информационных системах с ПОД на основе различных национальных языков должны быть снабжены пометами о принадлежности к тому или иному естественному языку.
8.5 Индивидуальные характеристики терминов индексирования являются факультативными элементами ПОД, и их используют для уточнения содержания документа, организации процедур информационного поиска или дальнейшей аналитико-синтетической обработки документов в системе.
К индивидуальным характеристикам относят данные о семантической и морфологической категориях термина индексирования, его роли и информационном весе, способе получения и предполагаемом использовании.
8.5.1 Семантическая характеристика термина индексирования заключается в отнесении его к следующим лексикографическим категориям:
1) термин, выражающий научное или техническое понятие;
2) имя собственное, идентификатор;
3) наименование параметра;
4) значение параметра (выраженное текстом или именованной величиной);
5) числовое выражение;
6) обозначение единицы величины.
8.5.2 Морфологическая характеристика термина индексирования заключается в отнесении его к лексикографическим категориям:
1) производному слову;
2) сложному слову;
3) словосочетанию;
4) аббревиатуре;
5) фрагменту слова.
Морфологические характеристики используют в ПОД для реализации в ИПС смыслового анализа лексических единиц на основе их формальных признаков.
8.5.3 Роль термина индексирования указывают в ПОД для уточнения места соответствующего понятия в содержании документа. Для этого особыми указателями роли, принятыми в ИПС, отмечают термины индексирования, отражающие следующие аспекты документа:
а) объект исследования, описания;
б) характеристики, свойства, параметры объекта;