5.1. ПОД состоит из выбранных терминов индексирования, организованных с помощью грамматических средств ИПЯ данной ИПС.
5.2. В состав ПОД могут быть включены следующие категории данных, предусмотренные технологией индексирования конкретной ИПС:
степень нормализации терминов индексирования и применяемый для этого словарь;
индивидуальные характеристики термина индексирования;
связь терминов индексирования в синтаксических конструкциях ПОД.
Для включения в ПОД фактографических данных применяют грамматические категории, указанные в разд. 6.
5.3. По степени нормализации различают два типа терминов координатного индексирования: дескрипторы и ключевые слова.
5.4. Термины индексирования должны быть представлены в ПОД в соответствии с орфографическими правилами используемого в системе естественного языка.
5.4.1. Дескрипторы допускается представлять условными кодами, которые указаны в используемом словаре индексирования. В этом случае ИПС должна обеспечивать автоматический поиск орфографических форм дескрипторов по их кодам.
5.4.2. Ключевые слова в многоязычных информационных системах, с ПОД на основе различных национальных языков, должны быть снабжены пометами о принадлежности к тому или иному естественному языку.
5.5. Индивидуальные характеристики терминов индексирования являются факультативными элементами ПОД и их используют для уточнения содержания документа, организации процедур информационного поиска или дальнейшей аналитико-синтетической обработки документов в системе.
К индивидуальным характеристикам относят данные о семантической и морфологической категории термина индексирования, его роли и информационном весе, способе получения и предполагаемом использовании.
5.5.1. Семантическая характеристика термина индексирования заключается в отнесении его к следующим лексикографическим категориям:
1) термин, выражающий научно-техническое понятие;
2) имя собственное, идентификатор;
3) наименование параметра;
4) значение параметра (выраженное текстом или именованной величиной);
5) числовое выражение;
6) обозначение единицы величины.
5.5.2. Морфологическая характеристика термина индексирования заключается в отнесении его к лексикографическим категориям:
1) производное слово;
2) сложное слово;
3) словосочетание;
4) аббревиатура;
5) фрагмент слова.
Морфологические характеристики используют в ПОД для реализации в ИПС смыслового анализа лексических единиц на основе их формальных признаков.
5.5.3. Роль термина индексирования указывают в ПОД для уточнения места соответствующего понятия в содержании документа. Для этого особыми указателями роли, принятыми в ИПС, отмечают термины индексирования, отражающие следующие аспекты документа:
1) объект исследования, описания;