Статус документа
Статус документа

ГОСТ Р ИСО 12620-2012 Терминология, другие языковые ресурсы и ресурсы содержания. Спецификация категорий данных и ведение реестра категорий данных для языковых ресурсов

     4 Роль категорий данных в управлении языковыми ресурсами

4.1 Обзор

Спецификации категорий данных описывают отдельные информационные блоки, определяющие схему сбора или аннотации данных для конкретного языкового ресурса. Каждая спецификация задает формальное представление категории данных и включает конкретные признаки, описывающие эту категорию (например, ее имя, определение, примеры, комментарии и т.д.). Кроме того, спецификация предоставляет контекст для ее создания и ведения в реестре DCR. Группы категорий данных, которые выделены в качестве подмножеств их глобального набора, составляющего реестр DCR, образуют выборки категорий данных (DCS). Как указано в ИСО 16642 Структура терминологической разметки (TMF), в DCS наряду с моделью данных должны быть определены различные ограничения, которые применимы к данным информационным структурам или форматам обмена, специфическим для тематической области или приложения.

На рис.1 показаны возможные варианты использования DCS. В зависимости от приложения выборка DCS может быть просто списком категорий данных с обратной ссылкой на полные спецификации в DCR либо она может быть представлена полным поднабором или даже расширенным набором DCR, состоящим из такого списка с добавленными определениями и ограничениями, связанными с конкретными спецификациями категорий данных.