• Текст документа
  • Статус
Оглавление
Поиск в тексте
Действующий


ГОСТ Р ИСО 1951-2012

     
     
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Представление и изложение словарных статей. Требования, рекомендации и информация

Presentation and representation of entries in dictionaries. Requirements, recommendations and information



ОКС 01.020, 01.080.99

Дата введения 2014-01-01

     
     
Предисловие

1 ПОДГОТОВЛЕН ЗАО "Проспект" на основе собственного аутентичного перевода на русский язык международного стандарта, указанного в пункте 4

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 55 "Терминология, элементы данных и документация в бизнес-процессах и электронной торговле"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 20 ноября 2012 г. N 966-ст

4 Настоящий стандарт идентичен международному стандарту ИСО 1951:2007* "Представление и изложение словарных статей. Требования, рекомендации и информация" (ISO 1951:2007 "Presentation/representation of entries in dictionaries - Requirements, recommendations and information").
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.


При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА

5 ВВЕДЕН ВПЕРВЫЕ


Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)

Введение


За последние 10 лет процессы создания словарной продукции претерпели важные изменения по причине широкого распространения электронных словарей. Вследствие этого лексикографы оказались перед фактом огромного разнообразия методов разработки и публикации словарей.

Настоящий стандарт имеет целью информационную поддержку процессов создания и организации использования самых разных типов словарной продукции. При этом принимаются во внимание различные способы применения словарей, в особенности такие, которые связаны с новыми функциональными возможностями электронных документов - гиперссылками.

Для того, чтобы сделать информационное содержимое словарей многократно используемым в разных печатных и электронных форматах, лексикографы постоянно стремятся создать надлежащую единую, четко структурированную лексикографическую первооснову или информационный репозиторий. В настоящем стандарте предлагается конкретная модель, основанная на профессиональном опыте и лучших достижениях сложившейся практики и призванная способствовать дальнейшему совершенствованию процедур создания, взаимообмена и организации эффективного использования словарей.

1 Область применения


Настоящий стандарт касается одноязычных и многоязычных общих и отраслевых словарей. Он определяет формализованную общую структуру, не зависящую от носителя информации, и устанавливает способы и средства представления статей в "бумажных" и электронных словарях. Связь между этой формальной структурой и представлениями словарных статей, которые используются издателями и читаются пользователями, поясняется примерами, рассмотренными в информативных приложениях.

Цель данного стандарта состоит в том, чтобы облегчить задачи создания, слияния, сравнения, поиска, информационного обмена, распространения и извлечения лексикографических словарных данных. В стандарте используется лексикографический подход к проблеме, основанный на выработке рекомендаций и не имеющий отношения к концептуальным разработкам, определенным в стандарте ИСО 704.

2 Нормативные ссылки


В настоящем стандарте использованы нормативные ссылки на следующие стандарты*, которые необходимо учитывать при использовании настоящего стандарта. В случае ссылок на документы, у которых указана дата утверждения, необходимо пользоваться только указанной редакцией. В случае, когда дата утверждения не приведена, следует пользоваться последней редакцией ссылочных документов, включая любые поправки и изменения к ним.
_______________
* Таблицу соответствия национальных стандартов международным см. по ссылке. - Примечание изготовителя базы данных.

ИСО 704:2000 Терминологическая работа. Принципы и методы (ISO 704:2009, Terminology work - Principles and methods)

ИСО 1087-1:2000 Терминологическая работа. Словарь. Часть 1: Теория и применение (ISO 1087-1:2000, Terminology work - Vocabulary - Part 1: Theory and application)

3 Термины и определения


В настоящем стандарте использованы следующие термины с соответствующими определениями:

3.1 комментарий (comment): Металингвистическая информация, описывающая лексическую единицу с помощью лексикографических элементов данных или составных элементов.

3.2 составной элемент (component element): Составной информационный объект, образованный элементами.

Примечание - Существуют три семейства составных элементов: блоки, контейнеры и группы.

3.3 блок (block): Разложимая структура данных, составной элемент, служащий для факторизации элементов, которые используются множеством экземпляров конкретного элемента в качестве общих уточнений.

Примечание - Примеры блоков приведены в таблицах 6-14.

3.4 контейнер (container): Уточняющая структура, составной элемент, используемый для предоставления дополнительной информации об одном конкретном элементе данных с помощью других элементов.

Пример - Контейнер заглавного слова, используемый для представления его произношения или указания части речи и уточняющий таким образом заглавное слово, которое само по себе является уточненным элементом данных.

3.5 группа (group): Составной элемент, используемый для объединения нескольких независимых элементов.

Пример - Смысл понятия описывается группой элементов, таких как определение, предметная область и др.

Примечание - Пример группы представлен в таблицах 15 и 16.

3.6 элемент данных (data element): Единица информации определенной категории, для которой с помощью набора признаков заданы определение, идентификатор, форма представления и диапазон допустимых значений.

[ИСО/МЭК 11179-1:2004, определение 3.3.8]

Примечание - Списки элементов данных представлены в таблицах 1 и 2.

3.7 словарная статья (dictionary entry): Лексический вход, часть словаря, которая содержит информацию, относящуюся к одной лемме и ее вариантам.

3.8 элемент (element): Любой элемент данных или составной элемент.

3.9 заглавное слово (headword): Слово лексического входа, лемма, которая служит заголовком для статьи в словаре.

3.10 лемма (lemma): Базовое слово, лексическая единица, выбранная в соответствии с лексикографическими соглашениями о представлении различных форм инфлективной парадигмы.

Пример - "Продавать" - это лемма парадигмы "продает, продал, продающий и т.д.".

3.11 лексическая единица, лексема (lexical unit): Языковая единица, принадлежащая к лексикону данного языка и описанная или упомянутая в словаре.

3.12 лексикографический символ (lexicographical symbol): Буква, знак пунктуации или иной типографский либо графический символ или группа символов, равно как их комбинация, используемые для представления определенных лексикографических или терминологических данных, которые отображаются или выводятся автономно либо в сочетании с другим элементом лексикографических данных.

3.13 гнездовая рубрика (nested entry): Группирующая структура для родственных словарных статей с общим заглавным словом.

4 Формализованное описание словарных статей

Для большей четкости изложения рассматриваемая ниже формализованная модель, именуемая в дальнейшем как XmLex, иллюстрируется короткими примерами, запрограммированными в соответствии с документом, касающимся определения типов данных в языке XML и носящим имя XmLex_V00 (более подробную информацию см. в справочном приложении С).

4.1 Общий обзор элементов данных и композиционных элементов


Словарные статьи могут рассматриваться как комментарии к определенным темам, образующим лексические единицы словаря. Статья имеет главную тему (определяемую заглавным словом); все другие темы (например, варианты, переводы) называются "зависимыми темами". Темы и комментарии являются элементами данных. Каждому элементу данных соответствует модель информационного содержания (контента). Элементы данных группируются в композиционные элементы для создания непротиворечивого и полностью поддающегося вычислительной обработке лексического входа. Приводимые ниже открытые списки элементов данных и композиционных элементов могут расширяться пользователем в соответствии с конкретными целями.

В словарях, издаваемых типографским способом, для определения связей между темами и комментариями, как правило, соблюдаются определенные типографские соглашения (использование обычного, полужирного и курсивного шрифтов); соглашения по размещению (до/после) и по знакам пунктуации (запятая и точка с запятой). В модели XmLex:

- положение элемента никогда не используется для обозначения связи между двумя элементами;

- не существует никаких маркеров, эквивалентных типографским знакам (запятой и точке с запятой).

Композиционные элементы (контейнеры, блоки и группы) используются для кодирования логических зависимостей между комментариями и темами таким образом, что, с одной стороны, всегда имеется возможность автоматически скомпоновать и выдать на печать любую форму, а, с другой стороны, автоматически "просчитать" все взаимосвязи между элементами в случае преобразования данных (например, для обращения двуязычного словаря) или при повторном использовании данных в иных контекстах, например, в среде систем памяти переводов или лексических баз данных.

В данной части стандарта:

- описываются элементы данных и их объединение в композиционные элементы, необходимые для представления наиболее общих словарных статейГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация;
_______________
ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация Каждому элементу данных присваивается условное имя и описание, которое должно в максимально возможной степени отвечать требованиям стандарта ISO 12620:1999. Произвольные элементы данных, тип которых определяется пользователем, позволяют осуществить расширение модели на ситуации "договорного информационного обмена".


- определяется формализованная модель словаря в расширенном представлении Бэкуса - Наура, которое часто используется в качестве формальной нотации для описания синтаксической структуры данного языка;

- даются в приложениях примеры реализации и средства контроля, основанные на использовании спецификаций XML, Xpointer, XSL и XHTML.

4.1.1 Элементы данных

4.1.1.1 Лексические единицы

Представленная ниже таблица содержит перечень лексических единиц и комментариев, которые следует использовать в стандартизованной словарной статье.

В первом столбце таблицы дается обозначение элемента данных. Второй столбец показывает групповой идентификатор этого элемента в рамках формализованной модели. В третьем столбце приводится короткое пояснение, а в четвертом - помещена ссылка на первый соответствующий пример (если таковой существует) элемента данных в приложениях (буква обозначает приложение, подчеркнутый номер указывает номер примера, а последний номер определяет нужную строку).


Таблица 1 - Список лексических единиц

Имя

Групповой идентификатор

Пояснение

См. приложение пример
строка

сокращенная форма

AbbreviatedForm

Лексическая единица, образованная путем удаления отдельных слов или букв из более длинной формы [...].

[адаптированный пример из ISO 1087-1:2000, определение 3.4.9]

С
7
3

аналогия

Analogy

Лексическая единица, имеющая некоторое сходство по смысловому содержанию с текущей лексической единицей.

[адаптированный пример из ISO 1087-1:2000, определение 3.4.9]

С
10
4

антоним

Antonym

Лексическая единица, которая представляет понятие, противоположное по смыслу текущей лексической единице.

[адаптированный пример из ISO 12620:1999, А.10.18.6]

С
5
45

композиционная фраза

CompositionalPhrase

Любое многократно повторяющееся общепринятое словосочетание, такое как коллокация, пословица, поговорка и т.п.

С
4
15

словообразование

Derivation

Изменение формы лексической единицы, обычно выражающееся в модифицировании корневой основы или аффиксации и сигнализирующее об изменении информации о части речи.

С
5
9

пример

Example

Экземпляр, типичный для применения лексической единицы в определенном контексте.

С
4
10

ложный друг

FalseFriend

Лексическая единица языка, кажущаяся формальным или семантическим подобием лексической единице другого языка, но не соответствует ей по смыслу.

[адаптированный пример из ISO 12620:1999, А.3.2]

С
15
6

произвольная тема

FreeTopic

Лексическая единица, тип которой в данном международном стандарте не определен.

С
18
5

полная форма

FullForm

Полная форма представления лексической единицы, для которой существует сокращенная форма.

[адаптированный пример из ISO 12620:1992, А.2.1.7]

С
20
3

заглавное слово

Headword

Лемма, являющаяся заголовком словарной статьи.

С
1
4

инфлексия

Inflection

Модификация формы слова для выражения других грамматических связей, в которых оно может участвовать.

С
22
5

международный научный термин

IntemationalScientificTerm

Термин, являющийся частью научной терминологии, принятой соответствующим научным распорядительным органом.

[адаптированный пример из ISO 12620:1999, А.2.1.4]

С
39
12

многословная лексическая единица

MultiWordUnit

Лексическая единица, состоящая из нескольких слов и выражающая только одно понятие.

С
1
42

символ

Symbol

Обозначение некоторого понятия буквами, числами, пиктограммами или любой их комбинацией.

[адаптированный пример из ISO 12620:1999, А.2.1.13]

С
23
7

синоним

Synonym

Лексическая единица, которая представляет то же самое или очень близкое понятие, что и заглавное слово словарной статьи.

[адаптированный пример из ISO 12620:1999, А.2.1.2]

С
5
27

перевод

Translation

Эквивалентная лексическая единица, принадлежащая целевому языку перевода.

С
1
15

вариант

Variant

Одна из альтернативных форм лексической единицы.

[адаптированный пример из ISO 12620:1999, А.2.1.9]

С
32
5



Таблица 2 - Список комментариев

Имя

Групповой идентификатор

Пояснение

См. приложение пример
строка

Засвидетельст-
вование

Attestation

Дата или время просмотра лексической единицы.

С
11
8

падеж

Case

Грамматическая форма лексической единицы (существительное, местоимение или модификатор), указывающая на ее грамматическую связь с другими словами в статье или предложении.

С
24
7

цитата

Citation

Цитата из книги, статьи или документа.

С
4
25

дополнение

Complement

Вспомогательная часть лексической единицы (например, предлог "to" с английским глаголом).

[адаптированный пример из ISO 16642:2003, С.4.10.2]

определение

Definition

Предложение, которое описывает некоторое понятие и позволяет отличать его от других понятий в рамках системы концептов.

[адаптированный пример из ISO 12620:1999, А.5.1]

С
4
61

отображение

Display

Синтезированный текст, который может показываться вместо раздельного представления тем или комментариев.

С
2
33

этимология

Etymology

Информация о происхождении конкретного слова и эволюции его смыслового значения.

[адаптированный пример из ISO 12620:1999, А.2.4.2]

С
4
6

формула

Formula

Цифры, символы или иные средства краткого выражения понятия, как, например, математическая или химическая формула.

[адаптированный пример из ISO 12620:1999, А.2.1.14]

С
16
3

частота

Frequency

Характеристика относительной интенсивности и общности использования лексической единицы.

[адаптированный пример из ISO 12620:1999, А.2.3.4]

С
19
3

свободный комментарий

FreeComment

Металингвистические средства, используемые для описания лексической единицы.

С
17
1

география применения

GeographicalUsage

Использование лексической единицы, отражающее региональные различия.

[адаптированный пример из ISO 12620:1999, А.2.3.2]

С
21
10

грамматический род

GrammaticalGender

Совокупность из двух или более грамматических категорий, на которые разделяются имена существительные конкретного языка.

С
1
15

грамматическое число

GrammaticalNumber

Во многих языках - грамматический признак различия, который указывает на количество объектов, определяемых данной лексической единицей.

[адаптированный пример из ISO 12620:1999, А.2.2.3]

С
2
48

грамматическая структура

GrammaticalPattern

Грамматическая конструкция, в которой часто встречается конкретная лингвистическая единица.

С
34
5

направляющая фраза

GuidePhrase

Грамматический оборот, иллюстрирующий случай употребления слова или его конкретного смыслового значения.

С
2
50

вставка

Insert

Текст, таблица или рисунок, которые представляют некоторые грамматические, энциклопедические, научные или культурологические сведения, относящиеся к словарной статье или к нескольким словарным статьям. Такая вставка может совершенно не зависеть от текста словаря.

наклонение

Mood

Свойство глаголов, выражающее отношение говорящего к реальности или правдоподобию того, о чем идет речь.

С
25
6

нормативный статус

NormativeStatus

Указатель статуса термина, присвоенный полномочным органом власти, таким как организация по стандартизации или государственным регуляционным учреждением.

[адаптированный пример из ISO 12620:1999, А.2.9.1]

С
26
4

примечание

Note

Дополнительная информация, касающаяся любого другого элемента совокупности данных.

[адаптированный пример из ISO 12620:1999, А.8]

С
3
24

часть речи

PartOfSpeech

Тип, присвоенный лексической единице на основании ее грамматических и семантических свойств.

[адаптированный пример из ISO 12620:1999, А.2.2.1]

С
1
11

лицо

Person

Индикатор грамматического лица (1-го, 2-го, 3-го и т.п.), ассоциируемого с данной изменяемой лексической единицей.

С
25
7

произношение

Pronunciation

Представление артикуляции при произнесении лексической единицы.

[адаптированный пример из ISO 12620:1999, А.2.5]

Представление может быть фонетическим или фонологическим.

С
11
3

область применения

RangeOfApplication

Область, в рамках которой сохраняется истинный смысл конкретного понятия.

С
1
14

регистр

Register

Классификация, показывающая относительный уровень языка, присвоенный конкретной лексической единице.

[адаптированный пример из ISO 12620:1999, А.2.3.3]

С
24
9

поисковая форма

SearchForm

Лексическая единица, добавленная к лексическому входу с целью облегчения процедуры поиска.

[адаптированный пример из ISO 12620:1999, А.10.6.3]

С
1
16

смотри

See

Перекрестная ссылка на другое заглавное слово, которое является синонимом текущего заглавного слова.

С
3
5

смотри также

SeeAlso

Перекрестная ссылка на родственное заглавное слово.

С
6
19

спецификатор эмоциональной окраски

SenseQualifier

Любой указатель эмоциональной окраски лексической единицы ("фигуральный", "буквализм", "устаревший"...).

С
1
45

сортировочный ключ

SortKey

Лексическая единица, которая вводится в лексикографическую статью для целей удобства сортировки, когда порядок расположения статей не позволяет отследить местоположение нужного словосочетания.

исходный язык

SourceLanguage

Язык лексической единицы, которая должна быть переведена на другой язык.

С
1
1

субкатегоризация

Subcategorisation

Приписывание лексического объекта к подклассу его части речи, особенно в тех случаях, когда учитываются синтаксические элементы, с которыми он может сочетаться.

Примечание - Этот элемент появляется только в грамматических контейнерах.

С
21
4

предметная область

SubjectField

Область человеческих знаний.

[адаптированный пример из ISO 12620:1999, А.4]

С
2
11

слогоделение

Syllabification

Разделение слова на слоги, отражающее его артикуляцию по слогам, то есть по неделимым элементам произношения.

[адаптированный пример из ISO 12620:1999, А.2.6]

С
34
4

целевой язык

TargetLanguage

Язык, на который должна быть переведена лексическая единица.

С
1
1

грамматическое время

Tense

Отличительный признак в виде разных форм глагола для выражения различий во времени или продолжительности выполнения обозначаемого этим глаголом действия или состояния.

С
31
5

4.1.2 Иерархические структуры: словарь и словарные статьи


Словарь состоит из обычных или гнездовых статей.


Таблица 3 - Список высокоуровневых структур

Имя

Групповой идентификатор

Пояснение

См. приложение пример
строка

словарь

Dictionary

Совокупность словарных статей или гнездовых рубрик.

С
1
1

словарная статья

DictionaryEntry

См. определение 3.4.

С
1
2

гнездовая рубрика

NestEntry

См. определение 3.10.

D
1
8



Статья в словаре состоит из элементов данных, которые самодостаточны или компонуются в рамках композиционных элементов.

4.1.3 Композиционные элементы

4.1.3.1 Контейнеры

Всюду, где это возможно, кодированному примеру на языке XML предшествует его печатный вид, взятый из реального словаря. В данном случае вся словарная статья полностью представляется на бумаге текстом внутри прямоугольника с серым фоном (на экране - это зеленый цвет). Если кодируются только какие-то части статьи, то на бумаге они [в данном случае - это текст "Farad n (F) DIN 1301"] располагаются на белом фоне (на экране - это желтый цвет).



ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информацияКонтейнер определяется в приложении С.4.5 стандарта ISO 16642:2003 как структура, используемая при необходимости уточнения соответствующего элемента данных с помощью других информационных элементов (для заглавного слова - это его часть речи; для цитаты - это имя автора цитируемых слов; для символического обозначения - его источник и т.п.). Пример контейнера приводится в таблице 4.


Таблица 4 - Исходные данные (пример 23 из приложения С)

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Хотя в данном англо-немецком словаре слова "Farad", "n", "F" и "DIN 1301" напечатаны в одну строку, между этими элементами существуют зависимости следующего характера:

[Фарада ("Farad") - это имя существительное ("noun"), обозначается символом "F" в соответствии со стандартом "DIN 1301"]



Таблица 5 - Кодовое представление (пример 23 из приложения С)

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Контейнер перевода (<TranslationCtn>) используется для уточнения перевода (Farad) путем указания его части речи (<PartOfSpeech>). Контейнер символа (<SymbolCtn>) используется для уточнения символа (F) посредством указания его источника (DIN 1301). Этот контейнер символа встроен в контейнер перевода для добавления к переводу символического обозначения.

4.1.3.2 Блоки

В издаваемых типографским способом словарях часто используются знаки пунктуации (запятая или точка с запятой) для обозначения степени схожести элементов статьи. Например, в таблице 6 слово "feelings" ("чувства") в квадратных скобках, которое стоит перед двумя переводами, разделенными запятой, определяет "область использования" этих двух переводов. Точка с запятой закрывает список возможных переводов слова "dam" в рамках области "feelings". Заключенное в квадратные скобки слово "Words" ("разговорная речь") открывает новую "область использования".

Блоки используются для кодирования характера такой логической связи.


Таблица 6 - Исходные данные - блок с базовыми компонентами (англо-французский пример 1 из приложения С)

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Таблица 7 - Схематическое представление блоков с базовыми компонентами

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Здесь имеются три родственных узла <Translation>. Блок TranslationBlock используется для объединения двух из этих узлов в одну группу, где они разделяют одну и ту же область использования <RangeOfApplication>.


Таблица 8 - Кодовое представление блока с базовыми компонентами (пример 1 из приложения С)

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Таблица 9 - Исходные данные - блок с контейнерами

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Здесь имеются три производные формы прошедшего времени глагола "cleave" (раскалывать) и три формы причастия прошедшего времени от этого глагола. Каждая производная форма может быть уточнена указанием для нее произношения или регистра.


Таблица 10 - Схематическое представление блока с контейнерами

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Таблица 11 - Кодовое представление блока с контейнерами

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Таблица 12 - Исходные данные производного блока

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Таблица 13 - Схематическое представление производного блока

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Блок <DerivationBlock> используется для ассоциирования уточнения <PartOfSpeech> с четырьмя производными блоками <Derivation>. Вложенный блок <DerivationBlock> используется для объединения в группу двух последних производных блоков, разделяющих одну и ту же область использования <RangeOfApplication>.

Модель XmLex определяет блоки для семи тем: CompositionalPhrase (композиционная фраза), Derivation (производный элемент), Headword (заглавное слово), Inflection (изменение формы слова), MultiWordUnit (многословная единица), Synonym (синоним) и Translation (перевод).


Таблица 14 - Кодовое представление вложенного производного блока

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация

4.1.3.3 Группы

Группа объединяет независимые элементы данных, контейнеры и блоки.

Группа является композиционным элементом, который используется для представления различных (и повторяющихся) наборов информации, например, множественных смысловых значений заглавного слова в рамках словарной статьи.


Таблица 15 - Пример группы (фрагмент примера 3 из приложения С)

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


Таблица 16 - Кодовое представление (фрагмент примера 3 из приложения С)

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация


В соответствии с предметной областью заглавное слово имеет два смысловых значения. Каждое из них описывается в группе <SenseGroup>.


Таблица 17 - Список групп

Имя

Групповой идентификатор

Пояснение

См. приложение пример
строка

омографическая группа

HomographGroup

Группирующий элемент для описания омографов.

С
1
10

смысловая группа

SenseGroup

Группирующий элемент для описания одного смыслового значения заглавного слова в словарной статье. См. определение 3.2.3.

С
1
12

4.2 Формальная структура словарной статьи

4.2.1 Формальная грамматика для высокоуровневых структур


Словарная статья включает в себя:

- одну или несколько основных лексических единиц ("заглавных слов") и связанные с ними другие лексические единицы (часть речи, произношение, орфографические варианты, словообразование и т.п.);

- описание каждого смыслового значения заглавных слов и лексических единиц, ассоциируемых с данным значением (композиционных фраз, многословных единиц, переводов, синонимов и др.).

Когда заглавное слово имеет сильно различающиеся смысловые значения, словарная статья может разбиваться на подстатьи по каждому омографу или для каждого значения может создаваться отдельная статья (с соответствующим номером омографа).

Несколько статей могут группироваться внутри уникального "гнезда" для сборки родственных заглавных слов в компактный словарь.

Модель представляется с использованием следующих соглашений расширенной формы Бэкуса - Наура (РБНФ):

- терминальные элементы являются существительными без разделителей; их объяснение дается до начала использования (примером может служить заглавное слово);

- символы разделяются знаками <>;

- {} обозначает любое число вхождений, включая 0;

- [ ] обозначает отсутствие или ровно одно вхождение;

- + означает одно или множество вхождений.

Необходимо помнить, что:

- порядок следования элементов внутри правила не имеет значения; например, внутри контейнера повторяющиеся уточняющие элементы могут появляться как до, так и после уточняемого элемента данных;

- символы, имя которых заканчивается словом "Value" (значение), как, например, <GrammaticalGenderValue>, или словом "Туре" (тип), как <HeadwordType>, в настоящем международном стандарте не рассматриваются; они относятся к допустимым значениям, которые определены в ISO 12620:1999 и в "Реестре категорий данных Технического комитета 37" (ТС 37 Data Category Registry).

Для элемента данных разрешаются списки допустимых значений. Например, элемент грамматического рода <GrammaticalGenderValue> может содержать значения "мужской", "женский", "средний" и т.п.

Определение типов дает дополнительную информацию о характере элемента данных. Например, <HeadwordType> будет содержать перечисление типов заглавных слов (имя нарицательное, имя собственное, приставка, суффикс, географическое название и др.).

Реализация этой модели всегда дает пользователю возможность добавлять собственные новые типы или нужные ему допустимые значения.

- Описание цитирования (CitationCtn) в настоящем стандарте отсутствует. Его компоненты следует заимствовать в ISO 15836 (Дублинское ядро) или ISO 12615 (ссылки на источники).

1.

<Dictionary> ::=

<generalQualifiers>

[sourceLanguage]

[targetLanguage]

{<DictionaryEntry> | <NestEntry> | <lnsert>}

2.

<NestEntry> ::=

<generalQualifiers>

[sourceLanguage]

[targetLanguage]

{DictionaryEntry>}

3.

<DictionaryEntry> ::=

[sortKey]

[sourceLanguage]

[targetLanguage]

[homographNumber]

<generalQualifiers>

(Headword| HeadwordCtn| HeadwordBlock)+

{HomographGroup} | {SenseGroup}

{MultiWordUnitCtn | CompositionalPhraseCtn|

{<Administrativelnformation>}

4.

<HomographGroup> ::=

<generalQualifiers>

[Headword| HeadwordCtn| HeadwordBlock]

{<CoreComments> | <SenseGroup>}

{<RelatedTopics>}

5.

<SenseGroup> ::=

<generalQualifiers>

[senseNumber]

[targetLanguage]

{<CoreComments>|

<RelatedTopics>|

<SenseGroup>}

(See|SeeCtn)

6.

<RelatedTopic> ::=

{AbbreviatedForm| <AbbreviatedFormCtn>

Analogy |<AnalogyCtn>| <AnalogyBlock>|

Antonym| <AntonymCtn>

Citation| <CitationCtn>|

CompanySpecificUsage| CompanySpecificUsageCtn|

CompositionalPhrase| <CompositionalPhraseCtn>|

<CompositionalPhraseBlock>|

Derivation|<DerivationCtn>|<DerivationBlock>|

Example|<ExampleCtn>|

FalseFriend|<FalseFriendCtn>|

FreeTopic|<FreeTopicCtn>|

FullForm|<FullFormCtn>|

Homonym| HomonymCtn|

lnflection|<lnflectionCtn>|<lnflectionBlock>|

lntemationalScientificTerm|<lnternationalScientificTermCtn>|

MultiWordUnit|<MultiWordUnitCtn>|<MultiWordUnitBlock>|

ProprietaryRestriction| ProprietaryRestrictionCtn|

Synonym|<SynonymCtn>|<SynonymBlock>|

Translation|<TranslationCtn>|<TranslationBlock>|

Variant|<VariantCtn>}

7.

<HeadwordCtn> ::= <generalQualifiers> Headword

{<CoreComments>| <RelatedTopics>}

8.

<HeadwordBlock> ::= <generalQualifiers> (Headword |

HeadwordCtn)+

{<CoreComments>}

9.

<MultiWordUnitCtn> ::= <generalQualifiers> MultiWordUnit+

{<CoreComments>| <RelatedTopics>} {<SenseGroup>}

10.

<CompositionalPhraseCtn> ::= <generalQualifiers>

CompositionalPhrase+ {<CoreComments>| <RelatedTopics>}

{<SenseGroup>}

11.

<LinguisticComment> ::=

Attestation|< AttestationCtn >|

Case|<CaseCtn>|

Complement|<ComplementCtn>|

Display|

Etymology|<EtymologyCtn>|

Formation|<FormationCtn>|

Formula|<FormulaCtn>|

Frequency|<FrequencyCtn>|

GeographicalUsage|<GeographicalUsageCtn>|

GrammaticalGender|<GrammaticalGenderCtn>|

GrammaticalNumber|<GrammaticalNumberCtn>|

GrammaticalPattern| GrammaticalPatternCtn|

GuidePhrase|<GuidePhraseCtn>|

Mood|<MoodCtn>|

NormativeStatus|<NormativeStatusCtn>|

PartOfSpeech|<PartOfSpeechCtn>|

Person|<PersonCtn>|

Pronunciation|<PronunciationCtn>|

RangeOfApplication|<RangeOfApplicationCtn>|

Register|<RegisterCtn>|

SearchForm|<SearchFormCtn>|

Syllabification|<SyllabificationCtn>|

Symbol|<SymbolCtn>|

TypicalComplement| TypicalComplementCtn|

Tense|<TenseCtn>|

UsageNote|<UsageNoteCtn>

12.

<SemanticComment> ::=
Definition|<DefinitionCtn>|
Senselndicator| SenselndicatorCtn|
SenseQualifier|<SenseQualifierCtn>|
SubjectField|<SubjectFieldCtn>

13.

<CoreComments> ::= {<LinguisticComments>| <SemanticComments>|
<CrossReferences>| <FreeElements>| <GeneralElements>|
<Administrativelnformations>}

14.

<CrossReferences> ::= SeeAlso

15.

<Administrativelnformation> ::= Origination | Modification

16.

<FreeElements> ::= FreeComment| <FreeCommentCtn>

17.

<GeneralElements> ::= Note| <NoteCtn>| Source| <SourceCtn>

18.

<ContainerComplement> ::= <FreeElements>| <GeneralElements>

19.

<generalQualifiers> ::= [id] [class] [style] [xmhl:lang]
[documentSize] [display]

4.2.2 Формальная грамматика для контейнеров других лексических единиц

20.

<AbbreviatedFormCtn> ::= <generalQualifiers> AbbreviatedForm
{<CoreComments>| <RelatedTopics>}

21.

<AnalogyCtn> ::= <generalQualifiers> Analogy {<CoreComments>|
<RelatedTopics>}

22.

<AntonymCtn> ::= <generalQualifiers> Antonym {<CoreComments>|
<RelatedTopics>}

23.

<DerivationCtn> ::= <generalQualifiers> Derivation
{<CoreComments>| <RelatedTopics>}

24.

<ExampleCtn> ::= <generalQualifiers> Example {<CoreComments>|
<RelatedTopics>}

25.

<FalseFriendCtn> ::= <generalQualifiers> FalseFriend
{<CoreComments>| <RelatedTopics>}

26.

<FreeTopicCtn> ::= <generalQualifiers> FreeTopic
{<CoreComments>| <RelatedTopics>}

27.

<FullFormCtn> ::= <generalQualifiers> FullForm
{<CoreComments>| <RelatedTopics>}

28.

<lnflectionCtn> ::= <generalQualifiers> Inflection
{<CoreComments>| <RelatedTopics>}

29.

<lnternationalScientificTermCtn> ::= <generalQualifiers>
IntemationalScientificTerm {<CoreComments>| <RelatedTopics>}

30.

<SearchFormCtn> ::= <generalQualifiers> SearchForm
{<CoreComments>| <RelatedTopics>}

31.

<SynonymCtn> ::= <generalQualifiers> Synonym {<CoreComments>|
<RelatedTopics>}

32.

<TranslationCtn> ::= <generalQualifiers> Translation
{<CoreComments>| <RelatedTopics>}

33.

<VariantCtn> ::= <generalQualifiers> Variant {<CoreComments>|
<RelatedTopics>}

4.2.3 Формальная грамматика для блоков

34.

<AnalogyBlock> ::= <generalQualifiers> (Analogy| AnalogyCtn>|
<AnalogyBlock>)+ {<CoreComments>}

35.

<CompositionalPhraseBlock> ::= <generalQualifiers>
(CompositionalPhrase| <CompositionalPhraseCtn>|
<CompositionalPhraseBlock>)+ {<CoreComments>}

36.

<DerivationBlock> ::= <generalQualifiers> (Derivation|
<DerivationCtn>| <DerivationBlock>)+ {<CoreComments>}

37.

<HeadwordBlock> ::= <generalQualifiers> (Headword|
<HeadwordCtn>| <HeadwordBlock>)+ {<CoreComments>}

38.

<lnflectionBlock> ::= <generalQualifiers> (Inflection|
<lnflectionCtn>| <lnflectiontionBlock>)+ {<CoreComments>}

39.

<MultiWordUnitBlock> ::= <generalQualifiers>
(MultiWordUnit|<MultiWordUnitCtn>|<MultiWordUnitBlock>)+ {<CoreComments>}

40.

<SynonymBlock> ::= <generalQualifiers>
(Synonym|<SynonymCtn>|<SynonymBlock>)+ {<CoreComments>}

41.

<TranslationBlock> ::= <generalQualifiers>
(Translation|<TranslationCtn>|<TranslationBlock>)+
{<CoreComments>}

42.

<VariantBlock> ::= <generalQualifiers>
(Variant|<VariantCtn>|<VariantBlock>)+ {<CoreComments>}

4.2.4 Формальная грамматика для контейнеров других комментариев

43.

<AttestationCtn> ::= <generalQualifiers> Attestation
{<ContainerComplement>}

44.

<CaseCtn> ::= <generalQualifiers> Case { Example| ExampleCtn|
<ContainerComplement>}

45.

<DefinitionCtn> ::= <generalQualifiers> Definition
{<ContainerComplement>}

46.

<EtymologyCtn> ::= <generalQualifiers> Etymology
{<ContainerComplement>}

47.

<FormulaCtn> ::= <generalQualifiers> Formula [Source]
<lnflectionCtn> ::= Inflection { <LinguisticComment> }

48.

<FreeCommentCtn> ::= <generalQualifiers> FreeComment
{<CoreComments>}

49.

<FrequencyCtn> ::= <generalQualifiers> Frequency
{<ContainerComplement>}

50.

<GeographicalUsageCtn> ::= <generalQualifiers>
Geographical Usage {<ContainerComplement>}

51.

<GuidePhraseCtn> ::= <generalQualifiers> GuidePhrase
{<ContainerComplement>}

52.

<GrammaticalGenderCtn> ::= <generalQualifiers>
GrammaticalGender {<ContainerComplement>}

53.

<GrammaticalNumberCtn> ::= <generalQualifiers>
GrammaticalNumber {<ContainerComplement>}

54.

<GrammaticalPatternCtn> ::= <generalQualifiers>
GrammaticalPattern {<ContainerComplement>}

55.

<lnsertCtn> ::= <generalQualifiers> Insert
{<ContainerComplement>}

56.

<MoodCtn> ::= <generalQualifiers> Mood {Example| ExampleCtn|
<ContainerComplement>}

57.

<NormativeStatusCtn> ::= <generalQualifiers> NormativeStatus
{<ContainerComplement>}

58.

<NoteCtn> ::= <generalQualifiers> Note {<ContainerComplement>}

59.

<PartOfSpeechCtn> ::= <generalQualifiers> PartOfSpeech
[Subcategorisation| SubcategorisationCtn] [GrammaticalGender]
[GrammaticalNumber] {<ContainerComplement>}

60.

<PersonCtn> ::= <generalQualifiers> Person { Example|
ExampleCtn| <ContainerComplement>}

61.

<PronunciationCtn ::= <generalQualifiers> Pronunciation
{<ContainerComplement>}

62.

<RegisterCtn ::= <generalQualifiers> Register
{<ContainerComplement>}

63.

<RangeOfApplicationCtn> ::= <generalQualifiers>
RangeOfApplication {<ContainerComplement>}

64.

<SeeCtn> ::= <generalQualifiers> See { Corecomments }
(HomographNumber) (SenseNumber) {<ContainerComplement>}

65.

<SenselndicatorCtn> ::= <generalQualifiers> Senselndicator
{<ContainerComplement>}

66.

<SenseQualifierCtn> ::= <generalQualifiers> SenseQualifier
{<ContainerComplement>}

67.

<SourceCtn> ::= <generalQualifiers> Source
{<ContainerComplement>}

68.

<SubcategorisationCtn> ::= <generalQualifiers>
Subcategorisation {<ContainerComplement> [SubcategorisationCtn]}

69.

<SubjectFieldCtn> ::= <generalQualifiers> SubjectField
{<ContainerComplement>}

70.

<SyllabificationCtn> ::= <generalQualifiers> Syllabification
{<ContainerComplement>}

71.

<SymbolCtn> ::= <generalQualifiers> Symbol { Source }
{<ContainerComplement>}

72.

<TenseCtn> ::= <generalQualifiers> Tense { Example|
ExampleCtn| <ContainerComplement>}

73.

<TypicalComplementCtn> ::= <generalQualifiers>
TypicalComplement {<ContainerComplement>}

74.

<UsageNoteCtn> ::= <generalQualifiers> UsageNote
{<CoreComments>}

4.2.5 Формальная грамматика для лексических единиц

75.

<AbbreviatedForm> ::= <generalQualifiers>
[Abbreviated Form Type] <CoreComponentContent>

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация

Название документа: ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация

Номер документа: ИСО 1951-2012

Вид документа: ГОСТ Р

Принявший орган: Росстандарт

Статус: Действующий

Опубликован: официальное издание

М.: Стандартинфом, 2014 год

Фактическая дата официального опубликования стандарта - июль 2014 года (информация с сайта http://www.gost.ru/ по состоянию на 17.07.2014)

Дата принятия: 20 ноября 2012

Дата начала действия: 01 января 2014
Информация о данном документе содержится в профессиональных справочных системах «Кодекс» и «Техэксперт»
Узнать больше о системах