Статус документа
Статус документа


ГОСТ Р ИСО 1951-2012

     

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Представление и изложение словарных статей. Требования, рекомендации и информация

Presentation and representation of entries in dictionaries. Requirements, recommendations and information



ОКС 01.020, 01.080.99

Дата введения 2014-01-01

     

Предисловие

1 ПОДГОТОВЛЕН ЗАО "Проспект" на основе собственного аутентичного перевода на русский язык международного стандарта, указанного в пункте 4

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 55 "Терминология, элементы данных и документация в бизнес-процессах и электронной торговле"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 20 ноября 2012 г. N 966-ст

4 Настоящий стандарт идентичен международному стандарту ИСО 1951:2007* "Представление и изложение словарных статей. Требования, рекомендации и информация" (ISO 1951:2007 "Presentation/representation of entries in dictionaries - Requirements, recommendations and information").

________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.


При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА

5 ВВЕДЕН ВПЕРВЫЕ


Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)

Введение


За последние 10 лет процессы создания словарной продукции претерпели важные изменения по причине широкого распространения электронных словарей. Вследствие этого лексикографы оказались перед фактом огромного разнообразия методов разработки и публикации словарей.

Настоящий стандарт имеет целью информационную поддержку процессов создания и организации использования самых разных типов словарной продукции. При этом принимаются во внимание различные способы применения словарей, в особенности такие, которые связаны с новыми функциональными возможностями электронных документов - гиперссылками.

Для того, чтобы сделать информационное содержимое словарей многократно используемым в разных печатных и электронных форматах, лексикографы постоянно стремятся создать надлежащую единую, четко структурированную лексикографическую первооснову или информационный репозиторий. В настоящем стандарте предлагается конкретная модель, основанная на профессиональном опыте и лучших достижениях сложившейся практики и призванная способствовать дальнейшему совершенствованию процедур создания, взаимообмена и организации эффективного использования словарей.

     1 Область применения


Настоящий стандарт касается одноязычных и многоязычных общих и отраслевых словарей. Он определяет формализованную общую структуру, не зависящую от носителя информации, и устанавливает способы и средства представления статей в "бумажных" и электронных словарях. Связь между этой формальной структурой и представлениями словарных статей, которые используются издателями и читаются пользователями, поясняется примерами, рассмотренными в информативных приложениях.

Цель данного стандарта состоит в том, чтобы облегчить задачи создания, слияния, сравнения, поиска, информационного обмена, распространения и извлечения лексикографических словарных данных. В стандарте используется лексикографический подход к проблеме, основанный на выработке рекомендаций и не имеющий отношения к концептуальным разработкам, определенным в стандарте ИСО 704.

     2 Нормативные ссылки


В настоящем стандарте использованы нормативные ссылки на следующие стандарты*, которые необходимо учитывать при использовании настоящего стандарта. В случае ссылок на документы, у которых указана дата утверждения, необходимо пользоваться только указанной редакцией. В случае, когда дата утверждения не приведена, следует пользоваться последней редакцией ссылочных документов, включая любые поправки и изменения к ним.

_______________

* Таблицу соответствия национальных стандартов международным см. по ссылке. - Примечание изготовителя базы данных.     

ИСО 704:2000 Терминологическая работа. Принципы и методы (ISO 704:2009, Terminology work - Principles and methods)

ИСО 1087-1:2000 Терминологическая работа. Словарь. Часть 1: Теория и применение (ISO 1087-1:2000, Terminology work - Vocabulary - Part 1: Theory and application)

     3 Термины и определения


В настоящем стандарте использованы следующие термины с соответствующими определениями:

3.1 комментарий (comment): Металингвистическая информация, описывающая лексическую единицу с помощью лексикографических элементов данных или составных элементов.

3.2 составной элемент (component element): Составной информационный объект, образованный элементами.

Примечание - Существуют три семейства составных элементов: блоки, контейнеры и группы.

3.3 блок (block): Разложимая структура данных, составной элемент, служащий для факторизации элементов, которые используются множеством экземпляров конкретного элемента в качестве общих уточнений.

Примечание - Примеры блоков приведены в таблицах 6-14.

3.4 контейнер (container): Уточняющая структура, составной элемент, используемый для предоставления дополнительной информации об одном конкретном элементе данных с помощью других элементов.

Пример - Контейнер заглавного слова, используемый для представления его произношения или указания части речи и уточняющий таким образом заглавное слово, которое само по себе является уточненным элементом данных.

3.5 группа (group): Составной элемент, используемый для объединения нескольких независимых элементов.

Пример - Смысл понятия описывается группой элементов, таких как определение, предметная область и др.

Примечание - Пример группы представлен в таблицах 15 и 16.

3.6 элемент данных (data element): Единица информации определенной категории, для которой с помощью набора признаков заданы определение, идентификатор, форма представления и диапазон допустимых значений.

[ИСО/МЭК 11179-1:2004, определение 3.3.8]

Примечание - Списки элементов данных представлены в таблицах 1 и 2.

3.7 словарная статья (dictionary entry): Лексический вход, часть словаря, которая содержит информацию, относящуюся к одной лемме и ее вариантам.

3.8 элемент (element): Любой элемент данных или составной элемент.

3.9 заглавное слово (headword): Слово лексического входа, лемма, которая служит заголовком для статьи в словаре.

3.10 лемма (lemma): Базовое слово, лексическая единица, выбранная в соответствии с лексикографическими соглашениями о представлении различных форм инфлективной парадигмы.

Пример - "Продавать" - это лемма парадигмы "продает, продал, продающий и т.д.".

3.11 лексическая единица, лексема (lexical unit): Языковая единица, принадлежащая к лексикону данного языка и описанная или упомянутая в словаре.

3.12 лексикографический символ (lexicographical symbol): Буква, знак пунктуации или иной типографский либо графический символ или группа символов, равно как их комбинация, используемые для представления определенных лексикографических или терминологических данных, которые отображаются или выводятся автономно либо в сочетании с другим элементом лексикографических данных.

3.13 гнездовая рубрика (nested entry): Группирующая структура для родственных словарных статей с общим заглавным словом.

     4 Формализованное описание словарных статей

     Для большей четкости изложения рассматриваемая ниже формализованная модель, именуемая в дальнейшем как XmLex, иллюстрируется короткими примерами, запрограммированными в соответствии с документом, касающимся определения типов данных в языке XML и носящим имя XmLex_V00 (более подробную информацию см. в справочном приложении С).

     

     4.1 Общий обзор элементов данных и композиционных элементов


Словарные статьи могут рассматриваться как комментарии к определенным темам, образующим лексические единицы словаря. Статья имеет главную тему (определяемую заглавным словом); все другие темы (например, варианты, переводы) называются "зависимыми темами". Темы и комментарии являются элементами данных. Каждому элементу данных соответствует модель информационного содержания (контента). Элементы данных группируются в композиционные элементы для создания непротиворечивого и полностью поддающегося вычислительной обработке лексического входа. Приводимые ниже открытые списки элементов данных и композиционных элементов могут расширяться пользователем в соответствии с конкретными целями.

В словарях, издаваемых типографским способом, для определения связей между темами и комментариями, как правило, соблюдаются определенные типографские соглашения (использование обычного, полужирного и курсивного шрифтов); соглашения по размещению (до/после) и по знакам пунктуации (запятая и точка с запятой). В модели XmLex:

- положение элемента никогда не используется для обозначения связи между двумя элементами;

- не существует никаких маркеров, эквивалентных типографским знакам (запятой и точке с запятой).

Композиционные элементы (контейнеры, блоки и группы) используются для кодирования логических зависимостей между комментариями и темами таким образом, что, с одной стороны, всегда имеется возможность автоматически скомпоновать и выдать на печать любую форму, а, с другой стороны, автоматически "просчитать" все взаимосвязи между элементами в случае преобразования данных (например, для обращения двуязычного словаря) или при повторном использовании данных в иных контекстах, например, в среде систем памяти переводов или лексических баз данных.

В данной части стандарта:

- описываются элементы данных и их объединение в композиционные элементы, необходимые для представления наиболее общих словарных статей;

_______________

Каждому элементу данных присваивается условное имя и описание, которое должно в максимально возможной степени отвечать требованиям стандарта ISO 12620:1999. Произвольные элементы данных, тип которых определяется пользователем, позволяют осуществить расширение модели на ситуации "договорного информационного обмена".


- определяется формализованная модель словаря в расширенном представлении Бэкуса - Наура, которое часто используется в качестве формальной нотации для описания синтаксической структуры данного языка;

- даются в приложениях примеры реализации и средства контроля, основанные на использовании спецификаций XML, Xpointer, XSL и XHTML.

     4.1.1 Элементы данных

4.1.1.1 Лексические единицы

Представленная ниже таблица содержит перечень лексических единиц и комментариев, которые следует использовать в стандартизованной словарной статье.

В первом столбце таблицы дается обозначение элемента данных. Второй столбец показывает групповой идентификатор этого элемента в рамках формализованной модели. В третьем столбце приводится короткое пояснение, а в четвертом - помещена ссылка на первый соответствующий пример (если таковой существует) элемента данных в приложениях (буква обозначает приложение, подчеркнутый номер указывает номер примера, а последний номер определяет нужную строку).


Таблица 1 - Список лексических единиц

Имя

Групповой идентификатор

Пояснение

См. приложение пример
строка

сокращенная форма

AbbreviatedForm

Лексическая единица, образованная путем удаления отдельных слов или букв из более длинной формы [...].

[адаптированный пример из ISO 1087-1:2000, определение 3.4.9]

С
7
3

аналогия

Analogy

Лексическая единица, имеющая некоторое сходство по смысловому содержанию с текущей лексической единицей.

[адаптированный пример из ISO 1087-1:2000, определение 3.4.9]

С
10
4

антоним

Antonym

Лексическая единица, которая представляет понятие, противоположное по смыслу текущей лексической единице.

[адаптированный пример из ISO 12620:1999, А.10.18.6]

С
5
45

композиционная фраза

CompositionalPhrase

Любое многократно повторяющееся общепринятое словосочетание, такое как коллокация, пословица, поговорка и т.п.

С
4
15

словообразование

Derivation

Изменение формы лексической единицы, обычно выражающееся в модифицировании корневой основы или аффиксации и сигнализирующее об изменении информации о части речи.

С
5
9

пример

Example

Экземпляр, типичный для применения лексической единицы в определенном контексте.

С
4
10

ложный друг

FalseFriend

Лексическая единица языка, кажущаяся формальным или семантическим подобием лексической единице другого языка, но не соответствует ей по смыслу.

[адаптированный пример из ISO 12620:1999, А.3.2]

С
15
6

произвольная тема

FreeTopic

Лексическая единица, тип которой в данном международном стандарте не определен.

С
18
5

полная форма

FullForm

Полная форма представления лексической единицы, для которой существует сокращенная форма.

[адаптированный пример из ISO 12620:1992, А.2.1.7]

С
20
3

заглавное слово

Headword

Лемма, являющаяся заголовком словарной статьи.

С
1
4

инфлексия

Inflection

Модификация формы слова для выражения других грамматических связей, в которых оно может участвовать.

С
22
5

международный научный термин

IntemationalScientificTerm

Термин, являющийся частью научной терминологии, принятой соответствующим научным распорядительным органом.

[адаптированный пример из ISO 12620:1999, А.2.1.4]

С
39
12

многословная лексическая единица

MultiWordUnit

Лексическая единица, состоящая из нескольких слов и выражающая только одно понятие.

С
1
42

символ

Symbol

Обозначение некоторого понятия буквами, числами, пиктограммами или любой их комбинацией.

[адаптированный пример из ISO 12620:1999, А.2.1.13]

С
23
7

синоним

Synonym

Лексическая единица, которая представляет то же самое или очень близкое понятие, что и заглавное слово словарной статьи.

[адаптированный пример из ISO 12620:1999, А.2.1.2]

С
5
27

перевод

Translation

Эквивалентная лексическая единица, принадлежащая целевому языку перевода.

С
1
15

вариант

Variant

Одна из альтернативных форм лексической единицы.

[адаптированный пример из ISO 12620:1999, А.2.1.9]

С
32
5

Доступ к полной версии документа ограничен
Полный текст этого документа доступен на портале с 20 до 24 часов по московскому времени 7 дней в неделю.
Также этот документ или информация о нем всегда доступны в профессиональных справочных системах «Техэксперт» и «Кодекс».