ГОСТ Р ИСО 1951-2012
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Представление и изложение словарных статей. Требования, рекомендации и информация
Presentation and representation of entries in dictionaries. Requirements, recommendations and information
ОКС 01.020, 01.080.99
Дата введения 2014-01-01
Предисловие
1 ПОДГОТОВЛЕН ЗАО "Проспект" на основе собственного аутентичного перевода на русский язык международного стандарта, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 55 "Терминология, элементы данных и документация в бизнес-процессах и электронной торговле"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 20 ноября 2012 г. N 966-ст
4 Настоящий стандарт идентичен международному стандарту ИСО 1951:2007* "Представление и изложение словарных статей. Требования, рекомендации и информация" (ISO 1951:2007 "Presentation/representation of entries in dictionaries - Requirements, recommendations and information").
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА
5 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)
За последние 10 лет процессы создания словарной продукции претерпели важные изменения по причине широкого распространения электронных словарей. Вследствие этого лексикографы оказались перед фактом огромного разнообразия методов разработки и публикации словарей.
Настоящий стандарт имеет целью информационную поддержку процессов создания и организации использования самых разных типов словарной продукции. При этом принимаются во внимание различные способы применения словарей, в особенности такие, которые связаны с новыми функциональными возможностями электронных документов - гиперссылками.
Для того, чтобы сделать информационное содержимое словарей многократно используемым в разных печатных и электронных форматах, лексикографы постоянно стремятся создать надлежащую единую, четко структурированную лексикографическую первооснову или информационный репозиторий. В настоящем стандарте предлагается конкретная модель, основанная на профессиональном опыте и лучших достижениях сложившейся практики и призванная способствовать дальнейшему совершенствованию процедур создания, взаимообмена и организации эффективного использования словарей.
Настоящий стандарт касается одноязычных и многоязычных общих и отраслевых словарей. Он определяет формализованную общую структуру, не зависящую от носителя информации, и устанавливает способы и средства представления статей в "бумажных" и электронных словарях. Связь между этой формальной структурой и представлениями словарных статей, которые используются издателями и читаются пользователями, поясняется примерами, рассмотренными в информативных приложениях.
Цель данного стандарта состоит в том, чтобы облегчить задачи создания, слияния, сравнения, поиска, информационного обмена, распространения и извлечения лексикографических словарных данных. В стандарте используется лексикографический подход к проблеме, основанный на выработке рекомендаций и не имеющий отношения к концептуальным разработкам, определенным в стандарте ИСО 704.
В настоящем стандарте использованы нормативные ссылки на следующие стандарты*, которые необходимо учитывать при использовании настоящего стандарта. В случае ссылок на документы, у которых указана дата утверждения, необходимо пользоваться только указанной редакцией. В случае, когда дата утверждения не приведена, следует пользоваться последней редакцией ссылочных документов, включая любые поправки и изменения к ним.
_______________
* Таблицу соответствия национальных стандартов международным см. по ссылке. - Примечание изготовителя базы данных.
ИСО 704:2000 Терминологическая работа. Принципы и методы (ISO 704:2009, Terminology work - Principles and methods)
ИСО 1087-1:2000 Терминологическая работа. Словарь. Часть 1: Теория и применение (ISO 1087-1:2000, Terminology work - Vocabulary - Part 1: Theory and application)
В настоящем стандарте использованы следующие термины с соответствующими определениями:
3.1 комментарий (comment): Металингвистическая информация, описывающая лексическую единицу с помощью лексикографических элементов данных или составных элементов.
3.2 составной элемент (component element): Составной информационный объект, образованный элементами.
Примечание - Существуют три семейства составных элементов: блоки, контейнеры и группы.
3.3 блок (block): Разложимая структура данных, составной элемент, служащий для факторизации элементов, которые используются множеством экземпляров конкретного элемента в качестве общих уточнений.
Примечание - Примеры блоков приведены в таблицах 6-14.
3.4 контейнер (container): Уточняющая структура, составной элемент, используемый для предоставления дополнительной информации об одном конкретном элементе данных с помощью других элементов.
Пример - Контейнер заглавного слова, используемый для представления его произношения или указания части речи и уточняющий таким образом заглавное слово, которое само по себе является уточненным элементом данных.
3.5 группа (group): Составной элемент, используемый для объединения нескольких независимых элементов.
Пример - Смысл понятия описывается группой элементов, таких как определение, предметная область и др.
Примечание - Пример группы представлен в таблицах 15 и 16.
3.6 элемент данных (data element): Единица информации определенной категории, для которой с помощью набора признаков заданы определение, идентификатор, форма представления и диапазон допустимых значений.
[ИСО/МЭК 11179-1:2004, определение 3.3.8]
Примечание - Списки элементов данных представлены в таблицах 1 и 2.
3.7 словарная статья (dictionary entry): Лексический вход, часть словаря, которая содержит информацию, относящуюся к одной лемме и ее вариантам.
3.8 элемент (element): Любой элемент данных или составной элемент.
3.9 заглавное слово (headword): Слово лексического входа, лемма, которая служит заголовком для статьи в словаре.
3.10 лемма (lemma): Базовое слово, лексическая единица, выбранная в соответствии с лексикографическими соглашениями о представлении различных форм инфлективной парадигмы.
Пример - "Продавать" - это лемма парадигмы "продает, продал, продающий и т.д.".
3.11 лексическая единица, лексема (lexical unit): Языковая единица, принадлежащая к лексикону данного языка и описанная или упомянутая в словаре.
3.12 лексикографический символ (lexicographical symbol): Буква, знак пунктуации или иной типографский либо графический символ или группа символов, равно как их комбинация, используемые для представления определенных лексикографических или терминологических данных, которые отображаются или выводятся автономно либо в сочетании с другим элементом лексикографических данных.
3.13 гнездовая рубрика (nested entry): Группирующая структура для родственных словарных статей с общим заглавным словом.
Для большей четкости изложения рассматриваемая ниже формализованная модель, именуемая в дальнейшем как XmLex, иллюстрируется короткими примерами, запрограммированными в соответствии с документом, касающимся определения типов данных в языке XML и носящим имя XmLex_V00 (более подробную информацию см. в справочном приложении С). |
Словарные статьи могут рассматриваться как комментарии к определенным темам, образующим лексические единицы словаря. Статья имеет главную тему (определяемую заглавным словом); все другие темы (например, варианты, переводы) называются "зависимыми темами". Темы и комментарии являются элементами данных. Каждому элементу данных соответствует модель информационного содержания (контента). Элементы данных группируются в композиционные элементы для создания непротиворечивого и полностью поддающегося вычислительной обработке лексического входа. Приводимые ниже открытые списки элементов данных и композиционных элементов могут расширяться пользователем в соответствии с конкретными целями.
В словарях, издаваемых типографским способом, для определения связей между темами и комментариями, как правило, соблюдаются определенные типографские соглашения (использование обычного, полужирного и курсивного шрифтов); соглашения по размещению (до/после) и по знакам пунктуации (запятая и точка с запятой). В модели XmLex:
- положение элемента никогда не используется для обозначения связи между двумя элементами;
- не существует никаких маркеров, эквивалентных типографским знакам (запятой и точке с запятой).
Композиционные элементы (контейнеры, блоки и группы) используются для кодирования логических зависимостей между комментариями и темами таким образом, что, с одной стороны, всегда имеется возможность автоматически скомпоновать и выдать на печать любую форму, а, с другой стороны, автоматически "просчитать" все взаимосвязи между элементами в случае преобразования данных (например, для обращения двуязычного словаря) или при повторном использовании данных в иных контекстах, например, в среде систем памяти переводов или лексических баз данных.
В данной части стандарта:
- описываются элементы данных и их объединение в композиционные элементы, необходимые для представления наиболее общих словарных статей;
_______________
Каждому элементу данных присваивается условное имя и описание, которое должно в максимально возможной степени отвечать требованиям стандарта ISO 12620:1999. Произвольные элементы данных, тип которых определяется пользователем, позволяют осуществить расширение модели на ситуации "договорного информационного обмена".
- определяется формализованная модель словаря в расширенном представлении Бэкуса - Наура, которое часто используется в качестве формальной нотации для описания синтаксической структуры данного языка;
- даются в приложениях примеры реализации и средства контроля, основанные на использовании спецификаций XML, Xpointer, XSL и XHTML.
4.1.1.1 Лексические единицы
Представленная ниже таблица содержит перечень лексических единиц и комментариев, которые следует использовать в стандартизованной словарной статье.
В первом столбце таблицы дается обозначение элемента данных. Второй столбец показывает групповой идентификатор этого элемента в рамках формализованной модели. В третьем столбце приводится короткое пояснение, а в четвертом - помещена ссылка на первый соответствующий пример (если таковой существует) элемента данных в приложениях (буква обозначает приложение, подчеркнутый номер указывает номер примера, а последний номер определяет нужную строку).
Таблица 1 - Список лексических единиц
Имя | Групповой идентификатор | Пояснение | См. приложение пример |
сокращенная форма | AbbreviatedForm | Лексическая единица, образованная путем удаления отдельных слов или букв из более длинной формы [...]. | С |
аналогия | Analogy | Лексическая единица, имеющая некоторое сходство по смысловому содержанию с текущей лексической единицей. | С |
антоним | Antonym | Лексическая единица, которая представляет понятие, противоположное по смыслу текущей лексической единице. | С |
композиционная фраза | CompositionalPhrase | Любое многократно повторяющееся общепринятое словосочетание, такое как коллокация, пословица, поговорка и т.п. | С |
словообразование | Derivation | Изменение формы лексической единицы, обычно выражающееся в модифицировании корневой основы или аффиксации и сигнализирующее об изменении информации о части речи. | С |
пример | Example | Экземпляр, типичный для применения лексической единицы в определенном контексте. | С |
ложный друг | FalseFriend | Лексическая единица языка, кажущаяся формальным или семантическим подобием лексической единице другого языка, но не соответствует ей по смыслу. | С |
произвольная тема | FreeTopic | Лексическая единица, тип которой в данном международном стандарте не определен. | С |
полная форма | FullForm | Полная форма представления лексической единицы, для которой существует сокращенная форма. | С |
заглавное слово | Headword | Лемма, являющаяся заголовком словарной статьи. | С |
инфлексия | Inflection | Модификация формы слова для выражения других грамматических связей, в которых оно может участвовать. | С |
международный научный термин | IntemationalScientificTerm | Термин, являющийся частью научной терминологии, принятой соответствующим научным распорядительным органом. | С |
многословная лексическая единица | MultiWordUnit | Лексическая единица, состоящая из нескольких слов и выражающая только одно понятие. | С |
символ | Symbol | Обозначение некоторого понятия буквами, числами, пиктограммами или любой их комбинацией. | С |
синоним | Synonym | Лексическая единица, которая представляет то же самое или очень близкое понятие, что и заглавное слово словарной статьи. | С |
перевод | Translation | Эквивалентная лексическая единица, принадлежащая целевому языку перевода. | С |
вариант | Variant | Одна из альтернативных форм лексической единицы. | С |