4.1 Настоящий стандарт является одним из серии международных и национальных стандартов, устанавливающих правила конверсии систем письма с целью обеспечения международного обращения письменных сообщений как в автоматизированных информационных и коммуникационных системах, так и при интеллектуальной обработке, требующей точного и однозначного представления текстовых данных, созданных на одном языке, средствами другого языка.
Такие правила должны обладать следующими необходимыми свойствами:
- однозначностью, обеспечивающей стабильность представления элементов исходной письменности (букв, слов, выражений) средствами другой (конвертирующей) письменности;
- обратимостью, обеспечивающей возможность однозначного точного восстановления текста на исходном языке;
- простотой, обеспечивающей автоматическое выполнение процедуры перехода от исходного текста к конвертированному и обратно на основе простых алгоритмов, преимущественно сводящихся к применению таблиц замены знаков одной системы письма знаками другой системы письма.
При применении правил конверсии могут не всегда соблюдаться требования звукового соответствия знаков конвертируемых систем письма, эстетические соображения и традиционные нормы, хотя в каждом отдельном случае желательна разработка таких правил, чтобы нарушение традиционных, фонетических и эстетических норм было минимальным. Однако каждый, кто знает исходный язык и правила конверсии, имеет возможность восстановить исходный текст и прочитать его по правилам исходного языка.
Для алфавитных систем письма способом, удовлетворяющим сформулированным выше требованиям, является транслитерация.
4.2 Устанавливают две системы транслитерации кирилловских алфавитов латинскими буквами:
А) с использованием диакритики - см. раздел 5,
Б) с использованием буквосочетаний - см. раздел 6.
Использование системы А или Б определяет орган, производящий транслитерацию, и это должно быть указано в сопроводительных материалах к документу. В составе одного документа следует использовать только одну систему, либо каждый раз вид транслитерации оговаривать особо и обозначать специальными указателями в тексте. Исключение из этого правила делается только для документов, в которых цитируются тексты, транслитерируемые в другом (цитируемом) документе, с указанием источника цитирования.
4.3 Транслитерированный текст на машиночитаемых носителях должен быть снабжен указателями, определяющими его границы, исходную письменность и способ транслитерации. Спецификация таких указателей должна быть задана стандартами на язык разметки структуры документов.
4.4 Небуквенные знаки письма (знаки препинания и др.), указанные в приложении Б, при транслитерации сохраняются, как правило, без изменения.
При отсутствии нужных символов в печатающем устройстве используют символы, предусмотренные ГОСТ 27465, при этом допускается:
- изменять вид кавычек (вместо открывающих строчных кавычек использовать подстрочные кавычки либо надстрочные кавычки, а вместо закрывающих строчных кавычек использовать надстрочные кавычки);
- заменять тире дефисом, окруженным с двух сторон пробелами;
- заменять многоточие тремя последовательными точками;
- заменять символ номера знаком # или сочетанием No.
Не допускается заменять верхние кавычки двумя апострофами или двумя ударениями, а нижние - двумя запятыми.