Статус документа
Статус документа

ГОСТ Р ИСО/МЭК 27038-2016 Информационные технологии (ИТ). Методы обеспечения безопасности. Требования и методы электронного цензурирования

Приложение А
(справочное)

Цензурирование документов в формате PDF


В большинстве случаев пользователи PDF-документов используют программное обеспечение, не имеющее или имеющее ограниченные функциональные возможности для цензурирования электронных документов в этом формате. В такой ситуации следует использовать специализированные инструменты для цензурирования содержащейся в PDF-документах информации.

В общем случае страницы PDF-документа формируются на основе объектов следующих четырех основных типов:

1) текстовый объект (Text Object) - информация, для отображения которой на странице используются шрифты;

2) графический объект (Image Object) - PDF-объект, обычно используемый для представления на странице растровой графической информации. Один и тот же графический объект может быть многократно использован в документе;

3) встроенный графический объект (Inline Image Object) - графические данные, встроенные в контент конкретной страницы. Такие объекты, как правило, используются программами оптического распознавания текста для вставки изображения отдельного слова, распознанного с низким уровнем уверенности;

4) объект типа контур (Path Object) - Набор команд векторной графики, включающий команды рисования линий, кривых и прямоугольников. Текст на странице может быть представлен с использованием объектов типа контур вместо текстовых объектов.

В пределах PDF-страницы эти объекты могут образовывать вложенные структуры в любой последовательности и на любую глубину. Процесс цензурирования PDF-страниц должен соответствовать следующим критериям:

a) из подлежащей удалению области страницы удаляются все содержащие информацию объекты, на любом уровне вложенности;

b) отображение незатронутых цензурированием частей PDF-страницы не изменяется.