Статус документа
Статус документа

ГОСТ Р ИСО/МЭК 29794-1-2012 Информационные технологии (ИТ). Биометрия. Качество биометрических образцов. Часть 1. Структура

Приложение А
(справочное)

     
Процедуры построения набора данных для нормализации показателя качества

А.1 Общие сведения о наборе данных для нормализации показателя качества

Цель метода стандартизации при помощи НДНПК - обеспечение согласующейся и допускающей взаимодействие интерпретации показателей качества. Для достижения поставленной цели необходима стандартизация набора(ов) данных и обеспечение каждой биометрической модальности собственным набором(ами) данных. Для каждого набора данных необходимо определить несколько классов показателей, с каждым из которых сопоставляется диапазон показателей качества. Данные о нескольких образцах, попадающие в каждый класс, собираются и вносятся в стандарты, предназначенные для разработчиков алгоритмов и получателей (пользователей) показателей качества. Поставщикам алгоритмов рекомендуется модифицировать или предоставить такую функцию преобразования, чтобы выходные данные алгоритмов качества согласовывались с рекомендуемым диапазоном показателя для данных о каждом образце, предоставленном в базе данных стандарта. Однако при наличии более одной версии стандартизированного набора данных важно предоставить сведения о том наборе данных, который используется для нормализации показателя качества. В дальнейшем набор данных вносится в стандарт и становится доступным для разработчиков и получателей (пользователей) показателей качества.

В настоящем приложении установлена процедура составления контрольной базы данных, ориентированной на эффективность. Результатом выполнения процедуры является набор образцов, снабженный целевым показателем качества. Результат является классификацией согласованных показателей схожести, полученных от множества компараторов. Подобные контрольные наборы используются при такой нормализации показателя качества, сгенерированного разными алгоритмами оценки качества, что показатели качества от разных алгоритмов оценки качества могут быть единообразно интерпретированы в рамках целесообразного диапазона. Метод применяется при настройке алгоритма оценки качества в соответствии с условиями эксплуатации, когда известны тип компаратора и тип данных. Разработчики алгоритма оценки качества, выполняющие общую задачу, также могут использовать данный метод. Входными данными для процедуры является репрезентативная база данных образцов. Выходными данными является сопоставленный каждому образцу целевой скалярный показатель качества. Метод предполагает доступность репрезентативного алгоритма сопоставления, который используется для сопоставления образов для создания как истинного, так и ложного показателя схожести. Таким образом, подразумевается, что на каждого человека может приходиться два и более образцов.

А.2 Данные

Данные, собранные в целевом рабочем приложении, являются наиболее показательными. Рекомендуется создать контрольный набор с большей долей образцов, представляющих сложность для компаратора, чем присутствует в генеральной совокупности. Контрольный набор образцов должен быть максимально сбалансирован, например, в случае с отпечатками пальцев - в отношении положения пальца (правый/левый указательный/большой/средний), типа отпечатка (прокатный/оттисковый), пола, возраста и сканера отпечатков пальцев. Недостаточное количество данных делает создание сбалансированного набора данных проблематичным.

В некоторых областях использование предлагаемого метода полностью зависит от стандартизации наборов данных биометрических образцов и их доступности. Наборы данных, как минимум, должны формироваться таким образом, чтобы: 1) оставалось достаточно места для хранения файлов, 2) осуществлялась защита целостности сохраненных в наборе данных файлов и 3) обеспечивалась безопасность файлов посредством контроля доступа к ним квалифицированных работников.

А.3 Присвоение целевого показателя качества

Каждому изображению, находящемуся в контрольном наборе данных, необходимо присвоить основанный на эффективности показатель качества. Соответствующие показатели схожести гарантируют эффективность показателей качества. Рассмотрим биометрический набор данных, содержащий 2 образцов, , , ..., , для каждого из субъектов 1, ..., , где каждое изображение содержит лишь одну характеристику, например изображение лишь одного пальца или одной радужной оболочки. При помощи данной процедуры присваиваются значения качества , , ..., , 1, ..., всем изображениям в контрольном наборе данных.

| Для каждого компаратора , 1, ..., , из доступных компараторов и каждой записи экземпляра (то есть -го образца субъекта ) необходимо:

1) сгенерировать набор всех возможных парных показателей сравнения при помощи -го компаратора:

     
1, ..., ; , ..., ;                                          (1)

     
1, ..., ,


где - -й из всех доступных 1, ..., компараторов.

В результате получаем элементов в наборе , где для каждого образца субъекта присутствует парных сопоставлений.

При этом полагаем, что генерируются несимметричные показатели сравнения, то есть

.


Если появляются симметричные показатели сравнения, то следует осуществлять процедуру с использованием лишь половины показателей сравнения;

2) сгенерировать набор непарных показателей сравнения при помощи -го компаратора посредством сравнения образцов, взятых у индивида , и образцов, взятых у всех 1, ...., и остальных индивидов:

     
1, ..., ; 1, ..., ;                                         (2)

     
1, ..., ; 1, ..., ; .


В результате получаем непарных показателей сравнения для образца ;

3) внести (, ) в набор , если его парные показатели сравнения больше, чем все его непарные показатели сравнения, то есть