6.1 Тестирование и оценка показателей - по ГОСТ Р 70321.6-2022 (раздел 6) с дополнениями, приведенными в настоящем стандарте.
6.2 Показатели для оценки функциональной корректности алгоритмов ИИ выбирают исходя из специфики решаемой задачи на усмотрение заказчика испытаний.
Например, в задачах сегментации могут быть использованы следующие показатели:
- доля правильных исходов по всем классам;
- попиксельная F-мера по всем классам.
Долю правильных исходов по всем классам и попиксельную F-меру по всем классам рассчитывают по формулам (13) и (17) ГОСТ Р 59898-2021 соответственно, причем:
- TP - количество истинно положительных исходов: площадь пикселей снимков, отнесенных к целевым классам объектов дорожно-транспортной сети по результатам работы алгоритма ИИ и принадлежащих к целевым классам объектов дорожно-транспортной сети в разметке;
- TN - количество истинно отрицательных исходов: площадь пикселей снимков, не отнесенных к целевым классам объектов дорожно-транспортной сети по результатам работы алгоритма ИИ и не принадлежащих к целевым классам объектов дорожно-транспортной сети в разметке;
- FP - количество ложноположительных исходов: площадь пикселей снимков, отнесенных к целевым классам объектов дорожно-транспортной сети по результатам работы алгоритма ИИ и не принадлежащих к целевым классам объектов дорожно-транспортной сети в разметке;
- FN - количество ложноотрицательных исходов: площадь пикселей снимков, не отнесенных к целевым классам объектов дорожно-транспортной сети по результатам работы алгоритма ИИ и принадлежащих к целевым классам объектов дорожно-транспортной сети в разметке.