Статус документа
Статус документа

ГОСТ Р 27.405-2011 Надежность в технике (ССНТ). Отбраковочные испытания на ранние отказы сложных систем, изготавливаемых в единичных экземплярах

     5 Планирование и проверка повышения степени безотказности

5.1 Шаг 1. Следует ли применять проверку степени повышения безотказности?

Проверка повышения безотказности имеет смысл в следующих случаях:

- экономия затрат за счет сокращения ранних отказов больше, чем расходы на проверку, с учетом необходимого мониторинга и контрольно-измерительной аппаратуры;

- отсутствуют результаты ранее проведенных испытаний всей системы, поскольку была произведена только одна или несколько систем или только одна система должна быть испытана;

- ожидаются ранние отказы из-за скрытых неисправностей, возникших в процессе сборки в компонентах или вследствие несоответствия допусков компонентов системы;

- серьезные ранние отказы модулей и компонентов должны быть исключены путем определения безотказности с учетом нагрузок до начала испытания системы;

- ожидаются ранние отказы в результате взаимодействия аппаратной системы и встроенного ПО;

- модель испытаний предполагает повышение безотказности, т.е. параметр потока отказов за время испытаний должен уменьшиться;

- при проведении испытаний с использованием моделируемых эксплуатационных нагрузок возможны нагрузки выше средних и добавление необычных релевантных нагрузок (искаженных, несанкционированных данных или условий перегрузки);

- возможные скрытые неисправности аппаратных средств преобразуются в постоянные или перемежающиеся за счет увеличения нагрузок окружающей среды, т.е. из-за увеличения температуры, колебаний температуры, вибрации, ударов и т.п.

5.2 Шаг 2. Определение отказа и сбор данных

Практический подход заключается в составлении перечня требований к системе и выявлении параметров, которые следует контролировать. Затем необходимо определить, как контролировать систему в ходе испытаний. Техническое задание на проведение испытаний должно определить релевантные и нерелевантные отказы.

Релевантные отказы представляют собой как внезапные отказы (функция отсутствует), так и постепенные отказы (деградация). Затем нужно определить отказы, связанные с ПО, т.е. отсутствие ответа, неправильный ответ, блокировка системы или чрезмерно большое время отклика. Отказы могут быть вызваны оборудованием, встроенным ПО или взаимодействием аппаратных средств и ПО, например, изменением значения времени задержки, приводящим к конфликту данных, или электромагнитными помехами, вызывающими изменение данных.

Нерелевантные отказы представляют собой отказы, вызванные испытательным оборудованием, контрольно-измерительной аппаратурой или операторами испытаний. Если проверка повышения степени безотказности предусматривает испытание устойчивости системы к человеческим ошибкам (ошибкам, допущенным оператором), эти ошибки будут определены как релевантные отказы.

Следует постоянно контролировать функции и производительность системы, по возможности. Если это невозможно, функциональные испытания, включая проверку функций резервных элементов, проводят в определенные промежутки времени. Когда прилагают циклические нагрузки, работу системы проверяют после каждого цикла. Статус резервирования и автоматической реконфигурирации, а также другие релевантные внутренние параметры системы проверяют в ходе испытаний.

Изменения в системе, например замена модуля или переключение режимов работы, также должны быть зарегистрированы. На практике принято отображать в протоколе испытаний все события: запуск, останов, отказ, обновление, изменение конфигурации, т.е. режим работы и т.п. Рекомендуется приглашать команду испытателей и операторов пользователя, с тем чтобы они высказали свои замечания и предложения по работе системы.

При проведении испытаний по методам 1, 2, 4, 5 и 6 следует регистрировать наработки до отказа. При этом должно быть задано эталонное время. Это может быть, к примеру, время испытаний в часах или минутах, эксплуатационное время или время работы центрального процессора. Чтобы сократить время испытаний, можно уплотнять время или увеличивать нагрузку (ускоренные испытания). В ходе испытаний по методу 3 регистрируют число транзакций до отказа.

5.3 Шаг 3. Уровни нагрузок

5.3.1 Общие положения

До начала процесса проверки степени повышения безотказности следует выполнить всесторонний анализ процедуры испытаний. Этот план должен содержать метод(ы) испытаний, а также процедуры принятия решений и уровень достоверности. Должны быть заданы виды анализа отказов и процедуры отчетности. Процессы должны быть адаптированы к конкретной системе, а также к доступному оборудованию формирования нагрузок и возможным способам нагрузки системы.

Для того чтобы как можно быстрее выявлять отказы, проявляемые как скрытые неисправности, испытуемые системы следует нагружать так, чтобы возникали релевантные неисправности, без введения отказов, не связанных с эксплуатационными отказами, и без существенного сокращения срока службы системы, т.е. без износа паяных соединений или без компонентов с ограниченным сроком службы. Условия испытаний могут находиться вне заданных условий эксплуатации, но должны соответствовать возможностям проекта. Цель - предотвращение повреждения системы и возникновения неисправностей, которые невозможны при эксплуатации.

Размер самых больших частей крупногабаритных систем ограничивает нагрузки, которые можно применять. Поэтому, как правило, используются низкие коэффициенты ускорения испытаний. Поскольку испытания предназначены для выявления ранних отказов, это редко становится проблематичным. Уплотнение времени ускоряет только виды отказов, вызываемых повышенной нагрузкой(ами). В результате некоторые виды отказов, например коррозия, не ускоряются, а даже сокращаются. Однако в большинстве случаев это не столь серьезная проблема, так как испытания предназначены для выявления ранних отказов, а не отказов, вызванных износом и старением.

В этом испытании используют увеличенные нагрузки для выявления скрытых неисправностей, проявляемых в виде отказов быстрее, чем при эксплуатации. Для методов, непосредственно основанных на убывающем времени испытаний, например таких, как методы 1.2, 3, 6 и 7, не нужно оценивать коэффициент ускорения. Для методов 1.1, 4 и 5, если указана требуемая безотказность при эксплуатации, коэффициент ускорения должен быть задан.

5.3.2 Увеличенная эксплуатационная нагрузка

Нагрузка, которую легче всего увеличить, - это, как правило, эксплуатационная нагрузка. Основой для определения эксплуатационной нагрузки в ходе испытаний служат графики эксплуатации и применения. Весьма полезный метод - уплотнение времени, т.е. увеличение числа рабочих нагрузок за единицу времени. В этом случае коэффициент ускорения эксплуатационной нагрузки можно легко оценить как отношение операций при испытании к операциям при эксплуатации за тот же период времени.

Эксплуатационную нагрузку ПО часто можно увеличить с помощью реальных или смоделированных входных данных, вводимых чаще или большего объема, чем при штатном режиме эксплуатации. Следует решить, должны ли эксплуатационные нагрузки имитировать обычные эксплуатационные нагрузки или же включать необычные эксплуатационные условия, такие как несбалансированная нагрузка, разброс нагрузки или экстремальные условия эксплуатации, несанкционированные, ошибочные или поврежденные данные.

Как правило, следует использовать высокие заданные эксплуатационные нагрузки. При заключении соглашения стороны могут договориться о том, что нагрузка может быть выше указанной максимальной нагрузки. В отсутствие соглашения нагрузка должна быть не выше указанной в технических условиях, если иное не утверждено организацией, уполномоченной принимать управленческие решения. Для резервных или защитных устройств, которые, как правило, не функционируют в системе, должны быть созданы условия активации этих устройств через регулярные промежутки времени.

5.3.3 Увеличение нагрузки окружающей среды