Analiza uszkodzeń - Informatyka Nr 10; miesięcznik profesjonalistów

W odniesieniu do architektury systemu, FMEA polega na iden

tyfikacji i analizie możliwych stanów uszkodzeń {failure mo

des) elem entówsystemu, wyznaczaniu wpływu, jakie te stany mogą mieć na działanie innych elementów i całego systemu oraz na ocenie możliwych konsekwencji tego wpływu na śro

dowisko zewnętrzne. Ocena możliwości wystąpienia

(praw-Uszkodzenie, awaria systemu (failure)

Sytuacja, gdy jedna z funkcji, którą system powinien realizować, nie jest realizowana.

Widzialny efekt zewnętrzny łańcucha przyczynowego.

(Według PN-93/N-50J9I, uszkodzenie systemu, to utrata jego zdolności do wykonywania wymaganych funkcji).

Błąd, pomyłka (ierror)

Nieprawidłowe działanie systemu lub ciąg stanów pośrednich, które powodują uszkodzenie.

Rozbieżność między stanem obliczonym, zaobserwowanym lub zmierzonym a stanem prawdziwym, ustalonym lub teoretycznie poprawnym (może to być także błąd operatora).

Usterka losowa, wada fizyczna elementu/modułu

(physical fault)

Losowa przyczyna błędu (np.

promieniowanie jonizujące) lub jako konsekwencja danych wejściowych.

Defekt, wada z procesu projektowego

elementu/modułu (design fault)

Przyczyna błędu powstała w specyfikacji wymagań, (np. przeoczenie) lub w procesie jej transformacji, (np. między projektem a kodowaniem programu).

Tabela 1. Pojęcia używane w analizie FMEA.

zrealizowanego systemu. W każdym przypadku FMEA słu

ży do weryfikacji i poprawy architektury lub procesu. We

dług normy IEC 812 metoda FMEA może być również zastosowana do analizy oprogramowania oraz działań lu

dzi. Znaczenie tego typu analiz rośnie wraz ze wzrostem złożoności systemów stosowanych w transporcie, energety

ce, medycynie lub militarne. Takim systemom stawiane są szczególnie wysokie wymagania niezawodności i bezpie

czeństwa.

dopodobieństwa, częstotliwości) i skutków uszkodzeń syste

mu jest podstawą analizy krytyczności. Na tej podstawie usta

lane są progi ryzyka dla systemu. S ta n y uszkodzeńzależą od architektury systemu i technologii. S k u tk i uszkodzeń zależą ponadto od sposobu użytkowania i środowiska danego syste

mu. Poniżej podano klasyfikację pojęć używanych w analizie FMEA. Pojęcia te reprezentują łańcuch przyczynowy: uster- ka/defekt-bląd-aszkodzenie. W prawej kolumnie tabeli poda

no wyjaśnienia poszczególnych pojęć.

42 in fo rm atyka 10/97

Stany uszkodzeń systemu są definiowane przez powiązanie ich z klasami możliwych usterek/wad/defektów (trwałych lub przemijających), które do tych stanów doprowadzają. Klasyfi

kacje usterek/wad/defektów stanowią podstawę do zbierania danych do późniejszych analiz porównawczych. Połączenie da

nych o przyczynach z obserwowanymi uszkodzeniami umożli

wia wykorzystanie zebranych danych do poprawy przyszłych systemów. Ocenia się, że źródłem większości uszkodzeń są błę

dy projektów lub/i nieprawidłowe użytkowanie systemu.

Zebrane i usystematyzowane dane (odzwierciedlające naturę produktów i stosowanych technik) umożliwiają ocenę różnych aspektów systemów oraz procesów ich tworzenia (np. pod kątem efektywności działań inżynierskich). Pozwalająw szczególności przewidywać wiarogodność realizowanych systemów i dąjąpod- stawę do doboru odpowiednich technik do osiągnięcia wymaga

nej niezawodności. Dane te umożliwiają także wykonanie pełnej analizy FMEA systemów zawieraj ących oprogramowanie.

Metoda FMEA zakłada, że struktura systemu i dane o jego elementach są znane.W szczególności, zidentyfikowane zo

stały czynnikipodstawowe- najniższy poziom elementów struk

tury, o którym mamy dostateczną wiedzę, dotyczącą możliwych stanów uszkodzeń każdego elementu, ich funkcjonowania i za

leżności między nimi. Poziom ten zależy od celu i zakresu ana

lizyi stanowi punkt wyjścia do analizy FMEA. Analiza służy do wyznaczenia wpływu czynników podstawowych na moduły/pod

systemy oraz identyfikacji czynników wtórnych,które mogąpo- jawić się na wyższych poziomach struktury. Rozważane sąciągi zdarzeń w czasie oraz różne tryby działania: inicjacja systemu, praca normalna, sterowanie, obsługa. Jeśli usterka/wada/defekt elementu doprowadzają do niewłaściwego zachowania syste

mu, chociaż zgodnego ze specyfikacją wymagań, oznacza to znalezienie w niej błędu. Metoda może skutecznie analizować pojedyncze uszkodzenia. Jej zakres zwykle nie obejmuje uszko

dzeń wielokrotnych. Dla różnych systemów analizy funkcjono

wania elementów mogą wspomagać techniki identyfikujące zachowanie się systemu. Stosowane są różne formy reprezenta

cji opisującej funkcje elementów (modele funkcjonalne), np.

diagramy blokowe stanów i przepływów. Ze względu na trudno

ści w stosowaniu modeli analitycznych, wynikające z niejasnych mechanizmów aktywacji usterek i propagacji błędów w syste

mach komputerowych (założenia upraszczające mogą zmienić znaczenie otrzymanych rezultatów), stosowane są również sy

mulacje numeryczne lub eksperymenty związane z symulacją (na drodze indukcji, programowej emulacji) usterek.

Analizę FMEA wybieramy wtedy, gdy:

■ liczba stanów wyjściowych systemu jest duża i potrzebuje

my techniki wspierającej identyfikację możliwych stanów systemu;

■ podejrzewamy, że system może „produkować” nieakcep- towalne stany wyjściowe, których nie znamy;

■ istnieje potrzeba poprawy konstrukcji (np. wzrostu pozio

mu bezpieczeństwa), rozpoznawania problemów diagno

styki lub obsługi, przygotowania specyfikacji i planu testów;

■ potrzebujemy jakościowej analizy, dającej wgląd w zachowa

nie się oprogramowania w przypadku awarii oraz pewność, że

dla znacznego zakresu defektów i związanych z nimi błędów system potrafi je wykryć i odpowiednio na nie zareagować;

■ chcemy zweryfikować poprawność procesu tworzenia sys

temu, zaplanować działania prewencyjne, ustalić priorytety traktowania usterek.

Analizy FMEA oraz FTA (analiza drzewa błędów) uzupeł

niają się. Analiza FMEA może być wykorzystana do uzasadnie

nia poprawności wyborów w trakcie analizy FTA, dotyczących zdarzeń elementarnych.

Celem nadrzędnym metody FMEA jestpoprawajakościtwo

rzonego systemu. Uzyskujemy dzięki niej następujące rezultaty:

■ identyfikacja wpływu uszkodzeń elementów na inne ele

menty, podsystemy i cały system;

■ określenie środków zmniejszających ryzyko;

■ weryfikacja lub uzupełnienie specyfikacji wymagań dla systemu;

■ oszczędność czasu i kosztów, dzięki identyfikacji możli

wych zagrożeń jeszcze przed przystąpieniem do wykona

nia systemu;

■ wspomaganie procesu, zmierzającego do lepszego zrozu

mienia systemu (w szczególności FMEA), może stanowić podstawę do opracowania procedur serwisowych i diagno

stycznych);

■ stworzenie warunków do analizy FMEA systemów nad

rzędnych, w których dany system został zastosowany;

■ dokumentacja wszystkich pomysłów dotyczących nieza

wodności danego rozwiązania;

■ dokumentacja zdobytego doświadczenia, problemów i ich rozwiązań dla następnych projektów;

■ redukcja zakresu napraw gwarancyjnych.

FMEA stosowaną we wczesnych etapach (po ustaleniu ar

chitektury) służy weryfikacji projektu, a w szczególności we

ryfikacji wymagań dla modułów programowych, wyboru języka programowania, narzędzi lub technik testowania. Stosowana później może poświadczać słuszność dokonanych wyborów.

Informacja narasta stopniowo wraz z analizą w kolejnych eta

pach cyklu życia systemu.

Zaletą metody FMEA jest to, że w szczególnych przypad

kach możliwe jest jej zastosowanie tylko dla elementów, które zostały uznane za krytyczne. Zaleca się, aby dla większych sys

temów przeprowadzano ją dla wszystkich elementów.

I . Definicja analizowanego systemu, celu i zakresu analizy, a w tym:

■ przygotowanie funkcjonalnego diagramu blokowego systemu uzupełnionego o inne opisy, diagramy, mode

le i dane o strukturze;

■ wybór wyj ściowego poziomu struktury i elementów do analizy;

■ ustalenie środowiska użytkowania systemu.

II. Definicja potencjalnych typów uszkodzeń, a w tym:

■ ustalenie czynników i prawdopodobnego mechanizmu uszkodzeń dla każdego elementu z poziomu wyjścio

wego analizowanej struktury;

P U B L IK A C J E

■ działania personelu autoryzowanego (użytkowanie, konserwacja,...) i nieautoryzowanego.

Zakres uszkodzeń danego systemu jest implikowany przez specyfikację wymagań dla tego systemu oraz przez nie sfor

mułowane wcześniej oczekiwania użytkownika.

III. Identyfikacja wpływu wyróżnionych typów uszkodzeń na działanie innych elementów i całego systemu, a w tym:

■ identyfikacja prawdopodobnego wpływu tych uszko

dzeń na inne elementy, podsystemy w wyższej (następ

nej) warstwie struktury i (w kontynuacji tej analizy) ostatecznie na cały system;

■ identyfikacja metod wykrywania błędów lub uszkodzeń.

FMEA dla systemów rozpmszonych może w szczególności uwzględnić: utratę sterowania wybranym urządzeniem, zerwa

nie linii transmisyjnej, uszkodzenie procesora w aktywnym urzą

dzeniu, czujnika lub czytnika, wybranej karty wejścia/wyjścia, utratę synchronizacji pracy urządzeń lub podsystemów.

IV. Ocena ry’7y k a związanego z wyróżnionymi typami uszko

dzeń, a w tym:

■ ustalenie koncepcji analizy hytyczności i oceny ryzyka;

■ oszacowanie skutków uszkodzeń;

■ wyznaczenie prawdopodobieństwa (lub innych charak

terystyk liczbowych mówiących o częstotliwości lub możliwości) wystąpienia danych typów uszkodzeń (np intensywności uszkodzeń)',

■ klasyfikacja uszkodzeń, ustalenie priorytetów zidenty

fikowanych typów uszkodzeń dla działań korekcyjnych.

Ocena krytyczności ze wskazaniem prawdopodobieństw może być uznana za w ażną ale istotnym osiągnięciem każdej FMEA jest już identyfikacja możliwych skutków uszkodzeń.

Postępowanie w przypadku intensywności uszkodzeń dla sprzę

tu jest dobrze znane.

V. Przygotowanie dokum entacji błędów i uszkodzeń.

Przykładową strukturę reprezentacji tych danych podano w poniższej tabeli:

NELEC oraz ich weryfikacja jest trudnym problemem nor

malizacyjnym i tematem wielu programów badawczych. Trud

ność polega na braku pewności i uzasadnień dla efektywności stosowanych technik, które, gdy techniki te są zastosowane, mają stanowić podstawę wiarogodności realizowanego sys

temu. Trudność ta ujawnia się w szczególności w próbie za

stosowania analizy FMEA do systemów z oprogramowaniem.

FMEA bazuje na wiedzy o sposobach działania elemen

tów systemu oraz sposobach aktywacji uszkodzeń. Dla syste

mów sprzętowych techniki eliminacji uszkodzeń są dostatecznie opanowane i możliwe jest przyjęcie założenia, że wszystkie (w tym powstałe w trakcie produkcji) wady zostały usunięte.

Analiza FMEA może dotyczyć rzeczywistego funkcjonowa

nia systemu. Pozostają te uszkodzenia, które wystąpiły po in

stalacji: uszkodzenia losowe lub wynikające z nieprawidłowego użytkowania.

Dla oprogramowania pozostaje zawsze problemem istnienia nie wykrytych błędów specyfikacj i i kodowania. Nie jest możliwe założenie istnienia idealnej konstrukcji realizowanej za pomocą oprogramowania. Przyjmuje się, że decydujący wpływ na jakość oprogramowania ma „inteligentne” i wyczerpujące testowanie, zastosowanie właściwych technik projektowania i wytwarzania (w tym metod formalnych) języków programowania, praktyk i procedur zapewniania jakości. Musimy jednak brać pod uwagę możliwość istnienia błędów w systemie zakończonym. Błędy te mogą ujawnić się podczas działania systemu i powodować od

stępstwa od przyjętej specyfikacji lub uniemożliwiać prawidłową interpretację skutków innych błędów i uszkodzeń. Ponieważ błę

dy oprogramowania są przede wszystkim związane z defektami projektowania, analiza FM EA dotycząca architektury oprogra

mowania, wymaga jej rozszerzenia o analizę FMEA dotyczącą pwcesu wytworzenia opmgramowania.

Wpływ błędów w module programowym na działanie mo

dułów z nim związanych i całego systemu (sprzętowo-progra

mowego) może być analizowany przy pomocy analizy drzewa Nr Element /

Proces

Funkcja / Cel

Typ uszkodzenia

Efekt uszkodzenia

Przyczyna uszkodzenia

Planowana metoda testowania

Działania naprawcze

Nagłówki tabeli powinny odzwierciedlać planowany zakres analizy i jej cele, obejmując następujące parametry: czas trwa

nia misji systemu, prawdopodobieństwo, czynniki i czas trwa

nia uszkodzenia, natychmiastowość skutków uszkodzenia, ciąg zdarzeń prowadzący do uszkodzenia.

VT. Dokumentacja końcowa analizy, o w tym:

■ rekomendacje dla projektantów i plan działania, doty

czące zmian w konstrukcji, aby system spełniał wyma

gania lub częstotliwość i skutki uszkodzeń były minimalne;

■ propozycje rozwiązań alternatywnych;

■ wytyczne dla personelu obsługującego i użytkowników.

Formułowanie wymagań bezpieczeństwa systemów z opro

gramowaniem według proponowanych standardów IEC i CE-44

zdarzeń lub analizy drzew błędów (FTA). Wyniki tych analiz powinny prowadzić do zmian w architekturze lub kodzie opro

gramowania lub, najbardziej typowo, do zmian w procesie wy

twarzania: to jest takiego doboru technik rozwoju i kontroli, który umożliwi eliminację konkretnego typu błędu lub redukcję moż

liwości jego wystąpienia w systemie. W szczególności, popra

wę odporności modułów na uj awniaj ące się błędy można uzyskać dzięki programowaniu defensywnemu.

Analiza procesu wytwarzania oprogramowania stanowi j eden z eta

pów procesu rozwoju oprogramowania i jego kontroli, czyli tech

nik weryfikacji oraz zapewnienia jakości zastosowanych procedur i kolejności działań. Wynika stąd, że potrzebna jest bardzo konkret

na i szczegółowa wiedza dotycząca defektów/wad, które mogąpo- wstać podczas stosowania poszczególnych technik (w tym FMEA dia systemów z oprogramowaniem

środowisk i języków programowania) lub klas i zakresu błędów możliwych do wykrycia przez wybrane techniki weryfikacji. Na

leży podkreślić, że tego rodzaju wiedza może wynikać z groma

dzonego doświadczenia i badań, które często wykraczają poza możliwości (przynajmniej w rozsądnym czasie) jednej firmy.

Wiedza ta jest rozproszona w różnych gałęziach przemysłu i czę

ściowo prezentowana w różnych publikacjach.

Sam proces wytwarzania również może zawierać błędy.

Zmiany technologii i procedur postępowania przy projektowa

niu oprogramowania niosą w sobie ryzyko związane z wprowa

dzeniem do niego błędów. Dzieje się tak, gdy trzeba opanować nowe metody, narzędzia lub wprowadzić zmiany organizacyjne przy podjęciu nowego projektu.

Podejmowanie decyzji w sytuacji ograniczenia, np. pod pre- sjązdarzeń, może być kompromisem z szerszymi celami projektu i spowolniać postęp prac. FMEA dla procesów wytwórczych jest sposobem uczenia się na własnych błędach na poziomie całej or

ganizacji, korzystania ze zdobytych doświadczeń i przewidywa

nia problemów. Analiza zauważonych błędów programowych i ich przyczyn powinna umożliwiać podejmowanie decyzji o szko

leniach i zmianach procesów, tak, aby podobne błędy się już nie pojawiały.

Przykładem firmy, w której „myślenie FMEA” stało się pro

gramem działania, jest Hewlett-Packard. Zauważono tam, jak nie

bezpieczne dla producenta oprogramowania jest ograniczenie działań do reakcji na zaistniałe zdarzenia. Wobec skłonności ludzi do myślenia reaktywnego (wynikającego ze stresów i presji zda

rzeń), działania te powinny być uzupełniane o decyzje napraw

cze, zmierzające do eliminacji źródeł błędów. Do źródeł większości popełnianych błędów zaliczano słabe wyszkolenie, słabą doku

mentację i nieefektywne procesy, a rzadko indywidualną niekom

petencję. Myślenie to nie obejmuje raczej pojedynczych rodzajów defektów, ale dotyczy tych źródeł ich powstawania.

W celu identyfikacji typów uszkodzeń w systemach opar

tych na oprogramowaniu możemy:

■ wykorzystać wiedzę o procesie i technikach rozwoju i kon

troli oprogramowania;

■ analizować samą architekturę (specyfikację) oprogramo

wania;

■ zbierać i analizować dane o zaistniałych awariach w okre

sie eksploatacji oprogramowania.

Dalej, korzystając z różnych źródeł informacji, należy osza

cować możliwość wystąpienia każdej z klas defektów/wad Skut

ki wystąpienia defektów/wad zależą od sposobu i środowiska użytkowania i mogą być klasyfikowane na różne sposoby (por.:

IE C 1508, IEEE Std 1044). Firmy, produkujące systemy podlega

jące procedurom dopuszczenia na rynek, mają utrudnioną sytu

ację: niedopracow ane norm y narzucają im sposoby dokumentowania, dobór narzędzi i metod Uznanym standardem do oceny dojrzałości procesu tworzenia oprogramowania jest Compatibility Maturity Model (CMM) rozwinięty przez SEI (So

ftware Engineering Institute) w Camegie-Mellon University, USA.

Oprogramowanie dla FMEA i automatyzacja analizy

Analiza FMEA może być wspomagana przez oprogramowanie, co umożliwia ujednolicenie i powtarzalność wypracowanych wzorów, uproszczenie procesu przygotowywania dokumentacj i

in fo rm atyka 10/97

końcowej, wykorzystanie bibliotekowych charakterystyk licz

bowych dotyczących elementów analizowanego systemu, auto

matyzację wyliczania parametrów krytyczności, ale przede wszystkim ułatwia analizę struktur znacznie rozbudowanych.

Przykłady pakietów programowych wspomagających analizę FMEA:

Failm ode (Mitchell & Gothier)

Pakiet umożliwiający automatyzację analizy FMEA zgodnie z MIL-STD-1629A i udostępniający intensywność uszkodzeń we

dług MIL-HDBK-338.

FMEA/Failsafe (Technicomp)

Dokumentuje analizy architektury i procesu.

FM EAplus (Ford Motor Company)

Ułatwia przygotowanie raportów FMEA dotyczących koncep

cji, projektu i procesu; wylicza poziomy ryzyka.

PC N ASA FMECA (Management Sciences)

Podejście według MIL-STD-1629A ze specyficznym algorytmem do oceny ryzyka; dla systemów z udziałem ludzi.

R ele x FMECA (Innovative Software Designs)

Zgodny z metodologiami MIL-STD-1629A, SAE, AIAG, Ford FEA.

FMEA: normalizacja i zalecenia

Po raz pierwszy FMEA była zastosowana w NASA jako miara w testowaniu zdolności samolotu do bezpiecznego latania, wska

zując ryzyko związane z pojedynczymi uszkodzeniami. Analiza ta do dziś jest jedną z podstawowych technik rozwiązywania problemów zapewniania jakości i bezpieczeństwa.

Propozycje normalizacyjne dotyczące analizy FMEA:

IEC 812:1985 (PN-IEC 812:1994), MIL-STD-1629A (USA De

partment of Defense, 1980, Pmcedures fo r Performing a FMEA), NASA Std 12410, BS 5760: Part 5: 1991, Ford FEA, Society of Automotive Engineers (SAE) J1739, Automotive Industry Action Group (AIAG) FMEA Methodology.

FMEA jest zalecana/wvmaaana przez:

IEC 1508, CENELEC prEN 50126/-8/-9, Adtranz SMS (Safety Management Strategy), Motorola QSR Guidelines, UK Defen

se Standard 00-56 (Hazard Analysis and ...), MIL-STD-882B (USA Department of Defense, 1984, System Safety Pmgram Requirements), EWICS TC7 Guideline WP 1024.

Według ISO 9004-1:1996 (p. 8.5) ocena kwalifikacyjna i walidacyjna projektu może być przeprowadzona z użyciem metody FMEA. Według ISO 9004-3:1996 (p. 8.4) okresowa ocena rezultatów projektowania/rozwoju wyrobu lub procesu w istotnych stadiach tego projektowania/rozwoju może być pro

wadzona metodą FMEA, natomiast w ISO 9004-1:1996 (p. 8.4:

Przegląd projektu) zaleca się, aby stosownie do etapu projektu i rodzaju wyrobu została wzięta pod uwagę analiza rodzajów i skutków uszkodzeń oraz analiza drzew’a niezdatności.

FMEA (Failure Modes and Effects Analysis)

(1) Analiza rodzajów i skutków uszkodzeń (PN-IEC 812:1994: tłu

maczenie nie zalecane przez Polski Komitet Normalizacyjny-).

(2) Analiza rodzajów i skutków niezdatności (PN-93/N-50191 (eqv IEC 50(1911:1990): tłumaczenie zalecane przez Polski Komitet Normalizacyjny').

Marek Cichocki jest pracownikiem Zakładu Badań i Rozwoju, Adtranz Zwus, Katowice.

B IU L E T Y N P T I

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■

■ ■ ■ ■ ■

■ ■ ■ ■

POLSKIE

TOWARZYSTWO

W dokumencie Informatyka Nr 10; miesięcznik profesjonalistów - Digital Library of the Silesian University of Technology (Stron 44-48)