• Nie Znaleziono Wyników

Identyfikacja bazy wiedzy dla pełnej, statycznej charakterystyki węgla

IV. ZASTOSOWANIA SYSTEMU WNIOSKUJĄCEGO Z PROBABILISTYCZNO-

1. Modelowanie własności węgla

1.5. System wnioskujący z probabilistyczno-rozmytą bazą wiedzy dla pełnej

1.5.3. Identyfikacja bazy wiedzy dla pełnej, statycznej charakterystyki węgla

Kryterium jakościowym identyfikacji jest otrzymanie jak najlepszej aproksymacji zależności wartości parametrów wyjściowych i wyjściowego tak, aby móc na podstawie zadanych wartości wejściowych określić właściwą wartość na wyjściu. Jako empiryczne dane

uczące zastosowano 400 rekordów wartości pomiarowych. Zdolność uogólniania otrzymanego systemu bazującego na fuzzy graph fp* została oceniona wyznaczając, dla kolejnych 95 pomiarów, wskaźnik błędu średniokwadratowego (RMSE). Oczywiście, im wartość wskaźnika błędu dla danych uczących jest mniejsza tym otrzymujemy lepszą aproksymację zależności parametrów, ponadto im wartość wskaźnika błędu dla danych testujących jest mniejszy, tym zdolność do uogólniania systemu jest większa.

Początkowo założono otrzymanie fuzzy graph fp* z pełnym rozkładem prawdopodobieństwa zdarzeń rozmytych. Badania przeprowadzono dla różnych sposobów interpretacji reguł (za pomocą interpretacji koniunkcyjnej oraz interpretacji logicznej z wykorzystaniem operatora implikacji rozmytej tj.: operatora implikacji Łukasiewicza, Goguena, Gödela, Kleene-Dienesa, Reichenbacha oraz Zadeha) oraz różnych operatorów t-normy, jako sposobu łączenia zdarzeń w poprzedniku reguły. W celu oceny aproksymacji, wartość liczbową wyjścia otrzymywano na podstawie metody środka ciężkości (por. III-5.5). W przypadku rozszerzonej metody środka ciężkości otrzymywano gorsze wyniki aproksymacji. Uzyskane wartości błędu RMSE dla zbioru danych uczących i testujących oraz różnych operatorów są przedstawione w tabeli IV-8.

Tab. IV-8. Błąd RMSE [%] aproksymacji zależności parametrów za pomocą fuzzy graph fp* w zależności od różnych operatorów interpretacji reguł oraz t-normy jako spójnika logicznego AND (dla modelu

uwzględniającego pełny rozkład prawdopodobieństwa zdarzeń rozmytych)

Na podstawie tabeli, można sformułować następujące wnioski. Największy wpływ na wyniki aproksymacji ma prawidłowy dobór operatora jako spójnika logicznego AND. Rodzaj interpretacji reguł nie wpływa na wynik w tak znaczącym stopniu. Zdolność do aproksymacji dla danych uczących i jej uogólnienie idzie ze sobą w parze tzn. przy małej wartości błędu dla danych uczących, błąd dla danych testujących jest nieco większy ale również mały, i na odwrót, przy dużych wartościach błędów dla danych uczących, błąd dla danych testujących jest jeszcze nieco większy. Dla każdego operatora stanowiącego o interpretacji reguł, najlepszą aproksymację otrzymano przy użyciu t-normy Einsteina, t-normy Fodora, minimum oraz iloczynu algebraicznego. Kolejno gorsze wyniki otrzymano dla t-normy Hamachera, natomiast wykorzystanie t-normy Łukasiewicza oraz t-normy drastycznej powodowało zafałszowanie wyników. Niezależnie od wybrania operatora dla spójnika logicznego AND najlepsze wyniki aproksymacji uzyskano dla interpretacji reguł z wykorzystaniem operatorów: minimum i iloczynu algebraicznego. Porównując wszystkie otrzymane wyniki, najlepszą aproksymację wykazało użycie następującego zestawu parametrów: t-normy Einsteina, interpretacji reguł jako minimum oraz wyostrzania metodą środka ciężkości.

Dla najlepszych parametrów (t-normy Einsteina oraz interpretacji reguł z operatorem minimum) wykreślono zależności błędów RMSE oraz liczby reguł elementarnych od wartości minimalnego wsparcia (min w). Rysunek IV-19 przestawia omawiane zależności zarówno dla

danych uczących, jak i danych testujących. Liczba reguł elementarnych, w przypadku fuzzy

graph fp* zawierającego prawdopodobieństwa brzegowe i warunkowe wynikające z pełnego rozkładu prawdopodobieństw dla zdarzeń rozmytych w regułach, wynosi 518. Wraz z wzrostem wartości minimalnego wsparcia dla reguł, liczba reguł elementarnych maleje, początkowo bardzo szybko, później wolniej. Jednakże, również wraz z wzrostem wartości minimalnego wsparcia, wartości błędów zarówno dla danych uczących, jak i danych testujących ulegają wzrostowi. Biorąc pod uwagę najlepsze dopasowanie wartości wyjścia do danych testujących i uczących oraz jednocześnie możliwie najmniej złożone odwzorowanie zależności, wartość minimalnego wsparcia równa 0,0015 wyznacza optymalną strukturę bazy wiedzy (na rysunku IV-19 zaznaczona linią przerywaną). Wówczas błąd RMSE dla danych uczących wynosi 1,91%, błąd RMSE dla danych testujących - 2,05%, natomiast liczba reguł elementarnych jest równa 103, co stanowi 62 reguły plikowe. Całość fuzzy graph fp* dla odwzorowania zależności przedstawionych parametrów węgla, została zamieszczona w dodatku C. Poniżej przedstawiono tylko 4 najważniejsze reguły plikowe zależności parametrów:

1: IF (Q1 IS średni) AND (Q2 IS mały) AND (A1 IS średnia) AND (A2 IS duża) [0.1581] THEN (Ac IS średnia) [0.6946]

ALSO (Ac IS duża) [0.2756] ALSO (Ac IS mała) [0.0298]

2: IF (Q1 IS duży) AND (Q2 IS mały) AND (A1 IS mała) AND (A2 IS duża) [0.0758] THEN (Ac IS średnia) [0.5966]

ALSO (Ac IS mała) [0.4034]

3: IF (Q1 IS średni) AND (Q2 IS b. mały) AND (A1 IS średnia) AND (A2 IS duża) [0.0640] THEN (Ac IS średnia) [0.7554]

ALSO (Ac IS duża) [0.1965] ALSO (Ac IS mała) [0.0481]

4: IF (Q1 IS średni) AND (Q2 IS mały) AND (A1 IS średnia) AND (A2 IS średnia) [0.0584] THEN (Ac IS średnia) [0.7821]

ALSO (Ac IS duża) [0.1103] ALSO (Ac IS mała) [0.1076]

Porównanie ciągów pomiarowych danych uczących i testujących oraz ciągów uzyskanych przy zastosowaniu systemu o optymalnej strukturze probabilistyczno-rozmytej bazy wiedzy zamieszczono na rysunkach IV-27 ÷ IV-28. W celu weryfikacji struktury modelu wiedzy przeprowadzono również analizę błędów dopasowania modelu do danych rzeczywistych, czyli tzw. analizę reszt:

c

c A

A

e  ˆ , (180)

gdzie: A oznacza ciąg danych odpowiednio uczących lub testujących, c c– ciąg danych uzyskanych na wyjściu utworzonego modelu (odpowiednio dla danych uczących lub testujących).

Rys. IV-19. Zależności błędu RMSE oraz liczby reguł elementarnych od wartości minimalnego wsparcia dla: a) danych uczących, b) danych testujących

Rysunki IV-20 ÷ IV-21 przedstawiają ciąg błędów dla danych uczących i testujących. Jak można zauważyć, w przypadku danych uczących, błędy rozkładają się równomiernie wzdłuż blisko zerowej wartości średniej zakłóceń (dokładnie wartość średnia wynosiła: – 0.1081%, odchylenie standardowe: 1.9121%), ponadto można przypuszczać o wartości stałej wariancji. Przedstawiona na rysunku IV-22 unormowana funkcja autokorelacji błędów Re(s) (unormowana kowariancja) wyliczona ze wzoru:

           s N n s N n s N n s n e n e e e s n e e n e e s n e e n e e s n e e n e E s R 1 2 1 2 1 2 ) ( 2 ) ( ( ( ) ) ( ( ) ) )] ) ( )( ) ( [( )] ) ( )( ) ( [( ) (   (181)

świadczy również o niezależności błędów - kształt funkcji zbliżony jest do funkcji autokorelacji białego szumu. W przypadku błędów dla danych testujących, rozkład ich jest również przeważająco równomierny wokół wartości zerowej, jednak wyjątkiem są próbki o numerach 40-55, gdzie średnia błędu jest większa od wartości zerowej. Wartość średnia błędu dla wszystkich pomiarów danych testujących wynosi 0,24%. Przedstawiona na rysunku IV-22 unormowana funkcja autokorelacji błędów Re(s) dla danych testujących świadczy o ich nieskorelowaniu dla przesunięć, za wyjątkiem przesunięcia s=4, dla którego autokorelacja błędu jest większa od wartości 0,2. Jednakże wartość na poziomie 0,259 oznacza niską dodatnią korelację błędów [ost99]. Rysunek IV-23 przedstawia histogram błędów dla danych uczących i testujących łącznie. Parametry statystyczne błędów wynoszą odpowiednio: moda mo=-2.9236, średnia e=-0.0413, mediana me=-0.2503. Zachodzi wobec tego nierówność e >me>mo, co świadczy o asymetrii prawostronnej rozkładu błędów. Asymetrię tą można również zaobserwować na wykresach zależności między wartością rzeczywistą wynikającą z pomiarów Ac a wartością wyliczoną na podstawie modelu c

(rys. IV-24). Wykresy te ponadto wyraźnie ukazują, że dla wartości wyjścia bliskiej średniej wartości danych wyjściowych ( Ac =29,37 dla danych uczących, Ac =30,04 dla danych testujących) jest najmniejszy poziom błędów. Im dalej od wartości średniej tym błąd e jest większy – dodatni dla wartości mniejszej od średniej A , ujemny dla wartości większej od c

średniej Ac.

Rys. IV-20. a) Ciąg pomiarów danych uczących (linia kropkowana), oraz ciąg uzyskany przy zastosowaniu systemu z probabilistyczno-rozmytą baza wiedzy (linia ciągła), b) Błąd jako różnica wartości wyliczonej od

wartości rzeczywistej

Rys. IV-21. a) Ciąg pomiarów danych testujących (linia kropkowana), oraz ciąg uzyskany przy zastosowaniu systemu z probabilistyczno-rozmytą bazą wiedzy (linia ciągła), b) Błąd jako różnica wartości wyliczonej

Rys. IV-22. Unormowana funkcja autokorelacji błędów dla danych uczących i testujących

Rys. IV-23. Histogram błędów dla danych uczących i testujących łącznie

Rys. IV-24. Zależność między wartością rzeczywistą wynikającą z pomiarów Ac a wartością wyliczoną na podstawie modelu c, dla danych uczących i testujących

2. System decydujący o wyborze algorytmu do budowy