• Nie Znaleziono Wyników

Katarzyna RUDNIK, Anna WALASZEK-BABISZEWSKA

N/A
N/A
Protected

Academic year: 2021

Share "Katarzyna RUDNIK, Anna WALASZEK-BABISZEWSKA"

Copied!
11
0
0

Pełen tekst

(1)

1. Wprowadzenie

W szeroko pojêtym zarz¹dzaniu przedsiêbior-stwem mamy do czynienia z wieloma zadaniami, które wi¹¿¹ siê z ograniczon¹ wiedz¹ i niepew-noœci¹, dotycz¹c¹ przebiegu zdarzeñ oraz dzia³a-nia zarz¹dzanymi obiektami. Wynika to z tempa, zakresu, zasiêgu, g³êbokoœci i szybkoœci rozcho-dzenia siê zmian w zglobalizowanej gospodarce, która jest otoczeniem pozornie lokalnych przed-siêwziêæ [13], a tak¿e jest efektem zjawisk natu-ralnych, które wci¹¿ zostaj¹ nieposkromione dla umys³ów badaczy. Mo¿emy zatem wyró¿niæ nie-pe³noœæ informacji, wynikaj¹c¹ z niewiedzy ludzkiej, zwan¹ niepewnoœci¹ subiektywn¹, a tak¿e niepewnoœæ obiektywn¹, która wynika z charakterystyki analizowanych procesów. Aby móc odkryæ i usystematyzowaæ wiedzê obar-czon¹ wymienionymi zagadnieniami, w literatu-rze spotyka siê modelowanie z wykorzystaniem logiki rozmytej [12, 19].

Jednoczeœnie, w wielu sytuacjach ekonomiczno-decyzyj-nych w przedsiêbiorstwie, mamy do czynienia z niepewno-œci¹ wynikaj¹c¹ z losowoœci, np. niepewnoœæ wartoœci pa-rametrów zjawisk spo³ecznych (np. zachorowalnoœæ wœród pracowników), ekonomicznych (np. wysokoœæ wskaŸni-ków gie³dowych) czy zjawisk geologicznych (np. prêdkoœæ i kierunek wiatru mierzony podczas szacowania op³acalno-œci inwestycji w elektrownie wiatrowe), które wykorzysty-wane s¹ do szeregu procesów podejmowania decyzji w przedsiêbiorstwach w skali zarz¹dzania operacyjnego, taktycznego lub strategicznego. Do modelowania takich procesów wykorzystywane s¹ g³ównie metody matema-tyczne z uwzglêdnieniem teorii prawdopodobieñstwa. Zdaje siê byæ naturalnym, i¿ ³¹cz¹c obie metody analizowa-nia zagadnieñ - teoriê logiki rozmytej i teoriê prawdopodo-bieñstwa, mo¿emy w sposób pe³ny opisaæ niepewnoœæ pro-blemów rzeczywistych zachodz¹cych w procesach przed-siêbiorstwa (rys. 1). Tak te¿ powsta³a koncepcja systemu wnioskuj¹cego z probabilistyczno-rozmyt¹ baz¹ wiedzy [3], której metodologiê modelowania i wnioskowania przedstawiono m.in. w pracach [21, 23].

W omawianym systemie wiedza lingwistyczna jest zawarta w regu³ach postaci IF-THEN z wagami, stanowi¹cymi brze-gowe i warunkowe prawdopodobieñstwo zdarzeñ rozmy-tych znajduj¹cych siê w poprzedniku i nastêpniku regu³. Z za³o¿enia system rozmyty ma pozwalaæ na uproszczone odtworzenia skomplikowanego problemu badawczego. Jed-nak¿e, przy wielu zmiennych systemu oraz zidentyfikowanej du¿ej iloœci zbiorów rozmytych, utworzenie wspomnianego modelu cechuje wysoka z³o¿onoœæ obliczeniowa. Ponadto, bior¹c pod uwagê ca³kowity rozk³ad prawdopodobieñstwa

zdarzeñ rozmytych, iloœæ regu³ elementarnych bazy wiedzy wynosi N m, gdzie N stanowi liczbê zmiennych modelu,

m – liczbê zbiorów rozmytych zmiennej (przy za³o¿eniu jed-nakowej iloœci zbiorów rozmytych dla ka¿dej zmiennej). Du¿a liczba regu³ ma wp³yw nie tylko na czas identyfikacji modelu, trudnoœci wnioskowania przy u¿yciu utworzonej bazy wiedzy, jak równie¿ ewentualn¹ implementacjê w obiek-cie rzeczywistym. W artykule zostanie pokazana mo¿liwoœæ wykorzystania idei wyszukiwania regu³ asocjacji (jednej z metod data mining) do pozyskiwania parametrów modelu dla systemu wnioskuj¹cego z probabilistyczno-rozmyt¹ baz¹ wiedzy. Algorytm pozwoli bezpoœrednio znaleŸæ wiarygod-ne regu³y rozmyte wraz z wagami, które bêd¹ stanowiæ pod-stawê do wnioskowania w oparciu o budowany model. 2. Koncepcja systemu wnioskuj¹cego z

probabilistycz-no-rozmyt¹ baz¹ wiedzy

Rozmyte systemy wnioskuj¹ce stanowi¹ systemy z bazami wiedzy (ang. knowledge-based systems), w których wyko-rzystane jest podejœcie lingwistyczne [26] podczas modelo-wania i wnioskomodelo-wania, zwanego równie¿ modelowaniem i wnioskowaniem rozmytym. Stosuj¹c podejœcie lingwi-styczne, zbiory rozmyte uto¿samiane s¹ ze zmiennymi lin-gwistycznymi, których wartoœci odpowiadaj¹ pewnym ka-tegoriom jêzyka naturalnego i s¹ reprezentowane przez s³o-wa lub stwierdzenia (np. wysoki, œredni, niski – koszt albo wystarczaj¹ca, niewystarczaj¹ca – jakoœæ) [15]. Ocena s³owna pozwala na opisanie niepewnej wiedzy o analizo-wanych zmiennych, a jednoczeœnie jest znaczeniowo zale¿-na od rzeczywistych obszarów.

Katarzyna RUDNIK, Anna WALASZEK-BABISZEWSKA

ROZMYTY SYSTEM WNIOSKUJ¥CY O MODELU BAZUJ¥CYM NA

REGU£ACH ASOCJACJI

Rys. 1. Koncepcja pe³nego opisu niepewnoœci procesów zachodz¹cych w przedsiêbiorstwie

(2)

W klasycznym ujêciu logiki rozmytej zbiór rozmyty A (ang. fuzzy set), zdefiniowany w niepustej przestrzeni À, jest okre-œlony przez funkcjê charakterystyczn¹ zwan¹ funkcj¹ przy-nale¿noœci mA (ang. membership function) w formie [26]:

(1) gdzie [0,1] oznacza przedzia³ liczb rzeczywistych od 0 do 1. Omawiany system wnioskuj¹cy wykorzystuje analogiczne podejœcie do definicji zbiorów rozmytych, jednak¿e za-miast funkcji przynale¿noœci stosuje siê sta³e stopnie przy-nale¿noœci, zdefiniowane dla roz³¹cznych przedzia³ów wartoœci zmiennych (por. (8) i rys. 3). Zasadnoœæ stosowa-nia stopni przynale¿noœci podczas modelowastosowa-nia w oma-wianym systemie zamieszczono w [4]. Dyskretyzacja prze-strzeni wartoœci zmiennych wp³ywa nieznacznie na struk-turê modelu, jednak¿e skraca czas generowania regu³ oraz wnioskowania. D³u¿szy czas generowania regu³ i wniosko-wania dla bazy danych definiowanej za pomoc¹ funkcji przynale¿noœci, wynika z niemo¿noœci wprowadzenia zwektoryzowanych obliczeñ, co ma znaczenie przy imple-mentacji systemu w œrodowisku obliczeniowym Matlab. System wnioskuj¹cy z probabilistyczno-rozmyt¹ baz¹ wiedzy jest systemem typu MISO (ang. Multiple Input Single Output) o wielu wejœciach i jednym wyjœciu. Jego strukturê oraz po-wi¹zania z otoczeniem decyzyjnym przedstawia rysunek 2. Omawiany system wnioskuj¹cy sk³ada siê z nastêpuj¹cych czêœci (por. [12, 15, 17, 18, 20, 25]):

• bazy wiedzy (ang. knowledge base), która zawiera wie-dzê dziedzinow¹ istotn¹ dla danego problemu,

• bloku rozmywania (ang. fuzzification), który zamienia dane wejœciowe z dziedziny iloœciowej na wielkoœci ja-koœciowe reprezentowane przez zbiory rozmyte na pod-stawie okreœlaj¹cych je stopni przynale¿noœci zapisa-nych w bazie wiedzy,

• bloku wnioskowania (ang. inference), który korzysta z bazy wiedzy oraz zaimplementowanych metod agre-gacji i koñcowego wnioskowania w celu rozwi¹zania specjalistycznych problemów,

• bloku wyostrzania (ang. defuzzification), który na pod-stawie wynikowych stopni przynale¿noœci, oblicza ilo-œciow¹ (ostr¹) wartoœæ na wyjœciu systemu.

Podstaw¹ bazy wiedzy probabilistyczno-rozmytego modelu s¹ dwa komponenty: baza danych (ang. data base) oraz baza probabilistyczno-rozmytych regu³ (ang. rule base) (por.[9]). Baza danych zawiera informacje definiowane przez eksperta z danej dziedziny zastosowania, do których nale¿¹ wartoœci lin-gwistyczne {An

m, Bj/m , j=1,...J, n=1,...,N, m=1,...,M} (por. (4))

zmiennych rozwa¿anych w bazie regu³ oraz definicje zbiorów rozmytych uto¿samianych z tymi wartoœciami. Natomiast baza probabilistyczno-rozmytych regu³, jak wskazuje sama nazwa, zawiera zbiór regu³ lingwistycznych w postaci (4), któ-re s¹ tworzone na podstawie zmodyfikowanego algorytmu ge-neruj¹cego rozmyte regu³y asocjacji. Algorytm pozwala na dopasowanie modelu do danych pomiarowych. Charaktery-styczna postaæ regu³, ukazuj¹ca empiryczny rozk³ad prawdo-podobieñstwa zdarzeñ rozmytych, pozwala na ³atw¹ interpre-tacjê zawartej w modelu wiedzy oraz umo¿liwia dodatkow¹ analizê rozwa¿anego zagadnienia.

Szczegó³y poszczególnych bloków systemu zostan¹ opisa-ne w kolejnych podpunktach artyku³u.

2.1. Probabilistyczno-rozmyta reprezentacja wiedzy Spoœród wachlarza formalizmów reprezentacji wiedzy w dzie-dzinie systemów wnioskuj¹cych, najbli¿sz¹ metod¹ zapisu wiedzy stosowan¹ przez cz³owieka jest regu³owa reprezen-tacja wiedzy typu JE¯ELI-TO. Zaczerpniêta z dziedziny logiki matematycznej, ogólna postaæ regu³owej reprezentacji wiedzy, zwanej te¿ regu³ami wnioskowania lub regu³ami de-cyzji, sk³ada siê z czêœci warunkowej pr, zwanej przes³ank¹ b¹dŸ poprzednikiem regu³y (ang. antecedent) oraz czêœci de-cyzyjnej qr, zwanej konkluzj¹ b¹dŸ nastêpnikiem regu³y (ang. consequent). Zatem ogólna postaæ regu³y ma formê:

JE¯ELI pr TO qr (2)

gdzie s³owa JE¯ELI (ang. IF), TO (ang. THEN) stanowi¹ s³owa kluczowe poprzedzaj¹ce odpowiednio przes³ankê i konkluzjê regu³y.

Szczegó³owa postaæ bazy regu³ kszta³tuje siê w zale¿noœci od zastosowanego modelu. Prostota zapisu oraz ³atwoœæ in-terpretacji i wnioskowania na podstawie regu³ typu JE¯E-LI-TO wp³ynê³y na ogromn¹ popularnoœæ ich zastosowania w strukturach modeli rozmytych, jak i neuronowo-rozmy-tych. Zalet¹ jest tak¿e mo¿liwoœæ opracowania modeli na bazie znacznie mniejszej iloœci informacji o systemie [18] w porównaniu z modelami matematycznymi. Chêæ uzyska-nia coraz to wiêkszej dok³adnoœci odwzorowauzyska-nia ró¿norod-nych systemów rzeczywistych, z ró¿nym stopniem dostêp-noœci informacji i ich form, spowodowa³o intensywny roz-wój struktur modeli [15].

Do najpopularniejszych modeli rozmytych nale¿y model typu Mamdaniego, który pozwala na odwzorowanie wejœcia modelu (x) na wyjœcie (y) poprzez zbiór rozmytych regu³ wa-runkowych (ang. fuzzy conditional rules) w postaci:

JE¯ELI x = Ai TO y = Bj (3) gdzie:

x stanowi zmienn¹ wejœciow¹ modelu, y – zmienn¹ wyjœciow¹,

Ai,Bj – wartoœci zmiennych lingwistycznych, które s¹ uto¿-samiane ze zbiorami rozmytymi, odpowiednio dla wejœcia i dla wyjœcia modelu.

Omawiany w artykule system wnioskuj¹cy z probabili-styczno-rozmyt¹ baz¹ wiedzy jest oparty na modelu, który jest „rozszerzeniem” modelu typu Mamdaniego. W litera-turze spotykany jest pod nazw¹ rozmyty model b¹dŸ rozmy-ta reprezenrozmy-tacja wiedzy z miarami prawdopodobieñstwa zbiorów rozmytych [23]. Charakterystyczn¹ cech¹ bazy wiedzy omawianego modelu dla systemu typu MISO jest reprezentacja wiedzy w postaci regu³ plikowych, stanowi¹-cych zbiór J regu³ elementarnych, w formie [21]:

gdzie:

N – liczba zmiennych wejœciowych modelu, M – liczba regu³ plikowych,

(3)

x1, …, xN – zmienne wejœciowe modelu, xnÎXnÌR, n=1,..., N,

y – zmienna wyjœciowa modelu, yÎYÌR, An

m Рm-ta wartoϾ lingwistyczna n-tej zmiennej

wejœcio-wej, m=1,…,M, n=1,..., N,

Bj/m – wartoœæ lingwistyczna zmiennej wyjœciowej w j-tej regule elementarnej m-tej regu³y plikowej, m=1,…,M, j=1,…,J.

Wagi wm, wj/m stanowi¹ miary prawdopodobieñstw zbiorów rozmytych. Waga m-tej regu³y plikowej wm reprezentuje ³¹czne prawdopodobieñstwo zdarzeñ rozmytych Am=A1

m´...´ANm w przes³ance regu³y plikowej:

(5) gdzie x=[x1, x1,..., xN].

Natomiast waga elementarnej regu³y wj/m reprezentuje

wa-runkowe prawdopodobieñstwo zdarzeñ rozmytych, które na podstawie twierdzenia Bayesa obliczane jest jako:

(6)

W ujêciu teorii zbiorów rozmytych wg Zadeha, prawdopo-dobieñstwo zdarzenia rozmytego A obliczane jest jako:

(7) dla dyskretnej przestrzeni rozwa¿añ À={x1,x1,...,xN}, gdzie

p(xi)Î[0,1] stanowi prawdopodobieñstwo (nierozmyte) zdarzenia elementarnego xi, przy czym Si=1,...,n p(xi)=1.

Wed³ug [23] wagi obliczane s¹ dla wartoœci lingwi-stycznych An

m, Bj/m okreœlonych na niepustych

przestrze-niach Xn i Y zdyskretyzowanych do roz³¹cznych prze-dzia³ów wartoœci zmiennych, oznaczonych odpowiednio an

k i bk:

(8) z zachowaniem zasady podzia³u do jednoœci. Przyk³ad defi-nicji zbiorów rozmytych dla roz³¹cznych przedzia³ów zmiennych przedstawia rysunek 3.

(4)

Korzystaj¹c z definicji przeciêcia zbiorów rozmytych (opartej na operatorze t-normy) oraz w³asnoœci (5-6), waga wm definiowana jest jako:

natomiast waga wj/m jako:

gdzie p(a1

k,...,aNk,bk) (p(a1k,...,aNk)) stanowi

prawdopodo-bieñstwo zajœcia jednoczeœnie zdarzeñ nierozmytych a1

k,...,aNk,bk (a1k,...,aNk). Przyk³ad operatorów t-normy, jakie

s¹ mo¿liwe do zastosowania przy tworzeniu regu³, przed-stawiono w tabeli 1.

2.2. Metody pozyskiwania rozmytej bazy wiedzy Regu³y JE¯ELI-TO, stanowi¹ce podstawê bazy wiedzy sys-temu rozmytego, mog¹ byæ definiowane na dwa sposoby: - jako regu³y logiczne, stanowi¹ce subiektywne definicje

tworzone przez cz³owieka na podstawie jego doœwiad-czeñ i wiedzy o badanym zjawisku,

- jako regu³y fizyczne, stanowi¹ce obiektywne modele wiedzy, zdefi-niowane na podstawie obserwacji i badañ naturalnych zachowañ ana-lizowanego procesu (obiektu) oraz zachodz¹cych w nim prawid³owo-œciach,

W przypadku modelowania rozmytego, pocz¹tkowo mieliœmy do czynienia z regu³ami logicznymi, jednak¿e w miarê rozwiniêcia dziedziny maszynowego uczenia zaczêto stosowaæ hybrydê omówionych regu³, gdzie pocz¹tkowe za³o¿enia dotycz¹ce zbiorów rozmy-tych, a nawet regu³, s¹ definiowane na zasadzie przekonañ eksperta, natomiast pozosta³e parametry zostaj¹ dopasowa-ne do danych pomiarowych. Celem me-tod automatycznego pozyskiwania baz wiedzy jest uzyskanie jak najmniejsze-go zbioru rozmytych regu³ JE¯ELI-TO, który umo¿liwia jak najdok³adniejsze odwzorowanie modelowanego obiektu czy zjawiska.

Do metod pozyskiwania baz wiedzy dla rozmytych systemów typu Mam-daniego mo¿na zaliczyæ [15]: - metodê Wanga-Mendela,

- metodê Nozaki-Ishibuchi-Tanaki, - metodê Sugeno-Yasukawy, - metodê szablonowego

modelowa-nia systemów rozmytych [25]. Metody Wanga-Mendela oraz szablo-nowego modelowania systemów roz-mytych pozwalaj¹ na wydobywanie przes³anek niezale¿nie od wydobywania konkluzji regu³. Metoda Nozaki-Ishibuchi-Tanaki wydobywa przes³anki regu³, a nastêpnie konkluzje, natomiast metoda Sugeno-Yasukawy odwrotnie – najpierw konkluzje, do-piero póŸniej przes³anki.

W celu pozyskiwania baz wiedzy do systemów rozmytych zaczêto równie¿ wykorzystywaæ metody wchodz¹ce w sk³ad obszaru zwanego data mining (zwanym inaczej eksploracj¹ da-nych).

Data mining, ja-ko g³ówny etap procesu odkrywania wiedzy (ang. knowledge discovery) [7], zajmuje siê nietrywialnymi algorytmami wyszukiwa-nia „ukrytych”, dot¹d nieznanych i potencjalnie potrzeb-nych informacji w dapotrzeb-nych [8] oraz zapisywania ich w po-staci wzorców i modeli. Niektóre z metod data mining iden-tyfikuj¹ regiony w przestrzeni zmiennych systemu, które póŸniej tworz¹ zdarzenia rozmyte w regu³ach. Mo¿e byæ to dokonane poprzez szukanie klastrów z u¿yciem algorytmów klasteringu czy te¿ identyfikacjê za pomoc¹ tzw. covering (zwanego równie¿ separate and conquer) algorytmu. Inne metody, np. rozmyte regu³y asocjacji, bazuj¹ na sta³ym roz-mytym podziale dla ka¿dego atrybutu (ang. fuzzy grid),

(9)

(10) Rys. 3. Przyk³ad definicji zbiorów rozmytych dla roz³¹cznych

(5)

a ka¿dy element siatki jest rozwa¿any jako potencjalny sk³adnik regu³y. W pierwszym podejœciu ka¿da zidentyfi-kowana regu³a posiada w³asne zbiory rozmyte [24]. Dlate-go te¿, z punktu widzenia interpretacji regu³, drugie podej-œcie jest korzystniejsze [11].

2.2.1. Regu³y asocjacji jako sposób na pozyskiwanie wiedzy modelu rozmytego

Niezale¿nie od metody automatycznego pozyskiwania wie-dzy, regu³y modelu rozmytego uzyskuje siê na podstawie ich optymalnego dopasowania do danych doœwiadczal-nych. W tym sensie, generowanie regu³ mo¿na rozumieæ jako wyszukiwanie regu³ o du¿ej czêstoœci wystêpowania, gdzie parametr czêstoœci wystêpowania wp³ywa na opti-mum dopasowania regu³. W takim przypadku, regu³y w po-staci (4) mog¹ byæ analizowane jako wspó³wystêpowanie rozmytych wartoœci zmiennych w kolekcjach danych do-œwiadczalnych, co zaœ stanowi sens rozmytych regu³ aso-cjacji (ang. fuzzy association rules).

Zagadnienie regu³ asocjacji zosta³o po raz pierwszy u¿yte w pracy [1]. Obecnie jest jedn¹ z czêœciej wykorzystywa-nych metod data mining. W ujêciu formalnym regu³y aso-cjacji maj¹ postaæ implikacji:

(11) gdzie X i Y s¹ roz³¹cznymi zbiorami zmiennych (atrybutów) w ujêciu klasycznym zbiorów, nazwanych czêsto: X – zbio-rem wartoœci warunkuj¹cych, Y – zbiozbio-rem wartoœci warun-kowanych.

Bior¹c pod uwagê regu³y asocjacji w wersji rozmytej, otrzymujemy (por. [14]):

(12) gdzie A1,An s¹ skrótowym zapisem: zmienna – zbiór

roz-myty w poprzedniku regu³y (np. „An @x jest An”, gdzie x

stanowi zmienn¹, An – zbiór rozmyty), An+1,Am parami

zmienna – zbiór rozmyty nastêpnika regu³y.

Ka¿da regu³a asocjacji jest zwi¹zana z dwiema miarami statystycznymi okreœlaj¹cymi wa¿noœæ i si³ê regu³y: sup-port (sup%) – wsparcie, prawdopodobieñstwo jednocze-snego wystêpowania zbiorów w poprzedniku i nastêpniku regu³y oraz confidence (conf %) – ufnoœæ, zwane równie¿

wiarygodnoœci¹, bêd¹ce prawdopodobieñstwem warunkowym (P(Y|X), P(An+1Ç...ÇAm| A1Ç...ÇAn)).

Problem odkrywania rozmytych regu³ asocjacji po-lega na znalezieniu w danej bazie danych wszyst-kich rozmytych regu³ asocjacji, których wsparcie i ufnoœæ s¹ wy¿sze od zdefiniowanych przez u¿yt-kownika wartoœci minimalnego wsparcia i mini-malnej ufnoœci.

Pierwsze zastosowanie regu³ asocjacji mia³o miejsce w analizie koszyka zakupów (ang. basket analysis). Jednak¿e bior¹c pod uwagê, i¿ w regu³ach mog¹ wy-stêpowaæ zmienne pochodz¹ce z ró¿nych dziedzin wartoœci o wartoœciach wyra¿onych w jêzyku natu-ralnym, wachlarz zastosowañ metody poszerza siê znacz¹co w p³aszczyŸnie podejmowania decyzji, planowania, sterowania, prognozowania itp. Publi-kacja pokazuje równie¿, ¿e rozmyte regu³y asocjacji mog¹ byæ wykorzystywane jako metoda pozyskiwa-nia wiedzy do rozmytych systemów wnioskuj¹cych. 2.2.2. Algorytmy pozyskiwania wiedzy na bazie

rozmy-tych regu³ asocjacji

Za podstawowy algorytm odkrywania regu³ asocjacji uzna-je siê iteracyjny algorytm Apriori [1]. Algorytm ten docze-ka³ siê wielu modyfikacji, które zmierzaj¹ do poprawienia jego efektywnoœci (np. AprioriTid, AprioriHybrid). W lite-raturze mo¿na znaleŸæ równie¿ inne algorytmy tj.: SETM, FreeSpan, Eclat, Partition. Efektywnym pod wzglêdem z³o-¿onoœci obliczeñ jest algorytm FP-Growth [han00], jednak-¿e pozwala on na generowanie regu³ asocjacji jedynie w wersji nierozmytej (11). Na odkrycie rozmytych regu³ asocjacji (12) pozwalaj¹ algorytmy opisane m.in. w [5, 10, 14]. Po³¹czenie eksploracji danych metodami rozmytych regu³ asocjacji z wykorzystaniem algorytmów genetycz-nych mo¿na znaleŸæ m.in. w [2].

Artyku³ przedstawia w³asn¹ wersjê algorytmu, utworzone-go na za³o¿eniach alutworzone-gorytmu Apriori, w celu wykorzystania go do generowania bazy wiedzy z probabilistyczno-rozmy-tymi regu³ami dla systemu o wielu wejœciach i jednym wyj-œciu. Za³o¿eniami proponowanego algorytmu jest predefi-niowana baza danych oraz wartoœci progowe minimalnego wsparcia (min w). Notacja u¿yta do przedstawienia algoryt-mu jest nastêpuj¹ca (por.[24]):

I – liczba pomiarów u¿ytych do identyfikacji modelu, N+1 – ca³kowita liczba zmiennych (N zmiennych wejœcio-wych, jedna zmienna wyjœciowa),

K – liczba roz³¹cznych przedzia³ów o równej szerokoœci w przestrzeniach zmiennych,

xn– zmienne wejœciowe modelu, xnÎXnÌR, n=1,...,N, y – zmienna wyjœciowa modelu, yÎYÌR,

|An| (|B|) – liczba wartoœci lingwistycznych dla n-tej zmien-nej wejœciowej (zmienzmien-nej wyjœciowej),

An

j – j-ta wartoœæ lingwistyczna n-tej zmiennej wejœciowej,

j=1,…,|An|, n=1,...,N,

Bj – j-ta wartoœæ lingwistyczna zmiennej wyjœciowej, j=1,…,|B|,

a

n=(a1n,...,akn,...,aKn) – roz³¹czne przedzia³y wartoœci n-tej

zmiennej wejœciowej xn, n=1,...N,

b=(b1,...,bk,...,bK)– roz³¹czne przedzia³y wartoœci zmiennej

wyjœciowej y, Tab. 1. Przyk³ad operatorów t-normy [18]

(6)

w – obliczona wartoœæ wsparcia dla kandydatów w zbiorze, min w – za³o¿ona przez eksperta, minimalna wartoœæ wsparcia, Cr – zbiór kandydatów sk³adaj¹cy siê ze zbiorów wartoœci lingwistycznych dla r (1 £ r £ N+1) zmiennych systemu, Fr – zestawienie zbiorów czêstych sk³adaj¹cych siê ze zbiorów wartoœci lingwistycznych dla r (1 £ r £ N+1) zmiennych systemu, D – dane empiryczne dotycz¹ce badanego systemu, w termi-nologii data mining czêsto okreœlane jako dane transakcyjne, Di – i-ty zbiór wartoœci empirycznych zmiennych modelu

{xi

1,..., xiN, yi}, i=1,...I.

Za zbiór czêsty uwa¿a siê zbiór, którego prawdopodobieñ-stwo wystêpowania jest wiêksze od wartoœci za³o¿onego mi-nimalnego wsparcia min w.

Algorytm do generowania regu³ dla systemu wnioskuj¹cego z probabilistyczno-rozmyt¹ baz¹ wiedzy jest przedstawiony na rysunku 4.

Dokonano próby zaadoptowania algorytmu FP-Growth do wersji, która pozwoli bezpoœrednio wyszukiwaæ rozmyte re-gu³y asocjacji. Jednak¿e ta wersja algorytmu okaza³a siê bar-dziej z³o¿ona obliczeniowo w porównaniu ze zmodyfikowa-nym algorytmem Apriori. Czas generowania regu³ tego algoryt-mu jest d³u¿szy, mimo ¿e otrzyalgoryt-mujemy te same wyniki (rys. 5). 2.3. Wnioskowanie w oparciu o zbudowany model Mechanizm wnioskowania rozmytego modelu o wielu wej-œciach i jednym wyjœciu oblicza na podstawie ostrych war-toœci danych wejœciowych wynikow¹ funkcjê przynale¿no-œci, a w konsekwencji ostr¹ wartoœæ wyjœcia modelu. Dla systemu z baz¹ regu³ w postaci (4) mo¿liwe s¹ dwa sposoby odnajdywania ostrych wyników y* [22]. Jeden ze sposo-bów wnioskowania dla przyk³adowej regu³y plikowej za-wiera rysunek 6. Przedstawione wnioskowanie wykorzy-stuje nastêpuj¹ce parametry: minimum jako operator t-nor-my (OperAND), iloczyn logiczny jako operatora implikacji rozmytej (OperImp) oraz metodê œrodka ciê¿koœci COA jako metodê defuzyfikacji (MethDefuzz).

3. Przyk³ad zastosowania omawianego systemu do pre-dykcji prêdkoœci wiatru w elektrowniach wiatrowych Energia wiatru stanowi alternatywne, odnawialne Ÿród³o energii. Dziêki turbinom wiatrowym istnieje mo¿liwoœæ przekszta³cenia energii wiatrowej w energiê elektryczn¹. Zasoby wiatru na œwiecie s¹ olbrzymie. Szacuje siê, ¿e iloœæ energii wiatrowej, mo¿liwej do wykorzystania z tech-nologicznego punktu widzenia, równe jest oko³o 53 tys. TWh/rok – tj. czterokrotnie wiêcej ni¿ wynosi globalne roczne zapotrzebowanie na energiê. Nie jest mo¿liwe wy-korzystanie ca³ego potencja³u wiatru, ale skutecznie mo¿e-my wykorzystaæ wiatr o prêdkoœci od 3-4 do 25-30 m/s [6]. Wiatr stanowi ruch mas powietrza powstaj¹cy w wyniku nierównomiernego rozk³adu ciœnienia, spowodowanego nierównomiernym ogrzewaniem Ziemi przez promienio-wanie s³oneczne. Ciep³e, ogrzane powietrze, jako l¿ejsze, unosi siê do góry, a w jego miejsce przechodz¹ ch³odniejsze masy, tworz¹c cyrkulacjê powietrza. Wa¿nymi parametrami wiatru wykorzystywanymi podczas sterowania w elektrowni wiatrowej jest jego prêdkoœæ i kierunek. Zale¿noœæ wiatru od warunków ukszta³towania powierzchni Ziemi powoduje jego lokalne zawirowania – zmiany kierunku i si³y wiatru.

Wieloletnie badania potwierdzaj¹ te¿ zmiennoœæ tych para-metrów w czasie, zarówno na przestrzeni lat (zmiennoœæ wieloletnia), na przestrzeni miesiêcy w roku (zmiennoœæ roczna zwi¹zana z porami roku), jak i w okresie dobowym oraz minutowym (sekundowym), gdzie jest to zmiennoœæ nieprzewidywalna o charakterze losowym.

Zmiennoœæ parametrów wiatru, bêd¹cego Ÿród³em energii, mo¿e zatem stanowiæ zak³ócenie dla procesu produkcji energii elektrycznej [16]. Dlatego te¿ z punku widzenia za-rz¹dzania energetyk¹ wiatrow¹, niezmiernie wa¿ne jest ujarzmienie wiatru poprzez jego identyfikacjê, poznanie jego parametrów z wyprzedzeniem czasowym, tak aby móc odpowiednio sterowaæ parametrami elektrowni. Ma to zna-czenie podczas typowej pracy mechanizmu ustawiania ³opat i kierunkowania elektrowni oraz w sytuacjach awa-ryjnych, aby móc przewidzieæ nag³e, huraganowe podmu-chy wiatru i z wyprzedzeniem zminimalizowaæ niekorzyst-ny wp³yw zak³óceñ. Prawid³owe oszacowanie zasobów energetycznych wiatru ma tak¿e decyduj¹ce znaczenie dla procesu lokalizacji elektrowni wiatrowej, planowania pro-dukcji, okreœlania kosztów oraz szacowania op³acalnoœci inwestycji tego typu. Moc elektrowni wiatrowej jest wprost proporcjonalna do powierzchni ³opat wirnika poruszanych przez wiatr oraz do szeœcianu prêdkoœci wiatru, co wynika z nastêpuj¹cej zale¿noœci [16]:

(13) gdzie:

N – moc elektrowni wiatrowej [W], A – powierzchnia ³opatek wirnika [A], r – gêstoœæ powietrza [kg/m3],

V – prêdkoœæ wiatru [m/s].

Omawiany system wnioskuj¹cy zastosowano zatem do pre-dykcji prêdkoœci wiatru. W okresie 01-01-2010 do 09-01-2010 na wysokoœci wirnika wiatraka zarejestrowano 11 000 pomiarów wartoœci prêdkoœci wiatru, w okresie próbkowa-nia co 1 minutê. Pierwsze 7 500 pomiarów stanowi³o dane ucz¹ce, kolejne dane testuj¹ce. Predykcji prêdkoœci wiatru v(t) dokonywano na podstawie trzech ostatnich pomiarów prêdkoœci wiatru ozn. v(t-3), v(t-2), v(t-1). Dla ka¿dej zmiennej zdefiniowano po 7 zbiorów rozmytych (o warto-œciach lingwistycznych okreœlaj¹cych wiatr jako: „cichy”, „s³aby”, „³agodny”, „umiarkowany”, ”doœæ silny”, „silny”, „bardzo silny”) przy za³o¿eniu 30-stu roz³¹cznych prze-dzia³ów wartoœci tych¿e zmiennych. Przyk³ad wartoœci stopni przynale¿noœci dla zmiennej v(t-3) zosta³ przedsta-wiony na rysunku 7. Stopnie przynale¿noœci dla pozosta-³ych zmiennych s¹ zdefiniowane analogicznie.

Dok³adnoœæ predykcji parametru wiatru badano na podsta-wie pierwiastka b³êdu œredniokwadratowego RMSE, który w tym przypadku jest obliczany za pomoc¹ wzoru:

gdzie:

N РliczebnoϾ zbioru,

v’(t) – wartoœæ prognozowana w chwili t, v(t) – wartoœæ rzeczywista w chwili t.

(7)
(8)

Rys. 5. Porównanie czasu generowania rozmytych regu³ asocjacji dla zmodyfikowanych algorytmów

Apriori i FP-Growth

Rys. 6. Przyk³ad wnioskowania w systemie z probabilistyczno-rozmyt¹ baz¹ wiedzy

Rys. 7. Przyk³ad definicji zbiorów rozmytych dla prêdkoœci wiatru

(9)

Liczbê elementarnych regu³ modelu oraz wartoœci b³êdów RMSE dla danych ucz¹cych, w zale¿noœci od parametru minimalnego wsparcia (min w), zamieszczono na rysunku 8.

Jak mo¿na zauwa¿yæ, celowe jest ograniczenie liczby regu³ do ok. 40-stu, aby móc uproœciæ z³o¿onoœæ modelu, zacho-wuj¹c przy tym t¹ sam¹ dok³adnoœæ odwzorowania na po-ziomie b³êdu ok. 0,75 m/sec. Dopiero po pewnej wartoœci minimalnego wsparcia b³¹d predykcji znacznie wzrasta, co œwiadczy o zbyt prostym modelu, który nie jest w stanie odwzorowaæ odpowiednich, przewidywanych wartoœci prêdkoœci wiatru v. Przy takich

za³o-¿eniach, optymaln¹ strukturê modelu otrzymujemy przy wartoœci minimal-nego wsparcia równej min w = 0,008, wówczas b³¹d œredniokwadratowy dla danych ucz¹cych wynosi 0,77 m/s, dla danych testuj¹cych 0,72 m/s oraz otrzymujemy model sk³adaj¹cy siê z 42 regu³ elementarnych (24 regu³ plikowych). Porównanie predykcji z wartoœciami rzeczywistymi dla da-nych ucz¹cych i testuj¹cych zamiesz-czono na rysunkach 9 i 10. Zalet¹ systemu jest mo¿liwoœæ podejrzenia struktury modelu, która pozwala nam oceniæ charakterystykê procesu po-przez rozk³ad prawdopodobieñstwa zajœcia jednoczesnych zdarzeñ, zapi-sanych w jêzyku naturalnym dla cz³o-wieka (tab. 2).

Prêdkoœæ wiatru jest parametrem trud-nym do prognozowania, st¹d te¿ nie-znaczne rozbie¿noœci pomiêdzy war-toœci¹ rzeczywist¹ a prognozowan¹. Wyniki na podobnym poziomie daje

predykcja z uwzglêdnieniem systemów rozmyto-wych (np. ANFIS). Jednak¿e w przypadku sieci neurono-wych utworzonego modelu nie mo¿na logicznie zinterpre-towaæ. Przedstawiona prognoza jest prognoz¹ w krótkim horyzoncie cza-sowym, st¹d ma g³ównie zastosowa-nie w sterowaniu obiektem wiatraka. Przy planowaniu produkcji energii elektrycznej i szacowaniu jej op³a-calnoœci przydatna bêdzie prognoza o d³u¿szym horyzoncie czasowym. 4. Podsumowanie

Opracowanie systemu wnioskuj¹ce-go z probabilistyczno-rozmyt¹ baz¹ wiedzy otwiera nowe mo¿liwoœci w modelowaniu zagadnieñ dotycz¹-cych zarz¹dzania przedsiêbiorstwem, które wymagaj¹ uwzglêdnienia nie-pewnoœci w kategoriach probabili-stycznych i rozmytych jednoczeœnie. Zastosowanie logiki rozmytej z regu-³ow¹ baz¹ wiedzy daje mo¿liwoœæ wyra¿ania informacji niepe³nej i nie-pewnej w jêzyku naturalnym, w spo-sób charakterystyczny dla cz³owieka. Zastosowanie dodatkowo prawdopo-dobieñstw zdarzeñ ujêtych w kategoriach lingwistycznych, pozwala na dostrojenie modelu na podstawie liczbowej in-formacji z danych przechowywanych w czasie dzia³alnoœci przedsiêbiorstwa. Utworzony w ten sposób model staje siê ³atwy do interpretacji przez u¿ytkowników, co ma du¿e znaczenie zw³aszcza w procesie podejmowania strategicz-nych decyzji dla przedsiêbiorstwa.

Rys. 8. Liczba regu³ oraz wartoœci b³êdów RMSE dla danych ucz¹cych w zale¿noœci od parametru minimalnego wsparcia (min w)

Rys. 9. Porównanie wartoœci predykcji i wartoœci rzeczywistych prêdkoœci wiatru dla danych ucz¹cych

(10)

Przedstawione w pracy rozmyte regu³y asocjacji mog¹ byæ wykorzystywane jako metoda pozyskiwania wiedzy w omawianym systemie wnioskuj¹cym. Przes³anki regu³ wydobywane s¹ wówczas niezale¿nie od ich konkluzji. Przeszukiwanie przestrzeni rozwa¿añ za pomoc¹ algoryt-mów wyszukiwania rozmytych regu³ asocjacji (w tym zmodyfikowanego algorytmu Apriori) skraca czas two-rzenia modelu i pozwala na ograniczenie jego z³o¿onoœci. Dziêki zastosowaniu ró¿nych parametrów (operatorów implikacji rozmytej i operatorów t-normy) przy budowie struktury systemu, istnieje mo¿liwoœæ indywidualnego dopasowania modelu do analizowanego procesu czy pro-blemu decyzyjnego.

Literatura:

[1] Agrawal R., Imielinski T., Swami A.: Mining associa-tion rules between sets of items in large databases. ACM Sigmod Intern. Conf. on Management of Data, Washington D.C., May 1993, pp. 207-216.

[2] Alcalá-Fdez J., Alcalá R., Gacto M. J., Herrera F.: Learning the membership function contexts for mining fuzzy association ru-les by using genetic algorithms. “Fuzzy Sets and System”, Vol. 160, 2009, pp. 905–921.

[3] B³aszczyk K.: Implementation of a probabilistic-fuzzy modelling system in Matlab. X Miêdzyna-rodowe Warsztaty Doktoranckie, OWD, Warszawa 2008, str. 74-78. [4] B³aszczyk K.: Notes on Defining fuzzy sets in the created inference system with probabilistic-fuzzy knowledge base. IV Œrodowisko-we Warsztaty Doktorantów PO, Zeszyty Naukowe Politechniki Opolskiej. Z. 63, Elektryka, Nr 335/2010, Opole – Pokrzywna 2010, str. 9-10.

[5] Chen G., Wei Q.: Fuzzy Associa-tion Rules and the Extended Mi-ning Algorithm. “Information Sciences”, Vol. 147, 2002, pp. 201-228.

[6] Energetycznie aspekty wiatru. Baza danych odnawialnych Ÿróde³ energii województwa podkarpac-kiego. Dostêpny w Internecie: http://www.baza-oze.pl

[7] Fayyad U., Piatetsky-Shapiro G., Smyth P.: From data mining to knowledge discovery in data-bases. “AI Magazine”, 1996, pp. 37-54.

[8] Frawley W., Piatetsky-Shapiro G., Matheus C.: Knowledge Disco-very in Databases: An Overview. „AI Magazine”, 1992, pp. 57-70. [9] Herrera F.: Genetic fuzzy systems: status, critical

con-siderations and future directions. “International Jour-nal of ComputatioJour-nal Intelligence Research”, Vol. 1, No. 1, 2005, pp. 59-67.

[10] Hong T.P., Kuo C.S., Chi S.C.: Trade-off between Computation Time and Number of Rules for Fuzzy Mining from Quantitative Data. “International Jour-nal of Uncertainty, Fuzziness and Knowledge-Based System”, Vol. 9, No. 5, 2001, pp. 587-604.

[11] Hüllermeier E.: Fuzzy methods in machine learning and data mining: status and prospects. “Fuzzy Sets and System”, Vol. 156, Issue 3, 2005, pp. 387-406. [12] Kacprzyk J.: Wieloetapowe sterowanie rozmyte.

Wy-dawnictwo Naukowo-Techniczne, Warszawa 2001. [13] KoŸmiñski A. K.: Zarz¹dzanie w warunkach

niepewno-œci. Wydawnictwo Naukowe PWN, Warszawa 2005. [14] Kuok C. M., Fu A., Wong M. H.: Mining Fuzzy

Asso-ciation Rules in Database. In ACM Sigmod VI Intern. Conf. on Information and Knowledge Management, Vol. 27 Issue I, 1998, pp. 41-46.

Tab. 2. Podgl¹d rozk³adu prawdopodobieñstwa jednoczesnego zajœcia wybranych zdarzeñ rozmytych, na podstawie struktury modelu predykcji prêdkoœci wiatru

Rys. 10. Porównanie wartoœci predykcji i rzeczywistych wartoœci prêdkoœci wiatru dla danych testuj¹cych

(11)

[15] £êski J.: Systemy neuronowo-rozmyte. WNT, Warsza-wa 2008.

[16] Metody oceny zasobów energetycznych wiatru. Baza danych odnawialnych Ÿróde³ energii województwa podkarpackiego. Dostêpny w Internecie: http:// www.baza-oze.pl

[17] Nowicki R. K.: Rozmyte systemy decyzyjne w zada-niach z ograniczon¹ wiedz¹. Akademicka Oficyna Wydawnicza EXIT, Warszawa 2009.

[18] Piegat A.: Modelowanie i sterowanie rozmyte. EXIT, Warszawa 2003.

[19] Piech H.: Wnioskowanie na bazie strategii rozmytych. Wydawnictwa Politechniki Czêstochowskiej, Czêsto-chowa 2005.

[20] Rutkowska D., Piliñski M., Rutkowski L.: Sieci neu-ronowe, algorytmy genetyczne i systemy rozmyte. PWN, Warszawa-£ódŸ 1997.

[21] Walaszek-Babiszewska A.: Zbiory rozmyte jako na-rzêdzie formalizacji wiedzy ekspertów w systemach informatycznych. Zeszyty Naukowe Politechniki Œl¹-skiej, Organizacja i Zarz¹dzanie. Materia³y Krajowej Konferencji Naukowej Wiedza – Informacja – Marke-ting, Szczyrk 2004.

[22] Walaszek-Babiszewska A., Chudzicki M.: Fuzzy mo-del for the information and decission making support system for the CFM branch company. “Applied Computer Science”, Vol. 2, No. 1, 2006, Decision Support Engineering, Banaszak Z., Matuszek J. (Eds.), pp. 110-121.

[23] Walaszek-Babiszewska A.: Fuzzy Knowledge Repre-sentation Using Probability Measures of Fuzzy Events, [in:] Automation and Robotics, Juan Manuel Ramos Arreguin (Ed.), pp. 329-342, I-Tech Education and Publishing, Vienna 2008.

[24] Walaszek-Babiszewska A., B³aszczyk K.: A modified Apriori algorithm to generate rules for inference sys-tem with probabilistic-fuzzy knowledge base. 7th Workshop on Advanced Control and Diagnosis 19-20 November 2009, Zielona Góra, CD-ROOM.

[25] Yager R. R., Filev D. P.: Podstawy modelowania i sterowania rozmytego. WNT, Warszawa 1995. [26] Zadeh L. A.: Fuzzy sets. „Inform. Contr.”, 1965 vol. 8,

pp. 338-353.

THE FUZZY INFERENCE SYSTEM WITH MODEL BASED ON ASSOCIATION RULES

Abstract:

In the practice of company management we deal with many tasks, that are associated with limited knowledge and un-certainty about the course of events and activities managed objects. Fuzzy IF-THEN rules are an appropriate form of describing subjective uncertainty results from lack of knowledge and objective uncertainty results from characte-ristics of different processes. On the other hand, the uncer-tainty due to randomness can be described using the theory of probability. The paper presents inference system with probabilistic-fuzzy knowledge base as a tool which can help user to analyze complete uncertainty of real problems in the company using fuzzy sets and probability. In the

mentioned system, knowledge is saved in the weighted IF-THEN fuzzy rules, where the weights constitute mar-ginal probabilities of the fuzzy events in the antecedents and conditional probabilities of the fuzzy events in the consequents.

Moreover, this paper propose using fuzzy association rules as a method of automatic knowledge base extraction in the inference system. For this purpose a modification of the Apriori algorithm was described. The algorithm extracts the most important and matching linguistic rules by as-sumption of minimum support as a minimum joint probabi-lity of the events in the rules. If minimum support equals zero, then the rules present total probabilistic distribution of the fuzzy events, otherwise the rules present probabili-stic distribution, which is the best matching to a variables universe. In the methodology of system creation, the uni-verse of quantitative variables is discretized on disjoint in-tervals of variable values and the fuzzy sets are defined by grades of membership of the disjoint intervals to fuzzy sets. This approach allows vectorize the calculation.

A numerical example is analyzed by using a wind speed prediction process. Parameter of wind speed characterized by high variability of random character. However, the cor-rect estimation of wind speed, as a energy resources, is ne-cessary for control working of wind turbine. It is also im-portant for the localization process of wind turbines, pro-duction planning and estimating cost-effectiveness of such investments.

Dr hab. in¿. Anna WALASZEK-BABISZEWSKA, prof. PO

Katedra Automatyki i Systemów Informatycznych Instytut Automatyki i Informatyki

Wydzia³ Elektrotechniki, Automatyki i Informatyki Politechnika Opolska

ul. K. Sosnkowskiego 31 45-272 Opole

a.walaszek-babiszewska@po.opole.pl Mgr in¿. Katarzyna RUDNIK

Katedra Zarz¹dzania i In¿ynierii Produkcji Instytut Innowacyjnoœci Procesów i Produktów Wydzia³ In¿ynierii Produkcji i Logistyki ul. Ozimska 75

45-370 Opole k.rudnik@po.opole.pl

Obraz

Tab. 1. Przyk³ad operatorów t-normy [18]
Tab. 2. Podgl¹d rozk³adu prawdopodobieñstwa jednoczesnego zajœcia wybranych zdarzeñ rozmytych, na podstawie struktury modelu predykcji prêdkoœci wiatru

Cytaty

Powiązane dokumenty

(Na podstaw ie nieznanych autografów Ju liu sza Słowackiego.. zresztą ocenę tej pracy w

Z góry mogę przedstawić tezę niniejszego artyku- łu; otóż, opowiadam się po stronie antynaturalistów, twierdząc, że ten para- dygmat bardziej przystaje do natury nauk

Виходячи з вітчизняної практики та міжнародного досвіду, можна виділити 5 основних принципів забезпечення техногенної безпеки [1,5]:

Rough Sets and Data Mining, Kluwer Academic Publishers..

2.2 Metoda współczynników pewności CF Celem ćwiczeń jest przedstawienie koncepcji rozszerzenia modelu reprezentacji wiedzy w postaci reguł produkcji o współczynniki pewności CF

Wnioskowanie prowadzi do wniosku, że uczeni badają Jasia, co może ale nie musi być prawdą !.Dla większości sieci semantyntycznych mechanizm wnioskowania oparty jest na

stwa, jak i sektora finansów publicznych oraz ograniczania przez to tempa wzro- stu długu publicznego było kompensowane prostym mechanizmem reguły, zmianą świadomości o

Metody oparte na logice — reprezentacja wiedzy w języku logiki 1.. Dlaczego logika matematyczna jest dobrym językiem reprezentacji wiedzy dla