• Nie Znaleziono Wyników

Podstawowymi metodamiformalnymiopisu stanu niepewno±ci, wynikaj¡cego z przypadkowo±ci zdarze«, lub z niedostatecznej wiedzy o obserwowanych zdarzeniach, s¡ funkcje prawdopodobie«stwa oraz funkcje przekonania 6. W kolejnych punktach podaje si¦ elementarne informacje z zakresu teorii tych funkcji. Informacje o innych podej±ciach do opisu stanu niepewno±ci, w szczególno±ci opartych na logice rozmytej, mo»na znale¹¢ np. w pracach [Kacprzyk 1988] i [Zadeh 1992].

3.3.1 Funkcje prawdopodobie«stwa

Przyjmuj¡c jako punkt wyj±cia klasyczne poj¦cie przestrzeni probabilistycz-nej (C, -C, Pr), w której jako zbiór zdarze« elementarnych rozwa»any jest (sko«czony) zbiór klas okre±lonych w danym zadaniu klasykacjiC, a odpo-wiedni zbiór zdarze« stanowi pewne -ciaªo podzbiorów zbioruC: -C 2C. Funkcjami prawdopodobie«stwa Pr nazywane s¡ funkcje okre±lone na-ciele zdarze«-C, speªniaj¡ce nast¦puj¡ce warunki ([Jakubowski 2010] s. 11) 7

Pr(A)  0 dla wszystkich A2-C (3.13.1)

Pr(C) = 1 (3.13.3)

oraz je±liAi 2-C;i = 1;2;:::;n i Ai\Aj =; dla i6=j, to Pr([n

i=1Ai) = Xn

i=1Pr(Ai) (3.13.3) W przestrzeni probabilistycznej (C, -C, Pr) funkcja Pr jest przeliczaln¡

addytywn¡ i nieujemn¡ miar¡ unormowan¡ okre±lon¡ na -C. Rozszerze-niami miary Pr na 2C s¡ prawdopodobie«stwa dolne Pri górne Pr, okre±lone

6Interpretacj¦ funkcji przekonania nieodwoªuj¡c¡ si¦ w sposób jawny do probabilistyki podali Smets i Kennes [Smets 1994] w postaci modeluTransferable Belief Model.

7Na u»ytek rozprawy odbiegamy od rozpowszechnionego w literaturze zapisu symbo-licznego(;;P), przyjmuj¡cC.

3.3 Wybrane metody opisu niepewno±ci 43 dla A22C nast¦puj¡co

Pr(A) = supfPr(X)jX A orazX 2-C g (3.14.1) Pr(A) = inffPr(X)jX A orazX 2-C g (3.14.2) Dla ka»dego zbioru A 2 2C zachodzi Pr(A)  Pr(A). Je±li A 2 -C, to Pr(A) = Pr(A) = Pr(A).

Prawdopodobie«stwo zaj±cia zdarzeniaA pod warunkiem zaj±cia zdarze-nia B nazywane jest prawdopodobie«stwem warunkowym Pr(A j B). Dla B 2-C takiego, »e Pr(B) > 0, wyra»a si¦ ono wzorem

Pr(AjB) = Pr(A\B)=Pr(B) (3.15) Szczególnie wa»na jest nast¦puj¡ca interpretacja poj¦cia prawdopodo-bie«stwa warunkowego. Niech Pr0(A) okre±la pocz¡tkowe (a priori) prawdo-podobie«stwo zdarzenia A. Wtedy prawdopodobie«stwo warunkowe (3.15) okre±la zaktualizowane prawdopodobie«stwo (a posteriori) zdarzenia A po powzi¦ciu informacji o zaj±ciu zdarzeniaB.

3.3.2 Funkcje przekonania

Funkcje przekonania (ang. belief functions) stanowi¡ klas¦ funkcji Bel : 2C 7!

[0;1] speªniaj¡cych nast¦puj¡ce warunki ([Shafer 1976] s. 39)

Bel(f;g) = 0 (3.16.0)

Bel(A)  0 dla wszystkichA22C (3.16.1)

Bel(C) = 1 (3.16.2)

Bel([n

i=1Ai)  X

If1;:::;ng;I6=;(?1)jIj+1Bel(\

i2IAi) (3.16.3) W powi¡zaniu z funkcj¡ przekonania Bel deniowana jest funkcja domnie-mania Pl : 2C 7![0;1], okre±lona jako

Pl(A) = 1?Bel(A) gdzieA =C nA (3.17) Denicj¦ funkcji przekonania mo»na równie» wprowadzi¢ deniuj¡c naj-pierw poj¦ciepodstawowego przypisania prawdopodobie«stwa(ang. basic pro-bability assignment, bpa) okre±lonego jako funkcja m : 2C 7! [0;1] o

wªasno-±ciach

m(;) = 0 (3.18.1)

X

ACm(A) = 1 (3.18.2)

44 Rozdziaª 3. Proponowana metoda selekcji

Wielko±¢ m(A) mierzy stopie« przekonania przypisany bezpo±rednio i niepodzielnie zbiorowi A. Je±li m jest funkcj¡ podstawowego przypisania prawdopodobie«stwa okre±lon¡ na 2C, to przyjmuje si¦, »e caªkowity stopie«

przekonania co doA wyra»a funkcja Bel : 2C 7![0;1] o warto±ciach Bel(A) = X

BAm(B) (3.19)

która speªnia warunki funkcji przekonania. Wyst¦puje wzajemnie jedno-znaczna zale»no±¢ pomi¦dzy funkcjami bpa i funkcjami przekonania. Wzór (3.19) okre±la funkcj¦ przekonania Bel skojarzon¡ z funkcj¡ bpa m. Jedno-cze±nie, dla danej funkcji przekonania Bel istnieje tylko jedna funkcja bpa, dla której zastosowanie wzoru (3.19) prowadzi do danej funkcji Bel. Taka funkcja bpa dla ustalonej funkcji Bel wyra»a si¦ wzorem

m(A) = X

BA(?1)jA?BjBel(B) (3.20) Podzbiory A  C takie, »e m(A) > 0 nosz¡ nazw¦ elementów ognisko-wych (ang. focal elements) funkcji podstawowego przypisania prawdopodo-bie«stwam (i skojarzonej z ni¡ funkcji przekonania).

Funkcje przekonania Bel i domniemania Pl wykazuj¡ formalne powi¡za-nia z rozszerzepowi¡za-niami (3.14.1) i (3.14.2) miary Pr ([Fagin 1991b]). Mianowi-cie dla danej funkcji przekonania Bel okre±lonej na zbiorze 2C mo»na zna-le¹¢ przestrze« probabilistyczn¡ (C, -C, Pr), w której Bel(A) = Pr(A) oraz Pl(A) = Pr(A), dla ka»dego A  C. I przeciwnie, je±li (C, -C, Pr) jest przestrzeni¡ probabilistyczn¡, wówczas Pr jest funkcj¡ przekona-nia okre±lon¡ na 2C, a Pr odpowiedni¡ funkcj¡ domniemania. Para od-powiadaj¡cych sobie funkcji Pr i Pr okre±lonych na zbiorze 2C wyznacza pewien zbiór funkcji prawdopodobie«stwa P = fPrig konstruowalnych na

-ciaªach -Ci  2C przy speªnieniu warunków (3.13.1-3.13.3), takich, »e Pr(A)Pri(A)Pr(A) dla ka»dego A2 -Ci.

Z funkcjamiProraz Pr zwi¡zane s¡ wielko±ci dolnej oraz górnej warto±ci oczekiwanej zmiennej losowej wzgl¦dem zbioru funkcji prawdopodobie«stwa

P, zdeniowane odpowiednio jako funkcjonaªy ([Dempster 1967] s. 327)

E

P[V ] = min

Pr2P E

Pr[V ] (3.21.1)

E



P[V ] = max

Pr2P E

Pr[V ] (3.21.2)

gdzieV oznacza zmienn¡ losow¡ zdeniowan¡ na zbiorze zdarze« elementar-nychC. Je»eli odpowiadaj¡ce sobie funkcje Pr i Pr okre±lone na 2C dane s¡

3.3 Wybrane metody opisu niepewno±ci 45 podstawowym przypisaniemprawdopodobie«stwam a V jest zmienn¡ losow¡

zdeniowan¡ jak poprzednio, wówczas ([Smets 1981])

E

 P[V ] = X

ACm(A)minc

2A V (c) (3.22.1)

E



P[V ] = X

ACm(A)maxc

2A V (c) (3.22.2) i dla ka»dego Pr2P zachodzi

E

P[V ]EPr[V ]EP[V ] (3.23) Formalna odpowiednio±¢ funkcji Bel i Pr oraz Pl i Pr, daje podstaw¦ by funkcje przekonania interpretowa¢ jako uogólnienie funkcji prawdopodobie«-stwa na zbiory zdarze«, na których nie mo»na skonstruowa¢ miary Pr speª-niaj¡cej warunki (3.13.1-3.13.3). Przy takiej interpretacji mo»na rozwa»a¢

warunkowe funkcje przekonania Bel(jB) i domniemania Pl(jB) 8. Odpo-wiednim rozszerzeniem reguªy (3.15) wyznaczania prawdopodobie«stwa wa-runkowego Pr(AjB) s¡ reguªy aktualizacji (warunkowania) (ang. updating) funkcji przekonania Bel(A) i domniemania Pl(A) pod wpªywem wyst¡pie-nia zdarzewyst¡pie-nia (przesªanki) B, gdy Bel(B) > 0. Podano kilka sformuªowa«

reguª aktualizacji, logicznie spójnych, ale prowadz¡cych do ró»nych

warto-±ci funkcji Bel(AjB), odpowiednio Pl(AjB). Wymieni¢ tu mo»na oryginalne sformuªowanie Dempstera [Dempster 1967] oraz pó¹niejsze Fagina i Halperna [Fagin 1991a].

W innej interpretacji traktuje si¦ funkcj¦ przekonania jako reprezentacj¦

przesªanki (ang. evidence). W takim uj¦ciu warto±¢ funkcji Bel(A) odpo-wiada stopniowi w jakim ta przesªanka wpªywa na zmian¦ przekonania co do AC [Shafer 1976]. Halpern i Fagin [Halpern 1992] okre±laj¡ przesªank¦, i reprezentuj¡c¡ j¡ funkcj¦ przekonania Bel, jako przeksztaªcenie sªu»¡ce ak-tualizacji funkcji prawdopodobie«stwa

Bel : Pr 7! Pr0 gdzie Pr;Pr02P (3.24) Halpern i Fagin [Halpern 1992] rozró»niaj¡ wi¦c dwie interpretacje funk-cji przekonania: jako uogólnionej funkfunk-cji prawdopodobie«stwa i jako repre-zentacji przesªanki. Z ka»d¡ z tych interpretacji wi¡»e si¦ inna operacja dokonywana wzgl¦dem funkcji przekonania po powzi¦ciu nowej przesªanki.

W pierwszym przypadku mamy do czynienia zaktualizacj¡ (ang. updating)

8Jako rozszerzenia klasycznego prawdopodobie«stwa warunkowego Pr (jB): dolne prawdopodobie«stwo warunkowe Pr(jB) oraz górne prawdopodobie«stwo warunkowe

Pr



(jB).

46 Rozdziaª 3. Proponowana metoda selekcji

uogólnionej funkcji prawdopodobie«stwa, za± w drugim z ª¡czeniem (ang.

combining) przesªanek. Halpern i Fagin wskazuj¡, »e brak rozró»nienia tych dwóch interpretacji i zwi¡zanych z nimi operacji prowadzi do licznych za-strze»e« wobec stosowanej w ramach teorii Dempstera-Shafera tzw. reguªy Dempstera (sumy ortogonalnej). Halpern i Fagin stwierdzaj¡, »e ta operacja powinna by¢ stosowana tylko wtedy, gdy interpretujemy funkcje przekona-nia jako reprezentacje przesªanek. Natomiast dla przypadku interpretacji funkcji przekonania jako uogólnionej funkcji prawdopodobie«stwa proponuj¡

oni inny sposób aktualizacji [Halpern 1992]. W naszych rozwa»aniach przyj-mujemy t¦ pierwsz¡ interpretacj¦, wi¦c reguªa Dempstera, któr¡ opisujemy poni»ej, znajduje zastosowanie.

Reguªa Dempstera, zwana te» operacj¡ sumy ortogonalnej, pozwala na okre±lenie ª¡cznej reprezentacji(w postaci ª¡cznej funkcji przekonania) zbioru przesªanek reprezentowanych ró»nymi funkcjami przekonania

Bel = BelnBel2Bel1 (3.25) Operacj¦ t¦ najdogodniej wyrazi¢ deniuj¡c j¡ dla funkcji podstawowego przypisania prawdopodobie«stwa bpa

m=mnm2m1 (3.26) przyjmuj¡cm(f;g) = 0 oraz dla niepustych podzbiorów AC

m(A) =

PBi1Bi\B1;Bii2\\2;:::;BinBin=Am1(Bi1)m2(Bi2)mn(Bin) 1?P Bi1;Bi2;:::;Bin

Bi1\Bi2\\Bin=;m1(Bi1)m2(Bi2)mn(Bin) (3.27) Je±li mianownik wyra»enia (3.27) jest równy 0, to oznacza to, »e prze-sªanki zakodowane za pomoc¡ poszczególnych funkcji bpa mi s¡ sprzeczne.

Takie funkcje bpa, jak i skojarzone z nimi funkcje przekonania, nie s¡ wtedy kombinowalne z u»yciem reguªy Dempstera.

Przesªanka wskazuj¡ca dokªadnie jeden niepusty podzbiór A  C na-zywana jest przesªank¡ homogeniczn¡. Funkcja przekonania reprezentuj¡ca przesªank¦ homogeniczn¡ nazywana jestprost¡ funkcj¡ wsparcia (ang. simple support function). Przyjmuj¡c, »e liczba s 2 [0;1] oddaje stopie« wsparcia udzielany stwierdzeniom zwi¡zanym z A przez przesªank¦ homogeniczn¡ s, reprezentuj¡ca j¡ prosta funkcja wsparcia Bels ma posta¢

Bels(X) =

8

>

<

>

:

0 je±li A6X

s je±li AX, przy czymX6=C

1 je±li X =C (3.28)

3.3 Wybrane metody opisu niepewno±ci 47 Zgodnie z (3.20) odpowiadaj¡ca Bels funkcja bpa ms ma posta¢

ms(A) = Bels(A) ms(C) = 1?Bels(A)

ms(X) = 0 dla wszystkich pozostaªychX C (3.29) Górny indeks (s) w (3.28) i (3.29) wskazuje, »e wielko±ci te okre±lono na podstawie przesªanki s. Funkcja wsparcia Bels = BelsnBels2Bels1 powstaªa ze zªo»enia prostych funkcji wsparcia nazywana jest separowaln¡

funkcj¡ wsparcia(ang. separable support function). Je±li dla pewnych funkcji przekonania zachodzi równo±¢ Bels0 = Bels0Bels1 to funkcja Bels1jest nazywna znaczeniowo niezale»n¡ wzgl¦dem Bels1, i odwrotnie.

Informacje na temat rozszerze« i zastosowa« teorii Dempstera-Shafera zawiera praca pod redakcj¡ Yagera, Kacprzyka i Fedrizziego [Yager 1994].

3.3.3 Podejmowanie decyzji przy niepeªnej informacji

Rozwa»amy tu ogólne zadanie podejmowania decyzji, które mo»na sformu-ªowa¢ nast¦puj¡co. Nale»y podj¡¢ jedn¡ z decyzji ze zbioruD =fdig. Efekt podj¦tej decyzji di zale»y od stanu ±wiata cj 2 C i wyra»a si¦ on

warto-±ci¡ funkcji strat l(di;cj), okre±lonej jako l : D C 7! R. Z zaªo»enia nie posiadamy peªnej informacji co do stanu ±wiata, a jedynie dysponujemy ob-serwacj¡s, która pozwala na pewn¡ ocen¦ ilo±ciow¡ przypuszcze«, co do tego, z którym ze stanów ±wiata cj 2C mamy do czynienia.

Gdy obserwacje s pozwalaj¡ niepewno±¢ co do faktycznego stanu ±wiata zredukowa¢ do postaci prawdopodobie«stw warunkowych Pr(cijs) okre±lo-nych dla poszczególokre±lo-nych stanów ci 2 C, warto±¢ straty oczekiwanej L(dijs) dla poszczególnych decyzjidi obliczana jest jako

L(dijs) =EPr(Cjs)[l] = X

cj2Cl(di;cj)Pr(cjjs) (3.30) Post¦puj¡c zgodnie z zasadami statystycznej teorii decyzji, analizuj¡c ob-serwacj¦ s nale»y podejmowa¢ decyzj¦ d 2 D = fd1;d2;:::;dng, z któr¡

wi¡»¦ si¦ najni»sza strata oczekiwana

d = arg minL(dijs)

di2D (3.31)

Yager [Yager 1992] i Denoeux [Den÷ux 1997] adaptuj¡ formuª¦ (3.30) dla potrzeb podejmowania decyzji w sytuacjach, gdy pozyskane dane s pozwa-laj¡ zredukowa¢ niepewno±¢ jedynie do postaci funkcji przekonania Bels(Cj) (równowa»nie, do odpowiedniej funkcji bpams(Cj) okre±lonej na podzbiorach

48 Rozdziaª 3. Proponowana metoda selekcji

Cj C). Den÷ux [Den÷ux 1997] proponuje by przez analogi¦ do (3.30) u»y¢

równa« (3.22.1) i (3.22.2), podanych na s. 45, i rozpatrywa¢ strat¦ oczeki-wan¡ doln¡ oraz strat¦ oczekioczeki-wan¡ górn¡, zdeniowane jako

L(dijs) = EP[l] = X

ACms(A)mincj

2A l(di;cj) (3.32.1) L(dijs) = EP[l] = X

ACms(A)maxcj

2A l(di;cj) (3.32.2) Wielko±ciL(dijs) iL(dijs) mog¡ sta¢ si¦ podstaw¡ rozstrzygni¦¢ (3.31) do-konywanych ze skrajnie ró»nych stanowisk przy subiektywnej ocenie niezna-nego faktyczniezna-nego stanu ±wiata. Podej±ciem umiarkowanym jest arbitralny wybór ze zbioru funkcji prawdopodobie«stwa

P =fPr(Ajs) : Bels(A)Pr(Ajs)Pls(A) dla ka»degoA Cg (3.33) pewnej funkcji Pr, i obliczenie starty oczekiwanejLPr(dijs) zgodnie z

zale»no-±ci¡ (3.30). Smets [Smets 1994] podaj¡c sformuªowanie teorii funkcji przeko-nania nieodwoªuj¡ce si¦ jawnie do intuicji probabilistycznych argumentuje, i»

w sytuacji gdy podstawowe przypisanie prawdopodobie«stwa m jest najpeª-niejszym i najbardziej szczegóªowym znanym opisem stanu ±wiata, podstaw¡

wyznaczania L(dijs) powinna by¢ szczególna funkcja prawdopodobie«stwa tzw. pignistic probability, deniowana dla ka»dego cj 2C jako

BetP(cjjs) = X

AC

fcjg\A6=;

ms(A)

jAj (3.34)

Obliczona zgodnie z formuª¡ (3.30) strata oczekiwana po podj¦ciu decyzjidi, dla rozkªadu BetP wynosi

LBet(dijs) =X

c2Cl(di;cj) X

AC

fcjg\A6=;

ms(A)

jAj = X

ACms(A) X

cj2A

l(di;cj)

jAj (3.35) iL LBet L.

Wyra»enia (3.32.1-3.32.2) oraz (3.35) wedªug których obliczane s¡ war-to±ci strat oczekiwanych L, L i LBet mog¡ by¢ uwa»ane za szczególne przypadki w zaproponowanej przez Yagera ([Yager 1992], [Yager 1997]) re-prezentacji straty oczekiwanej przy zastosowaniu operatorów uporz¡dkowa-nej ±redniej wa»ouporz¡dkowa-nej (ang. Ordered Weighted Averaging, OWA). Operatory OWA przyjmuj¡ jako argumenty sko«czone ci¡gi liczb rzeczywistych i zwra-caj¡ ±rednie wa»one wyrazów tych ci¡gów po uprzednim ich uporz¡dkowa-niu [Yager 1988]. Operator OWA o wymiarze n i wektorze nieujemnych

3.3 Wybrane metody opisu niepewno±ci 49 wag W = [w1;w2;:::;wn] speªniaj¡cych warunek Pni=1wi = 1, jest funk-cj¡OW : Rn?![0;1], dan¡ jako

OW(a1;a2;:::;an) =Xn

i=1wibi (3.36) gdziebi jest i-tym wyrazem ci¡gu fb1;b2;:::;bngzbudowanego z uporz¡dko-wanych malej¡co wszystkich wyrazów ci¡gu fa1;a2;:::;ang podanego jako argument. Dla wektorów wag WMin = [0;:::;0;1], WMax = [1;0;:::;0] i WAve = [n1;:::;n1], operatory OMin, OMax i OAve s¡ odpowiednio operato-rami wyboru: najmniejszego wyrazu, najwi¦kszego wyrazu oraz obliczania

±redniej arytmetycznej wszystkich wyrazów ci¡gu.

Yager [Yager 1988] wprowadza dwie miary charakteryzuj¡ce operatory OWA. Dla operatoremOW o wymiarzen, miara stopnia optymizmu denio-wana jest jako wspóªczynnik optymizmu Opt9

Opt(OW) = 1n?1

n

X

i=i(n?i)wi (3.37) a dyspersja operatora OW jako wielko±¢ Disp

Disp(OW) =? Xn

i=1 wi6=0

wiln(wi) (3.38) Warto±¢ wspóªczynnika Opt(OW) 2 [0;1] przyjmuje dla wyró»nionych operatorów OWA nast¦puj¡ce warto±ci: Opt(OMin) = 0, Opt(OAve) = 0:5, Opt(OMax) = 1.

W literaturze zaproponowano wiele sposobów okre±lania wektora wag operatorów OWA. Jedna z nich ([Yager 1992]) polega na okre±leniu klasy operatorów OWA OWn , które dla danego wymiaru n wykazuj¡ najwy»sz¡

mo»liw¡ warto±¢ dyspersji Disp(OWn ) przy zadanej warto±ci Opt(OWn ) = . Wektory wag operatorów OWn wyznaczane s¡ wtedy jako rozwi¡zanie na-st¦puj¡cego zadania optymalizacyjnego

max ?Pni=1wilnwi w1;w2;:::;wn

p.o. Pni=1 nn?1?i wi =

Pni=1wi = 1

wi 0 gdziei = 1;:::;n 0 1

(3.39)

9Wspóªczynnik optymizmuOpt, zdeniowany jako (3.37), w literaturze jest równie» na-zywany wspóªczynnikiem A-C od ang. attitudinal character, lub wspóªczynnikiem ORness, jako »e charakteryzuje podobie«stwo danego operatora OWA do operatora OR (OR jest deniowany jak operator OMax).

50 Rozdziaª 3. Proponowana metoda selekcji

W kontek±ciereprezentowanianiepewno±ci z u»yciemfunkcjiprzekonania, Yager [Yager 1992] stosuje operatory OWA do wyra»enia oczekiwanej straty L(dijs) w sposób nast¦puj¡cy

LOW(dijs) = X

AC A=fcj1;cj2:::;cjng

ms(A)OWn [l(dijcj1);l(dijcj2);:::;l(dijcjn) ] (3.40) W ogólno±ci zachodzi: LOMin LOW LOMax. Przyj¦cie w (3.40) warto±ci równej 0, 0.5 i 1 pozwala wyrazi¢ (3.32.1), (3.32.2) i (3.35) z u»yciem (3.40) w nast¦puj¡cy sposób

L(dijs)  LOMin(dijs) (3.41.1) LBet(dijs)  LOAve(dijs) (3.41.2) L(dijs)  LOMax(dijs) (3.41.3)