Podstawowymi metodamiformalnymiopisu stanu niepewno±ci, wynikaj¡cego z przypadkowo±ci zdarze«, lub z niedostatecznej wiedzy o obserwowanych zdarzeniach, s¡ funkcje prawdopodobie«stwa oraz funkcje przekonania 6. W kolejnych punktach podaje si¦ elementarne informacje z zakresu teorii tych funkcji. Informacje o innych podej±ciach do opisu stanu niepewno±ci, w szczególno±ci opartych na logice rozmytej, mo»na znale¹¢ np. w pracach [Kacprzyk 1988] i [Zadeh 1992].
3.3.1 Funkcje prawdopodobie«stwa
Przyjmuj¡c jako punkt wyj±cia klasyczne poj¦cie przestrzeni probabilistycz-nej (C, -C, Pr), w której jako zbiór zdarze« elementarnych rozwa»any jest (sko«czony) zbiór klas okre±lonych w danym zadaniu klasykacjiC, a odpo-wiedni zbiór zdarze« stanowi pewne -ciaªo podzbiorów zbioruC: -C 2C. Funkcjami prawdopodobie«stwa Pr nazywane s¡ funkcje okre±lone na-ciele zdarze«-C, speªniaj¡ce nast¦puj¡ce warunki ([Jakubowski 2010] s. 11) 7
Pr(A) 0 dla wszystkich A2-C (3.13.1)
Pr(C) = 1 (3.13.3)
oraz je±liAi 2-C;i = 1;2;:::;n i Ai\Aj =; dla i6=j, to Pr([n
i=1Ai) = Xn
i=1Pr(Ai) (3.13.3) W przestrzeni probabilistycznej (C, -C, Pr) funkcja Pr jest przeliczaln¡
addytywn¡ i nieujemn¡ miar¡ unormowan¡ okre±lon¡ na -C. Rozszerze-niami miary Pr na 2C s¡ prawdopodobie«stwa dolne Pri górne Pr, okre±lone
6Interpretacj¦ funkcji przekonania nieodwoªuj¡c¡ si¦ w sposób jawny do probabilistyki podali Smets i Kennes [Smets 1994] w postaci modeluTransferable Belief Model.
7Na u»ytek rozprawy odbiegamy od rozpowszechnionego w literaturze zapisu symbo-licznego(;;P), przyjmuj¡cC.
3.3 Wybrane metody opisu niepewno±ci 43 dla A22C nast¦puj¡co
Pr(A) = supfPr(X)jX A orazX 2-C g (3.14.1) Pr(A) = inffPr(X)jX A orazX 2-C g (3.14.2) Dla ka»dego zbioru A 2 2C zachodzi Pr(A) Pr(A). Je±li A 2 -C, to Pr(A) = Pr(A) = Pr(A).
Prawdopodobie«stwo zaj±cia zdarzeniaA pod warunkiem zaj±cia zdarze-nia B nazywane jest prawdopodobie«stwem warunkowym Pr(A j B). Dla B 2-C takiego, »e Pr(B) > 0, wyra»a si¦ ono wzorem
Pr(AjB) = Pr(A\B)=Pr(B) (3.15) Szczególnie wa»na jest nast¦puj¡ca interpretacja poj¦cia prawdopodo-bie«stwa warunkowego. Niech Pr0(A) okre±la pocz¡tkowe (a priori) prawdo-podobie«stwo zdarzenia A. Wtedy prawdopodobie«stwo warunkowe (3.15) okre±la zaktualizowane prawdopodobie«stwo (a posteriori) zdarzenia A po powzi¦ciu informacji o zaj±ciu zdarzeniaB.
3.3.2 Funkcje przekonania
Funkcje przekonania (ang. belief functions) stanowi¡ klas¦ funkcji Bel : 2C 7!
[0;1] speªniaj¡cych nast¦puj¡ce warunki ([Shafer 1976] s. 39)
Bel(f;g) = 0 (3.16.0)
Bel(A) 0 dla wszystkichA22C (3.16.1)
Bel(C) = 1 (3.16.2)
Bel([n
i=1Ai) X
If1;:::;ng;I6=;(?1)jIj+1Bel(\
i2IAi) (3.16.3) W powi¡zaniu z funkcj¡ przekonania Bel deniowana jest funkcja domnie-mania Pl : 2C 7![0;1], okre±lona jako
Pl(A) = 1?Bel(A) gdzieA =C nA (3.17) Denicj¦ funkcji przekonania mo»na równie» wprowadzi¢ deniuj¡c naj-pierw poj¦ciepodstawowego przypisania prawdopodobie«stwa(ang. basic pro-bability assignment, bpa) okre±lonego jako funkcja m : 2C 7! [0;1] o
wªasno-±ciach
m(;) = 0 (3.18.1)
X
ACm(A) = 1 (3.18.2)
44 Rozdziaª 3. Proponowana metoda selekcji
Wielko±¢ m(A) mierzy stopie« przekonania przypisany bezpo±rednio i niepodzielnie zbiorowi A. Je±li m jest funkcj¡ podstawowego przypisania prawdopodobie«stwa okre±lon¡ na 2C, to przyjmuje si¦, »e caªkowity stopie«
przekonania co doA wyra»a funkcja Bel : 2C 7![0;1] o warto±ciach Bel(A) = X
BAm(B) (3.19)
która speªnia warunki funkcji przekonania. Wyst¦puje wzajemnie jedno-znaczna zale»no±¢ pomi¦dzy funkcjami bpa i funkcjami przekonania. Wzór (3.19) okre±la funkcj¦ przekonania Bel skojarzon¡ z funkcj¡ bpa m. Jedno-cze±nie, dla danej funkcji przekonania Bel istnieje tylko jedna funkcja bpa, dla której zastosowanie wzoru (3.19) prowadzi do danej funkcji Bel. Taka funkcja bpa dla ustalonej funkcji Bel wyra»a si¦ wzorem
m(A) = X
BA(?1)jA?BjBel(B) (3.20) Podzbiory A C takie, »e m(A) > 0 nosz¡ nazw¦ elementów ognisko-wych (ang. focal elements) funkcji podstawowego przypisania prawdopodo-bie«stwam (i skojarzonej z ni¡ funkcji przekonania).
Funkcje przekonania Bel i domniemania Pl wykazuj¡ formalne powi¡za-nia z rozszerzepowi¡za-niami (3.14.1) i (3.14.2) miary Pr ([Fagin 1991b]). Mianowi-cie dla danej funkcji przekonania Bel okre±lonej na zbiorze 2C mo»na zna-le¹¢ przestrze« probabilistyczn¡ (C, -C, Pr), w której Bel(A) = Pr(A) oraz Pl(A) = Pr(A), dla ka»dego A C. I przeciwnie, je±li (C, -C, Pr) jest przestrzeni¡ probabilistyczn¡, wówczas Pr jest funkcj¡ przekona-nia okre±lon¡ na 2C, a Pr odpowiedni¡ funkcj¡ domniemania. Para od-powiadaj¡cych sobie funkcji Pr i Pr okre±lonych na zbiorze 2C wyznacza pewien zbiór funkcji prawdopodobie«stwa P = fPrig konstruowalnych na
-ciaªach -Ci 2C przy speªnieniu warunków (3.13.1-3.13.3), takich, »e Pr(A)Pri(A)Pr(A) dla ka»dego A2 -Ci.
Z funkcjamiProraz Pr zwi¡zane s¡ wielko±ci dolnej oraz górnej warto±ci oczekiwanej zmiennej losowej wzgl¦dem zbioru funkcji prawdopodobie«stwa
P, zdeniowane odpowiednio jako funkcjonaªy ([Dempster 1967] s. 327)
E
P[V ] = min
Pr2P E
Pr[V ] (3.21.1)
E
P[V ] = max
Pr2P E
Pr[V ] (3.21.2)
gdzieV oznacza zmienn¡ losow¡ zdeniowan¡ na zbiorze zdarze« elementar-nychC. Je»eli odpowiadaj¡ce sobie funkcje Pr i Pr okre±lone na 2C dane s¡
3.3 Wybrane metody opisu niepewno±ci 45 podstawowym przypisaniemprawdopodobie«stwam a V jest zmienn¡ losow¡
zdeniowan¡ jak poprzednio, wówczas ([Smets 1981])
E
P[V ] = X
ACm(A)minc
2A V (c) (3.22.1)
E
P[V ] = X
ACm(A)maxc
2A V (c) (3.22.2) i dla ka»dego Pr2P zachodzi
E
P[V ]EPr[V ]EP[V ] (3.23) Formalna odpowiednio±¢ funkcji Bel i Pr oraz Pl i Pr, daje podstaw¦ by funkcje przekonania interpretowa¢ jako uogólnienie funkcji prawdopodobie«-stwa na zbiory zdarze«, na których nie mo»na skonstruowa¢ miary Pr speª-niaj¡cej warunki (3.13.1-3.13.3). Przy takiej interpretacji mo»na rozwa»a¢
warunkowe funkcje przekonania Bel(jB) i domniemania Pl(jB) 8. Odpo-wiednim rozszerzeniem reguªy (3.15) wyznaczania prawdopodobie«stwa wa-runkowego Pr(AjB) s¡ reguªy aktualizacji (warunkowania) (ang. updating) funkcji przekonania Bel(A) i domniemania Pl(A) pod wpªywem wyst¡pie-nia zdarzewyst¡pie-nia (przesªanki) B, gdy Bel(B) > 0. Podano kilka sformuªowa«
reguª aktualizacji, logicznie spójnych, ale prowadz¡cych do ró»nych
warto-±ci funkcji Bel(AjB), odpowiednio Pl(AjB). Wymieni¢ tu mo»na oryginalne sformuªowanie Dempstera [Dempster 1967] oraz pó¹niejsze Fagina i Halperna [Fagin 1991a].
W innej interpretacji traktuje si¦ funkcj¦ przekonania jako reprezentacj¦
przesªanki (ang. evidence). W takim uj¦ciu warto±¢ funkcji Bel(A) odpo-wiada stopniowi w jakim ta przesªanka wpªywa na zmian¦ przekonania co do AC [Shafer 1976]. Halpern i Fagin [Halpern 1992] okre±laj¡ przesªank¦, i reprezentuj¡c¡ j¡ funkcj¦ przekonania Bel, jako przeksztaªcenie sªu»¡ce ak-tualizacji funkcji prawdopodobie«stwa
Bel : Pr 7! Pr0 gdzie Pr;Pr02P (3.24) Halpern i Fagin [Halpern 1992] rozró»niaj¡ wi¦c dwie interpretacje funk-cji przekonania: jako uogólnionej funkfunk-cji prawdopodobie«stwa i jako repre-zentacji przesªanki. Z ka»d¡ z tych interpretacji wi¡»e si¦ inna operacja dokonywana wzgl¦dem funkcji przekonania po powzi¦ciu nowej przesªanki.
W pierwszym przypadku mamy do czynienia zaktualizacj¡ (ang. updating)
8Jako rozszerzenia klasycznego prawdopodobie«stwa warunkowego Pr (jB): dolne prawdopodobie«stwo warunkowe Pr(jB) oraz górne prawdopodobie«stwo warunkowe
Pr
(jB).
46 Rozdziaª 3. Proponowana metoda selekcji
uogólnionej funkcji prawdopodobie«stwa, za± w drugim z ª¡czeniem (ang.
combining) przesªanek. Halpern i Fagin wskazuj¡, »e brak rozró»nienia tych dwóch interpretacji i zwi¡zanych z nimi operacji prowadzi do licznych za-strze»e« wobec stosowanej w ramach teorii Dempstera-Shafera tzw. reguªy Dempstera (sumy ortogonalnej). Halpern i Fagin stwierdzaj¡, »e ta operacja powinna by¢ stosowana tylko wtedy, gdy interpretujemy funkcje przekona-nia jako reprezentacje przesªanek. Natomiast dla przypadku interpretacji funkcji przekonania jako uogólnionej funkcji prawdopodobie«stwa proponuj¡
oni inny sposób aktualizacji [Halpern 1992]. W naszych rozwa»aniach przyj-mujemy t¦ pierwsz¡ interpretacj¦, wi¦c reguªa Dempstera, któr¡ opisujemy poni»ej, znajduje zastosowanie.
Reguªa Dempstera, zwana te» operacj¡ sumy ortogonalnej, pozwala na okre±lenie ª¡cznej reprezentacji(w postaci ª¡cznej funkcji przekonania) zbioru przesªanek reprezentowanych ró»nymi funkcjami przekonania
Bel = BelnBel2Bel1 (3.25) Operacj¦ t¦ najdogodniej wyrazi¢ deniuj¡c j¡ dla funkcji podstawowego przypisania prawdopodobie«stwa bpa
m=mnm2m1 (3.26) przyjmuj¡cm(f;g) = 0 oraz dla niepustych podzbiorów AC
m(A) =
PBi1Bi\B1;Bii2\\2;:::;BinBin=Am1(Bi1)m2(Bi2)mn(Bin) 1?P Bi1;Bi2;:::;Bin
Bi1\Bi2\\Bin=;m1(Bi1)m2(Bi2)mn(Bin) (3.27) Je±li mianownik wyra»enia (3.27) jest równy 0, to oznacza to, »e prze-sªanki zakodowane za pomoc¡ poszczególnych funkcji bpa mi s¡ sprzeczne.
Takie funkcje bpa, jak i skojarzone z nimi funkcje przekonania, nie s¡ wtedy kombinowalne z u»yciem reguªy Dempstera.
Przesªanka wskazuj¡ca dokªadnie jeden niepusty podzbiór A C na-zywana jest przesªank¡ homogeniczn¡. Funkcja przekonania reprezentuj¡ca przesªank¦ homogeniczn¡ nazywana jestprost¡ funkcj¡ wsparcia (ang. simple support function). Przyjmuj¡c, »e liczba s 2 [0;1] oddaje stopie« wsparcia udzielany stwierdzeniom zwi¡zanym z A przez przesªank¦ homogeniczn¡ s, reprezentuj¡ca j¡ prosta funkcja wsparcia Bels ma posta¢
Bels(X) =
8
>
<
>
:
0 je±li A6X
s je±li AX, przy czymX6=C
1 je±li X =C (3.28)
3.3 Wybrane metody opisu niepewno±ci 47 Zgodnie z (3.20) odpowiadaj¡ca Bels funkcja bpa ms ma posta¢
ms(A) = Bels(A) ms(C) = 1?Bels(A)
ms(X) = 0 dla wszystkich pozostaªychX C (3.29) Górny indeks (s) w (3.28) i (3.29) wskazuje, »e wielko±ci te okre±lono na podstawie przesªanki s. Funkcja wsparcia Bels = BelsnBels2Bels1 powstaªa ze zªo»enia prostych funkcji wsparcia nazywana jest separowaln¡
funkcj¡ wsparcia(ang. separable support function). Je±li dla pewnych funkcji przekonania zachodzi równo±¢ Bels0 = Bels0Bels1 to funkcja Bels1jest nazywna znaczeniowo niezale»n¡ wzgl¦dem Bels1, i odwrotnie.
Informacje na temat rozszerze« i zastosowa« teorii Dempstera-Shafera zawiera praca pod redakcj¡ Yagera, Kacprzyka i Fedrizziego [Yager 1994].
3.3.3 Podejmowanie decyzji przy niepeªnej informacji
Rozwa»amy tu ogólne zadanie podejmowania decyzji, które mo»na sformu-ªowa¢ nast¦puj¡co. Nale»y podj¡¢ jedn¡ z decyzji ze zbioruD =fdig. Efekt podj¦tej decyzji di zale»y od stanu ±wiata cj 2 C i wyra»a si¦ on
warto-±ci¡ funkcji strat l(di;cj), okre±lonej jako l : D C 7! R. Z zaªo»enia nie posiadamy peªnej informacji co do stanu ±wiata, a jedynie dysponujemy ob-serwacj¡s, która pozwala na pewn¡ ocen¦ ilo±ciow¡ przypuszcze«, co do tego, z którym ze stanów ±wiata cj 2C mamy do czynienia.
Gdy obserwacje s pozwalaj¡ niepewno±¢ co do faktycznego stanu ±wiata zredukowa¢ do postaci prawdopodobie«stw warunkowych Pr(cijs) okre±lo-nych dla poszczególokre±lo-nych stanów ci 2 C, warto±¢ straty oczekiwanej L(dijs) dla poszczególnych decyzjidi obliczana jest jako
L(dijs) =EPr(Cjs)[l] = X
cj2Cl(di;cj)Pr(cjjs) (3.30) Post¦puj¡c zgodnie z zasadami statystycznej teorii decyzji, analizuj¡c ob-serwacj¦ s nale»y podejmowa¢ decyzj¦ d 2 D = fd1;d2;:::;dng, z któr¡
wi¡»¦ si¦ najni»sza strata oczekiwana
d = arg minL(dijs)
di2D (3.31)
Yager [Yager 1992] i Denoeux [Den÷ux 1997] adaptuj¡ formuª¦ (3.30) dla potrzeb podejmowania decyzji w sytuacjach, gdy pozyskane dane s pozwa-laj¡ zredukowa¢ niepewno±¢ jedynie do postaci funkcji przekonania Bels(Cj) (równowa»nie, do odpowiedniej funkcji bpams(Cj) okre±lonej na podzbiorach
48 Rozdziaª 3. Proponowana metoda selekcji
Cj C). Den÷ux [Den÷ux 1997] proponuje by przez analogi¦ do (3.30) u»y¢
równa« (3.22.1) i (3.22.2), podanych na s. 45, i rozpatrywa¢ strat¦ oczeki-wan¡ doln¡ oraz strat¦ oczekioczeki-wan¡ górn¡, zdeniowane jako
L(dijs) = EP[l] = X
ACms(A)mincj
2A l(di;cj) (3.32.1) L(dijs) = EP[l] = X
ACms(A)maxcj
2A l(di;cj) (3.32.2) Wielko±ciL(dijs) iL(dijs) mog¡ sta¢ si¦ podstaw¡ rozstrzygni¦¢ (3.31) do-konywanych ze skrajnie ró»nych stanowisk przy subiektywnej ocenie niezna-nego faktyczniezna-nego stanu ±wiata. Podej±ciem umiarkowanym jest arbitralny wybór ze zbioru funkcji prawdopodobie«stwa
P =fPr(Ajs) : Bels(A)Pr(Ajs)Pls(A) dla ka»degoA Cg (3.33) pewnej funkcji Pr, i obliczenie starty oczekiwanejLPr(dijs) zgodnie z
zale»no-±ci¡ (3.30). Smets [Smets 1994] podaj¡c sformuªowanie teorii funkcji przeko-nania nieodwoªuj¡ce si¦ jawnie do intuicji probabilistycznych argumentuje, i»
w sytuacji gdy podstawowe przypisanie prawdopodobie«stwa m jest najpeª-niejszym i najbardziej szczegóªowym znanym opisem stanu ±wiata, podstaw¡
wyznaczania L(dijs) powinna by¢ szczególna funkcja prawdopodobie«stwa tzw. pignistic probability, deniowana dla ka»dego cj 2C jako
BetP(cjjs) = X
AC
fcjg\A6=;
ms(A)
jAj (3.34)
Obliczona zgodnie z formuª¡ (3.30) strata oczekiwana po podj¦ciu decyzjidi, dla rozkªadu BetP wynosi
LBet(dijs) =X
c2Cl(di;cj) X
AC
fcjg\A6=;
ms(A)
jAj = X
ACms(A) X
cj2A
l(di;cj)
jAj (3.35) iL LBet L.
Wyra»enia (3.32.1-3.32.2) oraz (3.35) wedªug których obliczane s¡ war-to±ci strat oczekiwanych L, L i LBet mog¡ by¢ uwa»ane za szczególne przypadki w zaproponowanej przez Yagera ([Yager 1992], [Yager 1997]) re-prezentacji straty oczekiwanej przy zastosowaniu operatorów uporz¡dkowa-nej ±redniej wa»ouporz¡dkowa-nej (ang. Ordered Weighted Averaging, OWA). Operatory OWA przyjmuj¡ jako argumenty sko«czone ci¡gi liczb rzeczywistych i zwra-caj¡ ±rednie wa»one wyrazów tych ci¡gów po uprzednim ich uporz¡dkowa-niu [Yager 1988]. Operator OWA o wymiarze n i wektorze nieujemnych
3.3 Wybrane metody opisu niepewno±ci 49 wag W = [w1;w2;:::;wn] speªniaj¡cych warunek Pni=1wi = 1, jest funk-cj¡OW : Rn?![0;1], dan¡ jako
OW(a1;a2;:::;an) =Xn
i=1wibi (3.36) gdziebi jest i-tym wyrazem ci¡gu fb1;b2;:::;bngzbudowanego z uporz¡dko-wanych malej¡co wszystkich wyrazów ci¡gu fa1;a2;:::;ang podanego jako argument. Dla wektorów wag WMin = [0;:::;0;1], WMax = [1;0;:::;0] i WAve = [n1;:::;n1], operatory OMin, OMax i OAve s¡ odpowiednio operato-rami wyboru: najmniejszego wyrazu, najwi¦kszego wyrazu oraz obliczania
±redniej arytmetycznej wszystkich wyrazów ci¡gu.
Yager [Yager 1988] wprowadza dwie miary charakteryzuj¡ce operatory OWA. Dla operatoremOW o wymiarzen, miara stopnia optymizmu denio-wana jest jako wspóªczynnik optymizmu Opt9
Opt(OW) = 1n?1
n
X
i=i(n?i)wi (3.37) a dyspersja operatora OW jako wielko±¢ Disp
Disp(OW) =? Xn
i=1 wi6=0
wiln(wi) (3.38) Warto±¢ wspóªczynnika Opt(OW) 2 [0;1] przyjmuje dla wyró»nionych operatorów OWA nast¦puj¡ce warto±ci: Opt(OMin) = 0, Opt(OAve) = 0:5, Opt(OMax) = 1.
W literaturze zaproponowano wiele sposobów okre±lania wektora wag operatorów OWA. Jedna z nich ([Yager 1992]) polega na okre±leniu klasy operatorów OWA OWn, które dla danego wymiaru n wykazuj¡ najwy»sz¡
mo»liw¡ warto±¢ dyspersji Disp(OWn) przy zadanej warto±ci Opt(OWn) =. Wektory wag operatorów OWn wyznaczane s¡ wtedy jako rozwi¡zanie na-st¦puj¡cego zadania optymalizacyjnego
max ?Pni=1wilnwi w1;w2;:::;wn
p.o. Pni=1 nn?1?i wi =
Pni=1wi = 1
wi 0 gdziei = 1;:::;n 0 1
(3.39)
9Wspóªczynnik optymizmuOpt, zdeniowany jako (3.37), w literaturze jest równie» na-zywany wspóªczynnikiem A-C od ang. attitudinal character, lub wspóªczynnikiem ORness, jako »e charakteryzuje podobie«stwo danego operatora OWA do operatora OR (OR jest deniowany jak operator OMax).
50 Rozdziaª 3. Proponowana metoda selekcji
W kontek±ciereprezentowanianiepewno±ci z u»yciemfunkcjiprzekonania, Yager [Yager 1992] stosuje operatory OWA do wyra»enia oczekiwanej straty L(dijs) w sposób nast¦puj¡cy
LOW(dijs) = X
AC A=fcj1;cj2:::;cjng
ms(A)OWn[l(dijcj1);l(dijcj2);:::;l(dijcjn) ] (3.40) W ogólno±ci zachodzi: LOMin LOW LOMax. Przyj¦cie w (3.40) warto±ci równej 0, 0.5 i 1 pozwala wyrazi¢ (3.32.1), (3.32.2) i (3.35) z u»yciem (3.40) w nast¦puj¡cy sposób
L(dijs) LOMin(dijs) (3.41.1) LBet(dijs) LOAve(dijs) (3.41.2) L(dijs) LOMax(dijs) (3.41.3)