Elementy teorii podejmowania decyzji
dr inż. Mariusz Makuchowski
Podejmowanie decyzji w
warunkach niepewności
przykład
Należy podjąć decyzję o wyborze zboża do zasiania Zysk zależy od podjętej decyzji i warunków pogodowych
decyzja warunki pogodowe
s1: susza s2: normalna s3: deszcze
d1: zboże 1 24 28 36
d2: zboże 2 31 30 28
d3: zboże 3 28 34 29
d4: zboże 4 27 29 33
d5: zboże 5 31 30 29
oznaczenia
Oznaczenia:
D - zbiór decyzji D = {d
1, d
2, . . . , d
n}, S - zbiór scenariuszy S = {s
1, s
2, . . . , s
m},
A - macierz zysku, a
i ,jjest zyskiem decyzji d
iscenariusza s
j.
Kryterium jest miarą oceny decyzji.
kryteria wyboru decyzji
Kryterium wyboru decyzji:
MaxMax: kryterium ryzykanta, optymisty,
Walda: kryterium MaxMin, asekuranta, pesymisty,
Hurwicza: ważone kryteria MaxMax i MaxMin,
Laplace’a: maksymalizacja oczekiwanego zysku,
Savage’a: minimalizacja makasymalnego żalu.
kryterium MaxMax
Kryterium MaxMax:
dla każdej decyzji d
iwyznaczamy jej maksymalny zysk o
i= max
j ∈S{a
i ,j},
wybieramy decyzję o maksymalnym o
i, o
∗= max
i ∈D{o
i}.
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
o1= max{24, 28, 36} = 36 = o∗ o2= max{31, 30, 28} = 31 o3= max{28, 34, 29} = 34 o4= max{27, 29, 33} = 33 o5= max{31, 30, 29} = 31
Optymalną w sensie kryterium MaxMax jest decyzja d
1.
kryterium Walda
Kryterium Walda:
dla każdej decyzji d
iwyznaczamy jej minimalny zysk p
i= min
j ∈S{a
i ,j},
wybieramy decyzję o maksymalnym p
i. p
∗= max
i ∈D{p
i}.
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
p1= min{24, 28, 36} = 24 p2= min{31, 30, 28} = 28 p3= min{28, 34, 29} = 28 p4= min{27, 29, 33} = 27 p5= min{31, 30, 29} = 29 = p∗
Optymalną w sensie kryterium Walda jest decyzja d
5.
kryterium Hurwicza
Kryterium Hurwicza:
wybieramy λ ∈ (0, 1) skłonność do ryzyka; λ = 0.1.
dla każdej decyzji d
iwyznaczamy jej ważony zysk h
i(λ) = λo
i+ (1 − λ)p
i,
wybieramy decyzję o maksymalnym h
i. h
∗(λ) = max
i ∈D{h
i(λ)}.
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
h1(0.1) = 0.1 · 36 + 0.9 · 24 = 25.2 h2(0.1) = 0.1 · 31 + 0.9 · 28 = 28.3 h3(0.1) = 0.1 · 34 + 0.9 · 28 = 28.6 h4(0.1) = 0.1 · 33 + 0.9 · 27 = 27.6
h5(0.1) = 0.1 · 31 + 0.9 · 29 = 29.2 = h∗(0.1)
Optymalną w sensie kryterium Hurwicza ze skłonnością do ryzyka
na poziomie λ = 0.1 jest decyzja d
5.
kryterium Laplace’a
Kryterium Laplace’a:
dla każdej decyzji d
iwyznaczamy wartość oczekiwaną zysku l
i= 1/m P
j ∈Sa
i ,j,
wybieramy decyzję o maksymalnej wartości oczekiwanej l
i. l
∗= max
i ∈D{l
i}.
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
l1= (24 + 28 + 36)/3 = 29.3 l2= (31 + 30 + 28)/3 = 29.6 l3= (28 + 34 + 29)/3 = 30.3 = l∗ l4= (27 + 29 + 33)/3 = 29.6 l5= (31 + 30 + 29)/3 = 30.0
Optymalną w sensie kryterium Laplace’a jest decyzja d
3.
kryterium Savage’a
Największą wypłatę dla scenariusza s
joznaczamy:
a
j∗= max
i ∈D
{a
i ,j},
a∗1= max{24, 31, 28, 27, 31} = 31 a∗2= max{28, 30, 34, 29, 30} = 34 a∗3= max{36, 28, 29, 33, 29} = 36
Żal, r
i ,j: dla decyzji d
ii scenariusza s
jjest różnicą pomiędzy najwyższą wypłatą tego scenariusza a wypłatą otrzymaną;
r
i ,j= a
∗j− a
i ,jMacierz żalu R:
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
R =
31 − 24 34 − 28 36 − 36 31 − 31 34 − 30 36 − 28 31 − 28 34 − 34 36 − 29 31 − 27 34 − 29 36 − 33 31 − 31 34 − 30 36 − 29
=
7 6 0
0 4 8
3 0 7
4 5 3
0 4 7
kryterium Savage’a
Kryterium Savage’a:
wyznaczamy R macierz żalu
dla każdej decyzji d
iwyznaczamy maksymalną wartość żalu r
i= max
j ∈S{r
i ,j},
wybieramy decyzję o minimalnej wartości r
i, r
∗= min
i ∈D{r
i}.
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
R =
7 6 0
0 4 8
3 0 7
4 5 3
0 4 7
r1= max{7, 6, 0} = 7 r2= max{0, 4, 8} = 8 r3= max{3, 0, 7} = 7 r4= max{4, 5, 3} = 5 = r∗ r5= max{0, 4, 7} = 7
Optymalną w sensie kryterium Savage’a jest decyzja d
4.
Podejmowanie decyzji w
warunkach ryzyka
przykład
Należy podjąć decyzję o wyborze zboża do zasiania Zysk zależy od podjętej decyzji i warunków pogodowych Znane są prawdopodobieństwa wystąpienia stanów
decyzja
warunki pogodowe
s1: susza s2: normalna s3: deszcze P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35
d1: zboże 1 24 28 36
d2: zboże 2 31 30 28
d3: zboże 3 28 34 29
d4: zboże 4 27 29 33
d5: zboże 5 31 30 29
kryteria wyboru decyzji
Kryterium wyboru decyzji:
Laplac’a: kryterium maksymalnej oczekiwanej wartości,
kryterium minimalnego oczekiwanego żalu.
kryterium Laplace’a
Kryterium Laplace’a:
dla każdej decyzji d
iwyznaczamy oczekiwaną wartość zysku;
E
i= P
j ∈SP(s
j)a
i ,j,
wybieramy decyzję o największej wartości E
i, E
∗= max
i ∈D{E
i}.
P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
E1= 0.15 · 24 + 0.50 · 28 + 0.35 · 36 = 30.20 E2= 0.15 · 31 + 0.50 · 30 + 0.35 · 28 = 29.45 E3= 0.15 · 28 + 0.50 · 34 + 0.35 · 29 = 31.35 = E∗ E4= 0.15 · 27 + 0.50 · 29 + 0.35 · 33 = 30.10 E5= 0.15 · 31 + 0.50 · 30 + 0.35 · 29 = 29.80
Optymalną, w sensie Laplace’a, jest decyzja d
3.
kryterium minimalnego oczekiwanego żalu
Kryterium minimalnego oczekiwanego żalu:
wyznaczamy R macierz żalu,
dla każdej decyzji d
iwyznaczamy oczekiwaną wartość żalu;
Z
i= P
j ∈SP(s
j)r
i ,j,
wybieramy decyzję o najmniejszej wartości Z
i, Z
∗= min
i ∈D{Z
i}.
P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35
R =
7 6 0
0 4 8
3 0 7
4 5 3
0 4 7
Z1= 0.15 · 7 + 0.50 · 6 + 0.35 · 0 = 4.05 Z2= 0.15 · 0 + 0.50 · 4 + 0.35 · 8 = 4.80 Z3= 0.15 · 3 + 0.50 · 0 + 0.35 · 7 = 2.90 = Z∗ Z4= 0.15 · 4 + 0.50 · 5 + 0.35 · 3 = 4.14 Z5= 0.15 · 0 + 0.50 · 4 + 0.35 · 7 = 4.45
Optymalną, w sensie min. oczekiwanego żalu, jest decyzja d
3.
Podejmowanie decyzji z wykorzystaniem
dodatkowej informacji
informacja doskonała
Informacja doskonała: to wiedza o przyszłym stanie natury przed podjęciem decyzji.
Największą wypłatę dla scenariusza s
joznaczamy:
a
∗j= max
i ∈D
{a
i ,j}
Wartość oczekiwana wypłaty dla informacji doskonałej to:
E
ID= X
j ∈S
P(j ) · a
∗jinformacja doskonała
Dane wejściowe:
P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
Największe wypłaty dla scenariuszy:
a∗1= max{24, 31, 28, 27, 31} = 31 a∗2= max{28, 30, 34, 29, 30} = 34 a∗3= max{36, 28, 29, 33, 29} = 36
Wartość oczekiwana wypłaty dla informacji doskonałej to:
EID=
P
j ∈SP(sj) · a∗j = 0.15 · 31 + 0.50 · 34 + 0.35 · 36 = 34.25
informacja doskonała
Cena graniczna doskonałej informacji to maksymalna kwota, jaką warto zainwestować w dodatkowe badanie pozwalające poznanie przyszłego zachowania się natury.
Jest ona różnicą pomiędzy wartościami oczekiwanymi wypłatami przy posiadaniu informacji doskonałej i bez niej:
CG = E
ID− E
∗.
Wartość CG jest równa minimalnemu oczekiwanemu żalowi Z
∗, CG = Z
∗.
CG = 34.25 − 31.35 = 2.90
prawdopodobieństwa a posteriori
Na stan natury ma wpływ pewien parametr, który może przyjmować wartości: I
1, I
2, . . . , I
K.
W wyniku dodatkowych badań szacuje się prawdopodobieństwo: P(I
k|s
j).
Celem analizy jest wyznaczenie prawdopodobieństw P(s
j|I
k), czyli prawdopodobieństw zaistnienia scenariusza s
jpod warunkiem zajścia czynnika I
k.
P(s
j|I
k) = P(I
k|s
j)P(s
j) P
i ∈S
P(I
k|s
i)P(s
i)
przykład
Prawdopodobieństwo P(I
k|s
j):
czynnik
warunki pogodowe
s
1: susza s
2: normalna s
3: deszcze
P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35
I
110% 30% 50%
I
240% 50% 25%
I
350% 20% 25%
Co można powiedzieć o prawdopodobieństwie poszczególnych
scenariuszy, gdy znana jest czynnik?
obliczenie prawdopodobieństw a posteriori
Obliczenie prawdopodobieństw warunkowych P(s
j|I
k):
sj s1 s2 s3 suma
P(sj) 0.150 0.500 0.500 1.000
P(I1|sj) 0.100 0.300 0.500 -
P(I1)·P(sj) 0.15·0.10 = 0.015 0.50·0.30 = 0.150 0.35·0.50 = 0.175 0.340 P(sj|I1) 0.015/0.34=0.044 0.150/0.34=0.441 0.175/0.34=0.515 1.000
P(I2|sj) 0.400 0.500 0.250 -
P(I2)·P(sj) 0.15·0.40 = 0.060 0.50·0.50 = 0.250 0.35·0.25 = 0.088 0.398 P(sj|I2) 0.060/0.398=0.151 0.250/0.398=0.629 0.088/0.398=0.220 1.000
P(I3|sj) 0.500 0.200 0.250 -
P(I3)·P(sj) 0.15·0.50 = 0.075 0.50·0.20 = 0.100 0.35·0.25 = 0.088 0.263 P(sj|I3) 0.075/0.263=0.286 0.100/0.263=0.381 0.088/0.263=0.333 1.000
Prawdopodobieństwo P(s
j|I
k):
czynnik
warunki pogodowe
s1susza s2normalna s3deszcze
I1 4.4% 44.1% 51.5%
I2 15.1% 62.9% 22.0%
I3 28.6% 38.1% 33.3%
wykorzystanie dodatkowej wiedzy
Wyznaczenie decyzji przy wykorzystaniu dodatkowej wiedzy dla każdego czynnika I
knależy prawdopodobieństwa a priori P(s
j) zastąpić prawdopodobieństwami a posteriori P(s
j|I
k).
dla każdej decyzji d
iwyznaczamy oczekiwaną wartość zysku;
E
i |Ik= P
j ∈SP(s
j|I
k) · a
i ,j, wartość oczekiwanej wypłaty to:
E
I∗k
= max
i ∈D{E
i |Ik}
decyzja dla wystąpienia czynnika I 1
Prawdopodobieństwo P(I
k|s
j):
czynnik warunki pogodowe
s1 s2 s3
I1 4.4% 44.1% 51.5%
I2 15.1% 62.9% 22.0%
I3 28.6% 38.1% 33.3%
Obliczenie decyzji Laplace’a dla wystąpienia czynnika I
1:
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
E1|I1= 0.044·24 + 0.441·28 + 0.514·36 = 31.94 = EI∗ E2|I1= 0.044·31 + 0.441·30 + 0.514·28 = 29.01 1
E3|I1= 0.044·28 + 0.441·34 + 0.514·29 = 31.16 E4|I1= 0.044·27 + 0.441·29 + 0.514·33 = 30.97 E5|I1= 0.044·31 + 0.441·30 + 0.514·29 = 29.52
Optymalna decyzją Laplac’a dla wystąpienie czynnika I
1jest d 1
decyzja dla wystąpienia czynnika I 2
Prawdopodobieństwo P(I
k|s
j):
czynnik warunki pogodowe
s1 s2 s3
I1 4.4% 44.1% 51.5%
I2 15.1% 62.9% 22.0%
I3 28.6% 38.1% 33.3%
Obliczenie decyzji Laplace’a dla wystąpienia czynnika I
2:
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
E1|I1= 0.151·24 + 0.629·28 + 0.220·36 = 29.16 E2|I1= 0.151·31 + 0.629·30 + 0.220·28 = 29.71 E3|I1= 0.151·28 + 0.629·34 + 0.220·29 = 31.99 = EI∗
2
E4|I1= 0.151·27 + 0.629·29 + 0.220·33 = 29.58 E5|I1= 0.151·31 + 0.629·30 + 0.220·29 = 29.93
Optymalna decyzją Laplac’a dla wystąpienie czynnika I
2jest d 3
decyzja dla wystąpienia czynnika I 3
Prawdopodobieństwo P(I
k|s
j):
czynnik warunki pogodowe
s1 s2 s3
I1 4.4% 44.1% 51.5%
I2 15.1% 62.9% 22.0%
I3 28.6% 38.1% 33.3%
Obliczenie decyzji Laplace’a dla wystąpienia czynnika I
3:
A =
24 28 36 31 30 28 28 34 29 27 29 33 31 30 29
E1|I1= 0.286·24 + 0.381·28 + 0.333·36 = 29.52 E2|I1= 0.286·31 + 0.381·30 + 0.333·28 = 29.61 E3|I1= 0.286·28 + 0.381·34 + 0.333·29 = 30.61 = EI∗
3
E4|I1= 0.286·27 + 0.381·29 + 0.333·33 = 29.76 E5|I1= 0.286·31 + 0.381·30 + 0.333·29 = 29.95
Optymalna decyzją Laplac’a dla wystąpienie czynnika I
3jest d 3
oczekiwana wartość wypłaty z dodatkową wiedzą
Oczekiwana wartość wypłaty z dodatkową informacją wynosi:
E
INFO=
K
X
k=1
P(I
k) · E
I∗kP(I1) = 0.340 EI∗
1= 31.94 P(I2) = 0.398 EI∗
2= 31.99 P(I3) = 0.362 EI∗
3= 30.62
EINFO= 0.340 · 31.94 + 0.398 · 31.99 + 0.362 · 30.62 = 31.615
oczekiwana wartość dodatkowej informacji
OWDI: oczekiwana wartość dodatkowej informacji jest różnicą pomiędzy oczekiwaną wartością wypłaty z i bez dodatkowej informacji:
OWDI = E
INFO− E
∗OWDI = 31.615 − 31.35 = 0.265
EDI efektywność dodatkowej informacji jest stosunkiem wartości oczekiwanej dodatkowej informacji do wartości oczekiwanej informacji doskonałej (ceny granicznej).
EDI = OWDI /CG
EDI = 0.265/2.90 = 9.14%