Elementy teorii podejmowania decyzji

(1)

Elementy teorii podejmowania decyzji

dr inż. Mariusz Makuchowski

(2)

Podejmowanie decyzji w

warunkach niepewności

(3)

przykład

Należy podjąć decyzję o wyborze zboża do zasiania Zysk zależy od podjętej decyzji i warunków pogodowych

decyzja warunki pogodowe

s1: susza s2: normalna s3: deszcze

d1: zboże 1 24 28 36

d2: zboże 2 31 30 28

d3: zboże 3 28 34 29

d4: zboże 4 27 29 33

d5: zboże 5 31 30 29

(4)

oznaczenia

Oznaczenia:

D - zbiór decyzji D = {d

₁

, d

₂

, . . . , d

_n

}, S - zbiór scenariuszy S = {s

₁

, s

₂

, . . . , s

_m

},

A - macierz zysku, a

i ,j

jest zyskiem decyzji d

i

scenariusza s

j

.

Kryterium jest miarą oceny decyzji.

(5)

kryteria wyboru decyzji

Kryterium wyboru decyzji:

MaxMax: kryterium ryzykanta, optymisty,

Walda: kryterium MaxMin, asekuranta, pesymisty,

Hurwicza: ważone kryteria MaxMax i MaxMin,

Laplace’a: maksymalizacja oczekiwanego zysku,

Savage’a: minimalizacja makasymalnego żalu.

(6)

kryterium MaxMax

Kryterium MaxMax:

dla każdej decyzji d

i

wyznaczamy jej maksymalny zysk o

_i

= max

_{j ∈S}

{a

_{i ,j}

},

wybieramy decyzję o maksymalnym o

i

, o

^∗

= max

_{i ∈D}

{o

_i

}.

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29







o1= max{24, 28, 36} = 36 = o^∗ o2= max{31, 30, 28} = 31 o3= max{28, 34, 29} = 34 o4= max{27, 29, 33} = 33 o5= max{31, 30, 29} = 31

Optymalną w sensie kryterium MaxMax jest decyzja d

₁

.

(7)

kryterium Walda

Kryterium Walda:

dla każdej decyzji d

i

wyznaczamy jej minimalny zysk p

_i

= min

_{j ∈S}

{a

_{i ,j}

},

wybieramy decyzję o maksymalnym p

i

. p

^∗

= max

_{i ∈D}

{p

_i

}.

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29







p1= min{24, 28, 36} = 24 p2= min{31, 30, 28} = 28 p3= min{28, 34, 29} = 28 p4= min{27, 29, 33} = 27 p5= min{31, 30, 29} = 29 = p^∗

Optymalną w sensie kryterium Walda jest decyzja d

₅

.

(8)

kryterium Hurwicza

Kryterium Hurwicza:

wybieramy λ ∈ (0, 1) skłonność do ryzyka; λ = 0.1.

dla każdej decyzji d

i

wyznaczamy jej ważony zysk h

_i

(λ) = λo

_i

+ (1 − λ)p

_i

,

wybieramy decyzję o maksymalnym h

_i

. h

^∗

(λ) = max

_{i ∈D}

{h

_i

(λ)}.

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29







h1(0.1) = 0.1 · 36 + 0.9 · 24 = 25.2 h2(0.1) = 0.1 · 31 + 0.9 · 28 = 28.3 h3(0.1) = 0.1 · 34 + 0.9 · 28 = 28.6 h4(0.1) = 0.1 · 33 + 0.9 · 27 = 27.6

h5(0.1) = 0.1 · 31 + 0.9 · 29 = 29.2 = h^∗(0.1)

Optymalną w sensie kryterium Hurwicza ze skłonnością do ryzyka

na poziomie λ = 0.1 jest decyzja d

5

.

(9)

kryterium Laplace’a

Kryterium Laplace’a:

dla każdej decyzji d

_i

wyznaczamy wartość oczekiwaną zysku l

i

= 1/m ^P

_{j ∈S}

a

i ,j

,

wybieramy decyzję o maksymalnej wartości oczekiwanej l

_i

. l

^∗

= max

i ∈D

{l

_i

}.

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29







l1= (24 + 28 + 36)/3 = 29.3 l2= (31 + 30 + 28)/3 = 29.6 l3= (28 + 34 + 29)/3 = 30.3 = l^∗ l4= (27 + 29 + 33)/3 = 29.6 l5= (31 + 30 + 29)/3 = 30.0

Optymalną w sensie kryterium Laplace’a jest decyzja d

₃

.

(10)

kryterium Savage’a

Największą wypłatę dla scenariusza s

_j

oznaczamy:

a

_j^∗

= max

i ∈D

{a

_{i ,j}

},

a^∗₁= max{24, 31, 28, 27, 31} = 31 a^∗₂= max{28, 30, 34, 29, 30} = 34 a^∗₃= max{36, 28, 29, 33, 29} = 36

Żal, r

_{i ,j}

: dla decyzji d

_i

i scenariusza s

_j

jest różnicą pomiędzy najwyższą wypłatą tego scenariusza a wypłatą otrzymaną;

r

_{i ,j}

= a

^∗_j

− a

_{i ,j}

Macierz żalu R:

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29





 R =







31 − 24 34 − 28 36 − 36 31 − 31 34 − 30 36 − 28 31 − 28 34 − 34 36 − 29 31 − 27 34 − 29 36 − 33 31 − 31 34 − 30 36 − 29







=







7 6 0

0 4 8

3 0 7

4 5 3

0 4 7







(11)

kryterium Savage’a

Kryterium Savage’a:

wyznaczamy R macierz żalu

dla każdej decyzji d

_i

wyznaczamy maksymalną wartość żalu r

i

= max

_{j ∈S}

{r

_{i ,j}

},

wybieramy decyzję o minimalnej wartości r

i

, r

^∗

= min

_{i ∈D}

{r

_i

}.

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29





 R =







7 6 0

0 4 8

3 0 7

4 5 3

0 4 7







r1= max{7, 6, 0} = 7 r2= max{0, 4, 8} = 8 r3= max{3, 0, 7} = 7 r4= max{4, 5, 3} = 5 = r^∗ r5= max{0, 4, 7} = 7

Optymalną w sensie kryterium Savage’a jest decyzja d

4

.

(12)

Podejmowanie decyzji w

warunkach ryzyka

(13)

przykład

Należy podjąć decyzję o wyborze zboża do zasiania Zysk zależy od podjętej decyzji i warunków pogodowych Znane są prawdopodobieństwa wystąpienia stanów

decyzja

warunki pogodowe

s1: susza s2: normalna s3: deszcze P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

d1: zboże 1 24 28 36

d2: zboże 2 31 30 28

d3: zboże 3 28 34 29

d4: zboże 4 27 29 33

d5: zboże 5 31 30 29

(14)

kryteria wyboru decyzji

Kryterium wyboru decyzji:

Laplac’a: kryterium maksymalnej oczekiwanej wartości,

kryterium minimalnego oczekiwanego żalu.

(15)

kryterium Laplace’a

Kryterium Laplace’a:

dla każdej decyzji d

_i

wyznaczamy oczekiwaną wartość zysku;

E

_i

= ^P

_{j ∈S}

P(s

_j

)a

_{i ,j}

,

wybieramy decyzję o największej wartości E

_i

, E

^∗

= max

i ∈D

{E

_i

}.

P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29







E1= 0.15 · 24 + 0.50 · 28 + 0.35 · 36 = 30.20 E2= 0.15 · 31 + 0.50 · 30 + 0.35 · 28 = 29.45 E3= 0.15 · 28 + 0.50 · 34 + 0.35 · 29 = 31.35 = E^∗ E4= 0.15 · 27 + 0.50 · 29 + 0.35 · 33 = 30.10 E5= 0.15 · 31 + 0.50 · 30 + 0.35 · 29 = 29.80

Optymalną, w sensie Laplace’a, jest decyzja d

₃

.

(16)

kryterium minimalnego oczekiwanego żalu

Kryterium minimalnego oczekiwanego żalu:

wyznaczamy R macierz żalu,

dla każdej decyzji d

_i

wyznaczamy oczekiwaną wartość żalu;

Z

i

= ^P

_{j ∈S}

P(s

j

)r

i ,j

,

wybieramy decyzję o najmniejszej wartości Z

_i

, Z

^∗

= min

i ∈D

{Z

_i

}.

P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

R =







7 6 0

0 4 8

3 0 7

4 5 3

0 4 7







Z1= 0.15 · 7 + 0.50 · 6 + 0.35 · 0 = 4.05 Z2= 0.15 · 0 + 0.50 · 4 + 0.35 · 8 = 4.80 Z3= 0.15 · 3 + 0.50 · 0 + 0.35 · 7 = 2.90 = Z^∗ Z4= 0.15 · 4 + 0.50 · 5 + 0.35 · 3 = 4.14 Z5= 0.15 · 0 + 0.50 · 4 + 0.35 · 7 = 4.45

Optymalną, w sensie min. oczekiwanego żalu, jest decyzja d

3

.

(17)

Podejmowanie decyzji z wykorzystaniem

dodatkowej informacji

(18)

informacja doskonała

Informacja doskonała: to wiedza o przyszłym stanie natury przed podjęciem decyzji.

Największą wypłatę dla scenariusza s

_j

oznaczamy:

a

^∗_j

= max

i ∈D

{a

_{i ,j}

}

Wartość oczekiwana wypłaty dla informacji doskonałej to:

E

^ID

= ^X

j ∈S

P(j ) · a

^∗_j

(19)

informacja doskonała

Dane wejściowe:

P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29







Największe wypłaty dla scenariuszy:

a^∗₁= max{24, 31, 28, 27, 31} = 31 a^∗₂= max{28, 30, 34, 29, 30} = 34 a^∗₃= max{36, 28, 29, 33, 29} = 36

Wartość oczekiwana wypłaty dla informacji doskonałej to:

E^ID=

P

j ∈SP(sj) · a^∗_j = 0.15 · 31 + 0.50 · 34 + 0.35 · 36 = 34.25

(20)

informacja doskonała

Cena graniczna doskonałej informacji to maksymalna kwota, jaką warto zainwestować w dodatkowe badanie pozwalające poznanie przyszłego zachowania się natury.

Jest ona różnicą pomiędzy wartościami oczekiwanymi wypłatami przy posiadaniu informacji doskonałej i bez niej:

CG = E

^ID

− E

^∗

.

Wartość CG jest równa minimalnemu oczekiwanemu żalowi Z

^∗

, CG = Z

^∗

.

CG = 34.25 − 31.35 = 2.90

(21)

prawdopodobieństwa a posteriori

Na stan natury ma wpływ pewien parametr, który może przyjmować wartości: I

₁

, I

₂

, . . . , I

_K

.

W wyniku dodatkowych badań szacuje się prawdopodobieństwo: P(I

k

|s

_j

).

Celem analizy jest wyznaczenie prawdopodobieństw P(s

_j

|I

_k

), czyli prawdopodobieństw zaistnienia scenariusza s

j

pod warunkiem zajścia czynnika I

_k

.

P(s

_j

|I

_k

) = P(I

_k

|s

_j

)P(s

_j

) P

i ∈S

P(I

_k

|s

_i

)P(s

_i

)

(22)

przykład

Prawdopodobieństwo P(I

k

|s

j

):

czynnik

warunki pogodowe

s

₁

: susza s

₂

: normalna s

₃

: deszcze

P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

I

1

10% 30% 50%

I

2

40% 50% 25%

I

3

50% 20% 25%

Co można powiedzieć o prawdopodobieństwie poszczególnych

scenariuszy, gdy znana jest czynnik?

(23)

obliczenie prawdopodobieństw a posteriori

Obliczenie prawdopodobieństw warunkowych P(s

_j

|I

_k

):

sj s1 s2 s3 suma

P(sj) 0.150 0.500 0.500 1.000

P(I1|s_j) 0.100 0.300 0.500 -

P(I1)·P(sj) 0.15·0.10 = 0.015 0.50·0.30 = 0.150 0.35·0.50 = 0.175 0.340 P(sj|I₁) 0.015/0.34=0.044 0.150/0.34=0.441 0.175/0.34=0.515 1.000

P(I2|s_j) 0.400 0.500 0.250 -

P(I2)·P(sj) 0.15·0.40 = 0.060 0.50·0.50 = 0.250 0.35·0.25 = 0.088 0.398 P(sj|I₂) 0.060/0.398=0.151 0.250/0.398=0.629 0.088/0.398=0.220 1.000

P(I3|s_j) 0.500 0.200 0.250 -

P(I3)·P(sj) 0.15·0.50 = 0.075 0.50·0.20 = 0.100 0.35·0.25 = 0.088 0.263 P(sj|I3) 0.075/0.263=0.286 0.100/0.263=0.381 0.088/0.263=0.333 1.000

Prawdopodobieństwo P(s

_j

|I

_k

):

czynnik

warunki pogodowe

s1susza s2normalna s3deszcze

I1 4.4% 44.1% 51.5%

I2 15.1% 62.9% 22.0%

I3 28.6% 38.1% 33.3%

(24)

wykorzystanie dodatkowej wiedzy

Wyznaczenie decyzji przy wykorzystaniu dodatkowej wiedzy dla każdego czynnika I

_k

należy prawdopodobieństwa a priori P(s

j

) zastąpić prawdopodobieństwami a posteriori P(s

j

|I

_k

).

dla każdej decyzji d

_i

wyznaczamy oczekiwaną wartość zysku;

E

_{i |I}_k

= ^P

_{j ∈S}

P(s

j

|I

_k

) · a

i ,j

, wartość oczekiwanej wypłaty to:

E

_I^∗

k

= max

i ∈D

{E

_{i |I}_k

}

(25)

decyzja dla wystąpienia czynnika I ₁

Prawdopodobieństwo P(I

_k

|s

_j

):

czynnik warunki pogodowe

s1 s2 s3

I1 4.4% 44.1% 51.5%

I2 15.1% 62.9% 22.0%

I3 28.6% 38.1% 33.3%

Obliczenie decyzji Laplace’a dla wystąpienia czynnika I

₁

:

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29







E_1|I₁= 0.044·24 + 0.441·28 + 0.514·36 = 31.94 = E_I^∗ E_2|I₁= 0.044·31 + 0.441·30 + 0.514·28 = 29.01 1

E_3|I₁= 0.044·28 + 0.441·34 + 0.514·29 = 31.16 E_4|I₁= 0.044·27 + 0.441·29 + 0.514·33 = 30.97 E_5|I₁= 0.044·31 + 0.441·30 + 0.514·29 = 29.52

Optymalna decyzją Laplac’a dla wystąpienie czynnika I

1

jest d 1

(26)

decyzja dla wystąpienia czynnika I ₂

Prawdopodobieństwo P(I

_k

|s

_j

):

s1 s2 s3

I1 4.4% 44.1% 51.5%

I2 15.1% 62.9% 22.0%

I3 28.6% 38.1% 33.3%

Obliczenie decyzji Laplace’a dla wystąpienia czynnika I

₂

:

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29







E_1|I₁= 0.151·24 + 0.629·28 + 0.220·36 = 29.16 E_2|I₁= 0.151·31 + 0.629·30 + 0.220·28 = 29.71 E_3|I₁= 0.151·28 + 0.629·34 + 0.220·29 = 31.99 = E_I^∗

2

E_4|I₁= 0.151·27 + 0.629·29 + 0.220·33 = 29.58 E_5|I₁= 0.151·31 + 0.629·30 + 0.220·29 = 29.93

Optymalna decyzją Laplac’a dla wystąpienie czynnika I

2

jest d 3

(27)

decyzja dla wystąpienia czynnika I ₃

Prawdopodobieństwo P(I

_k

|s

_j

):

s1 s2 s3

I1 4.4% 44.1% 51.5%

I2 15.1% 62.9% 22.0%

I3 28.6% 38.1% 33.3%

Obliczenie decyzji Laplace’a dla wystąpienia czynnika I

₃

:

A =







24 28 36 31 30 28 28 34 29 27 29 33 31 30 29







E_1|I₁= 0.286·24 + 0.381·28 + 0.333·36 = 29.52 E_2|I₁= 0.286·31 + 0.381·30 + 0.333·28 = 29.61 E_3|I₁= 0.286·28 + 0.381·34 + 0.333·29 = 30.61 = E_I^∗

3

E_4|I₁= 0.286·27 + 0.381·29 + 0.333·33 = 29.76 E_5|I₁= 0.286·31 + 0.381·30 + 0.333·29 = 29.95

Optymalna decyzją Laplac’a dla wystąpienie czynnika I

3

jest d 3

(28)

oczekiwana wartość wypłaty z dodatkową wiedzą

Oczekiwana wartość wypłaty z dodatkową informacją wynosi:

E

^INFO

=

K

X

k=1

P(I

_k

) · E

_I^∗_k

P(I1) = 0.340 E_I^∗

1= 31.94 P(I2) = 0.398 E_I^∗

2= 31.99 P(I3) = 0.362 E_I^∗

3= 30.62

E^INFO= 0.340 · 31.94 + 0.398 · 31.99 + 0.362 · 30.62 = 31.615

(29)

oczekiwana wartość dodatkowej informacji

OWDI: oczekiwana wartość dodatkowej informacji jest różnicą pomiędzy oczekiwaną wartością wypłaty z i bez dodatkowej informacji:

OWDI = E

^INFO

− E

^∗

OWDI = 31.615 − 31.35 = 0.265

EDI efektywność dodatkowej informacji jest stosunkiem wartości oczekiwanej dodatkowej informacji do wartości oczekiwanej informacji doskonałej (ceny granicznej).

EDI = OWDI /CG

EDI = 0.265/2.90 = 9.14%

(30)

Dziękuję za uwagę