• Nie Znaleziono Wyników

Elementy teorii podejmowania decyzji

N/A
N/A
Protected

Academic year: 2021

Share "Elementy teorii podejmowania decyzji"

Copied!
30
0
0

Pełen tekst

(1)

Elementy teorii podejmowania decyzji

dr inż. Mariusz Makuchowski

(2)

Podejmowanie decyzji w

warunkach niepewności

(3)

przykład

Należy podjąć decyzję o wyborze zboża do zasiania Zysk zależy od podjętej decyzji i warunków pogodowych

decyzja warunki pogodowe

s1: susza s2: normalna s3: deszcze

d1: zboże 1 24 28 36

d2: zboże 2 31 30 28

d3: zboże 3 28 34 29

d4: zboże 4 27 29 33

d5: zboże 5 31 30 29

(4)

oznaczenia

Oznaczenia:

D - zbiór decyzji D = {d

1

, d

2

, . . . , d

n

}, S - zbiór scenariuszy S = {s

1

, s

2

, . . . , s

m

},

A - macierz zysku, a

i ,j

jest zyskiem decyzji d

i

scenariusza s

j

.

Kryterium jest miarą oceny decyzji.

(5)

kryteria wyboru decyzji

Kryterium wyboru decyzji:

MaxMax: kryterium ryzykanta, optymisty,

Walda: kryterium MaxMin, asekuranta, pesymisty,

Hurwicza: ważone kryteria MaxMax i MaxMin,

Laplace’a: maksymalizacja oczekiwanego zysku,

Savage’a: minimalizacja makasymalnego żalu.

(6)

kryterium MaxMax

Kryterium MaxMax:

dla każdej decyzji d

i

wyznaczamy jej maksymalny zysk o

i

= max

j ∈S

{a

i ,j

},

wybieramy decyzję o maksymalnym o

i

, o

= max

i ∈D

{o

i

}.

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

o1= max{24, 28, 36} = 36 = o o2= max{31, 30, 28} = 31 o3= max{28, 34, 29} = 34 o4= max{27, 29, 33} = 33 o5= max{31, 30, 29} = 31

Optymalną w sensie kryterium MaxMax jest decyzja d

1

.

(7)

kryterium Walda

Kryterium Walda:

dla każdej decyzji d

i

wyznaczamy jej minimalny zysk p

i

= min

j ∈S

{a

i ,j

},

wybieramy decyzję o maksymalnym p

i

. p

= max

i ∈D

{p

i

}.

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

p1= min{24, 28, 36} = 24 p2= min{31, 30, 28} = 28 p3= min{28, 34, 29} = 28 p4= min{27, 29, 33} = 27 p5= min{31, 30, 29} = 29 = p

Optymalną w sensie kryterium Walda jest decyzja d

5

.

(8)

kryterium Hurwicza

Kryterium Hurwicza:

wybieramy λ ∈ (0, 1) skłonność do ryzyka; λ = 0.1.

dla każdej decyzji d

i

wyznaczamy jej ważony zysk h

i

(λ) = λo

i

+ (1 − λ)p

i

,

wybieramy decyzję o maksymalnym h

i

. h

(λ) = max

i ∈D

{h

i

(λ)}.

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

h1(0.1) = 0.1 · 36 + 0.9 · 24 = 25.2 h2(0.1) = 0.1 · 31 + 0.9 · 28 = 28.3 h3(0.1) = 0.1 · 34 + 0.9 · 28 = 28.6 h4(0.1) = 0.1 · 33 + 0.9 · 27 = 27.6

h5(0.1) = 0.1 · 31 + 0.9 · 29 = 29.2 = h(0.1)

Optymalną w sensie kryterium Hurwicza ze skłonnością do ryzyka

na poziomie λ = 0.1 jest decyzja d

5

.

(9)

kryterium Laplace’a

Kryterium Laplace’a:

dla każdej decyzji d

i

wyznaczamy wartość oczekiwaną zysku l

i

= 1/m P

j ∈S

a

i ,j

,

wybieramy decyzję o maksymalnej wartości oczekiwanej l

i

. l

= max

i ∈D

{l

i

}.

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

l1= (24 + 28 + 36)/3 = 29.3 l2= (31 + 30 + 28)/3 = 29.6 l3= (28 + 34 + 29)/3 = 30.3 = l l4= (27 + 29 + 33)/3 = 29.6 l5= (31 + 30 + 29)/3 = 30.0

Optymalną w sensie kryterium Laplace’a jest decyzja d

3

.

(10)

kryterium Savage’a

Największą wypłatę dla scenariusza s

j

oznaczamy:

a

j

= max

i ∈D

{a

i ,j

},

a1= max{24, 31, 28, 27, 31} = 31 a2= max{28, 30, 34, 29, 30} = 34 a3= max{36, 28, 29, 33, 29} = 36

Żal, r

i ,j

: dla decyzji d

i

i scenariusza s

j

jest różnicą pomiędzy najwyższą wypłatą tego scenariusza a wypłatą otrzymaną;

r

i ,j

= a

j

− a

i ,j

Macierz żalu R:

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

 R =

31 − 24 34 − 28 36 − 36 31 − 31 34 − 30 36 − 28 31 − 28 34 − 34 36 − 29 31 − 27 34 − 29 36 − 33 31 − 31 34 − 30 36 − 29

=

7 6 0

0 4 8

3 0 7

4 5 3

0 4 7

(11)

kryterium Savage’a

Kryterium Savage’a:

wyznaczamy R macierz żalu

dla każdej decyzji d

i

wyznaczamy maksymalną wartość żalu r

i

= max

j ∈S

{r

i ,j

},

wybieramy decyzję o minimalnej wartości r

i

, r

= min

i ∈D

{r

i

}.

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

 R =

7 6 0

0 4 8

3 0 7

4 5 3

0 4 7

r1= max{7, 6, 0} = 7 r2= max{0, 4, 8} = 8 r3= max{3, 0, 7} = 7 r4= max{4, 5, 3} = 5 = r r5= max{0, 4, 7} = 7

Optymalną w sensie kryterium Savage’a jest decyzja d

4

.

(12)

Podejmowanie decyzji w

warunkach ryzyka

(13)

przykład

Należy podjąć decyzję o wyborze zboża do zasiania Zysk zależy od podjętej decyzji i warunków pogodowych Znane są prawdopodobieństwa wystąpienia stanów

decyzja

warunki pogodowe

s1: susza s2: normalna s3: deszcze P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

d1: zboże 1 24 28 36

d2: zboże 2 31 30 28

d3: zboże 3 28 34 29

d4: zboże 4 27 29 33

d5: zboże 5 31 30 29

(14)

kryteria wyboru decyzji

Kryterium wyboru decyzji:

Laplac’a: kryterium maksymalnej oczekiwanej wartości,

kryterium minimalnego oczekiwanego żalu.

(15)

kryterium Laplace’a

Kryterium Laplace’a:

dla każdej decyzji d

i

wyznaczamy oczekiwaną wartość zysku;

E

i

= P

j ∈S

P(s

j

)a

i ,j

,

wybieramy decyzję o największej wartości E

i

, E

= max

i ∈D

{E

i

}.

P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

E1= 0.15 · 24 + 0.50 · 28 + 0.35 · 36 = 30.20 E2= 0.15 · 31 + 0.50 · 30 + 0.35 · 28 = 29.45 E3= 0.15 · 28 + 0.50 · 34 + 0.35 · 29 = 31.35 = E E4= 0.15 · 27 + 0.50 · 29 + 0.35 · 33 = 30.10 E5= 0.15 · 31 + 0.50 · 30 + 0.35 · 29 = 29.80

Optymalną, w sensie Laplace’a, jest decyzja d

3

.

(16)

kryterium minimalnego oczekiwanego żalu

Kryterium minimalnego oczekiwanego żalu:

wyznaczamy R macierz żalu,

dla każdej decyzji d

i

wyznaczamy oczekiwaną wartość żalu;

Z

i

= P

j ∈S

P(s

j

)r

i ,j

,

wybieramy decyzję o najmniejszej wartości Z

i

, Z

= min

i ∈D

{Z

i

}.

P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

R =

7 6 0

0 4 8

3 0 7

4 5 3

0 4 7

Z1= 0.15 · 7 + 0.50 · 6 + 0.35 · 0 = 4.05 Z2= 0.15 · 0 + 0.50 · 4 + 0.35 · 8 = 4.80 Z3= 0.15 · 3 + 0.50 · 0 + 0.35 · 7 = 2.90 = Z Z4= 0.15 · 4 + 0.50 · 5 + 0.35 · 3 = 4.14 Z5= 0.15 · 0 + 0.50 · 4 + 0.35 · 7 = 4.45

Optymalną, w sensie min. oczekiwanego żalu, jest decyzja d

3

.

(17)

Podejmowanie decyzji z wykorzystaniem

dodatkowej informacji

(18)

informacja doskonała

Informacja doskonała: to wiedza o przyszłym stanie natury przed podjęciem decyzji.

Największą wypłatę dla scenariusza s

j

oznaczamy:

a

j

= max

i ∈D

{a

i ,j

}

Wartość oczekiwana wypłaty dla informacji doskonałej to:

E

ID

= X

j ∈S

P(j ) · a

j

(19)

informacja doskonała

Dane wejściowe:

P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

Największe wypłaty dla scenariuszy:

a1= max{24, 31, 28, 27, 31} = 31 a2= max{28, 30, 34, 29, 30} = 34 a3= max{36, 28, 29, 33, 29} = 36

Wartość oczekiwana wypłaty dla informacji doskonałej to:

EID=

P

j ∈SP(sj) · aj = 0.15 · 31 + 0.50 · 34 + 0.35 · 36 = 34.25

(20)

informacja doskonała

Cena graniczna doskonałej informacji to maksymalna kwota, jaką warto zainwestować w dodatkowe badanie pozwalające poznanie przyszłego zachowania się natury.

Jest ona różnicą pomiędzy wartościami oczekiwanymi wypłatami przy posiadaniu informacji doskonałej i bez niej:

CG = E

ID

− E

.

Wartość CG jest równa minimalnemu oczekiwanemu żalowi Z

, CG = Z

.

CG = 34.25 − 31.35 = 2.90

(21)

prawdopodobieństwa a posteriori

Na stan natury ma wpływ pewien parametr, który może przyjmować wartości: I

1

, I

2

, . . . , I

K

.

W wyniku dodatkowych badań szacuje się prawdopodobieństwo: P(I

k

|s

j

).

Celem analizy jest wyznaczenie prawdopodobieństw P(s

j

|I

k

), czyli prawdopodobieństw zaistnienia scenariusza s

j

pod warunkiem zajścia czynnika I

k

.

P(s

j

|I

k

) = P(I

k

|s

j

)P(s

j

) P

i ∈S

P(I

k

|s

i

)P(s

i

)

(22)

przykład

Prawdopodobieństwo P(I

k

|s

j

):

czynnik

warunki pogodowe

s

1

: susza s

2

: normalna s

3

: deszcze

P(s1) = 0.15 P(s2) = 0.50 P(s3) = 0.35

I

1

10% 30% 50%

I

2

40% 50% 25%

I

3

50% 20% 25%

Co można powiedzieć o prawdopodobieństwie poszczególnych

scenariuszy, gdy znana jest czynnik?

(23)

obliczenie prawdopodobieństw a posteriori

Obliczenie prawdopodobieństw warunkowych P(s

j

|I

k

):

sj s1 s2 s3 suma

P(sj) 0.150 0.500 0.500 1.000

P(I1|sj) 0.100 0.300 0.500 -

P(I1)·P(sj) 0.15·0.10 = 0.015 0.50·0.30 = 0.150 0.35·0.50 = 0.175 0.340 P(sj|I1) 0.015/0.34=0.044 0.150/0.34=0.441 0.175/0.34=0.515 1.000

P(I2|sj) 0.400 0.500 0.250 -

P(I2)·P(sj) 0.15·0.40 = 0.060 0.50·0.50 = 0.250 0.35·0.25 = 0.088 0.398 P(sj|I2) 0.060/0.398=0.151 0.250/0.398=0.629 0.088/0.398=0.220 1.000

P(I3|sj) 0.500 0.200 0.250 -

P(I3)·P(sj) 0.15·0.50 = 0.075 0.50·0.20 = 0.100 0.35·0.25 = 0.088 0.263 P(sj|I3) 0.075/0.263=0.286 0.100/0.263=0.381 0.088/0.263=0.333 1.000

Prawdopodobieństwo P(s

j

|I

k

):

czynnik

warunki pogodowe

s1susza s2normalna s3deszcze

I1 4.4% 44.1% 51.5%

I2 15.1% 62.9% 22.0%

I3 28.6% 38.1% 33.3%

(24)

wykorzystanie dodatkowej wiedzy

Wyznaczenie decyzji przy wykorzystaniu dodatkowej wiedzy dla każdego czynnika I

k

należy prawdopodobieństwa a priori P(s

j

) zastąpić prawdopodobieństwami a posteriori P(s

j

|I

k

).

dla każdej decyzji d

i

wyznaczamy oczekiwaną wartość zysku;

E

i |Ik

= P

j ∈S

P(s

j

|I

k

) · a

i ,j

, wartość oczekiwanej wypłaty to:

E

I

k

= max

i ∈D

{E

i |Ik

}

(25)

decyzja dla wystąpienia czynnika I 1

Prawdopodobieństwo P(I

k

|s

j

):

czynnik warunki pogodowe

s1 s2 s3

I1 4.4% 44.1% 51.5%

I2 15.1% 62.9% 22.0%

I3 28.6% 38.1% 33.3%

Obliczenie decyzji Laplace’a dla wystąpienia czynnika I

1

:

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

E1|I1= 0.044·24 + 0.441·28 + 0.514·36 = 31.94 = EI E2|I1= 0.044·31 + 0.441·30 + 0.514·28 = 29.01 1

E3|I1= 0.044·28 + 0.441·34 + 0.514·29 = 31.16 E4|I1= 0.044·27 + 0.441·29 + 0.514·33 = 30.97 E5|I1= 0.044·31 + 0.441·30 + 0.514·29 = 29.52

Optymalna decyzją Laplac’a dla wystąpienie czynnika I

1

jest d 1

(26)

decyzja dla wystąpienia czynnika I 2

Prawdopodobieństwo P(I

k

|s

j

):

czynnik warunki pogodowe

s1 s2 s3

I1 4.4% 44.1% 51.5%

I2 15.1% 62.9% 22.0%

I3 28.6% 38.1% 33.3%

Obliczenie decyzji Laplace’a dla wystąpienia czynnika I

2

:

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

E1|I1= 0.151·24 + 0.629·28 + 0.220·36 = 29.16 E2|I1= 0.151·31 + 0.629·30 + 0.220·28 = 29.71 E3|I1= 0.151·28 + 0.629·34 + 0.220·29 = 31.99 = EI

2

E4|I1= 0.151·27 + 0.629·29 + 0.220·33 = 29.58 E5|I1= 0.151·31 + 0.629·30 + 0.220·29 = 29.93

Optymalna decyzją Laplac’a dla wystąpienie czynnika I

2

jest d 3

(27)

decyzja dla wystąpienia czynnika I 3

Prawdopodobieństwo P(I

k

|s

j

):

czynnik warunki pogodowe

s1 s2 s3

I1 4.4% 44.1% 51.5%

I2 15.1% 62.9% 22.0%

I3 28.6% 38.1% 33.3%

Obliczenie decyzji Laplace’a dla wystąpienia czynnika I

3

:

A =

24 28 36 31 30 28 28 34 29 27 29 33 31 30 29

E1|I1= 0.286·24 + 0.381·28 + 0.333·36 = 29.52 E2|I1= 0.286·31 + 0.381·30 + 0.333·28 = 29.61 E3|I1= 0.286·28 + 0.381·34 + 0.333·29 = 30.61 = EI

3

E4|I1= 0.286·27 + 0.381·29 + 0.333·33 = 29.76 E5|I1= 0.286·31 + 0.381·30 + 0.333·29 = 29.95

Optymalna decyzją Laplac’a dla wystąpienie czynnika I

3

jest d 3

(28)

oczekiwana wartość wypłaty z dodatkową wiedzą

Oczekiwana wartość wypłaty z dodatkową informacją wynosi:

E

INFO

=

K

X

k=1

P(I

k

) · E

Ik

P(I1) = 0.340 EI

1= 31.94 P(I2) = 0.398 EI

2= 31.99 P(I3) = 0.362 EI

3= 30.62

EINFO= 0.340 · 31.94 + 0.398 · 31.99 + 0.362 · 30.62 = 31.615

(29)

oczekiwana wartość dodatkowej informacji

OWDI: oczekiwana wartość dodatkowej informacji jest różnicą pomiędzy oczekiwaną wartością wypłaty z i bez dodatkowej informacji:

OWDI = E

INFO

− E

OWDI = 31.615 − 31.35 = 0.265

EDI efektywność dodatkowej informacji jest stosunkiem wartości oczekiwanej dodatkowej informacji do wartości oczekiwanej informacji doskonałej (ceny granicznej).

EDI = OWDI /CG

EDI = 0.265/2.90 = 9.14%

(30)

Dziękuję za uwagę

Cytaty

Powiązane dokumenty

Warunki te dzielą się na deterministyczne, czyli te, które są pewne, za pomocą których można przewidzieć wszystkie konsekwencje podejmowanych decyzji, oraz

Analiza literatury 47 pozwala stwierdzić, że ocena wariantów i podjęcie decyzji stanowi niejako wynikową uprzednio realizowanych czynności, po- cząwszy od

Zarząd Generalny salezjanów zwrócił się do swoich współbraci z zachętą, by podjąć to zawołanie, nie było jednak specjalnego odzewu.. W tej sytuacji niektóre kraje

Kolejny tom „Studiów Prymasowskich” zawiera najpierw teksty wystąpień z V Konferencji naukowej zorganizowanej przez Ośrodek Dokumentacji i Stu- diów nad Osobą i

[r]

Rada Wydziału Prawa Kanonicznego UKSW przeprowadziła w roku akademi- ckim 2008/09 postępowanie nostryfikacyjne dotyczące uznania dyplomu licencja- ckiego ks. Il delitto di

Wynika to z faktu, że zmiana wartości parametru α powoduje zmianę warto- ści wag dotyczących wszystkich wypłat (a nie tylko skrajnych). 2) W obu przypadkach jest rekomendowany

Dla potrzeb niniejszej pracy przyjęto, że proces podejmowania decyzji składa się następujących faz: identyfikacja problemu decyzyjnego, rozwiązanie problemu decyzyjnego,