• Nie Znaleziono Wyników

W celu opisania rozważanej gry posłużymy się pewnym przykładem

N/A
N/A
Protected

Academic year: 2021

Share "W celu opisania rozważanej gry posłużymy się pewnym przykładem"

Copied!
6
0
0

Pełen tekst

(1)

ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA XVII (1981)

ANTONI STYSZYŃSKI (Wrocław)

Gra antagonistyczna o losowym okresie trwania

(Praca przyjęta do druku 15.02.1979)

1. Wstęp i opis modelu gry. W pracy [l] rozważa się pewien model gry antagonis- tycznej związanej z ciągiem zmiennych losowych niezależnych, prz)jmujących wartości O i l. Celem niniejszej pracy jest znalezienie rozwiązania dla wersji z czasem

ciągłym modelu gry z [1]. Zakłada się, że czas przebywania w stanie l jest zmienną losową o znanej dystrybuancie F( t), t ~ O. Zmodyfikowana gra jest grą na produkcie (O, co) x [O, co) z nieciągłą funkcją wypłaty. Stosując metodę dodatnich transformacji

całkowych rozwiniętą przez Karlina [2] dla gier czasowych uzyskujemy postać strategii optymalnych w rozważanej grze.

W celu opisania rozważanej gry posłużymy się pewnym przykładem. Załóżmy, że dwaj producenci tego samego towaru sprzedają swoje produkty temu samemu nabywcy, który ma prawo, biorąc pod uwagę sytuację na rynku, odmówić przyjęcia

towaru w losowym momencie czasu. Przed przystąpieniem do gry obaj gracze w sposób niezależny ustalają okresy trwania produkcji i zaopatrują się w odpowiednie ilości materiału. Każdy z producentów stara się produkować dłużej niż jego prze- ciwnik, unikając jednak wystąpienia nadmiaru nie wykorzystanego materiału. Niech x, y e [0, co) będą momentami przerwania produkcji odpowiednio przez pierwszego i drugiego gracza. Rozważmy zmienną losową T (moment odmowy zakupu) określoną na przestrzeni probabilistycznej (.Q, g;, P) o wartościach w [0, co) i dystrybuancie F( t), t > O. Wypłatą dla gracza pierwszego jest zmienna losowa okreśiona na (.Q, !F, P) następującym wzorem:

lft · X{T>x}(w)-e · X<Y<T<x}(w), Jf'xy(w) = (ft -e)· X{T>x}(w),

ft · Xtx<T<y}(w)-eX{T>y}(w), gdzie X.t( ·)jest funkcją charakterystyczną zbioru A.

gdy X> y, gdy X= y, gdy X< y,

Dla przykładu omówimy przypadek x > y. Jeśli odmowa zakupu nastąpiła póź1iej niż planowa1y przez gracza I okres produkcji, to gracz I uzyskuje wartość p,, gdyż produkował dłużej niż przeciwnik. Jeśli odmowa miała miejsce przed plano- wanym zakończeniem produkcji, to gracz I traci wartość e z powodu nie wyko- rzystanych zapasów.

3 Matematyka Stosowana nr 17 (33]

(2)

Uzasadnienie wypłaty w przypadkach x = y i x < y jest analogiczne. Łatwo

zauważyć, że czas trwania gry jest zmienną losową T= min[T, max(x, y)].

Nietrudno jest ustalić postać normalną rozważanej gry. Przestrzeniami strategii czystych graczy są półosie dodatnie X i Y, a funkcja wypłaty M(x, y), x EX, y E Y, ma następującą postać:

{

-(p.+e)F(x)+eF(y)+p., gdy x > y, M(x, y) = (p.-e)[l-F(x)], gdy x = y, (}t+e)F(y)-p.F(x)-e, gdy x < y.

(l. l)

Dla przykładu wyprowadzimy postać M(x, y), gdy O :s;; y < x < oo.

Otrzymujemy

M(x,y) = p.P{T > x}-eP{y <T :s;; .x} =

= p.[l-F(x)]-e[F(x)-F(y)] = -{lt+e)F(x)+eF(y)+p..

W następnym paragrafie udowodnimy twierdzenie o istnieniu i formie anali- tycznej mieszanych strategii optymalnych w grze (X, Y, M). Paragraf trzeci zawiera dwa przykłady liczbowe omawianej gry. Model przedstawiony w niniejszej pracy jest

dość prosty. Stosując metodę Karlina można rozważyć przypadek, gdy p.= p.(x) oraz e = e(Y) są różniczkowalnymi funkcjami monotonicznymi.

2. Strategie optymalne. W niniejszym paragrafie udowodnimy następujące TWIERDZENIE. Jeśli istnieje gęstość dystrybuanty F( t) oraz F( t) E (0, l) dla każdego t > O, to gra (X, Y, M) ma wartość

(2.1) V = {rt.p.,

-{Je,

gdy fJ =o,

gdy a= O,

a jedynymi optymalnymi strategiami graczy I i II są rozkłady wyznaczone odpowiednio przez dystrybuanty

(2.2)'

(2.2)"

{_g_ {[I + a.p,fe] [l - F(x)]-P!<PH> -l}, K(x) = P.

l,

{Ł {[I+ ,Be/p.][l-F(y)]-(1'<"+11> -l}, L(y)= e

l,

Parametry a, a. i fJ określone są następująco:

(2.3) a = min (a', a"),

gdzie a' i a" pierwiastkami równań

X E [0, a], x >a, yE[O,a], Y> a.

(2.4) (2.5)

[1-F(a')]-PI<PH> = p.+e ,

e [1-F(a")]-(I/<P+~~> = p.+ e

p. ' ex = lim K(x), fJ = lim L(y).

x .... o+ y .... o+

(3)

Gra antagonistyczna o losowym okresie trwania

D o w ó d. Wprowadzimy klasę f/ dystrybuant na [O, oo) postaci:

(2.6) S(x) =l"'+ Is(u)du,

l,

X E [0, a], x >a, gdzie s(x) >O, a> O i a ! o s(u)du = l-a, a e [0, l].

Zdefiniujemy równiez dwie funkcje pomocnicze:

00

<p(y) = ~ M(x,y)dK(x), K e f/, y e Y,

(2.7) 00 o

1p(x) = ~ M(x,y)dL(y), L ef/,x eX.

o

35

W pierwszej kolejności wykażemy, że istnieje para strategii (K, L) e f/ xf/ stano-

wiąca parę odpowiadających sobie strategii wyrównujących [2], tzn. spełniających

warunki:

(2.8) <p(y) = v1 y e (0, a], '/'(X) = V 2 , X E (0, a]

dla pewnych stałych v1 i v2 •

Z łatwością znajdujemy wyrażenia dla funkcji <p{y) i 'l'(x). Korzystając z równości (1.1) otrzymujemy

(2.9) <p{y) =

Q

ctm(O)+ ~ M1(x, O)k(x)dx, gdy y =O,

o

Y Q

cxM2(0,y)+ ~M2(x,y)k(x)dx+ ~M1(x,y)k(x)dx, gdy ye(O,a]

O Y

a

ctM2(0, y)+ ~ M2(x, y)k(x)dx, gdy y > a, oraz o

(2.10) 1J'(X) =

a

Pm(O) + ~ M2(0, y)l(y)dy, gdy x =O, o

% ..

PM1(x, 0)+ ~ M1(x,y)l(y)dy+! M2(x,y)/(y)dy, gdy x e (0, a],

o %

PM1(x,0)+ a ~M1(x,y)l(y)dy, gdy x >a,

o

(4)

gdzie

(2.11)

M1(x,y) = -tu+e)F(x)+eF(y)+p, m(x) = (}'-e)[l-F(x)],

Mz(x, y) = (f.'+e)F(y) -pF(x) -e.

Wobec istnieniagęstości dystrybuanty F(t) warunki (2.8) są równoważne warunkom:

<p'{y) = 0 gdy y E (0, a], tp'(x) = O dla x E (0, a].

(2.12)

Korzystając z równości (2.9) i (2.10) otrzymujemy pochodne dla x, y E (0, a]

<p'(y) = J(y),uK(y)+ef(y)-(f.'+e)[t-F(y)Jk(y), tp'(x) = -f(x)eL(x) -pf(x)+ <P+e)[l-F(x)]l(x).l

i'.ądając spełnienia warunków (2.12) otrzymujemy następujące równania całkowe:

-J(y) p+e ,uk(y)

1-F(y) = --~~-. pK(y)+e, Y E (0, a]' - f(x) ,u+ e el(x)

1-F(x) = --e-. eL(x)+p ' X E (O, a]' (2.13)

z warunkami brzegowymi K(O) = ex, L( O) = p.

Biorąc pod uwagę założenie twierdzenia, F( t) E (0, l) dla t> O, zauważamy, że rozwiązaniem równań (2.13) są ciągłe funkcje rosnące

Ka(y) =! {[l+cx,u/e][l-F{y)]-"'<~H'.-1}, yE [O, a], L11(x) = _!!.._ {[l +{Je/ ,u] [l - F(x)]-fi<PH> -l}, x E [O, a].

e

Rozwiązanie to jest jedyne. Niech a' i a" będą pierwiastkami, odpowiednio

równań K0(d) = l i L0(a") = l. Dla każdego a ~ min(a', a") dystrybuanty K11(x) i L11(Y) określone równościami

Ka(x) = {Ka.(x), gdy x E [0, a],

l, gdy x >a,

La(y) = {Lp(y), gdy y E [0, a], l, gdy y >a (2.14)

stanowią parę odpowiadających sobie strategii wyrównujących będących elementami klasy 9'.

Obecnie znajdziemy wśród par strategii wyrównujących parę strategii optymal·

nych. Wykażemy, że jeśli parametr a spełnia warunek (2.3), to pa~~ strategii (K11 , Lj jest parą strategii optymalnych w grze (X, Y, M) . .Jeśli spełniony jest warunek (2.3), to

Dil aa

~ ~ M(x, y)dKa(x)dLa(y) = ~ ~ M(x, y)dLa(y)dKa(X)

00 00

(5)

Gra antagonistyczna o losowym okresie trwania 37 oraz stałe v1 i v2 w równościach (2.8) takie same. Ponadto, stałe ex i {3 wyznacza-

jące skoki dystrybuant Ka i La w punkcie t = O Spełniają warunek (2.15)

W dalszym ciągu rozważania ograniczymy do przypadku ex~ O, {3 =O. Przypadek ex= O, {3 >O może być traktowany podobnie. Zauważmy, że wobec (2.2)' dla dystrybuanty Ka

(2.16) lim lp(y) = lp(O)-r1.p,, lp'(y) > O dla y > a.

y-.O+

Podobnie, korzystając z (2.2)" dla dystrybuanty La

(2.17) lim'P(x) = 1p(O) = v, tp'(x) <O dla x > a.

,x--.0+

Stąd, dla wszystkich x, y E [O, oo) zachodzi nierówność

(2.18) 'P(x) ~ v ~ lp(y),

co dowodzi optymalności strategii Ka i La dla a = min(a', a"). Warto zauważyć,

że p(a) ~ v i 'P(a) = v, co odpowiada przyjętemu założeniu ex~ O i {3 =O. Oczy-

wiście, dla a = min(a', a") dystrybuanty (2.14) mają postać (2.2)' i (2.2)" podaną w twierdzeniu; liczby a' i a" spełniają warunki (2.4). Jednoznaczność wyznaczonych strategii wynika z warunku koniecznego optymalności, jakim jest wyrównywalność

strategii i jednoznaczności rozwiązań równań całkowych (2.13). Pozostaje znaleźć

wyrażenie na wartość gry v. Korzystając z (2.9) obliczamy dla r1. ~O, {3 =O

a

v = limlfJ(x) = -exe+ ~ [p,-(,u+e)F(x)]k(.x)dx =

.x-.o+ o

-e+e(l +ex,ufe) ~ Q [1-F(x)]-Pf<P+(!>J(x)dx = o

= -e+e(l +ex,ufe) "';e {1-[1-F(a)]-(!/<PH>} = r1.p,

co pokrywa się z pierwszą równością w (2.1). Analogicznie, korzystając z (2.10) otrzymujemy dla ex = O, {3 ~ O

"

v = lim 1p(y) = P,u+ ~ [-e+ (,u+e)F(y)]l(y) dy =

y--.0+ o

= p,-p.(1 +{Je/p,) JJ;e {1-[1-F{a)]-P/<PH>}-{Je, co odpowiada drugiej równości w (2.1).

Znając optymalną wartość parametru a obliczoną ze wzoru (2.3) z łatwością

znajdujemy wartości parametrów ex i {3 według wzorów (2.5).

(6)

3. Przykłady liczbowe.

PRZYKŁAD l. Załóżmy, że p,= e= l i F(x) = 1-e-.tx (A.> 0). Wówczas a' = a"= a = ! ln4, ex = fJ = O, a z równości (2.2)' i (2.2)" otrzymujemy oraz

K(x) = Ie l, ~ -1, gdy x gdy x e [O, a),

~a,

L(y) = Ie J.: -1, gdy y e [O, a),

l, gdy y~ a.

Wartość gry równa jest zero. Warto zauważyć, że a jest większe od wartości oczeki- wanej dystrybuanty F.

PRZYKŁAD 2. Niech p, = 2, e = l i F(x) = 1-e-.tx (A. > 0). Rozwiązując

. (2 . 3ln3 " 3Inj S d 3Inj fJ 0 . 1

równan1a A) otrzymujemy a' =-u, a =-A.-. a =-A.-' = 1 ex=

Równości (2.2)' i (2.2)" mają tutaj postać

oraz

K(x) = lł(je 2;:.; -1), gdy x e [0, a],

l, gdy x >a,

L(y) = 12(e J.: -l),

l, gdy Y gdy y E ~a. (0, a), Zauważmy, że F(a) = 19/27 i z równości (2.1) mamy v = 1/3.

Prace cytowane

[l] B. K • .U o M a H cK ą, O HeKomopwx wpax, C6R3aHHblX c nocAeooBame;zbHOcmbw EePHYAAu,

Tem. K:ą6., N!!!4, 1974.

[2] S. K a r l i n, Mathematical methods and theory in games, programming and economics, Pergamon Press, London 1959.

INSTYTUT MATEMATYCZNY POLITECHNIKI WROCLA WSKIE1

Cytaty

Powiązane dokumenty

Organizatorem gry miejskiej &#34;Wgraj się w Miasto Poezji” (zwanej dalej Grą), realizowanej na terenie miasta Lublin jest Ośrodek „Brama Grodzka-Teatr NN” oraz

Uczeń ten przedstawia się i rzuca kłębek do innego ucznia, trzymając nitkę w ręce.. Między uczniami powstaje

Uczniowie ustawieni w dwuszeregu, nauczyciel demonstruje ćwiczenia, stojąc przed uczniami: krążenia prawej ręki w przód, lewa kozłuje piłkę, krążenia lewej ręki w przód,

Wiara Marshala McLuhana w to, że poprzez poznanie gramatyki środków ma- sowego przekazu można zmienić moralne oblicze świata, to po prostu utopia bę- dąca przejawem

Proszę obejrzeć filmik, który zawiera gry i zabawy wykorzystywane do doskonalenia umiejętności koszykarskich Proszę te zabawy obejrzeć, zapamiętać gdyż w przyszłości będziemy

Proszę obejrzeć filmik, który zawiera gry i zabawy wykorzystywane do doskonalenia umiejętności koszykarskich Proszę te zabawy obejrzeć, zapamiętać gdyż w przyszłości będziemy

Ułóż skrypt zielonej flagi dla sceny tak, aby najpierw pokazywała się plansza początkowa (tło tytuł), a dopiero potem rozpoczynała się gra (tło gra).. Do odczytania

Do czasu gry nie wlicza się przerw w grze, czyli kiedy piłka jest &#34;martwa&#34;(ten przepis można regulować tak jak długość czasu gry).. Okresy te są odliczane