W celu opisania rozważanej gry posłużymy się pewnym przykładem

(1)

ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA XVII (1981)

ANTONI STYSZYŃSKI (Wrocław)

Gra antagonistyczna o losowym okresie trwania

(Praca przyjęta do druku 15.02.1979)

1. Wstęp i opis modelu gry. W pracy [l] rozważa się pewien model gry antagonis- tycznej ^związanejz ^ciągiemzmiennych losowych niezależnych, prz)jmujących wartości O i l. Celem niniejszej pracy jest znalezienie rozwiązania dla wersji z czasem

ciągłym modelu gry z [1]. Zakłada się, że czas przebywania w stanie l jest zmienną losową o znanej dystrybuancie F( t), t ^~O. Zmodyfikowana gra jest grą na produkcie (O, co) x [O, co) z nieciągłą funkcją wypłaty. Stosując metodę dodatnich transformacji

całkowych rozwiniętą przez Karlina [2] dla gier czasowych uzyskujemy ^postać strategii optymalnych w rozważanej grze.

W celu opisania rozważanej gry posłużymy się pewnym przykładem. Załóżmy, że dwaj producenci tego samego towaru sprzedają swoje produkty temu samemu nabywcy, który ma prawo, biorąc pod uwagę sytuację na rynku, odmówić przyjęcia

towaru w losowym momencie czasu. Przed przystąpieniem do gry obaj gracze w sposób niezależny ustalają okresy trwania produkcji i zaopatrują się w odpowiednie ilości materiału. Każdy z producentów stara się produkować dłużej niż jego przeciwnik, unikając jednak wystąpienia nadmiaru nie wykorzystanego materiału. Niech x, y e [0, co) będą momentami przerwania produkcji odpowiednio przez pierwszego i drugiego gracza. Rozważmy zmienną losową T (moment odmowy zakupu) określoną na przestrzeni probabilistycznej (.Q, g;, P) o wartościach w [0, co) i dystrybuancie F( t), t > O. Wypłatą dla gracza pierwszego jest zmienna losowa okreśiona na (.Q, !F, P) następującym wzorem:

lft · X{T>x}(w)-e · X<Y<T<x}(w), Jf'xy(w) = (ft -e)· X{T>x}(w),

ft · Xtx<T<y}(w)-eX{T>y}(w), gdzie X.t( ·)jest funkcją charakterystyczną zbioru A.

gdy X> y, gdy X= y, gdy X< y,

Dla przykładu omówimy przypadek x > y. Jeśli odmowa zakupu nastąpiła póź1iej niż planowa1y przez gracza I okres produkcji, to gracz I uzyskuje ^wartośćp,, gdyż produkował dłużej niż przeciwnik. Jeśli odmowa miała miejsce przed plano- wanym zakończeniem produkcji, to gracz I traci ^wartośće z powodu nie wyko- rzystanych zapasów.

3 Matematyka Stosowana nr 17 (33]

(2)

Uzasadnienie ^wypłatyw przypadkach x = ^{y i}^x^<y jest analogiczne. ^Łatwo

zauważyć, że czas trwania gry jest zmienną losową T= min[T, max(x, y)].

Nietrudno jest ustalić postać normalną rozważanej gry. Przestrzeniami strategii czystych graczy są półosie dodatnie X i Y, a funkcja ^wypłatyM(x, y), x EX, y ^EY, ma następującą postać:

{

-(p.+e)F(x)+eF(y)+p., gdy x > y, M(x, y) = (p.-e)[l-F(x)], gdy x = y, (}t+e)F(y)-p.F(x)-e, gdy x < y.

(l. l)

Dla przykładu wyprowadzimy postać M(x, y), gdy O :s;; y < x < oo.

Otrzymujemy

M(x,y) = ^p.P{T> x}-eP{y <T :s;; .x} =

= p.[l-F(x)]-e[F(x)-F(y)] = -{lt+e)F(x)+eF(y)+p..

W następnym paragrafie udowodnimy twierdzenie o istnieniu i formie anali- tycznej mieszanych strategii optymalnych w grze (X, Y, M). Paragraf trzeci zawiera dwa przykłady liczbowe omawianej gry. Model przedstawiony w niniejszej pracy jest

dość prosty. Stosując metodę Karlina można rozważyć przypadek, gdy p.= p.(x) oraz e = e(Y) są różniczkowalnymi funkcjami monotonicznymi.

2. Strategie optymalne. W niniejszym paragrafie udowodnimy następujące TWIERDZENIE. Jeśli istnieje ^gęstośćdystrybuanty F( t) oraz F( t) E (0, l) dla ^każdego t > O, to gra (X, Y, M) ma ^wartość

(2.1) ^V⁼{rt.p.,

-{Je,

gdy fJ =o,

gdy a= O,

a jedynymi optymalnymi strategiami graczy I i II są rozkłady wyznaczone odpowiednio przez dystrybuanty

(2.2)'

(2.2)"

{_g_ {[I + ^a.p,fe]^{[l -} F(x)]-P!<PH> -l}, K(x) = P.

l,

{^Ł^{[I+,Be/p.][l-F(y)]-(1'<"+11> -l}, L(y)= e

l,

Parametry a, a. i fJ określone są następująco:

(2.3) a = ^min(a', a"),

gdzie a' i a" ^sąpierwiastkami ^równań

X E [0, a], x >a, yE[O,a], Y> a.

(2.4) (2.5)

[1-F(a')]-PI<PH> = p.+e ,

e [1-F(a")]-(I/<P+~~> = ^{p.+ e}

p. ' ex = ^limK(x), fJ = lim L(y).

x .... o+ y .... o+

(3)

Gra antagonistyczna o losowym okresie trwania

D o w ó d. Wprowadzimy klasę f/ dystrybuant na [O, oo) postaci:

(2.6) S(x) =l"'+ ^Is(u)du,

l,

X E [0, a], x >a, gdzie s(x) >O, a> O i a ! _o^s(u)du⁼ ^{l-a, a e}^{[0, l].}

Zdefiniujemy równiez dwie funkcje pomocnicze:

00

<p(y) = ~ M(x,y)dK(x), K e f/, y e Y,

(2.7) ₀₀^o

1p(x) = ~ M(x,y)dL(y), L ef/,x eX.

o

35

W pierwszej kolejności wykażemy, że istnieje para strategii (K, L) e f/ xf/ stano-

wiąca parę odpowiadających sobie strategii wyrównujących [2], tzn. spełniających

warunki:

(2.8) <p(y) = v1 y e (0, a], '/'(X) = V 2 , X E (0, a]

dla pewnych ^stałychv₁i v2 •

Z łatwością znajdujemy wyrażenia dla funkcji <p{y) i 'l'(x). Korzystając z ^równości (1.1) otrzymujemy

(2.9) <p{y) =

Q

ctm(O)+ ~ M₁(x, O)k(x)dx, gdy y =O,

o

Y Q

cxM2(0,y)+ ~M2(x,y)k(x)dx+ ~M1(x,y)k(x)dx, gdy ye(O,a]

O Y

a

ctM2(0, y)+ ~ M2(x, y)k(x)dx, gdy y > a, oraz o

(2.10) 1J'(X) =

a

Pm(O) + ^~^M2(0, y)l(y)dy, gdy x =O, o

% ..

PM1(x, 0)+ ~ M1(x,y)l(y)dy+! M2(x,y)/(y)dy, gdy x e (0, a],

o %

PM¹(x,0)+ a ~M1(x,y)l(y)dy, _{gdy x}_>a,

o

(4)

gdzie

(2.11)

M1(x,y) = -tu+e)F(x)+eF(y)+p, m(x) = (}'-e)[l-F(x)],

Mz(x, y) = (f.'+e)F(y) -pF(x) -e.

Wobec istnieniagęstości dystrybuanty F(t) warunki (2.8) są równoważne warunkom:

<p'{y) = 0 gdy y E (0, a], tp'(x) = ^O ^dla x ^E(0, a].

(2.12)

Korzystając z równości (2.9) i (2.10) otrzymujemy pochodne dla x, y E (0, a]

<p'(y) = J(y),uK(y)+ef(y)-(f.'+e)[t-F(y)Jk(y), tp'(x) = -f(x)eL(x) -pf(x)+ <P+e)[l-F(x)]l(x).l

i'.ądając spełnienia warunków (2.12) otrzymujemy następujące równania ^całkowe:

-J(y) p+e ,uk(y)

1-F(y) = ^--~~-.pK(y)+e, Y E (0, a]' - f(x) ,u+ e el(x)

1-F(x) = --e-. eL(x)+p ' ^XE (O, a]' (2.13)

z warunkami brzegowymi K(O) = ex, L( O) = p.

Biorąc pod uwagę założenie twierdzenia, F( t) E (0, l) dla t> O, zauważamy, że rozwiązaniem równań (2.13) są ciągłe funkcje ^rosnące

Ka(y) =! {[l+cx,u/e][l-F{y)]-"'<~H'.-1}, yE [O, a], L₁₁(x) = ^_!!.._{[l +{Je/ ,u] [l - F(x)]-fi<PH> -l}, x E [O, a].

e

Rozwiązanie to jest jedyne. Niech a' i a" ^będąpierwiastkami, odpowiednio

równań K₀(d) = ^{l i L}0(a") = l. Dla ^każdegoa ^~min(a', a") dystrybuanty K11(x) i L11(Y) określone równościami

Ka(x) = {Ka.(x), gdy x E [0, a],

l, gdy x >a,

La(y) = {Lp(y), gdy y E [0, a], l, gdy y >a (2.14)

stanowią parę odpowiadających sobie strategii wyrównujących będących elementami klasy 9'.

Obecnie znajdziemy ^wśródpar strategii wyrównujących parę strategii optymal·

nych. Wykażemy, że jeśli parametr a spełnia warunek (2.3), to pa~~ strategii (K11 , Lj jest parą strategii optymalnych w grze (X, Y, M) . .Jeśli spełniony jest warunek (2.3), to

Dil aa

~ ~ M(x, y)dKa(x)dLa(y) = ~ ~ M(x, y)dLa(y)dKa(X)

00 00

(5)

Gra antagonistyczna o losowym okresie trwania 37 oraz stałe v1 i v2 w równościach (2.8) są takie same. Ponadto, stałe ex i {3 wyznacza-

jące skoki dystrybuant Ka i La w punkcie t = O ^Spełniająwarunek (2.15)

W dalszym ciągu rozważania ograniczymy do przypadku ^ex~O, {3 =O. Przypadek ex= O, {3 >O może być traktowany podobnie. Zauważmy, że wobec (2.2)' dla dystrybuanty Ka

(2.16) lim lp(y) = lp(O)-r1.p,, ^lp'(y)> ^{O dla} ^y> a.

y-.O+

Podobnie, korzystając z (2.2)" dla dystrybuanty La

(2.17) lim'P(x) = 1p(O) = v, tp'(x) <O dla x > a.

,x--.0+

Stąd, dla wszystkich x, y E [O, oo) zachodzi nierówność

(2.18) 'P(x) ^~v ^~lp(y),

co dowodzi optymalności strategii Ka i La dla a = min(a', a"). Warto ^zauważyć,

że p(a) ~ v i 'P(a) = v, co odpowiada przyjętemu założeniu ex~ O i {3 =O. Oczy-

wiście, dla a = min(a', a") dystrybuanty (2.14) mają postać (2.2)' i (2.2)" ^podaną w twierdzeniu; liczby a' i a" ^spełniająwarunki (2.4). Jednoznaczność wyznaczonych strategii wynika z warunku koniecznego optymalności, jakim jest wyrównywalność

strategii i jednoznaczności rozwiązań równań całkowych (2.13). Pozostaje ^znaleźć

wyrażenie na ^wartośćgry v. Korzystając z (2.9) obliczamy dla r1. ^~O,^{3=O

a

v = limlfJ(x) = -exe+ ~ [p,-(,u+e)F(x)]k(.x)dx =

.x-.o+ o

-e+e(l +ex,ufe) ~ Q [1-F(x)]-Pf<P+(!>J(x)dx = o

= -e+e(l +ex,ufe) "';e {1-[1-F(a)]-(!/<PH>} = r1.p,

co pokrywa ^sięz pierwszą równością w (2.1). Analogicznie, korzystając z (2.10) otrzymujemy dla ex = ^O, ^{3^~^O

"

v = lim 1p(y) = P,u+ ~ [-e+ (,u+e)F(y)]l(y) dy =

y--.0+ o

= ^p,-p.(1+{Je/p,) JJ;e {1-[1-F{a)]-P/<PH>}-{Je, co odpowiada drugiej ^równościw (2.1).

Znając optymalną wartość parametru a obliczoną ze wzoru (2.3) z łatwością

znajdujemy wartości parametrów ex i {3 według wzorów (2.5).

(6)

3. Przykłady liczbowe.

PRZYKŁAD l. Załóżmy, że p,= e= l i F(x) = 1-e-.tx (A.> 0). Wówczas a' = a"= a = ! ^ln4,^ex⁼^fJ⁼^{O, a z}^równości(2.2)' i (2.2)" otrzymujemy oraz

K(x) = Ie _l,^~^-1, ^{gdy x}_gdy _x^e^[O,^a),

~a,

L(y) = Ie ^J.:^-1, ^gdy ^y^e^[O,a),

l, gdy y~ a.

Wartość gry równa jest zero. Warto zauważyć, że a jest większe od wartości oczeki- wanej dystrybuanty F.

PRZYKŁAD 2. Niech p, = 2, e = ^l ^{i F(x)}= 1-e-.tx (A. > 0). Rozwiązując

. (2 . 3ln3 " 3Inj S d 3Inj fJ 0 . ¹

równan1a A) otrzymujemy a' =-u, ^a ^=-A.-. ^tą ^{a =-A.-'} ⁼ ¹^ex=^6·

Równości (2.2)' i (2.2)" ^majątutaj ^postać

oraz

K(x) = lł(je ²^;:.;-1), gdy x e [0, a],

l, gdy x >a,

L(y) = 12(e ^J.:-l),

l, ^{gdy Y}gdy y ^E~a. ^{(0, a),} Zauważmy, że F(a) = 19/27 i z równości (2.1) mamy v = 1/3.

Prace cytowane

[l] B. K • .U o M a H cK ą, O HeKomopwx wpax, C6R3aHHblX c nocAeooBame;zbHOcmbw EePHYAAu,

Tem. ^K:ą6.,N!!!4, 1974.

[2] S. K a r l i n, Mathematical methods and theory in games, programming and economics, Pergamon Press, London 1959.

INSTYTUT MATEMATYCZNY POLITECHNIKI WROCLA WSKIE1