ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA XVII (1981)
ANTONI STYSZYŃSKI (Wrocław)
Gra antagonistyczna o losowym okresie trwania
(Praca przyjęta do druku 15.02.1979)
1. Wstęp i opis modelu gry. W pracy [l] rozważa się pewien model gry antagonis- tycznej związanej z ciągiem zmiennych losowych niezależnych, prz)jmujących wartości O i l. Celem niniejszej pracy jest znalezienie rozwiązania dla wersji z czasem
ciągłym modelu gry z [1]. Zakłada się, że czas przebywania w stanie l jest zmienną losową o znanej dystrybuancie F( t), t ~ O. Zmodyfikowana gra jest grą na produkcie (O, co) x [O, co) z nieciągłą funkcją wypłaty. Stosując metodę dodatnich transformacji
całkowych rozwiniętą przez Karlina [2] dla gier czasowych uzyskujemy postać strategii optymalnych w rozważanej grze.
W celu opisania rozważanej gry posłużymy się pewnym przykładem. Załóżmy, że dwaj producenci tego samego towaru sprzedają swoje produkty temu samemu nabywcy, który ma prawo, biorąc pod uwagę sytuację na rynku, odmówić przyjęcia
towaru w losowym momencie czasu. Przed przystąpieniem do gry obaj gracze w sposób niezależny ustalają okresy trwania produkcji i zaopatrują się w odpowiednie ilości materiału. Każdy z producentów stara się produkować dłużej niż jego prze- ciwnik, unikając jednak wystąpienia nadmiaru nie wykorzystanego materiału. Niech x, y e [0, co) będą momentami przerwania produkcji odpowiednio przez pierwszego i drugiego gracza. Rozważmy zmienną losową T (moment odmowy zakupu) określoną na przestrzeni probabilistycznej (.Q, g;, P) o wartościach w [0, co) i dystrybuancie F( t), t > O. Wypłatą dla gracza pierwszego jest zmienna losowa okreśiona na (.Q, !F, P) następującym wzorem:
lft · X{T>x}(w)-e · X<Y<T<x}(w), Jf'xy(w) = (ft -e)· X{T>x}(w),
ft · Xtx<T<y}(w)-eX{T>y}(w), gdzie X.t( ·)jest funkcją charakterystyczną zbioru A.
gdy X> y, gdy X= y, gdy X< y,
Dla przykładu omówimy przypadek x > y. Jeśli odmowa zakupu nastąpiła póź1iej niż planowa1y przez gracza I okres produkcji, to gracz I uzyskuje wartość p,, gdyż produkował dłużej niż przeciwnik. Jeśli odmowa miała miejsce przed plano- wanym zakończeniem produkcji, to gracz I traci wartość e z powodu nie wyko- rzystanych zapasów.
3 Matematyka Stosowana nr 17 (33]
Uzasadnienie wypłaty w przypadkach x = y i x < y jest analogiczne. Łatwo
zauważyć, że czas trwania gry jest zmienną losową T= min[T, max(x, y)].
Nietrudno jest ustalić postać normalną rozważanej gry. Przestrzeniami strategii czystych graczy są półosie dodatnie X i Y, a funkcja wypłaty M(x, y), x EX, y E Y, ma następującą postać:
{
-(p.+e)F(x)+eF(y)+p., gdy x > y, M(x, y) = (p.-e)[l-F(x)], gdy x = y, (}t+e)F(y)-p.F(x)-e, gdy x < y.
(l. l)
Dla przykładu wyprowadzimy postać M(x, y), gdy O :s;; y < x < oo.
Otrzymujemy
M(x,y) = p.P{T > x}-eP{y <T :s;; .x} =
= p.[l-F(x)]-e[F(x)-F(y)] = -{lt+e)F(x)+eF(y)+p..
W następnym paragrafie udowodnimy twierdzenie o istnieniu i formie anali- tycznej mieszanych strategii optymalnych w grze (X, Y, M). Paragraf trzeci zawiera dwa przykłady liczbowe omawianej gry. Model przedstawiony w niniejszej pracy jest
dość prosty. Stosując metodę Karlina można rozważyć przypadek, gdy p.= p.(x) oraz e = e(Y) są różniczkowalnymi funkcjami monotonicznymi.
2. Strategie optymalne. W niniejszym paragrafie udowodnimy następujące TWIERDZENIE. Jeśli istnieje gęstość dystrybuanty F( t) oraz F( t) E (0, l) dla każdego t > O, to gra (X, Y, M) ma wartość
(2.1) V = {rt.p.,
-{Je,
gdy fJ =o,
gdy a= O,
a jedynymi optymalnymi strategiami graczy I i II są rozkłady wyznaczone odpowiednio przez dystrybuanty
(2.2)'
(2.2)"
{_g_ {[I + a.p,fe] [l - F(x)]-P!<PH> -l}, K(x) = P.
l,
{Ł {[I+ ,Be/p.][l-F(y)]-(1'<"+11> -l}, L(y)= e
l,
Parametry a, a. i fJ określone są następująco:
(2.3) a = min (a', a"),
gdzie a' i a" są pierwiastkami równań
X E [0, a], x >a, yE[O,a], Y> a.
(2.4) (2.5)
[1-F(a')]-PI<PH> = p.+e ,
e [1-F(a")]-(I/<P+~~> = p.+ e
p. ' ex = lim K(x), fJ = lim L(y).
x .... o+ y .... o+
Gra antagonistyczna o losowym okresie trwania
D o w ó d. Wprowadzimy klasę f/ dystrybuant na [O, oo) postaci:
(2.6) S(x) =l"'+ Is(u)du,
l,
X E [0, a], x >a, gdzie s(x) >O, a> O i a ! o s(u)du = l-a, a e [0, l].
Zdefiniujemy równiez dwie funkcje pomocnicze:
00
<p(y) = ~ M(x,y)dK(x), K e f/, y e Y,
(2.7) 00 o
1p(x) = ~ M(x,y)dL(y), L ef/,x eX.
o
35
W pierwszej kolejności wykażemy, że istnieje para strategii (K, L) e f/ xf/ stano-
wiąca parę odpowiadających sobie strategii wyrównujących [2], tzn. spełniających
warunki:
(2.8) <p(y) = v1 y e (0, a], '/'(X) = V 2 , X E (0, a]
dla pewnych stałych v1 i v2 •
Z łatwością znajdujemy wyrażenia dla funkcji <p{y) i 'l'(x). Korzystając z równości (1.1) otrzymujemy
(2.9) <p{y) =
Q
ctm(O)+ ~ M1(x, O)k(x)dx, gdy y =O,
o
Y Q
cxM2(0,y)+ ~M2(x,y)k(x)dx+ ~M1(x,y)k(x)dx, gdy ye(O,a]
O Y
a
ctM2(0, y)+ ~ M2(x, y)k(x)dx, gdy y > a, oraz o
(2.10) 1J'(X) =
a
Pm(O) + ~ M2(0, y)l(y)dy, gdy x =O, o
% ..
PM1(x, 0)+ ~ M1(x,y)l(y)dy+! M2(x,y)/(y)dy, gdy x e (0, a],
o %
PM1(x,0)+ a ~M1(x,y)l(y)dy, gdy x >a,
o
gdzie
(2.11)
M1(x,y) = -tu+e)F(x)+eF(y)+p, m(x) = (}'-e)[l-F(x)],
Mz(x, y) = (f.'+e)F(y) -pF(x) -e.
Wobec istnieniagęstości dystrybuanty F(t) warunki (2.8) są równoważne warunkom:
<p'{y) = 0 gdy y E (0, a], tp'(x) = O dla x E (0, a].
(2.12)
Korzystając z równości (2.9) i (2.10) otrzymujemy pochodne dla x, y E (0, a]
<p'(y) = J(y),uK(y)+ef(y)-(f.'+e)[t-F(y)Jk(y), tp'(x) = -f(x)eL(x) -pf(x)+ <P+e)[l-F(x)]l(x).l
i'.ądając spełnienia warunków (2.12) otrzymujemy następujące równania całkowe:
-J(y) p+e ,uk(y)
1-F(y) = --~~-. pK(y)+e, Y E (0, a]' - f(x) ,u+ e el(x)
1-F(x) = --e-. eL(x)+p ' X E (O, a]' (2.13)
z warunkami brzegowymi K(O) = ex, L( O) = p.
Biorąc pod uwagę założenie twierdzenia, F( t) E (0, l) dla t> O, zauważamy, że rozwiązaniem równań (2.13) są ciągłe funkcje rosnące
Ka(y) =! {[l+cx,u/e][l-F{y)]-"'<~H'.-1}, yE [O, a], L11(x) = _!!.._ {[l +{Je/ ,u] [l - F(x)]-fi<PH> -l}, x E [O, a].
e
Rozwiązanie to jest jedyne. Niech a' i a" będą pierwiastkami, odpowiednio
równań K0(d) = l i L0(a") = l. Dla każdego a ~ min(a', a") dystrybuanty K11(x) i L11(Y) określone równościami
Ka(x) = {Ka.(x), gdy x E [0, a],
l, gdy x >a,
La(y) = {Lp(y), gdy y E [0, a], l, gdy y >a (2.14)
stanowią parę odpowiadających sobie strategii wyrównujących będących elementami klasy 9'.
Obecnie znajdziemy wśród par strategii wyrównujących parę strategii optymal·
nych. Wykażemy, że jeśli parametr a spełnia warunek (2.3), to pa~~ strategii (K11 , Lj jest parą strategii optymalnych w grze (X, Y, M) . .Jeśli spełniony jest warunek (2.3), to
Dil aa
~ ~ M(x, y)dKa(x)dLa(y) = ~ ~ M(x, y)dLa(y)dKa(X)
00 00
Gra antagonistyczna o losowym okresie trwania 37 oraz stałe v1 i v2 w równościach (2.8) są takie same. Ponadto, stałe ex i {3 wyznacza-
jące skoki dystrybuant Ka i La w punkcie t = O Spełniają warunek (2.15)
W dalszym ciągu rozważania ograniczymy do przypadku ex~ O, {3 =O. Przypadek ex= O, {3 >O może być traktowany podobnie. Zauważmy, że wobec (2.2)' dla dystrybuanty Ka
(2.16) lim lp(y) = lp(O)-r1.p,, lp'(y) > O dla y > a.
y-.O+
Podobnie, korzystając z (2.2)" dla dystrybuanty La
(2.17) lim'P(x) = 1p(O) = v, tp'(x) <O dla x > a.
,x--.0+
Stąd, dla wszystkich x, y E [O, oo) zachodzi nierówność
(2.18) 'P(x) ~ v ~ lp(y),
co dowodzi optymalności strategii Ka i La dla a = min(a', a"). Warto zauważyć,
że p(a) ~ v i 'P(a) = v, co odpowiada przyjętemu założeniu ex~ O i {3 =O. Oczy-
wiście, dla a = min(a', a") dystrybuanty (2.14) mają postać (2.2)' i (2.2)" podaną w twierdzeniu; liczby a' i a" spełniają warunki (2.4). Jednoznaczność wyznaczonych strategii wynika z warunku koniecznego optymalności, jakim jest wyrównywalność
strategii i jednoznaczności rozwiązań równań całkowych (2.13). Pozostaje znaleźć
wyrażenie na wartość gry v. Korzystając z (2.9) obliczamy dla r1. ~O, {3 =O
a
v = limlfJ(x) = -exe+ ~ [p,-(,u+e)F(x)]k(.x)dx =
.x-.o+ o
-e+e(l +ex,ufe) ~ Q [1-F(x)]-Pf<P+(!>J(x)dx = o
= -e+e(l +ex,ufe) "';e {1-[1-F(a)]-(!/<PH>} = r1.p,
co pokrywa się z pierwszą równością w (2.1). Analogicznie, korzystając z (2.10) otrzymujemy dla ex = O, {3 ~ O
"
v = lim 1p(y) = P,u+ ~ [-e+ (,u+e)F(y)]l(y) dy =
y--.0+ o
= p,-p.(1 +{Je/p,) JJ;e {1-[1-F{a)]-P/<PH>}-{Je, co odpowiada drugiej równości w (2.1).
Znając optymalną wartość parametru a obliczoną ze wzoru (2.3) z łatwością
znajdujemy wartości parametrów ex i {3 według wzorów (2.5).
3. Przykłady liczbowe.
PRZYKŁAD l. Załóżmy, że p,= e= l i F(x) = 1-e-.tx (A.> 0). Wówczas a' = a"= a = ! ln4, ex = fJ = O, a z równości (2.2)' i (2.2)" otrzymujemy oraz
K(x) = Ie l, ~ -1, gdy x gdy x e [O, a),
~a,
L(y) = Ie J.: -1, gdy y e [O, a),
l, gdy y~ a.
Wartość gry równa jest zero. Warto zauważyć, że a jest większe od wartości oczeki- wanej dystrybuanty F.
PRZYKŁAD 2. Niech p, = 2, e = l i F(x) = 1-e-.tx (A. > 0). Rozwiązując
. (2 . 3ln3 " 3Inj S d 3Inj fJ 0 . 1
równan1a A) otrzymujemy a' =-u, a =-A.-. tą a =-A.-' = 1 ex= 6·
Równości (2.2)' i (2.2)" mają tutaj postać
oraz
K(x) = lł(je 2;:.; -1), gdy x e [0, a],
l, gdy x >a,
L(y) = 12(e J.: -l),
l, gdy Y gdy y E ~a. (0, a), Zauważmy, że F(a) = 19/27 i z równości (2.1) mamy v = 1/3.
Prace cytowane
[l] B. K • .U o M a H cK ą, O HeKomopwx wpax, C6R3aHHblX c nocAeooBame;zbHOcmbw EePHYAAu,
Tem. K:ą6., N!!!4, 1974.
[2] S. K a r l i n, Mathematical methods and theory in games, programming and economics, Pergamon Press, London 1959.
INSTYTUT MATEMATYCZNY POLITECHNIKI WROCLA WSKIE1