• Nie Znaleziono Wyników

_ z wieloma źródłami głośnych zakłóceń Minimaksowe decyzje w pewnych problemach sterowania

N/A
N/A
Protected

Academic year: 2021

Share "_ z wieloma źródłami głośnych zakłóceń Minimaksowe decyzje w pewnych problemach sterowania"

Copied!
12
0
0

Pełen tekst

(1)

A nd rz ej G r z y bo w s k i

Częstochowa

Minimaksowe decyzje w pewnych problemach sterowania z wieloma źródłami głośnych zakłóceń

(Praca wpłynęła do Redakcji 1986.05.12)

Wprowadzenie. W pracy rozważa się układ stochastyczny opisany równa- niem (1). Niezależne ciągi zmiennych losowych vk0, vkl, ..., k = 1, . . s, mo- żna interpretować jako zakłócenia działające na system i pochodzące z s niezależnych źródeł. O zakłóceniach tych zakładamy, że są „głośne”, tzn. że w chwili n znamy wartości wszystkich zakłóceń do chwili n — 1 włącznie.

Zmienne losowe vk0, kl,... mają rozkład o znanej funkcji gęstości pk(vk, źk) zależnej od nieznanego parametru Xk. Ponadto w rozpatrywanym modelu zakładamy, że sterowania un nie oddziaływają na system w sposób zdetermi- nowany, lecz są zniekształcane przez losowy „błąd wzbudzony” w„. Dla takiego układu chcemy zaleźć sterowania minimaksowe. Szczegółowo rozwią- zano ten problem w sytuacji, gdy zakłócenia składają się z sumy zmiennych losowych o rozkładzie dwumianowym oraz z komponenty ciągłej o rozkła- dzie normalnym.

I. Sformułowanie problemu. Rozważmy układ stochastyczny zadany przez równanie

S

(1) *n+l =a„X„ + W„u„+ £ yk»Vkn>

k= 1

*o = e, n = 0, 1, ..., M,

gdzie xn jest zmienną stanu, un jest sterowaniem, w„, vkn, k = 1, ..., s, n = 0, 1, _, j6f są niezależnymi zmiennymi losowymi; a„, ykn, e — dane stałe.

Przyjmujemy, że w chwili n znamy: V f”1 = (vk0, vki, ..., r*n_i),

k = 1, ..., s, oraz X„ = (x0, x l5 ..., x„). Zakładamy, że dla n = 1 ,..., M un

jest rzeczywistą funkcją borelowską X„, V f ' 1, k = 1, ..., s. Przyjmujemy, że

dla każdego k = 1, ..., s, vk0, vkl, ... mają ten sam rozkład PAfc oraz że PXk

(2)

należy do wykładniczej rodziny rozkładów z kwadratową funkcją wariancji, tzn. jego gęstość względem <r-skończonej miary q na R = ( — 00, 00) ma postać:

(2) pk (vk, Xk) = Sk (vk, qk) exp [qk Ak (Xk) + vkBk (Xk)],

gdzie Xk eA k jest parametrem. Zakładamy parametryzację naturalną, dla której zachodzą warunki podane w pracy [ 1], z których wynika, że (3) Ekk (vkn) = qkXk, Eh (vkn) = qkl Xk2 + qk2 Xk + qk3

dla pewnych stałych qk > 0; qkl, qk2, qk 3 - Będziemy zakładać, że znamy postać pk(vk, Xk), k = 1, ..., s, nie znamy jednak wartości parametru Xk.

Rozkład zmiennych losowych w„ jest nieznany, ale zakładamy, że dane są jego pierwszy i drugi moment, tzn. znamy: E(wn) = px, £(wj) = p2 •

Niech u0, ulf ..., uM będą sterowaniami. Wektor U =(u0 , ..., uM) nazy- wamy strategią sterowania.

Przyjmujemy, że sterowanie odbywa się do losowego momentu N. Zakła- damy, że ten losowy horyzont jest ograniczoną zmienną losową, niezależną od w„, vkn, k = 1, ..., s, n = 0, .. ., M, o danym rozkładzie:

(4) P(N = n) = pn, pM > 0, Y M j Pi = L i= 1

Wprowadzimy oznaczenie: X = (Xl5 X2, ..., Xs). Zdefiniujemy funkcję ryzyka dla danej strategii sterowania U jako:

(5) «(I, U) = EP {£x[S (dl. D ^ ’di, i = 0 W + k ,«?)]} =

= Ep {Ex [ Y (aoo x } + Y a*k + 2 Y a 0 k xi Xk +

i == 0 k= 1

s — 1 s

+ 2 1 z flk/Xfc x, + ki uf

*=

1

/= k+ 1 gdzie macierze

4°o ao\ ••• flffi

(6) A (i) = n (i) “ 11

_a{ol

• • a {i)

W SS

_J

są nieujemnie określone, o^i) > 0, > 0, (x,, X) = (xf, .Xx, ..., Xs), £ p( ) ozna-

cza wartość oczekiwaną względem rozkładu (4) zmiennej losowej N, E x ( )

oznacza wartość oczekiwaną względem rozkładu zmiennych losowych

w0, wM, vk0, ..., vkM, k = 1, ..., s, gdy X jest znanym parametrem.

(3)

Załóżmy, że parametry Ak są niezależnymi zmiennymi losowymi. Niech 77 będzie rozkładem a priori wektora losowego X. Funkcję

(7) r(77, U) = j R(X, U) dli

Ai x ... x /ls

nazywamy ryzykiem bayesowskim.

W dalszym ciągu będziemy zakładali, że jedyną informacją o parametrach ,..., As jest to, że FI należy do pewnej rodziny rozkładów r . Będziemy rozważali tylko te strategie sterowania U, dla których ryzyko bayesowskie jest skończone dla każdego l l e r . Zbiór tych strategii oznaczymy przez A r.

Strategię U{0)e A r, dla której

(8) supr(77, U{0)) = inf supr(77, U\

ner UeAp ner

nazywamy r-minimaksową strategią sterowania.

r-minimaksowych strategii sterowania będziemy szukali w przypadku, gdy ryzyko dane jest wzorem (5), a klasa r jest określona przez zadanie pewnych momentów dla rozkładów zmiennych losowych Xl5 ..., As.

II. Naturalna rodzina wykładnicza z kwadratową funkcją wariancji. Załóż- my, że dla danego k zmienne losowe vk0, vkl, ... mają rozkład z gęstością pk(vk, Xk) określoną wzorem (2). W [1] pokazano, że istnieje dokładnie sześć rozkładów — nie licząc ich liniowych transformacji — należących do klasy wykładniczej i spełniających warunek (3). Są to rozkłady: Poissona, dwumia- nowy, ujemno-dwumianowy, gamma, normalny i GEHS.

Oznaczmy przez 7 7 ^ rozkład o gęstości danej wzorem (9) gk (X*, Pk, rk) = Ck (pk, rk) Bk (/k) exp [& Ak (żk) + rk Bk (Xk)], gdzie parametry (£k, rk)eS k.

W [3] podano postacie zbiorów Sk parametrów (/?k, rk), gdy pk(vk, Ak) jest gęstością jednego z sześciu wskazanych rozkładów.

Gdy FIpkrk jest rozkładem a priori parametru Ak, wtedy rozkładem a posteriori tego parametru, gdy znamy £ vki, jest' ^k(Xk, ^k„, rkn), gdzie n- 1

i=0 n— 1 (10) Pkn = Pk + nqk, rk„ = rk+ £ vki.

i= 0

Dla rozkładu a priori 77Jgfcrfc parametru Ak mamy (patrz [2], [3])

( 1 1 ) E ix jv r 1) ^

Pkn oraz

£ ( 4 2/ n " “ ‘) = V

i

r,2„ + T ń r» „+ Ę ,

( 12 )

(4)

gdzie E(-/Vk *) oznacza warunkową wartość oczekiwaną, gdy jest dany wektor Fk"_1; T£, i = 1, 2, 3, są stałymi zależnymi od fikHt fik0 = pk,rk0 = rk.

III. Strategie bayesowskie i ich ryzyka. Niech X = (At , ..., As) ma rozkład 77. Strategię sterowania Un €Ar spełniającą warunek

(13) r(77, Un) = inf r(77, U)

UeJp nazywamy strategią bayesowską.

Wprowadzamy oznaczenia: fi = fia-i),r = (rit ra_i).__

Niech U*(fi, r, ps, rs) = (u$, uf, ufa) będzie strategią sterowania określoną w następujący sposób:

(14) «Sr = 0,

U* = - P„Xn~ X Qknrkn = - PHXn- £ ^ M _ 1 ’

Pkn

gdzie

(15)

k= 1 k= 1

P„ = n „+1 ctnAn+lfi1 77„

J ,

—— An+1 p2 77n

+ 1 ^

~ 77„ +1 ^n+l Tkn^k + ^fc.n+l 1 0 *„ = -p r~ P i 77,

M

= I p„

, , 77„+1 ,, Pkn

kn+ ——— An+i g 2

k 1, ..., s,

stałe A„, Dkn, k = 1, ..., s, spełniają równania rekurencyjne

4 - n (") i ^ n + 1 ,4

— “00+ ^n+1

,

(16)

^ ~2 i ^ n+ 1 /( j - j An+1 <X 0C„ _2 .,2

“ u , , 77w+1 ^

^"+1 ^2

Dkn — a0ik + 77„ + 1 C^kn Qk An+ i "ł" Dk n+ i] ^ ( IIn+i A '„2\

n

^n+1 ^

/

n„ , 77„+1 a

+ ^ n + l/^2 77,

z warunkami początkowymi: = a(0^ , 7)kM = a ^ , k = 1 ,..., s. Przez <r2 oznaczono wariancję zmiennych losowych w„.

Podobnie jak w [2] przez zastosowanie metod programowania dynami-

cznego dowodzi się, że wyżej opisana strategia sterowania jest bayesowska

względem rozkładu a prio ri77 = n Pin x llp 2r2 x ... x / 7 ^ , gdy (/?, r, /?s, rs)

eSi xS2 x ... xSs. Przez {fi, r, /?s, rs) rozumiemy wektor

(5)

(fil* r 1, 02, r2,..., 0S, rs).

Niech Vn~1 = (F 1"“ 1, K2"_1, ..., Fs"-1) oraz niech M n ~

(17) R„(ż, 17) = £ x {£ I f + k u f W" - 1, Xn},

gdzie X J oznacza warunkową wartość oczekiwaną przy danych wartościach Vk ~x, k = 1, s, X n.

Oczywiście R 0 (X, U)

=

R (X, U).

Stosując metody podobne jak w [2] dowodzi się, że Rn(I, U) spełnia następujące równanie rekurencyjne:

(18) R„(X, U) = (x„, X)A<">{x„ X)r + ^«„2 + % i £ x[R„ł I (I, U ) / V ~ \ X„], a następnie, że

(19) R(X, r, A, r,)) = a(0’x3 + £ [ C ^ + 4 °U ,2 + 21il0'x 04 +

k = 1

+ 2 X 4? Xi + 2 £ (fcg* rk r} + mg* Xk Xj) + g(k0) Xk] + z(0),

j= 1 J= k 1

gdzie stałe a(0), 4 0); ^k0), 4?\ g[0), z(0); k, j = 1 , ..., s, k ^ r ^ s , k < / < s, można otrzymać z następujących, rekurencyjnych ze względu na n równań:

a'"> = A„, Ą"' = Din,

t& = 4 a , . 0 , . + % - f e An k iQknQ „ + b ^ l>y

d** =: akk H jj C^n+1 7k« Qki + 2Dk „+ j yk„ qk +

+2K+1,* + M ri,<h l+4"+11],

(20) = % - [ - / ( ,+, a . y„q,lii+bi }+1 1 , a„M. + « r “i

mli? = 4 ? + /7^ L‘ [ 4 + i Tta7in9»9i + 1 Vi„9i + Di,.+1 A,9„ +

+ ® +119ft + S'* " 9, + J) 9* 9, + mlT "],

4 ”’

2 '"' =

n »+1

n„+i n„

[An+ i ykn4k2 + frk*+1)4k2+0k"+1)]>

K +1 i yk2^k3+ k= 1 k= 1 i

(6)

z warunkami początkowymi: a(M) = affl, Ą M) = a[k\ hk = ajj?, mkł = affK i pozostałymi stałymi dla n = M równymi zeru. Rozwiązanie tego układu równań jest następujące:

( 21 )

, ( n )

A„ /ii"* = Dkn,

i M - 1 o(i)

U(n) _ V 3fcr

kr n n it f i kifiri’

Ąn) = — n n

m _ _ L

~ n XX n

M - l ... -

t'k’-Z q t Z ( i- n ) - ~ + Z

i = n + l Pki i = n + l \Pki) .

C(i)

M- 1 ł fck

M — 1 o(i) M - l o (0

Z / + « , Z

i = n Pki i - n + 1 Pki Pji _

4 ? i #•(«) _

rki Hk

M - 1

i = n + 1 Z

M - 1

Z(n) =

+ HkHi Z

i = n + l P k i P l i _ Hk2

- - c(0 M -1 o(0

Z Z ( * - » ) = * +

1 ' Pki i = n + 1 Pli

C (0

M - 1

C(i)

i V1 /• \ ^kk

i = n + l \Pki) J

77

rr 1 s Z ^k3

i J n k= 1

M - l o (0

. /• x *^kk

gdzie niezależne od fi, /?s stałe są dane równaniami:

^k? = H k n H i n ( I I n+ 1A n+ k f i 2 + n „ k n),

M - i

= n„ a g + Z n i+! t ó ^ki 4-+1 + 2ykt- qk Dk>i+i + 1}),

M - 1

( 2 2 ) tffl = F l n a f f + Y

j

H i + 1 (Jki 7 u Hk Hi A - + i + 7ki Hk A , i + 1 + 7 u Hi D k,i + 1 + a u + 1 ))»

i~ n

4 ? = fti (* ~ n) + Hk (i — n)(i — n — 1),

M - 1

ykn = Z 7ki 77f + i A l + ! . i = n

IV. Granice strategii bayesowskich. Podzielmy zbiór indeksów «/ =

= {1,2, . . .,s — l} na trzy rozłączne podzbiory J u J 2, </3 takie, że J = / j u Ą u Ą . Oznaczmy ten podział zbioru </ przez Wprowadzimy następujące oznaczenia związane z podziałem ^ zbioru J . Przez fi* =

= {fi*, /?f-i) oznaczamy punkt w /f*- 1 — być może niewłaściwy — taki,

że fit = fik, gdy k fit = oo, gdy k e J 2, gdzie Analogicznie,

(7)

przez P = (rf, rf_x) oznaczamy punkt w Rs~x taki, że r$ = mk, gdy k e J t v J 2, rf = rk, gdy k e J 3.

Niech m* = (mf, m f-J, y = (yi, ys_-i), = (<71 ? będą punktami w I?5-1. Będziemy pisali, że y -►/?*, jeżeli dla każdego k e J : yk -*/?*, oraz że %. -*m*, jeżeli — ->m* dla k e J i KjJ2 i — “*-77' dla k e</3.

y l k 7k Pk

Z danym podziałem & zbioru J związane są strategie sterowania, których oznaczenia i definicje podajemy poniżej.

Oznaczmy przez U#{(}*, P , /3S, rs) = (u0, uM) strategię sterowania, dla której:

«m = 0,

(mk)

(23) un = - P nx„ - Y. HtĄ ---- £ Hknmk —

k e ^ i Pkn k e S 2

~ I H j - p - H j f - , n = 1...M - 1,

k e S

3

Pkn Psn

uo — ~ P o xo~ X Hkomk~ Z ^ko~n Hs0— .

k e ^ i

2 k e .^ 3

Pk Ps

Podobnie przez +Up(j3*, r, oo, mj = (+u0, +Mi> •••» +% ) oznaczamy stra- tegię, dla której

+“M = °’ <»*>

(24) +u„ = - P . x . ~ Y. HtĄ ---- X Hk„mk-

k e S ^ Pkn k e J 2

~ Y H k n j 1 - H s n m s , n = 1 , . . . , M — 1, k e J 3 Pkn

+ U0 ~ ~ P o X0~ X HkOmk~ X ^ k0~R HsOms- ke^i kj J2 *6^3 Pk

Wreszcie przez ~Up(j3*, P , /?s, ms) = (- u0, _ m 15 ..., _wM) oznaczamy strategię zdefiniowaną następująco:

mm —

J mk>

Un = ~ PnXn~ £ H kn~£---Z H kn ™k ~ r kn

keSi Pl kn

k e J 2

(ms)

- I n = 1... M - l ,

k e S

3

Pkn Ps

U0 — ~ PoX0~ Z ^kO mk — Z ^*0 71 #s0 ms • keSj u-^2 ke^3 Pk

( 25 )

(8)

Występujące w powyższych definicjach symbole /?*„, rkn mają znaczenie

n— 1

nadane im wzorami (10), a rk™k) = ]T vki-\-mk^k.

Dla f c e { l,...,s | będziemy pisali, że mkESkl, jeżeli istnieje ciąg i=0

{(7ki» <*«)};= i, (Va, dla którego yki -+ oo, — ^ m k dla i -> oo. Podob- nie będziemy pisali, że (fłk, mk) eSk2, jeżeli istnieje ciąg {(yki, tfki)};=i, dla 7ki

którego (yu , aki)e S k, yki -►&, — ^ m k dla i -►oo.

Z postaci zbiorów Sk wynika, że dla każdego z sześciu rozkładów należących do klasy wykładniczej z kwadratową funkcją wariancji Pk > 0, jeżeli (Pk,r k)eS k (patrz [3]).

Załóżmy, że

mk eSkl, (yk, ak) eSk dla k e J 2t (26) (fik, mk) eSk2, (yk, <rk) eSk dla /c 6 J u

(pk,r k)eS k dla k e J 3, k = s.

Wtedy z (19) i (21) otrzymujemy

(27) R (I, f*. ft, O) = lim R(X, £/*(f, <f, ft, rj).

f-ł*

-=• ->m*

Jeżeli mseSsl,(ys,trs)eS s, to

(28) R (f,+l/,(? * ,r* ,o o ,m J)= lim R (X, U* (y, 5, y„ aj).

-»m*

yc -►oo,--- ►mc s

ffs

Vs s Jeżeli (&, ms)e Ss2, (ys, <Js)eS s, to

(29) R(X, ~ U<?($*, r*, f}s, mj) = lim R(X, U*(y, a, ys, aj).

y-+ P *,J -*m*

yS~*Ps’ys ~*mSas

V. Strategie r-minimaksowe. Niech U* (/?, r, ps, rj będzie strategią baye- sowską wzgjędem rozkładu a priori 7 7 ^ x 7 7 ^ = 7 7 ^ x n fi r x ... x /7^

parametru k. Wtedy z (19) i (21) otrzymujemy, że jeżeli TI jest rozkładem a priori parametru I, to

(30) r ( n ,V * t f , r, ft, r,)) = £ Ą01 £ (A?) + fc= 1

+ £ (2Dfc0 + 9l°> + 2 £ IJj? ij) £ (A*) ■+ 2 ’£* £ mg' £ (A*) E (A,) +

*=1 j = l k = 1 j= k + 1

+ io ^ o + z(0) + i B ^ + 2 Z b[?rkrj).

fc = 1 j= k+ 1

(9)

Załóżmy, że dla k e J zmienne losowe vk0, vkl, ... mają rozkład dwumia- nowy z parametrem Xk, a zmienne losowe vs0, vsl, ... mają rozkład normalny z parametrem Xs.

Załóżmy, że r jest zbiorem tych wszystkich rozkładów a priori parametru I, dla których

(31) E(Xk) — mk, 0 < mk < 1 dla k e J oraz

(32) £(żs2) = ms, ms > 0,

gdzie stałe mk, k = 1 , ..., s, są dane.

Gdy pk(vk, żk) jest gęstością rozkładu dwumianowego, wtedy dla rozkładu a priori parametru Xk zdefiniowanego wzorem (9) mamy, gdy (Pk, rk)eS k, że E(Xk) = j - oraz

Pk

(33) E (11) = g s* = {/V- rk > 0, rk > 0}.

Gdy pk{vk, Xk) jest gęstością rozkładu normalnego, wtedy dla rozkładu a priori parametru Xk zadanego wzorem (9), gdy (Pk, rk) eSk, mamy że E(Xk) = oraz

Pk

(34) E(li) = § + - j - , Sk = % > 0, rk eR\.

Pk Pk t

Wobec tego, jeżeli iJ^>Fx/7^ eT i {Pk,r k)e S k, k = 1, ..., s, otrzymujemy (35)

oraz (36)

— = mk, k e ./,

Pk

r2 1

1 2

+ - = ms.

Pt Ps

Z (30) wynika, że jeżeli n eT, to ryzyko bayesowskie r(J7, U* (P, r, /łs, rs)) przyjmuje postać

(37) r { n ,U * tf,r ,P „ r ,)) =

= i ' Ą ^ M E U D + Z .W , f, Ps, rs)E ls + Z 20 , f, A, rj, k= 1

gdzie

s — 1

Z itf, r, rs) = 2Ds0 x0 + g(s0) + 2 £ /Js0)r, + 2 X m j?S -

j= i ;= i

( 38 )

(10)

W nawiasach przy współczynnikach we wzorze (37) zaznaczono ich faktyczną zależność od wskazanych zmiennych.

Wprowadzimy podział , / zbioru indeksów ,/ = [1, s — 1] związany z własnościami współczynników Ą0)( ). Rozłączne zbiory / l5 , / 2, ^3 podziału , / określamy następująco:

k e J 1 o d ia każdego fi > 0 djt0)(/ł) > 0, (39) / c g / 2 o dla każdego fi > 0 <40)(/ł) <0, /c g o istnieje fik takie, że d{k0)(j3k) = 0.

Oczywiście / = i t u i 2u / 3, co wynika z ciągłości funkcji c40)(-) dla /?k > 0.

Przyporządkujmy temu podziałowi punkty fi*, r*, m* (określenie patrz IV), dla których:

& = 0 dla k e J u fik = fik dla / c g / 3, r* = mk dla / c g , / i u . / 2, rk = mkfik dla / c g , / 3, m* = mk dla / c g / ,

gdzie mk = £żk, / c g ,/.

Z analizy postaci współczynnika Z t (fi, r, fis, rs) łatwo widać, że spełnia on przynajmniej jeden z trzech poniższych warunków

(A) lim Z 3 (y, a, fis, J m s - fis) ^ 0, y ~*P*A */v) -"i* Ps-<*>

(B) lim Z ^ y , a, Ps, - ^ / m sf ó - p s) ^ 0, y-*P*,(óly)

Ps-°°

(C) istnieją fis ^ — i rs takie, że (&, rs) eSs i ms f Gs (^s ’ fis» rs) dXs TYls

As oraz

lim Z i {y, o , fis, rs) = 0.

y o/y) ~*m*

Ponadto zauważmy, że Z x(-, •, ■, •) jest ograniczoną funkcją swoich zmien- nych, gdy spełniają one warunki (35) i (36).

Stosując wyżej wprowadzone oznaczenia, sformułujemy twierdzenie poda- jące r-minimaksowe strategie sterowania (.T-MSS) w każdym z możliwych

przypadków zachowania się współczynników d(k0)(•), / c g ,/; Z l (-, •, •, •)•

(11)

T w ie r d z e n ie . Przypuśćmy, że zmienne losowe vk0, vkl, ... mają dla k e J rozkłady dwumianowe, a zmienne losowe vs0, vsl, ... mają rozkład normalny.

Wtedy:

1) jeżeli spełniony jest warunek (A), to strategia + Up(fi*, r*, oo, y/ms) jest r-MSS;

2) jeżeli spełniony jest warunek (B), to strategia + Up(j3*, r*, oo, — ^/m^

jest r~MSS;

3) jeżeli spełniony jest warunek (C), to strategia U<?($*, r*, \8S, rs) jest T- MSS.

Do dowodu twierdzenia potrzebny jest, znany z teorii decyzji, lemat (patrz twierdzenie 6.5.2 [4]), który podamy w wersji zamieszczonej w [3]

L e m a t . Niech {TJk j ® będzie ciągiem rozkładów a priori na przestrzeni A, n ke r i niech [Uk} f oraz 1 r(n k, Uk) ] ® będą odpowiadającymi mu ciągami bayesowskich strategii sterowania i ich ryzyk bayesowskich. Jeżeli U° jest strategią sterowania spełniającą warunek

supr(77, U°) = limsupr(17fc, Uk),

Ile r k -* oo

to U° jest r-minimaksową strategią sterowania.

D o w ó d tw ierdzenia. Przypuśćmy, że spełniony jest warunek (A).

Z (37) i (28) mamy

r (n, r*, oo, ^/mj) = lim r(J7, U*(y, 5, y„ - 7>» = y-*P*,(a/y)->m* ys-ao

= lim [ £ 4 0»(Vl) £ tó ) + £ 4 0l(y*)£(^) + E 4 01 ( « £ « ) +

k e ^ i k e J 2 k e J 3

( a/y) -*m*

+ z 1 (y, O, ys, J m sy 2 - ys) EXs + Z 2{y, a, ys, J m sy2s - ys)] ^

< lim [ X dk0)(yk)mk+ Z 4 0)(yfcW + Zi(y, o, ys, j m sy2s- y s) ^/ms +

y ^ p * ,y s -*oo k e f i

+ z 2 (y, V, ys, \/™sy2- y s)] = lim [V Ą 0)(yk) ak^ k + 1^ +

y-+P*, vs - « k e J yk (y k + 1)

(a/y) ->m*

/ 2

+ Zi(y, ó, ys, J m sy2 - ys) ^ — h + z 2{y, d, ys, J m sy2- y s)] =

Js

= _ lim r(n f ^ x IJ ______> U*(y, 5, ys, J m s y2s - ys)).

y-*p*,ys ->ao V*’v msy 2 + ys

(a/y) S

(12)

Powyższe granice oblicza się przy warunkach (yfc, <rfc) eSk, co oczywiście zawsze jest możliwe; mk, /?* spełniają warunki (26), a y/ms eSsl.

Ponieważ wykazana nierówność granic zachodzi dla każdego l l e r , więc na mocy lematu strategia +Up(J}*, r*, oo, yjms) jest w rozważanym przypad- ku T-MSS.

Podobnie dowodzi się prawdziwości punktów 2) i 3) twierdzenia 1.

Zauważmy, że ponieważ jeden z warunków (A), (B), (C) musi być spełnio- ny, więc z twierdzenia 1 wynika, że w rozpatrywanym problemie strategie T- minimaksowe zawsze istnieją.

Na koniec, zwróćmy uwagę na fakt, że strategie bayesowskie zostały wyznaczone przy ogólnym założeniu, że gęstości pk(vk, A*) należą do klasy wykładniczej z kwadratową funkcją wariancji. Na podstawie analizy wzoru (38) oraz wyników części IV widać, że w sytuacji, gdy zmienne losowe vs0, vsl, ... mają, zamiast rozkładu normalnego, jeden z pozostałych rozkładów należących do rozważanej klasy, można podać twierdzenie analogiczne do zawartego w tej pracy.

Prace cytowane

[1] C. M orris, Natural exponential families with quadratic variance functions, Ann. Statist. 10 (1982), str. 65-80.

[2] S. T ry b u ła, K. S zajow ski, Minimax control of a stochastic system with disturbances belonging to the exponential family, Zastos. Mat. 18.4(1985), str. 525-539.

[3] S. T ry b u ła, Some problems of control with noisy disturbances, Systems Science, przyjęto do druku.

[4] S. Z aks, The theory of statistical inference, J. Wiley and Sons, New York and London

1971.

Cytaty

Powiązane dokumenty

Do eliminacji czynników, jak również do prowadzenia analizy wpływu wielkości wejściowych na wyjściową stosuje się metodę bilansu losowego [2, 3], Istotę

nienia reorganizacji wyrobu oraz zaopatrzenia kopalń w kopalniaki w aspekcie aktualnych wa runków funkcjonowania Zakładów Drzewnych Przemysłu Węglowego.. Przedstawiony w

Z»stosowanie teorii i metod sterowania... Zistosowanle teorii 1 metod

Mikroprogra- mowany System Sterowania Napędami przeznaczony jest do sekwencyjnego sterowania i kontroli pracy urządzeń wykonawczych... ilości i typy modułów oraz ich

Obecnie wykorzystany wyniki uzyskane w rozdziale poprzednia, ChocliJ sadzała (5.1) - (3.3) noże zostać zawsze rozwiązane, o lic spełnione J«t nierówność alSę, to

Prezentowana struktura zredukowanego obserwatora stanu układu sprężystego, w powiązaniu z zaproponowaną metodą wyznaczania wartości współczynników macierzy L,

Praca dotyczy wybranych problemów wielomaszynowego szeregowania zadań z efektem uczenia się oraz kryterium minimalizacji czasu zakończenia wykonywanych

Sterow anie pojazdem następnika odbyw a się w czasie rzeczyw istym , w ięc najprostszym sposobem porów nania m odeli ruchu je s t w ykres odległości dj+i- O