Stochastyczne optymalne sterowanie rozdziałem zasobów w zdecentralizowanym systemie dynamicznym

(1)

Z E S Z Y T Y NAUKOWE POLITECHNIKI ŚL ĄS KI EJ Seria: A U T O M A T Y K A z. 63

________ 1962 Nr kol. 735

Andrzej ŚW IE R N I A K

Instytut A u to ma ty ki Politechniki ślęskie]

ST OC HA ST YC ZN IE OPTY MA LN E STEROWANIE R O ZD ZI AŁ EM Z A SO BÓ W W ZD EC EN T R A L I Z O W A N Y M SY STEMIE DY NA MI CZ NY M

S t r e s z c z e n i e . Pr zedstawiono statys ty cz ni e optymalnę strategię rozdziału zasobów w systemie zwożonym ze statycznych podsystemów.

Podsystemy powięzane sę przez ws pó ln e zasoby, których ilość zmienia się w czasie jako funkcjs przeszłych decyzji. Dynamika systemu w y nika z pojemności maga zy nu grom ad zą ce go zasoby. Lokalni decydenci oosiadaję informacje dotyczęce swoich po ds ys te mó w oraz orzekazVwane przez centralnego koordynatora, który posiada jedynie informację o ilości zasobów w systemie. Za kłada się, że istnieje ws pó ln e k r y t e rium op ty ma li za cy jn e i m i n i ma li zo wa na jest jego wartość oczekiwana.

1. w s t ę p

VI pracy £l] przeds ta wi on o oryginalna metodę deko mp oz yc ji i koordynacji statystycznie oo ty ma ln eg o st at ycznego rozdziału zasobów. W niniejszej p r a cy wy ko rz y s t a n o otrzymane tam wyniki do określenia algory tm ów dla punktów decy zy jn yc h ni ższego poziomu w z d e c en tr al iz ow an ym systemie dla konkretnej postaci wska źn ik a ja kości i ograniczeń. Z drugiej strony z a ł o ż o n o , ż e ce n

tralny punkt de c y z y j n y określa og ra ni cz en ie przydziału za sobów dla całego systemu, orzy czym równanie dy na mi ki systemu ch ar ak te ry zu je zmienność za

sobów w czasie. Realizacje w y z n a c z o n e g o sterowania musi być dokonana na

drodze numerycznej. j

2. S F O R M U ŁO WA NI E PR OBLEMU P I E R WO TN EG O A D O ST ĘP NA INFORMACOA W SYSTEMIE

R o zw aż an y będzie duży system złożony z M podsystemów, z których każ

dy s t er ow an y Jest przez po je dy nc zy punkt decyzyjny dy sp on uj ąc y zmiennę de

cyzyjna u (ni w n-tej chwili (n » 0 . 1 N-lj . N Jest znane, Za po

trzebowanie i-tego systemu na zasoby wynosi w chwili n-tej z i (n). Podsys

temy powięzane sa ze sobg orzez ograniczenia w orzydziale zasobów, o d o s-

taci :

M

"y~' u i (n) » q(n) i = 1

(1)

(2)

166 A. świerniak

W pr zeciwieństwie do [2] o wi el ko śc i q(n) de cyduje centralny ko or dy

nator, biorąc pod uwagę dostępnę informację o ogólnej w i el ko śc i za sobów x(n) oraz posiadanę ocenę z a po tr ze bo wa ń p o d s ys tę mó w z A (n). Za kładać b ę dziemy, że straty w systeale zależę od n i e z a s po ko jo ny ch potrzeb, przy czym podsystemy kooperuję ze sobę tak, 2e m i n i ma li zo wa ny wskaźnik pierwotny dla całego systemu może być p r ze ds ta wi on y w postaci:

M N- l N-l n

I « ' y ' L 1 (ui (n) z i (n) n) « s(n) ^ ‘ ( u ^ n ) - z Ł (n))2 (2)

i»l n«0 n»0 i»l

Kwadra to wa postać w s ka źn ik a jakości może być traktowane Jako Bprokay- mBcJa d r ug ie go rzędu rzeczywistej funkcji strat, natomiast s ^ n ) określa wa gi strat w przyszłości. Ho ź n a np. przyjęć:

s(n) ■ s-n « s ^ 1 (3)

Dynamikę zmian ilości z a so bó w przedstawia równanie:

x(n+l) » ax(n) - bq(n) + d(n) : n » 0 , 1 N-l (3a) x{0) > O - dane ,

gdzie stałe O ^ a s S i , 0 < b < 1 określeję st opień d e p r ec ja cj i oraz nie- odtwar za ln oś ć za sobów przydzielonych, natomiast d(n) Jest losowym d o pływem zasobów. Dla uproszczenia zakładać będziemy, źe d(n) Jest białym szumem o rozkładzie ogra ni cz on ym i wart oś ci oczekiwanej d(n).

Podobnie zakładamy, że z ^ n ) sę białymi szumami o w a r t oś ci ac h ocze

kiwanych z i (n). Zakłada się ponadto, że ilość za sobów w systemie w danej chwili jako również sumaryczny pr zy dz ia ł z a s o b ó w sę ograniczone - co zo

stanie dalej dokładniej określone. Z uwagi na niepełnę informację rozwię- zanle problemu pierwotnego, pole ga ję ce go na minimalizacji w s ka źn ik a (2), Jest niemożliwe i należy sf or mu ło wa ć problem wtórny, w y ni ka ję cy zarówno od dostępnej informacji Jak i struktury decyzyjnej systemu.

3. S F OR MU ŁO WA NI E I ROZW IĄ ZA NI E PR OBLEMU W T Ó R N E G O

Lokalny punkt decyzyjny posiada informację o włas ny ch z a po tr ze bo wa

niach orBz otrzymuje z centrum d y sp oz yc yj ne gó informację koordynujęcę o wa rt oś ci ¿|(n) oraz o systemie. Do pu sz cz al ne al go ry tm y i-tcgo lokalnego

punktu de cy zy jn eg o maję zatem postać:

u ± (n) » A 1 (zi (n), q ( n ) ) j n - 0 , 1 N-l . (*)

(3)

Stochastycznie optymalne sterowanie.. 167

Natomiast do pu sz c z a l n e a l go ry tm y ce nt ralnego ko or dy na to ra przyjmuję pos

tać

Wtórny problem polega na wy bo rz e spośród a l g o r y t m ó w d o p u sz cz al ny ch ta-

gdzie E |x (n ) oznacza op erację w a r u n k o w e g o uś re dn ia ni a przy z a da ny m x(n).

Ponadto ob ow ię zu je równanie ewol uc ji za s o b ó w (3) i ogra ni cz en ia na zmien- nę dacyzyjnę

Natomiast o g ra ni cz en ia na ilość z a s o b ó w w systemie pr zy ję ta zo st an ie po

dobnie jak (7) w po staci warunk ow ej w a r t o ś c i oc ze ki wa ne j Jako Je dn ok ro ko -

*rej ich oceny przaz c e n t ra ln eg o ko ordynatora:

Ograniczenie (7) w problemie w t ó r n y m powoduje, Ze dla pewnych realizacji

zatem po siadać w ł a s n y ma gazyn buforowy, um oż li wi aJ ęc y pokrycie e w e n t u a l nie zwiększonej aktualnie p o t r z e b y na zasoby,

Ro zw lę za nl e problemu do lnego poziomu, tzn. w y z n ac ze ni a lokalnych a l g o rytmów de cy z y j n y c h Jest problemem st at yc zn ym [i]. Z a s t o s o w a n i e uz ys ka ny ch tern re zu lt at ów w y k o r z y s t u j ą c y c h metodę m n oż ni kó w L a g r a n g e 'a or az zasadę sin - E [3] daje algo ry tm op ty ma ln y o postaci:

q(n) » B n (x(n)). (5)

kich, które m i ni ma li zu ję w t ó r n y w s k a ź n i k ja ko śc i o postaci:

N-l M

i(a,B) » E ^ ‘ s(n) ^ ( A j ( Z 1 < Bn ( x ( n ) ) - z ^ n))2 (6) n-0 1-1

oraz o g r a n i cz en iu : M

(7)

(8)

czyli

X> i n < a x ( n ) - bq(n) + d(n) < X>x < n - 0 , 1 , . . , , N-l (9)

(4)

166_____________________________________________________________________ A. Świerniek

u i (n) “ R ] q ( n 'i ” 2 ^ J (n) J-l

^ ( n ) (10)

Po ds ta wi en ie (10) do wt ór ne go w s ka źn ik a ja kości daje problem o p ty ma li za

cyjny o postaci:

N-l

n»0

M nn E S 8.(n) X ! “ fi|8n (x(n)) - 2 V n)

i=l J«1

( 1 1 ) i

Zast os ow an ia za sa dy min - E um oż li wi a wy zn a c z e n i e decyzji op ty malnych z równania funkcyjnego:

V n (x(n)) - Mi

(n)E lx(n) ( s(n)(q(n) " X i ^ (n))2 +

V n + 1 (ax(n) - bq(n) + d(n)) n = 0,1. ,N-l (12)

z wa ru n k i e m końcowym V N (x(n)) - 0, przy czym q(n) należy do zbioru sterowań do pu sz c z a l n y c h Q(x(n)) ok re ś l o n e g o przez ogra ni cz en ia (8) i (9).

P o nieważ zbiór Q(x) Jest w y p u k ł y i zwarty, a m i n i m a l i z o w a n y wskaźnik Jest ściśle wypu kł y, więc istnieje J e dn oz na cz ne ro zw ięzanie q n = B n (x(n)) dla w s z y s t k i c h x(n) , dla których zbió r Q(x(n)) Jest ni ep us ty [4J .

W a r u n k i e m w y s t a r c z a j ę c y m , aby Q(x) był ni epusty Jest spełnione we w s zy st ki ch krokach sterowania relacji:

btW n + X min < ax(n) + 3(n) ^ bq~v + x *nmx mx (13)

W y st ar cz y zatem, aby:

Xm i n ^ x <°> < X mx

ax|3(n n l

Ma ) * a(d(n-l) - 3(

Min|3(n) + a ( d ( n - l ) min - 3(

n-l))}.

(n-l) )} ^ h ^ m i n + Xmin . Łatwo w y ka za ć indukcyjnie, że rozwięzanie równania (l2) ma postać:

V n (x(n)l + Pn x2 (n) + 2 R nx(n) + Fn (14)

(5)

S t o c ha st yc zn ie optymalne sterowanie. 169

Optymalna prawo sterowania Jest bowiem a f ln ic zn e w z g l ę d e m x(n). pr z y j m u jąc Jednę z mo żl iw yc h form:

q(n) =

g d z i e :

■'min

•jlj (8x(n) + i3(n) - x n q°(n) 4 Q ( X n )

q°(n) = C n x(n) + O n q°(n) e Q ( x n ) (15)

5 (ax(n) + i(n) - X nin

C n - (s(n) + b ^ ) " 1 b P n + 1 s

/

q°(n)

4

Q ( x n ^

Dn - (s(n) ♦ b ^ , ) - 1 (Pn + 1 b + 2 1 Z j (" » J-l a w os tatnim kroku

PN " R N " FN ' °'

Wart oś ci Pn , R n , Fn sę różne we w s z y s t k i c h pięciu przypadkach, ale m o ż na podać reku re nc yj ne wzor y dla ich wyznaczania.

Ola ok re śl en ia odpowiedniej de cyzji konieczne Jest wy k o n a n i e siatki dla z m ie nn yc h x(n). Proces ob li cz e n i o w y jest jednak pr ostszy niż w p r z y padku st os ow an ia siatek dla x(n) i q(n). S t os ow an ie siatek jest s z c z e gólnie adekwatne, gdy zasoby maję c h ar ak te r dyskretny, nie trzeba bowiem dokonywać d y s k r e ty za cj i x ( n ) , zaś pr zy określ an iu w ł aś ci wy ch q(n) n a l e ży skorzy st ać z ci ęg ło śc i o p t y ma ln yc h funkcji B (x(n)).

4. UWAGI KOŃCOWE

Pr ze ds ta wi on a w pracy metoda rozdziału zasobów, oparte o koncepcje z a warto w pracach Ge ssinga (m.in. [ l ]), umoż li wi a określenia op ty malnych strategii rozdziału za s o b ó w w z d e c e n t r al iz ow an ym systemie, pr zy n i e w i e l kiej ilości informacji przetwarzanej przez punkt d e c y z y j n y w y ż s ze go oo- ziomu. O t rz ym an e rezultaty można bez trudu rozszerzyć na przypadek mar- kowskich modili procesu d(n) lub niedokładnej informacji o ilości z a s o bów x ( n ) , jak to uczy ni on o w przypadku rozdziału z a so bó w wo dn yc h w p r a

(6)

170 A. świornlak

cach [5] 1 [6]. Możn a ró wnież rozwiązać w podobny sp os ób za ga dnienie roz

działu z a so bó w w przypadku braku ma ga z y n ó w buforowych w podsystemach. Z a gadnienie mi ni malizacji strat może być zastąpione z a ga dn ie ni em maksymeli- zacji zysku, przy czym może być uwzg lę dn io ny ud zi ał zysku w posiadanych przez system zasobach.

LITERA TU RA

[1] Ge ssing R . : Me toda d e ko mp oz yc ji i koordynacji statyc zn ie optymalnego, stat yc zn eg o rozdziału zasobów. Z e s z y t y Naukowe Poli te ch ni ki Slęsklej, Au to ma ty ka z. 54, Gl iwice 1980.

[2] Aoki M . , Toda M . 1 Pa rametr adaptive resource a l lo ca ti on pr oblem for de c e n t ra li ze d system. IEEE Trans on AC, A C - 2 0 1975, No 2.

[3] Ge ss in g R. : Za sa da m i n i m a li za cj i i uśre dn ia ni a Jako metoda w y z n a c z a nie al go ry tm ów st er ow an ia statys ty cz ni e optymalnego. A r c h i w u m A u t o m a tyki i Te lemechaniki, t. XXI, z. 4, 1976.

[ 4] K l e i nd or fe r P., Gl ov er K . : Linear convex st oc ha st ic op timal control wi th appl ic at io n in produc ti on planning. IEEE _Trana. on AC-18, 1973, No 1.

[ 5 ] ś w ie rn ie k A . : Rozd zi ał za so bó w wo dn yc h w przypadku d o p ł y w ó w mo de lo

wych procesami Ma rkowa I rzędu. Z e s z y t y Naukowe P o li te ch ni ki Ślęskiej, Au to ma ty ka z. 59, 1981.

[6j świe rn ia k A . : St oc ha st ic op ti mi za ti on st rategy for the w a t e r resour

ces allocation, M a t e r i a ł y Konferencji: G r un dl ag en -der Modelllerung und S i m u l a t i o n e t e c h n i k , Rostock, 1981.

Recenzent: Doc. dr hab. lnż. Dan WljGLARZ

W p ł y n ę ł o do Re da kc ji 15 .0 5. 19 82 r.

CTOXACTHHECKH OIIIHMAJIhHHfl AJirOPHTM PACirPEHEJEEHHH PECyPCOB B HHHAMHHECKOił HE LJEHTPJLHH3OB AHHOíí CHCTEKE

P ^e 3 ¡0 m e

P a ccuaxpHBaeic* cxoxaciHHecKH onTiuiajbHy» cipaTeniB b saâê pacnpeêas- hha pecypcoB b fiozbnofi CHCTeke. CxaizuecxHe noACHCxeku c B as aa n coBkeciHKffl pecypcakH, xoiopue H3keHflxwcH bo BpexeuH, KpHiepail KaveciBa npaasx b bka«

cpeAKero 3nasenna noxepb usaoft cz c i o u u .

(7)

Stocha st yc zn ie optymalne sterowani«.'. 171

STOCHA ST IC OP TI MA L AL GO R I T H M OF RE SOURCE A L LO CA TI ON FOR A D E C E N T RA LI ZE D DY NA MI C SY STEM

S u m m a r y

A dynamic resource alloca ti on problem under un ce rt ai nt y is considered.

A large system composed of static subsystems each of which is controlled by a single de ci si on -m ak er is coordinated by one coordinator being in charge of alloca ti ng the available resource, the amount of whic h evolves with time. The deci si on makers have the in fo rm at io n about their s u b s y s tems and exchange the me ssages with the coordinator. It is assumed that the de ci si on makers cooperate wi th each other. Expected total losses are minimized.