• Nie Znaleziono Wyników

WYBRANE ZAGADNIENIA TEORII STEROWANIA OPTYMALNEGO

31 to założenie towarzyszęce wszystkim zagadnieniom wzroutu goupodarczegó

3.1. Sform ułowanie zagadnienia

Zagadnienie sterowania optymolnego przedstawimy na przykładzie syste­ mu stacjonarnego. Uogólnieniami zajmiemy się w punkcie 3.3.

Rozpatrzmy gładki, stacjonarny system aynamiczny z przekształceniem stenów /vewnftrznych

^ x (t) - f(x (t), u (t)), (3.1)

f =■ < V f£ .... fn ); f. d f / ó x e c ° [ E n X uj ; u(t)euch'M

w każdym momencie 1 przekształceniem wyjścia

y(t) = p ( x (t;, u (t)) , (3.2)

? “ ®?1* ? 2 .... ?k> J ? 6 C ° [E" x U J * 2i

Czytelnika pragnącego gruntowniej zapoznać się z zasadą makbimum Pontriagina i innymi metodami stepowania optymalnego bezpośrednio nie opartymi na zasadzie maksimum odsyłamy dc prac: L.5. P o n t r i a g i n i in. J42] , M. A t h a n s, P.L. F: a 1 b [3] , W.G. B o ł t i a ń -8 k i [-8], 0. G e d y m l n r20] , G. H a d 1 e y, M.C. K e m p J 22], R.E. K a l m a r i ln. A.m. T i e r - K r i k o r o w [4L , a także R. B e l l m a n [5]". R, ó e l l m a n , R. K a l a b a [61, M. I n t r i l i g a t o r [24 rozdz. 13,14, R. K u l i k o w s k i [2d] rozdz.4.

W układzie (3.1) - (3.2) wektor x(t) oznacza stan wewnętrzny syste­ mu, wektor u(t) - wartość sterowanLa (stan wejścia), wektor y (t) - star wyjścia systemu w momencie t, U - Jest zbiorem sterowań. Horyzontem jest przedział czasu tQ • Będziemy zakładać, że moment początkowy t ho­ ryzontu Je t ustalony. Momentem Końcowym może być d o w o l n y mo­ ment czasu t (t1< + oo ). Sterowaniem w okresie [t0 >tj] może byc każda funkcja u t C° * wjrtosciami w zbiorze U. Zakładamy, że każdemu takiemu sterowaniu odpowiada dokładnie jodna trajektoria xft » !

r l

spełniająca wa ru ne k początkowy (1.4), będąca nb L r,_'t lJ rozwiązaniem”rów- nania (3.1) w sensie całkowym. Trnjektorle te są funkcjami z klasy

S1 ['o^l].

A D e f l n i c J a 3.1. Oznaczmy przez X 1 S En (X" / p ) pewien pod­ zbiór e t a n ó w d o c e l o w y c h systemu, (i) Parę (u,x)r,. r i

r i Llo’ lJ

gdzie u £t t ^ jest sterowaniem w okresie L to*tiJ > a x [t , t ^ j - odpo­ wiadającą mu trajektorią stanów wewnętrznych (rozwiązanie równania (3.1)) spełniającą warunek początkowy (1.4), nazywać będziemy p r o c e s e m s t e r o w a n i a . (ii) Proces sterowania nazwiemy d o p u s z ­ c z a l n y m , jeżeli w momencie Końcowy,n t^ spełniony będzie warunek: x(t1 ) 6 X 1 . A

3ezeli w pewnym okr»sie [rQ ,t p a r a (u,x) |r t J będzie dopuszczal­ nym procesem sterowania, wteay uf .. l nazw: i iy° ^ s t e r o w a n l e i

L S ^ i J

d o p u s z c z a l n y m , a x [ t - t ] “ d o p u s z c z a l n ą

t r a j e k t o r i ą s t a n ó w w 1 w n ę t r z n y c h . Trajek­ torię y r i odpowiadającą procesowi dopuszczalnemu zgodnie z ( 1 2 )

L'o' lj

nazwiemy d o p u s z c z a l n ą t r a j e k t o r i ą w y j ś ­ c i a . Funkcja yr .. -i wteay i tylko wtŁdy będzie dopuszczalną

tra-Ll . * 3 J

jektorią wyjścia. Jeżeli znajdzie się taki proces dopuszczalny

(u.x ) t ,t J * ie tróJka [t ,t J 8Pbłni na [*o* *lJ warunek (3.2). 0 stalowaniu dopuszczalnym będziemy mówić, że p r z e p r o w a ­ d z a s y s t e m z e s t a n u p o o z ą t k o w e g o X0 d o z b i o r u s t a n ó w d o c e l o w y c h X , a o dopuszczalnej trajektorii stanów wewnętrznych, że w y c h o d z i z x

1 w c h o d z i d o X1 . Zwracamy uwagę, że dwa różne sterowanie dopuszczalne mogą przeprowadzać system ze stanu x° do zbioru X 1 w różnyir czasie, tzn., że różne mogą być nio tylko trajektorie stanów wewnętrz­ nych odpowiadające tym notowaniom, lecz także momenty końcowe ich dojś­ cia do X 1 .

Określmy na procesach dopuszczalnych funkcjonał całkowy $ z wartoś­ ciami 33 *1

$[(“ ,x)[t t j j ' j

fo ( x ( t ) ’ u(t)) d t ‘ *0 (3.3)

Wartość funkcjonału ( 3 13) bedziemy nazywać w s k a ź n i k i e m j a ­ k o ś c i procesu (u,x)r r i, zaś funkcjonał - k r y t e r i u m

L o ’ iJ 22

f v . n k c j o n o w a n i a systemu . 0 funkcji podcałkowej f zakła­ damy, że spełnia te same warunki co funkcja r w równaniu (3.1), tzn.

C *v ó x e c ° ! > " x u J •

K~ ł t \

" " ^ nazwiemy "o ’ u

p r o c e s e m o p t y m a l n y m , jeżeli spełniony będzie warunek A D e f i n i c j a 3.2. Proces dupuszczelny (u*. **)£ t t>ł]

J

f0 (x“ (t).u* ( t ) d t >

j

fQ (x(t), u(t))dt

o ’

ł 0

dla każaego procesu dopuszczaln«go (u,x) ^ . A

hrocusem optymalnym będzie zatem ten proces dopuszczalny, któren.u od­ powiada maksymalny wskaźnik Jakości. Jeżeli (u* >l>rt t «1 bidzie

pro-M O 1 ■* c e s e m o p t y m a l n y m , t o u f m] n a z w i e m y s t e r o w a n i e m o p -L O' t y m a l n y m , x t* J “ ° P t y m B l n 9 t r a j e k t o r i e s t a n ó w w e w n ę t r z n y c h , yM ft * 1 - o p t y m a l n ą L o l-1 r j i t r a j e k t o r i ą w y j ś c i t . a przedział czasu |_t -tjJ - o p ­ t y m a l n y m h o r y z o n t e m . Zadaniem sterowania optymalnego nazywamy zadanie wyboru procesu optymalnego - maksymalizującego wartość funkcjonału (3.3) - ze zoioru (z wiązki) procesów dopuszczalnych. Zadanie to będziemy zapisywać w następującej postaci:

*1

max J fQ (x(t), u (t))dr , (3.4)

x(t) = f(x(t),u(t)) ,

u ( t ) £ U , u € C ° [ t o ,t1J , <3 -5) x(to ) =. x°, x(tx ) 6 X 1 .

W dalszym ciągu nazywać je Dędziemy stacjonarnym zadaniem stepowania z kryterium całkowym i nie ustalonym momentem końcowym.

22 Ogólnie, kryterium funkcjonowania systemu mo.e być funkcjonałem określonym zarówno na dopjszczalnych procesach (u,x)rt t jak i na

od-L o ' 1-1

p o w i a d a j ą c y c h i m t r a j e k t o r i a c h w y j ś c i a y t r j . K r y t e r i u m t a k i e z a w s z e

można przekształcić do postaci (3.3) zważ/wszy, ze w każdym momencie cza­ su star wyjścia Jest z nałożenia ciągłą funkcją stanu wewnętrznego i sta­ nu wejścia (steiowanla).

Moment końcowy t w zadaniu tym nie Jest ustalony ad hoc (Jest

2mien-1

ną decyzyjny zaJaniej. 0 zoiorze sranow docelowych X zakładany, żt jest gładką rozmaitością w En ^3 .

A D e f i n i c J a 3.3. Niech p » (Pi>P2.... pk^ będzie funkcję wek­ torową z E1’ w Ek (k ^ n) . Niepusty zbiór

X1 = | x £ E n : p(x) = O

J

nazwiemy gładką (n-k)-wymiarową rozmaitością, jeżeli (i) p 6 C J [_ En J. (i i ) w każdym punkcie x £ X 1 wektory dp^(x)/'i)x * (dp^nj/j)

& P^l *)/ d x n). i”1 . 2, . . ., k , sę liniowo niezależne. A

Na przykłaa, zDiór wszystkich wekioiów x £ E n spełniających równanie < a , x > = const. będzie ( n-l)-wymiarową gładką rozmaitością , ( niperpłesz- czyzną) w E n , Jeżeli a/O.

Przyjmijmy oznaczenia

35

= | x € E n : Pjjx) = o j ,i=l,2.... k .

Wówczas X 1 * f"') X*. Zbiory > nazywamy h i p e r p o w i e r z c h X;

k

i=l

n i a m i g ł a d k i m i w E n . Punkt x £ X* nazywamy pjnkrea osob­ liwym hiperpowierzchni X^ , Jeżeli t)pi( x ) / ó x = O. Gładka hipei powierz - chnia nie mająca punktów osobliwych Jest (n-l)-wymiarową gładi ą rozma­ itością w E n . Niech P^^ x będzie hiperpłaszczyzną styczną w punkcie x £ X * do gładkiej hiperpowierzchni X*. Wówczas wektor ć)pi(x)/{)x jest jej wektorem normalnym, tzn.:

f n ‘>Pi(x ) 1

p i , x = l y € E :< - ^ t — ■ y-x > = °J • k

A d e f i n i c j a 3.4. (i) Zbiór Px = f'') PŁ nazywamy p ł a s z-i=l

c z y z n ę s t y c z n ę w punkcie x do gładkiej rozmaitości X^. (ii) Wektor z z początkiem w x nazywamy wektorem stycznym w punkcie x do gładkiej rozmaitości X 1 , Jeżeli Jest on ortogonalny do wszystkich wektorow óp^^ (*)/ ó* ,i=l,2, ...,k . A

Wektor z wtedy i tylko wtedy jest styczny do gładkiej rozmaitości X 1 w punkcie x , Jeżeli z « y-x dla pewnego y € px - Pojęcie płaszczyzny stycznej gra istotną rolę w warunkach optymalno-ici formułowanych dalej.

23

W teorii stnrowania optymalnego Jest to typowe założenie, dzięki któremu obok „właściwej" zasady maksimum pojawiają się dodatkowe tzw. wa­ runki transwersalności. Mowa o nich w dowodzie twierdzenia 3.1 (zob. Do­ datek matematyczny do paragrafu 3, twierdzenie 3.1, s. 212).

3 2. W arunki konieczne optymalr.ości. Z asad a maksimum Pontriagina w przypadku stacjonarnego zadania sterowania opLym ahego

ł kryterium całkowym i nie ustalonym momentem końcowym

Znane sę dwie podstawowe metody rozwiązywanie zadań sterowania opty­ malnego typu (3.4) - (3.5) :24 metoda Pontriagina 1 współpracowników, a o d - l n j mówiąc zespół warunków koniecznych optymalności znanych pod ogól­ ną nazwą z a s a d y m a k s i m u m oraz metoda pi ogramowenia dy­ namicznego, w której kluczowa rolę gra r ó w n a n i e B e l l m a - n a. W zastosowaniach metoda Pontriaginn jest na ogół dogodniejsza od metody Bellmana. W celu rozwiązania zadania sterowania optymalnego metodą programowanie dynamicznego potrzebne są p»wne dodatkowe informacje o właś­ ciwościach rozwiązań, których nie wyitaga metoda Pontriagina. Co więcej, posługując się zasadą maksimum Pontriagina, można 1 ozwiązać t ikj e zaca- nia,których w ogóle nie daje się rozwiązać metodą programowania dynamicz­ nego. Pełne wyprowadzenie warunków optynalnoścl (zasady maksimum) wykra­ cza poza ramy książki. Przy pewnych dodatkowych założeniach można Jednak stosunkowo łatwo otrzymać je z równania Bellmana. W tym celu potraktujemy zadanie (3.4) - (3.5) jako jedno z rodziny zadań z różnymi stanami po­ czątkowy ii x t En i momentami początkowymi t £ E * . Zamiast Jednego zada­ nia (3.4) - (3.5) rozpatrzymy zatem klasę zadań sterowania typu (3.4) -- 3.5) z ustalonym (we wszystkich zadaniach takim samym) zbiorem stanów docelowych X 1 , lecz z różnymi stanami i momentami początkowymi x,t.Wyjś­ ciowe zadanie (3.4) - (3.5) otrzymamy, przyjmując x ■ x D , t = t .

V z a ł o ż e n i e 3.1. Ola każdego stanu początkowego xfc Ł ' 1 do- wolnsgo momentu t € E1 Istnieje rozwiązanie zadania

s

max J fQ ( x (e), u(e)) d , (3.6) t

x(e) - f (x(b) ,u («))

u(e)6 u, u t c ° [t.t J , (3. 7)

x (t) - x, x (t ) e X 1 . ▼

W zadaniu tym, podobnie jak w zadaniu (3.4) - (3.5), moment końcowy t^ nie Jest ustalony. Oznaczmy przez 3(x,t) maksymalną wartość funkcjonału (3.6) w zadaniu (3.6) - (3.7) z momentem początkowym t i stanem począt­ kowym x. W mysi założenia 3.1 funkcja 3 zmiennych x,t jest

okreś-1 t-n+1

łona na L

Nie licząc tzw. metod gradientowych, w których wykorzystuje się aparat analizy funkcjonalnej, por.np. R. K u l i k o w s k i 28

7 z a ł O z o n i e 3.2. 3 e C 2 [e° x H1 ] .▼

Przy tych założeniach prawdziwe Jest następujące twierdzenie. 25

□ t w i e r d z e n i e 3.1. Oeżali spełnione są założenia 3.1, 3.2 i proces (u*, xM ) r i jest rozwiązaniem zadania (3.4) - (3.5),

Ll 0 * * 1 J

to istnieje taka stała w > 0 oraz takie rozwiązanie uj r ,, t

nia Ł V * l J 37 równa-d , X <>H (Y o - Y (t) > % « " ( * > )

HF

Y ( t ) ---

37

X - X * ( t ) ' ze w każdym momencie t € J m a x H ( y " , y * ( t ) . x " ( t ) ru) = H ty *, y * ( t ) . x X (t) . u * ( t ) ) = O, u 6 U

a ponadto w momencie końcowym t*

< / ( * & . x - x * ( t j ) > - O

dla każdego wektora x € P ^dzie H ( y o * Y >x »u ) ■

■» Y 0 fQ (x,u) + < y , f ( x , u ) > , PxMjtxj jest płaszczyzną styczną punkcie x*(t *). ■

do X 1

To, że przy dowodzie tego twierdzenia korzysta się z. założań 3.1,3.2 nie miałoby większego znaczenia, goyby założenia te były spełnione w prak­ tyce. Okazuje się Jednak, że w konkretnych zadaniach sterowania, z który­ mi spotykamy się w praktyce, założenia te na ogół nie są spełnione. Pon- tragin i współpracownicy wyprowadzili zespół warunków koniecznych opty­ malności bardzo podobny do warunków sformułowanych w twierdzeniu 3.1,Jed­ nak bez założeń 3.1, 3.2. Dzięki temu właśnie, a także ze względu na jej przejrzystość i prostotę, zasada mai slmum Pontriagina stanowi podstawową metodę rozwiązywania wielu praktycznych zadań sterowania optymalnego.

Teza twierdzenia, które formułujemy poniżej różni się nieznacznie od tezy twierdzenia 3.1. Twierdzenie 3.2 jeat ogólniejsze, ponieważ proce­ sy '.p*łniające warunki twierdzonia 3.1 spełniają również warunki tego twierdzenia. Jego najistotniejszą zaletą Jest to, że w odróżnieniu od twierdzenia 3.1 Jest prawdziwe bez zaiozeń 3.1, 3.2.

□ T w i e r d z e n i e 3.2.26 Miech proces (u* x*) J będzie rozwiązaniem następującego stacjonarnego zadania sterowania optymalnego z kryterium całko'vym, ustalonym momentem początkowym i m e ustalonym mo­ mentem końcowym;

Dowód,zob.Dodatek matematyczny do paragrafu 3, T w i e r d z e n i e 3.1. s .212.

Zob.np. O. G e d y m l n [20] i ,134-135, twierdzenie 2-5. 26

t,

max J f0 (<(t),u(t)) dt ,

^ x( t ) « f ! x( t) ,u(t) ) , u ( t ) e u . u € Ć° [ t o ,t1 ] ,

x(t0 )» x°, x(t,)6 X 1

( f “ ( f f 2 ‘ ” ' ' f r>) ’ fo ,f' d f o l ^ x ’ ^ f/ir ^ X ^ C° [ Enx u]; X 1 Je6t gładką rozmaitością w En) .

Zdefiniujmy funkcję H (h&miltonian) zmiennych l|/0 ^ E > y , x 6 E n , u 6 Em :

h ( y 0 . y . x . u) - % f 0<x »u) + < Y * f ( * . u ) > .

istnieje stała y * 0 oraz takib rozwiązanie y t J równania

d d H ( y * . y ( t ) .x,uM (t))

^ y f t ) --- T 7

---c x że x=x*(t) ’ (A) ( y * , y M (t)) / o w każdym momencie t £ Ct0 'tJ 1 '

fB) ax H ( y * , y*(t) x*{t),u) ■= n ( y * , i|f M ( t) ,xK (t) .u*(t)) = O u 6 U

w każdym momencie t € '

(C) < y M (t*) . x - x*(t*)> = O

dla każdego wektora x e p x*(t*) gdzie px*( t* ) J1*41 P*a»zczYzne stycz­ ną do gładkiej rozmaitości X 1 w punkcie x* (t*) . fl

Twierdzenie tc, pozę tym, że jest prawdziwe bez założeń 3.1, 3.2 różni się tylko tym od twierdzenia 3.1, że stała y ” może, ogólnie biorąc, przyjęć obecnie również wartość zerową i wobec tego p o j a M a się dodatkowy warunek (nietrywialności) (A). W twierdzeniu 3.1 warunek ten jest zawsre spełniony, a stałą * wprowadziliśmy tam po to, aby otrzymać tezę ma­ ksymalnie zbliżoną do tezy twierdzenia 3.2. Je-jo dowód jest Jednak znacz­ nie trudniejszy i wykracza poza ramy tej książki. Zainteresowanego Czy­ telnika odsyłamy do prac wymienionych na początku paragrafu.