WYKŁAD nr 10
1. ZASADA MAKSIMUM
Jedna z najsilniejszych postaci warunków koniecznych optymalności dla problemów optymalizacji dynamicznej została podana przez Pontriagina i współpracowników w 1956 r. Siła zasady maksimum dotyczy w zasadzie tylko problemów, w których stan chwilowy x(t) jest elementem przestrzeni Rn, dla układów liniowych warunki wynikające z zasady maksimum są warunkami koniecznymi i wystarczającymi, lecz ogólnie rzecz ujmując daje ona jedynie warunki konieczne optymalności, które np. w odniesieniu do układów nieliniowych nie są warunkami wystarczającymi.
W zależności od problemów optymalizacji do rozwiązania których zasada maksimum została zastosowana, istnieje kilka jej wariantów wywodzących się z tzw. wariantu podstawowego.
Rozpatrzmy ciągły problem o:
a) równaniu stanu
( ) ( )
[
t t t] ( )
t( )
t t[
t t T]
f
t)= , , , ∈ = ∈ , k =
( x u x 0 W 0 x0 0
x& x (1)
stan i funkcja x(t) f
[
x( ) ( )
t , ut ,t]
są wektorami wymiarowymi .n x(t)∈Rn,
( ) ( ) [
t t t]
Rn f x , u , ∈O funkcji f
[
x( ) ( )
t , ut ,t]
∈Rn zakładamy że ze względu na stan jest klasy (ciągła wraz z pierwszą pochodną ), ze względu na sterowanie oraz czas jest klasyC1
fx
D (przedziałami ciągła), 0
b) wskaźniku jakości (Problem Bolza)
(2)
[ ]
=[ ( ) ( ) ]
+∫
tk[
t k
k t f t t t dt
t t K t t F
0
, ) ( , ) ( ,
) ( , )
( x x 0 x 0u x
u ,
]
gdzie K, f0 są funkcjami skalarnymi klasy C1, funkcja K określona jest na zbiorze X× X×T, funkcja określona jest na niepustym zbiorze dopuszczalnych procesów sterowania .
f0
D
Do podstawowych problemów optymalizacji należą również:
problem Lagrange’a o wskaźniku
[ ]
=∫
tk[
t
dt t t t f t t F
0
, ) ( , ) ( )
( , )
( x 0 u x
u
]
K[
x( ) ( )
t0 ,xtk ,tk]
≡1problem Mayera o wskaźniku
[
t t]
K[ ( ) ( )
t tk tk]
F u( ), x( ) = x 0 ,x ,
[
( ), ( ),]
10
0 ≡
∫
kt
t
dt t t t
f u x
c) ograniczeniach chwilowych na wartości sterowania
[
k]
d t t t
t) , ,
( ∈U ∈ 0
u (3)
wektor sterowania u(t) jest przedziałami ciągły u(t)∈PC
(
T,Ud)
, przy czym jest domkniętym, wypukłym i ograniczonym podzbiorem przestrzeniUd r
wymiarowej R i nie zależy od stanu. Zakładamy skończoną ilość punktów r nieciągłości sterowania u(t)∈Ud, t∈
[
t0,tk]
, punkty te są nieciągłościami pierwszego rodzaju co oznacza, że istnieje lewostronna i prawostronna granica d) ograniczeniach chwilowych na wartość stanu[
k]
d t t t
t) , ,
( ∈ X ∈ 0
x (4)
wektor stanu x(t) jest ciągły i przedziałami różniczkowalny.
Dla warunków a–d stawiamy problem znalezienia minimum funkcjonału (2) na zbiorze , tzn. należy znaleźć sterowanie optymalne
i optymalna trajektorie stanu
[
(t), (t)F u x
]
)
D(
,Ud) ˆ(t ∈PCT
u xˆ(t)∈ Xd,t∈
[
t0,tk]
takie że dla pary(
xˆ(t), u(t))
∈D funkcjonał (2) osiąga swą wartość minimalną.Rozwiązanie postawionego problemu optymalizacji wymaga wprowadzenia funkcji H zwanej hamiltonianem, oraz funkcji sprzężonej ze stanem, spełniającej równanie różniczkowe sprzężone (Obszerny opis, stosowne twierdzenia wraz z dowodami można znaleźć [H. Górecki Optymalizacja systemów dynamicznych, PWN, Warszawa 1993] [38]).
) (t η
2 Wariant podstawowy
A. Stan początkowy ustalony, stan końcowy swobodny, czas końcowy ustalony
Metodyka wykorzystania zasady maksimum jest następująca. Dla równania stanu wg (1) i wskaźnika jakości wg (2):
1. Formułujemy hamiltonian (funkcje Hamiltona) zadania optymalizacji i poszukujemy jego maksimum
[
t t t t]
f[
t t t]
t f[
t t t]
H x( ),u( ),η( ), =− 0 x( ),u( ), +η( )T ⋅ x( ),u( ), (5)
2. Zakładamy, że potrafimy rozwiązać na drodze analitycznej zadanie poszukiwania maksimum hamiltonianu względem i wyznaczyć sterowanie ekstremalne
) (t u
( )
[
∇ η]
=0T x u
uH ˆ,ˆ,ˆ ⇒ uˆ(t)=ϕ(ηˆ(t),xˆ(t),t) (6) 3. Podstawiamy wyznaczone sterowanie ekstremalne do równań stanu i równań
sprzężonych, uzyskując układ równań nazywany układem kanonicznym
( )
[
∇ηH uˆ,xˆ]
T =x&ˆ(t) x(t0)=x0 (7)( )
[
− ∇xH uˆ,xˆ,ηˆ]
T=η&ˆ(t) (8)4. Założymy, że potrafimy rozwiązać równania kanoniczne na drodze analitycznej z góry zakładając znajomość warunków początkowych dla wektora , warunki są znane. Każde (przy dowolnych warunkach początkowych ) rozwiązanie przedstawionego układu równań nazywać będziemy ekstremalami problemu. Zakładamy, że znamy postać analityczną ekstremal
.
) ˆ(t0 η )
(t0 x
) ˆ( , ) ˆ(t0 ηt0 x
) ), ˆ( , ˆ( , ) ), ˆ( ,
(x0 ηt0 t η x0 ηt0 t x
5. Korzystając z prawego warunku brzegowego na zmienna sprzężoną
[
−∇x(tk)K]
T=ηˆ(T) (9)uzyskujemy właściwe warunki początkowe dla zmiennych sprzężonych oraz docelowe ekstremale x xˆ( 0, ηˆ(t0), t),ηˆ(x0, ηˆ(t0),t).
6. Podstawiając docelowe ekstremale do zależności )uˆ(t)=ϕ(ηˆ(t),xˆ(t),t uzyskujemy sterowanie jedno lub kilka, spełniające wszystkie warunki zasady maksimum. Jeżeli uzyskamy kilka sterowań, należy je porównać, obliczając dla każdego z nich wskaźnik jakości.
B. Stan początkowy swobodny, stan końcowy ustalony, czas końcowy ustalony
Metodyka wykorzystania zasady maksimum w obecnej sytuacji jest następująca:
Formułujemy hamiltonian (funkcje Hamiltona) zadania optymalizacji i poszukujemy jego maksimum
[
t t t t]
f[
t t t]
t f[
t t t]
H x( ),u( ),η( ), =− 0 x( ),u( ), +η( )T ⋅ x( ),u( ), (10)
( )
[
∇ η]
=0T x
uH uˆ,ˆ,ˆ ⇒ uˆ(t)=ϕ(ηˆ(t),xˆ(t),t) (11) Rozwiązujemy kanoniczny układ równań
( )
[
∇ηH uˆ,xˆ]
T=x&ˆ(t) x(tk)=xT (12)( )
[
− ∇xH uˆ,xˆ,ηˆ]
T=η&ˆ(t) (13)z warunkiem początkowym na zmienną sprzężoną
[
∇x(t0)K]
T=ηˆ(t0) (14)C. Stan początkowy swobodny, stan końcowy swobodny, czas końcowy ustalony
Metodyka wykorzystania zasady maksimum w obecnej sytuacji jest następująca:
Formułujemy hamiltonian (funkcje Hamiltona) zadania optymalizacji i poszukujemy jego maksimum
[
t t t t]
f[
t t t]
t f[
t t t]
H x( ),u( ),η( ), =− 0 x( ),u( ), +η( )T ⋅ x( ),u( ), (15)
( )
[
∇uH uˆ,xˆ,ηˆ]
T =0 ⇒ uˆ(t)=ϕ(ηˆ(t),xˆ(t),t) (16) Rozwiązujemy kanoniczny układ równań( )
[
H ˆ,ˆ]
T ˆ(t)x
u =x&
∇η (17)
( )
[
− ∇xH uˆ,xˆ,ηˆ]
T=η&ˆ(t) (18)z warunkami brzegowymi na zmienną sprzężoną
[
∇x(t0)K]
T=ηˆ(t0)[
( )]
ˆ( k) T tx K t
k =η
∇
− (19)
3. Wariant I (stan początkowy ustalony, stan końcowy swobodny, czas końcowy swobodny)
Różnica między wariantem podstawowym a wariantem ze swobodnym czasem końcowym wynika z faktu, że poza tym iż nie narzuca się dla czasu optymalizacji innych ograniczeń. Funkcja
t0
tk∗ >
( ) ( ) [
t t t]
Rnf x , u , ∈ (1) powinna być klasy C0 ze względu na czas.
Problem w tym przypadku sprowadza się do znalezienia:
1) optymalnego czasu końcowego tˆk >t0,
2) dopuszczalnego sterowania optymalnego uˆ(t):
[
t0, ∞)
→Ud,które zminimalizują funkcjonał reprezentujący kryterium jakości, np. w postaci (2).
Sterowanie optymalne w przedziale
[ ]
t ,0 t∗k musi spełniać warunki konieczne uzyskane z wariantu podstawowego[
t t t t]
f[
t t t]
t f[
t t t]
H x( ),u( ),η( ), =− 0 x( ),u( ), +η( )T ⋅ x( ),u( ), (20)
( )
[
∇ η]
=0T x
uH uˆ,ˆ,ˆ ⇒ uˆ(t)=ϕ(ηˆ(t),xˆ(t),t) (21) Rozwiązujemy kanoniczny układ równań
( )
[
∇ηH uˆ,xˆ]
T =x&ˆ(t), x(t0)= , x0[
−(
∇xH)
uˆ,xˆ,ηˆ]
T=η&ˆ(t) (22) z warunkiem brzegowym na zmienną sprzężoną[
( )]
ˆ( )= ∗
∇
− xt K T tk
k η (23)
Dodatkowy warunek konieczny do optymalizacji czasu końcowego uzyskujemy z analizy wariacji funkcji
tˆk
[
x t∗k tk∗]
K ( ), wokół optymalnego czasu końcowego i jej wpływu na wartość wskaźnika jakości.
tˆk
[
∗ ∗] [
= ∗ ∗ ∗ ∗∂
∂
k k k k k
k
k H x t u t η t t
t t t x
K ( ), ( ), ( ), ( ),
*
]
(24)4. Wariant II (stan początkowy i końcowy ustalony, czas końcowy swobodny)
Przy ustalonym czasie optymalizacji, oraz ustalonych warunkach końcowych na trajektoriach stanów, postępujemy jak poniżej:
[
t t t t]
f[
t t t]
t f[
t t t]
H x( ),u( ),η( ), =− 0 x( ),u( ), +η( )T ⋅ x( ),u( ), (25)
( )
[
∇ η]
=0T x
uH uˆ,ˆ,ˆ ⇒ uˆ(t)=ϕ(ηˆ(t),xˆ(t),t) (26) Rozwiązujemy kanoniczny układ równań
( )
[
∇ηH uˆ,xˆ]
T=x&ˆ(t) x(t0)=x0, x(t∗k)=xt∗ (27)( )
[
− ∇xH uˆ,xˆ,ηˆ]
T=η&ˆ(t) (28)Dodatkowy warunek konieczny do optymalizacji czasu końcowego uzyskujemy z analizy wariacji funkcji
tˆk
[
x t∗k tk∗]
K ( ), wokół optymalnego czasu końcowego i jej wpływu na wartość wskaźnika jakości
tˆk
[
∂ ∗ ∗] [
= ∗ ∗ ∗ ∗∂
k k k k k
k
k H x t u t η t t
t t t x
K ( ), ( ), ( ), ( ),
*