∫ ∫ WYK Ł AD nr 10

(1)

WYKŁAD nr 10

1. ZASADA MAKSIMUM

Jedna z najsilniejszych postaci warunków koniecznych optymalności dla problemów optymalizacji dynamicznej została podana przez Pontriagina i współpracowników w 1956 r. Siła zasady maksimum dotyczy w zasadzie tylko problemów, w których stan chwilowy x(t) jest elementem przestrzeni Rⁿ, dla układów liniowych warunki wynikające z zasady maksimum są warunkami koniecznymi i wystarczającymi, lecz ogólnie rzecz ujmując daje ona jedynie warunki konieczne optymalności, które np. w odniesieniu do układów nieliniowych nie są warunkami wystarczającymi.

W zależności od problemów optymalizacji do rozwiązania których zasada maksimum została zastosowana, istnieje kilka jej wariantów wywodzących się z tzw. wariantu podstawowego.

Rozpatrzmy ciągły problem o:

a) równaniu stanu

( ) ( )

[

t t t

] ( )

t

( )

t t

[

t t T

]

f

t)= , , , ∈ = ∈ , _k =

( x u x ₀ W ₀ x₀ ₀

x& _x (1)

stan i funkcja x(t) ^f

[

^x

( ) ( )

^t ^{, u}^t ^,^t

]

są wektorami wymiarowymi .

n x(t)∈Rⁿ,

( ) ( ) [

t t t

]

Rⁿ f x , u , ∈

O funkcji ^f

[

^x

( ) ( )

^t ^{, u}^t ^,^t

]

^∈^Rⁿ zakładamy że ze względu na stan jest klasy (ciągła wraz z pierwszą pochodną ), ze względu na sterowanie oraz czas jest klasy

C1

fx

D (przedziałami ciągła), 0

b) wskaźniku jakości (Problem Bolza)

(2)

[ ]

⁼

[ ( ) ( ) ]

⁺

∫

^t^k

[

t k

k t f t t t dt

t t K t t F

0

, ) ( , ) ( ,

) ( , )

( x x ₀ x ₀u x

u ,

]

gdzie K, f₀ są funkcjami skalarnymi klasy C¹, funkcja K określona jest na zbiorze X× X×T, funkcja określona jest na niepustym zbiorze dopuszczalnych procesów sterowania .

f0

D

Do podstawowych problemów optymalizacji należą również:

problem Lagrange’a o wskaźniku

[ ]

⁼

∫

^t^k

[

t

dt t t t f t t F

0

, ) ( , ) ( )

( , )

( x ₀ u x

u

]

K

[

x

( ) ( )

t₀ ,xt_k ,t_k

]

≡1

(2)

problem Mayera o wskaźniku

[

t t

]

K

[ ( ) ( )

t tk tk

]

F u( ), x( ) = x ₀ ,x ,

[

⁽ ⁾^, ⁽ ⁾^,

]

¹

0

0 ≡

∫

^k

t

dt t t t

f u x

c) ograniczeniach chwilowych na wartości sterowania

[

k

]

d t t t

t) , ,

( ∈U ∈ ₀

u (3)

wektor sterowania u(t) jest przedziałami ciągły u(t)∈PC

(

T,Ud

)

, przy czym jest domkniętym, wypukłym i ograniczonym podzbiorem przestrzeni

Ud r

wymiarowej R i nie zależy od stanu. Zakładamy skończoną ilość punktów ^r nieciągłości sterowania u(t)∈U_d, t∈

[

t₀,t_k

]

, punkty te są nieciągłościami pierwszego rodzaju co oznacza, że istnieje lewostronna i prawostronna granica d) ograniczeniach chwilowych na wartość stanu

[

k

]

d t t t

t) , ,

( ∈ X ∈ ₀

x (4)

wektor stanu x(t) jest ciągły i przedziałami różniczkowalny.

Dla warunków a–d stawiamy problem znalezienia minimum funkcjonału (2) na zbiorze , tzn. należy znaleźć sterowanie optymalne

i optymalna trajektorie stanu

[

(t), (t)

F u x

]

)

^D

(

,Ud

) ˆ(t ∈PCT

u xˆ(t)∈ Xd,t∈

[

t₀,tk

]

takie że dla pary

(

^x^ˆ⁽^t⁾^, ^u⁽^t⁾

)

^∈^D funkcjonał (2) osiąga swą wartość minimalną.

Rozwiązanie postawionego problemu optymalizacji wymaga wprowadzenia funkcji H zwanej hamiltonianem, oraz funkcji sprzężonej ze stanem, spełniającej równanie różniczkowe sprzężone (Obszerny opis, stosowne twierdzenia wraz z dowodami można znaleźć [H. Górecki Optymalizacja systemów dynamicznych, PWN, Warszawa 1993] [38]).

) (t η

2 Wariant podstawowy

A. Stan początkowy ustalony, stan końcowy swobodny, czas końcowy ustalony

Metodyka wykorzystania zasady maksimum jest następująca. Dla równania stanu wg (1) i wskaźnika jakości wg (2):

1. Formułujemy hamiltonian (funkcje Hamiltona) zadania optymalizacji i poszukujemy jego maksimum

[

^t ^t ^t ^t

]

^f

[

^t ^t ^t

]

^t ^f

[

^t ^t ^t

]

H x( ),u( ),η( ), =− ₀ x( ),u( ), +η( )^T ⋅ x( ),u( ), (5)

(3)

2. Zakładamy, że potrafimy rozwiązać na drodze analitycznej zadanie poszukiwania maksimum hamiltonianu względem i wyznaczyć sterowanie ekstremalne

) (t u

( )

[

^∇ η

]

⁼⁰

T x u

uH _ˆ_,_ˆ_,_ˆ ⇒ uˆ(t)=ϕ(ηˆ(t),xˆ(t),t) (6) 3. Podstawiamy wyznaczone sterowanie ekstremalne do równań stanu i równań

sprzężonych, uzyskując układ równań nazywany układem kanonicznym

( )

[

∇_ηH _uˆ,_xˆ

]

^T =x&^ˆ⁽t⁾ x(t₀)=x₀ (7)

( )

[

− ∇_xH _uˆ,_xˆ,_ηˆ

]

^T=η&^ˆ⁽t⁾ (8)

4. Założymy, że potrafimy rozwiązać równania kanoniczne na drodze analitycznej z góry zakładając znajomość warunków początkowych dla wektora , warunki są znane. Każde (przy dowolnych warunkach początkowych ) rozwiązanie przedstawionego układu równań nazywać będziemy ekstremalami problemu. Zakładamy, że znamy postać analityczną ekstremal

.

) ˆ(t₀ η )

(t₀ x

) ˆ( , ) ˆ(t₀ ηt₀ x

) ), ˆ( , ˆ( , ) ), ˆ( ,

(x₀ ηt₀ t η x₀ ηt₀ t x

5. Korzystając z prawego warunku brzegowego na zmienna sprzężoną

[

−∇_x(_t_k)K

]

^T=η^ˆ⁽T⁾ (9)

uzyskujemy właściwe warunki początkowe dla zmiennych sprzężonych oraz docelowe ekstremale x xˆ( ₀, ηˆ(t₀), t),ηˆ(x₀, ηˆ(t₀),t).

6. Podstawiając docelowe ekstremale do zależności )uˆ(t)=ϕ(ηˆ(t),xˆ(t),t uzyskujemy sterowanie jedno lub kilka, spełniające wszystkie warunki zasady maksimum. Jeżeli uzyskamy kilka sterowań, należy je porównać, obliczając dla każdego z nich wskaźnik jakości.

B. Stan początkowy swobodny, stan końcowy ustalony, czas końcowy ustalony

Metodyka wykorzystania zasady maksimum w obecnej sytuacji jest następująca:

Formułujemy hamiltonian (funkcje Hamiltona) zadania optymalizacji i poszukujemy jego maksimum

[

^t ^t ^t ^t

]

^f

[

^t ^t ^t

]

^t ^f

[

^t ^t ^t

]

H x( ),u( ),η( ), =− ₀ x( ),u( ), +η( )^T ⋅ x( ),u( ), (10)

( )

[

^∇ η

]

⁼⁰

T x

uH u_ˆ_,_ˆ_,_ˆ ⇒ uˆ(t)=ϕ(ηˆ(t),xˆ(t),t) (11) Rozwiązujemy kanoniczny układ równań

(4)

( )

[

∇_ηH _uˆ,_xˆ

]

^T=x&^ˆ⁽t⁾ x(t_k)=x_T (12)

( )

[

]

^T=η&^ˆ⁽t⁾ (13)

z warunkiem początkowym na zmienną sprzężoną

[

∇_x(_t₀)K

]

^T=η^ˆ⁽t0⁾ (14)

C. Stan początkowy swobodny, stan końcowy swobodny, czas końcowy ustalony

Metodyka wykorzystania zasady maksimum w obecnej sytuacji jest następująca:

Formułujemy hamiltonian (funkcje Hamiltona) zadania optymalizacji i poszukujemy jego maksimum

[

^t ^t ^t ^t

]

^f

[

^t ^t ^t

]

^t ^f

[

^t ^t ^t

]

H x( ),u( ),η( ), =− ₀ x( ),u( ), +η( )^T ⋅ x( ),u( ), (15)

( )

[

^∇uH _u_ˆ_,_x_ˆ_,_η_ˆ

]

^T ⁼⁰ ⇒ uˆ(t)=ϕ(ηˆ(t),xˆ(t),t) (16) Rozwiązujemy kanoniczny układ równań

( )

[

H ˆ,ˆ

]

^T ^ˆ⁽t⁾

x

u =x&

∇_η (17)

( )

[

]

^T=η&^ˆ⁽t⁾ (18)

z warunkami brzegowymi na zmienną sprzężoną

[

∇_x(_t₀)K

]

^T=η^ˆ⁽t0⁾

[

( )

]

^ˆ⁽ k⁾ T t

x K t

k =η

∇

− (19)

3. Wariant I (stan początkowy ustalony, stan końcowy swobodny, czas końcowy swobodny)

Różnica między wariantem podstawowym a wariantem ze swobodnym czasem końcowym wynika z faktu, że poza tym iż nie narzuca się dla czasu optymalizacji innych ograniczeń. Funkcja

t0

t_k^∗ >

( ) ( ) [

^t ^t ^t

]

^Rⁿ

f x , u , ∈ (1) powinna być klasy C⁰ ze względu na czas.

Problem w tym przypadku sprowadza się do znalezienia:

1) optymalnego czasu końcowego tˆ_k >t₀,

2) dopuszczalnego sterowania optymalnego uˆ(t):

[

t₀, ∞

)

→Ud,

które zminimalizują funkcjonał reprezentujący kryterium jakości, np. w postaci (2).

Sterowanie optymalne w przedziale

[ ]

t ,₀ t^∗k musi spełniać warunki konieczne uzyskane z wariantu podstawowego

(5)

[

t t t t

]

f

[

t t t

]

t f

[

t t t

]

H x( ),u( ),η( ), =− ₀ x( ),u( ), +η( )^T ⋅ x( ),u( ), (20)

( )

[

^∇ η

]

⁼⁰

T x

( )

[

∇_ηH _uˆ,_xˆ

]

^T =x&^ˆ⁽t⁾, x(t₀)= , x₀

[

−

(

∇_xH

)

_uˆ,_xˆ,_ηˆ

]

^T=η&^ˆ⁽t⁾ (22) z warunkiem brzegowym na zmienną sprzężoną

[

( )

]

^ˆ⁽ ⁾

= ∗

∇

− _x_t K ^T t_k

k η (23)

Dodatkowy warunek konieczny do optymalizacji czasu końcowego uzyskujemy z analizy wariacji funkcji

tˆk

[

x t^∗k tk^∗

]

K ( ), wokół optymalnego czasu końcowego i jej wpływu na wartość wskaźnika jakości.

tˆk

[

^∗ ^∗

] [

⁼ ^∗ ^∗ ^∗ ^∗

∂

k k k k k

k

k H x t u t η t t

t t t x

K ( ), ( ), ( ), ( ),

*

]

⁽²⁴⁾

4. Wariant II (stan początkowy i końcowy ustalony, czas końcowy swobodny)

Przy ustalonym czasie optymalizacji, oraz ustalonych warunkach końcowych na trajektoriach stanów, postępujemy jak poniżej:

[

t t t t

]

f

[

t t t

]

t f

[

t t t

]

H x( ),u( ),η( ), =− ₀ x( ),u( ), +η( )^T ⋅ x( ),u( ), (25)

( )

[

^∇ η

]

⁼⁰

T x

( )

[

∇_ηH _uˆ,_xˆ

]

^T=x&^ˆ⁽t⁾ x(t₀)=x₀, x(t^∗_k)=x_t∗ (27)

( )

[

]

^T=η&^ˆ⁽t⁾ (28)

Dodatkowy warunek konieczny do optymalizacji czasu końcowego uzyskujemy z analizy wariacji funkcji

tˆk

[

x t^∗k tk^∗

]

K ( ), wokół optymalnego czasu końcowego i jej wpływu na wartość wskaźnika jakości

tˆk

[

_∂ ^∗ ^∗

] [

⁼ ^∗ ^∗ ^∗ ^∗

∂

k k k k k

k

k H x t u t η t t

t t t x

K ( ), ( ), ( ), ( ),

*

]

⁽²⁹⁾