WYKŁAD 14 1. Programowanie dynamiczne ( optymalizacja wieloetapowa )

(1)

WYKŁAD 14

1. Programowanie dynamiczne ( optymalizacja wieloetapowa )

Optymalizacja wieloetapowa jest nazywana w literaturze programowaniem dynamicznym . Nazwa ta wywodzi się stąd, że pierwsze zastosowania optymalizacji wieloetapowej miały miejsce w automatyce do optymalizacji układów dynamicznych .

Optymalizację wieloetapową można stosować tylko w tych zadaniach w których proces rozwiązania można sprowadzić do procesu markowskiego. Proces markowski ma tę właściwość , że po podjęciu określonej liczby decyzji np. , w wyniku podjęcia -tej decyzji , (przy czym ) stan procesu zależy tylko od stanu bezpośrednio po podjęciu -tej decyzji oraz ciągu decyzji podjętych później .

k

n n>k

k

Systemy pracujące sekwencyjnie , procesy wieloetapowe układy i systemy dynamiczne na ogół łatwo dają się optymalizować wieloetapowo , ponieważ wieloetapowość jest cechą ich sposobu działania .

2. Zasada optymalności

U podstaw algorytmów wg których przeprowadzana jest optymalizacja wieloetapowa leży zasada optymalności .

Zasadę optymalności można sformułować następująco : dowolny fragment optymalnego łańcucha stanów , jest łańcuchem optymalnym łączącym stany początkowy i końcowy tego fragmentu.

>

< N Łˆ 0,

) 0

ˆs( ˆs(1)

) ( ) ˆ(i s i

s = ^×

) 1 ( ˆi+ s

) 1 ˆ(k− s

) ( ) ( ˆk s k

s = ^× sˆ N( )

) 1 ( +

× i

s s^×(k−1)

Rys. 1 Optymalny łańcuch stanów ^Ł^ˆ

[

^s^ˆ⁽⁰⁾^,^s^ˆ⁽^N⁾

]

Weźmiemy pod uwagę łańcuch stanów ^Ł^ˆ

[

^s^ˆ⁽⁰⁾^,^s^ˆ⁽^N⁾

]

przedstawiony na rysunku 1 Wyróżnimy następnie dwa etapy pośrednie „ i ” oraz „ k ” ( przy czy k>i).

(2)

Przyjmiemy założenie ze fragmenty łańcucha ^Ł^ˆ

[

^s^ˆ⁽⁰⁾^,^s^ˆ⁽ⁱ⁾

]

^oraz^Ł^ˆ

[

^s^ˆ⁽^k⁾^,^s^ˆ⁽^N⁾

]

^są

optymalne oraz że między stanami sˆ(i), sˆ(k) można znaleźć łańcuch

[

^s ⁽ⁱ⁾^,^s ⁽^k⁾

]

Ł^× ^× ^× lepszy od dotychczasowego (zaznaczony na rysunku linią przerywaną ). Jeżeli tak to można znaleźć lepszy łańcuch ^Ł^×

[

^s^×⁽⁰⁾^,^s^×⁽^N⁾

]

^w

przypadku zastąpienia dotychczasowego fragmentu ^Ł^ˆ

[

^s^ˆ⁽ⁱ⁾^,^s^ˆ⁽^k⁾

]

fragmentem

[

^s ⁽ⁱ⁾^,^s ⁽^k⁾

]

Ł^× ^× ^× . Takie zastąpienie przeczy jednak założeniu ,że łańcuch jest optymalny . Wynika z tego że fragment

[

^ˆ⁽⁰⁾^,^ˆ⁽ ⁾

ˆ s s N

Ł

]

^Ł^ˆ

[

^s^ˆ⁽ⁱ⁾^,^s^ˆ⁽^k⁾

]

^łańcucha

jest fragmentem optymalnym .

[

^ˆ⁽⁰⁾^,^ˆ⁽ ⁾

ˆ s s N

Ł

]

3. Algorytm optymalizacji wieloetapowej

Konstrukcję algorytmu optymalizacji wieloetapowej przedstawimy na przykładzie problemu optymalizacji pracy zbiornika retencyjnego w interwale czasu

.Posłużymy się problemem , którego główne założenia sprowadzają się do :

[

^t ^T

]

t∈ ₀,

• uzyskanie w chwili końcowej horyzontu optymalizacji T , maksymalnie zbliżonego wypełnienia zbiornika xˆ T( ) do żądanego wypełnienia x^W(T)

• zapewnienie odpływu ze zbiornika ^u^ˆ⁽^t⁾^,^∀^t^∈

[ ]

⁰^,^T , który w minimalny sposób odbiegać będzie od określonego funkcją zapotrzebowania pożądanego odpływu ze zbiornika w całym horyzoncie optymalizacji

,

) (t Y

[ ]

^T

t∈ 0,

• określenie trajektorii stanu zbiornika w całym horyzoncie optymalizacji tj.

) ˆ t(

[

^T x t^∈ 0,

]

∀ , zapewniającej minimalne odchylenia od żądanej (określonej wcześniej w oparciu o inne kryteria ) trajektorii

[ ]

^T . t t

x^W(),∀ ∈ 0,

Wzajemne relacje między składnikami wskaźnika kształtują współczynniki wag

3.

2 1,a ,a a

a.) analityczna postać wskaźnika jakości uwzględniająca powyższe wymagania jest następująca :

[ ]

( )

[ ] [ ]

( )

{ }

⎪⎪

⎭

⎪⎪⎬

⎫

⎪⎪

⎩

⎪⎪⎨

⎧

−

⋅ +

−

⋅ +

+

−

⋅

=

∫

⁺

+ T

W W

W

dt t u t u a t x t x a

T x T x a F

0

3 2 2 2

1 2

) ( ) ( )

( ) (

) ( ) ( 5

. 0

(3)

(1) w której :

) ˆ t(

x trajektoria stanu zbiornika w okresie optymalizacji ^∀^t^∈

[ ]

⁰^,^T

) (t

x^W wymagana trajektoria stanu zbiornika w okresie optymalizacji

[ ]

^T

t∈ 0,

∀

) (T

x wypełnienie zbiornika na koniec rozpatrywanego interwału czasu ( horyzontu optymalizacji T ),

) (T

x^W żądane wypełnienie zbiornika na koniec rozpatrywanego interwału czasu ( horyzoncie optymalizacji T ),

) ˆ t(

u odpływ ze zbiornika w okresie optymalizacji ^∀^t^∈

[ ]

⁰^,^T

) (t

u^W pożądany odpływ ze zbiornika w całym horyzoncie optymalizacji

[ ]

^T

t∈ 0, , ( funkcja zapotrzebowania )

3 2 1,a ,a

a współczynnik wag powiązany ze składnikami wskaźnika jakości.

b.) równanie stanu zbiornika sprowadza się do zależności między prognozowanym dopływem do zbiornika a sterowanym odpływem

) (2)

( ) ( )

(t Q t u t x& = ^P −

) 0

0 ( ,

0 x x

t

dla = =

gdzie : prognozowany Q^P(t) dopływ do zbiornika ^∀^t^∈

[ ]

⁰^,^T

wypełnienie zbiornika w chwili

x0 t=0

c.) ograniczenia sterowania

u_min(t)≤u(t)≤u_max(t) (3)

gdzie: u_min(t) - dolne ograniczenie sterowania (odpływu) u_max(t) - górne ograniczenie sterowania (odpływu) d.) ograniczenia stanu zbiornika

(4) )

( ) ( )

(t x t x t

x_d ≤ ≤ _g

gdzie : x_d(t) dolne ograniczenie stanu zbiornika , górne ograniczenie stanu zbiornika )

(t x_g

Celem uproszczenia opisu algorytmu przyjęto stałe w czasie dolne i górne ograniczenia stanu

(4)

e.) Do określenia dalszych zależności konieczne jest przeprowadzenie dyskretyzacji przedziału czasu

[

^t₀^,^T

]

^na etapów o stałym interwale ,

(

^T ^t

)

^N N t= − ₀ /

∆ (5)

co odpowiada wprowadzeniu indeksu dyskretyzacji czasu:

: 1 ,...,

1 +

= N

i

f.) Należy również przeprowadzić dyskretyzację pojemności zbiornika na pewna określoną ilość stanów

) (t x M , różniących się o stałą wartość ∆x

∆^x=

(

^xg −^xd

)

/^M (6)

Dyskretyzacja odpowiada przyjęciu indeksu dyskretyzacji stanu .

1 ,...,

1 +

= M

j

W wyniku przeprowadzonej dyskretyzacji otrzymamy siatkę ,której punkty odpowiadają -temu stanowi zbiornika w -tej chwili czasu . Korzystając z siatki zaznaczyć należy tj. wymaganą trajektorie stanu zbiornika w okresie optymalizacji

j i

) (i x^W

1 ,...,

1 +

= N

i oraz warunek

początkowego wypełnienia zbiornika odpowiadający węzłowi np.

i warunek końcowy wypełnienia zbiornika w cyklu obliczeniowym np.

(

(i=1),(j=4)

)

(

(i=N+1),(j=4)

)

( rysunek 7.2).

1 , 1 +

= N i )

, ( , ) , (i j x i j

x ^W

1 ,...,

1 +

= M

j

=1

i i=2 i=4 i= N+1

=1 j

=2 j

=6 j

) 7 , 4

W(

x x^W(N+1,6)

((i=1),(j=4))

x x((i=N+1),(j=4))

Rys. 2 Dyskretyzacja pojemności zbiornika i horyzontu optymalizacji g.) W analogiczny sposób należy określić dyskretny zakres zmienności funkcji

, , .

) (t

Q^P uˆ t( ) )

1 (t

u^W

h.) Obecnie dyskretne równanie trajektorii stanu zbiornika można zapisać w następującej formie :

, 1 ))

( , ( ) ( ( ) , 1 ( ) ,

(i k =x i− j + Q i −u i j k ⋅∆t k= M +

x a (7)

w której :

(

^x ⁱ ^k ^x ⁱ ^j

)

^t

i Q k j i

u( ,( a ))= ()− ( , )− ( −1, ) ∆ (8)

(5)

)) (

, (i j k

u a

i-ta chwila czasowa ze stanu o

numerze j

na stan o numerze k

( )

(

Q u

)

t

x x

t u

Q x

x

t u

Q x

x

t u

Q x

x

t u

Q x

x

t u

Q x

x

t u

Q x

x

t u

Q x

x

∆

⋅

− +

=

∆

⋅

− +

=

∆

⋅

− +

=

∆

⋅

− +

=

∆

⋅

− +

=

∆

⋅

− +

=

∆

⋅

− +

=

∆

⋅

− +

=

) 7 8 ( , 4 ) 4 ( ) 8 , 3 ( ) 7 , 4 (

) 7 7 ( , 4 ) 4 ( ) 7 , 3 ( ) 7 , 4 (

) 7 6 ( , 4 ) 4 ( ) 6 , 3 ( ) 7 , 4 (

) 7 5 ( , 4 ) 4 ( ) 5 , 3 ( ) 7 , 4 (

) 7 4 ( , 4 ) 4 ( ) 4 , 3 ( ) 7 , 4 (

) 7 3 ( , 4 ) 4 ( ) 3 , 3 ( ) 7 , 4 (

) 7 2 ( , 4 ) 4 ( ) 2 , 3 ( ) 7 , 4 (

) 7 1 ( , 4 ) 4 ( ) 1 , 3 ( ) 7 , 4 (

a a a a a a a a

Rys 3 Zapis dyskretnego punktu trajektorii stanu

Dla każdego węzła siatki stanu (rysunek 2) można wg wzorów (7) i (8) określić wartość trajektorii stanu , sterowanie konieczne do osiągnięcia tego stanu , oraz ze stanu na stan . j k

wartość wskaźnika jakości która dla ustalonej chwili odpowiada przejściu trajektorii Dyskretna postać wskaźnika jakości dla każdego węzła siatki przedstawia się następująco :

i

( ) [ ]

3

[ ⁽ ⁾ ]

²

2

2 ( ) ( , ) () ,( )

) ( ,

1 j k a x i x i k a u i ui j k

i

F − a = ⋅ ^W − + ⋅ ^W − a (9)

Dla wybranych węzłów siatki obliczenia przedstawione są poniżej

( ) [ ( ) ] [ ⁽ ⁾ ]

( ) [ ( ) ] [ ( ) ]

( ) [ ( ) ] [ ⁽ ⁾ ]

( ) [ ( ) ] [ ( ) ]

( ) [ ( ) ]

3

[ ⁽ ⁾ ]

²

2 2

2 3

2 2

2 3

2 2

2 3

2 2

2 3

2 2

2 3

2 2

2 3

2 2

) 8 3 ( , 3 ) 3 ( 8

, 3 ) 3 ( )

8 3 ( , 2

) 7 3 ( , 3 ) 3 ( 7

, 3 ) 3 ( )

7 3 ( , 2

) 6 3 ( , 3 ) 3 ( 6

, 3 ) 3 ( )

6 3 ( , 2

) 5 3 ( , 3 ) 3 ( 5

, 3 ) 3 ( )

5 3 ( , 2

) 4 3 ( , 3 ) 3 ( 4

, 3 ) 3 ( )

4 3 ( , 2

) 3 3 ( , 3 ) 3 ( 3

, 3 ) 3 ( )

3 3 ( , 2

) 2 3 ( , 3 ) 3 ( 2

, 3 ) 3 ( )

2 3 ( , 2

a a

u u

a x

x a F

u u

a x

x a F

u u

a x

x a F

u u

a x

x a F

u u

a x

x a F

u u

a x

x a F

u u

a x

x a F

W W

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

(6)

( ) [ ( ) ] [ ( ) ]

( ) [ ( ) ] [ ⁽ ⁾ ]

( ) [ ( ) ]

3

[ ( ) ]

²

2 2

2 3

2 2

2 3

2 2

2 3

2 2

2 3

2 2

) 7 5 ( , 8 ) 8 ( 7

, 8 ) 8 ( )

7 5 ( , 7

) 6 5 ( , 8 ) 8 ( 6

, 8 ) 8 ( )

6 5 ( , 7

) 5 5 ( , 8 ) 8 ( 5

, 8 ) 8 ( )

5 5 ( , 7

) 4 5 ( , 8 ) 8 ( 4

, 8 ) 8 ( )

4 5 ( , 7

) 3 5 ( , 8 ) 8 ( 3

, 8 ) 8 ( )

3 5 ( , 7

a a

u u

a x

x a F

u u

a x

x a F

u u

a x

x a F

u u

a x

x a F

u u

a x

x a F

W W

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

−

⋅ +

−

⋅

=

i )

, ( , ) (i x i j

x ^W

+1

= M j

=1

i i=2 i=4 i= N+1

=1 j

=2 j

=6 j

Góne ograniczenie stanu zbiornika

Dolne ograniczenie stanu zbiornika

Wymagana trajektoria stanu zbiornika

=7 i

=3 j

=4 j

=5

j j=5

Rys 4 Wartości wskaźnika jakości dla wybranych węzłów

Jeżeli przyjmiemy że znane są optymalne wartości wskaźnika jakości w węzłach , wskazujące optymalny łańcuch od tego węzła aż do węzła kończącego optymalizacje

1 ,.., 1 , ) ,

(i k k= M +

(

M +1,J

)

, wówczas poszukiwanie najlepszego połączenia (w sensie minimum wskaźnika jakości dla węzła

(

(i−1),j

)

) między węzłami , sprowadza się do wyboru minimalnej wartości ze zbioru określonego wg

i i 1)a ( −

( )

( ) { ( ) ( ) }

{

F i−¹^,j =^min F ⁽i−¹^),⁽jak +F i^,k ^, k=¹^,..,M +¹

}

^,j=¹^,..,M +¹ (10) Ilustracja postępowania wg wzoru (10) obserwujemy na rysunku 5

(7)

i )

, ( , ) (i x i j

x ^W

+1

= M j

=1

i i=2 i=4 i= N+1

=1 j

=2 j

=6 j

=7 i

=3 j

=4 j

=5

j j=5

=8 i

=3 i

( )³^,⁸

Fˆ

( )³^,²

Fˆ

( )8,7 Fˆ

( )8,3 Fˆ

( )3,4 Fˆ

( )⁸^,⁵

Fˆ

J j=6=

Rys. 5. Poszukiwanie minimalnej wartości przypisanej do węzła

np. wartość wskaźnika jakości jaka należy przypisać węzłowi

(

i=2, j=3

)

ma być minimalną wartością ze zbioru utworzonego z sumy wskaźnika lokalnego dotyczącego przejścia między węzłem

(

i=2, j=3

)

a węzłem

(

i=2, j=2,...,8

)

i wartości optymalnej wskaźnika w węźle

(

i=3, j=2,...,8

)

( )

( ) ( )

[ ] [ ⁽ ⁾ ^{( )} ] [ ⁽ ⁾ ^{( )} ]

( ) ( )

[ ] [ ⁽ ⁾ ^{( )} ] [ ⁽ ⁾ ⁽ ]

( )

[ ]

⎪⎪

⎭

⎪⎪⎬

⎫

⎪⎪

⎩

⎪⎪⎨

⎧

+

+ +

+

+ +

+

=

8 , 3 ˆ( ) 8 3 ( , 2

, 7 , ˆ 3 ) 7 3 ( , 2 , 6 , ˆ 3 ) 6 3 ( , 2 , 5 , ˆ 3 ) 5 3 ( , 2

, 4 , ˆ 3 ) 4 3 ( , 2 , 3 , ˆ 3 ) 3 3 ( , 2 , 2 , ˆ 3 ) 2 3 ( , 2 min 3 , ˆ 2

F F

F

a

a a

a

a a

a

)

Analizując w opisany sposób wszystkie węzły siatki cofamy się do węzła

)

, który zamyka obliczenia .W następstwie przedstawionego schematu postępowania uzyskujemy łańcuch decyzji optymalnych między węzłem siatki przyjętym jako wypełnienie początkowe zbiornika

(

⁽ⁱ⁼¹^),⁽^j⁼⁴⁾

(

⁽ⁱ⁼¹^),⁽^j⁼⁴⁾

)

x a

węzłem siatki przyjętym w danym cyklu obliczeniowym jako wypełnienie końcowe zbiornika ^x

(

⁽ⁱ⁼^N⁺¹^),⁽^j⁼⁴⁾

)

^.

Odczytując łańcuch odtworzymy optymalną (z uwagi na przyjęty wskaźnik jakości wypełnienie początkowe i końcowe zbiornika ) trajektorię stanu zbiornika oraz trajektorię sterowania (odpływu ze zbiornika )

Analizując w analogiczny sposób wszystkie możliwe stany końcowe zbiornika wybieramy tę trajektorie stanu i sterowania dla której wartość wskaźnika jakości będzie minimalna .

(

(i=N+1),(j=1,...,M+1)

x

)

Optymalizacja wieloetapowa ma istotną zaletę . Wszelkie ograniczenia zawężają jedynie zbiór ewentualnych decyzji co zasadniczo upraszcza obliczenia .Wadą natomiast jest fakt , iż uzyskane rozwiązanie optymalne jest na tyle dokładne na ile zezwala wprowadzona dyskretyzacja (siatka ) obowiązująca dla poszczególnych

(8)

zmiennych .Łatwo zauważyć ,że ze wzrostem dokładności siatki otrzymane rozwiązanie zbliża się do rozwiązania będącego wynikiem analitycznego rozwiązania problemu .

Przykład

Opisana metodę optymalizacji wieloetapowej prześledzimy na prostym przykładzie liczbowym .

Przyjmiemy :

• dyskretyzację horyzontu optymalizacji T na 3 etapy i=1,..,4 ,

• dyskretyzację pojemności stanu zbiornika x na 5 stanów j=1,..,5,

( )

1,1 =0,...,x

( )

1,5 =4 x

• dyskretyzację dopływów Q^P i sterowań również na 5 stanów , u

( ) ( )

1,1 =u1,1 =0,...,Q (1,5)=u(1,5)=4

Q^P ^P

• warunek początkowego wypełnienia zbiornika x

( )

1,3 =2,

• warunek końcowego wypełnienia zbiornika x(4,4)=3,

• ograniczenia na trajektorie stanu :

(

(i=1,..,4),(j=2)

)

=1 , x

(

(i=1,..,4),(j=5)

)

=4

x_d _g ,

• ograniczenia na sterowanie :

(

⁽ ¹^,..,⁴^),⁽ ¹⁾

)

⁰ ^, _max

(

⁽ ¹^,..,⁴^),⁽ ⁴⁾

)

⁴

min i= j= = u i= j= =

u ,

• wymaganą trajektorie stanu zbiornika ^x^W

(

⁽ⁱ⁼¹^,..,⁴^),⁽^j⁼⁵⁾

)

⁼⁴^,

• wymaganą trajektorie sterowania

(

⁽ⁱ⁼¹^,..,³^),⁽^j⁼⁴⁾

)

⁼³^,^u

(

⁽ⁱ⁼³^,⁴^),⁽^j⁼⁵⁾

)

⁼⁴

u^W ^W ,

• prognozowany dopływ do zbiornika

( ) ( )

(

( 3,4),( 2)

)

1

, 3 ) 4 ( ), 3 , 2 ( , 2 ) 3 ( ), 2 , 1 (

=

= j i

Q

j i

Q j

i Q

P

P P

Na rys 6 przedstawione są wymienione wyżej założenia .

(9)

) , ( , ) , ( ), , ( , )

(i x i j x i j x i j

x ^W _d _g

=1

i i=2 i=4

=1 j

=2 j

=3 j

=4 j

=3 i

=5 j

) , ( ) ,

(i j x i j

x_g = ^W

) , ( ji x_d

przyjęte końcowe wypełnienie zbiornika

przyjęte początkowe wypełnienie zbiornika

=1

i i=2 i=4

=1 j

=2 j

=3 j

=4 j

=3 i

=5 j

) ,

max(i j u

) ,

min(i j u )

, ( ji u^W

) , ( ji Q^P

(3,(2a4))

u

(³^,⁽³a⁴⁾)

u

(3,(4a4))

u

(3,(5a4))

u

Rys 7.6 Dane wejściowe przyjęte do zadania optymalizacji

Wykorzystując równanie (7) , (8) , (9) wyliczamy wartości sterowań odpowiadające przejściu między kolejnymi stanami zbiornika i odpowiadające im wartości wskaźnika jakości dla każdego węzła siatki.

Etap i=4 a3

(

⁴^,⁽² ⁴⁾

)

⁼^Q ⁽⁴⁾⁻

[

^x⁽⁴^,⁴⁾⁻^x⁽³^,²⁾

]

^/^∆^t⁼¹⁻⁽³⁻¹⁾^/¹⁼⁻¹

u a ^P odpada ze względu

na ograniczenie sterowania ,

( ) [ ]

(

⁴^,⁽⁵ ⁴⁾

)

⁽⁴⁾

[

⁽⁴^,⁴⁾ ⁽³^,⁵⁾

]

^/ ¹ ⁽³ ⁴⁾^/¹ ²

1 1 / ) 3 3 ( 1 / ) 4 , 3 ( ) 4 , 4 ( ) 4 ( ) 4 4 ( , 4

0 1 / ) 2 3 ( 1 / ) 3 , 3 ( ) 4 , 4 ( ) 4 ( ) 4 3 ( , 4

=

−

=

∆

−

=

−

=

∆

−

=

−

=

∆

−

=

t x

x Q

u

t x

x Q

u

t x

x Q

u

P P P

a a a

(10)

( ) [ ]

3

[ ( ) ]

²

2

2 ( ) ( , ) () ,( )

) ( ,

1 j k a x i x i k a u i ui j k

i

F − a = ⋅ ^W − + ⋅ ^W − a

( ) [ ] [ ( ) ]

( ) [ ] [ ⁽ ⁾ ]

(

³³^,^,⁽⁽⁵⁴ ⁴⁴⁾⁾

)

¹¹

[

⁽⁽⁴⁴⁾⁾ ⁽⁽⁴⁴^,^,⁴⁴⁾⁾

]

¹¹

[

⁽⁽⁴⁴⁾⁾

(

⁴⁴^,^,⁵⁴ ⁴⁴

) ]

⁽⁽⁴⁴ ³³⁾⁾ ⁽⁽⁴⁴ ¹²⁾⁾ ¹⁰⁵

17 ) 0 4 ( ) 3 4 ( 4 3 , 4 ) 4 ( 1 ) 4 , 4 ( ) 4 ( 1 ) 4 3 ( , 3

2 2 2

2

2 2 2

2

2 2 2

2

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

a a

u u

x x

F

u u

x x

F

u u

x x

F

W W

Etap i=3 a2 węzeł

(

i=²^,j=²

)

( ) [ ]

(

³^,⁽¹ ³⁾

)

⁽³⁾

[

⁽³^,³⁾ ⁽²^,²⁾

]

^/ ³ ⁽² ¹⁾^/¹ ²

1 1 / ) 1 3 ( 3 / ) 2 , 2 ( ) 4 , 3 ( ) 3 ( ) 4 2 ( , 3

0 1 / ) 1 4 ( 3 / ) 2 , 2 ( ) 5 , 3 ( ) 3 ( ) 5 2 ( , 3

=

−

=

∆

−

=

−

=

∆

−

=

−

=

∆

−

=

t x

x Q

u

t x

x Q

u

t x

x Q

u

P P P

a a a

( ) [ ] [ ( ) ]

(

²²^,^,⁽⁽²² ³⁴⁾⁾

)

¹¹

[

⁽⁽³³⁾⁾ ⁽⁽³³^,^,³⁴⁾⁾

]

¹¹

[

⁽⁽³³⁾⁾

(

³³^,^,²² ³⁴

) ]

⁽⁽⁴⁴ ²³⁾⁾ ⁽⁽³³ ¹²⁾⁾ ⁵⁵

9 ) 0 3 ( ) 4 4 ( 5 2 , 3 ) 3 ( 1 ) 5 , 3 ( ) 3 ( 1 ) 5 2 ( , 2

2 2 2

2

2 2 2

2

2 2 2

2

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

a a

u u

x x

F

u u

x x

F

u u

x x

F

W W

dla węzła

(

i=2,j=2

)

wartość minimalna wskaźnika jakości =

]

( ) ( ) ( )

[

⁹ ⁵^, ⁵ ¹⁰ ^, ⁵ ¹⁷ ¹⁴

min + + + = co odpowiada łańcuchowi

(

i=2,j=2

) (

⇒ i=3, j=5

) (

⇒ i=4, j=4

)

) , ( , ) , ( ), , ( , )

x ^W _d _g

=1

i i=2 i=4

=1 j

=2 j

=3 j

=4 j

=3 i

=5 j

(

i=2,j=2

)

(

ⁱ⁼³^,^j⁼⁵

)

(

i=4,j=4

)

,F=14 9

5 5

17 10

5

ograniczenia sterowania

ograniczenia stanu

Rys 7 Optymalny łańcuch decyzji z węzła

(

ⁱ⁼²^, ^j⁼²

)

(11)

węzeł

(

ⁱ⁼²^,^j⁼³

)

( ) [ ]

(

3,(3 3)

)

(3)

[

(3,3) (2,3)

]

/ 3 (2 2)/1 3 2 1 / ) 2 3 ( 3 / ) 3 , 2 ( ) 4 , 3 ( ) 3 ( ) 4 3 ( , 3

1 1 / ) 2 4 ( 3 / ) 3 , 2 ( ) 5 , 3 ( ) 3 ( ) 5 3 ( , 3

=

−

=

∆

−

=

−

=

∆

−

=

−

=

∆

−

=

t x

x Q

u

t x

x Q

u

t x

x Q

u

P P P

a a a

( ) [ ] [ ( ) ]

(

²²^,^,⁽⁽³³ ³⁴⁾⁾

)

¹¹

[

⁽⁽³³⁾⁾ ⁽⁽³³^,^,³⁴⁾⁾

]

¹¹

[

⁽⁽³³⁾⁾

(

³³^,^,³³ ³⁴

) ]

⁽⁽⁴⁴ ²³⁾⁾ ⁽⁽³³ ³²⁾⁾ ⁴²

4 ) 1 3 ( ) 4 4 ( 5 3 , 3 ) 3 ( 1 ) 5 , 3 ( ) 3 ( 1 ) 5 3 ( , 2

2 2 2

2

2 2 2

2

2 2 2

2

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

a a

u u

x x

F

u u

x x

F

u u

x x

F

W W

dla węzła

(

i=2,j=3

)

]

( ) ( ) ( )

[

4 5, 2 10 , 4 17 9

(

i=2,j=3

) (

⇒ i=3, j=5

) (

⇒ i=4, j=4

)

) , ( , ) , ( ), , ( , )

x ^W _d _g

=1

i i=2 i=4

=1 j

=2 j

=3 j

=4 j

=3 i

=5 j

(

ⁱ⁼²^,^j⁼³

)

(

i=3,j=5

)

(

ⁱ⁼⁴^,^j⁼⁴

)

^,^F⁼⁹

4 2

4 17

10 5

ograniczenie sterowania

ograniczenie stanu

(

i=2, j=3

)

węzeł

(

i=2,j=4

)

( ) [ ]

(

³^,⁽⁴ ³⁾

)

⁽³⁾

[

⁽³^,³⁾ ⁽²^,⁴⁾

]

^/ ³ ⁽² ³⁾^/¹ ⁴

3 1 / ) 3 3 ( 3 / ) 4 , 2 ( ) 4 , 3 ( ) 3 ( ) 4 4 ( , 3

2 1 / ) 3 4 ( 3 / ) 4 , 2 ( ) 5 , 3 ( ) 3 ( ) 5 4 ( , 3

=

−

=

∆

−

=

−

=

∆

−

=

−

=

∆

−

=

t x

x Q

u

t x

x Q

u

t x

x Q

u

P P P

a a a

(12)

( ) [ ] [ ( ) ]

(

²²^,^,⁽⁽⁴⁴ ⁴³⁾⁾

)

¹¹

[

⁽⁽³³⁾⁾ ⁽⁽³³^,^,³⁴⁾⁾

]

¹¹

[

⁽⁽³³⁾⁾

(

³³^,^,⁴⁴ ³⁴

) ]

⁽⁽⁴⁴ ²³⁾⁾ ⁽⁽³³ ⁴³⁾⁾ ¹⁵

1 ) 2 3 ( ) 4 4 ( 5 4 , 3 ) 3 ( 1 ) 5 , 3 ( ) 3 ( 1 ) 5 4 ( , 2

2 2 2

2

2 2 2

2

2 2 2

2

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

a a

u u

x x

F

u u

x x

F

u u

x x

F

W W

dla węzła wartość minimalna wskaźnika jakości =

co odpowiada łańcuchowi

(

i=2,j=4

) ]

( ) ( ) ( )

[

1 5,1 10 , 5 17 6

min + + + =

(

i=2,j=4

) (

⇒ i=3,j=5

) (

⇒ i=4,j=4

)

) , ( , ) , ( ), , ( , )

x ^W _d _g

=1

i i=2 i=4

=1 j

=2 j

=3 j

=4 j

=3 i

=5 j

(

i=2,j=4

)

(

i=3,j=5

)

(

i=4,j=4

)

,F=6 1

1

5 17

10 5

ograniczenia stanu

(

ⁱ⁼²^, ^j⁼⁴

)

węzeł

(

i=2,j=5

)

( ) [ ]

(

3,(5 3)

)

(3)

[

(3,3) (2,5)

]

/ 3 (2 4)/1 5 4 1 / ) 4 3 ( 3 / ) 5 , 2 ( ) 4 , 3 ( ) 3 ( ) 4 5 ( , 3

3 1 / ) 4 4 ( 3 / ) 5 , 2 ( ) 5 , 3 ( ) 3 ( ) 5 5 ( , 3

=

−

=

∆

−

=

−

=

∆

−

=

−

=

∆

−

=

t x

x Q

u

t x

x Q

u

t x

x Q

u

P P P

a a a

( ) [ ] [ ( ) ]

(

²²^,^,⁽⁽⁵⁵ ³⁴⁾⁾

)

¹¹

[

⁽⁽³³⁾⁾ ⁽⁽³³^,^,³⁴⁾⁾

]

¹¹

[

⁽⁽³³⁾⁾

(

³³^,^,⁵⁵ ³⁴

) ]

⁽⁽⁴⁴ ²³⁾⁾ ⁽⁽³³ ⁵⁴⁾⁾ ⁸²

0 ) 3 3 ( ) 4 4 ( 5 5 , 3 ) 3 ( 1 ) 5 , 3 ( ) 3 ( 1 ) 5 5 ( , 2

2 2 2

2

2 2 2

2

2 2 2

2

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

a a

u u

x x

F

u u

x x

F

u u

x x

F

W W

(13)

dla węzła

(

ⁱ⁼²^,^j⁼⁵

)

]

( ) ( ) ( )

[

⁰ ⁵^, ² ¹⁰ ^, ⁸ ¹⁷ ⁵

(

ⁱ⁼²^,^j⁼⁵

) (

^⇒ ⁱ⁼³^,^j⁼⁵

) (

^⇒ ⁱ⁼⁴^,^j⁼⁴

)

) , ( , ) , ( ), , ( , )

x ^W _d _g

=1

i i=2 i=4

=1 j

=2 j

=3 j

=4 j

=3 i

=5

j

(

i=2,j=5

) (

i=3,j=5

)

(

i=4,j=4

)

,F=5 0

2 8

17 10

5

ograniczenia stanu

(

i=2, j=5

)

Zestawienie optymalnych łańcuchów decyzji dla etapów i=4a3a2 przedstawia rysunek 7.11 .

) , ( , ) , ( ), , ( , )

x ^W _d _g

=1

i i=2 i=4

=1 j

=2 j

=3 j

=4 j

=3 i

=5

j

(

i=2,j=5

) (

i=³^,j=⁵

)

( )

(

2,3,4, 2,5,4

)

, 14 9 , 4 , 5 , 3 , 4 , 3 , 2

6 , 4 , 5 , 4 , 4 , 3 , 2

5 , 4 , 5 , 5 , 4 , 3 , 2

=

F j

i

F j

i

F j

i

F j

i 0

1 5 4 9

(

i=²^,j=⁴

) (

i=2,j=3

) (

i=2,j=2

)

Rys 11 Optymalnych łańcuchy decyzji na etapach i=4a3a2

(14)

Interpretacja pokazanych łańcuchów jest następująca :

• jeżeli trajektoria stanu znajdzie się w węźle

(

ⁱ⁼²^, ^j⁼⁵

)

, łańcuch optymalny od tego węzła do węzła

(

ⁱ⁼⁴^, ^j⁼⁴

)

kończącego obliczenie , przebiegać będzie przez węzeł

(

ⁱ⁼³^,^j⁼⁵

)

a wówczas wskaźnik jakości osiągnie wartość F =5.

• jeżeli trajektoria stanu znajdzie się w węźle

(

ⁱ⁼²^, ^j⁼⁴

)

, łańcuch optymalny od tego węzła do węzła

(

ⁱ⁼⁴^, ^j⁼⁴

)

kończącego obliczenie , przebiegać będzie przez węzeł

(

ⁱ⁼³^,^j⁼⁵

)

, wskaźnik jakości osiągnie wartość F=6,

• itp. dla pozostałych węzłów z ustalonym indeksem i=3. Etap i=2 a1

węzeł

(

ⁱ^{= j}¹^, ⁼³

)

( ) [ ]

(

²^,⁽³ ²⁾

)

⁽²⁾

[

⁽²^,²⁾ ⁽¹^,³⁾

]

^/ ² ⁽¹ ²⁾^/¹ ³

2 1 / ) 2 2 ( 2 / ) 3 , 1 ( ) 3 , 2 ( ) 2 ( ) 3 3 ( , 2

1 1 / ) 2 3 ( 2 / ) 3 , 1 ( ) 4 , 2 ( ) 2 ( ) 4 3 ( , 2

0 1 / ) 2 4 ( 2 / ) 3 , 1 ( ) 5 , 2 ( ) 2 ( ) 5 3 ( , 2

=

−

=

∆

−

=

−

=

∆

−

=

−

=

∆

−

=

−

=

∆

−

=

t x

x Q

u

t x

x Q

u

t x

x Q

u

t x

x Q

u

P P P P

a a a a

( ) [ ] [ ( ) ]

(

¹¹^,^,⁽⁽³³ ³³⁾⁾

)

¹¹

[

⁽⁽²²⁾⁾ ⁽⁽²²^,^,³²⁾⁾

]

¹¹

[

⁽⁽²²⁾⁾

(

²²^,^,³³ ³²

) ]

⁽⁽⁴⁴ ²¹⁾⁾ ⁽⁽³³ ³²⁾⁾ ⁹⁵

5 ) 1 3 ( ) 3 4 ( 4 3 , 2 ) 2 ( 1 ) 4 , 2 ( ) 2 ( 1 ) 4 3 ( , 1

9 ) 0 3 ( ) 4 4 ( 5 3 , 2 ) 2 ( 1 ) 5 , 2 ( ) 2 ( 1 ) 5 3 ( , 1

2 2 2

2

2 2 2

2

2 2 2

2

2 2 2

2

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

− +

−

=

−

⋅ +

−

⋅

=

a a

u u

x x

F

u u

x x

F

u u

x x

F

u u

x x

F

W W

Węzeł

(

ⁱ⁼¹^, ^j⁼³

)

jest węzłem rozpoczynającym obliczenia ( warunek początkowego wypełnienia zbiornika) . Połączenie tego węzła z węzłami o ustalonym indeksie , tworzy cztery alternatywne łańcuchy połączeń z węzłem

kończącym obliczenia .

=3

i

(

ⁱ⁼⁴^,^j⁼⁴

)

Łańcuchem optymalnym będzie oczywiście ten łańcuch dla którego wskaźnik jakości przyjmie minimalną wartość (rysunek 12) .

Znając łańcuch decyzji optymalnych łatwo odtworzyć łańcuch optymalnych sterowań (odpływów ze zbiornika ) przy których zapewniona zostanie minimalna wartość wskaźnika jakości .

Dla łańcucha decyzji

(

i=1,2,3,4, j=3,4,5,4

)

, wartości optymalnego odpływu dla poszczególnych etapów są

(

i=1a2a3a4 uˆ=1,2,2

)

. Przy takim odpływie wartość wskaźnika jakości (dla całej analizowanej siatki ) będzie minimalna (rysunek 13) .