• Nie Znaleziono Wyników

Własności dynamiczne algorytmów Åströma i Kalmana w problemie sterowania minimalno-wariancyjnego

N/A
N/A
Protected

Academic year: 2022

Share "Własności dynamiczne algorytmów Åströma i Kalmana w problemie sterowania minimalno-wariancyjnego"

Copied!
13
0
0

Pełen tekst

(1)

ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ Seria: AUTOHATYKA z. 103

________1991 Nr kol. 1090

Marian BŁACHUTA Andrzej ORDYS

t

WŁASNOŚCI DYNAMICZNE ALGORYTMÓW ASTROMA I KALMANA W PROBLEMIE STEROWANIA MINIMALNO-WARIANCYJNEGO

Streszczenie. W artykule podaje się wzory określające wartość wariancji wyjścia obiektu CARMA regulowanego przy zastosowaniu praw sterowania Kalmana i Astroma w chwilach i = 0,1.2 ... gdzie i = 0 oznacza moment rozpoczęcia sterowania.

Wartość ta jest przedstawiona w postaci sumy składowej ustalonej, jed­

nakowej dla obydwu algorytmów oraz składowej przejściowej. Wyniki zilu­

strowano przykładami.

1. WSTĘP

Poprzez problem sterowania minimalno-wariancyjnego rozumie się tu dobór prawa sterowania minimalizującego wariancję wyjścia obiektu o jednym wejściu i jednym wyjściu opisanego dyskretnym, liniowym i stacjonarnym modelem w przestrzeni stanu o skorelowanych między sobą zakłóceniach stanu i wyjścia.

Modelowi temu w opisie wejściowo-wyjściowym odpowiada model CARMA [1], [2].

Algorytmem Kalmana nazywa się optymalne prawo sterowania uyzskane w przestrzeni stanu. Algorytm Astroma [1] wyprowadzony na gruncie teorii ciągów czasowych [2] może być również sformułowany w przestrzeni stanu. Jak wykazano w [7] stanowi on graniczną, asymptotyczną postać algorytmu Kalmana przy czasie zmierzającym do nieskończoności. Równoważność tych dwu różnych postaci algorytmu Astroma była, przy coraz słabszych ograniczeniach, dowodzona w pracach 13] — [71,

O

W artykule zwraca się uwagę na nierównoważność algorytmów Astroma 1 Kalmana dla skończonych czasów sterowania. W szczególności pokazuje się, że wariancja wyjścia sterowanego obiektu może być przedstawiona jako suma skła­

dowej ustalonej i składowej przejściowej. Składowa ustalona ma dla obydwu algorytmów tę samą wartość podaną przez Astroma. Składowa przejściowa, zmierzająca• z upływem czasu do zera, jest dla algorytmu Astroma zawsze większa od analogicznej dla algorytmu Kalmana.

(2)

14 M. Błachuta, A. Ordys

2. SFORMUŁOWANIE PROBLEMU STEROWANIA OPTYMALNEGO

Obiekt regulacji jest określony równaniami:

x i + l = Axi + bui + gVi (1)

(2)

gdzie: i = 0,1,2 ... jest numerem kolejnej dyskretnej chwili czasu, jest n-wymiarowym wektorem stanu, Uj- skalarnym sterowaniem, y^ - skalarnym wyj­

ściem, - skalarnym zakłóceniem; A - macierzą n x n wymiarową zaś b,g,d są wektorami n-wymiarowymi.

Zakłada się, że parametry Markowa spełniają zależności

T T T k-2 T k-1

d b = 0, d Ab = 0, ... d A b = 0, d A b = b * 0 (3) o

oraz, że wartości własne macierzy

niezależnym od x tzn. E(v,x ) = 0 i = 1,2...

o i o

Wskaźnik jakości jest określony Jako wariancja wyjścia w chwili przesunię­

tej w stosunku do chwili bieżącej i o k kroków u przód:

F = A - gd,T (4)

leżą wewnątrz okręgu jednostkowego:

I Aj (F) I < 1 J = 1,2, ... n (5)

Warunek początkowy x jest zmienną losową o rozkładzie normalnym:

o

E(x ) = 0,

o ( 6 )

Zakłócenie jest białym szumem gaussowskim

E(v^) = 0, (7)

(8) Oznaczmy przez y ^ informację pomiarową dostępną w chwili i.

(3)

Własności dynamiczne algorytmów. 15

W jej skład wchodzą aktualne i przeszłe wartości wyjścia i sterowania:

? i = [ yQ. y r • • • y r v v V i ] (9)

Zadanie syntezy optymalnego algorytmu sterowania polega na znalezieniu ciągu funkcji określających sterowanie minimalizujące w każdej chwili i(l =0,1, ...) wskaźnik (8) przy informacji y^.

u° = arg min

Jak wykazano w [7], układowi (1), (2) z warunkiem (3) odpowiada w opisie wejściowo-wyjściowym model CARMA o opóźnieniu k:

A(z 1)y1 = z k B(z ^ u ^ + C(z 1)v^

gdzie z * jest operatorem opóźnienia oraz

A(z *) = 1 + a z 1 + ... + a z n

1 n

B(z *) = b + b , z 1 + . . . + b z m , m = n-k

o 1 m

C(z *) = 1 + c,z * + ... c z n

1 n

Warunek (5) jest równoważny wymaganiu, aby wielomian

det(zl - F) = C(z) = znC(z 1) posiadał zera spełniające nierówność

|Zj| < 1, j = 1.2, ... n. Proces CARMA nazywa się wówczas odwracalnym Odwracalność jest warunkiem koniecznym istnienia algorytmu Astroma.

Zazwyczaj wymaga się również aby obiekt był minimalno-fazowy [1], tzn. ab zera wielomianu B(z) = zm B(z *) leżały wewnątrz okręgu jednostkowego Chociaż zera B(z) nie mają wpływu na istnienie i wartość wskaźnika jakość to minimalno-fazowość wraz z odwracalnością stanowią WKW stabilności układu

O algorytmu Astroma.

O

Jako wskaźnik jakości w problemie Astroma przyjmuje się

I = lim = lim E<yi+k>

i-*oo i-xn

(11

(4)

16 M. Błachuta, A. Ordys

3. ALGORYTMY KALHANA I ASTROMA

Obecnie przytoczymy w zwięzłej formie wyprowadzone w [7] algorytmy sterowania dla problemów sformułowanych w poprzednim punkcie.

A lg o r y tm K a lm a n a

Prawo sterowania minimalizujące wskaźnik (9) w każdej chwili i, i = 0,1,2 ... , dla obiektu opisanego równaniami (l)-(5) ma postać:

o 1 T ,k-l f „ ~o 1 ,, _,

ui = ” g- d A j ^ F x i + gytJ C12)

przy czym x° jest oceną stanu wyznaczoną przez filtr Kalmana o równaniach:

xi+l/i + ki+l [yi+l " d x i+l/i]’ xo/-l = 0 (13) O

x l+l = x -

xl+l/i = Fxi + bui +gyi (14)

gdzie:

F P FTd k i+l - T T

<r + d FPł F d

T FP FTddTFP FT Q ddTQ

Pi + 1 = FP FT - 4 , P = Q - T° (16)

<r + dTFP F d 0 ° o- + d Q d

1 O

oraz

Xi = E/ y i X i ' x i/i-l E/y1_1 xi* Po ~ E(xi " xi)(xi X° )T (17)

O V

Algorytm Astroma, minimalizujący wskaźnik (11) jest stacjonarny tzn. =

= ftyj). dla i = 0,1, ...

u° = f(j^) = arg min I (18)

Jak wykazano w [7] może być on sformułowany w przestrzeni stanu w postaci równoważnej zapisowi operatorowemu [1],

(5)

Własności dynamiczne algorytmów. 17 O

A lg o r y t m A s t r o m a ( w p r z e s t r z e n i s t a n u )

Prawo sterowania minimalizujące wskaźnik (11) dla obiektu opisanego równaniami (l)-(5) ma postać:

u° = - i- dTAk 1 |Vx1 + gyŁj (19)

przy czym x^ jest oceną stanu wyznaczoną przez filtr o równaniu:

x i+1 = Fx a + buŁ + gy1, x q = 0 (20)

U w a g a

O M

Istotna różnica między algorytmem Kalmana i Astróma polega na równaniu filtru. Algorytm Astroma korzysta z filtru o postaci (20) będącej uproszczoną wersją filtru Kalmana (13) — (17) uzyskaną po położeniu 0. 1 = 0,1...

Filtr Kalmana zmierza, przy 1 — » w, do postaci (20) w związku z czym w granicy obydwa algorytmy są równoważne. Dla skończonych czasów sterowania

O

algorytmu Kalmana jest lepszy od algorytmu Astroma, wymaga on jednak dodatkowo znajomości macierzy Qq.

4. WARJANCJA WYJŚCIA UKŁADÓW Z AL0RYTHAHI KALMANA I AsTRfiMA

Główne wyniki pracy sformułujemy w postaci dwóch twierdzeń

T w i e r d z e n i e 1

Wartość wariancji wyjścia obiektu (1) — (5) regulowanego za pomocą algorytmu Kalmana (12)-(17) wynosi

Ik = dTAk_1FP FTAk_1 d + o- £ 2 , i = 0,1, ... (21) j=0

gdzie

J ,T,k-2

eQ =1, e1 = d g ... ek_j = d A g (¿2)

zaś macierz P jest rozwiązaniem równania Riccatiego

(6)

18 H. Błachuta, A. Ordys

z warunkiem początkowym:

Q d d \

Po = Qo - " T T - (24)

o- + d Q d o

Asymptotyczną wartością wskaźnika jakości "3est

k k_* 2

I = lim I, = o- £ e, (251

i-*» J=0 J

T w i e r d z e n i e 2

Wartość wariancji wyjścia obiektu (l)-(5) regulowanego za pomocą algorytmu Astróma (19), (20) wynosi:

.A _ ,T k - l „ _T.k-lT , , k~* 2 „ , ,0, v

I. = d A FSiF A d + <r £ e., i = 0,1, ... (26) j=0 J

gdzie macierz jest rozwiązaniem równania Lapunowa

s1 + l = F S / (27)

z warunkiem początkowym

Sc = Q0 (28)

Asymptotyczną wartością wskaźnika jakości jest

A k_1 2

I = lim I = a- £ e (29)

i-*o j=o J

D o w ó d t w i e r d z e n i a 1

Jak wykazano w (7):

2

Ik = min IŁ = E(y°+k) . (30)

gdzie

yi+k = yi+k “ yi+k (31)

(7)

Własności dynamiczne algorytmów. 19

jest błędem k-krokowej predykcji wyjścia zaś y°+^_ = E|^>

wyjścia w chwili i+k na odstawie informacji bieżącej w chwili Wyjście obiektu w chwili i+k można przedstawić wzorem:

^T *k . i ^ ,j.k-i

k; 1

y i+k = d A xi + boui + d A gvi + ejvi+k-j

Wyznaczając z równania (2) = y^ - d Txi i wstawiając do (32)

yi+k = dTAk"1(Fxi + gy.J + boU. + ejvi+k-j

*o ,T.k-l , * , , y i+k = d A (Fxi + g y i ] + boUi

gdyż

k-1

E,-> T e,v. ..= O, E,-+ x, = x.

IVi j^o J i+k_J' lyi 1 1

Zatem błąd k-krokowej predykcji wyjścia jest określony zależności:

. . k-1

~o ,T,k-lr.~o _

y i+k = d A Fxi + ejvi+k-j

gdzie:

-o o

X i " Xi Xi jest błędem oceny stanu.

Wartość wskaźnika Jakości wyniesie zatem:

tK .T.k-1 _ ,_~o~oT\ _T.k-l^ J k~J 2 I. = d A F(Ex,x. ) F A d + <r £ e .

J=0 Jednakże, przy zastosowaniu filtru Kalmana

,~o~oT, „ E(xix i ) = P.

gdzie P Jest rozwiązaniem równania Riccatiego (23).

jest oceną

(32)

otrzymujemy

(33)

(34)

(35)

(36)

(3?)

(38)

(8)

20 M. Błachuta. A. Ordys

Własność graniczna (25) wynika z twierdzenia Cainesa (31, zgodnie z którym, przy spełnieniu (5) niezależnie od P zachodzi:

O

i-ł 03

D ow ód t w ie r d z e n i a 2

Podobnie jak w dowodzie twierdzenia i raoźna stwierdzić, że wartość wskaźnika Jest określona wzorem o postaci (37). Jednakże ze względu na zastosowanie filtru (20) wartość kowariancji błędu filtracji będzie inna.

Podstawmy v = y - d x^ wzynaczone z równania (2) do (1). Otrzymamy:X

co po odjęciu od (20) daje równanie błędu oceny stanu dokonywanej przez filtr (20):

Jest zmienną losową normalną o zerowej wartości oczekiwanej i kowariancji:

Kowariancja wektora x^ określonego równaniem (41) z warunkiem początkowym (42) Jest określona równaniem Lapunowa (27) z warunkiem początkowym (28).

Jeśli wartości własno macierzy F leżą wewnątrz okręgu jednostkowego, wówczas:

lim P = 0 □ . (39)

(40)

x1+1 = Fx

i (41)

przy czym

(42)

(43)

Oznaczmy

(44)

lim S. “ 0 ( 1

i -*D O. (45)

(9)

Własności dynamiczne algorytmów. 21

5. PRZYKŁAD LICZBOWY

Celem Ilustracji przeprowadzonych rozważań obliczono przebiegi czasowe wariancji wyjścia obiektu regulowanego za pomocą omawianych algorytmów.

Przyjęto model, w którym wektor stanu Jest k+1 wymiarowy, przy czym k i l , zaś macierz A 1 wektory b,g,d są dane w postaci:

A = k-1 zer

1 0 0 1

b =

k-1 zer 8 =

k-1 zer

dT = [1 0 . . . 0 ]

W konwencji teorii ciągów czasowych odpowiada temu modelowi układ CARMA:

y, = z

b + b z - k o l

-1 - 2 i 1 + ajZ + a^z

-1 -2

1 + CjZ + C2Z rf~ ZJ- v!

1 ♦ ajZ + a2z

Obliczenia przeprowadzono dla danych liczbowych takich, że:'

z2 (l + 3jZ_1 + a2z"2 ) = z2 - 1.8 z + 0.81 = (z - 0.9)2

z2 (l + Cjz"1 + c2z'2 ) = z2 - 0.95 z ♦ 0.9025 =

= (z - 0.95 eJ 60 ) (z - 0.95 e'J 60 )

Wartości liczbowe bQ, b^ nie posiadają wpływu na wartość wskaźnika.

Przebieg obliczeń był następujący:

W trakcie N kroków, N = 50, obliczono wariancję wyjścia układu nlesterowanego posługując się zależnościami

Q i+i = aV T + ^ ggT' Q-N = 0

E(y2 ) = dTQ td ♦ cr dla i = -N, ... 0

(10)

22 M. Błachuta, A. Ordys

W a r i a n c j a w y j ś c i a . a l g o r y t n o p t y n a l n y

r Ili 111

. 1111 III!!

11111

n iiiiiiiiiiiii m m m m m 1 1 1 ł 1 I 1 II 1 i i i i 1 . 1111111I!!

in iiiii 111(1 IIIII

111111II1 1 1 1 1 1 1 m m m m m 111111111111111 .iiiiiin in III!! n m m m m m inim in IIIII ii m m m m mi i nun hi 1(111ii m m m m

.

1111111! 1! 11hi IIIII ii mm m m .11II111111111 in HII! 11111111 ii 111111 III MMMMIII in IIIII iiiiim m i . 11111111111111 in IIIII MMMMMM i .i 1 11111(11111 i 1mi IIIII m m m m i .u m m m m ii in IIIII m m m m i .in 11111111111111 IIIII m m m m i mu MIMIIII Mill hi IIIII 11 m m m m i .Mini IIMII llllllll in IIIII ii m m im i

t

W a r i a n c j a w y j ś c i a a l g o r y t « a s y m p t o t y c z n y

Rys. 1. Przebiegi wariancji wyjścia dla opóźnienia równego 1 Fig. 1. Runs of the output variance for delay k = 1

W a r i a n c j a w y j ś c i a a l y o r y t n o p t y m a l n y

•T*

I

I ... 1111111111111111II1111111 i 11111 i I

j ,ji j¡I 11 j11 jl j1{|j11 ii11 j111 j!111H111111}I!l! t.... t...t... |... t_______ ,

t

W a r i a n c j a w y j ś c i a a l g o r y t m a s y m p t o t y c z n y

— ..<111111111111111111111111111111111111.

miii 111111 n 11 i i j 111 n I j 11111 j i u j j j»111111 n 11 i

ii l ii i

ii ii

ii il ill.li.

Rys. 2. Przebiegi wariancji wyjścia dla opóźnienia równego 5 Fig. 2. Runs of the output variance for delay k = 5

(11)

Własności dynamiczne algorytmów. 23

k A

Następnie przyjęto Qq = Wq 1- wyznaczono wartości wskaźników oraz I.

korzystając ze wzorów (21)-(24) oraz (26)-(28). Wyniki obliczeń dla k = 1, k = 5, przedstawiono kolejno na rys. 1, 2.

6. PODSUMOWANIE

W pracy podano wzory pozwalające na obliczenie wariancji wyjścia obiektu CARMA regulowanego za pomocą algorytmów Xstroma i Kalmana.

Wskazano na różnicę tych wartości w stanach przejściowych.

Pokazano, że charakter stanu przejściowego po zastosowaniu któregokolwiek z prezentowanych algorytmów jest zależny jedynie od wielomianu C(z 1) zaś jego udział w wartości wskaźnika jakości od A(z 1) oraz k.

Zamieszczony przykład wskazuje, źe proces przejściowy po zastosowanu algorytmu Kalmana może być wyraźnie lepszy niż przy zastosowaniu algorytmy O

Astróma. Wymienione czynniki winny być brane pod uwagę przy doborze algorytmów sterowania dla procesów szarżowych oraz doborze algorytmów regulacji samonastrajającej, które zmieniając parametry regulatora pobudzają procesy przejściowe.

LITERATURA O

[11 Astrom K.J.: Introduction to Stochastic Control Theory, Academic Press, N. Y. , 1970.

[2] Box G.E.P./ Jenkins G.M.: Time Series Analysis - forecasting and control, Holden-Day, San Francisco 1976.

[31 Caines P.E.: Relationship between Box-Jenkins-Astrom control law and Kalman linear regulator, Proc. IEE 119, No 5, 1972.

[4] Hughes D.-J. : Equivalence of the Box-Jenkins-Astrom control law to the Kalman regulator, El.Lett., 9, 1973.

[5] Watson W.: Box-Jenkins-Astrom linear control laws and their equivalence, Proc. IEE, 123, 1976.

[6] Lam K.P.: Implicit and explicit self-tuning regulators, Ph.D. thesis, Univ. of Oxford, 1980.

(12)

24 M. Błachuta. A. Ordys

[7] Błachuta M., Ordys A.: Związek algorytmów Xstroma i Kalmana dla problemu sterowania minimalno-wariancyjnogo, Z. N. Politechniki Śl., seria Automa­

tyka, z. 74. 1984.

Recenzent: Prof.dr inż. Henryk Górecki

Wpłynąło do Redakcji 27.07.1987 r.

¿MHAMHHECKHE CBOfiCTBA AJITO PH IM O B ALffiPO.MA H KAJIBMAHA B n PO SJiEM S MHEHMA JIBHO - B APHAHLtfiilHO TO y U P A iJL E H H ii

? e 3 r u. e

B p aO oxe n c c j i e j y e i ca jmneUnuH o 6 % e K i, A H C K p eT im ii bo BpeMeHH C OAHHM BŁOiOAHKM CJiTHajIOM X , OAHHM ynpaBJIH D ąH M BXOAOM

o a h k m MeaarmHM b x o a o m v . O O t e K i oU H C H BaexcH yp a B H e H H e H :

xi + 1 = + b u i + S V ± C I )

yi = d T x i + v± ( I I )

npH H RM aeTC K, h t o 3aAaM e2 CHCxeMH p e ry jiH p o B a H H H H B jiH e x c s uHHitMa—

jiH 3aiiaa BapHREUHH bhxoas H3 oObeKxa:

Ji * E J i + k 2 ( I I I )

TaxKM o0pa3o« nojiywaeTCH 3axoH ynpaajxeHHR [ 7 ] s

u i = ■ t f t ' aa>Ak" 1 [(A- s d T ) *i + o j a v ) d A b

A

rA e o C o an aw a e T o u e H K y c o c t o h h h h

Aa t o p k t m ( I V ) HBJiflexcfl auropHTMOM KanBMaHa T o r^ a , e c n u oueHKa c o c t o r h h h npop.cxoAHT c onxnuajibHoro ¡pKAbxpa ('piiAbxpa K aiitM aH a) .

£c j!h oueujca cooxosHHa pacwHXHBaeTca wepe3 acHtsnxoxHRecKaa b h a p B A Ł ip a , to noiiyweHHHii TaKBM oOpasow ajiropnxM cxaHOBHTca s k b h- bajjeHTHUM aJjropHTMV AHTpOMa ( A0Ka3BTe.>IBCTB0 HaXOAHTCH B [ ? ] ) . B paO oTe b h b o a h t c h (p op w yjiu, no3BOAABaiHe p a c R a x a x b a a u e u e i m s i b o b p e v e a H bapHRHUHH BbocoAa oO b eK x a ( I I I ) a jl h n p e A C T a s jie H K x noBmne a . n r o p m « o B . 3 x a Bejm H H H a u B n a e T o a o o C T a B H o 2 cyM w oii o n p e A e a e H O E j oAHKaKO Boa a a r oOo k x a jir o p K x u o B ji B p ew eH H oii o o c x a B H o fi.

P.pKBOAHTCR np orpajuiiiA upHMep n c3 B a jia są H li cpaBHKXb K a u ecT Ba aarop H T M oB,

(13)

Własności dynamiczne algorytmów. 25

DYNAMICAL PROPERTIES OF ASTRÔM AND KALMAN ALGORITHMS IN THE MINIMUM-VARIANCE CONTROL PROBLEM

S u m m a r y

In the paper a linear, discrete In the time object Is considered. It is assumed to have single output signal y, single input-control signal u and single Input-disturbance signal v. The object is described by the following state equations:

The task of control system is to minimize the object’s output variance:

where x^ is an estimation of the state Xj.

The algorithm (IV) will be called thé Kalman algorithm if the state estimation is calculated by an optimal filter (the Kalman filter). If the

algorithm obtained will become equivalent to the Astrom algorithm (the proof is done in (7]).

In this article formulas which enable computation of the variation in the time of object’s output variance (III) for both algorithms presented above are educed. This variance is a sum of a transient part. A numerical example is presented which serves to compare the quality of algorithms.

( I )

(II)

( I I I )

In such a way the following control law (7) could be obtained:

uI [(A-gd1) ^ + gyj (IV)

state estimation x^ is done by the asymptotic form of the filter the

Cytaty

Powiązane dokumenty

wielkości niemierzonych (nieznanych) parametrów i zmiennych charakteryzujących obiekt na podstawie dostępnych obserwacji (pomiarów) innych parametrów i zmiennych badanego obiektu

Pokazać, że przy odwzorowaniu w = 1/z środek okręgu nie przechodzi na środek obrazu

[r]

Docenia przede wszystkim heroizm wykazywany w czasach, kiedy za- wieszono prawa boskie i ludzkie, odłożono na bok miłosierdzie i współczu- cie, zapomniano o humanizmie i o wspólnocie,

ci algorytmu AstrBrna z graniczną, asymptotyczną postacią algorytmu Kalmana uzyskaną przy założeniu ustalenia się macierzy kowariancji Lłędu filtracji dla

V przypadku klasycznej struktury Informacji bieżącej w pracy podano sposób wyznaczania praw sterowania w strukturach CL i OLF wykorzystujący delcomponowalność operacji

[r]

lenia prądu wzbudzenia wymaganego w czasie samowzbudzenia się silnika po zmianie kierunku wirowania’, natomiast przez rezystor R2 jest doładowywany kondensator C w