ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ Seria: AUTOMATYKA z. 47
________ 1979 N r kol. 605
Andrzej BARGIF.i.A
SUBOJPTYMALNE STEROWANIE DUALNE OBIEKTÓW O NIEZNANYCH PARAMEIHACH
Streszozenie. W praoy przedstawiono nowy rodzaj sterowania adap
tacyjnego spełniającego zarówno funkoję identyfikaoji Jak i stero
wania. Został on wyprowadzony w oparciu o minimalizację wartości o—
czekiwanej kwadratu wyjścia n a jeden krok naprzód, uwzględniająo o—
graniozenie n a ślad jednokrokowej estymaty maoierzy kowariancji błę
du estymaoji. D l a wyliczenia w ozasie rzeozywistym estymat parame
trów i maoierzy informaoyjnej wykorzystywanych przez algorytm ste-- rowania posłużono się teohniką filtru Kalmana. Dwa przykłady nume
ryczne pozwalają n a porównanie tego sterowania ze sterowaniem nie- dualnym i perturbacyjnym,
1. Wstęp
Zagadnienie sterowania obiektem o nieznanych parametrach wymaga znale
zienia takich sterowań, któro spełniają podwójną rolę, minimalizują wskaź
n i k jakośoi i utrzymują dobrą identyfikację. W przypadku obiektu liniowe
go zadanie daje się sprowadzić do niezależnego zaprojektowania filtru Kal
mana i macierzy sprzężenia zwrotnego. Uzyskane rozwiązanie, wprawdzie do
kładne pod względem analitycznym, jest jednak nieprzydatne do sterowania obiektem w czasie rzeczywistym, ponieważ zńalezienie macierzy sprzężenia zwrotnego wymaga wcześniejszej znajomośol obiektu. Było to powodem poszu
kiwania suboptymalnych strategii sterowania pozwalających n a analityczne wyznaczenie sterowali w czasie rzeozywistym. Przykładami takioh rozwiązań są:
- "strategia wymuszonego rozdzielenia" zaproponowana przez IstrBma i Vit- tenmarka [1] polegająca n a wyliczaniu sterowania tak, jak gdyby system posiadał deterministyczne parametry oraz podstawieniu estymat w miejsoe parametrów,
- "zasada minimalizaoji i uśredniania" zaproponowana przez Gessinga [2,3] i polegająoa n a przeprowadzeniu w śoiśle ustalonej kolejności operaoji minimalizaoji i uśredniania wskaźnika Jakości,
- "sterowanie perturbacyjne" zaproponowane przez Yieslandera i Yittenmar—
ka [4] będące w istocie sterowaniem adaptacyjnym z dodatkowym sygnałem zakłócająoym m ająoym n a o elu poprawę identyfikacji.
<)6 . Dargloła
2. u f o r m u ł o w a n i o p r o b l e m u
Zaproponowana tutaj strategia sterowania dotyczy obiektu opisanego rów
naniom róźnicov>iu
y(t) = a 1 ( t)y( t - i) + ... + an (t'y(t - n) +
b^(t)u(t - 1 ) + ... + bn (t)u(t - n) + o(t' (i'
gdzio:
t = 1,2 •« • - dyskretne wskaźniki czasu, y ( 0 , u{t) - odpowiednio wyjśoie i wejście,
b^(t) - nieznane parametry,
e(t) - szum n iezależny o rozkładzie normalnym o ( t ) ~ X [p,R].
Strategia ta pozwala na wyliczenie sterowań w czasie rzeczywistym.
Suboptyraalna natura uzyskanego rozwiązania wynika z wyboru wskaźnika Jakości w postaci
J = E [ y 2 (t)] (2)
a nie jako
N J N = Ei X y 2 i t )]
t=i
Konsekwencją zastosowania Jednokrokowego wskaźnika jakości Jest z Jed
nej strony krótkowzroczność strategii sterowania, z drugiej Jednak wskaź
nik t a k i m m o ż l i w i a wyliczenie sterowania w czasie rzeczywistym,którego po
stać numeryczna jest prostsza.od algorytmów opartych na polnym rozwiąza
niu dualnym. Niekorzystna cecha strategii sterowania wynikająca z zasto
sowania wskaźnika Jakości (2) została znacznie zredukowana przez odi>owied—
nie przyjęcie ograniczenia na błąd estymacji współczynników systemu.
Sterowanie optymalne w sensie wskaźnika' (2) wyliczono, wykorzystując podstawowy lemat sterowania stochustycznego Xstrôma. Minimalizacja (2) Jest równoważna na mocy tego lematu
J 0 = min E [ y 2(t + O / r J u( t;
Suboptymalne sterowanie dualno obiektów.. 97
gd z i e :
>'t = j^y( t)y( t - 1) ... u( t - O u C t - 2 ) ***j>
jest zbiorem poprzednich wyjść i sterowań.
J = min E [ y 2(t + l)|yt] = (5 )
u(t) 1
= min e[ (a,(t+1)y(t) + ... + a (t+1)y(t-n+1) + b (t+l)u(t) + ...
( i. \ *■ » “ ‘
u( t)
+ bn (t+l)u(t-n+l) + e(t))2|yt] =
= min E [ b 2 (t+1)u2 (t) + 2b ( t+ 1 )u( t}a^( t + 1) Y( t) + u( t)
2b^ ( t+1 )u( t)e( t+1 )| y^ ] + składniki niezależne od u(t)
a c (t) = [ a -j(t), kg(t)|...( an (t), 0 , b^ft),..., bn (t)]
YT (t) = [y(t), y(t-l),..., y(t—n + 1 ), 0 , u(t-l),..., u(t-n+l)] I
Obliczając w (5) wartość oczekiwaną warunkową i różniczkując otrzymany wynik względem u(t), otrzymujemy sterowajiie optymalne minimalizujące JQ .
Sterowanie to przedstawia się wzorem:
fi Ą ( t+ 1 11) a^( t+ 1 11) + P^ . ( t+ 1 11)
u°(t) = - ^ '-- Y(t) (6)
b^Ct+1 |t) + Pb b ^(t+l| t)
gdzie:
P^+ ^(t+1 |t) — jest (n+l)— szą kolumną macierzy kowariancji błędów esty
macji parametrów P(t+l|t) (równ. filtru Kalmana (11)), P. . (t+ljt) - jest (n+l)x(n+l) elementem macierzy P(t+l|t),
1 1
Przy wyliczaniu wartości sterowania u°(t) wykorzystuje się predykowane przy pomocy filtru Kalmana wartości parametrów obiektu i maoierzy kowa
riancji błędu estymacji.
Zapisując równania obiektu w postaci:
y(t) = $ T ( t) 0 (t) + e(t) (7) 0(t) = 0 ( t - l ) + v(t) , (8)
2S
A, BargielaRównania filtru są:
8 (t+l|t) = 0 (111— 1) + K(t)[y(t) - <{>T (t)0 ( 111- 1 )] (9 )
K ( t ) = P ( t | t - l ) < ^ ( t ) [ < J > T ( t ) P ( t | t - l ) < J ( t ) + R ] “ 1 ( 1 0 )
P ( t + 1 |t ) = [ l - K { t ) < | | T ( t ) ] p ( t ) t - 0 [ x - K ( t ) ^ T ( t ) ] T + K ( t ) R K T ( t ) + QA ( 1 1 '
Adaptacyjne prawo sterowania uzależnia sterowanie od estymat parame
trów systemu i ich wariancji błędów. Jednakże estymacja i sterowanie są rozdzielone i sterowanie nie wpływa n a poprawę identyfikaoji.Jest to p r z y czyną występowania zjawiska "wygaszania" regulatora opisanego w praoy M przez Vieslandera. Zaproponowana tam motoda zapobiegania zjawisku wygasza
nia polegała n a dodaniu do sterowania adaptacyjnego małego sygnału zakłó
cającego. Sterowanie to, nazwane sterowaniem perturbaoyjnym, polepszało przekształcenie, nie pozwalając wygasnąć sterowaniu i podtrzymując śledze
nie parametrów systemu. Natomiast w przypadku dobrej estymacji parametrów sygnał zakłócająoy jest szkodliwy, niepotrzebnie zwiększając sterowanie.
3. Sterowanie dualne
Analiza zjawiska wygaszania pozwoliła n a zaproponowanie sterowania du- . alnego odgrywająoego w przeciwieństwie do sterowania perturbacyjnego ak
tywną rolę w procesie identyfikaoji. Zasadniczym krokiem było znalezienie funkcjonału od wartośoi błędu identyfikaoji, kt ó r y byłby miarą jakości estymat. Ponadto w aelu analitycznego wyznaczenia ograniozenia n a stero
wanie wymaga się, a b y funkojonał ten zależał również od sygnałów sterują
cych. Wymagania powyższe spełnia ślad odwrotności maoierzy kowariancji błę
du estymaoji parametrów. Żąda się, aby trP ^(t+1 |t+l) był większy od u- stalonej arbitralnie wartości granicznej} pozwala to na analityczne okreś
lenie sterowań bez konieczności rozdzielenia sterowania i identyfikaojl.
Sterowanie dualne wylicza się więc z minimalizacji (2) przy ograniczeniu
t r P - 1 ( t + 1 | t + 1 ) 5 m ( t + l ) ( 1 2 )
u względniając, ż e !
P“ 1(tt-1 11+1) = P“ 1(t+I|t) + 0 ( t + l ) R -10(t+l) (13)
gdzie:
0T (t+l) = [ a 1(t+l)...an (t+l)b1{t+l)...bn (t+l)]
Suboptymalne atarowanie dualne obiektów.. 99
otrzymuje się
trP"1(t+1 |t+l) = trP-1 (t+1 11) + R“ 20T (t+l)0(t+l) =
= trP- 1 (t+l|t) + R “ 1[ u 2 (t) + YT (t)ł’(t)] (14)
Z (12) i (14) można wyliozyć minimalne dopuszczalno ze względu n a ja
kość ostymaoji parametrów sterowanie
^n(t) n(t) > 0 0 n(t) < 0
(15)
gdzie!
n(t) = R[m(t+1) - trP“ 1(t+1 | t)] - YT (t)Y(t)
Dla sterowania adaptacyjnego wyliczonego z minimalizacji wskaźnika Ja
kości (2) słuszne więc będzie ograniczenie
|u(t)] > «„,(*) 0 $
W celu określenia znaku -sterowania dualnego rozpatrzono część funkcji strat Jo zależną od u(t). Ponieważ jeden składnik jest liniowy a drugi kwadratowy względem u(t), najmniejszą wartość funkoji strat uzyskujemy dla sterowania
=
um (t)sign(u°(t)) |u°(t)| < ura(t)
(17) u°(t) |u°(t)| > um (Ł )
Można zauważyć, że pomijając ograniczenie (1 z) - (um (*) = o) - stero
wanie dualne (1 7) Jest równoważne niedualnomu (6). Uezpośrednia kontrola wielkości macierzy kowariancji błędu estymacji parametrów pozwala na wy
korzystanie zaproponowanego sterowania dualnego w przypadku obiektów nie
stacjonarnych, bowiem błąd identyfikacji zostaje szybko wykryty i skory
gowany. Jest to równio* przyczyną, dla której możliwe było przyjęcie w rozpatrywanych przykładach stałych wartośoi wariancji parametrów do fil
tru Kalmana i identyfikacja wyłącznie wariancji szumu pomiarowego, co znacz
nie upraszoza numeryczną stronę zagadnienia.
Efektywność proponowanego algorytmu sterowania badano poprzez symula
cję na maszynie cyfrowej dla różnych modeli obiektów i porównano wyniki z wynikami uzyskiwanymi dla sterowaniu nieduainogo i perturbacyjnego.
100 A. Bargicła
Za miarę- jakości sterowania przyjęto Jak w [A] akumulowaną funkcję strat
n
V ( n ) = ^ y 2 (t) (18)
t=1
W celu uproszczenia obliczeń Sf przykładach rozpatrzono obiekty o dwóch zmiennych parametrach, a wio o :
0 T (t) = [a1 ( t)bf ( t)]
U. Przykłady
Przykład 1
Przykład ten dotyczy sterowania obiektem o nieznanych stochastycznych parametrach. Ula sterowania niedualnego, dualnego i perturbacyjnego uśred
niono akumulowaną funkcję strat dla trzydziestu i pięćdziesięciu n iezależ
nych symulacji, Względny błąd wyliczenia skumulowanej funkcji strat nie przekraczał 5?»» co Jest wystarczające do badań porównawczych i świadczy o reprezentatywności uśrednionych przebiegów.
Założona wartość wariancji szumu parametrów jest - w pierwszym z roz
patrywanych przypadków - dokładna, a w drugim róZni się dziesięciokrotnie od wartości rzeczywistej.
■Symulacje pozwalają więc ocenić znaczenie dokładnej znajomości tej wa
riancji.
Wartości początkowe parametrów symulowanego obiektu generowane były lo
sowo, natomiast wariancje szumu pomiarowego i macierz kowariancji szumu parametrów wynoszą odpowiednio!
R = Ił . 10~2
q = diag[ó . 1 0- 5 , 2 . to“ 3]
Założona wartość macierzy kowariancji szumu parametrów wykorzystana w równaniach fil troi Kaimana;
— dla przypadku pierwszego
a- = («
- dlu przypadku drugiego
(19)
qA = li»}
Suboptvmalne a terowanie dualna obiektów...
Wit]
loi
80
«0
40
20
staro w an ie d u aln e Sterowanie nieduolne sterow an ie perturbacyjne najm niejsza w arto ść W it) przy zn a n ych p ara m e trach
/
i
~2$0 ’ 40(f 600 000 1000
Rys. 1. Przykład 1. Uśredniona skumulowana funkcja strata Znane Q
600
000
m
<50
<00
s t e r o w a n ie dualne sterow anie niedualne sterow an ie p ertu rb acyjn e n ajm n iejsza w a rto ś ć W(t) przy zn anych p a ra m e tra c h
2Óa ' *6o
Rys. Z. Przykład 1. Uśredniona »kumulowana funkcja strat,Nieznane Q
102 A. Bargleła
Paramatry regulatora dualnego:
m„ = 20 o
■ p £ p | = 0.25
a warlanoJa azumu zakłócającego w sterowaniu perturbacyjnym
z = 0.08
Przebiegi wartości uśrednionej akumulowanej funkcji strat wykazują przewagę sterowania dualnego n a d niedualnym i perturbacyjnym*
V porównaniu do funkcji strat uzy
skanej przy dokładnej znajomości Q (rys. 1) obserwuje się dla sterowania dualnego wzrost jej wartości o około 17£, natomiast dla sterowania pertur
bacyjnego i niedualnego wynosi odpo
wiednio 325C i k5%. T a względna nieozu—
łość sterowania dualnego n a błąd okreś
lenia QA motywowana była p r z y opisie sterowania. Analiza naohylenia 9(t) - rys. 2 - pozwala ponadto n a stwier
dzenie, Ze nie jest korzystne ukierun
kowywanie sterowania n a identyfikację w początkowym okresie symulacji (dla sterowania perturbacyjnego poozątkowy wzrost funkcji strat był zawsze w i ę kszy n i ż dla sterowania niedualnego).
Było to przesłanką do poszukiwania najbardziej korzystnej zależności f u n k cyjnej dla ograniozenia m(t), takiej, która b y dla małych t preferowała sterowanie według u°(t). Przykładem takiej zależności wykorzystywanej w symulacjach Jest przebieg przedstawiony na rys. 3.
Przykład 2
System, w których a(t) i b(t) są funkcjami deterministycznymi - a(t) jest stałe a b(t) zmienia się w określony sposób - rozpatrywany był już przez Viealandera i Vittenmarka. Celem tego przykładu było zbadanie, ozy sterowanie perturbacyjne pozwala na osiągnięcie dobrych efektów również dla systemu różnego od zaproponowanego w
GO.
Rys. 3. Przykład 1, Zmienne o—
graniczenie n a trP"^(t+111+ 0
SuboptymaJLne starowanie dualne obiektów.«.
s te r o w a n ie duaLne s te r o w a n ie n ied u a ln e ste ro w a n ie p e r t u r b a c y jn e m inim alna w a rto ó t W(t) przy zn a n y ch p a ra m e tra c h
Rys. ^ . P r z y k ł a d 2. Uśredniona akumulowana funkcja strat
— b / t /
b j t i sterowanie perturbacyjne b / t / sterowanie dualne b / t / sterowanie niedualne
Rys. 5, Przykład 2. Parainotr'b( t) i jego estymaty
Wykorzystana do estywau|i wariancja szumu pomiarowego J szumu parame
trów wynosi odpowiednio
R = 9 . to“2
QA = diag[lo“ 7 , 2 . 10"3]
Początkowa wax*to4ó parametrów modelu i macierz kowariai-’ .i wspólrzyn—
nlków wynosi;
8 ( 1 |o) = [io_ 1 , to"1]
1>(1|0) = diag[4, 4]
Analiza uśrednionej funkcji strat (rys. 1») wskazuje, że sterowalnie pen- turbacyjno jest bardziej wrażliwo na zmiany współczynników lodelu niż ste
rowanie dualne. Wprawdzie dla modelu zmian b(t) Jak w [4] sterowania te są porównywalne! lecz dla innych zmian możliwe Jest - Jak w tym przykła
dzie - uzyskanie nawet gorszych efektów niż dla sterowania niedualnego.
Przykładowy przebieg estymacji parametru b(t) (rys. 5) pozwala na za
obserwowanie korzystnej cechy sterowania dualnego - stopniowego udoklad- nienia eatywaty b(t). Rys. 5 zasługuje dodatkowo na uwagę ze względu na wystąpienie zjawiska wygaszania w przypadku sterowania niedualnego. Obja
wia się to wyzerowaniem estymaty b ( t ) . Efektem takiego stanu Jest przyję
cie przez model poetaoi
y(t) = a(t)y(t-l) + e(t)
W przypadku, g d y a ( t ) < 1, narastanie y(t) oraz macierzy kowariancji błędu estymacji ni# jest zbyt szybkie i stan wygaszenia trwa do końca o- kreeu symulacji.
5. Uwagi końcowe
Zaproponowany nowy rodzaj suboptymalnego sterowania dualnego wykorzy
stujący miarę kowariancji błędu estymacji parametrów do okresowego ukie
runkowywania sterowania na Identyfikację jest stosunkowo prosty numerycz
nie.
Efektem stosowania tego algorytmu było:
— zabezpieczenie się przed wysłąpieniem zjawiska wygaszania dl.a każdego z rozpatrywanych systemów,
- uzyskanie mniejszej wartości wskaźnika jakości niż przy sterowaniu per
turbacyjnym czy niedualnym,
Suboptymalne sterowanie dualno obiektów... 1 0 5.
- mniejsza wrażliwość algorytmu dualnego nu zmiany parametrów systemu (moż
liwa przybliżona ocona wartości i>A).
Dalsze możliwości tego algorytmu tkwią we właściwym zaprojektowaniu spo
sobu zmian m(t) w zależności od sterowanego obiektu«
LITERATURA
[Í] ÁstrtJra K.J., Uittenmurk )i,¡ 1’roblems of Identification and Control.
J .Math.jVnul.Appi . 10 f 1971) .
[2] Gessing R.s Zasada minimalizacji i uśredniania Jako metoda wyznaoza- nia algorytmów sterowania statystycznie optymalnego. Archiwum Autom, i Teleraech. z, U. (1976).
[3] Gessing II,: Zastosowanie zasady minimalizao ji i uśredniania do wyzna
czania sterowania optymalnego. Archiwum Autom, i Telemech. z.1* (1976).
[¿ł] Vieslander J., Wittenmark U.: An Approach to Adaptive Control UsJLng Real Time Identification. Automática Vol 7 (1971).
C y B O n T H M A J I b K O S m B O A C T B E K H O E y n P A B J I E H H E O E B E K T A M H C H E K3B E C T H Ü M H I1A P A M E T P A M H
P e 3 10 M e
B c i a i b e p a c c M a T p K B a e i c a H O B n ñ b h a a A a n x a u H O H H o r o y n p a B J i e u H H B u n o a H H W Ę e - r o b p a B H o i ł u e p e , < J y H K U H H o n o s H a B a H m a h y n p a B j i e H a a . Ou b u b c a ^ h m3 M H H H M a j i n — 3a u a u c p e j m e r o 3H a u e H u a B a p u a H U H u H C x o A H o r o c u r u a a a H a o a h h m a r B n e p ë A , y u u - T K B a a o r p a H H U e u u e c j i e . u a O A H o m a r o B o f l 3C t u u a T H u a t p u i m k o B a p a a H T H O C t h o e h6k h 3C T K I < a U H H .
Æjia Buuuca eu ua b AeflCTBHiejibHox Bpexeuu acTKxai napaxeTpoB cHCTeuiFH h h- (fopMauHOHHofi x a i pu u H u c n oa b 3y ex ux a a r o p u r « ynpaBaeHua, n p uM eueua lexuHKa (fiuabTpa K aa bu aH a . # B a u o x ep Hu ec K Hx npHM ep a no3Boaa»i c paBUHTb oior aar op ux x y n p a B a e H u a c HeflBotlcTBeHHUM h nepTy p0 a nn oH UU M ynpaBJteHHex.
SUBOPTIMUM DUAL CONTROL OF OBJECTS OF UNKNOWN PARAMETERS
S u m m a r y
A n e w adaptive control algorithm where the control is for both, regu
lation and identification, is presented in this article. It was derived b y minimizing the one-stop-ahead expected squared output subjeot to a constraint on the trace of the one-step-ahead estimation error covariance matrix. Kalman filter technique was used to give in real time the values of estimated parameters and information matrix. Two examples have let us compare this algorithm to nondual and perturbation control.