Suboptymalne sterowanie dualne obiektów o nieznanych parametrach

(1)

ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ Seria: AUTOMATYKA z. 47

________ 1979 N r kol. 605

Andrzej BARGIF.i.A

SUBOJPTYMALNE STEROWANIE DUALNE OBIEKTÓW O NIEZNANYCH PARAMEIHACH

Streszozenie. W praoy przedstawiono nowy rodzaj sterowania adap

tacyjnego spełniającego zarówno funkoję identyfikaoji Jak i stero

wania. Został on wyprowadzony w oparciu o minimalizację wartości o—

czekiwanej kwadratu wyjścia n a jeden krok naprzód, uwzględniająo o—

graniozenie n a ślad jednokrokowej estymaty maoierzy kowariancji błę

du estymaoji. D l a wyliczenia w ozasie rzeozywistym estymat parame

trów i maoierzy informaoyjnej wykorzystywanych przez algorytm ste-- rowania posłużono się teohniką filtru Kalmana. Dwa przykłady nume

ryczne pozwalają n a porównanie tego sterowania ze sterowaniem nie- dualnym i perturbacyjnym,

1. Wstęp

Zagadnienie sterowania obiektem o nieznanych parametrach wymaga znale

zienia takich sterowań, któro spełniają podwójną rolę, minimalizują wskaź

n i k jakośoi i utrzymują dobrą identyfikację. W przypadku obiektu liniowe

go zadanie daje się sprowadzić do niezależnego zaprojektowania filtru Kal

mana i macierzy sprzężenia zwrotnego. Uzyskane rozwiązanie, wprawdzie do

kładne pod względem analitycznym, jest jednak nieprzydatne do sterowania obiektem w czasie rzeczywistym, ponieważ zńalezienie macierzy sprzężenia zwrotnego wymaga wcześniejszej znajomośol obiektu. Było to powodem poszu

kiwania suboptymalnych strategii sterowania pozwalających n a analityczne wyznaczenie sterowali w czasie rzeozywistym. Przykładami takioh rozwiązań są:

- "strategia wymuszonego rozdzielenia" zaproponowana przez IstrBma i Vit- tenmarka [1] polegająca n a wyliczaniu sterowania tak, jak gdyby system posiadał deterministyczne parametry oraz podstawieniu estymat w miejsoe parametrów,

- "zasada minimalizaoji i uśredniania" zaproponowana przez Gessinga [2,3] i polegająoa n a przeprowadzeniu w śoiśle ustalonej kolejności operaoji minimalizaoji i uśredniania wskaźnika Jakości,

- "sterowanie perturbacyjne" zaproponowane przez Yieslandera i Yittenmar—

ka [4] będące w istocie sterowaniem adaptacyjnym z dodatkowym sygnałem zakłócająoym m ająoym n a o elu poprawę identyfikacji.

(2)

<)6 . Dargloła

2. u f o r m u ł o w a n i o p r o b l e m u

Zaproponowana tutaj strategia sterowania dotyczy obiektu opisanego rów

naniom róźnicov>iu

y(t) = a 1 ( t)y( t - i) + ... + an (t'y(t - n) +

b^(t)u(t - 1 ) + ... + bn (t)u(t - n) + o(t' (i'

gdzio:

t = 1,2 •« • - dyskretne wskaźniki czasu, y ( 0 , u{t) - odpowiednio wyjśoie i wejście,

b^(t) - nieznane parametry,

e(t) - szum n iezależny o rozkładzie normalnym o ( t ) ~ X [p,R].

Strategia ta pozwala na wyliczenie sterowań w czasie rzeczywistym.

Suboptyraalna natura uzyskanego rozwiązania wynika z wyboru wskaźnika Jakości w postaci

J = E [ y 2 (t)] (2)

a nie jako

N J N = Ei X y 2 i t )]

t=i

Konsekwencją zastosowania Jednokrokowego wskaźnika jakości Jest z Jed

nej strony krótkowzroczność strategii sterowania, z drugiej Jednak wskaź

nik t a k i m m o ż l i w i a wyliczenie sterowania w czasie rzeczywistym,którego po

stać numeryczna jest prostsza.od algorytmów opartych na polnym rozwiąza

niu dualnym. Niekorzystna cecha strategii sterowania wynikająca z zasto

sowania wskaźnika Jakości (2) została znacznie zredukowana przez odi>owied—

nie przyjęcie ograniczenia na błąd estymacji współczynników systemu.

Sterowanie optymalne w sensie wskaźnika' (2) wyliczono, wykorzystując podstawowy lemat sterowania stochustycznego Xstrôma. Minimalizacja (2) Jest równoważna na mocy tego lematu

J 0 = min E [ y 2(t + O / r J u( t;

(3)

Suboptymalne sterowanie dualno obiektów.. 97

gd z i e :

>'t = j^y( t)y( t - 1) ... u( t - O u C t - 2 ) ***j>

jest zbiorem poprzednich wyjść i sterowań.

J = min E [ y 2(t + l)|yt] = (5 )

u(t) 1

= min e[ (a,(t+1)y(t) + ... + a (t+1)y(t-n+1) + b (t+l)u(t) + ...

( i. \ *■ » “ ‘

u( t)

+ bn (t+l)u(t-n+l) + e(t))2|yt] =

= min E [ b 2 (t+1)u2 (t) + 2b ( t+ 1 )u( t}a^( t + 1) Y( t) + u( t)

2b^ ( t+1 )u( t)e( t+1 )| y^ ] + składniki niezależne od u(t)

a c (t) = [ a -j(t), kg(t)|...( an (t), 0 , b^ft),..., bn (t)]

YT (t) = [y(t), y(t-l),..., y(t—n + 1 ), 0 , u(t-l),..., u(t-n+l)] I

Obliczając w (5) wartość oczekiwaną warunkową i różniczkując otrzymany wynik względem u(t), otrzymujemy sterowajiie optymalne minimalizujące JQ .

Sterowanie to przedstawia się wzorem:

fi Ą ( t+ 1 11) a^( t+ 1 11) + P^ . ( t+ 1 11)

u°(t) = - ^ '-- Y(t) (6)

b^Ct+1 |t) + Pb b ^(t+l| t)

gdzie:

P^+ ^(t+1 |t) — jest (n+l)— szą kolumną macierzy kowariancji błędów esty

macji parametrów P(t+l|t) (równ. filtru Kalmana (11)), P. . (t+ljt) - jest (n+l)x(n+l) elementem macierzy P(t+l|t),

1 1

Przy wyliczaniu wartości sterowania u°(t) wykorzystuje się predykowane przy pomocy filtru Kalmana wartości parametrów obiektu i maoierzy kowa

riancji błędu estymacji.

Zapisując równania obiektu w postaci:

y(t) = $ T ( t) 0 (t) + e(t) (7) 0(t) = 0 ( t - l ) + v(t) , (8)

(4)

2S

A, Bargiela

Równania filtru są:

8 (t+l|t) = 0 (111— 1) + K(t)[y(t) - <{>T (t)0 ( 111- 1 )] (9 )

K ( t ) = P ( t | t - l ) < ^ ( t ) [ < J > T ( t ) P ( t | t - l ) < J ( t ) + R ] “ 1 ( 1 0 )

P ( t + 1 |t ) = [ l - K { t ) < | | T ( t ) ] p ( t ) t - 0 [ x - K ( t ) ^ T ( t ) ] T + K ( t ) R K T ( t ) + QA ( 1 1 '

Adaptacyjne prawo sterowania uzależnia sterowanie od estymat parame

trów systemu i ich wariancji błędów. Jednakże estymacja i sterowanie są rozdzielone i sterowanie nie wpływa n a poprawę identyfikaoji.Jest to p r z y  czyną występowania zjawiska "wygaszania" regulatora opisanego w praoy M przez Vieslandera. Zaproponowana tam motoda zapobiegania zjawisku wygasza

nia polegała n a dodaniu do sterowania adaptacyjnego małego sygnału zakłó

cającego. Sterowanie to, nazwane sterowaniem perturbaoyjnym, polepszało przekształcenie, nie pozwalając wygasnąć sterowaniu i podtrzymując śledze

nie parametrów systemu. Natomiast w przypadku dobrej estymacji parametrów sygnał zakłócająoy jest szkodliwy, niepotrzebnie zwiększając sterowanie.

3. Sterowanie dualne

Analiza zjawiska wygaszania pozwoliła n a zaproponowanie sterowania du- . alnego odgrywająoego w przeciwieństwie do sterowania perturbacyjnego ak

tywną rolę w procesie identyfikaoji. Zasadniczym krokiem było znalezienie funkcjonału od wartośoi błędu identyfikaoji, kt ó r y byłby miarą jakości estymat. Ponadto w aelu analitycznego wyznaczenia ograniozenia n a stero

wanie wymaga się, a b y funkojonał ten zależał również od sygnałów sterują

cych. Wymagania powyższe spełnia ślad odwrotności maoierzy kowariancji błę

du estymaoji parametrów. Żąda się, aby trP ^(t+1 |t+l) był większy od u- stalonej arbitralnie wartości granicznej} pozwala to na analityczne okreś

lenie sterowań bez konieczności rozdzielenia sterowania i identyfikaojl.

Sterowanie dualne wylicza się więc z minimalizacji (2) przy ograniczeniu

t r P - 1 ( t + 1 | t + 1 ) 5 m ( t + l ) ( 1 2 )

u względniając, ż e !

P“ 1(tt-1 11+1) = P“ 1(t+I|t) + 0 ( t + l ) R -10(t+l) (13)

gdzie:

0T (t+l) = [ a 1(t+l)...an (t+l)b1{t+l)...bn (t+l)]

(5)

Suboptymalne atarowanie dualne obiektów.. 99

otrzymuje się

trP"1(t+1 |t+l) = trP-1 (t+1 11) + R“ 20T (t+l)0(t+l) =

= trP- 1 (t+l|t) + R “ 1[ u 2 (t) + YT (t)ł’(t)] (14)

Z (12) i (14) można wyliozyć minimalne dopuszczalno ze względu n a ja

kość ostymaoji parametrów sterowanie

^n(t) n(t) > 0 0 n(t) < 0

(15)

gdzie!

n(t) = R[m(t+1) - trP“ 1(t+1 | t)] - YT (t)Y(t)

Dla sterowania adaptacyjnego wyliczonego z minimalizacji wskaźnika Ja

kości (2) słuszne więc będzie ograniczenie

|u(t)] > «„,(*) 0 $

W celu określenia znaku -sterowania dualnego rozpatrzono część funkcji strat Jo zależną od u(t). Ponieważ jeden składnik jest liniowy a drugi kwadratowy względem u(t), najmniejszą wartość funkoji strat uzyskujemy dla sterowania

=

um (t)sign(u°(t)) |u°(t)| < ura(t)

(17) u°(t) |u°(t)| > um (Ł )

Można zauważyć, że pomijając ograniczenie (1 z) - (um (*) = o) - stero

wanie dualne (1 7) Jest równoważne niedualnomu (6). Uezpośrednia kontrola wielkości macierzy kowariancji błędu estymacji parametrów pozwala na wy

korzystanie zaproponowanego sterowania dualnego w przypadku obiektów nie

stacjonarnych, bowiem błąd identyfikacji zostaje szybko wykryty i skory

gowany. Jest to równio* przyczyną, dla której możliwe było przyjęcie w rozpatrywanych przykładach stałych wartośoi wariancji parametrów do fil

tru Kalmana i identyfikacja wyłącznie wariancji szumu pomiarowego, co znacz

nie upraszoza numeryczną stronę zagadnienia.

Efektywność proponowanego algorytmu sterowania badano poprzez symula

cję na maszynie cyfrowej dla różnych modeli obiektów i porównano wyniki z wynikami uzyskiwanymi dla sterowaniu nieduainogo i perturbacyjnego.

(6)

100 A. Bargicła

Za miarę- jakości sterowania przyjęto Jak w [A] akumulowaną funkcję strat

n

V ( n ) = ^ y 2 (t) (18)

t=1

W celu uproszczenia obliczeń Sf przykładach rozpatrzono obiekty o dwóch zmiennych parametrach, a wio o :

0 T (t) = [a1 ( t)bf ( t)]

U. Przykłady

Przykład 1

Przykład ten dotyczy sterowania obiektem o nieznanych stochastycznych parametrach. Ula sterowania niedualnego, dualnego i perturbacyjnego uśred

niono akumulowaną funkcję strat dla trzydziestu i pięćdziesięciu n iezależ

nych symulacji, Względny błąd wyliczenia skumulowanej funkcji strat nie przekraczał 5?»» co Jest wystarczające do badań porównawczych i świadczy o reprezentatywności uśrednionych przebiegów.

Założona wartość wariancji szumu parametrów jest - w pierwszym z roz

patrywanych przypadków - dokładna, a w drugim róZni się dziesięciokrotnie od wartości rzeczywistej.

■Symulacje pozwalają więc ocenić znaczenie dokładnej znajomości tej wa

riancji.

Wartości początkowe parametrów symulowanego obiektu generowane były lo

sowo, natomiast wariancje szumu pomiarowego i macierz kowariancji szumu parametrów wynoszą odpowiednio!

R = Ił . 10~2

q = diag[ó . 1 0- 5 , 2 . to“ 3]

Założona wartość macierzy kowariancji szumu parametrów wykorzystana w równaniach fil troi Kaimana;

— dla przypadku pierwszego

a- = («

- dlu przypadku drugiego

(19)

qA = li»}

(7)

Suboptvmalne a terowanie dualna obiektów...

Wit]

loi

80

«0

40

20

staro w an ie d u aln e Sterowanie nieduolne sterow an ie perturbacyjne najm niejsza w arto ść W it) przy zn a n ych p ara m e trach

/

i

~2$0 ’ 40(f 600 000 1000

Rys. 1. Przykład 1. Uśredniona skumulowana funkcja strata Znane Q

600

000

m

<50

<00

s t e r o w a n ie dualne sterow anie niedualne sterow an ie p ertu rb acyjn e n ajm n iejsza w a rto ś ć W(t) przy zn anych p a ra m e tra c h

2Óa ' *6o

Rys. Z. Przykład 1. Uśredniona »kumulowana funkcja strat,Nieznane Q

(8)

102 A. Bargleła

Paramatry regulatora dualnego:

m„ = 20 o

■ p £ p | = 0.25

a warlanoJa azumu zakłócającego w sterowaniu perturbacyjnym

z = 0.08

Przebiegi wartości uśrednionej akumulowanej funkcji strat wykazują przewagę sterowania dualnego n a d niedualnym i perturbacyjnym*

V porównaniu do funkcji strat uzy

skanej przy dokładnej znajomości Q (rys. 1) obserwuje się dla sterowania dualnego wzrost jej wartości o około 17£, natomiast dla sterowania pertur

bacyjnego i niedualnego wynosi odpo

wiednio 325C i k5%. T a względna nieozu—

łość sterowania dualnego n a błąd okreś

lenia QA motywowana była p r z y opisie sterowania. Analiza naohylenia 9(t) - rys. 2 - pozwala ponadto n a stwier

dzenie, Ze nie jest korzystne ukierun

kowywanie sterowania n a identyfikację w początkowym okresie symulacji (dla sterowania perturbacyjnego poozątkowy wzrost funkcji strat był zawsze w i ę kszy n i ż dla sterowania niedualnego).

Było to przesłanką do poszukiwania najbardziej korzystnej zależności f u n k  cyjnej dla ograniozenia m(t), takiej, która b y dla małych t preferowała sterowanie według u°(t). Przykładem takiej zależności wykorzystywanej w symulacjach Jest przebieg przedstawiony na rys. 3.

Przykład 2

System, w których a(t) i b(t) są funkcjami deterministycznymi - a(t) jest stałe a b(t) zmienia się w określony sposób - rozpatrywany był już przez Viealandera i Vittenmarka. Celem tego przykładu było zbadanie, ozy sterowanie perturbacyjne pozwala na osiągnięcie dobrych efektów również dla systemu różnego od zaproponowanego w

GO.

Rys. 3. Przykład 1, Zmienne o—

graniczenie n a trP"^(t+111+ 0

(9)

SuboptymaJLne starowanie dualne obiektów.«.

s te r o w a n ie duaLne s te r o w a n ie n ied u a ln e ste ro w a n ie p e r t u r b a c y jn e m inim alna w a rto ó t W(t) przy zn a n y ch p a ra m e tra c h

Rys. ^ . P r z y k ł a d 2. Uśredniona akumulowana funkcja strat

— b / t /

b j t i sterowanie perturbacyjne b / t / sterowanie dualne b / t / sterowanie niedualne

Rys. 5, Przykład 2. Parainotr'b( t) i jego estymaty

(10)

Wykorzystana do estywau|i wariancja szumu pomiarowego J szumu parame

trów wynosi odpowiednio

R = 9 . to“2

QA = diag[lo“ 7 , 2 . 10"3]

Początkowa wax*to4ó parametrów modelu i macierz kowariai-’ .i wspólrzyn—

nlków wynosi;

8 ( 1 |o) = [io_ 1 , to"1]

1>(1|0) = diag[4, 4]

Analiza uśrednionej funkcji strat (rys. 1») wskazuje, że sterowalnie pen- turbacyjno jest bardziej wrażliwo na zmiany współczynników lodelu niż ste

rowanie dualne. Wprawdzie dla modelu zmian b(t) Jak w [4] sterowania te są porównywalne! lecz dla innych zmian możliwe Jest - Jak w tym przykła

dzie - uzyskanie nawet gorszych efektów niż dla sterowania niedualnego.

Przykładowy przebieg estymacji parametru b(t) (rys. 5) pozwala na za

obserwowanie korzystnej cechy sterowania dualnego - stopniowego udoklad- nienia eatywaty b(t). Rys. 5 zasługuje dodatkowo na uwagę ze względu na wystąpienie zjawiska wygaszania w przypadku sterowania niedualnego. Obja

wia się to wyzerowaniem estymaty b ( t ) . Efektem takiego stanu Jest przyję

cie przez model poetaoi

y(t) = a(t)y(t-l) + e(t)

W przypadku, g d y a ( t ) < 1, narastanie y(t) oraz macierzy kowariancji błędu estymacji ni# jest zbyt szybkie i stan wygaszenia trwa do końca o- kreeu symulacji.

5. Uwagi końcowe

Zaproponowany nowy rodzaj suboptymalnego sterowania dualnego wykorzy

stujący miarę kowariancji błędu estymacji parametrów do okresowego ukie

runkowywania sterowania na Identyfikację jest stosunkowo prosty numerycz

nie.

Efektem stosowania tego algorytmu było:

— zabezpieczenie się przed wysłąpieniem zjawiska wygaszania dl.a każdego z rozpatrywanych systemów,

- uzyskanie mniejszej wartości wskaźnika jakości niż przy sterowaniu per

turbacyjnym czy niedualnym,

(11)

Suboptymalne sterowanie dualno obiektów... 1 0 5.

- mniejsza wrażliwość algorytmu dualnego nu zmiany parametrów systemu (moż

liwa przybliżona ocona wartości i>A).

Dalsze możliwości tego algorytmu tkwią we właściwym zaprojektowaniu spo

sobu zmian m(t) w zależności od sterowanego obiektu«

LITERATURA

[Í] ÁstrtJra K.J., Uittenmurk )i,¡ 1’roblems of Identification and Control.

J .Math.jVnul.Appi . 10 f 1971) .

[2] Gessing R.s Zasada minimalizacji i uśredniania Jako metoda wyznaoza- nia algorytmów sterowania statystycznie optymalnego. Archiwum Autom, i Teleraech. z, U. (1976).

[3] Gessing II,: Zastosowanie zasady minimalizao ji i uśredniania do wyzna

czania sterowania optymalnego. Archiwum Autom, i Telemech. z.1* (1976).

[¿ł] Vieslander J., Wittenmark U.: An Approach to Adaptive Control UsJLng Real Time Identification. Automática Vol 7 (1971).

C y B O n T H M A J I b K O S m B O A C T B E K H O E y n P A B J I E H H E O E B E K T A M H C H E K3B E C T H Ü M H I1A P A M E T P A M H

P e 3 10 M e

B c i a i b e p a c c M a T p K B a e i c a H O B n ñ b h a a A a n x a u H O H H o r o y n p a B J i e u H H B u n o a H H W Ę e - r o b p a B H o i ł u e p e , < J y H K U H H o n o s H a B a H m a h y n p a B j i e H a a . Ou b u b c a ^ h m3 M H H H M a j i n — 3a u a u c p e j m e r o 3H a u e H u a B a p u a H U H u H C x o A H o r o c u r u a a a H a o a h h m a r B n e p ë A , y u u - T K B a a o r p a H H U e u u e c j i e . u a O A H o m a r o B o f l 3C t u u a T H u a t p u i m k o B a p a a H T H O C t h o e h6k h 3C T K I < a U H H .

Æjia Buuuca eu ua b AeflCTBHiejibHox Bpexeuu acTKxai napaxeTpoB cHCTeuiFH h h- (fopMauHOHHofi x a i pu u H u c n oa b 3y ex ux a a r o p u r « ynpaBaeHua, n p uM eueua lexuHKa (fiuabTpa K aa bu aH a . # B a u o x ep Hu ec K Hx npHM ep a no3Boaa»i c paBUHTb oior aar op ux x y n p a B a e H u a c HeflBotlcTBeHHUM h nepTy p0 a nn oH UU M ynpaBJteHHex.

SUBOPTIMUM DUAL CONTROL OF OBJECTS OF UNKNOWN PARAMETERS

S u m m a r y

A n e w adaptive control algorithm where the control is for both, regu

lation and identification, is presented in this article. It was derived b y minimizing the one-stop-ahead expected squared output subjeot to a constraint on the trace of the one-step-ahead estimation error covariance matrix. Kalman filter technique was used to give in real time the values of estimated parameters and information matrix. Two examples have let us compare this algorithm to nondual and perturbation control.