• Nie Znaleziono Wyników

Suboptymalne sterowanie dualne obiektów o nieznanych parametrach

N/A
N/A
Protected

Academic year: 2022

Share "Suboptymalne sterowanie dualne obiektów o nieznanych parametrach"

Copied!
11
0
0

Pełen tekst

(1)

ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ Seria: AUTOMATYKA z. 47

________ 1979 N r kol. 605

Andrzej BARGIF.i.A

SUBOJPTYMALNE STEROWANIE DUALNE OBIEKTÓW O NIEZNANYCH PARAMEIHACH

Streszozenie. W praoy przedstawiono nowy rodzaj sterowania adap­

tacyjnego spełniającego zarówno funkoję identyfikaoji Jak i stero­

wania. Został on wyprowadzony w oparciu o minimalizację wartości o—

czekiwanej kwadratu wyjścia n a jeden krok naprzód, uwzględniająo o—

graniozenie n a ślad jednokrokowej estymaty maoierzy kowariancji błę­

du estymaoji. D l a wyliczenia w ozasie rzeozywistym estymat parame­

trów i maoierzy informaoyjnej wykorzystywanych przez algorytm ste-- rowania posłużono się teohniką filtru Kalmana. Dwa przykłady nume­

ryczne pozwalają n a porównanie tego sterowania ze sterowaniem nie- dualnym i perturbacyjnym,

1. Wstęp

Zagadnienie sterowania obiektem o nieznanych parametrach wymaga znale­

zienia takich sterowań, któro spełniają podwójną rolę, minimalizują wskaź­

n i k jakośoi i utrzymują dobrą identyfikację. W przypadku obiektu liniowe­

go zadanie daje się sprowadzić do niezależnego zaprojektowania filtru Kal­

mana i macierzy sprzężenia zwrotnego. Uzyskane rozwiązanie, wprawdzie do­

kładne pod względem analitycznym, jest jednak nieprzydatne do sterowania obiektem w czasie rzeczywistym, ponieważ zńalezienie macierzy sprzężenia zwrotnego wymaga wcześniejszej znajomośol obiektu. Było to powodem poszu­

kiwania suboptymalnych strategii sterowania pozwalających n a analityczne wyznaczenie sterowali w czasie rzeozywistym. Przykładami takioh rozwiązań są:

- "strategia wymuszonego rozdzielenia" zaproponowana przez IstrBma i Vit- tenmarka [1] polegająca n a wyliczaniu sterowania tak, jak gdyby system posiadał deterministyczne parametry oraz podstawieniu estymat w miejsoe parametrów,

- "zasada minimalizaoji i uśredniania" zaproponowana przez Gessinga [2,3] i polegająoa n a przeprowadzeniu w śoiśle ustalonej kolejności operaoji minimalizaoji i uśredniania wskaźnika Jakości,

- "sterowanie perturbacyjne" zaproponowane przez Yieslandera i Yittenmar—

ka [4] będące w istocie sterowaniem adaptacyjnym z dodatkowym sygnałem zakłócająoym m ająoym n a o elu poprawę identyfikacji.

(2)

<)6 . Dargloła

2. u f o r m u ł o w a n i o p r o b l e m u

Zaproponowana tutaj strategia sterowania dotyczy obiektu opisanego rów­

naniom róźnicov>iu

y(t) = a 1 ( t)y( t - i) + ... + an (t'y(t - n) +

b^(t)u(t - 1 ) + ... + bn (t)u(t - n) + o(t' (i'

gdzio:

t = 1,2 •« • - dyskretne wskaźniki czasu, y ( 0 , u{t) - odpowiednio wyjśoie i wejście,

b^(t) - nieznane parametry,

e(t) - szum n iezależny o rozkładzie normalnym o ( t ) ~ X [p,R].

Strategia ta pozwala na wyliczenie sterowań w czasie rzeczywistym.

Suboptyraalna natura uzyskanego rozwiązania wynika z wyboru wskaźnika Jakości w postaci

J = E [ y 2 (t)] (2)

a nie jako

N J N = Ei X y 2 i t )]

t=i

Konsekwencją zastosowania Jednokrokowego wskaźnika jakości Jest z Jed­

nej strony krótkowzroczność strategii sterowania, z drugiej Jednak wskaź­

nik t a k i m m o ż l i w i a wyliczenie sterowania w czasie rzeczywistym,którego po­

stać numeryczna jest prostsza.od algorytmów opartych na polnym rozwiąza­

niu dualnym. Niekorzystna cecha strategii sterowania wynikająca z zasto­

sowania wskaźnika Jakości (2) została znacznie zredukowana przez odi>owied—

nie przyjęcie ograniczenia na błąd estymacji współczynników systemu.

Sterowanie optymalne w sensie wskaźnika' (2) wyliczono, wykorzystując podstawowy lemat sterowania stochustycznego Xstrôma. Minimalizacja (2) Jest równoważna na mocy tego lematu

J 0 = min E [ y 2(t + O / r J u( t;

(3)

Suboptymalne sterowanie dualno obiektów.. 97

gd z i e :

>'t = j^y( t)y( t - 1) ... u( t - O u C t - 2 ) ***j>

jest zbiorem poprzednich wyjść i sterowań.

J = min E [ y 2(t + l)|yt] = (5 )

u(t) 1

= min e[ (a,(t+1)y(t) + ... + a (t+1)y(t-n+1) + b (t+l)u(t) + ...

( i. \ *■ »

u( t)

+ bn (t+l)u(t-n+l) + e(t))2|yt] =

= min E [ b 2 (t+1)u2 (t) + 2b ( t+ 1 )u( t}a^( t + 1) Y( t) + u( t)

2b^ ( t+1 )u( t)e( t+1 )| y^ ] + składniki niezależne od u(t)

a c (t) = [ a -j(t), kg(t)|...( an (t), 0 , b^ft),..., bn (t)]

YT (t) = [y(t), y(t-l),..., y(t—n + 1 ), 0 , u(t-l),..., u(t-n+l)] I

Obliczając w (5) wartość oczekiwaną warunkową i różniczkując otrzymany wynik względem u(t), otrzymujemy sterowajiie optymalne minimalizujące JQ .

Sterowanie to przedstawia się wzorem:

fi Ą ( t+ 1 11) a^( t+ 1 11) + P^ . ( t+ 1 11)

u°(t) = - ^ '-- Y(t) (6)

b^Ct+1 |t) + Pb b ^(t+l| t)

gdzie:

P^+ ^(t+1 |t) — jest (n+l)— szą kolumną macierzy kowariancji błędów esty­

macji parametrów P(t+l|t) (równ. filtru Kalmana (11)), P. . (t+ljt) - jest (n+l)x(n+l) elementem macierzy P(t+l|t),

1 1

Przy wyliczaniu wartości sterowania u°(t) wykorzystuje się predykowane przy pomocy filtru Kalmana wartości parametrów obiektu i maoierzy kowa­

riancji błędu estymacji.

Zapisując równania obiektu w postaci:

y(t) = $ T ( t) 0 (t) + e(t) (7) 0(t) = 0 ( t - l ) + v(t) , (8)

(4)

2S

A, Bargiela

Równania filtru są:

8 (t+l|t) = 0 (111— 1) + K(t)[y(t) - <{>T (t)0 ( 111- 1 )] (9 )

K ( t ) = P ( t | t - l ) < ^ ( t ) [ < J > T ( t ) P ( t | t - l ) < J ( t ) + R ] “ 1 ( 1 0 )

P ( t + 1 |t ) = [ l - K { t ) < | | T ( t ) ] p ( t ) t - 0 [ x - K ( t ) ^ T ( t ) ] T + K ( t ) R K T ( t ) + QA ( 1 1 '

Adaptacyjne prawo sterowania uzależnia sterowanie od estymat parame­

trów systemu i ich wariancji błędów. Jednakże estymacja i sterowanie rozdzielone i sterowanie nie wpływa n a poprawę identyfikaoji.Jest to p r z y ­ czyną występowania zjawiska "wygaszania" regulatora opisanego w praoy M przez Vieslandera. Zaproponowana tam motoda zapobiegania zjawisku wygasza­

nia polegała n a dodaniu do sterowania adaptacyjnego małego sygnału zakłó­

cającego. Sterowanie to, nazwane sterowaniem perturbaoyjnym, polepszało przekształcenie, nie pozwalając wygasnąć sterowaniu i podtrzymując śledze­

nie parametrów systemu. Natomiast w przypadku dobrej estymacji parametrów sygnał zakłócająoy jest szkodliwy, niepotrzebnie zwiększając sterowanie.

3. Sterowanie dualne

Analiza zjawiska wygaszania pozwoliła n a zaproponowanie sterowania du- . alnego odgrywająoego w przeciwieństwie do sterowania perturbacyjnego ak­

tywną rolę w procesie identyfikaoji. Zasadniczym krokiem było znalezienie funkcjonału od wartośoi błędu identyfikaoji, kt ó r y byłby miarą jakości estymat. Ponadto w aelu analitycznego wyznaczenia ograniozenia n a stero­

wanie wymaga się, a b y funkojonał ten zależał również od sygnałów sterują­

cych. Wymagania powyższe spełnia ślad odwrotności maoierzy kowariancji błę­

du estymaoji parametrów. Żąda się, aby trP ^(t+1 |t+l) był większy od u- stalonej arbitralnie wartości granicznej} pozwala to na analityczne okreś­

lenie sterowań bez konieczności rozdzielenia sterowania i identyfikaojl.

Sterowanie dualne wylicza się więc z minimalizacji (2) przy ograniczeniu

t r P - 1 ( t + 1 | t + 1 ) 5 m ( t + l ) ( 1 2 )

u względniając, ż e !

P“ 1(tt-1 11+1) = P“ 1(t+I|t) + 0 ( t + l ) R -10(t+l) (13)

gdzie:

0T (t+l) = [ a 1(t+l)...an (t+l)b1{t+l)...bn (t+l)]

(5)

Suboptymalne atarowanie dualne obiektów.. 99

otrzymuje się

trP"1(t+1 |t+l) = trP-1 (t+1 11) + R“ 20T (t+l)0(t+l) =

= trP- 1 (t+l|t) + R “ 1[ u 2 (t) + YT (t)ł’(t)] (14)

Z (12) i (14) można wyliozyć minimalne dopuszczalno ze względu n a ja­

kość ostymaoji parametrów sterowanie

^n(t) n(t) > 0 0 n(t) < 0

(15)

gdzie!

n(t) = R[m(t+1) - trP“ 1(t+1 | t)] - YT (t)Y(t)

Dla sterowania adaptacyjnego wyliczonego z minimalizacji wskaźnika Ja­

kości (2) słuszne więc będzie ograniczenie

|u(t)] > «„,(*) 0 $

W celu określenia znaku -sterowania dualnego rozpatrzono część funkcji strat Jo zależną od u(t). Ponieważ jeden składnik jest liniowy a drugi kwadratowy względem u(t), najmniejszą wartość funkoji strat uzyskujemy dla sterowania

=

um (t)sign(u°(t)) |u°(t)| < ura(t)

(17) u°(t) |u°(t)| > um (Ł )

Można zauważyć, że pomijając ograniczenie (1 z) - (um (*) = o) - stero­

wanie dualne (1 7) Jest równoważne niedualnomu (6). Uezpośrednia kontrola wielkości macierzy kowariancji błędu estymacji parametrów pozwala na wy­

korzystanie zaproponowanego sterowania dualnego w przypadku obiektów nie­

stacjonarnych, bowiem błąd identyfikacji zostaje szybko wykryty i skory­

gowany. Jest to równio* przyczyną, dla której możliwe było przyjęcie w rozpatrywanych przykładach stałych wartośoi wariancji parametrów do fil­

tru Kalmana i identyfikacja wyłącznie wariancji szumu pomiarowego, co znacz­

nie upraszoza numeryczną stronę zagadnienia.

Efektywność proponowanego algorytmu sterowania badano poprzez symula­

cję na maszynie cyfrowej dla różnych modeli obiektów i porównano wyniki z wynikami uzyskiwanymi dla sterowaniu nieduainogo i perturbacyjnego.

(6)

100 A. Bargicła

Za miarę- jakości sterowania przyjęto Jak w [A] akumulowaną funkcję strat

n

V ( n ) = ^ y 2 (t) (18)

t=1

W celu uproszczenia obliczeń Sf przykładach rozpatrzono obiekty o dwóch zmiennych parametrach, a wio o :

0 T (t) = [a1 ( t)bf ( t)]

U. Przykłady

Przykład 1

Przykład ten dotyczy sterowania obiektem o nieznanych stochastycznych parametrach. Ula sterowania niedualnego, dualnego i perturbacyjnego uśred­

niono akumulowaną funkcję strat dla trzydziestu i pięćdziesięciu n iezależ­

nych symulacji, Względny błąd wyliczenia skumulowanej funkcji strat nie przekraczał 5?»» co Jest wystarczające do badań porównawczych i świadczy o reprezentatywności uśrednionych przebiegów.

Założona wartość wariancji szumu parametrów jest - w pierwszym z roz­

patrywanych przypadków - dokładna, a w drugim róZni się dziesięciokrotnie od wartości rzeczywistej.

■Symulacje pozwalają więc ocenić znaczenie dokładnej znajomości tej wa­

riancji.

Wartości początkowe parametrów symulowanego obiektu generowane były lo­

sowo, natomiast wariancje szumu pomiarowego i macierz kowariancji szumu parametrów wynoszą odpowiednio!

R = Ił . 10~2

q = diag[ó . 1 0- 5 , 2 . to“ 3]

Założona wartość macierzy kowariancji szumu parametrów wykorzystana w równaniach fil troi Kaimana;

— dla przypadku pierwszego

a- = («

- dlu przypadku drugiego

(19)

qA = li»}

(7)

Suboptvmalne a terowanie dualna obiektów...

Wit]

loi

80

«0

40

20

staro w an ie d u aln e Sterowanie nieduolne sterow an ie perturbacyjne najm niejsza w arto ść W it) przy zn a n ych p ara m e trach

/

i

~2$0 40(f 600 000 1000

Rys. 1. Przykład 1. Uśredniona skumulowana funkcja strata Znane Q

600

000

m

<50

<00

s t e r o w a n ie dualne sterow anie niedualne sterow an ie p ertu rb acyjn e n ajm n iejsza w a rto ś ć W(t) przy zn anych p a ra m e tra c h

2Óa ' *6o

Rys. Z. Przykład 1. Uśredniona »kumulowana funkcja strat,Nieznane Q

(8)

102 A. Bargleła

Paramatry regulatora dualnego:

m„ = 20 o

■ p £ p | = 0.25

a warlanoJa azumu zakłócającego w sterowaniu perturbacyjnym

z = 0.08

Przebiegi wartości uśrednionej akumulowanej funkcji strat wykazują przewagę sterowania dualnego n a d niedualnym i perturbacyjnym*

V porównaniu do funkcji strat uzy­

skanej przy dokładnej znajomości Q (rys. 1) obserwuje się dla sterowania dualnego wzrost jej wartości o około 17£, natomiast dla sterowania pertur­

bacyjnego i niedualnego wynosi odpo­

wiednio 325C i k5%. T a względna nieozu—

łość sterowania dualnego n a błąd okreś­

lenia QA motywowana była p r z y opisie sterowania. Analiza naohylenia 9(t) - rys. 2 - pozwala ponadto n a stwier­

dzenie, Ze nie jest korzystne ukierun­

kowywanie sterowania n a identyfikację w początkowym okresie symulacji (dla sterowania perturbacyjnego poozątkowy wzrost funkcji strat był zawsze w i ę kszy n i ż dla sterowania niedualnego).

Było to przesłanką do poszukiwania najbardziej korzystnej zależności f u n k ­ cyjnej dla ograniozenia m(t), takiej, która b y dla małych t preferowała sterowanie według u°(t). Przykładem takiej zależności wykorzystywanej w symulacjach Jest przebieg przedstawiony na rys. 3.

Przykład 2

System, w których a(t) i b(t) są funkcjami deterministycznymi - a(t) jest stałe a b(t) zmienia się w określony sposób - rozpatrywany był już przez Viealandera i Vittenmarka. Celem tego przykładu było zbadanie, ozy sterowanie perturbacyjne pozwala na osiągnięcie dobrych efektów również dla systemu różnego od zaproponowanego w

GO.

Rys. 3. Przykład 1, Zmienne o—

graniczenie n a trP"^(t+111+ 0

(9)

SuboptymaJLne starowanie dualne obiektów.«.

s te r o w a n ie duaLne s te r o w a n ie n ied u a ln e ste ro w a n ie p e r t u r b a c y jn e m inim alna w a rto ó t W(t) przy zn a n y ch p a ra m e tra c h

Rys. ^ . P r z y k ł a d 2. Uśredniona akumulowana funkcja strat

b / t /

b j t i sterowanie perturbacyjne b / t / sterowanie dualne b / t / sterowanie niedualne

Rys. 5, Przykład 2. Parainotr'b( t) i jego estymaty

(10)

Wykorzystana do estywau|i wariancja szumu pomiarowego J szumu parame­

trów wynosi odpowiednio

R = 9 . to“2

QA = diag[lo“ 7 , 2 . 10"3]

Początkowa wax*to4ó parametrów modelu i macierz kowariai-’ .i wspólrzyn—

nlków wynosi;

8 ( 1 |o) = [io_ 1 , to"1]

1>(1|0) = diag[4, 4]

Analiza uśrednionej funkcji strat (rys. 1») wskazuje, że sterowalnie pen- turbacyjno jest bardziej wrażliwo na zmiany współczynników lodelu niż ste­

rowanie dualne. Wprawdzie dla modelu zmian b(t) Jak w [4] sterowania te są porównywalne! lecz dla innych zmian możliwe Jest - Jak w tym przykła­

dzie - uzyskanie nawet gorszych efektów niż dla sterowania niedualnego.

Przykładowy przebieg estymacji parametru b(t) (rys. 5) pozwala na za­

obserwowanie korzystnej cechy sterowania dualnego - stopniowego udoklad- nienia eatywaty b(t). Rys. 5 zasługuje dodatkowo na uwagę ze względu na wystąpienie zjawiska wygaszania w przypadku sterowania niedualnego. Obja­

wia się to wyzerowaniem estymaty b ( t ) . Efektem takiego stanu Jest przyję­

cie przez model poetaoi

y(t) = a(t)y(t-l) + e(t)

W przypadku, g d y a ( t ) < 1, narastanie y(t) oraz macierzy kowariancji błędu estymacji ni# jest zbyt szybkie i stan wygaszenia trwa do końca o- kreeu symulacji.

5. Uwagi końcowe

Zaproponowany nowy rodzaj suboptymalnego sterowania dualnego wykorzy­

stujący miarę kowariancji błędu estymacji parametrów do okresowego ukie­

runkowywania sterowania na Identyfikację jest stosunkowo prosty numerycz­

nie.

Efektem stosowania tego algorytmu było:

— zabezpieczenie się przed wysłąpieniem zjawiska wygaszania dl.a każdego z rozpatrywanych systemów,

- uzyskanie mniejszej wartości wskaźnika jakości niż przy sterowaniu per­

turbacyjnym czy niedualnym,

(11)

Suboptymalne sterowanie dualno obiektów... 1 0 5.

- mniejsza wrażliwość algorytmu dualnego nu zmiany parametrów systemu (moż­

liwa przybliżona ocona wartości i>A).

Dalsze możliwości tego algorytmu tkwią we właściwym zaprojektowaniu spo­

sobu zmian m(t) w zależności od sterowanego obiektu«

LITERATURA

[Í] ÁstrtJra K.J., Uittenmurk )i,¡ 1’roblems of Identification and Control.

J .Math.jVnul.Appi . 10 f 1971) .

[2] Gessing R.s Zasada minimalizacji i uśredniania Jako metoda wyznaoza- nia algorytmów sterowania statystycznie optymalnego. Archiwum Autom, i Teleraech. z, U. (1976).

[3] Gessing II,: Zastosowanie zasady minimalizao ji i uśredniania do wyzna­

czania sterowania optymalnego. Archiwum Autom, i Telemech. z.1* (1976).

[¿ł] Vieslander J., Wittenmark U.: An Approach to Adaptive Control UsJLng Real Time Identification. Automática Vol 7 (1971).

C y B O n T H M A J I b K O S m B O A C T B E K H O E y n P A B J I E H H E O E B E K T A M H C H E K3B E C T H Ü M H I1A P A M E T P A M H

P e 3 10 M e

B c i a i b e p a c c M a T p K B a e i c a H O B n ñ b h a a A a n x a u H O H H o r o y n p a B J i e u H H B u n o a H H W Ę e - r o b p a B H o i ł u e p e , < J y H K U H H o n o s H a B a H m a h y n p a B j i e H a a . Ou b u b c a ^ h m3 M H H H M a j i n — 3a u a u c p e j m e r o 3H a u e H u a B a p u a H U H u H C x o A H o r o c u r u a a a H a o a h h m a r B n e p ë A , y u u - T K B a a o r p a H H U e u u e c j i e . u a O A H o m a r o B o f l 3C t u u a T H u a t p u i m k o B a p a a H T H O C t h o e h6k h 3C T K I < a U H H .

Æjia Buuuca eu ua b AeflCTBHiejibHox Bpexeuu acTKxai napaxeTpoB cHCTeuiFH h h- (fopMauHOHHofi x a i pu u H u c n oa b 3y ex ux a a r o p u r « ynpaBaeHua, n p uM eueua lexuHKa (fiuabTpa K aa bu aH a . # B a u o x ep Hu ec K Hx npHM ep a no3Boaa»i c paBUHTb oior aar op ux x y n p a B a e H u a c HeflBotlcTBeHHUM h nepTy p0 a nn oH UU M ynpaBJteHHex.

SUBOPTIMUM DUAL CONTROL OF OBJECTS OF UNKNOWN PARAMETERS

S u m m a r y

A n e w adaptive control algorithm where the control is for both, regu­

lation and identification, is presented in this article. It was derived b y minimizing the one-stop-ahead expected squared output subjeot to a constraint on the trace of the one-step-ahead estimation error covariance matrix. Kalman filter technique was used to give in real time the values of estimated parameters and information matrix. Two examples have let us compare this algorithm to nondual and perturbation control.

Cytaty

Powiązane dokumenty

„Program Specjalnej Strefy Demograficznej w województwie opolskim do 2020 roku «Opolskie dla rodziny»” (Program SSD ) stanowi odpowiedź władz regionu na wyzwania rozwojowe

Do najefektywniejszych algorytmów entropijnych należą kodowanie arytmetyczne i kodowanie Huffmana [1, 2]. Ten drugi typ jest prosty do implementacji, a podstawowa wersja

ABSTRAKT: Niniejsza publikacja jest poświęcona problemowi zapewnienia dostępu do zabytkowych obiektów użyteczności publicznej osobom niepełnosprawnym, przy czym tę

W proponowanym rozwiązaniu układ wykonawczy sterowania (zespół rakietowych silników korekcyjnych (rysunek 4) oddziałuje na środek masy obiektu, a ruch wokół

Należy jednak pamiętać, że w przypadku robót budowlanych innych niż budowa bądź przebudowa obiektu budow- lanego lub jego części nie wydaje się pozwolenia na użytkowanie

Korzystając z arkusza kalkulacyjnego Excel użyj opcji Narzędzia -&gt; Szukaj wyniku.. Czy wektor (0,0) należy do wnętrza

– Tożsamość obiektu, która odróżnia go od innych obiektów i jest niezależna od wartości jego atrybutów, od powiązań z innymi obiektami, od lokalizacji bytu w

Jeżeli zatrzymamy działanie systemu zobaczymy diagram obiektów, z których każdy jest w innym stanie i w pewnych szczególnych związkach z innymi obiektami...