Sterowanie napędów maszyn i robotów Wykład 6 - odtwarzanie zmiennych stanu przez obserwację dr inż. Jakub Możaryn

(1)

Sterowanie napędów maszyn i robotów

Wykład 6 - odtwarzanie zmiennych stanu przez obserwację

dr inż. Jakub Możaryn

Instytut Automatyki i Robotyki

Warszawa, 2014

dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów

(2)

Odtwarzanie zmiennych stanu

Wykorzystanie układów sterowania od zmiennych stanu wymaga uzyskania dodatkowych informacji o stanie obiektu. W układach pozycjonowania są to najczęściej:

położenie - d (t), prędkość - v (t)), przyspieszenie - a(t).

Informacje te mogą być dostępne dzięki użyciu dodatkowych przetworników pomiarowych. Wiąże się to jednak między innymi z dodatkowym kosztem.

(3)

Odtwarzanie zmiennych stanu - sposoby odtwarzania sygnałów

Sterowanie dyskretne i technika cyfrowa pozwalają uzyskiwać dodatkowe informacje o stanie obiektu poprzez odtwarzanie zmiennych stanu.

Korzyści jakie wynikają z eliminacji dodatkowych czujników to:

obniżenie kosztów,

zmniejszenie wymiarów maszyny napędzającej,

eliminacja połączeń kablowych od czujników prędkości, większa niezawodność.

Istnieją 2 podstawowe sposoby odtwarzania sygnałów przez różniczkowanie,

przez obserwację (wykorzystanie obserwatorów).

(4)

Odtwarzanie zmiennych stanu przez różniczkowanie - powtórzenie

(5)

Odtwarzanie zmiennych stanu przez różniczkowanie - Podsumowanie

Rysunek :Odtwarzanie przez różniczkowanie (sieczna wielopunktowa).

Rysunek :Odtwarzanie przez różniczkowanie (wielomian interpolacyjny).

Rysunek :Odtwarzanie przez różniczkowanie (wielomian aproksymacyjny).

(6)

Odtwarzanie zmiennych stanu przez różniczkowanie

W praktyce preferowane jest odtwarzanie przez różniczkowanie. Ma ono szereg zalet w stosunku do odtwarzania przez obserwację.

Ograniczona moc obliczeniowa wykorzystywanych w produktach przemysłowych (ze względu na niski koszt) układów

mikroprocesorowych (8-bitowe, rzadko 16- i 32-bitowe, jednokartowe sterowniki procesorowe) i kompatybilna z ich możliwościami

obliczeniowymi prostota implementacji,

Bezmodelowa, a więc odporna na zmiany warunków pracy napędu, procedura odtwarzania sygnałów - w porównaniu z potrzebą wiarygodnego modelu zachowań dynamicznych napędu w przypadku obserwacji i złożoność identyfikacyjna i implementacyjna tego modelu,

Zawodność liniowego obserwatora w obszarze silnie nieliniowych zachowań napędu, a więc przede wszystkim w obszarze małych prędkości ruchu.

(7)

Odtwarzanie zmiennych stanu przez różniczkowanie

Główne wady odtwarzania przez różniczkowanie są następujące Podniesienie szumu pomiarowego przez wzmocnienie

wysokoczęstotliwościowych sygnałów zakłóceń; problematyczne w przypadku bezdotykowych, indukcyjnych i magnetostrykcyjnych, przetworników położenia, odpornych na warunki pracy i tanich, ale obarczonych dużym szumem pomiarowym - nawet kilkukrotnie przewyższającym rozdzielczość właściwego pomiaru.

Przesunięcie czasowe (opóźnienie fazowe) odtwarzanych sygnałów:

do odtworzenia sygnałów ˆv i ˆa w chwili k potrzebne są, oprócz sygnału d (k), sygnały z poprzednich chwil d (k − i ) i d (k − j ).

Zredukowanie wartości liczbowych reprezentujących sygnał odtwarzany w stosunku do rozdzielczości zastosowanego przetwornika położenia (kwantyzacja sygnałów) - szczególnie widoczne przy wielokrotnym różniczkowaniu.

Pogorszenie stabilności zmuszające do ograniczenia wartości wzmocnień w układzie sterowania i przez to zmniejszenie wpływu na zachowania dynamiczne napędu.

(8)

Odtwarzanie zmiennych stanu przez obserwację

(9)

Odtwarzanie zmiennych stanu przez obserwację - realizacja obserwatora

Proces ruchu realizowany przez układ napędowy jest przyjmowany jako wielowymiarowy, jednowyjściowy obiekt sterowania, opisany w

uproszczonej postaci dyskretnej przez następujące macierze stanu, sterowania i wyjścia

Amd ∈ R^n×n (1)

Bmd∈ R^n×r (2)

Cmd ∈ R^1×n (3)

oraz przez opóźnienie d .

Obserwator według Luenbergera to układ o postaci ˆ

x (k + 1) = Amdx (k) + Bmdu(k − d ) + kobeob(k),

eob(k) = [y (k) − Cmdx (k)]ˆ (4)

estymujący - przy odpowiednim doborze macierzy obserwacji kob ∈ R^n×1 – stan procesu ˆx (k).

(10)

Odtwarzanie zmiennych stanu przez obserwację - realizacja obserwatora

Narzucenie dyskretnemu układowi wartości własnych z₁, z₂, ..., z_nokreśla macierz obserwacji k_ob zgodnie z zależnością

det(zI − A_md+ k_obC_md) = (z − z₁)(z − z₂)...(z − z_n) (5) oraz określa dynamikę zanikania odchyłki odtwarzania eob(k).

Zbieżność estymacji zapewniają wartości własne zi leżące wewnątrz okręgu jednostkowego na płaszczyźnie zmiennej zespolonej z

|zi| < 1, i = 1, 2, ..., n (6) co oznacza spełnienie warunku stabilności asymptotycznej

obserwatora.

(11)

Odtwarzanie zmiennych stanu przez obserwację

Rysunek :Sterowanie pozycyjne pneumatycznego układu napędowego z obserwatorem.

(12)

Odtwarzanie zmiennych stanu przez obserwację

Przykład: Macierz obserwacji dla dyskretnego modelu procesu ruchu

x (k +1) =





1 Tp 0

0 1 − αTp βTp

0 −2αβ 1 − αT_{p−2β(1−β)}



x (k)+



 0 CmTpα 2Cmαβ



 (7)

y (k) = [1 0 0]x (k) (8)

gdzie

α = 0.5ω_om² Tp, β = 1 − DmωomTp (9) Równanie stanu dane jest w postaci (n = 3, r = 1)

x (k + 1) =





1 a12 0 0 a22 a23

0 a32 a33



x (k) +



 0 b21

b31



 (10)

Rozpisanie zależności na wyznaczenie macierzy wzmocnień obserwatora

det



Iz −





1 a12 0 0 a22 a23

0 a32 a33



+



 kob1

kob2

kob3



[1 0 0]



= (z−z₁)(z−z2)(z−z3)

(13)

Odtwarzanie zmiennych stanu przez obserwację

Korzystając z (11) otrzymuje się następujące zależności określające składowe macierzy obserwacji

k_ob1= 1 + a₂₂+ a₃₃− γ₁ (12)

kob2= γ2− [a22a33− a23a32+ a22+ a33− k(a22+ a33)]

a12

(13)

kob3=a22a33− a23a32− kob1(a22a33+ a23a32) + kob2a12a33− γ3

a₁₂a₂₃ (14)

gdzie: a₁₂, a₂₂, a₂₃, a₃₂, a₃₃ są niezerowymi i niejedynkowymi elementami macierzy A_md, oraz

γ₁= z₁+ z₂+ z₃, γ2 = z₁z₂+ z₁z₃+ z₂z₃, γ₃= z₁z₂z₃.

UWAGA: głównym problemem realizacyjnym obserwatora pozostaje wybór wartości własnych - oprócz teoretycznych uwarunkowań brakuje innych, konkretnych przesłanek wyboru: powodzenie, ograniczone zresztą, zapewniają 2 metody.

(14)

Odtwarzanie zmiennych stanu przez obserwację metody dobory wartości własnych

METODA 1: Narzucenie wartości własnych w płaszczyźnie zmiennej zespolonej s w funkcji pulsacji drgań swobodnych ωom wybranego do

realizacji obserwatora modelu procesu ruchu.

s_1,2= −αω_om(1 ± j β), s₃= −αχω_om (15) z warunkiem

α(ωom) =

α^ω_ω^ogr

om gdy ω_om< ω_ogr α gdy ωom ωogr

(16)

UWAGA: uzależnienie współczynnika α od pulsacji ωom

wykorzystywanego modelu i pewnej granicznej wartości ωogr

spowodowane zostało spostrzeżeniem, że jakość odtwarzania pogarsza się dla obszaru małych wartości pulsacji (ωom< 15 ÷ 25rd /s), co objawia się małą zmiennością przebiegu amplitudy, także w niektórych sytuacjach pojawieniem się cyklu granicznego lub słabo tłumionych oscylacji.

(15)

Odtwarzanie zmiennych stanu przez obserwację metody dobory wartości własnych

METODA 1: Narzucenie wartości własnych w płaszczyźnie zmiennej zespolonej s w funkcji pulsacji drgań swobodnych ω_om wybranego do

realizacji obserwatora modelu procesu ruchu.

Wartości s₁, s₂, s₃są transformowane na płaszczyznę z, następująco z1,2= e^−αωôm^T^pcos(αβωomTp)±je^−αωôm^T^psin(αβωomTp), z3= e^−αχωôm^T^p

(17) gdzie współczynniki α, β i χ , dobrane są doświadczalnie dla typowych rozwiązań i warunków pracy napędów, tzn. zapewniają dostatecznie szybkie dążenie zmiennych odtwarzanych do odpowiednich zmiennych stanu procesu ruchu, np. dla pneumatycznego napędu siłownikowego







α ∈< 1, 5; 6 >

β ∈< 0, 3; 2 >

χ ∈< 1, 5; 5 >

(18)

(16)

Odtwarzanie zmiennych stanu przez obserwację

METODA 2: powiązanie problemu syntezy obserwatora i sterowania pozycyjnego napędu przez narzucenie dopuszczalnych wartości odchyłek

zmiennych stanu: powodowanych przez odtwarzanie (δobx ) i sterowanie pozycyjne (δx ).

Względne wartości tych odchyłek można powiązać ze sobą wychodząc z równań pracy układu po wprowadzeniu zakłócenia skokowego

u(t) = Uo

1(t), (19)

jako

δ_x = k_xδ_obx Uo

(20)

kob1=δx 2kx 1

δx 1kx 2

, kob2= δx 3kx 1

δx 1kx 3

, kob3= −Cmω²_omkx 1

δx 1

−2Dmωomkob2−ω_om² kob1

(21)

(17)

Odtwarzanie zmiennych stanu przez obserwację

METODA 2: powiązanie problemu syntezy obserwatora i sterowania pozycyjnego napędu przez narzucenie dopuszczalnych wartości odchyłek

zmiennych stanu: powodowanych przez odtwarzanie (δobx ) i sterowanie pozycyjne (δx ).

Uwzględnienie wartości odchyłek prowadzi, dla modelu zachowań oscylacyjnych procesu ruchu, do zależności

s1,2= −Res1,2± jIms1,2

s3= −Res3

(22) oraz

Res3[(Res1,2)²+ (Ims1,2)²] = Cmωomkx 1

δ_{x 1} (23)

określających położenie wartości własnych s1, 2 po narzuceniu wartości odchyłki położenia δ_{x 1}, wzmocnienia położeniowego k_{x 1}i części rzeczywistej s₃.

(18)

Odtwarzanie zmiennych stanu przez obserwację

Rysunek :Odtwarzanie przez obserwację, gdzie: v , a - sygnały wzorcowe, odtwarzanie przy pomocy obserwatorów wykorzystujących modele o parametrach: v1, a1- obliczanych analitycznie oraz szacowanych: v2, a2 - w trakcie eksperymentu uruchomieniowego (off-line), v3, a3- w trakcie normalnej pracy układu napędowego (on-line).

(19)

Obserwator obliczeniowy lub uruchomieniowy

Ze względu na nieadekwatności modelu obliczeniowego lub identyfikowanego w procedurze uruchomieniowej w odniesieniu do bieżącego zachowania układu napędowego, odtwarzanie dla potrzeb sterowania przez deterministyczny (stały) obserwator prowadzi do pogorszenia jakości sterowania nawet w stosunku do układów korzystających z różniczkowania metodą siecznej.

Nie satysfakcjonują również

próby rozbudowy struktury obserwatora o wybrane elementy nieliniowe

próby wzmacniania sprzężenia zwrotnego w powiązaniu z odchyłką odtwarzania (ze względu na podniesienie poziomu szumu

wprowadzanego z sygnału położenia).

(20)

Obserwator obliczeniowy lub uruchomieniowy

Stosunkowo dobrą metodą poprawy jakości odtwarzania jest wprowadzenie mechanizmu samostrojenia, zakładającego uzmiennienie modelu dynamiki napędu w stosunku do wartości

obliczanych lub szacowanych; przyjmując np. stałą wartość wzmocnienia prędkościowego C_m- pulsacja drgań swobodnych ω_om oraz tłumienie D_m modelu wykorzystywanego w obserwatorze mogą być w tym mechanizmie wyliczane:

bezpośrednio

pośrednio, przez uproszczoną aproksymację przebiegu wartości uwzględnianych parametrów:

odcinkami linii prostych wychodzących od znanej wartości (np. od wartości minimalnej),

schodkowo, stałymi wartościami w tak dobranych zakresach wartości określanego parametru, np. pulsacji, aby spełnić określone warunki

(21)

Obserwator obliczeniowy lub uruchomieniowy

Przy obliczaniu pośrednio - schodkowo, stałymi wartościami w tak dobranych zakresach wartości określanego parametru, np. pulsacji, aby spełnić określone warunki , przyjmuje się

|ωom(s) − ωomob(s) − ωom min| ¬ δωom, orazωomob(s) = cωom(s)ωom min

(24) gdzie: ωom odpowiada wartości wyliczonej, ωom min- wartości minimalnej, ωomob - wartości wykorzystywanej w mechanizmie samostrojenia, δωom - względnej, akceptowanej odchyłce aproksymacji i cωom - współczynnikowi aproksymacji.

(22)

Obserwator identyfikowany w trakcie normalnej pracy napędu

Odtwarzanie z wykorzystaniem modelu odtwarzanego, uwzględniając problematykę szacowania współczynników modelu, realizacji obserwatora oraz optymalizacji nakładu obliczeniowego i dostępu do pamięci

procesora, przebiegu w następujących krokach obliczeniowych:

odtworzenie wartości parametrów ruchu, np. prędkości i przyspieszenia, jedną z metod zapewniających możliwie wierny wartościowo i gładki przebieg sygnałów,

określenie współczynników modeli zachowań procesu ruchu np.

prędkościowych i przyspieszeniowych procesu ruchu:

ˆ

v (k) = ˆθv 1v (k − 1) + ˆˆ θv 2a(k − 1) + ˆˆ θv 3u(k − d − 1) ˆ

a(k) = ˆθa1v (k − 1) + ˆˆ θa2a(k − 1) + ˆˆ θa3u(k − d − 1) (25) przez oszacowanie w trakcie normalnej pracy napędu zgodnie ze schematem rekurencyjnej metody najmniejszych kwadratów,

(23)

Obserwator identyfikowany w trakcie normalnej pracy napędu

wyznaczenie odchyłki obserwacji (odtwarzania) ˆe_ob(k) w postaci ˆ

e_ob(k) = s(k) − ˆs(k) (26)

wyliczenie aktualnych wartości składowych macierzy obserwacji kob1, kob2ikob3 wybraną metodą,

odtworzenie przyrostu przemieszczenia sp(k + 1), sygnału prędkości ˆ

v (k + 1) i przyspieszenia ˆa(k + 1)





sp(k + 1) ˆ v (k + 1)

ˆ a(k + 1)



=





a12(k) a13(k) b1(k) −kob1(k) a22(k) a23(k) b2(k) −kob2(k) a₃₂(k) a₃₃(k) b₃(k) −kob3(k)









 ˆ v (k) ˆ a(k) u(k + d )

ˆ e_ob(k)





 (27) gdzie: a₁₂= T_p, a₁₃= 0, b₁= 0, a₂₂= ˆθ_{v 1}, a₂₃= ˆθ_{v 2}, b₂=

θˆ_{v 3}, a₃₂= ˆθ_a1, a₃₃= ˆθ_a2, b₃= ˆθ_a3 - uwzględniając postać modelu dyskretnego procesu ruchu i modele cząstkowe.

(24)

Obserwator identyfikowany w trakcie normalnej pracy napędu

estymację sygnału położenia, na podstawie otrzymanej wartości przyrostu

ˆ

s(k + 1) = ˆs(k) + sp(k + 1) (28) W porównaniu z obserwatorem wykorzystującym model obliczeniowy lub identyfikowany w eksperymencie uruchomieniowym obserwator

identyfikowany w trakcie normalnej pracy napędu zapewnia najlepszą jakość odtwarzania - nie jest jednak wolny od wad związanych ze stosowaniem modelu

szacowaniem modelu,

trudnością identyfikacji modelu (np. w trakcie małych przemieszczeń),

zaniżaniem wartości szacowanej pulsacji w skrajnych położeniach (np. napędów płynowych),

wrażliwością na błąd punktu zerowego wysterowania.