Sterowanie napędów maszyn i robotów
Wykład 6 - odtwarzanie zmiennych stanu przez obserwację
dr inż. Jakub Możaryn
Instytut Automatyki i Robotyki
Warszawa, 2014
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Odtwarzanie zmiennych stanu
Wykorzystanie układów sterowania od zmiennych stanu wymaga uzyskania dodatkowych informacji o stanie obiektu. W układach pozycjonowania są to najczęściej:
położenie - d (t), prędkość - v (t)), przyspieszenie - a(t).
Informacje te mogą być dostępne dzięki użyciu dodatkowych przetworników pomiarowych. Wiąże się to jednak między innymi z dodatkowym kosztem.
Odtwarzanie zmiennych stanu - sposoby odtwarzania sygnałów
Sterowanie dyskretne i technika cyfrowa pozwalają uzyskiwać dodatkowe informacje o stanie obiektu poprzez odtwarzanie zmiennych stanu.
Korzyści jakie wynikają z eliminacji dodatkowych czujników to:
obniżenie kosztów,
zmniejszenie wymiarów maszyny napędzającej,
eliminacja połączeń kablowych od czujników prędkości, większa niezawodność.
Istnieją 2 podstawowe sposoby odtwarzania sygnałów przez różniczkowanie,
przez obserwację (wykorzystanie obserwatorów).
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Odtwarzanie zmiennych stanu przez różniczkowanie - powtórzenie
Odtwarzanie zmiennych stanu przez różniczkowanie - Podsumowanie
Rysunek :Odtwarzanie przez różniczkowanie (sieczna wielopunktowa).
Rysunek :Odtwarzanie przez różniczkowanie (wielomian interpolacyjny).
Rysunek :Odtwarzanie przez różniczkowanie (wielomian aproksymacyjny).
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Odtwarzanie zmiennych stanu przez różniczkowanie
W praktyce preferowane jest odtwarzanie przez różniczkowanie. Ma ono szereg zalet w stosunku do odtwarzania przez obserwację.
Ograniczona moc obliczeniowa wykorzystywanych w produktach przemysłowych (ze względu na niski koszt) układów
mikroprocesorowych (8-bitowe, rzadko 16- i 32-bitowe, jednokartowe sterowniki procesorowe) i kompatybilna z ich możliwościami
obliczeniowymi prostota implementacji,
Bezmodelowa, a więc odporna na zmiany warunków pracy napędu, procedura odtwarzania sygnałów - w porównaniu z potrzebą wiarygodnego modelu zachowań dynamicznych napędu w przypadku obserwacji i złożoność identyfikacyjna i implementacyjna tego modelu,
Zawodność liniowego obserwatora w obszarze silnie nieliniowych zachowań napędu, a więc przede wszystkim w obszarze małych prędkości ruchu.
Odtwarzanie zmiennych stanu przez różniczkowanie
Główne wady odtwarzania przez różniczkowanie są następujące Podniesienie szumu pomiarowego przez wzmocnienie
wysokoczęstotliwościowych sygnałów zakłóceń; problematyczne w przypadku bezdotykowych, indukcyjnych i magnetostrykcyjnych, przetworników położenia, odpornych na warunki pracy i tanich, ale obarczonych dużym szumem pomiarowym - nawet kilkukrotnie przewyższającym rozdzielczość właściwego pomiaru.
Przesunięcie czasowe (opóźnienie fazowe) odtwarzanych sygnałów:
do odtworzenia sygnałów ˆv i ˆa w chwili k potrzebne są, oprócz sygnału d (k), sygnały z poprzednich chwil d (k − i ) i d (k − j ).
Zredukowanie wartości liczbowych reprezentujących sygnał odtwarzany w stosunku do rozdzielczości zastosowanego przetwornika położenia (kwantyzacja sygnałów) - szczególnie widoczne przy wielokrotnym różniczkowaniu.
Pogorszenie stabilności zmuszające do ograniczenia wartości wzmocnień w układzie sterowania i przez to zmniejszenie wpływu na zachowania dynamiczne napędu.
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Odtwarzanie zmiennych stanu przez obserwację
Odtwarzanie zmiennych stanu przez obserwację - realizacja obserwatora
Proces ruchu realizowany przez układ napędowy jest przyjmowany jako wielowymiarowy, jednowyjściowy obiekt sterowania, opisany w
uproszczonej postaci dyskretnej przez następujące macierze stanu, sterowania i wyjścia
Amd ∈ Rn×n (1)
Bmd∈ Rn×r (2)
Cmd ∈ R1×n (3)
oraz przez opóźnienie d .
Obserwator według Luenbergera to układ o postaci ˆ
x (k + 1) = Amdx (k) + Bmdu(k − d ) + kobeob(k),
eob(k) = [y (k) − Cmdx (k)]ˆ (4)
estymujący - przy odpowiednim doborze macierzy obserwacji kob ∈ Rn×1 – stan procesu ˆx (k).
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Odtwarzanie zmiennych stanu przez obserwację - realizacja obserwatora
Narzucenie dyskretnemu układowi wartości własnych z1, z2, ..., znokreśla macierz obserwacji kob zgodnie z zależnością
det(zI − Amd+ kobCmd) = (z − z1)(z − z2)...(z − zn) (5) oraz określa dynamikę zanikania odchyłki odtwarzania eob(k).
Zbieżność estymacji zapewniają wartości własne zi leżące wewnątrz okręgu jednostkowego na płaszczyźnie zmiennej zespolonej z
|zi| < 1, i = 1, 2, ..., n (6) co oznacza spełnienie warunku stabilności asymptotycznej
obserwatora.
Odtwarzanie zmiennych stanu przez obserwację
Rysunek :Sterowanie pozycyjne pneumatycznego układu napędowego z obserwatorem.
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Odtwarzanie zmiennych stanu przez obserwację
Przykład: Macierz obserwacji dla dyskretnego modelu procesu ruchu
x (k +1) =
1 Tp 0
0 1 − αTp βTp
0 −2αβ 1 − αTp−2β(1−β)
x (k)+
0 CmTpα 2Cmαβ
(7)
y (k) = [1 0 0]x (k) (8)
gdzie
α = 0.5ωom2 Tp, β = 1 − DmωomTp (9) Równanie stanu dane jest w postaci (n = 3, r = 1)
x (k + 1) =
1 a12 0 0 a22 a23
0 a32 a33
x (k) +
0 b21
b31
(10)
Rozpisanie zależności na wyznaczenie macierzy wzmocnień obserwatora
det
Iz −
1 a12 0 0 a22 a23
0 a32 a33
+
kob1
kob2
kob3
[1 0 0]
= (z−z1)(z−z2)(z−z3)
Odtwarzanie zmiennych stanu przez obserwację
Korzystając z (11) otrzymuje się następujące zależności określające składowe macierzy obserwacji
kob1= 1 + a22+ a33− γ1 (12)
kob2= γ2− [a22a33− a23a32+ a22+ a33− k(a22+ a33)]
a12
(13)
kob3=a22a33− a23a32− kob1(a22a33+ a23a32) + kob2a12a33− γ3
a12a23 (14)
gdzie: a12, a22, a23, a32, a33 są niezerowymi i niejedynkowymi elementami macierzy Amd, oraz
γ1= z1+ z2+ z3, γ2 = z1z2+ z1z3+ z2z3, γ3= z1z2z3.
UWAGA: głównym problemem realizacyjnym obserwatora pozostaje wybór wartości własnych - oprócz teoretycznych uwarunkowań brakuje innych, konkretnych przesłanek wyboru: powodzenie, ograniczone zresztą, zapewniają 2 metody.
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Odtwarzanie zmiennych stanu przez obserwację metody dobory wartości własnych
METODA 1: Narzucenie wartości własnych w płaszczyźnie zmiennej zespolonej s w funkcji pulsacji drgań swobodnych ωom wybranego do
realizacji obserwatora modelu procesu ruchu.
s1,2= −αωom(1 ± j β), s3= −αχωom (15) z warunkiem
α(ωom) =
αωωogr
om gdy ωom< ωogr α gdy ωom ωogr
(16)
UWAGA: uzależnienie współczynnika α od pulsacji ωom
wykorzystywanego modelu i pewnej granicznej wartości ωogr
spowodowane zostało spostrzeżeniem, że jakość odtwarzania pogarsza się dla obszaru małych wartości pulsacji (ωom< 15 ÷ 25rd /s), co objawia się małą zmiennością przebiegu amplitudy, także w niektórych sytuacjach pojawieniem się cyklu granicznego lub słabo tłumionych oscylacji.
Odtwarzanie zmiennych stanu przez obserwację metody dobory wartości własnych
METODA 1: Narzucenie wartości własnych w płaszczyźnie zmiennej zespolonej s w funkcji pulsacji drgań swobodnych ωom wybranego do
realizacji obserwatora modelu procesu ruchu.
Wartości s1, s2, s3są transformowane na płaszczyznę z, następująco z1,2= e−αωomTpcos(αβωomTp)±je−αωomTpsin(αβωomTp), z3= e−αχωomTp
(17) gdzie współczynniki α, β i χ , dobrane są doświadczalnie dla typowych rozwiązań i warunków pracy napędów, tzn. zapewniają dostatecznie szybkie dążenie zmiennych odtwarzanych do odpowiednich zmiennych stanu procesu ruchu, np. dla pneumatycznego napędu siłownikowego
α ∈< 1, 5; 6 >
β ∈< 0, 3; 2 >
χ ∈< 1, 5; 5 >
(18)
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Odtwarzanie zmiennych stanu przez obserwację
METODA 2: powiązanie problemu syntezy obserwatora i sterowania pozycyjnego napędu przez narzucenie dopuszczalnych wartości odchyłek
zmiennych stanu: powodowanych przez odtwarzanie (δobx ) i sterowanie pozycyjne (δx ).
Względne wartości tych odchyłek można powiązać ze sobą wychodząc z równań pracy układu po wprowadzeniu zakłócenia skokowego
u(t) = Uo
1(t), (19)
jako
δx = kxδobx Uo
(20)
kob1=δx 2kx 1
δx 1kx 2
, kob2= δx 3kx 1
δx 1kx 3
, kob3= −Cmω2omkx 1
δx 1
−2Dmωomkob2−ωom2 kob1
(21)
Odtwarzanie zmiennych stanu przez obserwację
METODA 2: powiązanie problemu syntezy obserwatora i sterowania pozycyjnego napędu przez narzucenie dopuszczalnych wartości odchyłek
zmiennych stanu: powodowanych przez odtwarzanie (δobx ) i sterowanie pozycyjne (δx ).
Uwzględnienie wartości odchyłek prowadzi, dla modelu zachowań oscylacyjnych procesu ruchu, do zależności
s1,2= −Res1,2± jIms1,2
s3= −Res3
(22) oraz
Res3[(Res1,2)2+ (Ims1,2)2] = Cmωomkx 1
δx 1 (23)
określających położenie wartości własnych s1, 2 po narzuceniu wartości odchyłki położenia δx 1, wzmocnienia położeniowego kx 1i części rzeczywistej s3.
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Odtwarzanie zmiennych stanu przez obserwację
Rysunek :Odtwarzanie przez obserwację, gdzie: v , a - sygnały wzorcowe, odtwarzanie przy pomocy obserwatorów wykorzystujących modele o parametrach: v1, a1- obliczanych analitycznie oraz szacowanych: v2, a2 - w trakcie eksperymentu uruchomieniowego (off-line), v3, a3- w trakcie normalnej pracy układu napędowego (on-line).
Obserwator obliczeniowy lub uruchomieniowy
Ze względu na nieadekwatności modelu obliczeniowego lub identyfikowanego w procedurze uruchomieniowej w odniesieniu do bieżącego zachowania układu napędowego, odtwarzanie dla potrzeb sterowania przez deterministyczny (stały) obserwator prowadzi do pogorszenia jakości sterowania nawet w stosunku do układów korzystających z różniczkowania metodą siecznej.
Nie satysfakcjonują również
próby rozbudowy struktury obserwatora o wybrane elementy nieliniowe
próby wzmacniania sprzężenia zwrotnego w powiązaniu z odchyłką odtwarzania (ze względu na podniesienie poziomu szumu
wprowadzanego z sygnału położenia).
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Obserwator obliczeniowy lub uruchomieniowy
Stosunkowo dobrą metodą poprawy jakości odtwarzania jest wprowadzenie mechanizmu samostrojenia, zakładającego uzmiennienie modelu dynamiki napędu w stosunku do wartości
obliczanych lub szacowanych; przyjmując np. stałą wartość wzmocnienia prędkościowego Cm- pulsacja drgań swobodnych ωom oraz tłumienie Dm modelu wykorzystywanego w obserwatorze mogą być w tym mechanizmie wyliczane:
bezpośrednio
pośrednio, przez uproszczoną aproksymację przebiegu wartości uwzględnianych parametrów:
odcinkami linii prostych wychodzących od znanej wartości (np. od wartości minimalnej),
schodkowo, stałymi wartościami w tak dobranych zakresach wartości określanego parametru, np. pulsacji, aby spełnić określone warunki
Obserwator obliczeniowy lub uruchomieniowy
Przy obliczaniu pośrednio - schodkowo, stałymi wartościami w tak dobranych zakresach wartości określanego parametru, np. pulsacji, aby spełnić określone warunki , przyjmuje się
|ωom(s) − ωomob(s) − ωom min| ¬ δωom, orazωomob(s) = cωom(s)ωom min
(24) gdzie: ωom odpowiada wartości wyliczonej, ωom min- wartości minimalnej, ωomob - wartości wykorzystywanej w mechanizmie samostrojenia, δωom - względnej, akceptowanej odchyłce aproksymacji i cωom - współczynnikowi aproksymacji.
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Obserwator identyfikowany w trakcie normalnej pracy napędu
Odtwarzanie z wykorzystaniem modelu odtwarzanego, uwzględniając problematykę szacowania współczynników modelu, realizacji obserwatora oraz optymalizacji nakładu obliczeniowego i dostępu do pamięci
procesora, przebiegu w następujących krokach obliczeniowych:
odtworzenie wartości parametrów ruchu, np. prędkości i przyspieszenia, jedną z metod zapewniających możliwie wierny wartościowo i gładki przebieg sygnałów,
określenie współczynników modeli zachowań procesu ruchu np.
prędkościowych i przyspieszeniowych procesu ruchu:
ˆ
v (k) = ˆθv 1v (k − 1) + ˆˆ θv 2a(k − 1) + ˆˆ θv 3u(k − d − 1) ˆ
a(k) = ˆθa1v (k − 1) + ˆˆ θa2a(k − 1) + ˆˆ θa3u(k − d − 1) (25) przez oszacowanie w trakcie normalnej pracy napędu zgodnie ze schematem rekurencyjnej metody najmniejszych kwadratów,
Obserwator identyfikowany w trakcie normalnej pracy napędu
wyznaczenie odchyłki obserwacji (odtwarzania) ˆeob(k) w postaci ˆ
eob(k) = s(k) − ˆs(k) (26)
wyliczenie aktualnych wartości składowych macierzy obserwacji kob1, kob2ikob3 wybraną metodą,
odtworzenie przyrostu przemieszczenia sp(k + 1), sygnału prędkości ˆ
v (k + 1) i przyspieszenia ˆa(k + 1)
sp(k + 1) ˆ v (k + 1)
ˆ a(k + 1)
=
a12(k) a13(k) b1(k) −kob1(k) a22(k) a23(k) b2(k) −kob2(k) a32(k) a33(k) b3(k) −kob3(k)
ˆ v (k) ˆ a(k) u(k + d )
ˆ eob(k)
(27) gdzie: a12= Tp, a13= 0, b1= 0, a22= ˆθv 1, a23= ˆθv 2, b2=
θˆv 3, a32= ˆθa1, a33= ˆθa2, b3= ˆθa3 - uwzględniając postać modelu dyskretnego procesu ruchu i modele cząstkowe.
dr inż. Jakub Możaryn Sterowanie napędów maszyn i robotów
Obserwator identyfikowany w trakcie normalnej pracy napędu
estymację sygnału położenia, na podstawie otrzymanej wartości przyrostu
ˆ
s(k + 1) = ˆs(k) + sp(k + 1) (28) W porównaniu z obserwatorem wykorzystującym model obliczeniowy lub identyfikowany w eksperymencie uruchomieniowym obserwator
identyfikowany w trakcie normalnej pracy napędu zapewnia najlepszą jakość odtwarzania - nie jest jednak wolny od wad związanych ze stosowaniem modelu
szacowaniem modelu,
trudnością identyfikacji modelu (np. w trakcie małych przemieszczeń),
zaniżaniem wartości szacowanej pulsacji w skrajnych położeniach (np. napędów płynowych),
wrażliwością na błąd punktu zerowego wysterowania.