Sterowanie napędów maszyn i robotów
Wykład 5 - Identyfikacja
dr inż. Jakub Możaryn
Instytut Automatyki i Robotyki (IAiR), Politechnika Warszawska
Warszawa, 2015
Identyfikacja statystyczna struktury i parametrów modelu serownapędu pneumatycznego
Podstawowe znaczenie dla udanej identyfikacji modelu procesu ruchu ma rozwiązanie następujących problemów:
Wybór metody identyfikacji.
Wybór struktury modelu.
Wybór postaci modelu.
Wybór okresu próbkowania.
Identyfikacja statystyczna struktury i parametrów modelu serownapędu pneumatycznego
Wybór metody identyfikacji
W przypadku identyfikacji pneumatycznego napędu siłownikowego od względem niezawodności i efektywności najbardziej przydatna jest metoda LS, w dwóch wersjach:
W wersji podstawowej (LS) podczas uruchomienia napędu, (off-line) - zbieżne i dobrze powtarzalne oszacowanie współczynników modelu (dużo danych pomiarowych, długie eksperymenty).
W wersji rekurencyjnej (RLS) podczas normalnej pracy napędu (on-line) - zdecydowanie gorsze oszacowanie współczynników modelu (mała liczba danych pomiarowych, krótkie eksperymenty, silne oscylacje wartości współczynników w początkowej fazie szacowania powodowane procedurą rekurencyjną).
Identyfikacja statystyczna struktury i parametrów modelu serownapędu pneumatycznego
Wybór struktury modelu
Dla dwóch podstawowych faz ruchu: rozbiegu i hamowania
modele fazy rozbiegu mają charakter aperiodyczny, przeważnie 4-go rzędu z opóźnieniem (d ) równym jednemu lub dwóm okresom próbkowania (przy Tp= 2ms): pewne właściwości oscylacyjne, ujawniają się tylko przy niskim wysterowaniu, poniżej 30[%]
nominalnej wartości sygnału u,
modele fazy hamowania charakteryzują się właściwościami oscylacyjnymi 3-go rzędu z krótszym opóźnieniem d w stosunku do fazy rozbiegu - przeważnie o okres Tp; właściwości te ustępują ponownie zachowaniom inercyjnym w zakresie malejących wysterowań, szczególnie poniżej 20 − 10[%] wartości umax (wpływ tarcia).
Identyfikacja statystyczna struktury i parametrów modelu serownapędu pneumatycznego
Wybór postaci modelu
Ograniczając zachowania napędu do modelu zachowań oscylacyjnego członu 2-go rzędu z pominięciem astatyczności, transmitancja i równanie różnicowe identyfikacji, podane są - w przypadku prędkościowego modelu ARMA - w postaci
Gv(z) = b1z−1+ b2z−2
1 + a1z−1+ a2z−2z−d (1) oraz
ˆ v (k) =
2
X
i =1
aiv (k − i ) +
2
X
j =1
bju(k − d − j ) (2)
Identyfikacja statystyczna struktury i parametrów modelu serownapędu pneumatycznego
Wybór postaci modelu, c.d.
Można także, na podstawie znajomości przybliżonego modelu zachowań dynamicznych napędu, wprowadzić zmodyfikowane modele dyskretne w postaci dwóch równań różnicowych
zachowań prędkościowych ˆ
v (k) = (1 − αTp)v (k − 1) + βTpa(k − 1) + CmTpαu(k − d − 1) (3) ˆ
v (k) = ˆθv 1v (k − 1) + ˆθv 2a(k − 1) + ˆθv 3u(k − d − 1) (4) zachowań przyspieszeniowych
ˆ
a(k) = −2αβv (k−1)+[1−αTp−2β(1−β)]a(k−1)+2Cmαβu(k−d −1) (5) ˆ
a(k) = ˆθa1v (k − 1) + ˆθa2a(k − 1) + ˆθa3u(k − d − 1) (6)
Identyfikacja statystyczna struktury i parametrów modelu serownapędu pneumatycznego
Wybór okresu próbkowania
Znane zalecenia (określone względem czasów narastania odpowiedzi skokowej identyfikowanego obiektu) zakładają, że okres próbkowania Tp zawierać się w granicach od kilku do kilkudziesięciu ms.
Problem próbkowania
Element ruchomy napędu przy maksymalnej prędkości ruchu przebywa w czasie 1[ms] drogę rzędu 5[mm]. Powstaje konflikt pomiędzy
koniecznością zmniejszania Tp∈ (0, 8; 1, 2)[ms] dla zapewnienia żądanej dokładności pozycjonowania a zachowaniem akceptowalnej jakości identyfikowanego modelu.
Rozwiązanie problemu próbkowania
Wprowadza się oddzielny okres próbkowania Tpident= nTp, n ∈ C przeznaczony do identyfikacji.
Procedury identyfikacji statystycznej modelu serownapędu pneumatycznego
Wybierając model przyspieszeniowy procesu ruchu napędu, podstawą procedur metody LS jest oszacowanie w chwili dyskretnej k wektora parametrów modelu ˆΘa(k)
Θˆa(k) = [VT(k)V (k)]−1VT(k)a(k) = ˆΘa(k − 1) + ∆ ˆΘa(k) (7) który minimalizuje błąd szacowania ˆηa(k) .
ˆ
ηa(k) = a(k) − ˆa(k) (8)
gdzie:
a(k) - sygnał przyspieszenia w rzeczywistym napędzie, ˆ
a(k) - sygnał przyspieszenia w modelu.
Procedury identyfikacji statystycznej modelu serownapędu pneumatycznego
Zapis (7) łączy dwa podejścia do identyfikacji metodą najmniejszych kwadratów:
w wersji podstawowej metody LS - wykorzystywane są na raz wszystkie zebrane w chwilach k = 1, 2, ..., m pomiarowe dane wejściowe v (k), a(k) i u(k − d )
V (m) =
v (1) a(1) u(1) ... ... ...
v (m) a(m) u(m)
, a(m) =
a(1)
...
a(m)
(9)
Prowadzi to do oszacowania wektora parametrów modelu za pomocą wyrażenia
ΘˆLSa (m) = [VT(m)V (m)]−1VT(m)a(m) (10) minimalizującego kryterium jakości w postaci
IaLS(m) = 1 m
m
X
i =1
ˆ
η2a(i ) , min (11)
Procedury identyfikacji statystycznej modelu
w wersji rekurencyjnej (RLS), w której korekcyjny - względem wektora parametrów modelu ˆΘRLSa (k) - wektor ∆ ˆΘRLSa (k) określają zależności
∆ ˆΘRLSa (k) = γa(k)ˆηa(k) = γa(k)[a(k)−ˆa(k)] = γa(k)[a(k)− ˆΘRLSa (k−1)w (k)]
(12) gdzie γa(k) - współczynnik szacowania: zmianę wartości parametrów modelu wywołuje ηa(k) 6= 0.
W procedurze tej, w każdej kolejnej chwili k macierze V i a uzupełniane są o nowy niezerowy wiersz (wiersze k < i ¬ m pozostają zerowe), co pozwala na szacowanie wektora parametrów modelu w postaci
ΘˆRLSa (k) = [VT(k−1)V (k−1)+wT(k)w (k)]−1[VT(k−1)a(k−1)+wT(k)a(k)]
(13) Postać ta pozwala na wykorzystanie obliczeniowo oszczędnej techniki pseudoinwersji macierzy.
Procedury identyfikacji statystycznej modelu
Pseudoinwersja macierzy polega ona na zastąpieniu odwracanej macierzy następująco:
[VT(k − 1)V (k − 1) + wT(k)w (k)]−1' [VT(k − 1)V (k − 1)]−1+
−µ(k)[VT(k − 1)V (k − 1)]−1wT(k)w (k)[VT(k − 1)V (k − 1)]−1 (14)
µ(k) = 1
w (k)[VT(k − 1)V (k − 1)]−1wt(k) + λ (15) gdzie: λ - współczynnik zapominania (λ = 1 przy równym traktowaniu wszystkich danych pomiarowych).
Macierz odwracana w chwili k daje się obliczyć ze znanej już dla chwili poprzedniej (k − 1) macierzy odwrotnej. W tej procedurze
minimalizowane jest kryterium jakości w postaci
IaLS(m) = 1 k
k
X
i =1
λk−1ηˆa(i )2, min (16)
Konwersja parametrów modelu dyskretnego w parametry modelu ciągłego
Konwersja parametrów modelu dyskretnego w parametry modelu ciągłego polega odwrócenie przyporządkowania parametrów modelu ciągłego zachowań ruchowych napędu (Cm, ωom, Dm) elementom wektora szacowania ˆθv lub ˆθa modelu dyskretnego.
Równania stanu - dyskretyzacja modeli (uproszczenia)
Model z czasem ciągłym
X (t) =˙
0 1 0
0 0 1
0 −ωom2 −Dmωom
X (t) +
0 0
0 0
Cmω2om −Cmωom2
U(t)
y (t) = [1 0 0] x1(t)
Doprowadzany jest przez usunięcie z zależności wyrazów z czynnikiem Tpwyższym niż kwadratowy, do postaci modelu z czasem dyskretnym
X (k+1) =
1 Tp 0
0 1 − αTp βTp
0 −2αβ 1 − αTp− 2β(1 − β)
X (k)+
0 CmTpα 2Cmαβ
U(k)
y (k) = [1 0 0] X (k) gdzie
α = 1
2ω2omTp; β = 1 − DmωomTp
Konwersja parametrów modelu dyskretnego w parametry modelu ciągłego
Można poprawić niezawodność numerycznej konwersji i uzyskać lepsze uwarunkowania równań procedury oraz zmniejszenia nakładu obliczeń poprzez uproszczenie uzasadnione zakresami zmian wartości
współczynników α i β (znając własności modelu bilansowego i wyniki eksperymentalne). Dla siłowników pneumatycznych wartości parametrów modelu ciągłego mieszczą się w zakresach
Cm∈ (0, 15; 1, 5)[m/sV ], ωom∈ (10; 60)[rad /s], Dm∈ (0, 1; 1, 5) co prowadzi do
DmωomTp∈ (0, 0008; 0, 18)[rad ] dla okresu próbkowania Tp(0, 8, 2)[ms]
i można przyjąć uproszczenie DmωomTp≈ 0.
Konwersja parametrów modelu dyskretnego w parametry modelu ciągłego
Uproszczone równania konwersji dla modelu prędkościowego
Cm= θˆv 3
1 − ˆθv 1
, ωom ≈ q
2(1 − ˆθv 1) Tp
, Dm≈ 1 ωomTp
(1 − θˆv 2
Tp
) (17)
dla modelu przyspieszeniowego
Cm= − θˆa3
θˆa1, ωom≈ s
−ˆθa1
Tp
, Dm≈ 1 2ωomTp
(1 −ωom2 Tp2
2 − ˆθa2) (18)
Konwersja parametrów modelu dyskretnego w parametry modelu ciągłego
W celu zmniejszenia wpływu chwilowych odchyłek aktualnie szacowanych wartości parametrów modelu na wynik konwersji zastosowano
następujący filtr uśredniający:
Φusr(k) = νΦakt(k) + (1 − ν)Φusr(k − 1) (19) gdzie:
Φ = [Cm ωom Dm]T, Φusr(k) = [Cusrm ωusrom Dusrm]T,
ν << 1 - współczynnik filtracji, Φakt - bieżąca wartość parametrów i Φusr
- uśredniona wartość parametrów modelu ciągłego.
Przykładowo dla współczynnika v = 0, 1 wynik wcześniejszy o 5 okresów próbkowania względem chwili k ma już tylko połowę tej wagi, co aktualny (0, 95≈ 0, 59).
Realizacja identyfikacji statystycznej modelu
ETAP 1: Identyfikacja uruchomieniowa → dla wyznaczenia deskryptorów, charakterystyk i modeli układu napędowego:
zakresu ruchu (siły, momentu) i jego korelacji z szerokością zakresu pomiarowego zastosowanego przetwornika pomiarowego, tzn.
rzeczywistej charakterystyki pomiaru kontrolowanego parametru w układzie napędowym,
biegunowości podłączenia elektrycznego, błędu punktu zerowego i histerezy wysterowania nastawnika,
charakterystyki prędkościowej ruchu i charakterystyki
kompensacyjnej jej nieliniowości w układzie nastawnik - siłownik, parametrów modelu zakłóceniowego (np. zmian obciążenia masowego, siłowego) układu napędowego,
parametrów modelu zachowań ruchowych (siłowych, momentowych) układu napędowego; parametry te są wykorzystywane dla doboru nastaw startowych sterowania oraz jako parametry startowe szacowanego w trybie on-line modelu.
Uwagi - sterowanie pozycyjne napędów pneumatycznych
W trakcie identyfikacji uruchomieniowej możliwe jest zastosowanie w procedurze identyfikacyjnej modelu planowanego eksperymentu czynnego z możliwością pobudzenia pseudoprzypadkowym sygnałem binarnym (PRBS – ang. Pseudorandom Binary Sequence) o właściwościach zbliżonych do „białego szumu”, wytwarzanym przez generator w postaci rejestru przesuwnego z wejściem przez sprzężenia z wybranych pozycji;
przy amplitudzie równej aktualnemu wysterowaniu u pozostałe parametry generatora dobiera się eksperymentalnie
Dla napędu pneumatycznego i okresu próbkowania Tp< 0, 8, 2 > ms oraz przewidywanego zbioru identyfikowanych napędów wybrano jako długość rejestru n = 4 i jako minimalną wartość przedziału czasowego sygnału mTp, m(2; 9), optymalnie m = 6.
Uwagi - sterowanie pozycyjne napędów pneumatycznych
Identyfikacja uruchomieniowa prowadzona jest po rozpędzeniu siłownika (silnika) do bezpiecznej wartości prędkości vbezpi następnie wyhamowaniu przy pomocy sygnału PRBS dla obydwu kierunków ruchu (istotne dla siłowników i niehoryzontalnych położeń napędu), różnych obciążeń masowych mobc, wybranych położeń s i
wysterowań u.
W najprostszym przypadku identyfikowane są cztery modele: dla dwóch kierunków ruchu oraz minimalnego i maksymalnego obciążenia masowego dla wybranego, np. środkowego, położenia elementu ruchomego napędu (siłownika).
Identyfikacja uruchomieniowa napędu
Rysunek 1. Identyfikacja uruchomieniowa napędu.
Realizacja identyfikacji statystycznej modelu
ETAP 2: Identyfikacja w trakcie normalnej pracy napędu służy do:
wyznaczenia lokalnych (chwilowych) modeli zachowań układu napędowego; jest prowadzona równolegle do sterowania pozycyjnego:
szacowanie wektora parametrów modelu dyskretnego (ˆθ) i potem modelu ciągłego (Φ) przebiega w każdym okresie Tpident w trzech kolejnych krokach obliczeniowych, w powtarzalnych ciągach po kilkadziesiąt szacowań kończonych każdorazowo
modyfikacji nastaw sterowania przez szacowanie obciążenia masowego i identyfikację on-line modelu procesu ruchu.
Identyfikacja w trakcie normalnej pracy napędu
Rysunek 2. Identyfikacja w trakcie normalnej pracy napędu.
Uwagi - sterowanie pozycyjne napędów pneumatycznych
W porównaniu do modelu obliczeniowego (bilansowego), gorzej szacowany jest wpływ obciążenia masowego. Tak więc dla bardziej zaawansowanych metod sterowania (np. adaptacyjnego) konieczne może być stosowanie specjalnej procedury identyfikacyjnej.
Obserwowane rozbieżności w przypadku współczynnika tłumienia Dm
wynikają z trudności analitycznego określenia zachowań ciernych napędu pneumatycznego: współczynnik tarcia jest przyjmowany w praktyce według katalogowych danych producenta, z reguły jako pewna wartość stała dla całego typoszeregu
siłowników (silników, przekładni), bez uwzględnienia rzeczywistych oporów ruchu w kompletnym układzie napędowym.
W stosunku do „uśrednionych” wyników modelowania analitycznego i uruchomieniowego (metoda LS), różnice w odniesieniu do
identyfikacji w trakcie normalnej pracy, zwłaszcza zmniejszenie wzmocnienia obiektowego Cm, wywołane są dwoma czynnikami:
zapewnieniem procedurze RLS charakteru silnie bieżącego szacowania oraz wpływu tarcia przylgowego w przypadku małych przemieszczeń i prędkości ruchu.
Uwagi
W trakcie normalnej pracy układu napędowego są identyfikowane charakterystyczne dla napędów przebiegi zależności parametrów zachowań modelu oscylacyjnego od parametrów ruchu i
wysterowania: dotyczy to charakterystyk pulsacji drgań swobodnych ωom i tłumienia Dm w funkcji położenia s.
Spośród działań o charakterze ulepszeń numerycznych zmniejszających wrażliwość identyfikacji i konwersji parametrów na zakłócenia i zniekształcenia pomiarowe, dyskretyzacyjne i
rekonstrukcyjne wykorzystywanych sygnałów, jak np. skalowanie ich wartości dla poprawy uwarunkowań równań procedur lub
dopasowania czasu próbkowania, szczególne znaczenie przypisać należy działaniom filtracyjnym zarówno na sygnałach
wejściowych, jak i na estymowanych parametrach modeli.
Sterowanie napędów maszyn i robotów
Wykład 5 - Identyfikacja
dr inż. Jakub Możaryn
Instytut Automatyki i Robotyki (IAiR), Politechnika Warszawska
Warszawa, 2015