Struktura sterowania VFO-ADR
Uwaga 2.4 W przypadku obiektów o predyspozycjach do ruchu profilowa- profilowa-nego, obiekt jest w pełni dosterowany gdy
∀i∈{u,v,w,p,q,r} 0<
∏
i
ai <1, (2.27)
oraz niedosterowany w przypadku, gdy
∀i∈{u,v,w,p,q,r}
∏
i
ai =0. (2.28)
Analizowany w ramach tej pracy typ obiektu mo ˙ze nale ˙ze´c zarówno do grupy obiektów w pełni dosterowanych jak i do grupy obiektów niedosterowanych, z uwzgl ˛ednieniem zało ˙zenia 2.6, oraz docelowo powinien realizowa´c ruch profilowany o charakterze torpedopodob-nym. Główny nap ˛ed pojazdu przyło ˙zony jest wzdłu ˙z osi xB (rysunek 2.1) oraz wokół osi xB, yB i zB. Maksymalne warto´sci sił mo ˙zliwych do wygenerowania wzdłu ˙z osi yB i zB s ˛a znacznie mniejsze ni ˙z w osi xB, dlatego nawet je ˙zeli obiekt jest w pełni dosterowany i istnieje mo ˙zliwo´s´c ich wygenerowania, pełni ˛a one wył ˛acznie rol ˛e pomocnicz ˛a zwi ˛azan ˛a z kompensacj ˛a zakłóce ´n i niepo ˙z ˛adanych efektów dynamicz-nych pojawiaj ˛acych si ˛e w trakcie ruchu robota. Zastosowanie układu nap ˛edowego o opisanych własno´sciach kierunkowych jest szczególnie uzasadnione, w przypadku gdy współczynniki tłumienia o´srodka s ˛a znacznie wy ˙zsze wzdłu ˙z osi yB i zB ani ˙zeli wzdłu ˙z osi xB. Ró ˙z-nice warto´sci współczynników tłumienia w poszczególnych osiach s ˛a wynikiem odpowiedniego zaprojektowania konstrukcji mechanicznej robota i mog ˛a by´c regulowane, przykładowo, wykorzystuj ˛ac lotki [18] zwi ˛ekszaj ˛ace powierzchni ˛e przekroju poprzecznego robota oraz ograniczaj ˛ace aerodynamik ˛e pojazdu w odpowiednich kierunkach.
28 m o d e l o b i e k t u i z a d a n i a s t e r o wa n i a
2.2 r o d z a j e s y g na ł ó w r e f e r e n c y j n y c h
Struktura sterowania projektowana w ramach tej pracy dotyczy dwóch klasycznych zada ´n ruchu:
- ´sledzenia trajektorii, czyli pod ˛a ˙zania za punktem ´sci´sle zdefinio-wanym w czasie i przestrzeni oraz
- odtwarzania ´scie ˙zki, czyli poruszaniu si ˛e wzdłu ˙z okre´slonej w przestrzeni krzywej z zadanym profilem pr ˛edko´sci.
2.2.1 Trajektoria zadana
W zadaniu ´sledzenia trajektorii, sparametryzowana czasem konfigura-cja referencyjna jest wyra ˙zona jako wektor
ηd(t) =
gdzie docelowa pozycja w przestrzeni kartezja ´nskiej opisana jest przy pomocy wektora ηpd(t). Poszczególne elementy wektora orientacji zadanej ηod(t), zgodnie z torpedopodobnym charakterem ruchu, zde-finiowane s ˛a w taki sposób aby o´s xB wzdłu ˙z której docelowo genero-wana b ˛edzie główna składowa siły ci ˛agu była styczna do trajektorii, to znaczy trakcie ´sledzenia trajektorii, okre´slonego jako ruch przodem dla ξd =1 oraz ruch tyłem dla ξd = −1. Dziedzina orientacji zadanej ηod(t), na podstawie definicji (2.30)-(2.32), jest zdefiniowana jakoQod, {0} × (−π/2, π/2) × (−π, π].
Uwaga 2.5 Ze wzgl˛edu na stał ˛a, wynosz ˛ac ˛a zero, warto´s´c k ˛ata φd zdefinio-wanego w (2.30), docelowa strategia ruchu ma charakter bezprzechyłowy (ang. non-banked), opisany mi˛edzy innymi w [24]. W efekcie, o´s yB wirtu-alnego pojazdu o konfiguracji ηd(t)jest zawsze równoległa do płaszczyzny xGyG.
Zało˙zenie 2.7 Dla ka˙zdej chwili czasu t≥0, trajektoria zadana ηpd(t) ∈ C3 jest przynajmniej trzykrotnie ró˙zniczkowaln ˛a funkcj ˛a Lipschitza. Ze wzgl˛edu na potrzeb˛e zagwarantowania ustawicznego pobudzenia struktury
2.2 rodzaje sygnałów referencyjnych 29
sterowania przedstawionej w rozdziale 3, pochodna ˙ηpd(t)powinna przyj-mowa´c niezerowe warto´sci w ka˙zdej chwili czasu. Poszczególne ograniczenia przyjmuj ˛a posta´c
∀t≥0
m¯ ≤ ˙ηpd(t) ≤m,¯ (2.33)
∀t≥0 0≤max
¨ηpd(t) , ...
ηpd(t)
≤ M,¯ (2.34)
dla pewnych stałych
m,¯ m, ¯¯ M > 0.
Zało˙zenie 2.8 Aby ograniczy´c prawdopodobie ´nstwo przejazdu robota przez osobliwo´s´c opisan ˛a w zało˙zeniu 2.1, równie˙z zadany k ˛at pitch powinien spełnia´c zale˙zno´s´c
∀t>0 θd(t) 6= π
2 +kπ, k∈ Z. (2.35)
Utrzymanie k ˛ata θd(t)w po˙z ˛adanym przedziale mo˙zna uzyska´c, zakładaj ˛ac
˙ze
m¯ ≤ ˙¯ηpd(t) (2.36)
dla podwektora ˙¯ηpd(t) , [˙xd ˙yd]>interpretowanego jako rzut wektora ˙ηpd(t) na płaszczyzn˛e xGyGoraz dla stałej
m¯ >0.
Wektor zadanych pr ˛edko´sci w lokalnym układzie odniesienia, wy-prowadzony na podstawie równa ´n kinematyki bryły sztywnej o
sze-´sciu stopniach swobody (2.3) ma posta´c νd(t) =J−1(ηod(t))˙ηpd(t)
= [ud(t)vd(t)wd(t) pd(t)qd(t)rd(t)]> ∈R6, (2.37) przy czym ze wzgl ˛edu na konkretne definicje wektora orientacji zada-nej (2.30)-(2.32), elementy wektora pr ˛edko´sci zadanej wzdłu ˙z osi yB, zBoraz wokół osi xB spełniaj ˛a wyra ˙zenie
∀t≥0 vd(t) =wd(t) = pd(t) ≡0, (2.38) które potwierdza zgodny charakter zaprojektowanej trajektorii z no-minalnym ruchem obiektu torpedopodobnego.
Uwaga 2.6 Wyra˙zenie(2.38) jest zgodne z zało˙zeniem o profilowanym, tor-pedopodobnym sposobie poruszania si˛e obiektu referencyjnego. Ze wzgl˛edu na zerowe warto´sci pr˛edko´sci zadanych wzdłu˙z osi yB i zB, ruch robota (a tak˙ze powi ˛azana z nim główna składowa sił generowanych przez układ nap˛edowy) powinien by´c realizowany wzdłu˙z osi xB.
Uwzgl ˛edniaj ˛ac zało ˙zenie 2.7, zgodnie z którym wymagane jest zagwarantowanie niezerowych warto´sci pr ˛edko´sci trajektorii zadanej (równanie (2.33)), mo ˙zemy zapisa´c
tinf≥0|ud(t)| = u¯d ≥
m,¯ (2.39)
30 m o d e l o b i e k t u i z a d a n i a s t e r o wa n i a
gwarantuj ˛ac tym samym ustawiczne pobudzenie trajektorii zadanej wzdłu ˙z osi xB. Znak pr ˛edko´sci zadanej ud implikuje docelowy kieru-nek ruchu okre´slony przez wprowadzon ˛a w (2.32) zmienn ˛a
ξd=sign(ud(t)). (2.40)
Niedokładno´s´c odtwarzania trajektorii opisana jest przy pomocy wektora uchybu konfiguracji, który dla zadania ´sledzenia trajektorii zdefiniowany został jako
gdzie ep(t) odpowiada uchybowi pozycji, eo(t) uchybowi orienta-cji, natomiast dziedzina bł ˛edu zdefiniowana jest jako Qet , R3× (−π, π] × (−π, π) ×R.
2.2.2 ´Scie˙zka referencyjna w postaci nieparametrycznej
Nieparametryczny opis krzywej w przestrzeni trójwymiarowej polega na odpowiednim dobraniu dwóch funkcji s1(ηp), s2(ηp):R3 →R, dla których ka ˙zdy punkt ηpnale ˙z ˛acy do docelowej ´scie ˙zki referencyjnej znajduje si ˛e w zbiorze
Sd , {ηp ∈ D: s1(ηp) =s2(ηp) =0}, (2.42) gdzie D jest zbiorem dopuszczalnych pozycji obiektu sterowania.
Postaci poszczególnych wyra ˙ze ´n opisuj ˛acych kształt funkcji s1(ηp), s2(ηp)powinny spełnia´c wymienione poni ˙zej zało ˙zenia.
Zało˙zenie 2.9 Dla ka˙zdego dopuszczalnego punktu ηp ∈ D, funkcje sj(ηp) ∈ C3 s ˛a trzykrotnie ró˙zniczkowalnymi funkcjami Lipschitza, dodatkowo ele-menty gradientu j-tej funkcji zdefiniowanego jako∇sj(ηp) , [∂sj/∂x ∂sj/∂y
∂sj/∂z]>s ˛a funkcjami Lipschitza. Poszczególne ograniczenia mo˙zna opisa´c wykorzystuj ˛ac nast˛epuj ˛ace wyra˙zenia
∀ηp∈D
2.2 rodzaje sygnałów referencyjnych 31
Zało˙zenie 2.10 Dla ka˙zdego dopuszczalnego punktu ηp ∈ D, gradienty powierzchni sj(ηp)nie s ˛a współliniowe, czyli
∀ηp∈D ∇s1(ηp) 6=k∇s2(ηp), k∈R. (2.46) W wyniku tego zało˙zenia, k ˛at pomi˛edzy wektorami gradientów poszczegól-nych powierzchni spełnia zale˙zno´s´c
κ(ηp) , ∠(∇s1(ηp),∇s2(ηp)) 6=0. (2.47) Poza geometryczn ˛a definicj ˛a referencyjnego zbioru pozycji, do re-alizacji zadania odtwarzania ´scie ˙zki wymagana jest równie ˙z definicja profilu pr ˛edko´sci post ˛epowej wzdłu ˙z wybranej krzywej:
ud,ξdU, U = const>0, ξd ∈ {−1,+1}, (2.48) gdzie symbol ξd, tak jak w przypadku trajektorii zadanej, opisuje strategi ˛e ruchu robota wzdłu ˙z ´scie ˙zki - w tył dla warto´sci ξd= −1 i w przód dla ξd=1. Niezerowe warto´sci stałej U gwarantuj ˛a ustawiczne pobudzenie struktury sterowania realizuj ˛acej zadanie odtwarzania
´scie ˙zki opisanej w rozdziale3.
Uwaga 2.7 Profil pr˛edko´sci ud zdefiniowany wzdłu˙z ´scie˙zki referencyjnej Sd przyjmuje w ramach tej pracy warto´sci stałe w celu zapewnienia przej-rzysto´sci prezentowanych tre´sci. W ogólnym przypadku mo˙ze by´c zmienny, zale˙zny na przykład od pozycji ηp, czy innych parametrów.
W celu opisania orientacji zadanej zgodnej z torpedopodobnym charakterem obiektu sterowania, nale ˙zy najpierw zdefiniowa´c wektory jednostkowe prostopadłe do poszczególnej powierzchni sj, to jest
ϑj(ηp) =
oraz jednostkowy wektor styczny do obu powierzchni
ϑ⊥(ηp) = Zmienna σ∈ {−1, 1}opisuje kierunek realizacji ruchu wzdłu ˙z ´scie ˙zki.
Dla prostego przykładu ´scie ˙zki w kształcie okr ˛egu, pojazd porusza-j ˛acy si ˛e w przód (ξd =1) docelowo powinien realizowa´c ruch prawo-skr ˛etny dla σ=1 i lewoskr ˛etny dla σ = −1. Referencyjna orientacja obiektu sterowania została zdefiniowana w taki sposób, aby o´s xB była równoległa do jednostkowego wektora stycznego do powierzchni
32 m o d e l o b i e k t u i z a d a n i a s t e r o wa n i a
opisuj ˛acych ´scie ˙zk ˛e referencyjn ˛a ϑ⊥. Przyj ˛ete postaci zadanych k ˛atów yaw, pitch i roll s ˛a kolejno zdefiniowane jako
ψd(ηp) ,Atan2(ξdϑ⊥y(ηp), ξdϑ⊥x(ηp)) ∈ [−π, π), (2.51) Zgodnie z uwag ˛a2.5, przez przyj ˛ecie zerowej warto´sci referencyjnego k ˛ata roll, docelowa strategia ruchu robota wzdłu ˙z ´scie ˙zki ma charakter bezprzechyłowy.
Zało˙zenie 2.11 Aby ograniczy´c prawdopodobie ´nstwo przejazdu robota przez osobliwo´s´c opisan ˛a w zało˙zeniu2.1, równie˙z zadany k ˛at pitch powinien speł-nia´c zale˙zno´s´c
∀t>0 θd(ηp) 6= π
2 +kπ, k∈Z. (2.55)
Utrzymanie k ˛ata θd(ηp)w po˙z ˛adanym przedziale mo˙zna uzyska´c, zakładaj ˛ac
˙ze
m¯ ⊥< k¯ϑ⊥(ηp)k, (2.56)
dla podwektora ¯ϑ⊥(ηp) , [ϑ⊥xϑ⊥y]>interpretowanego jako rzut wektora ϑ⊥(ηp)na płaszczyzn˛e xGyG, oraz dla
m¯⊥ >0.
Przyj ˛ecie we wzorach (2.51) - (2.53) definicji k ˛atów referencyjnych wyznaczonych z wykorzystaniem elementów jednostkowego wek-tora skierowanego wzdłu ˙z ´scie ˙zki referencyjnej ϑ⊥ ze wzoru (2.50), pozwala na zapisanie referencyjnych pseudopr ˛edko´sci
∀t≥0 vd(ηp) =wd(ηp) = pd(ep) ≡0, (2.57) które potwierdzaj ˛a torpedopodobny profil pr ˛edko´sci obiektu refe-rencyjnego. W efekcie uwaga2.6 dotyczy obu analizowanych zada ´n ruchu.
Niedokładno´s´c odtwarzania ´scie ˙zki na poziomie kinematycznym jest opisana przy pomocy uchybu
e(η) = niezerowe warto´sci o ró ˙znych znakach, w zale ˙zno´sci po której stronie
´scie ˙zki jest pojazd.
2.3 zdefiniowanie zada ´n s t e r o wa n i a 33
Definicja 2.4 Zbiory punktów, dla których funkcja sj(ηp), j ∈ {1, 2} przyjmuje takie same warto´sci nazywane b˛ed ˛a powierzchniami poziomi-cowymi.
Pomimo tego, ˙ze punkty nale ˙z ˛ace do danej powierzchni poziomico-wej nie s ˛a w ogólno´sci równoodległe od ´scie ˙zki referencyjnej, stanowi ˛a one pewn ˛a nieeuklidesow ˛a miar ˛e odległo´sci ´srodka układu {B}od zerowej poziomicy funkcji sj(ηp). Z tego powodu wektor ep(ηp)mo ˙ze by´c interpretowany jako pewna forma uchybu pozycji. Wektor eo(η) jest zdefiniowanym w sposób konwencjonalny uchybem orientacji.
2.3 z d e f i n i o wa n i e z a d a ´n s t e r o wa n i a
Zadaniem sterowania jest odpowiednie zaprojektowanie sygnałów steruj ˛acych τ(η(t))korzystaj ˛acych wył ˛acznie ze sprz ˛e ˙zenia od wyj´scia (definicja 2.1, zało ˙zenie2.3) i realizuj ˛acych powierzone im zadanie ruchu (´sledzenie trajektorii opisanej wzorem (2.29) lub odtwarza-nie ´scie ˙zki zdefiniowanej w (2.42)) przez obiekt o dynamice (2.7), po-mimo strukturalnych i parametrycznych niepewno´sci modelu obiektu oraz wyst ˛epowania zaburze ´n zewn ˛etrznych opisanych w zało ˙zeniu2.4.
Zadanie ruchu jest poprawnie realizowane, je ˙zeli norma wektora uchybu
e2π(t) ,
"
ep(t) eo(t)mod 2π
#
, (2.59)
wyprowadzonego w zale ˙zno´sci od zadania ruchu, na podstawie (2.41) lub (2.58), spełnia wyra ˙zenia
∃T∈(0,∞)∀t≥T ke2π(t)k ≤εη (2.60) oraz
∃T∈(0,∞)∀t≥T kep(t)k ≤εp (2.61) dla pewnych stałych εp, εη > 0, przy czym ograniczenie εp okre´slaj ˛ace górn ˛a granic ˛e uchybu pozycji dla czasu t > T mo ˙ze by´c dowolnie małe. Operacja mod 2π została wprowadzona we wzorze (2.59) w celu ograniczenia niepo ˙z ˛adanych efektów wynikaj ˛acych z definicji dziedziny bł ˛edu eψ,ψd−ψw zbiorze liczb rzeczywistychR.
Spójne oznaczenie uchybów zdefiniowanych w (2.41) dla zadania
´sledzenia trajektorii oraz w (2.58) dla zadania odtwarzania ´scie ˙zki umo ˙zliwiło wprowadzenie jednakowej definicji zadania sterowania dla obu rozpatrywanych zada ´n ruchu przedstawionej we wzorach (2.60) i (2.61) .
3
K A S K A D O WA S T R U K T U R A U K Ł A D Ó W S T E R O WA N I A I P R AW O S T E R O WA N I A
Rozwi ˛azanie postawionego w poprzednim rozdziale zadania stero-wania zostanie zrealizowane przez zaprojektowanie dwustopniowej, kaskadowej struktury układu sterowania, której schemat pogl ˛adowy przedstawiony został na rysunku 3.1. P ˛etla zewn ˛etrzna, działaj ˛aca na poziomie kinematyki, oparta jest o metodyk ˛eVFOwyprowadzon ˛a dla obiektów o sze´sciu stopniach swobody, przedstawion ˛a w pracach [43–45,57]. Sterownik p ˛etli zewn ˛etrznej przyjmuje na wej´sciu wektor konfiguracji η(t)oraz wektor sygnałów referencyjnych, na podstawie których oblicza wektor pr ˛edko´sci po ˙z ˛adanych νc(t). Wektor sygnałów referencyjnych jest ró ˙zny dla dwóch analizowanych zada ´n ruchu i składa si ˛e z:
- zadanych pozycji ηpd(t), pr ˛edko´sci ˙ηpd(t)i przyspiesze ´n ¨ηpd(t) w przypadku zadania ´sledzenia trajektorii, oraz
- zwarto´sciowanych w bie ˙z ˛acej pozycji pojazdu warto´sci powierzchni poziomicowych sj(ηp), ich gradientów∇sj(ηp)oraz Hesjanów ∇(∇>sj(ηp)) w zadaniu odtwarzania ´scie ˙zki, dla j∈ {1, 2}.
Działaj ˛aca na poziomie dynamiki wewn ˛etrzna p ˛etla sterowania zo-stała zaprojektowana na podstawie metodyADR, opisanej pierwotnie w pracach [30,87], z wykorzystaniem obserwatora stanu rozszerzo-nego (ESO) zdefiniowanego w dziedzinie uchybu przedstawionego w pracach [49,52,71,88]. Zadaniem sterownika p ˛etli wewn ˛etrznej jest wyznaczenie odpowiedniego sygnału steruj ˛acego τ(t), na podstawie wektora konfiguracji η(t)oraz wygenerowanego przez sterownik p ˛etli zewn ˛etrznej wektora pr ˛edko´sci po ˙z ˛adanych νc(t). Zarówno sterow-nik na poziomie kinematyki oraz sterowsterow-nik na poziomie dynamiki wykorzystuj ˛a do wyznaczenia sygnałów wyj´sciowych wył ˛acznie zmie-rzonych warto´sci elementów wektora η(t). W efekcie, zgodne z za-ło ˙zeniem2.3, sygnał steruj ˛acy jest obliczany wył ˛acznie w oparciu o sprz ˛e ˙zenie od wyj´scia.
� ��
�Generator sygnału referencyjnego
Sygnały
ref. Sterownik pętli zewnętrznej
��
Sterownik pętli wewnętrznej
Obiekt sterowania
Rysunek 3.1: Pogl ˛adowy schemat kaskadowej struktury sterowaniaVFO-ADR
35
36 k a s k a d o wa s t r u k t u r a u k ł a d ó w s t e r o wa n i a i p r aw o s t e r o wa n i a
3.1 s t e r o w n i k p ˛e t l i w e w n ˛e t r z n e j
Sterownik wewn ˛etrznej p ˛etli sterowania składa si ˛e z dwóch głównych elementów: obserwatora stanu rozszerzonego (ESO) oraz odpornego sterownika dynamicznego opartego o metod ˛eADR, których konfigu-racja została pogl ˛adowo przedstawiona na rysunku 3.2. Zadaniem
Sterownik ESO ADR
Rysunek 3.2: Schemat blokowy wewn ˛etrznej p ˛etli sterowania
obserwatora stanu rozszerzonego jest wyznaczenie estymowanej war-to´sci uchybu pr ˛edko´sci ˆe(t)oraz wektora ˆd(t)okre´slaj ˛acego estymat ˛e wpływu zaburze ´n zewn ˛etrznych, niedokładno´sci pomiarowych oraz niepewno´sci parametrycznych i strukturalnych modelu obiektu na wynikowy ruch pojazdu, na podstawie konfiguracji mierzonej η(t) oraz konfiguracji po ˙z ˛adanej ηc(t)wyznaczonej poprzez odpowiednie przekształcenie i scałkowanie wektora pr ˛edko´sci po ˙z ˛adanych νc(t). Sygnały wyj´sciowe obserwatora podawane s ˛a na wej´scie sterownika
ADRi na ich podstawie obliczany jest wektor sygnałów steruj ˛acych τ(t), interpretowany jako wektor sił uogólnionych oddziałuj ˛acych na obiekt sterowania w poszczególnych osiach lokalnego układu współ-rz ˛ednych.
3.1.1 Sterowanie z aktywn ˛a redukcj ˛a zakłóce ´n
Nawi ˛azuj ˛ac do schematu blokowego przedstawionego na rysunku3.2, w równaniach obserwatora wykorzystany zostanie przecałkowany i przemno ˙zony przez macierz J wektor pr ˛edko´sci po ˙z ˛adanych
νc(t) =
wyznaczony przez sterownik p ˛etli zewn ˛etrznej (rysunek3.1). Na pod-stawie definicji wektora νc(t)wyra ˙zonego w lokalnym układzie od-niesienia oraz równa ´n kinematyki (2.3), wektor pr ˛edko´sci po ˙z ˛adanych w globalnym układzie odniesienia jest wyra ˙zony równaniem
˙ηc(t) = J(ηo(t))νc(t). (3.2) Niedokładno´s´c odtwarzania pr ˛edko´sci po ˙z ˛adanych została zdefinio-wana jako wektor
3.1 sterownik p ˛e t l i w e w n ˛e t r z n e j 37
którego dynamika, na podstawie (2.8), przyjmuje posta´c
˙e= ¨ηc− ¨η
= ¨ηc+Mη−1(ηo)hµη(η, ˙η) +τη∗
i−Mη−1(ηo)Γη(ηo)τη. (3.4) Z uwagi na zakładan ˛a w zało ˙zeniu2.4niepewno´s´c parametryczn ˛a i strukturaln ˛a modelu obiektu oraz nieznane warto´sci zaburzenia zewn ˛etrznego τη∗, zdefiniujmy wektor zaburzenia całkowitego
d(¨ηc, η, ˙η, τη, τη∗) , ¨ηc+Mη−1(ηo)hµη(η, ˙η) +τη∗ i
−Mη−1(ηo)Γη(ηo)τη+ ˆBη(ηo)Γη(ηo)τη, (3.5) który akumuluje wszelkie niepewno´sci wyst ˛epuj ˛ace w systemie dy-namicznym. Macierz ˆBη(ηo) ∈ R6×6 wyra ˙zona w układzie {G}jest zdefiniowana jako
ˆBη(ηo) ,J(ηo)ˆBJ>(ηo), (3.6) przy czym jej odpowiednik wyra ˙zony w lokalnym układzie odniesie-nia ma posta´c
ˆB ,diag{ˆb1, ..., ˆb6} ∈R6×6. (3.7) Macierze ˆBη(ηo) oraz ˆB s ˛a, odpowiednio, zgrubnie szacowanymi odpowiednikami macierzy Mη−1(ηo)i M−1. Wektor zaburzenia cał-kowitego wynikaj ˛acy z definicji (3.5) składa si ˛e wi ˛ec z pochodnej pr ˛edko´sci po ˙z ˛adanych wyra ˙zonych w układzie globalnym ¨ηc interpre-towanej jako sygnał sprz ˛e ˙zenia wyprzedzaj ˛acego, swobodnej cz ˛e´sci dynamiki (2.8) oraz potencjalnie z wpływu sygnału steruj ˛acego wyni-kaj ˛acego z niedokładno´sci szacowania odwrotnej macierzy mas, gdy ˆBη(ηo) 6= Mη−1(ηo). W efekcie, na podstawie relacji (2.11) i (3.6) oraz definicji (3.5), dynamik ˛e uchybu odtwarzania pr ˛edko´sci po ˙z ˛adanych, opisanej wzorem (3.4), mo ˙zna przepisa´c jako
˙e=d(¨ηc, η, ˙η, τη, τη∗) − ˆBη(ηo)Γη(ηo)τη
(3.6)
= d(¨ηc, η, ˙η, τη, τη∗) −J(ηo)ˆBJ>(ηo)Γη(ηo)τη (2.11)
= d(¨ηc, η, ˙η, τη, τη∗) −J(ηo)ˆBΓJ>(ηo)τη. (3.8) Uwaga 3.1 W przypadku perfekcyjnej znajomo´sci modelu dynamiki obiektu sterowania, wyra˙zonej wzorem (2.7), macierz M jest dokładnie znana, dla-tego zastosowanie podstawienia ˆB= M−1w definicji zaburzenia całkowitego wyklucza składnik zwi ˛azany z sygnałem steruj ˛acym. W przypadku niepew-no´sci parametrycznej macierzy mas, wyznaczenie dokładnej warto´sci odwrot-nej macierzy mas jest niemo˙zliwe i konieczne jest znalezienie aproksymacji
ˆB≈ M−1, powoduj ˛ac wyst ˛apienie składnika zale˙znego od sygnału steruj ˛a-cego w ramach wektora całkowitego zaburzenia z wzoru (3.5). Odporno´s´c metodyADRCna niedokładno´s´c szacowania odpowiednika macierzy wej´s´c dla systemuSISOzostała szczegółowo przeanalizowana w pracy [20].
38 k a s k a d o wa s t r u k t u r a u k ł a d ó w s t e r o wa n i a i p r aw o s t e r o wa n i a
Zało˙zenie 3.1 Wektor stanu systemu(2.18) składaj ˛acy si˛e z konfiguracji pojazdu η(t) oraz wektora pseudopr˛edko´sci ν(t) znajduje si˛e w pewnym ograniczonym zbiorze zwartym.
Zało˙zenie 3.2 Elementy wektora d(t) ∈ C1s ˛a ograniczone, przynajmniej jednokrotnie ró˙zniczkowalne oraz s ˛a funkcjami Lipschitza dla wektorów η(t), ν(t)nale˙z ˛acych do pewnego przedziału zwartego. Na podstawie przyj˛etych zało˙ze ´n mo˙zna zapisa´c, ˙ze nierówno´sci
sup
t≥0
kd(t)k ≤Rd (3.9)
sup
t≥0
˙d(t) ≤rd˙ (3.10)
s ˛a spełnione dla pewnych sko ´nczonych Rd, rd˙>0 je˙zeli spełnione jest zało˙ze-nie3.1oraz ˆB jest odpowiednio dokładnym przybli˙zeniem macierzy M−1. Uwaga 3.2 Zało˙zenie o ograniczonych warto´sciach elementów wektorów d(t)i ˙d(t), które w ogólno´sci s ˛a zale˙zne od stanu, jest szeroko stosowane w badaniach zwi ˛azanych z projektowaniem sterowników odpornych, na przykład w [64], [66] czy [49], a tak˙ze w analizie odpornego obserwatora opisanego w [34]. Wynik przedstawiony w pracy [82] pokazuje, ˙ze uzyskanie ograniczo-nych warto´sci całkowitego zaburzenia oraz jego pochodnej jest mo˙zliwe wy-ł ˛acznie w przypadku, gdy wektor stanu rozwa˙zanego systemu dynamicznego znajduje si˛e w pewnej ograniczonej przestrzeni zwartej, dlatego konieczne jest wprowadzenie zało˙zenia3.1.
Uwaga 3.3 Rachunek argumentów przeprowadzony dla wektorów d(t) i
˙d(t)został przedstawiony w rozdziale8.4. W efekcie, uwzgl˛edniaj ˛ac zało˙zenia 2.5i3.1, pokazana została zale˙zno´s´c wektora całkowitego zaburzenia oraz jego pochodnej wył ˛acznie od wielko´sci odgórnie ograniczonych w dowolnym sko ´nczonym czasie.
Zakładaj ˛ac mo ˙zliwo´s´c wyznaczenia estymaty całkowitego zabu-rzenia ˆd(t) oraz estymaty uchybu ´sledzenia pr ˛edko´sci po ˙z ˛adanych ˆe(t)(sposób obliczania poszczególnych estymat opisany zostanie w podpunkcie3.1.2), sygnał steruj ˛acy wyra ˙zony w globalnym układzie odniesienia zaprojektowany zgodnie z metodyk ˛aADRw celu stabili-zacji systemu dynamicznego (3.8) w punkcie e=000 przyjmuje posta´c
τη , ˆB−η1(ηo)h ˆd+Kη(ηo)ˆei
= J−>(ηo)ˆB−1J−1(ηo)h ˆd+J(ηo)K J−1(ηo)ˆei
. (3.11)
Macierz wzmocnie ´n sterownika p ˛etli wewn ˛etrznej w globalnym ukła-dzie odniesienia
Kη(ηo) ,J(ηo)K J−1(ηo) ∈R6×6 (3.12)
3.1 sterownik p ˛e t l i w e w n ˛e t r z n e j 39
jest zdefiniowana przy pomocy jej odpowiednika wyra ˙zonego w ukła-dzie lokalnym
K,diag{k1, ..., k6} ∈R6×6, (3.13) który jest parametrem projektowym opisywanej struktury sterowania.
Korzystaj ˛ac z relacji (2.12) opisuj ˛acej przekształcenie sygnału steru-j ˛acego mi ˛edzy analizowanymi układami, wektor sił i momentów sił wyra ˙zony w lokalnym układzie odniesienia ma posta´c
τ= J>(ηo)τη
= ˆB−1J−1(ηo)h ˆd+J(ηo)K J−1(ηo)ˆei
. (3.14)
Uwaga 3.4 Wyznaczony w równaniu (3.14) sygnał steruj ˛acy odpowiada siłom i momentom sił, które zostałyby wygenerowane dla pojazdu w pełni dosterowanego. W rzeczywisto´sci, ze wzgl˛edu na mo˙zliwe niedosterowanie obiektu, wygenerowane przez układ nap˛edowy sygnały steruj ˛ace s ˛a mno˙zone przez macierzΓ - zgodnie z równaniami dynamiki obiektu sterowania
wyra-˙zonymi wzorem (2.7). Obecno´s´c macierzyΓ b˛edzie brana pod uwag˛e przy analizie stabilno´sci układu zamkni˛etego.
3.1.2 Obserwator stanu rozszerzonego
Estymaty bł ˛edu odtwarzania pr ˛edko´sci ˆe i całkowitego zaburzenia ˆd wykorzystywane w równaniu sterownika p ˛etli wewn ˛etrznej ze wzoru (3.14) obliczane s ˛a przez sze´s´c równolegle działaj ˛acych obserwatorów stanu rozszerzonego, zaprojektowanych osobno dla ka ˙zdego stopnia swobody, o strukturze opisanej mi ˛edzy innymi w pracach [37, 87].
Wektor stanu rozszerzonego dla i-tego stopnia swobody zdefiniowany jest jako
dla i∈ {1, ..., 6}oraz dla konfiguracji po ˙z ˛adanej wyznaczonej poprzez całkowanie równania (3.2) i wyra ˙zonej jako
ηc(t) = [ηc1(t). . . ηc6(t)]>,η(0) +
Z t
0 J(ηo(ξ))νc(ξ)dξ∈R6. (3.16)
40 k a s k a d o wa s t r u k t u r a u k ł a d ó w s t e r o wa n i a i p r aw o s t e r o wa n i a
Równania stanu opisuj ˛ace dynamik ˛e stanu rozszerzonego mo ˙zna zapisa´c, dla ka ˙zdego ze stopni swobody, w oparciu o definicj ˛e (3.3) oraz równanie (3.8), jak nast ˛epuje
jest wektorem odpowiedzialnym za wycinanie odpowiedniego ele-mentu wektora sygnałów steruj ˛acych, oddziałuj ˛acego na konkretny stopie ´n swobody.
Na podstawie równa ´n (3.17) projektujemy liniowy obserwator stanu rozszerzonego opisany równaniem
˙ˆxi = A ˆxi+bζiJ(ηo)ˆBΓJ>(ηo)τη+li[x1i− ˆx1i], (3.19) gdzie ˆxi , [ˆx1i ˆx2i ˆx3i]> ∈R3 jest estymat ˛a wektora stanu rozszerzo-nego xi, zdefiniowanego w (3.15), natomiast
li = [l1i l2i l3i]>, [3ωoi3ωoi2 ω3oi]>∈R3, ωoi >0 (3.20) jest wektorem wzmocnie ´n obserwatora działaj ˛acego w i-tym stopniu swobody.
Uwaga 3.5 Parametryzacja wzmocnie ´n obserwatora stanu rozszerzonego z