W przypadku obiektów o predyspozycjach do ruchu profilowa- profilowa-nego, obiekt jest w pełni dosterowany gdy

Struktura sterowania VFO-ADR

Uwaga 2.4 W przypadku obiektów o predyspozycjach do ruchu profilowa- profilowa-nego, obiekt jest w pełni dosterowany gdy

∀_i_∈{u,v,w,p,q,r} 0<

∏

a_i <_1, _(2.27)

oraz niedosterowany w przypadku, gdy

∀_i_∈{u,v,w,p,q,r}

∏

a_i =0. (2.28)

Analizowany w ramach tej pracy typ obiektu mo ˙ze nale ˙ze´c zarówno do grupy obiektów w pełni dosterowanych jak i do grupy obiektów niedosterowanych, z uwzgl ˛ednieniem zało ˙zenia 2.6, oraz docelowo powinien realizowa´c ruch profilowany o charakterze torpedopodob-nym. Główny nap ˛ed pojazdu przyło ˙zony jest wzdłu ˙z osi x^B (rysunek 2.1) oraz wokół osi x^B, y^B i z^B. Maksymalne warto´sci sił mo ˙zliwych do wygenerowania wzdłu ˙z osi y^B i z^B s ˛a znacznie mniejsze ni ˙z w osi x^B, dlatego nawet je ˙zeli obiekt jest w pełni dosterowany i istnieje mo ˙zliwo´s´c ich wygenerowania, pełni ˛a one wył ˛acznie rol ˛e pomocnicz ˛a zwi ˛azan ˛a z kompensacj ˛a zakłóce ´n i niepo ˙z ˛adanych efektów dynamicz-nych pojawiaj ˛acych si ˛e w trakcie ruchu robota. Zastosowanie układu nap ˛edowego o opisanych własno´sciach kierunkowych jest szczególnie uzasadnione, w przypadku gdy współczynniki tłumienia o´srodka s ˛a znacznie wy ˙zsze wzdłu ˙z osi y^B i z^B ani ˙zeli wzdłu ˙z osi x^B. Ró ˙z-nice warto´sci współczynników tłumienia w poszczególnych osiach s ˛a wynikiem odpowiedniego zaprojektowania konstrukcji mechanicznej robota i mog ˛a by´c regulowane, przykładowo, wykorzystuj ˛ac lotki [18] zwi ˛ekszaj ˛ace powierzchni ˛e przekroju poprzecznego robota oraz ograniczaj ˛ace aerodynamik ˛e pojazdu w odpowiednich kierunkach.

28 m o d e l o b i e k t u i z a d a n i a s t e r o wa n i a

2.2 r o d z a j e s y g na ł ó w r e f e r e n c y j n y c h

Struktura sterowania projektowana w ramach tej pracy dotyczy dwóch klasycznych zada ´n ruchu:

- ´sledzenia trajektorii, czyli pod ˛a ˙zania za punktem ´sci´sle zdefinio-wanym w czasie i przestrzeni oraz

- odtwarzania ´scie ˙zki, czyli poruszaniu si ˛e wzdłu ˙z okre´slonej w przestrzeni krzywej z zadanym profilem pr ˛edko´sci.

2.2.1 Trajektoria zadana

W zadaniu ´sledzenia trajektorii, sparametryzowana czasem konfigura-cja referencyjna jest wyra ˙zona jako wektor

η_d(t) =

gdzie docelowa pozycja w przestrzeni kartezja ´nskiej opisana jest przy pomocy wektora η_pd(t). Poszczególne elementy wektora orientacji zadanej η_od(t), zgodnie z torpedopodobnym charakterem ruchu, zde-finiowane s ˛a w taki sposób aby o´s x^B wzdłu ˙z której docelowo genero-wana b ˛edzie główna składowa siły ci ˛agu była styczna do trajektorii, to znaczy trakcie ´sledzenia trajektorii, okre´slonego jako ruch przodem dla ξ_d =1 oraz ruch tyłem dla ξ_d = −1. Dziedzina orientacji zadanej η_od(t), na podstawie definicji (2.30)-(2.32), jest zdefiniowana jakoQ_od, {0} × (−π/2, π/2) × (−π, π].

Uwaga 2.5 Ze wzgl˛edu na stał ˛a, wynosz ˛ac ˛a zero, warto´s´c k ˛ata φ_d zdefinio-wanego w (2.30), docelowa strategia ruchu ma charakter bezprzechyłowy (ang. non-banked), opisany mi˛edzy innymi w [24]. W efekcie, o´s y^B wirtu-alnego pojazdu o konfiguracji η_d(t)jest zawsze równoległa do płaszczyzny x^Gy^G.

Zało˙zenie 2.7 Dla ka˙zdej chwili czasu t≥0, trajektoria zadana η_pd(t) ∈ C³ jest przynajmniej trzykrotnie ró˙zniczkowaln ˛a funkcj ˛a Lipschitza. Ze wzgl˛edu na potrzeb˛e zagwarantowania ustawicznego pobudzenia struktury

2.2 rodzaje sygnałów referencyjnych 29

sterowania przedstawionej w rozdziale 3, pochodna ˙η_pd(t)powinna przyj-mowa´c niezerowe warto´sci w ka˙zdej chwili czasu. Poszczególne ograniczenia przyjmuj ˛a posta´c

∀_t_≥₀

m¯ ≤ ˙η_pd(t) ≤m,¯ (2.33)

∀_t_≥₀ 0≤max

¨η_pd(t) , ...

η_pd(t)

≤ M,^¯ (2.34)

dla pewnych stałych

m,¯ m, ¯¯ M > 0.

Zało˙zenie 2.8 Aby ograniczy´c prawdopodobie ´nstwo przejazdu robota przez osobliwo´s´c opisan ˛a w zało˙zeniu 2.1, równie˙z zadany k ˛at pitch powinien spełnia´c zale˙zno´s´c

∀_t_>₀ θ_d(t) 6= ^π

2 +kπ, k∈ _Z. (2.35)

Utrzymanie k ˛ata θ_d(t)w po˙z ˛adanym przedziale mo˙zna uzyska´c, zakładaj ˛ac

˙ze

m¯ ≤ ˙¯η_pd(t) (2.36)

dla podwektora ˙¯η_pd(t) , [^˙xd ˙y_d]^>interpretowanego jako rzut wektora ˙η_pd(t) na płaszczyzn˛e x^Gy^Goraz dla stałej

m¯ >0.

Wektor zadanych pr ˛edko´sci w lokalnym układzie odniesienia, wy-prowadzony na podstawie równa ´n kinematyki bryły sztywnej o

sze-´sciu stopniach swobody (2.3) ma posta´c ν_d(t) =J⁻¹(η_od(t))_˙η_pd(t)

= [u_d(t)v_d(t)w_d(t) p_d(t)q_d(t)r_d(t)]^> ∈_R⁶, (2.37) przy czym ze wzgl ˛edu na konkretne definicje wektora orientacji zada-nej (2.30)-(2.32), elementy wektora pr ˛edko´sci zadanej wzdłu ˙z osi y^B, z^Boraz wokół osi x^B spełniaj ˛a wyra ˙zenie

∀_t_≥₀ v_d(t) =w_d(t) = p_d(t) ≡0, (2.38) które potwierdza zgodny charakter zaprojektowanej trajektorii z no-minalnym ruchem obiektu torpedopodobnego.

Uwaga 2.6 Wyra˙zenie(2.38) jest zgodne z zało˙zeniem o profilowanym, tor-pedopodobnym sposobie poruszania si˛e obiektu referencyjnego. Ze wzgl˛edu na zerowe warto´sci pr˛edko´sci zadanych wzdłu˙z osi y^B i z^B, ruch robota (a tak˙ze powi ˛azana z nim główna składowa sił generowanych przez układ nap˛edowy) powinien by´c realizowany wzdłu˙z osi x^B.

Uwzgl ˛edniaj ˛ac zało ˙zenie 2.7, zgodnie z którym wymagane jest zagwarantowanie niezerowych warto´sci pr ˛edko´sci trajektorii zadanej (równanie (2.33)), mo ˙zemy zapisa´c

tinf≥0|u_d(t)| = u¯_d ≥

m,¯ (2.39)

30 m o d e l o b i e k t u i z a d a n i a s t e r o wa n i a

gwarantuj ˛ac tym samym ustawiczne pobudzenie trajektorii zadanej wzdłu ˙z osi x^B. Znak pr ˛edko´sci zadanej u_d implikuje docelowy kieru-nek ruchu okre´slony przez wprowadzon ˛a w (2.32) zmienn ˛a

ξ_d=sign(u_d(t)). (2.40)

Niedokładno´s´c odtwarzania trajektorii opisana jest przy pomocy wektora uchybu konfiguracji, który dla zadania ´sledzenia trajektorii zdefiniowany został jako

gdzie ep(t) odpowiada uchybowi pozycji, eo(t) uchybowi orienta-cji, natomiast dziedzina bł ˛edu zdefiniowana jest jako Q_et , R³× (−π, π] × (−π, π) ×_R.

2.2.2 ´Scie˙zka referencyjna w postaci nieparametrycznej

Nieparametryczny opis krzywej w przestrzeni trójwymiarowej polega na odpowiednim dobraniu dwóch funkcji s₁(η_p), s₂(η_p):R³ →_{R, dla} których ka ˙zdy punkt η_pnale ˙z ˛acy do docelowej ´scie ˙zki referencyjnej znajduje si ˛e w zbiorze

S_d , {^ηp ∈ D: s₁(η_p) =s₂(η_p) =0}, (2.42) gdzie D jest zbiorem dopuszczalnych pozycji obiektu sterowania.

Postaci poszczególnych wyra ˙ze ´n opisuj ˛acych kształt funkcji s1(_η_p)_, s₂(ηp)powinny spełnia´c wymienione poni ˙zej zało ˙zenia.

Zało˙zenie 2.9 Dla ka˙zdego dopuszczalnego punktu ηp ∈ D, funkcje s_j(ηp) ∈ C³ s ˛a trzykrotnie ró˙zniczkowalnymi funkcjami Lipschitza, dodatkowo ele-menty gradientu j-tej funkcji zdefiniowanego jako∇s_j(_η_p) , [^∂sj/∂x ∂s_j/∂y

∂s_j/∂z]^>s ˛a funkcjami Lipschitza. Poszczególne ograniczenia mo˙zna opisa´c wykorzystuj ˛ac nast˛epuj ˛ace wyra˙zenia

∀_η_p_∈D

2.2 rodzaje sygnałów referencyjnych 31

Zało˙zenie 2.10 Dla ka˙zdego dopuszczalnego punktu ηp ∈ D, gradienty powierzchni s_j(ηp)nie s ˛a współliniowe, czyli

∀_η_p_∈D ∇s₁(_η_p) 6=k∇s₂(_η_p)_{, k}∈_R. _(2.46) W wyniku tego zało˙zenia, k ˛at pomi˛edzy wektorami gradientów poszczegól-nych powierzchni spełnia zale˙zno´s´c

κ(η_p) , ∠(∇^s1(η_p),∇s₂(η_p)) 6=0. (2.47) Poza geometryczn ˛a definicj ˛a referencyjnego zbioru pozycji, do re-alizacji zadania odtwarzania ´scie ˙zki wymagana jest równie ˙z definicja profilu pr ˛edko´sci post ˛epowej wzdłu ˙z wybranej krzywej:

u_d,^ξdU, U = const>0, ξ_d ∈ {−1,+1}, (2.48) gdzie symbol ξ_d, tak jak w przypadku trajektorii zadanej, opisuje strategi ˛e ruchu robota wzdłu ˙z ´scie ˙zki - w tył dla warto´sci ξ_d= −1 i w przód dla ξ_d=1. Niezerowe warto´sci stałej U gwarantuj ˛a ustawiczne pobudzenie struktury sterowania realizuj ˛acej zadanie odtwarzania

´scie ˙zki opisanej w rozdziale3.

Uwaga 2.7 Profil pr˛edko´sci u_d zdefiniowany wzdłu˙z ´scie˙zki referencyjnej S_d przyjmuje w ramach tej pracy warto´sci stałe w celu zapewnienia przej-rzysto´sci prezentowanych tre´sci. W ogólnym przypadku mo˙ze by´c zmienny, zale˙zny na przykład od pozycji η_p, czy innych parametrów.

W celu opisania orientacji zadanej zgodnej z torpedopodobnym charakterem obiektu sterowania, nale ˙zy najpierw zdefiniowa´c wektory jednostkowe prostopadłe do poszczególnej powierzchni sj, to jest

ϑ_j(η_p) =

oraz jednostkowy wektor styczny do obu powierzchni

ϑ⊥(ηp) = Zmienna σ∈ {−1, 1}opisuje kierunek realizacji ruchu wzdłu ˙z ´scie ˙zki.

Dla prostego przykładu ´scie ˙zki w kształcie okr ˛egu, pojazd porusza-j ˛acy si ˛e w przód (ξ_d =1) docelowo powinien realizowa´c ruch prawo-skr ˛etny dla σ=1 i lewoskr ˛etny dla σ = −1. Referencyjna orientacja obiektu sterowania została zdefiniowana w taki sposób, aby o´s x^B była równoległa do jednostkowego wektora stycznego do powierzchni

32 m o d e l o b i e k t u i z a d a n i a s t e r o wa n i a

opisuj ˛acych ´scie ˙zk ˛e referencyjn ˛a ϑ_⊥. Przyj ˛ete postaci zadanych k ˛atów yaw, pitch i roll s ˛a kolejno zdefiniowane jako

ψ_d(ηp) ,^Atan2(ξ_dϑ⊥y(ηp), ξ_dϑ⊥x(ηp)) ∈ [−π, π), (2.51) Zgodnie z uwag ˛a2.5, przez przyj ˛ecie zerowej warto´sci referencyjnego k ˛ata roll, docelowa strategia ruchu robota wzdłu ˙z ´scie ˙zki ma charakter bezprzechyłowy.

Zało˙zenie 2.11 Aby ograniczy´c prawdopodobie ´nstwo przejazdu robota przez osobliwo´s´c opisan ˛a w zało˙zeniu2.1, równie˙z zadany k ˛at pitch powinien speł-nia´c zale˙zno´s´c

∀_t_>₀ θ_d(η_p) 6= ^π

2 +kπ, k∈_Z. (2.55)

Utrzymanie k ˛ata θ_d(η_p)w po˙z ˛adanym przedziale mo˙zna uzyska´c, zakładaj ˛ac

˙ze

m¯ ⊥< k¯ϑ⊥(ηp)k, (2.56)

dla podwektora ¯ϑ⊥(ηp) , [^ϑ⊥xϑ⊥y]^>interpretowanego jako rzut wektora ϑ_⊥(η_p)na płaszczyzn˛e x^Gy^G, oraz dla

m¯_⊥ >0.

Przyj ˛ecie we wzorach (2.51) - (2.53) definicji k ˛atów referencyjnych wyznaczonych z wykorzystaniem elementów jednostkowego wek-tora skierowanego wzdłu ˙z ´scie ˙zki referencyjnej ϑ_⊥ ze wzoru (2.50), pozwala na zapisanie referencyjnych pseudopr ˛edko´sci

∀_t_≥₀ v_d(ηp) =w_d(ηp) = p_d(ep) ≡0, (2.57) które potwierdzaj ˛a torpedopodobny profil pr ˛edko´sci obiektu refe-rencyjnego. W efekcie uwaga2.6 dotyczy obu analizowanych zada ´n ruchu.

Niedokładno´s´c odtwarzania ´scie ˙zki na poziomie kinematycznym jest opisana przy pomocy uchybu

e(_η) = niezerowe warto´sci o ró ˙znych znakach, w zale ˙zno´sci po której stronie

´scie ˙zki jest pojazd.

2.3 zdefiniowanie zada ´n s t e r o wa n i a 33

Definicja 2.4 Zbiory punktów, dla których funkcja sj(η_p), j ∈ {1, 2} przyjmuje takie same warto´sci nazywane b˛ed ˛a powierzchniami poziomi-cowymi.

Pomimo tego, ˙ze punkty nale ˙z ˛ace do danej powierzchni poziomico-wej nie s ˛a w ogólno´sci równoodległe od ´scie ˙zki referencyjnej, stanowi ˛a one pewn ˛a nieeuklidesow ˛a miar ˛e odległo´sci ´srodka układu {B}od zerowej poziomicy funkcji s_j(η_p). Z tego powodu wektor e_p(η_p)mo ˙ze by´c interpretowany jako pewna forma uchybu pozycji. Wektor eo(η) jest zdefiniowanym w sposób konwencjonalny uchybem orientacji.

2.3 z d e f i n i o wa n i e z a d a ´n s t e r o wa n i a

Zadaniem sterowania jest odpowiednie zaprojektowanie sygnałów steruj ˛acych τ(η(t))korzystaj ˛acych wył ˛acznie ze sprz ˛e ˙zenia od wyj´scia (definicja 2.1, zało ˙zenie2.3) i realizuj ˛acych powierzone im zadanie ruchu (´sledzenie trajektorii opisanej wzorem (2.29) lub odtwarza-nie ´scie ˙zki zdefiniowanej w (2.42)) przez obiekt o dynamice (2.7), po-mimo strukturalnych i parametrycznych niepewno´sci modelu obiektu oraz wyst ˛epowania zaburze ´n zewn ˛etrznych opisanych w zało ˙zeniu2.4.

Zadanie ruchu jest poprawnie realizowane, je ˙zeli norma wektora uchybu

e_2π(t) ,

e_p(t) e_o(t)mod 2π

, (2.59)

wyprowadzonego w zale ˙zno´sci od zadania ruchu, na podstawie (2.41) lub (2.58), spełnia wyra ˙zenia

∃_T_∈(_0,_∞₎∀_t_≥_T ke_2π(t)k ≤ε_η (2.60) oraz

∃_T_∈(_0,∞₎∀_t_≥_T ke_p(t)k ≤ε_p (2.61) dla pewnych stałych εp, εη > 0, przy czym ograniczenie εp okre´slaj ˛ace górn ˛a granic ˛e uchybu pozycji dla czasu t > T mo ˙ze by´c dowolnie małe. Operacja mod 2π została wprowadzona we wzorze (2.59) w celu ograniczenia niepo ˙z ˛adanych efektów wynikaj ˛acych z definicji dziedziny bł ˛edu e_ψ,^ψd−ψw zbiorze liczb rzeczywistychR.

Spójne oznaczenie uchybów zdefiniowanych w (2.41) dla zadania

´sledzenia trajektorii oraz w (2.58) dla zadania odtwarzania ´scie ˙zki umo ˙zliwiło wprowadzenie jednakowej definicji zadania sterowania dla obu rozpatrywanych zada ´n ruchu przedstawionej we wzorach (2.60) i (2.61) .

3

K A S K A D O WA S T R U K T U R A U K Ł A D Ó W S T E R O WA N I A I P R AW O S T E R O WA N I A

Rozwi ˛azanie postawionego w poprzednim rozdziale zadania stero-wania zostanie zrealizowane przez zaprojektowanie dwustopniowej, kaskadowej struktury układu sterowania, której schemat pogl ˛adowy przedstawiony został na rysunku 3.1. P ˛etla zewn ˛etrzna, działaj ˛aca na poziomie kinematyki, oparta jest o metodyk ˛eVFOwyprowadzon ˛a dla obiektów o sze´sciu stopniach swobody, przedstawion ˛a w pracach [43–45,57]. Sterownik p ˛etli zewn ˛etrznej przyjmuje na wej´sciu wektor konfiguracji η(t)oraz wektor sygnałów referencyjnych, na podstawie których oblicza wektor pr ˛edko´sci po ˙z ˛adanych νc(t). Wektor sygnałów referencyjnych jest ró ˙zny dla dwóch analizowanych zada ´n ruchu i składa si ˛e z:

- zadanych pozycji η_pd(t), pr ˛edko´sci ˙η_pd(t)i przyspiesze ´n ¨η_pd(t) w przypadku zadania ´sledzenia trajektorii, oraz

- zwarto´sciowanych w bie ˙z ˛acej pozycji pojazdu warto´sci powierzchni poziomicowych s_j(η_p), ich gradientów∇s_j(η_p)oraz Hesjanów ∇(∇^>s_j(ηp)) w zadaniu odtwarzania ´scie ˙zki, dla j∈ {1, 2}.

Działaj ˛aca na poziomie dynamiki wewn ˛etrzna p ˛etla sterowania zo-stała zaprojektowana na podstawie metodyADR, opisanej pierwotnie w pracach [30,87], z wykorzystaniem obserwatora stanu rozszerzo-nego (ESO) zdefiniowanego w dziedzinie uchybu przedstawionego w pracach [49,52,71,88]. Zadaniem sterownika p ˛etli wewn ˛etrznej jest wyznaczenie odpowiedniego sygnału steruj ˛acego τ(_t), na podstawie wektora konfiguracji η(t)oraz wygenerowanego przez sterownik p ˛etli zewn ˛etrznej wektora pr ˛edko´sci po ˙z ˛adanych ν_c(t). Zarówno sterow-nik na poziomie kinematyki oraz sterowsterow-nik na poziomie dynamiki wykorzystuj ˛a do wyznaczenia sygnałów wyj´sciowych wył ˛acznie zmie-rzonych warto´sci elementów wektora η(t). W efekcie, zgodne z za-ło ˙zeniem2.3, sygnał steruj ˛acy jest obliczany wył ˛acznie w oparciu o sprz ˛e ˙zenie od wyj´scia.

� ��

�Generator sygnału referencyjnego

Sygnały

ref. Sterownik pętli zewnętrznej

��

Sterownik pętli wewnętrznej

Obiekt sterowania

Rysunek 3.1: Pogl ˛adowy schemat kaskadowej struktury sterowaniaVFO-ADR

36 k a s k a d o wa s t r u k t u r a u k ł a d ó w s t e r o wa n i a i p r aw o s t e r o wa n i a

3.1 s t e r o w n i k p ˛e t l i w e w n ˛e t r z n e j

Sterownik wewn ˛etrznej p ˛etli sterowania składa si ˛e z dwóch głównych elementów: obserwatora stanu rozszerzonego (ESO) oraz odpornego sterownika dynamicznego opartego o metod ˛eADR, których konfigu-racja została pogl ˛adowo przedstawiona na rysunku 3.2. Zadaniem

Sterownik ESO ADR

Rysunek 3.2: Schemat blokowy wewn ˛etrznej p ˛etli sterowania

obserwatora stanu rozszerzonego jest wyznaczenie estymowanej war-to´sci uchybu pr ˛edko´sci ˆe(t)oraz wektora ˆd(t)okre´slaj ˛acego estymat ˛e wpływu zaburze ´n zewn ˛etrznych, niedokładno´sci pomiarowych oraz niepewno´sci parametrycznych i strukturalnych modelu obiektu na wynikowy ruch pojazdu, na podstawie konfiguracji mierzonej η(t) oraz konfiguracji po ˙z ˛adanej η_c(t)wyznaczonej poprzez odpowiednie przekształcenie i scałkowanie wektora pr ˛edko´sci po ˙z ˛adanych ν_c(t). Sygnały wyj´sciowe obserwatora podawane s ˛a na wej´scie sterownika

ADRi na ich podstawie obliczany jest wektor sygnałów steruj ˛acych τ(t), interpretowany jako wektor sił uogólnionych oddziałuj ˛acych na obiekt sterowania w poszczególnych osiach lokalnego układu współ-rz ˛ednych.

3.1.1 Sterowanie z aktywn ˛a redukcj ˛a zakłóce ´n

Nawi ˛azuj ˛ac do schematu blokowego przedstawionego na rysunku3.2, w równaniach obserwatora wykorzystany zostanie przecałkowany i przemno ˙zony przez macierz J wektor pr ˛edko´sci po ˙z ˛adanych

νc(t) =

wyznaczony przez sterownik p ˛etli zewn ˛etrznej (rysunek3.1). Na pod-stawie definicji wektora ν_c(t)wyra ˙zonego w lokalnym układzie od-niesienia oraz równa ´n kinematyki (2.3), wektor pr ˛edko´sci po ˙z ˛adanych w globalnym układzie odniesienia jest wyra ˙zony równaniem

˙ηc(_t) = J(_η_o(_t))_ν_c(_t)_. _(3.2) Niedokładno´s´c odtwarzania pr ˛edko´sci po ˙z ˛adanych została zdefinio-wana jako wektor

3.1 sterownik p ˛e t l i w e w n ˛e t r z n e j 37

którego dynamika, na podstawie (2.8), przyjmuje posta´c

˙e= ¨η_c− ¨η

= ¨η_c+M_η⁻¹(η_o)^hµ_η(η, ˙η) +τ_η^∗

i−M_η⁻¹(η_o)_Γ_η(η_o)τ_η. (3.4) Z uwagi na zakładan ˛a w zało ˙zeniu2.4niepewno´s´c parametryczn ˛a i strukturaln ˛a modelu obiektu oraz nieznane warto´sci zaburzenia zewn ˛etrznego τ_η^∗, zdefiniujmy wektor zaburzenia całkowitego

d(¨η_c, η, ˙η, τη, τ_η^∗) , ^¨ηc+M_η⁻¹(η_o)^hµη(η, ˙η) +τ_η^∗ i

−M_η⁻¹(ηo)_Γ_η(ηo)τη+ ˆB_η(ηo)_Γ_η(ηo)τη, (3.5) który akumuluje wszelkie niepewno´sci wyst ˛epuj ˛ace w systemie dy-namicznym. Macierz ˆBη(ηo) ∈ _R⁶^×⁶ wyra ˙zona w układzie {G}jest zdefiniowana jako

ˆB_η(_η_o) ,^J(_η_o)ˆBJ^>(_η_o)_, _(3.6) przy czym jej odpowiednik wyra ˙zony w lokalnym układzie odniesie-nia ma posta´c

ˆB ,^diag{ˆb₁, ..., ˆb₆} ∈_R⁶^×⁶. (3.7) Macierze ˆBη(ηo) oraz ˆB s ˛a, odpowiednio, zgrubnie szacowanymi odpowiednikami macierzy M_η⁻¹(η_o)i M⁻¹. Wektor zaburzenia cał-kowitego wynikaj ˛acy z definicji (3.5) składa si ˛e wi ˛ec z pochodnej pr ˛edko´sci po ˙z ˛adanych wyra ˙zonych w układzie globalnym ¨ηc interpre-towanej jako sygnał sprz ˛e ˙zenia wyprzedzaj ˛acego, swobodnej cz ˛e´sci dynamiki (2.8) oraz potencjalnie z wpływu sygnału steruj ˛acego wyni-kaj ˛acego z niedokładno´sci szacowania odwrotnej macierzy mas, gdy ˆB_η(η_o) 6= M_η⁻¹(η_o). W efekcie, na podstawie relacji (2.11) i (3.6) oraz definicji (3.5), dynamik ˛e uchybu odtwarzania pr ˛edko´sci po ˙z ˛adanych, opisanej wzorem (3.4), mo ˙zna przepisa´c jako

˙e=d(¨η_c, η, ˙η, τ_η, τ_η^∗) − ˆB_η(η_o)_Γ_η(η_o)τ_η

(3.6)

= d(¨ηc, η, ˙η, τη, τ_η^∗) −J(ηo)ˆBJ^>(ηo)_Γ_η(ηo)τη (2.11)

= d(¨η_c, η, ˙η, τ_η, τ_η^∗) −J(η_o)_ˆBΓJ^>(η_o)τ_η. (3.8) Uwaga 3.1 W przypadku perfekcyjnej znajomo´sci modelu dynamiki obiektu sterowania, wyra˙zonej wzorem (2.7), macierz M jest dokładnie znana, dla-tego zastosowanie podstawienia ˆB= M⁻¹w definicji zaburzenia całkowitego wyklucza składnik zwi ˛azany z sygnałem steruj ˛acym. W przypadku niepew-no´sci parametrycznej macierzy mas, wyznaczenie dokładnej warto´sci odwrot-nej macierzy mas jest niemo˙zliwe i konieczne jest znalezienie aproksymacji

ˆB≈ M⁻¹, powoduj ˛ac wyst ˛apienie składnika zale˙znego od sygnału steruj ˛a-cego w ramach wektora całkowitego zaburzenia z wzoru (3.5). Odporno´s´c metodyADRCna niedokładno´s´c szacowania odpowiednika macierzy wej´s´c dla systemuSISOzostała szczegółowo przeanalizowana w pracy [20].

38 k a s k a d o wa s t r u k t u r a u k ł a d ó w s t e r o wa n i a i p r aw o s t e r o wa n i a

Zało˙zenie 3.1 Wektor stanu systemu(2.18) składaj ˛acy si˛e z konfiguracji pojazdu η(t) oraz wektora pseudopr˛edko´sci ν(t) znajduje si˛e w pewnym ograniczonym zbiorze zwartym.

Zało˙zenie 3.2 Elementy wektora d(t) ∈ C¹s ˛a ograniczone, przynajmniej jednokrotnie ró˙zniczkowalne oraz s ˛a funkcjami Lipschitza dla wektorów η(t), ν(t)nale˙z ˛acych do pewnego przedziału zwartego. Na podstawie przyj˛etych zało˙ze ´n mo˙zna zapisa´c, ˙ze nierówno´sci

sup

t≥0

kd(t)k ≤R_d (3.9)

sup

t≥0

˙d(t) ≤rd˙ (3.10)

s ˛a spełnione dla pewnych sko ´nczonych R_d, r_d_˙>0 je˙zeli spełnione jest zało˙ze-nie3.1oraz ˆB jest odpowiednio dokładnym przybli˙zeniem macierzy M⁻¹. Uwaga 3.2 Zało˙zenie o ograniczonych warto´sciach elementów wektorów d(t)i ˙d(t), które w ogólno´sci s ˛a zale˙zne od stanu, jest szeroko stosowane w badaniach zwi ˛azanych z projektowaniem sterowników odpornych, na przykład w [64], [66] czy [49], a tak˙ze w analizie odpornego obserwatora opisanego w [34]. Wynik przedstawiony w pracy [82] pokazuje, ˙ze uzyskanie ograniczo-nych warto´sci całkowitego zaburzenia oraz jego pochodnej jest mo˙zliwe wy-ł ˛acznie w przypadku, gdy wektor stanu rozwa˙zanego systemu dynamicznego znajduje si˛e w pewnej ograniczonej przestrzeni zwartej, dlatego konieczne jest wprowadzenie zało˙zenia3.1.

Uwaga 3.3 Rachunek argumentów przeprowadzony dla wektorów d(t) i

˙d(t)został przedstawiony w rozdziale8.4. W efekcie, uwzgl˛edniaj ˛ac zało˙zenia 2.5i3.1, pokazana została zale˙zno´s´c wektora całkowitego zaburzenia oraz jego pochodnej wył ˛acznie od wielko´sci odgórnie ograniczonych w dowolnym sko ´nczonym czasie.

Zakładaj ˛ac mo ˙zliwo´s´c wyznaczenia estymaty całkowitego zabu-rzenia ˆd(t) oraz estymaty uchybu ´sledzenia pr ˛edko´sci po ˙z ˛adanych ˆe(t)(sposób obliczania poszczególnych estymat opisany zostanie w podpunkcie3.1.2), sygnał steruj ˛acy wyra ˙zony w globalnym układzie odniesienia zaprojektowany zgodnie z metodyk ˛aADRw celu stabili-zacji systemu dynamicznego (3.8) w punkcie e=000 przyjmuje posta´c

τη , ^ˆB⁻η¹(ηo)h ˆd+Kη(ηo)ˆei

= J^−>(η_o)ˆB⁻¹J⁻¹(η_o)h ˆd+J(η_o)K J⁻¹(η_o)ˆei

. (3.11)

Macierz wzmocnie ´n sterownika p ˛etli wewn ˛etrznej w globalnym ukła-dzie odniesienia

Kη(ηo) ,^J(ηo)K J⁻¹(ηo) ∈_R⁶^×⁶ (3.12)

3.1 sterownik p ˛e t l i w e w n ˛e t r z n e j 39

jest zdefiniowana przy pomocy jej odpowiednika wyra ˙zonego w ukła-dzie lokalnym

K,diag{k₁, ..., k6} ∈_R⁶^×⁶_, _(3.13) który jest parametrem projektowym opisywanej struktury sterowania.

Korzystaj ˛ac z relacji (2.12) opisuj ˛acej przekształcenie sygnału steru-j ˛acego mi ˛edzy analizowanymi układami, wektor sił i momentów sił wyra ˙zony w lokalnym układzie odniesienia ma posta´c

τ= J^>(η_o)τη

= ˆB⁻¹J⁻¹(η_o)h ˆd+J(η_o)K J⁻¹(η_o)ˆei

. (3.14)

Uwaga 3.4 Wyznaczony w równaniu (3.14) sygnał steruj ˛acy odpowiada siłom i momentom sił, które zostałyby wygenerowane dla pojazdu w pełni dosterowanego. W rzeczywisto´sci, ze wzgl˛edu na mo˙zliwe niedosterowanie obiektu, wygenerowane przez układ nap˛edowy sygnały steruj ˛ace s ˛a mno˙zone przez macierzΓ - zgodnie z równaniami dynamiki obiektu sterowania

wyra-˙zonymi wzorem (2.7). Obecno´s´c macierzyΓ b˛edzie brana pod uwag˛e przy analizie stabilno´sci układu zamkni˛etego.

3.1.2 Obserwator stanu rozszerzonego

Estymaty bł ˛edu odtwarzania pr ˛edko´sci ˆe i całkowitego zaburzenia ˆd wykorzystywane w równaniu sterownika p ˛etli wewn ˛etrznej ze wzoru (3.14) obliczane s ˛a przez sze´s´c równolegle działaj ˛acych obserwatorów stanu rozszerzonego, zaprojektowanych osobno dla ka ˙zdego stopnia swobody, o strukturze opisanej mi ˛edzy innymi w pracach [37, 87].

Wektor stanu rozszerzonego dla i-tego stopnia swobody zdefiniowany jest jako

dla i∈ {1, ..., 6}oraz dla konfiguracji po ˙z ˛adanej wyznaczonej poprzez całkowanie równania (3.2) i wyra ˙zonej jako

ηc(t) = [η_c1(t). . . η_c6(t)]^>,^η(0) +

Z _t

0 J(ηo(ξ))νc(ξ)dξ∈_R⁶. (3.16)

40 k a s k a d o wa s t r u k t u r a u k ł a d ó w s t e r o wa n i a i p r aw o s t e r o wa n i a

Równania stanu opisuj ˛ace dynamik ˛e stanu rozszerzonego mo ˙zna zapisa´c, dla ka ˙zdego ze stopni swobody, w oparciu o definicj ˛e (3.3) oraz równanie (3.8), jak nast ˛epuje



jest wektorem odpowiedzialnym za wycinanie odpowiedniego ele-mentu wektora sygnałów steruj ˛acych, oddziałuj ˛acego na konkretny stopie ´n swobody.

Na podstawie równa ´n (3.17) projektujemy liniowy obserwator stanu rozszerzonego opisany równaniem

˙ˆx_i = _{A ˆx}_i+bζ_iJ(ηo)ˆBΓJ^>(ηo)τη+l_i[x_1i− ˆx_1i], (3.19) gdzie ˆx_i , [^ˆx1i ˆx_2i ˆx_3i]^> ∈_R³ jest estymat ˛a wektora stanu rozszerzo-nego x_i, zdefiniowanego w (3.15), natomiast

l_i = [l_1i l_2i l_3i]^>, [^3ωoi3ω_oi² ω³_oi]^>∈_R³, ω_oi >0 (3.20) jest wektorem wzmocnie ´n obserwatora działaj ˛acego w i-tym stopniu swobody.

Uwaga 3.5 Parametryzacja wzmocnie ´n obserwatora stanu rozszerzonego z

W dokumencie Promotor: dr hab. in ˙z. Maciej Marcin Michałek, prof. PP (Stron 44-57)