• Nie Znaleziono Wyników

W przypadku obiektów o predyspozycjach do ruchu profilowa- profilowa-nego, obiekt jest w pełni dosterowany gdy

Struktura sterowania VFO-ADR

Uwaga 2.4 W przypadku obiektów o predyspozycjach do ruchu profilowa- profilowa-nego, obiekt jest w pełni dosterowany gdy

i∈{u,v,w,p,q,r} 0<

i

ai <1, (2.27)

oraz niedosterowany w przypadku, gdy

i∈{u,v,w,p,q,r}

i

ai =0. (2.28)

Analizowany w ramach tej pracy typ obiektu mo ˙ze nale ˙ze´c zarówno do grupy obiektów w pełni dosterowanych jak i do grupy obiektów niedosterowanych, z uwzgl ˛ednieniem zało ˙zenia 2.6, oraz docelowo powinien realizowa´c ruch profilowany o charakterze torpedopodob-nym. Główny nap ˛ed pojazdu przyło ˙zony jest wzdłu ˙z osi xB (rysunek 2.1) oraz wokół osi xB, yB i zB. Maksymalne warto´sci sił mo ˙zliwych do wygenerowania wzdłu ˙z osi yB i zB s ˛a znacznie mniejsze ni ˙z w osi xB, dlatego nawet je ˙zeli obiekt jest w pełni dosterowany i istnieje mo ˙zliwo´s´c ich wygenerowania, pełni ˛a one wył ˛acznie rol ˛e pomocnicz ˛a zwi ˛azan ˛a z kompensacj ˛a zakłóce ´n i niepo ˙z ˛adanych efektów dynamicz-nych pojawiaj ˛acych si ˛e w trakcie ruchu robota. Zastosowanie układu nap ˛edowego o opisanych własno´sciach kierunkowych jest szczególnie uzasadnione, w przypadku gdy współczynniki tłumienia o´srodka s ˛a znacznie wy ˙zsze wzdłu ˙z osi yB i zB ani ˙zeli wzdłu ˙z osi xB. Ró ˙z-nice warto´sci współczynników tłumienia w poszczególnych osiach s ˛a wynikiem odpowiedniego zaprojektowania konstrukcji mechanicznej robota i mog ˛a by´c regulowane, przykładowo, wykorzystuj ˛ac lotki [18] zwi ˛ekszaj ˛ace powierzchni ˛e przekroju poprzecznego robota oraz ograniczaj ˛ace aerodynamik ˛e pojazdu w odpowiednich kierunkach.

28 m o d e l o b i e k t u i z a d a n i a s t e r o wa n i a

2.2 r o d z a j e s y g na ł ó w r e f e r e n c y j n y c h

Struktura sterowania projektowana w ramach tej pracy dotyczy dwóch klasycznych zada ´n ruchu:

- ´sledzenia trajektorii, czyli pod ˛a ˙zania za punktem ´sci´sle zdefinio-wanym w czasie i przestrzeni oraz

- odtwarzania ´scie ˙zki, czyli poruszaniu si ˛e wzdłu ˙z okre´slonej w przestrzeni krzywej z zadanym profilem pr ˛edko´sci.

2.2.1 Trajektoria zadana

W zadaniu ´sledzenia trajektorii, sparametryzowana czasem konfigura-cja referencyjna jest wyra ˙zona jako wektor

ηd(t) =

gdzie docelowa pozycja w przestrzeni kartezja ´nskiej opisana jest przy pomocy wektora ηpd(t). Poszczególne elementy wektora orientacji zadanej ηod(t), zgodnie z torpedopodobnym charakterem ruchu, zde-finiowane s ˛a w taki sposób aby o´s xB wzdłu ˙z której docelowo genero-wana b ˛edzie główna składowa siły ci ˛agu była styczna do trajektorii, to znaczy trakcie ´sledzenia trajektorii, okre´slonego jako ruch przodem dla ξd =1 oraz ruch tyłem dla ξd = −1. Dziedzina orientacji zadanej ηod(t), na podstawie definicji (2.30)-(2.32), jest zdefiniowana jakoQod, {0} × (−π/2, π/2) × (−π, π].

Uwaga 2.5 Ze wzgl˛edu na stał ˛a, wynosz ˛ac ˛a zero, warto´s´c k ˛ata φd zdefinio-wanego w (2.30), docelowa strategia ruchu ma charakter bezprzechyłowy (ang. non-banked), opisany mi˛edzy innymi w [24]. W efekcie, o´s yB wirtu-alnego pojazdu o konfiguracji ηd(t)jest zawsze równoległa do płaszczyzny xGyG.

Zało˙zenie 2.7 Dla ka˙zdej chwili czasu t0, trajektoria zadana ηpd(t) ∈ C3 jest przynajmniej trzykrotnie ró˙zniczkowaln ˛a funkcj ˛a Lipschitza. Ze wzgl˛edu na potrzeb˛e zagwarantowania ustawicznego pobudzenia struktury

2.2 rodzaje sygnałów referencyjnych 29

sterowania przedstawionej w rozdziale 3, pochodna ˙ηpd(t)powinna przyj-mowa´c niezerowe warto´sci w ka˙zdej chwili czasu. Poszczególne ograniczenia przyjmuj ˛a posta´c

t0

m¯ ≤ ˙ηpd(t) ≤m,¯ (2.33)

t0 0≤max

¨ηpd(t) , ...

ηpd(t)

≤ M,¯ (2.34)

dla pewnych stałych

m,¯ m, ¯¯ M > 0.

Zało˙zenie 2.8 Aby ograniczy´c prawdopodobie ´nstwo przejazdu robota przez osobliwo´s´c opisan ˛a w zało˙zeniu 2.1, równie˙z zadany k ˛at pitch powinien spełnia´c zale˙zno´s´c

t>0 θd(t) 6= π

2 +kπ, kZ. (2.35)

Utrzymanie k ˛ata θd(t)w po˙z ˛adanym przedziale mo˙zna uzyska´c, zakładaj ˛ac

˙ze

m¯ ≤ ˙¯ηpd(t) (2.36)

dla podwektora ˙¯ηpd(t) , [˙xd ˙yd]>interpretowanego jako rzut wektora ˙ηpd(t) na płaszczyzn˛e xGyGoraz dla stałej

m¯ >0.

Wektor zadanych pr ˛edko´sci w lokalnym układzie odniesienia, wy-prowadzony na podstawie równa ´n kinematyki bryły sztywnej o

sze-´sciu stopniach swobody (2.3) ma posta´c νd(t) =J1(ηod(t))˙ηpd(t)

= [ud(t)vd(t)wd(t) pd(t)qd(t)rd(t)]>R6, (2.37) przy czym ze wzgl ˛edu na konkretne definicje wektora orientacji zada-nej (2.30)-(2.32), elementy wektora pr ˛edko´sci zadanej wzdłu ˙z osi yB, zBoraz wokół osi xB spełniaj ˛a wyra ˙zenie

t0 vd(t) =wd(t) = pd(t) ≡0, (2.38) które potwierdza zgodny charakter zaprojektowanej trajektorii z no-minalnym ruchem obiektu torpedopodobnego.

Uwaga 2.6 Wyra˙zenie(2.38) jest zgodne z zało˙zeniem o profilowanym, tor-pedopodobnym sposobie poruszania si˛e obiektu referencyjnego. Ze wzgl˛edu na zerowe warto´sci pr˛edko´sci zadanych wzdłu˙z osi yB i zB, ruch robota (a tak˙ze powi ˛azana z nim główna składowa sił generowanych przez układ nap˛edowy) powinien by´c realizowany wzdłu˙z osi xB.

Uwzgl ˛edniaj ˛ac zało ˙zenie 2.7, zgodnie z którym wymagane jest zagwarantowanie niezerowych warto´sci pr ˛edko´sci trajektorii zadanej (równanie (2.33)), mo ˙zemy zapisa´c

tinf0|ud(t)| = u¯d

m,¯ (2.39)

30 m o d e l o b i e k t u i z a d a n i a s t e r o wa n i a

gwarantuj ˛ac tym samym ustawiczne pobudzenie trajektorii zadanej wzdłu ˙z osi xB. Znak pr ˛edko´sci zadanej ud implikuje docelowy kieru-nek ruchu okre´slony przez wprowadzon ˛a w (2.32) zmienn ˛a

ξd=sign(ud(t)). (2.40)

Niedokładno´s´c odtwarzania trajektorii opisana jest przy pomocy wektora uchybu konfiguracji, który dla zadania ´sledzenia trajektorii zdefiniowany został jako

gdzie ep(t) odpowiada uchybowi pozycji, eo(t) uchybowi orienta-cji, natomiast dziedzina bł ˛edu zdefiniowana jest jako Qet , R3× (−π, π] × (−π, π) ×R.

2.2.2 ´Scie˙zka referencyjna w postaci nieparametrycznej

Nieparametryczny opis krzywej w przestrzeni trójwymiarowej polega na odpowiednim dobraniu dwóch funkcji s1(ηp), s2(ηp):R3R, dla których ka ˙zdy punkt ηpnale ˙z ˛acy do docelowej ´scie ˙zki referencyjnej znajduje si ˛e w zbiorze

Sd , {ηp ∈ D: s1(ηp) =s2(ηp) =0}, (2.42) gdzie D jest zbiorem dopuszczalnych pozycji obiektu sterowania.

Postaci poszczególnych wyra ˙ze ´n opisuj ˛acych kształt funkcji s1(ηp), s2(ηp)powinny spełnia´c wymienione poni ˙zej zało ˙zenia.

Zało˙zenie 2.9 Dla ka˙zdego dopuszczalnego punktu ηp ∈ D, funkcje sj(ηp) ∈ C3 s ˛a trzykrotnie ró˙zniczkowalnymi funkcjami Lipschitza, dodatkowo ele-menty gradientu j-tej funkcji zdefiniowanego jako∇sj(ηp) , [∂sj/∂x ∂sj/∂y

∂sj/∂z]>s ˛a funkcjami Lipschitza. Poszczególne ograniczenia mo˙zna opisa´c wykorzystuj ˛ac nast˛epuj ˛ace wyra˙zenia

ηp∈D

2.2 rodzaje sygnałów referencyjnych 31

Zało˙zenie 2.10 Dla ka˙zdego dopuszczalnego punktu ηp ∈ D, gradienty powierzchni sj(ηp)nie s ˛a współliniowe, czyli

ηp∈D ∇s1(ηp) 6=k∇s2(ηp), kR. (2.46) W wyniku tego zało˙zenia, k ˛at pomi˛edzy wektorami gradientów poszczegól-nych powierzchni spełnia zale˙zno´s´c

κ(ηp) , ∠(∇s1(ηp),∇s2(ηp)) 6=0. (2.47) Poza geometryczn ˛a definicj ˛a referencyjnego zbioru pozycji, do re-alizacji zadania odtwarzania ´scie ˙zki wymagana jest równie ˙z definicja profilu pr ˛edko´sci post ˛epowej wzdłu ˙z wybranej krzywej:

ud,ξdU, U = const>0, ξd ∈ {−1,+1}, (2.48) gdzie symbol ξd, tak jak w przypadku trajektorii zadanej, opisuje strategi ˛e ruchu robota wzdłu ˙z ´scie ˙zki - w tył dla warto´sci ξd= −1 i w przód dla ξd=1. Niezerowe warto´sci stałej U gwarantuj ˛a ustawiczne pobudzenie struktury sterowania realizuj ˛acej zadanie odtwarzania

´scie ˙zki opisanej w rozdziale3.

Uwaga 2.7 Profil pr˛edko´sci ud zdefiniowany wzdłu˙z ´scie˙zki referencyjnej Sd przyjmuje w ramach tej pracy warto´sci stałe w celu zapewnienia przej-rzysto´sci prezentowanych tre´sci. W ogólnym przypadku mo˙ze by´c zmienny, zale˙zny na przykład od pozycji ηp, czy innych parametrów.

W celu opisania orientacji zadanej zgodnej z torpedopodobnym charakterem obiektu sterowania, nale ˙zy najpierw zdefiniowa´c wektory jednostkowe prostopadłe do poszczególnej powierzchni sj, to jest

ϑj(ηp) =

oraz jednostkowy wektor styczny do obu powierzchni

ϑ(ηp) = Zmienna σ∈ {−1, 1}opisuje kierunek realizacji ruchu wzdłu ˙z ´scie ˙zki.

Dla prostego przykładu ´scie ˙zki w kształcie okr ˛egu, pojazd porusza-j ˛acy si ˛e w przód (ξd =1) docelowo powinien realizowa´c ruch prawo-skr ˛etny dla σ=1 i lewoskr ˛etny dla σ = −1. Referencyjna orientacja obiektu sterowania została zdefiniowana w taki sposób, aby o´s xB była równoległa do jednostkowego wektora stycznego do powierzchni

32 m o d e l o b i e k t u i z a d a n i a s t e r o wa n i a

opisuj ˛acych ´scie ˙zk ˛e referencyjn ˛a ϑ. Przyj ˛ete postaci zadanych k ˛atów yaw, pitch i roll s ˛a kolejno zdefiniowane jako

ψd(ηp) ,Atan2(ξdϑy(ηp), ξdϑx(ηp)) ∈ [−π, π), (2.51) Zgodnie z uwag ˛a2.5, przez przyj ˛ecie zerowej warto´sci referencyjnego k ˛ata roll, docelowa strategia ruchu robota wzdłu ˙z ´scie ˙zki ma charakter bezprzechyłowy.

Zało˙zenie 2.11 Aby ograniczy´c prawdopodobie ´nstwo przejazdu robota przez osobliwo´s´c opisan ˛a w zało˙zeniu2.1, równie˙z zadany k ˛at pitch powinien speł-nia´c zale˙zno´s´c

t>0 θd(ηp) 6= π

2 +kπ, kZ. (2.55)

Utrzymanie k ˛ata θd(ηp)w po˙z ˛adanym przedziale mo˙zna uzyska´c, zakładaj ˛ac

˙ze

< k¯ϑ(ηp)k, (2.56)

dla podwektora ¯ϑ(ηp) , [ϑxϑy]>interpretowanego jako rzut wektora ϑ(ηp)na płaszczyzn˛e xGyG, oraz dla

>0.

Przyj ˛ecie we wzorach (2.51) - (2.53) definicji k ˛atów referencyjnych wyznaczonych z wykorzystaniem elementów jednostkowego wek-tora skierowanego wzdłu ˙z ´scie ˙zki referencyjnej ϑ ze wzoru (2.50), pozwala na zapisanie referencyjnych pseudopr ˛edko´sci

t0 vd(ηp) =wd(ηp) = pd(ep) ≡0, (2.57) które potwierdzaj ˛a torpedopodobny profil pr ˛edko´sci obiektu refe-rencyjnego. W efekcie uwaga2.6 dotyczy obu analizowanych zada ´n ruchu.

Niedokładno´s´c odtwarzania ´scie ˙zki na poziomie kinematycznym jest opisana przy pomocy uchybu

e(η) = niezerowe warto´sci o ró ˙znych znakach, w zale ˙zno´sci po której stronie

´scie ˙zki jest pojazd.

2.3 zdefiniowanie zada ´n s t e r o wa n i a 33

Definicja 2.4 Zbiory punktów, dla których funkcja sj(ηp), j ∈ {1, 2} przyjmuje takie same warto´sci nazywane b˛ed ˛a powierzchniami poziomi-cowymi.

Pomimo tego, ˙ze punkty nale ˙z ˛ace do danej powierzchni poziomico-wej nie s ˛a w ogólno´sci równoodległe od ´scie ˙zki referencyjnej, stanowi ˛a one pewn ˛a nieeuklidesow ˛a miar ˛e odległo´sci ´srodka układu {B}od zerowej poziomicy funkcji sj(ηp). Z tego powodu wektor ep(ηp)mo ˙ze by´c interpretowany jako pewna forma uchybu pozycji. Wektor eo(η) jest zdefiniowanym w sposób konwencjonalny uchybem orientacji.

2.3 z d e f i n i o wa n i e z a d a ´n s t e r o wa n i a

Zadaniem sterowania jest odpowiednie zaprojektowanie sygnałów steruj ˛acych τ(η(t))korzystaj ˛acych wył ˛acznie ze sprz ˛e ˙zenia od wyj´scia (definicja 2.1, zało ˙zenie2.3) i realizuj ˛acych powierzone im zadanie ruchu (´sledzenie trajektorii opisanej wzorem (2.29) lub odtwarza-nie ´scie ˙zki zdefiniowanej w (2.42)) przez obiekt o dynamice (2.7), po-mimo strukturalnych i parametrycznych niepewno´sci modelu obiektu oraz wyst ˛epowania zaburze ´n zewn ˛etrznych opisanych w zało ˙zeniu2.4.

Zadanie ruchu jest poprawnie realizowane, je ˙zeli norma wektora uchybu

e(t) ,

"

ep(t) eo(t)mod 2π

#

, (2.59)

wyprowadzonego w zale ˙zno´sci od zadania ruchu, na podstawie (2.41) lub (2.58), spełnia wyra ˙zenia

T∈(0,)tT ke(t)k ≤εη (2.60) oraz

T∈(0,∞)tT kep(t)k ≤εp (2.61) dla pewnych stałych εp, εη > 0, przy czym ograniczenie εp okre´slaj ˛ace górn ˛a granic ˛e uchybu pozycji dla czasu t > T mo ˙ze by´c dowolnie małe. Operacja mod 2π została wprowadzona we wzorze (2.59) w celu ograniczenia niepo ˙z ˛adanych efektów wynikaj ˛acych z definicji dziedziny bł ˛edu eψ,ψdψw zbiorze liczb rzeczywistychR.

Spójne oznaczenie uchybów zdefiniowanych w (2.41) dla zadania

´sledzenia trajektorii oraz w (2.58) dla zadania odtwarzania ´scie ˙zki umo ˙zliwiło wprowadzenie jednakowej definicji zadania sterowania dla obu rozpatrywanych zada ´n ruchu przedstawionej we wzorach (2.60) i (2.61) .

3

K A S K A D O WA S T R U K T U R A U K Ł A D Ó W S T E R O WA N I A I P R AW O S T E R O WA N I A

Rozwi ˛azanie postawionego w poprzednim rozdziale zadania stero-wania zostanie zrealizowane przez zaprojektowanie dwustopniowej, kaskadowej struktury układu sterowania, której schemat pogl ˛adowy przedstawiony został na rysunku 3.1. P ˛etla zewn ˛etrzna, działaj ˛aca na poziomie kinematyki, oparta jest o metodyk ˛eVFOwyprowadzon ˛a dla obiektów o sze´sciu stopniach swobody, przedstawion ˛a w pracach [43–45,57]. Sterownik p ˛etli zewn ˛etrznej przyjmuje na wej´sciu wektor konfiguracji η(t)oraz wektor sygnałów referencyjnych, na podstawie których oblicza wektor pr ˛edko´sci po ˙z ˛adanych νc(t). Wektor sygnałów referencyjnych jest ró ˙zny dla dwóch analizowanych zada ´n ruchu i składa si ˛e z:

- zadanych pozycji ηpd(t), pr ˛edko´sci ˙ηpd(t)i przyspiesze ´n ¨ηpd(t) w przypadku zadania ´sledzenia trajektorii, oraz

- zwarto´sciowanych w bie ˙z ˛acej pozycji pojazdu warto´sci powierzchni poziomicowych sj(ηp), ich gradientów∇sj(ηp)oraz Hesjanów ∇(∇>sj(ηp)) w zadaniu odtwarzania ´scie ˙zki, dla j∈ {1, 2}.

Działaj ˛aca na poziomie dynamiki wewn ˛etrzna p ˛etla sterowania zo-stała zaprojektowana na podstawie metodyADR, opisanej pierwotnie w pracach [30,87], z wykorzystaniem obserwatora stanu rozszerzo-nego (ESO) zdefiniowanego w dziedzinie uchybu przedstawionego w pracach [49,52,71,88]. Zadaniem sterownika p ˛etli wewn ˛etrznej jest wyznaczenie odpowiedniego sygnału steruj ˛acego τ(t), na podstawie wektora konfiguracji η(t)oraz wygenerowanego przez sterownik p ˛etli zewn ˛etrznej wektora pr ˛edko´sci po ˙z ˛adanych νc(t). Zarówno sterow-nik na poziomie kinematyki oraz sterowsterow-nik na poziomie dynamiki wykorzystuj ˛a do wyznaczenia sygnałów wyj´sciowych wył ˛acznie zmie-rzonych warto´sci elementów wektora η(t). W efekcie, zgodne z za-ło ˙zeniem2.3, sygnał steruj ˛acy jest obliczany wył ˛acznie w oparciu o sprz ˛e ˙zenie od wyj´scia.

Generator sygnału referencyjnego

Sygnały

ref. Sterownik pętli zewnętrznej

Sterownik pętli wewnętrznej

Obiekt sterowania

Rysunek 3.1: Pogl ˛adowy schemat kaskadowej struktury sterowaniaVFO-ADR

35

36 k a s k a d o wa s t r u k t u r a u k ł a d ó w s t e r o wa n i a i p r aw o s t e r o wa n i a

3.1 s t e r o w n i k p ˛e t l i w e w n ˛e t r z n e j

Sterownik wewn ˛etrznej p ˛etli sterowania składa si ˛e z dwóch głównych elementów: obserwatora stanu rozszerzonego (ESO) oraz odpornego sterownika dynamicznego opartego o metod ˛eADR, których konfigu-racja została pogl ˛adowo przedstawiona na rysunku 3.2. Zadaniem

Sterownik ESO ADR

Rysunek 3.2: Schemat blokowy wewn ˛etrznej p ˛etli sterowania

obserwatora stanu rozszerzonego jest wyznaczenie estymowanej war-to´sci uchybu pr ˛edko´sci ˆe(t)oraz wektora ˆd(t)okre´slaj ˛acego estymat ˛e wpływu zaburze ´n zewn ˛etrznych, niedokładno´sci pomiarowych oraz niepewno´sci parametrycznych i strukturalnych modelu obiektu na wynikowy ruch pojazdu, na podstawie konfiguracji mierzonej η(t) oraz konfiguracji po ˙z ˛adanej ηc(t)wyznaczonej poprzez odpowiednie przekształcenie i scałkowanie wektora pr ˛edko´sci po ˙z ˛adanych νc(t). Sygnały wyj´sciowe obserwatora podawane s ˛a na wej´scie sterownika

ADRi na ich podstawie obliczany jest wektor sygnałów steruj ˛acych τ(t), interpretowany jako wektor sił uogólnionych oddziałuj ˛acych na obiekt sterowania w poszczególnych osiach lokalnego układu współ-rz ˛ednych.

3.1.1 Sterowanie z aktywn ˛a redukcj ˛a zakłóce ´n

Nawi ˛azuj ˛ac do schematu blokowego przedstawionego na rysunku3.2, w równaniach obserwatora wykorzystany zostanie przecałkowany i przemno ˙zony przez macierz J wektor pr ˛edko´sci po ˙z ˛adanych

νc(t) =

wyznaczony przez sterownik p ˛etli zewn ˛etrznej (rysunek3.1). Na pod-stawie definicji wektora νc(t)wyra ˙zonego w lokalnym układzie od-niesienia oraz równa ´n kinematyki (2.3), wektor pr ˛edko´sci po ˙z ˛adanych w globalnym układzie odniesienia jest wyra ˙zony równaniem

˙ηc(t) = J(ηo(t))νc(t). (3.2) Niedokładno´s´c odtwarzania pr ˛edko´sci po ˙z ˛adanych została zdefinio-wana jako wektor

3.1 sterownik p ˛e t l i w e w n ˛e t r z n e j 37

którego dynamika, na podstawie (2.8), przyjmuje posta´c

˙e= ¨ηc¨η

= ¨ηc+Mη1(ηo)hµη(η, ˙η) +τη

i−Mη1(ηo)Γη(ηo)τη. (3.4) Z uwagi na zakładan ˛a w zało ˙zeniu2.4niepewno´s´c parametryczn ˛a i strukturaln ˛a modelu obiektu oraz nieznane warto´sci zaburzenia zewn ˛etrznego τη, zdefiniujmy wektor zaburzenia całkowitego

d(¨ηc, η, ˙η, τη, τη) , ¨ηc+Mη1(ηo)hµη(η, ˙η) +τη i

Mη1(ηo)Γη(ηo)τη+ ˆBη(ηo)Γη(ηo)τη, (3.5) który akumuluje wszelkie niepewno´sci wyst ˛epuj ˛ace w systemie dy-namicznym. Macierz ˆBη(ηo) ∈ R6×6 wyra ˙zona w układzie {G}jest zdefiniowana jako

ˆBη(ηo) ,J(ηo)ˆBJ>(ηo), (3.6) przy czym jej odpowiednik wyra ˙zony w lokalnym układzie odniesie-nia ma posta´c

ˆB ,diag{ˆb1, ..., ˆb6} ∈R6×6. (3.7) Macierze ˆBη(ηo) oraz ˆB s ˛a, odpowiednio, zgrubnie szacowanymi odpowiednikami macierzy Mη1(ηo)i M1. Wektor zaburzenia cał-kowitego wynikaj ˛acy z definicji (3.5) składa si ˛e wi ˛ec z pochodnej pr ˛edko´sci po ˙z ˛adanych wyra ˙zonych w układzie globalnym ¨ηc interpre-towanej jako sygnał sprz ˛e ˙zenia wyprzedzaj ˛acego, swobodnej cz ˛e´sci dynamiki (2.8) oraz potencjalnie z wpływu sygnału steruj ˛acego wyni-kaj ˛acego z niedokładno´sci szacowania odwrotnej macierzy mas, gdy ˆBη(ηo) 6= Mη1(ηo). W efekcie, na podstawie relacji (2.11) i (3.6) oraz definicji (3.5), dynamik ˛e uchybu odtwarzania pr ˛edko´sci po ˙z ˛adanych, opisanej wzorem (3.4), mo ˙zna przepisa´c jako

˙e=d(¨ηc, η, ˙η, τη, τη) − ˆBη(ηo)Γη(ηo)τη

(3.6)

= d(¨ηc, η, ˙η, τη, τη) −J(ηo)ˆBJ>(ηo)Γη(ηo)τη (2.11)

= d(¨ηc, η, ˙η, τη, τη) −J(ηo)ˆBΓJ>(ηo)τη. (3.8) Uwaga 3.1 W przypadku perfekcyjnej znajomo´sci modelu dynamiki obiektu sterowania, wyra˙zonej wzorem (2.7), macierz M jest dokładnie znana, dla-tego zastosowanie podstawienia ˆB= M1w definicji zaburzenia całkowitego wyklucza składnik zwi ˛azany z sygnałem steruj ˛acym. W przypadku niepew-no´sci parametrycznej macierzy mas, wyznaczenie dokładnej warto´sci odwrot-nej macierzy mas jest niemo˙zliwe i konieczne jest znalezienie aproksymacji

ˆBM1, powoduj ˛ac wyst ˛apienie składnika zale˙znego od sygnału steruj ˛a-cego w ramach wektora całkowitego zaburzenia z wzoru (3.5). Odporno´s´c metodyADRCna niedokładno´s´c szacowania odpowiednika macierzy wej´s´c dla systemuSISOzostała szczegółowo przeanalizowana w pracy [20].

38 k a s k a d o wa s t r u k t u r a u k ł a d ó w s t e r o wa n i a i p r aw o s t e r o wa n i a

Zało˙zenie 3.1 Wektor stanu systemu(2.18) składaj ˛acy si˛e z konfiguracji pojazdu η(t) oraz wektora pseudopr˛edko´sci ν(t) znajduje si˛e w pewnym ograniczonym zbiorze zwartym.

Zało˙zenie 3.2 Elementy wektora d(t) ∈ C1s ˛a ograniczone, przynajmniej jednokrotnie ró˙zniczkowalne oraz s ˛a funkcjami Lipschitza dla wektorów η(t), ν(t)nale˙z ˛acych do pewnego przedziału zwartego. Na podstawie przyj˛etych zało˙ze ´n mo˙zna zapisa´c, ˙ze nierówno´sci

sup

t0

kd(t)k ≤Rd (3.9)

sup

t0

˙d(t) ≤rd˙ (3.10)

s ˛a spełnione dla pewnych sko ´nczonych Rd, rd˙>0 je˙zeli spełnione jest zało˙ze-nie3.1oraz ˆB jest odpowiednio dokładnym przybli˙zeniem macierzy M1. Uwaga 3.2 Zało˙zenie o ograniczonych warto´sciach elementów wektorów d(t)i ˙d(t), które w ogólno´sci s ˛a zale˙zne od stanu, jest szeroko stosowane w badaniach zwi ˛azanych z projektowaniem sterowników odpornych, na przykład w [64], [66] czy [49], a tak˙ze w analizie odpornego obserwatora opisanego w [34]. Wynik przedstawiony w pracy [82] pokazuje, ˙ze uzyskanie ograniczo-nych warto´sci całkowitego zaburzenia oraz jego pochodnej jest mo˙zliwe wy-ł ˛acznie w przypadku, gdy wektor stanu rozwa˙zanego systemu dynamicznego znajduje si˛e w pewnej ograniczonej przestrzeni zwartej, dlatego konieczne jest wprowadzenie zało˙zenia3.1.

Uwaga 3.3 Rachunek argumentów przeprowadzony dla wektorów d(t) i

˙d(t)został przedstawiony w rozdziale8.4. W efekcie, uwzgl˛edniaj ˛ac zało˙zenia 2.5i3.1, pokazana została zale˙zno´s´c wektora całkowitego zaburzenia oraz jego pochodnej wył ˛acznie od wielko´sci odgórnie ograniczonych w dowolnym sko ´nczonym czasie.

Zakładaj ˛ac mo ˙zliwo´s´c wyznaczenia estymaty całkowitego zabu-rzenia ˆd(t) oraz estymaty uchybu ´sledzenia pr ˛edko´sci po ˙z ˛adanych ˆe(t)(sposób obliczania poszczególnych estymat opisany zostanie w podpunkcie3.1.2), sygnał steruj ˛acy wyra ˙zony w globalnym układzie odniesienia zaprojektowany zgodnie z metodyk ˛aADRw celu stabili-zacji systemu dynamicznego (3.8) w punkcie e=000 przyjmuje posta´c

τη , ˆBη1(ηo)h ˆd+Kη(ηo)ˆei

= J−>(ηo)ˆB1J1(ηo)h ˆd+J(ηo)K J1(ηo)ˆei

. (3.11)

Macierz wzmocnie ´n sterownika p ˛etli wewn ˛etrznej w globalnym ukła-dzie odniesienia

Kη(ηo) ,J(ηo)K J1(ηo) ∈R6×6 (3.12)

3.1 sterownik p ˛e t l i w e w n ˛e t r z n e j 39

jest zdefiniowana przy pomocy jej odpowiednika wyra ˙zonego w ukła-dzie lokalnym

K,diag{k1, ..., k6} ∈R6×6, (3.13) który jest parametrem projektowym opisywanej struktury sterowania.

Korzystaj ˛ac z relacji (2.12) opisuj ˛acej przekształcenie sygnału steru-j ˛acego mi ˛edzy analizowanymi układami, wektor sił i momentów sił wyra ˙zony w lokalnym układzie odniesienia ma posta´c

τ= J>(ηo)τη

= ˆB1J1(ηo)h ˆd+J(ηo)K J1(ηo)ˆei

. (3.14)

Uwaga 3.4 Wyznaczony w równaniu (3.14) sygnał steruj ˛acy odpowiada siłom i momentom sił, które zostałyby wygenerowane dla pojazdu w pełni dosterowanego. W rzeczywisto´sci, ze wzgl˛edu na mo˙zliwe niedosterowanie obiektu, wygenerowane przez układ nap˛edowy sygnały steruj ˛ace s ˛a mno˙zone przez macierzΓ - zgodnie z równaniami dynamiki obiektu sterowania

wyra-˙zonymi wzorem (2.7). Obecno´s´c macierzyΓ b˛edzie brana pod uwag˛e przy analizie stabilno´sci układu zamkni˛etego.

3.1.2 Obserwator stanu rozszerzonego

Estymaty bł ˛edu odtwarzania pr ˛edko´sci ˆe i całkowitego zaburzenia ˆd wykorzystywane w równaniu sterownika p ˛etli wewn ˛etrznej ze wzoru (3.14) obliczane s ˛a przez sze´s´c równolegle działaj ˛acych obserwatorów stanu rozszerzonego, zaprojektowanych osobno dla ka ˙zdego stopnia swobody, o strukturze opisanej mi ˛edzy innymi w pracach [37, 87].

Wektor stanu rozszerzonego dla i-tego stopnia swobody zdefiniowany jest jako

dla i∈ {1, ..., 6}oraz dla konfiguracji po ˙z ˛adanej wyznaczonej poprzez całkowanie równania (3.2) i wyra ˙zonej jako

ηc(t) = [ηc1(t). . . ηc6(t)]>,η(0) +

Z t

0 J(ηo(ξ))νc(ξ)R6. (3.16)

40 k a s k a d o wa s t r u k t u r a u k ł a d ó w s t e r o wa n i a i p r aw o s t e r o wa n i a

Równania stanu opisuj ˛ace dynamik ˛e stanu rozszerzonego mo ˙zna zapisa´c, dla ka ˙zdego ze stopni swobody, w oparciu o definicj ˛e (3.3) oraz równanie (3.8), jak nast ˛epuje

jest wektorem odpowiedzialnym za wycinanie odpowiedniego ele-mentu wektora sygnałów steruj ˛acych, oddziałuj ˛acego na konkretny stopie ´n swobody.

Na podstawie równa ´n (3.17) projektujemy liniowy obserwator stanu rozszerzonego opisany równaniem

˙ˆxi = A ˆxi+iJ(ηo)ˆBΓJ>(ηo)τη+li[x1i− ˆx1i], (3.19) gdzie ˆxi , [ˆx1i ˆx2i ˆx3i]>R3 jest estymat ˛a wektora stanu rozszerzo-nego xi, zdefiniowanego w (3.15), natomiast

li = [l1i l2i l3i]>, [oioi2 ω3oi]>R3, ωoi >0 (3.20) jest wektorem wzmocnie ´n obserwatora działaj ˛acego w i-tym stopniu swobody.

Uwaga 3.5 Parametryzacja wzmocnie ´n obserwatora stanu rozszerzonego z

Powiązane dokumenty