STEROWANIE BEHAWIORALNE RUCHEM MOBILNEGO ROBOTA KOŁOWEGO Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ ROZMYTĄ

(1)

STEROWANIE BEHAWIORALNE RUCHEM MOBILNEGO ROBOTA KOŁOWEGO

Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ ROZMYTĄ

Marcin Szuster

^1a

1Katedra Mechaniki Stosowanej i Robotyki, Politechnika Rzeszowska

amszuster@prz.edu.pl

Streszczenie

W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego Pionier 2-DX w nieznanym środowisku ze statycznymi przeszkodami. Układ sterowania składa się z dwóch warstw: warstwy planowania trajektorii i warstwy realizacji ruchu. Zadaniem warstwy planowania trajektorii jest generowanie pa- rametrów ruchu kół robota w czasie rzeczywistym na podstawie sygnałów z układu sensorycznego. W warstwie tej zastosowano koncepcję sterowania behawioralnego, zrealizowanego z zastosowaniem układów z logiką rozmytą.

Warstwa realizacji ruchu generuje sygnały sterowania modułami napędowymi robota, w warstwie tej zastosowano algorytmy aproksymacyjnego programowania dynamicznego. Weryfikację algorytmu sterowania przeprowadzono z zastosowaniem robota Pioneer 2-DX, wyposażonego w skaner laserowy przestrzeni.

Słowa kluczowe: aproksymacyjne programowanie dynamiczne, mobilny robot kołowy, sterowanie behawioralne, sterowanie nadążne, układy z logiką rozmytą

BEHAVIOURAL CONTROL OF THE WHEELED MOBILE ROBOT USING FUZZY LOGIC SYSTEMS

Summary

In the article a hierarchical control system of the Wheeled Mobile Robot Pioneer 2-DX movement in the un- known environment with static obstacles is presented. The control system consists of two layers: the path planning layer and the tracking control layer. On the basis of the sensory system signals the path planning layer generates the desired trajectory in real time. In this layer of the hierarchical control system, the conception of behavioural control was used. It was realised using Fuzzy Logic systems. The tracking control system is the lower layer of the hierarchical control system. It generates control signals for the WMR’s motors and is realised using Ap- proximate Dynamic Programming algorithms. Using the WMR Pioneer 2-DX verification of the proposed hierarchical control system was performed. The WMR was equipped with the scanning laser range finder for obstacles detection.

Keywords: approximate dynamic programming, wheeled mobile robot, behavioral control, tracking control, fuzzy logic system

1. WSTĘP

Rozwój robotyki mobilnej, który nastąpił w ciągu ostatnich lat, znacznie poszerzył obszar jej zastosowań.

Jednocześnie możliwa stała się realizacja bardziej skom- plikowanych zadań, co pociągnęło za sobą konieczność zastosowania złożonych algorytmów sterowania robotów

mobilnych. Jednakże nadal jednym z najistotniejszych problemów pozostaje generowanie w czasie rzeczywistym bezkolizyjnych trajektorii ruchu mobilnych robotów kołowych i ich realizacja. W literaturze problem ten jest często poruszany, co świadczy o jego aktualności i braku

(2)

uniwersalnych rozwiązań sprawdzających się we wszyst- kich warunkach.

Istnieje wiele różnych metod planowania trajektorii ruchu mobilnych robotów kołowych (WMR, ang. Whe- eled Mobile Robot) [1,2,3,4,7,11,12], wśród których można wyróżnić dwie główne grupy: metody lokale i globalne. W metodach globalnych proces planowania trajektorii ruchu WMR odbywa się off-line, metody te bazują na znajomości mapy otoczenia robota. W metodach lokalnych algorytm nawigacji wyznacza trajektorię ruchu, korzystając jedynie z informacji o odległości do przeszkód w bezpośrednim otoczeniu robota, dostarcza- nej przez układ sensoryczny. Metody lokalne mogą być stosowane do generowania trajektorii ruchu w czasie rzeczywistym, nadają się do nawigacji robota w nieznanym środowisku. Kolejnym problemem dotyczącym aplikacji robotów mobilnych jest opis ich dynamiki z zastosowaniem nieliniowych, dynamicznych równań ruchu, w których niektóre parametry mogą być nieznane lub zmieniać się w czasie ruchu robota. Powoduje to konieczność stosowania algorytmów, których parametry mogą adaptować się do zmieniających się warunków pracy obiektu sterowania. Obecnie coraz chętniej stosuje się nowoczesne metody sztucznej inteligencji (AI, ang.

Artificial Intelligence), takie jak sztuczne sieci neurono- we (NN, ang. Neural Networks) czy algorytmy z logiką rozmytą (FL, ang. Fuzzy Logic), w układach sterowania ruchem nadążnym WMR, czy algorytmach generowania trajektorii ruchu [2,3,7,12]. W ostatnich latach można również zaobserwować znaczący wzrost zainteresowania algorytmami aproksymacyjnego programowania dyna- micznego (ADP, ang. Approximate Dynamic Program- ming) [13,14,15], których idea wywodzi się z programo- wania dynamicznego Bellmana, a zastosowanie NN umożliwia aplikacje w sterowaniu w czasie rzeczywistym [12,14].

W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego Pioneer 2-DX. Algorytm sterowania składa się z dwóch warstw.

Pierwsza z nich, nadrzędna, to warstwa generowania bezkolizyjnych trajektorii ruchu WMR w nieznanym środowisku 2D ze statycznymi przeszkodami, w której zastosowano koncepcję sterowania behawioralnego. Idea sterowania behawioralnego wynika z obserwacji świata organizmów żywych i odwzorowania ich elementarnych zachowań typu „podążaj do celu” (GS, ang. Goal Seeking), czy „omijaj przeszkody” (OA, ang. Obstacle Avoiding) przez robot mobilny. Algorytmy te są zalicza- ne do grupy metod lokalnych, w których proces generowania trajektorii ruchu bazuje na sygnałach z układu sensorycznego WMR Pioneer 2-DX, który w prezentowanym artykule składał się ze skanera laserowego przestrzeni Hokuyo UBG-04LX-F01. W warstwie planowania trajektorii ruchu zastosowano algorytmy FL do generowania sterowań behawioralnych w zadaniach typu

GS i OA oraz dodatkowy algorytm FL do miękkiego przełączania realizacji poszczególnych zadań w zależno- ści od warunków środowiska. Takie podejście umożliwia generowanie bezkolizyjnych trajektorii ruchu w zadaniu typu „podążaj do celu z omijaniem przeszkód” (GSOA, ang. Goal Seeking with Obstacle Avoiding). Realizacja takiego zadania w większości przypadków nie jest moż- liwa, gdy stosuje się jeden z typów sterowań behawioralnych GS lub OA. W literaturze można spotkać rozwią- zania umożliwiające generowanie trajektorii ruchu w zadaniu typu GSOA, w których udział poszczególnych sterowań behawioralnych typu GS i OA jest stały, ustalony w sposób heurystyczny przez autora opracowa- nia. W prezentowanym algorytmie nawigacji udział ten zmienia się w czasie ruchu WMR w zależności od odle- głości do celu i przeszkód znajdujących się w otoczeniu robota. Drugą warstwę hierarchicznego układu sterowania stanowi algorytm sterowania ruchem nadążnym WMR, który generuje sygnały sterowania modułami napędowymi zapewniające realizację trajektorii ruchu wygenerowanej przez warstwę nadrzędną. W warstwie realizacji ruchu zastosowano algorytmy ADP w konfiguracji Dualnego Heurystycznego Programowania Dyna- micznego (DHP, ang. Dual-Heuristic Dynamic Pro- gramming), zrealizowane w formie struktur aktor- krytyk, w których zastosowano NN Random Vector Functional Link (RVFL).

Wyniki badań prezentowane w artykule są kontynu- acją prac autora, związanych z algorytmami planowania trajektorii ruchu [9,10] oraz sterowania ruchem nadąż- nym WMR [8]. Artykuł składa się z następujących części: w części pierwszej zawarto wprowadzenie w tematykę artykułu, część druga zawiera opis obiektu sterowania, w części trzeciej przedstawiono hierarchiczny układ sterowania WMR, w części czwartej zaprezentowano budowę stanowiska laboratoryjnego zastosowanego w badaniach. W części piątej przedstawiono wyniki badań weryfikacyjnych algorytmu, część ostatnia pod- sumowuje artykuł.

2. MOBILNY ROBOT KOŁOWY PIONEER 2-DX

Obiektem sterowania jest mobilny robot dwukołowy, z trzecim kołem samonastawnym, Pioneer 2-DX. Ruch WMR jest analizowany w płaszczyźnie xy. WMR Pione- er 2-DX przedstawiono na rys. 1.a), jego schemat w torze pomiarowym ze statycznymi przeszkodami przedstawiono na rys. 1.b). WMR składa się z ramy 4, dwóch kół napędzających 1 i 2 oraz koła samonastawne- go 3. Jest to obiekt nieholonomiczny, którego dynamika jest opisana nieliniowymi równaniami ruchu. Zadaniem algorytmu sterowania jest wygenerowanie bezkolizyjnej trajektorii ruchu WMR do celu G( , ), znajdującego się w odległości od punktu A( , ) ramy robota, z którym związano ruchomy układ współrzędnych x1y1,

(3)

gdzie: - kąt pomiędzy prostą pG a osią x, - kąt obrotu ramy WMR, - kąt pomiędzy prostą pG a osią x1 ruchomego układu współrzędnych, , , - odległości do przeszkód zmierzone przez skaner laserowy przed WMR, po prawej i lewej stronie ramy robota, , , - kąty pomiędzy osią i-tego pomiaru i osią ramy WMR, i=1,2,3, - sygnał sterujący j-tego koła, j=1,2, - prędkość kątowa j-tego koła.

Rys. 1 a) Robot Pioneer 2-DX, b) schemat robota mobilnego w laboratoryjnym torze pomiarowym

Dynamika WMR Pioneer 2-DX została zamodelowa- na z zastosowaniem formalizmu Maggiego [5,6]. Model ciągły dynamiki WMR został zdyskretyzowany z zastosowaniem metody Eulera. Przyjęto wektor stanu

, , w którym wektor

, odpowiada wektorowi prędkości kątowych w zapisie ciągłym. Dyskretny model dynamiki WMR przyjęto w postaci układu równań

! " ,

# "$^% &' ( ! )' (

#"$^% *₊ # , ,

(1) gdzie k – indeks kroków iteracji, h – parametr dyskrety- zacji czasu, M – dodatnio określona macierz bezwładno- ści WMR Pioneer 2-DX, – wektor kątów obrotu kół napędzających, &' ( – wektor momentów od

sił odśrodkowych i Coriolis’a, )' ( – wektor oporów ruchu, *₊ – wektor zakłóceń o ograniczonych warto- ściach, , – wektor sygnałów sterowania.

Wyznaczono dyskretne błędy nadążania

- # ₊ ,

- # ₊ , (2)

gdzie ₊ - wektor zadanych kątów obrotu kół, ₊ - wektor zadanych prędkości kątowych, generowany przez warstwę planowania trajektorii w czasie ruchu WMR.

Na podstawie błędów (2) zdefiniowano uogólniony błąd nadążania

. - !Λ- , (3)

gdzie Λ - stała macierz diagonalna o dodatnich współ- czynnikach.

Na podstawie modelu dynamiki WMR oraz definicji błędów nadążania (2) i (3) wyznaczono wartość uogól- nionego błędu nadążania WMR w kroku k+1

. #/0' ( ! /+' , ₊ , ₊₁ ( !

#/₂ ! "$^% , (4) gdzie

/0' ( "$^% &' ( ! )' ( , /+' , + , +1 ( . ! /3' , + , +1 (,

/3' , ₊ , ₊₁ ( "Λ- # ₊₁ , /₂ "$^% *₊ ,

(5) gdzie /0' ( – wektor zawierający wszystkie nielinio- wości modelu WMR, ₊₁ – wektor zawierający zadane wartości przyspieszeń kątowych kół napędzających, jego obecność wynika z zapisu wektora ₊ w kroku k- tym z zastosowaniem metody Eulera.

3. HIERARCHICZNY UKŁAD STEROWANIA

Hierarchiczny układ sterowania ruchem WMR skła- da się z dwóch warstw: warstwy generowania bezkolizyjnej trajektorii ruchu WMR, zrealizowanej z zastosowaniem algorytmów FL, oraz warstwy realizacji ruchu, zrealizowanej z zastosowaniem algorytmu DHP.

3.1 WARSTWA GENEROWANIA TRAJEKTORII RUCHU

Koncepcja sterowania behawioralnego opiera się na próbie odwzorowania elementarnych zachowań organi- zmów żywych przez roboty mobilne. Przykładami takich zachowań są zadania typu GS i OA. Pierwsze z nich polega na generowaniu i realizacji trajektorii ruchu o torze z położenia początkowego, do celu wyznaczonego we współrzędnych mapy, przy czym nie jest istotna

(4)

informacja o lokalizacji przeszkód w otoczeniu robota.

W drugim z zachowań elementarnych generowana jest bezkolizyjna trajektoria ruchu, jednak nie jest możliwe zdefiniowanie celu. W zadaniu tym istotna jest informacja z układu sensorycznego robota o odległościach do przeszkód. Jednak w robotyce mobilnej najczęściej spotykane jest zadanie typu GSOA, które jest połącze- niem zadań typu GS i OA. Polega ono na wygenerowa- niu i realizacji bezkolizyjnej trajektorii ruchu robota do wyznaczonego celu z ominięciem statycznych przeszkód.

W proponowanym algorytmie sterowania warstwę planowania trajektorii ruchu zrealizowano z zastosowaniem układów FL. Składa się ona z trzech struktur sterowania, z których pierwsza generuje sygnały sterowania behawioralnego w zadaniu typu GS , 4 5 , ₆₇ 8 , druga struktura warstwy planowania trajektorii generuje sygnały sterowania behawioralnego w zadaniu typu OA, ,9

4 ₉₅ , ₉₆₇ 8 . Trzeci element warstwy generowania trajektorii, zrealizowany z zastosowaniem układu FL, generuje sygnał :_; służący do miękkiego przełączania między realizacją sterowań behawioralnych zadań typu GS i OA, na podstawie informcji o odległości do celu oraz odległości do przeszkód, zgodnie z zależnością

, :_; , ! '1 # :_; (,9 , (6) gdzie , 4 ₅ , ₆₇ 8 – całkowite sygnały sterowania warstwy generowania trajektorii, ₅ - sygnał sterujący zadaną prędkością ruchu punktu A ramy WMR, ₆₇ - sygnał sterujący zadaną prędko- ścią kątową obrotu ramy WMR 7 . Na podstawie tych sygnałów są generowane zadane prędkości kątowe obrotu kół napędzających WMR zgodnie z zależnością

= ⁺

+ > _?@A^B 7^B

A^B # 7^B C = ⁵

67 >, (7) gdzie r, l1 – wymiary wynikające z geometrii WMR, A^B - zdefiniowana maksymalna prędkość punktu A, 7^B - maksymalna prędkość kątowa obrotu ramy WMR.

Układ FL generujący sygnał :; , który zmienia udziął poszczególnych sterowań behawioralnych w całkowitych sygnałach sterowania warstwy generowania bezkolizyjnych trajektorii ruchu, został zealizowany na podstawie modelu Mamdaniego, z trójkątnymi lub trapezowymi funkcjami przynależności do zbiorów rozmytych przesłanek i konkluzji. Posiada on bazę m=25 reguł typu

D^E: JEŻELI ' ^B JEST NO( I ' ₉^B JEST PQ(

TO :; JEST :S, (8) gdzie ^B /EU - znormalizowana odległość do celu, _EU - maksymalna odległość do celu, ₉^B

9 / EU - znormalizowana odległość do przeszkód,

dmx=4 [m] - maksymalny zasięg pomiaru skanera lasero-

wego, ₉ min' , , ( - minimalna

odległość do przeszkód, i=1,2,3, ^B min' (/

EU – minimalna znormalizowana odległość do prze- szkód przed WMR, _E min' ( – minimalna odległość do przeszkód po lewej stronie WMR,

E min' ( – minimalna odległość do prze- szkód po prawej stronie, ^B 2 4Z _E /' _E !

E ([ # 0.58 – znormalizowana minimalna odległość do przeszkód po lewej stronie ramy robota, ^B 2 4Z _E /' _E ! _E ([ # 0.58 - znormalizowana minimalna odległość do przeszkód po prawej stronie WMR, dGM, dOD, uS – lingwistyczne etykiety funkcji przynależności do zbiorów rozmytych przesłanek i konkluzji, gdzie: BM0 – bardzo mały, bliski 0, BM – bardzo mały, M – mały, S – średni, D – duży, BD – bardzo duży, BD1 – bardzo duży, bliski 1. Schemat bazy reguła układu FL pokazano na rys. 2.

Rys. 2. Schemat bazy reguł

Przestrzenie wejść do układu FL podzielono na 5 zbiorów trójkątnych i trapezowych, natomiast w konkluzjach zastosowano 7 funkcji przynależności.

Otrzymano powierzchnię modelu FL przedstawioną na rys. 3.

Rys. 3. Powierzchnia modelu rozmytego.

Z zastosowanej bazy reguł wynika, że jeżeli WMR znajduje się w pobliżu przeszkód, w generowanej

(5)

trajektorii ruchu dominujący udział ma zachowanie typu OA, gdy WMR znajduje się w pobliżu celu, dominuje zachowanie typu GS, natomiast w pozostałych przypadkach wynikowe zachowanie jest połączeniem zachowań typu GS i OA w różnych proporcjach.

Strukturę generującą sterowania w zadaniu typu GS zbudowano z zastosowaniem dwóch układów FL.

Generuje ona sygnały sterowania ₅ i ₆₇ na podstawie znajomości położenia i orientacji ramy WMR oraz położenia celu. Trajektoria jest generowana w taki sposób, aby zminimalizować odległość do celu , poprzez ruch ramy WMR w kierunku punktu G, gdy minimalizowany jest kąt

# , (9)

zawarty między osią ramy WMR a prostą pG.

Strukturę generującą sterowania w zadaniu typu OA zbudowano z zastosowaniem dwóch układów FL, które generują sygnały sterowania ₉₅ i ₉₆₇ na podstawie sygnałów z układu sensorycznego WMR. Generowana jest bezkolizyjna trajktoria ruchu powodująca minimalizację błędu

_₉ ^B # ^B , (10)

co powoduje ruch WMR środkiem wolnej przestrzeni.

3.2 WARSTWA REALIZACJI RUCHU

Wygenerowana trajektoria jest realizowana przez warstwę sterowania ruchem nadążnym WMR. W warstwie tej zastosowano nowoczesne meteody AI w postaci algorytmów ADP [13,14,15] w konfiguracji DHP, zrealizowanych z zastosowaniem NN RVFL. Sposób generowania sygnałów sterowania w algorytmch ADP bazuje na idei sterowania optymalnego Bellmana, jednakże dzięki zastosowani metod AI umożliwia aproksymację funkcji wartości przez NN struktury krytyka oraz generowanie sygnału sterowania przez NN struktury aktora. Całkowity sygnał sterowania ruchem

nadążnym WMR , , składa się

z sygnału sterowania generowanego przez strukurę aktor-krytyk DHP , , sygnału sterowania regulatora PD, ,_`a , sygnału sterowania nadzorującego ,_b , o strukturze wynikającej z analizy stabilności zamkniętego układu sterowania zrealizowanej z zastosowaniem teorii stabilności Lapunova, oraz dodatkowego sygnału sterowania ,_c . Całkowity sygnał sterowania ruchem nadążnym przyjęto w formie

, _d$e#, ! ,_b # ,_`a # ,_c f, (11) gdzie

,b gb,bB , ,_`a ha. , ,_c "Λ- # ₊₁ ,

(12)

gdzie gb – macierz diagonalna, ib , 1 jeżeli jk j l m , w przeciwnym przypadku ib , 0, m – dodatnia stała, i=1,2, _b^B - wektor sygnałów sterowania nadzorującego, wyznaczonych stosując analizę sta- bilności układu zamkniętego z zastosowaniem teorii stabilności Lapunova, ha – dodatnio określona macierz diagonalna wzmocnień regulatora PD.

Sygnał sterowania generowanego przez NN RVFL struktury aktora określony jest zależnością

'n , o ( o p'q n (, (13) gdzie n – wektor wejść do i-tej NN aktora, o – wektor wag warstwy wyjściowej sieci adaptowanych w czasie ruchu WMR, S(.) – wektor sigmoidlanych bipolarnych funkcji aktywacji neuronów, DA – macierz stałych wag warstwy wejściowej.

Schemat struktury hierarchicznego układu sterowania ruchem WMR Pioneer 2-DX przedstawiono na rys. 4.

Rys. 4. Schemat hierarchicznego układu sterowania Neuronowy algorytm sterowania ruchem nadążnym został szczegółowo omówiony w [8].

4. STANOWISKO BADAWCZE

Schemat stanowiska badawczego pokazano na rys. 5.

Rys. 5. Schemat stanowiska badawczego.

Zaproponowany hierarchiczny układ sterowania przetestowano na stanowisku badawczym składającym się z WMR Pioneer 2-DX, wyposażonego w skaner laserowy przestrzeni Hokuyo UBG-4LX-F01, układu

(6)

zasilania oraz komputera PC z kartą kontrolno- pomiarową dSpace DS1102, oraz oprogramowaniem Matlab/Simulink i dSpace ControlDesk.

5. WYNIKI EKSPERYMENTU

Przeprowadzono szereg eksperymentów weryfikują- cych proces planowania trajektorii oraz realizacji ruchu.

W tym rozdziale, w celu uproszczenia zapisu, pominięto indeks k w oznaczeniach zmiennych. Przyjęto wartość h=0.01 [s] parametru dyskretyzacji czasu. Trajektoria ruchu była generowana w czasie rzeczywistym przez warstwę nadrzędną hierarchicznego układu sterowania na bazie sygnałów z układu sensorycznego robota, oraz realizowana przez warstwę sterowania ruchem nadąż- nym. Zadanie było uznawane za zrealizowane, jeżeli w trakcie ruchu WMR nie wystąpiła kolizja z przeszko- dą oraz gdy po zakończeniu ruchu punkt A ramy WMR znalazł się w odległości do celu r 0.05 [m]. Tory ruchu WMR z położenia początkowego w punkcie S(0.6, 0.95), do celu w punktach GA(4.8, 3.5), GB(9.3, 3.5), GC(7.0, 0.75), wraz z mapą toru pomiaro- wego i współrzędnymi przeszkód zlokalizowanych przez czujnik laserowy przestrzeni, oznaczonych szarymi kropkami, przedstawiono na rys. 6.

Rys. 6. Mapa otoczenia z torem ruchu robota Pioneer 2-DX do celu a) GA(4.8, 3.5), b) GB(9.3, 3.5), c) GC(7.0, 0.75)

Zadane położenia GA(4.8, 3.5), GB(9.3, 3.5) i GC(7.0, 0.75) oznaczono symbolami X. Ich lokalizacje dobrano tak, aby wygenerowanie bezkolizyjnej trajektorii ruchu WMR do celu nie było możliwe z zastosowaniem stero- wań behawioralnych typu GS lub OA. Rozwiązanie tego problemu wymaga zastosowania algorytmu planowania trajektorii, który generuje sygnały sterowania będące połączeniem sterowań behawioralnych zadań typu GS i OA w odpowiednich proporcjach, w zależności od warunków środowiska, przez co umożliwia wygenerowanie bezkolizyjnej trajektorii ruchu w złożonym zadaniu typu GSOA. Na rys. 6a-c można zauważyć występowa- nie różnic między rzeczywistą mapą otoczenia WMR a położeniem przeszkód zlokalizowanych przez układ sensoryczny robota. Wynika to z zakłóceń pojawiających się w trakcie ruchu WMR po nierównym podłożu, co ma wpływ na pracę czujnika laserowego przestrzeni, jak również z niejednolitej faktury powierzchni przeszkód i ich ustawienia pod różnym kątem do wiązki laserowej.

Kolejnym problemem zaobserwowanym w trakcie realizacji badań było przesunięcie zmierzonego położenia przeszkód względem mapy rzeczywistej, wynikające z obliczania lokalizacji przeszkód na podstawie położenia i orientacji ramy WMR, ustalanych na podstawie pomiaru kąta obrotu kół realizowanego z zastosowaniem enkoderów inkrementalnych. Pojawiające się błędy sumują się w czasie ruchu, co wpływa na coraz większe przesunięcie lokalizacji wykrytych przeszkód w stosunku do ich rzeczywistego położenia. Wpływ tego zjawiska można ograniczyć poprzez zastosowanie zewnętrznej metody lokalizacji WMR w torze pomiarowym.

Odległości do celu otrzymane w trakcie realizacji ruchu WMR przedstawiono na rys. 7. Realizacja bezko- lizyjnej trajektorii ruchu WMR do punktu GC(7.0, 0.75) wymaga chwilowego zwiększenia odległości do zadanego położenia końcowego w celu ominięcia przeszkody.

Rys. 7. Przebiegi wartości odległości lG do celów GA, GB i GC

Poniżej przedstawiono wyniki eksperymentu otrzymane w trakcie realizacji ruchu WMR do punktu GC. Na rys. 8a przedstawiono przebieg wartości współ- czynnika koordynacji sterowań behawioralnych aB, generowanego przez układ FL, którego wartość zależy od odległości do przeszkód, oraz do celu. W czasie eksperymentu zmiany wartości tego sygnału powodują zmianę wpływ poszczególnych sterowań behawioralnych

(7)

na realizowane zadanie. W czasie stu16;18y [s] można zaobserwować wzrost znaczenia sygnałów sterowania behawioralnego typu OA w całkowitych sygnałach sterowania, co wynika ze zmniejszenia odległości do przeszkody. Natomiast po czasie s z 30 [s] następuje całkowite przełączenie warstwy generowania trajektorii ruchu na realizację zadania typu GS, ze względu na odległość do celu. Otrzymane sygnały sterowania warstwy planowania trajektorii ruchu ₅ i ₆₇ przedstawiono na rys. 8b, są one połączeniem w odpowiednich proporcja sygnałów sterowań behawioralnych zadań typu GS (rys. 8d), oraz OA (rys. 8c), gdzie współczyn- nikiem proporcjonalności jest wartość sygnału aB.

Rys. 8 a) Przebieg wartości sygnału aB, b) przebiegi wartości sygnałów ₅ i ₆₇, c) przebieg wartości sygnałów sterowania behawioralnego typu: c) OA ( ₉₅, ₉₆₇), d) GS ( ₅, ₆₇) Wartość sygnału sterowania prędkością kątową obrotu własnego ramy WMR, ₆₇, zmienia się w początkowej

fazie ruchu w zależności od odległości do przeszkód, w sposób zapewniający bezkolizyjny ruchu WMR.

W końcowej fazie ruchu większe znaczenie w całkowi- tych wartościach sygnałów sterowania mają sygnały sterowania zadania typu GS, sygnał sterowania ₆₇ zmienia się tak, aby możliwe było osiągnięcie celu GC

przez punkt A ramy WMR.

Na podstawie wartości sygnałów sterowania warstwy planowania trajektorii ruchu WMR generowano w czasie ruchu zadane wartości parametrów kątowych obrotu kół napędzających. Na rys. 9a przedstawiono przebiegi wartości zadanych prędkości kątowych obrotu kół napędzających WMR. Zadane parametry ruchu zostały zrealizowane z zastosowaniem warstwy realizacji ruchu, poprzez podanie do układów napędowych WMR sygna- łów sterowania ruchem nadążnym, pokazanych na rys.

9b. Trajektoria ruchu WMR została zrealizowana z błędami nadążania, których przebiegi dla i=2 koła WMR przedstawiono na rys. 9c.

Rys. 9 a) Przebiegi wartości zadanych prędkości kątowych obrotu kół 1 i 2 robota, b) przebiegi wartości całkowitych sygnałów sterowania ruchem nadążnym, c) przebiegi wartości

błędów nadążania koła i=2 robota

W warstwie realizacji ruchu hierarchicznego układu sterowania zastosowano algorytm DHP, w którym znajdują się NN RVFL o m=8 neuronach każda, realizu-

(8)

jące zadania struktur aktora i krytyka. Przyjęto zerowe wartości początkowe wag sieci. Przebiegi wartości wag NN i=1 krytyka przedstawiono na rys. 10.

Rys. 10. Przebiegi wartości wag NN i=1 krytyka.

6. PODSUMOWANIE

W artykule przedstawiono hierarchiczny układ sterowania ruchem WMR Pioneer 2-DX, który składa się z dwóch warstw. Warstwa nadrzędna generuje bezkolizyjną trajektorię ruchu robota w nieznanym

środowisku 2D ze statecznymi przeszkodami, zastosowano w niej koncepcję sterowania behawioralnego. Składa się ona z dwóch struktur generujących sterowania behawioralne w zadaniach typu GS i OA, które zostały zrealizowane z zastosowaniam układów FL, oraz z algorytmu koordynujacego wpływ poszczególnych sterowań behawioralnych na generowaną trajektorię ruchu, w zależności od odległości do celu oraz przeszkód znajdujących się w otoczeniu WMR. Warstwę realizacji ruchu stanowi układ sterowania ruchem nadążnym WMR, w którym zastosowano algorytm ADP w konfiguracji DHP. Algorytm ten składa się z dwóch struktur, aktora oraz krytyka, zrealizowanych z zastosowaniem NN RVFL. Algorytm działa on-line i nie wymaga fazy uczenia wstępnego wag NN. Wartości błędów realizacji zadanej trajektorii ruchu, oraz wartości wag NN pozostają ograniczone w trakcie ruchu WMR Pioneer 2-DX.

Literatura

1. Arkin R. C.: Behavioural-based robotics. Cambridge: MIT Press, 1998.

2. Burghardt A: Sterowanie behawioralne minirobota kołowego. „PAK” 2004, Vol. 11, p. 26 - 29.

3. Drainkov D., Saffiotti A.: Fuzzy logic techniques for autonomous vehicle navigation. New York: Springer, 2001.

4. Fahimi F.: Autonomous robots : modeling, path planning, and control. New York: Springer, 2009.

5. Giergiel J., Zylski W.: Description of motion of a mobile robot by Maggie’s Equations. „Journal Theoretical and Applied Mechanics” 2005, 3, Vol. 43, p. 511 - 521.

6. Giergiel M., Hendzel Z., Żylski W.: Modelowanie i sterowanie mobilnych robotów kołowych. Warszawa: PWN, 2002.

7. Hendzel Z.: Fuzzy reactive control of wheeled mobile robot. “Journal Theoretical and Applied Mechanics” 2004, 3, Vol. 42, p. 503 - 517.

8. Z. Hendzel, M. Szuster: Discrete model-based adaptive critic designs in wheeled mobile robot control.

L. Rutkowski et al. (eds.): ICAISC 2010, Part II, „LNCS” 2010, Vol. 6114, p. 264 - 271.

9. Z. Hendzel, M. Szuster: Neural dynamic programming in reactive navigation of wheeled mobile robot.

L. Rutkowski et al. (eds.): ICAISC 2012, Part II, „LNCS” 2012, Vol. 7268, p. 450 - 457.

10. Hendzel Z., Szuster M.: Neuronowe programowanie dynamiczne w sterowaniu behawioralnym mobilnym robo- tem kołowym. „Acta Mech. Automatica” 2011, 1, Vol. 5, p. 28 - 36.

11. Maaref, H., Barret, C.: Sensor-based navigation of a mobile robot in an indoor environment. „Robot. Auton.

Syst.” 2002, Vol. 38, p. 1-18.

12. Millan, J.: Reinforcement learning of goal-directed obstacle-avoiding reaction strategies in an autonomous mobile robot. „Robot. Auton. Syst.” 1995, 4, Vol. 15, p. 275 - 299.

13. Powell W.B.: Approximate dynamic programming: solving the curses of dimensionality. Princeton: Willey- Interscience, 2007.

14. Prokhorov D., Wunch D.: Adaptive critic designs. „IEEE Trans. Neural Netw” 1997, Vol. 8, p. 997 - 1007.

15. Si, J., Barto, A.G., Powell, W.B., Wunsch, D.: Handbook of learning and approximate dynamic programming.

IEEE Press, Wiley-Interscience, 2004.