PLANOWANIE TRAJEKTORII RUCHU FORMACJI ROBOTÓW MOBILNYCH Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ ROZMYTĄ

(1)

PLANOWANIE TRAJEKTORII RUCHU FORMACJI ROBOTÓW MOBILNYCH Z ZASTOSOWANIEM UKŁADÓW

Z LOGIKĄ ROZMYTĄ

Andrzej Burghardt

^1a

, Marcin Szuster

^1b

1Katedra Mechaniki Stosowanej i Robotyki, Politechnika Rzeszowska

aandrzejb@prz.edu.pl, ^bmszuster@prz.edu.pl

Streszczenie

W pracy zaprezentowano hierarchiczny układ sterowania ruchem formacji mobilnych robotów kołowych, w któ- rym zastosowano koncepcję wirtualnej struktury. W algorytmie tym każdy z agentów podąża za zadanym punktem wirtualnej struktury, realizując trajektorię formacji wygenerowaną przez najwyższą warstwę hierarchicznego układu sterowania. Środkowa warstwa algorytmu sterowania wyznacza trajektorie ruchu poszczególnych agentów, które następnie są realizowane przez warstwę sterowania ruchem nadążnym. W prezentowanej pracy zastosowano nowe podejście, w którym jedna struktura warstwy generowania trajektorii, zbudowana z zastosowaniem dwóch układów z logiką rozmytą, generuje sygnały sterowania umożliwiające realizację złożonego zadania typu „podążaj do celu i omijaj przeszkody”.

Słowa kluczowe: formacja mobilnych robotów kołowych, sterowanie behawioralne, sterowanie nadążne, układy z logiką rozmytą

FUZZY LOGIC SYSTEMS IN WHEELED MOBILE ROBOTS FORMATION PATH PLANNING

Summary

In the article a hierarchical control system of the wheeled mobile robots formation is presented, where the virtual structure conception is applied. In the proposed control algorithm every agent tracks a desired point of the virtual structure and realises trajectory of the wheeled mobile robots formation generated by the highest layer of the hierarchical control system. The middle layer of the control system is the formation control layer. It generates desired trajectories for particular agents. These trajectories are realized by the tracking control layer. In the presented article a new approach is applied, where one structure of the highest layer of the hierarchical control system generates control signals that make realisation of the complex task of “goal seeking with obstacle avoiding”

possible. In this layer two fuzzy logic systems were used.

Keywords: wheeled mobile robots formation, behavioral control, tracking control, fuzzy logic system

1. WSTĘP

Rozwój technologii umożliwia budowę coraz więk- szych budynków czy maszyn, skracając czas konieczny do realizacji projektu, często poprzez zastosowanie wielkogabarytowych elementów konstrukcji. Wyzwaniem trudnym i kosztownym w realizacji staje się transport elementów wielkogabarytowych. Wymaga on zastosowania odpowiednio dużych środków transportowych lub

grupy mniejszych, współpracujących ze sobą pojazdów.

Drugie z tych podejść wydaje się być bardziej uniwersal- ne, jednocześnie jest trudniejsze w realizacji. Pojazdy współpracujące w trakcie transportu wielkogabarytowych elementów mogą być użyteczne również po zakoń- czeniu realizacji tego zadania, jednakże problemem w tym przypadku jest współpraca operatorów, która nie

(2)

zawsze jest odpowiednia, a w krytycznych przypadkach może prowadzić do kosztownych wypadków. Problem ten może zostać rozwiązany przez zastosowanie grupy mobilnych robotów kołowych, poruszających się w zdefiniowanej formacji, gdzie pozycja każdego z agen- tów jest ściśle określona. Innymi istotnymi możliwościa- mi zastosowania grup autonomicznych robotów porusza- jących się w formacji są np. zadania patrolowe czy bojowe.

Kolejnym problemem w implementacji zrobotyzowa- nego, autonomicznego transportu wielkogabarytowego jest konieczność zastosowania złożonych algorytmów generowania i realizacji trajektorii ruchu poszczególnych agentów w formacji. Zadanie generowania trajektorii mobilnych robotów kołowych jest często spotykane w literaturze [1,3,4,7,13,14,18], gdzie problem ten jest najczęściej rozwiązywany z zastosowaniem dwóch typów metod: tzw. metod globalnych lub lokalnych. Metody globalne bazują na znajomości mapy otoczenia, natomiast metody lokalne bazują na aktualnym stanie wie- dzy o środowisku, gdzie znana jest tylko mapa otoczenia wokół robota, będącego w zasięgu jego układu senso- rycznego. Mobilne roboty kołowe są obiektami opisany- mi nieliniowymi równaniami dynamiki, których parametry mogą się zmieniać w czasie ruchu w zależności od warunków pracy. Problem ten w algorytmach sterowania ruchem nadążnym jest często rozwiązywany poprzez zastosowanie nowoczesnych metod sztucznej inteligencji (AI, ang. Artificial Intelligence), takich jak sztuczne sieci neuronowe (NN, ang. Neural Networks) czy układy z logiką rozmytą (FL, ang. Fuzzy Logic). Istnieje wiele prób implementacji tych metod w układach generowania trajektorii czy układach sterowania ruchem robotów [14,18].

W artykule zaprezentowano hierarchiczny układ sterowania ruchem formacji mobilnych robotów kołowych (WMRF, ang. Wheeled Mobile Robots Formation), w którym zastosowano algorytmy FL oraz algorytmy aproksymacyjnego programowania dynamicznego (ADP, ang. Approximate Dynamic Programming) [15,16,17]

zbudowane z zastosowaniem NN. Układ sterowania składa się z trzech warstw: warstwy generowania trajektorii ruchu formacji, warstwy generowania trajektorii dla poszczególnych agentów oraz warstwy realizacji ruchu.

W warstwie generowania trajektorii ruchu zastosowano koncepcję sterowania behawioralnego [18], które jest próbą naśladowania elementarnych zachowań organi- zmów żywych w rozwiązywaniu problemów generowania trajektorii ruchu do celu, czy trajektorii ruchu umożli- wiającej omijanie przeszkód. W mobilnej robotyce najczęściej spotykany jest problem wymagający połącze- nia realizacji dwóch zachowań: „podążaj do celu” (GS, ang. Goal Seeking) oraz „omijaj przeszkody” (OA, ang.

Obstacle Avoiding). Zazwyczaj problem ten jest rozwią- zywany poprzez implementację algorytmów generują- cych sterowania behawioralne w zadaniach GS

i OA, a następnie ich stałe połączenie w heurystycznie dobranych proporcjach, czy miękkie przełączanie w zależności od warunków środowiska, stosując do tego celu oddzielny algorytm. W prezentowanym artykule zastosowano nowe podejście do problemu generowania trajektorii ruchu w złożonym zadaniu „podążaj do celu z omijaniem przeszkód” (GSOA, ang. Goal Seeking with Obstacle Avoiding), poprzez zastosowanie jednego ele- mentu układu sterowania, w którym zastosowano dwa układy FL.

Wyniki prac zaprezentowanych w artykule są konty- nuacją wcześniejszych prac autorów związanych z problemami sterowania WMRF [8], generowaniem bezkolizyjnych trajektorii ruchu WMR [2,10,11,12], czy też sterowania ruchem nadążnym robotów [9]. Artykuł składa się z następujących części: część pierwsza zawiera wprowadzenie do problemów związanych ze sterowaniem WMRF, w części drugiej przedstawiono opis obiektu sterowania, część trzecia zawiera opis hierarchicznego układu sterowania. W kolejnej części przedstawiono wyniki badań numerycznych, ostatnia część podsumowu- je artykuł.

2. FORMACJA MOBILNYCH ROBOTÓW KOŁOWYCH

Obiektem sterowania jest WMRF. Analizę zagadnień związanych z planowaniem i realizacją ruchu formacji przeprowadzono, przyjmując liczbę n=3, agentów two- rzących formację.

2.1 MODEL MOBILNEGO ROBOTA KOŁOWEGO

Schemat j-tego mobilnego robota dwukołowyego, z trzecim kołem swobodnym, samonastawnym, został przedstawiony na rys. 1. WMR jest obiektem nieholonomicznym, którego dynamika jest opisywana z zastosowaniem nieliniowych równań ruchu. Składa się on z ramy 4, dwóch kół napędzających 1 i 2, oraz koła samonastawnego, podpierającego 3. Ruch mobilnego robota kołowego jest analizowany w płaszczyźnie xy.

Mobilny robot wyposażony jest w układ sensoryczny składający się z n=8, ( ,… , ), czujników ultradź- więkowych o maksymalnym zasięgu pomiaru dmx=4 [m], umożliwiających wykrywanie przeszkód znajdujących się w otoczeniu robota w odległościach , …, . Z punktem A^(j)( , ) ramy j-tego WMR powiązany jest ruchomy układ współrzędnych o osiach x^(j), y^(j), natomiast β^(j) to kąt skręcenia ramy WMR względem nieruchomego układu współrzędnych xy, to kąt pomiędzy osią pomiaru i-tego czujnika si, a osią ramy mobilnego robota, - sygnał sterujący i-tego koła, i=1,2, - prędkość kątowa i-tego koła.

(3)

Rys. 1. Schemat j-tego mobilnego robota kołowego

Współrzędne j-tego WMR w formacji są określane

poprzez wektor , , , , , gdzie

, – kąty obrotu kół 1 i 2. Kinematyka j-tego WMR jest opisana równaniem

! "^#cos' ( 0

"^#sin' ( 0

0 ^#

!, ^-

. /, (1)

gdzie "^# - zdefiniowana maksymalna prędkość punktu A,

# - maksymalna prędkość kątowa obrotu ramy WMR,

- , _. – sygnały sterowania warstwy generowania trajektorii.

Zaproponowany hierarchiczny układ sterowania ruchem WMRF działa w dyskretnej dziedzinie czasu, dlatego ciągły model Maggiego dynamiki WMR [5,6]

dyskretyzowano, stosując metodę Eulera. Przyjęto wektor stanu 0₁₂₃ 0 ₁₂₃, 0 ₁₂₃ , w którym wektor 0 ₁₂₃ 4 ₁₂₃, 4 ₁₂₃ odpowiada wektorowi prędko- ści kątowych w zapisie ciągłym. Dyskretny model dyna- miki j-tego WMR w formacji został przyjęty w formie układu równań

0 _{125 3} 0 ₁₂₃6 70₁₂₃,

0 _{125 3} 0₁₂₃8 79 ^: ; '0 ₁₂₃(0 ₁₂₃6 < '0 ₁₂₃( 879 ^: =_>1238 ?₁₂₃ ,

(2) gdzie h – parametr dyskretyzacji czasu, k – indeks kroków iteracji, M^(j) – dodatnio określona macierz bezwładności WMR, 0₁₂₃ – wektor kątów obrotu kół,

;^@ '0₁₂₃(0 ₁₂₃ – wektor momentów od sił odśrodko- wych i Coriolisa, <^@ '0 ₁₂₃( – wektor oporów ruchu,

=_>123 – wektor ograniczonych zakłóceń, ?₁₂₃ – wektor sygnałów sterowania.

Opis układu zamkniętego wyznaczono, przyjmując dyskretne błędy nadążania zadanych parametrów kąto- wych obrotu kół

A₁₂₃ 0₁₂₃8 0_{> 123},

A₁₂₃ 0 ₁₂₃8 0_{> 123}, (3)

gdzie zadane parametry ruchu WMR (0_{> 123}, 0_{> 123}) są generowane w czasie ruchu WMRF. Na podstawie błędów nadążania (3) zdefiniowano uogólniony błąd nadążania j-tego WMR w formie zależności

B₁₂₃ A₁₂₃6ΛA₁₂₃, (4) gdzie Λ - stała macierz diagonalna o dodatnich współ- czynnikach.

Na podstawie definicji błędów nadążania (3) i (4), oraz modelu dynamiki WMR, wyznaczono wartość uogólnionego błędu nadążania j-tego WMR w kroku k+1

B_{125 3} 8C_D '0₁₂₃( 6 C_> '0₁₂₃, 0_>123,0_>E123( 6 8C_F1236 79 ^: ?₁₂₃ (5) gdzie

C_D '0₁₂₃( 79 ^: ; '0₁₂₃(0₁₂₃6 < '0 ₁₂₃( , C_> '0₁₂₃,0_>123,0_>E123( B₁₂₃6 C_G '0₁₂₃, 0_{> 123}, 0_>E123(,

C_G '0₁₂₃,0_{> 123},0_>E123( 7 ΛA₁₂₃8 0_>E123 , C_F123 79 ^: =_>123,

(6) gdzie C_D '0 ₁₂₃( – wektor zawierający wszystkie nieli- niowości modelu WMR, 0_>E123 – wektor zawierający zadane wartości przyspieszeń kątowych kół napędzają- cych, którego obecność wynika z zapisu wektora 0_{> 125 3} w kroku k-tym z zastosowaniem metody Eulera.

2.2 MODEL FORMACJI ROBOTÓW MOBILNYCH

WMRF składa się z m=3 robotów i została schematycznie przedstawiona na rys. 2.

(4)

Rys. 2. Schemat formacji mobilnych robotów kołowych.

Punkty A^(j) ram WMR tworzą wirtualną strukturę o kształcie trójkąta równobocznego. Każdy z WMR jest wyposażony w 8 czujników ultradźwiękowych, jednakże nie wszystkie sygnały z układów sensorycznych robotów tworzących formację są brane pod uwagę w procesie generowania trajektorii ruchu. Wybrane czujniki zostały pogrupowane w celu wygenerowania znormalizowanych odległości do przeszkód przed WMRF ( _H123^# ), z prawej ( _I123^# ) oraz lewej strony formacji ( _J123^# ), co zostało szczegółowo opisane w kolejnym rozdziale. Punkt M( _K123, _K123) to centralny punkt wirtualnej struktury o kształcie trójkąta, natomiast _K123 to kąt obrotu wirtualnej struktury. Zadaniem hierarchicznego układu sterowania jest wygenerowanie bezkolizyjnej trajektorii ruchu do celu G( _L123, _L123), znajdującego się w odle- głości ML123 od punktu M, gdzie kąt pomiędzy prostą p^G, a osią x wynosi NL123.

3. HIERARCHICZNY UKŁAD STEROWANIA

Prezentowany hierarchiczny układ sterowania składa się z trzech warstw. Pierwszą, najwyższą warstwę sterowania, stanowi generator trajektorii ruchu wirtualnej struktury WMRF. Warstwa ta generuje zadaną trajek- torię ruchu punktu M wirtualnej struktury. W drugiej warstwie hierarchicznego układu sterowania, na podsta- wie zadanej trajektorii ruchu punktu M, generowane są zadane trajektorie ruchu poszczególnych agentów wcho- dzących w skład formacji. Trzecia, najniższa warstwa hierarchicznego układu sterowania, składa się z n algo- rytmów sterowania ruchem nadążnym, gdzie n odpowia- da liczbie robotów w formacji. Jej zadaniem jest wygenerowanie sygnałów sterowania modułami napędowymi WMR, zapewniających realizację trajektorii ruchu

wygenerowanej przez wyższe warstwy hierarchicznego układu sterowania. Schemat hierarchicznego układu sterowania przedstawiono na rys. 3.

Rys. 3. Schemat hierarchicznego układu sterowania Warstwa generowania trajektorii ruchu wirtualnej struktury na podstawie zrealizowanych parametrów ruchu poszczególnych agentów ₁₂₃ i sygnałów z ich układów sensorycznych P₁₂₃ generuje zadane parametry ruchu punktu M wirtualnej struktury, _>K123, na podstawie których są generowane zadane parametry ruchu poszczególnych agentów _>123.

3.1 WARSTWA GENEROWANIA TRAJEKTORII RUCHU FORMACJI

W warstwie generowania trajektorii ruchu zastosowano koncepcję sterowania behawioralnego w celu planowania trajektorii ruchu WMRF.

W sterowaniu tym wyróżnia się podstawowe zadania wzorowane na świecie organizów żywych, takie jak: GS i OA. W algorytmach generowania trajektorii ruchu WMR problem generowania trajektorii ruchu w złożonym zadaniu GSOA zazwyczaj jest rozwiązywany poprzez implementację algorytmów generujących sterowania behawioralne w zadaniach typu GS i OA, a następnie ich stałe połączenie w heurystycznie dobranych proporcjach, czy miękkie przełączanie w zależności od warunków środowiska, stosując do tego celu oddzielny algorytm. W prezentowanym artykule zastosowano nowe podejście do problemu generowania trajektorii ruchu w zadaniu GSOA, poprzez zastosowanie tylko jednego układu sterowania, w którym zastosowano dwa układy FL, z których jeden generuje sygnał _-123 steru- jący zadaną prędkością ruchu punktu M wirtualnej struktury, drugi algorytm generuje sygnał _.123 sterują- cy zadanym kątem obrotu wirtualnej struktury _K123.

Generator trajektorii zrealizowano stosując układy FL, z modelem Takagi-Sugeno oraz trójkątnymi lub trapezowymi funkcjami przynależności do zbiorów

(5)

rozmytych. Układ FL generujący sygnał sterowania

-123 posiada dwa wejścia – znormalizowaną odległość do celu _L123^# M_L123/MRS, oraz znormalizowaną odległość do przeszkód _T123^# _T123/ _RS, gdzie M_RS - maksymalna odległość do celu, _T123 minV _J123, _H123, _I123 W - minimalna odległość do przeszkód,

H123 min' _{X 123}, _{Y 123}( – minimalna odległość do przeszkód przed WMRF, _J123 min' _{E 123}, _{E 123}( – minimalna odległość do przeszkód po lewej stronie WMRF, _I123 min ' _{Z 123}, _{Z 123}^E ( – minimalna odle- głość do przeszkód po prawej stronie, _J123^# 2 ' _J123/V _J1236 _I123W( 8 0.5 – znormalizowana minimalna odległość do przeszkód po lewej stronie formacji, _I123^# 2 ' _I123/V _J1236 _I123W( 8 0.5 - znormalizowana minimalna odległość do przeszkód po prawej stronie WMRF. Układ FL generujący sygnał sterowania _.123 posiada bardziej złożoną strukturę. Jest wyposażony w cztery wejścia: _L123^# i _T123^# , oraz ]_T123 i ^_L123 zdefiniowane zależnościami

]_T123 _I123^# 8 _J123^# ,

^_L123 N_L1238 _K123. (7) Układ z logiką rozmytą zawiera bazę m=48 reguł typu

_^R: IF V _L123^# JEST dGMW I V _T123^# JEST dOMW I V]_T123 JEST eMW I V^_L123^# JEST pMW TO _-123 JEST uDM,

(8) gdzie ^L123# op81,1r – znormalizowany kąt ^L123, dGM, dOM, eM, pM – lingwistyczne etykiety funkcji przyna- leżności do zbiorów rozmytych przesłanek, pokazanych na rys. 4, uUD=-1, uUM=-0.6, uDM=0.6, uDD=1 – funkcje przynależności typu singleton konkluzji, gdzie:

M – mały, S – średni, D – duży, UD – ujemny duży, UM – ujemny mały, DM – dodatni mały, DD – dodatni duży.

3.2 WARSTWA GENEROWANIA

TRAJEKTORII RUCHU ROBOTÓW W FORMACJI

Warstwa generowania trajektorii ruchu robotów w formacji bazuje na idei wirtualnej struktury z centralnym punktem M, której orientację określa kąt

K123. Położenie i orientacja wirtualnej struktury zmieniają się zgodnie z przyjętym algorytmem warstwy generowania trajektorii w zalezności od odległości do przeszkód oraz lokalizacji celu G. Zadane położenia środków ram WMR wchodzących w skład formacji określają punkty s_> . Zadane trajektorie ruchu poszczególnych agentów są generowane w taki sposób, aby punkty A^(j)( ₁₂₃, ₁₂₃) ramy WMR w kolejnym kroku iteracji osiągnęły zadane położenie

s_> _{> 123}, _{> 123} , wyznaczone na podstawie znajomości położenia i orientacji wirtualnej struktury formacji.

W warstwie generowania trajektorii ruchu robotów w formacji wyznaczane są wartości sygnałów sterowania

H-123 i _H.123, umożliwiające obliczenie zadanych wartości prędości kątowych obrotu kół napędowych poszczególnych agentów zgodnie z zależnością

t4_> ₁₂₃

4_> ₁₂₃u _vw"^# ^#M

"^# 8 ^#M x t ^H-123

H.123

u, (9) gdzie r, l1 – wymiary wynikające z geometrii WMR.

Algorytm ten został szczegółowo opisany w [8].

Rys. 4. Funkcje przynależności do zbiorów rozmytych przesła- nek zmiennych: a) _L123^# , b) _T123^# , c) ]_T123, d) ^_L123.

3.3 WARSTWA REALIZACJI RUCHU

Trajektoria ruchu wygenerowana dla j-tego WMR jest realizowana przez najniższą warstwę hierarchicznego układu sterowania, w której zastosowano neuronwe algorytmy sterowania ruchem nadążnym.

W algorytmach tych zastosowano struktury ADP w konfiguracji Dualnego Heurystycznego Programowania Dynamicznego (DHP, ang. Dual-Heuristic Dynamic

(6)

Programming) [15,16,17]. Całkowity sygnał sterowania ruchem nadążnym j-tego WMR ?₁₂₃ ₁₂₃, ₁₂₃ składa się z sygnału sterowania generowanego przez strukurę aktor-krytyk DHP ?₁₂₃, sygnału sterowania regulatora PD, ?_yz123, sygnał sterowania nadzorującego

?_{123, o strukturze wynikającej z analizy stabilności zamkniętego układu sterowania przeprowadzonej z zastosowaniem teorii stabilności Lapunova, oraz dodatkowego sygnału sterowania ?_|123. Całkowity sygnał sterowania ruchem nadążnym j-tego WMR w formacji przyjęto w formie zależności

?₁₂₃ _}9 ~8? ₁₂₃6 ?_{1238 ?_yz1238 ?_|123•. (9) Schemat neuronowego algorytmu sterowania ruchem nadążnym j-tego agenta przedstawiono na rys. 5.

Rys. 5. Schemat układu sterowania ruchem nadążnym Neuronowy układ sterowania ruchem nadążnym, w którym zastosowano algorytmy ADP w konfiguracji DHP, został szczegółowo omówiony w [9].

4. WYNIKI BADAŃ NUMERYCZNYCH

Testy numeryczne zaproponowanego hierarchicznego układu sterowania zostały zrealizowane w środowisku obliczeniowym Matlab/Simulink. W tym rozdziale, w celu uproszczenia zapisu, pominięto indeks k w ozna- czeniach zmiennych. Parametr dyskretyzacji czasu w trakcie symulacji przyjmował wartość h=0.01 [s].

W środowisku obliczeniowym zamodelowano labora- toryjny tor pomiarowy i zasymulowano pracę czujników ultradźwiękowych systemu pomiarowego agentów wcho- dzących w skład formacji. Na bazie tych sygnałów hierarchiczny układ sterowania wygenerował i zrealizo- wał bezkolizyjne trajektorie ruchu WMR wchodzących w skład formacji. Zadanie było uznawane za zrealizowane, jeżeli w trakcie symulacji nie wystąpiła kolizja żadnego z agentów z przeszkodami, oraz gdy po zakoń- czeniu ruchu punkt M wirtualnej struktury znalazł się w odległości od celu M_L123€ 0.05 [m]. Tory ruchu po- szczególnych agentów w formacji wraz z mapą wirtual- nego toru pomiarowego przedstawiono na rys. 6.

Rys. 6. Mapa otoczenia z torami ruchu robotów mobilnych do celów w punktach GA, GB i GC

Zadane położenia puntu M wirtualnej struktury GA(7.5, 8.5), GB(13.5, 13.5) i GC(1.5, 13.5) oznaczono symbolami X. Ich lokalizację dobrano tak, aby wygenerowanie bezkolizyjnej trajektorii ruchu WMRF do celu nie było możliwe z zastosowaniem sterowań behawioralnych typu GS lub OA. Rozwiązanie tego problemu wymaga zastosowania generatora trajektorii, który w odpowiedni sposób łączy sygnały sterowania charakte- rystyczne dla sterowań behawioralnych w zadaniach GS i OA, przez co umożliwia wygenerowanie bezkolizyjnej trajektorii ruchu w złożonym zadaniu GSOA.

Odległości do celu ML otrzymane w trakcie realizacji ruchu WMRF do zadanych punktów we współrzędnych mapy przedstawiono na rys. 7.a. Na rys. 7.b przedstawiono sygnały sterowania _- i _. warstwy planowania trajektorii wygenerowane w trakcie ruchu WMRF do punktu GA(7.5, 8.5). Z przebiegu wartości sygnału sterowania _- wynika, że punkt M wirtualnej struktury formacji przez większość czasu przemieszczał się z pręd- kością bliską prędkości maksymalnej, jedynie w czasie

•op33; 35r [s], ze względu na odległość do przeszkód, wartość sygnału sterowania zadaną prędkością ruchu wirtualnej struktury została zredukowana. Po czasie

• „ 53 [s] sygnał sterowania został zredukowany do wartości bliskich zero, co wiąże się z osiągnięciem zada- nego położenia przez WMRF. Wartość sygnału sterowania prędkością kątową obrotu własnego wirtualnej struktur WMRF, _., zmienia się w początkowej fazie ruchu w zależności od odległości od przeszkód w sposób zapewniający bezkolizyjny ruchu formacji. W końcowej fazie ruchu większe znaczenie w wartościach sygnałów sterowania ma zadanie GS, sygnał sterowania _. zmienia się tak, aby możliwe było osiągnięcie celu przez punkt M wirtualnej struktury.

(7)

Rys. 7.a) Przebiegi wartości odległości lG do celów GA, GB i GC, b) przebiegi wartości sygnałów sterujących _- i _. w trakcie

ruchu do celu GA

Na podstawie wartości sygnałów sterowania warstwy generowania trajektorii ruchu robotów w formacji wyge- nerowano zadane trajektorie ruchu poszczególnych agentów. Na rys. 8a przedstawiono przebiegi wartości zadanych prędkości kątowych obrotu kół napędzających j=3 WMR w formacji. Zadane parametry ruchu zostały zrealizowane z zastosowaniem warstwy realizacji ruchu poprzez podanie na układy napędowe sygnałów sterowania ruchem nadążnym, pokazanych na rys. 8b. Trajekto- ria ruchu WMR została zrealizowana z błędami nadąża- nia, których przebiegi dla i=1 koła j=3 WMR przedsta- wiono na rys. 8c.

Rys. 8.a) Przebiegi wartości zadanych prędkości kątowych obrotu kół 1 i 2 robota j=3 w formacji, b) przebiegi całkowi- tych sygnałów sterowania ruchem nadążnym, c) przebiegi

wartości błędów nadążania koła i=1 robota j=3

W algorytmie sterowania ruchem nadążnym zastosowano struktury DHP, w których znajdują się NN.

W prezentowanym teście numerycznym zastosowano zerowe wartości początkowe wag NN, co wiąże się z największymi błędami realizacji zadanej trajektorii w początkowej fazie ruchu, gdy proces adaptacji wag dopiero rozpoczyna się. Błędy realizacji trajektorii są następnie redukowane do wartości bliskich zeru. Prze- biegi wartości wag NN aktora 1 oraz krytyka 1 j=3 agenta przedstawiono na rys. 9a i b odpowiednio. Zasto- sowano NN Random Vector Functional Link (RVFL) o m=8 neuronach, stałych wartościach wag wejściowych dobieranych losowo w procesie inicjalizacji sieci, sigmo- idalnych bipolarnych funkcjach aktywacji neuronów oraz adaptowanych w czasie symulacji warstwach wag wyj- ściowych sieci. Przyjęto zerowe wartości początkowe wag warstw wyjściowych sieci, następnie były one adaptowa- ne w trakcie testu numerycznego zgodnie z przyjętym algorytmem adaptacji wag.

Wartości wag NN pozostają ograniczone w trakcie eksperymentu.

Rys. 9.a) Przebiegi wartości wag NN i=1 aktora układu stero- wania j=3 agenta, b) przebiegi wartości wag NN i=1 krytyka.

5. PODSUMOWANIE

W artykule zaprezentowano dyskretny, hierarchiczny układ sterowania ruchem WMRF, w którym zastosowano koncepcję wirtualnej struktury. Algorytm sterowania składa się z warstwy generowania trajektorii ruchu, w której zastosowano nowe podejście do sterowania behawioralnego, gdzie złożone zadanie „podążaj do celu z omijaniem przeszkód” zrealizowano z zastosowaniem jednej struktury warstwy generowania trajektorii zbu- dowanej z dwóch układów FL. Druga warstwa hierarchicznego układu sterowania odpowiada za generowanie trajektorii ruchu poszczególnych agentów w formacji.

Najniższa warstwa hierarchicznego układu sterowania składa się z algorytmów realizacji ruchu nadążnego poszczególnych agentów. W warstwie tej zastosowano algorytmy ADP w konfiguracji DHP, zbudowane

(8)

z zastosowaniem NN RVFL. Zaprezentowany algorytm sterowania umożliwia generowanie bezkolizyjnych trajektorii ruchu WMRF w nieznanym środowisku 2D ze statycznymi przeszkodami. Algorytm sterowania działa

on-line i nie wymaga fazy wstępnego uczenia wag NN.

Wartości błędów nadążania i wag NN pozostają ograniczone w trakcie symulacji ruchu WMRF.

Literatura

1. Arkin R. C.: Bahavioural-based robotics. Cambridge: MIT Press, 1998.

2. Burghardt A: Sterowanie behawioralne minirobota kołowego. „PAK” 2004, Vol. 11, p. 26 - 29.

3. Egerstedt, M., Hu, X.: Formation constrained multi-agent control. „IEEE Trans. Robot. Autom.” 2001, 16, Vol.

7, p. 947 - 951.

4. Fahimi F.: Autonomous robots. Modeling, path planning, and control. New York: Springer, 2009.

5. Giergiel J., Zylski W.: Description of motion of a mobile robot by Maggie’s Equations. „Journal Theoretical and Applied Mechanics” 2005, 3, Vol. 43, p. 511 - 521.

6. Giergiel M., Hendzel Z., Żylski W.: Modelowanie i sterowanie mobilnych robotów kołowych. Warszawa: PWN, 2002.

7. Hendzel Z.: Fuzzy reactive control of wheeled mobile robot. “Journal of Theoretical and Applied Mechanics”

2004, 3, Vol. 42, p. 503 - 517.

8. Hendzel Z., Burghardt A., Szuster M.: Artificial intelligence methods in reactive navigation of mobile robots formation. In: 4^th International Conference on Neural Computation Theory and Applications, 2012. Proceedings.

SciTePress, p. 466 - 473.

9. Z. Hendzel, M. Szuster: Discrete model-based adaptive critic designs in wheeled mobile robot control.

L. Rutkowski et al. (Eds.): ICAISC 2010, Part II, „LNCS” 2010, Vol. 6114, p. 264 - 271.

10. Hendzel Z., Szuster M.: Neuronowe programowanie dynamiczne w sterowaniu behawioralnym mobilnym robo- tem kołowym, „Acta Mech. Automatica” 2011, 1, Vol. 5, p. 28 - 36.

11. Z. Hendzel, M. Szuster: Neural dynamic programming in reactive navigation of wheeled mobile robot.

L. Rutkowski et al. (Eds.): ICAISC 2012, Part II, „LNCS” 2012, Vol. 7268, p. 450 - 457.

12. Hendzel Z., Szuster M., Neural sensor-based navigation of wheeled mobile robot in unknown environment.

„PAR” 2013, 1, p. 114 - 120.

13. Maaref, H., Barret, C.: Sensor-based navigation of a mobile robot in an indoor environment. „Robot. Auton.

Syst.” 2002, Vol. 38, p. 1-18.

14. Millan, J.: Reinforcement learning of goal-directed obstacle-avoiding reaction strategies in an autonomous mobile robot. „Robot. Auton. Syst.” 1995, 4, Vol. 15, p. 275 - 299.

15. Powell W.B.: Approximate dynamic programming: solving the curses of dimensionality. Princeton: Willey- Interscience, 2007.

16. Prokhorov D., Wunch D.: Adaptive critic designs. „IEEE Trans. Neural Netw” 1997, Vol. 8, p. 997 - 1007.

17. Si, J., Barto, A.G., Powell, W.B., Wunsch, D.: Handbook of learning and approximate dynamic programming.

IEEE Press, Wiley-Interscience, 2004.

18. Yamaguchi, H.: Adaptive formation control for distributed autonomous mobile robot groups. In Robotics and Automation, 1997. Proceedings., 1997 IEEE International Conference on, Vol. 3, p. 2300 - 2305.