• Nie Znaleziono Wyników

PLANOWANIE TRAJEKTORII RUCHU FORMACJI ROBOTÓW MOBILNYCH Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ ROZMYTĄ

N/A
N/A
Protected

Academic year: 2021

Share "PLANOWANIE TRAJEKTORII RUCHU FORMACJI ROBOTÓW MOBILNYCH Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ ROZMYTĄ"

Copied!
8
0
0

Pełen tekst

(1)

PLANOWANIE TRAJEKTORII RUCHU FORMACJI ROBOTÓW MOBILNYCH Z ZASTOSOWANIEM UKŁADÓW

Z LOGIKĄ ROZMYTĄ

Andrzej Burghardt

1a

, Marcin Szuster

1b

1Katedra Mechaniki Stosowanej i Robotyki, Politechnika Rzeszowska

aandrzejb@prz.edu.pl, bmszuster@prz.edu.pl

Streszczenie

W pracy zaprezentowano hierarchiczny układ sterowania ruchem formacji mobilnych robotów kołowych, w któ- rym zastosowano koncepcję wirtualnej struktury. W algorytmie tym każdy z agentów podąża za zadanym punk- tem wirtualnej struktury, realizując trajektorię formacji wygenerowaną przez najwyższą warstwę hierarchicznego układu sterowania. Środkowa warstwa algorytmu sterowania wyznacza trajektorie ruchu poszczególnych agentów, które następnie są realizowane przez warstwę sterowania ruchem nadążnym. W prezentowanej pracy zastosowano nowe podejście, w którym jedna struktura warstwy generowania trajektorii, zbudowana z zastosowaniem dwóch układów z logiką rozmytą, generuje sygnały sterowania umożliwiające realizację złożonego zadania typu „podążaj do celu i omijaj przeszkody”.

Słowa kluczowe: formacja mobilnych robotów kołowych, sterowanie behawioralne, sterowanie nadążne, układy z logiką rozmytą

FUZZY LOGIC SYSTEMS IN WHEELED MOBILE ROBOTS FORMATION PATH PLANNING

Summary

In the article a hierarchical control system of the wheeled mobile robots formation is presented, where the vir- tual structure conception is applied. In the proposed control algorithm every agent tracks a desired point of the virtual structure and realises trajectory of the wheeled mobile robots formation generated by the highest layer of the hierarchical control system. The middle layer of the control system is the formation control layer. It generates desired trajectories for particular agents. These trajectories are realized by the tracking control layer. In the pre- sented article a new approach is applied, where one structure of the highest layer of the hierarchical control sys- tem generates control signals that make realisation of the complex task of “goal seeking with obstacle avoiding”

possible. In this layer two fuzzy logic systems were used.

Keywords: wheeled mobile robots formation, behavioral control, tracking control, fuzzy logic system

1. WSTĘP

Rozwój technologii umożliwia budowę coraz więk- szych budynków czy maszyn, skracając czas konieczny do realizacji projektu, często poprzez zastosowanie wielkogabarytowych elementów konstrukcji. Wyzwaniem trudnym i kosztownym w realizacji staje się transport elementów wielkogabarytowych. Wymaga on zastosowa- nia odpowiednio dużych środków transportowych lub

grupy mniejszych, współpracujących ze sobą pojazdów.

Drugie z tych podejść wydaje się być bardziej uniwersal- ne, jednocześnie jest trudniejsze w realizacji. Pojazdy współpracujące w trakcie transportu wielkogabaryto- wych elementów mogą być użyteczne również po zakoń- czeniu realizacji tego zadania, jednakże problemem w tym przypadku jest współpraca operatorów, która nie

(2)

zawsze jest odpowiednia, a w krytycznych przypadkach może prowadzić do kosztownych wypadków. Problem ten może zostać rozwiązany przez zastosowanie grupy mobilnych robotów kołowych, poruszających się w zdefiniowanej formacji, gdzie pozycja każdego z agen- tów jest ściśle określona. Innymi istotnymi możliwościa- mi zastosowania grup autonomicznych robotów porusza- jących się w formacji są np. zadania patrolowe czy bojowe.

Kolejnym problemem w implementacji zrobotyzowa- nego, autonomicznego transportu wielkogabarytowego jest konieczność zastosowania złożonych algorytmów generowania i realizacji trajektorii ruchu poszczególnych agentów w formacji. Zadanie generowania trajektorii mobilnych robotów kołowych jest często spotykane w literaturze [1,3,4,7,13,14,18], gdzie problem ten jest najczęściej rozwiązywany z zastosowaniem dwóch typów metod: tzw. metod globalnych lub lokalnych. Metody globalne bazują na znajomości mapy otoczenia, nato- miast metody lokalne bazują na aktualnym stanie wie- dzy o środowisku, gdzie znana jest tylko mapa otoczenia wokół robota, będącego w zasięgu jego układu senso- rycznego. Mobilne roboty kołowe są obiektami opisany- mi nieliniowymi równaniami dynamiki, których parame- try mogą się zmieniać w czasie ruchu w zależności od warunków pracy. Problem ten w algorytmach sterowa- nia ruchem nadążnym jest często rozwiązywany poprzez zastosowanie nowoczesnych metod sztucznej inteligencji (AI, ang. Artificial Intelligence), takich jak sztuczne sieci neuronowe (NN, ang. Neural Networks) czy układy z logiką rozmytą (FL, ang. Fuzzy Logic). Istnieje wiele prób implementacji tych metod w układach generowania trajektorii czy układach sterowania ruchem robotów [14,18].

W artykule zaprezentowano hierarchiczny układ ste- rowania ruchem formacji mobilnych robotów kołowych (WMRF, ang. Wheeled Mobile Robots Formation), w którym zastosowano algorytmy FL oraz algorytmy aproksymacyjnego programowania dynamicznego (ADP, ang. Approximate Dynamic Programming) [15,16,17]

zbudowane z zastosowaniem NN. Układ sterowania składa się z trzech warstw: warstwy generowania trajek- torii ruchu formacji, warstwy generowania trajektorii dla poszczególnych agentów oraz warstwy realizacji ruchu.

W warstwie generowania trajektorii ruchu zastosowano koncepcję sterowania behawioralnego [18], które jest próbą naśladowania elementarnych zachowań organi- zmów żywych w rozwiązywaniu problemów generowania trajektorii ruchu do celu, czy trajektorii ruchu umożli- wiającej omijanie przeszkód. W mobilnej robotyce najczęściej spotykany jest problem wymagający połącze- nia realizacji dwóch zachowań: „podążaj do celu” (GS, ang. Goal Seeking) oraz „omijaj przeszkody” (OA, ang.

Obstacle Avoiding). Zazwyczaj problem ten jest rozwią- zywany poprzez implementację algorytmów generują- cych sterowania behawioralne w zadaniach GS

i OA, a następnie ich stałe połączenie w heurystycznie dobranych proporcjach, czy miękkie przełączanie w zależności od warunków środowiska, stosując do tego celu oddzielny algorytm. W prezentowanym artykule zastosowano nowe podejście do problemu generowania trajektorii ruchu w złożonym zadaniu „podążaj do celu z omijaniem przeszkód” (GSOA, ang. Goal Seeking with Obstacle Avoiding), poprzez zastosowanie jednego ele- mentu układu sterowania, w którym zastosowano dwa układy FL.

Wyniki prac zaprezentowanych w artykule są konty- nuacją wcześniejszych prac autorów związanych z problemami sterowania WMRF [8], generowaniem bezkolizyjnych trajektorii ruchu WMR [2,10,11,12], czy też sterowania ruchem nadążnym robotów [9]. Artykuł składa się z następujących części: część pierwsza zawiera wprowadzenie do problemów związanych ze sterowaniem WMRF, w części drugiej przedstawiono opis obiektu sterowania, część trzecia zawiera opis hierarchicznego układu sterowania. W kolejnej części przedstawiono wyniki badań numerycznych, ostatnia część podsumowu- je artykuł.

2. FORMACJA MOBILNYCH ROBOTÓW KOŁOWYCH

Obiektem sterowania jest WMRF. Analizę zagadnień związanych z planowaniem i realizacją ruchu formacji przeprowadzono, przyjmując liczbę n=3, agentów two- rzących formację.

2.1 MODEL MOBILNEGO ROBOTA KOŁOWEGO

Schemat j-tego mobilnego robota dwukołowyego, z trzecim kołem swobodnym, samonastawnym, został przedstawiony na rys. 1. WMR jest obiektem nieholonomicznym, którego dynamika jest opisywana z zastosowaniem nieliniowych równań ruchu. Składa się on z ramy 4, dwóch kół napędzających 1 i 2, oraz koła samonastawnego, podpierającego 3. Ruch mobilnego robota kołowego jest analizowany w płaszczyźnie xy.

Mobilny robot wyposażony jest w układ sensoryczny składający się z n=8, ( ,… , ), czujników ultradź- więkowych o maksymalnym zasięgu pomiaru dmx=4 [m], umożliwiających wykrywanie przeszkód znajdujących się w otoczeniu robota w odległościach , …, . Z punktem A(j)( , ) ramy j-tego WMR powiązany jest ruchomy układ współrzędnych o osiach x(j), y(j), natomiast β(j) to kąt skręcenia ramy WMR względem nieruchomego układu współrzędnych xy, to kąt pomiędzy osią pomiaru i-tego czujnika si, a osią ramy mobilnego robota, - sygnał sterujący i-tego koła, i=1,2, - prędkość kątowa i-tego koła.

(3)

Rys. 1. Schemat j-tego mobilnego robota kołowego

Współrzędne j-tego WMR w formacji są określane

poprzez wektor , , , , , gdzie

, – kąty obrotu kół 1 i 2. Kinematyka j-tego WMR jest opisana równaniem

! "#cos' ( 0

"#sin' ( 0

0 #

!, -

. /, (1)

gdzie "# - zdefiniowana maksymalna prędkość punktu A,

# - maksymalna prędkość kątowa obrotu ramy WMR,

- , . – sygnały sterowania warstwy gene- rowania trajektorii.

Zaproponowany hierarchiczny układ sterowania ru- chem WMRF działa w dyskretnej dziedzinie czasu, dlatego ciągły model Maggiego dynamiki WMR [5,6]

dyskretyzowano, stosując metodę Eulera. Przyjęto wektor stanu 0123 0 123, 0 123 , w którym wektor 0 123 4 123, 4 123 odpowiada wektorowi prędko- ści kątowych w zapisie ciągłym. Dyskretny model dyna- miki j-tego WMR w formacji został przyjęty w formie układu równań

0 125 3 0 1236 70123,

0 125 3 01238 79 : ; '0 123(0 1236 < '0 123( 879 : =>1238 ?123 ,

(2) gdzie h – parametr dyskretyzacji czasu, k – indeks kroków iteracji, M(j) – dodatnio określona macierz bezwładności WMR, 0123 – wektor kątów obrotu kół,

;@ '0123(0 123 – wektor momentów od sił odśrodko- wych i Coriolisa, <@ '0 123( – wektor oporów ruchu,

=>123 – wektor ograniczonych zakłóceń, ?123 – wektor sygnałów sterowania.

Opis układu zamkniętego wyznaczono, przyjmując dyskretne błędy nadążania zadanych parametrów kąto- wych obrotu kół

A123 01238 0> 123,

A123 0 1238 0> 123, (3)

gdzie zadane parametry ruchu WMR (0> 123, 0> 123) są generowane w czasie ruchu WMRF. Na podstawie błędów nadążania (3) zdefiniowano uogólniony błąd nadążania j-tego WMR w formie zależności

B123 A1236ΛA123, (4) gdzie Λ - stała macierz diagonalna o dodatnich współ- czynnikach.

Na podstawie definicji błędów nadążania (3) i (4), oraz modelu dynamiki WMR, wyznaczono wartość uogólnionego błędu nadążania j-tego WMR w kroku k+1

B125 3 8CD '0123( 6 C> '0123, 0>123,0>E123( 6 8CF1236 79 : ?123 (5) gdzie

CD '0123( 79 : ; '0123(01236 < '0 123( , C> '0123,0>123,0>E123( B1236 CG '0123, 0> 123, 0>E123(,

CG '0123,0> 123,0>E123( 7 ΛA1238 0>E123 , CF123 79 : =>123,

(6) gdzie CD '0 123( – wektor zawierający wszystkie nieli- niowości modelu WMR, 0>E123 – wektor zawierający zadane wartości przyspieszeń kątowych kół napędzają- cych, którego obecność wynika z zapisu wektora 0> 125 3 w kroku k-tym z zastosowaniem metody Eulera.

2.2 MODEL FORMACJI ROBOTÓW MOBILNYCH

WMRF składa się z m=3 robotów i została schematycznie przedstawiona na rys. 2.

(4)

Rys. 2. Schemat formacji mobilnych robotów kołowych.

Punkty A(j) ram WMR tworzą wirtualną strukturę o kształcie trójkąta równobocznego. Każdy z WMR jest wyposażony w 8 czujników ultradźwiękowych, jednakże nie wszystkie sygnały z układów sensorycznych robotów tworzących formację są brane pod uwagę w procesie generowania trajektorii ruchu. Wybrane czujniki zostały pogrupowane w celu wygenerowania znormalizowanych odległości do przeszkód przed WMRF ( H123# ), z prawej ( I123# ) oraz lewej strony formacji ( J123# ), co zostało szczegółowo opisane w kolejnym rozdziale. Punkt M( K123, K123) to centralny punkt wirtualnej struktury o kształcie trójkąta, natomiast K123 to kąt obrotu wirtualnej struktury. Zadaniem hierarchicznego układu sterowania jest wygenerowanie bezkolizyjnej trajektorii ruchu do celu G( L123, L123), znajdującego się w odle- głości ML123 od punktu M, gdzie kąt pomiędzy prostą pG, a osią x wynosi NL123.

3. HIERARCHICZNY UKŁAD STEROWANIA

Prezentowany hierarchiczny układ sterowania składa się z trzech warstw. Pierwszą, najwyższą warstwę stero- wania, stanowi generator trajektorii ruchu wirtualnej struktury WMRF. Warstwa ta generuje zadaną trajek- torię ruchu punktu M wirtualnej struktury. W drugiej warstwie hierarchicznego układu sterowania, na podsta- wie zadanej trajektorii ruchu punktu M, generowane są zadane trajektorie ruchu poszczególnych agentów wcho- dzących w skład formacji. Trzecia, najniższa warstwa hierarchicznego układu sterowania, składa się z n algo- rytmów sterowania ruchem nadążnym, gdzie n odpowia- da liczbie robotów w formacji. Jej zadaniem jest wyge- nerowanie sygnałów sterowania modułami napędowymi WMR, zapewniających realizację trajektorii ruchu

wygenerowanej przez wyższe warstwy hierarchicznego układu sterowania. Schemat hierarchicznego układu sterowania przedstawiono na rys. 3.

Rys. 3. Schemat hierarchicznego układu sterowania Warstwa generowania trajektorii ruchu wirtualnej struktury na podstawie zrealizowanych parametrów ruchu poszczególnych agentów 123 i sygnałów z ich układów sensorycznych P123 generuje zadane parametry ruchu punktu M wirtualnej struktury, >K123, na pod- stawie których są generowane zadane parametry ruchu poszczególnych agentów >123.

3.1 WARSTWA GENEROWANIA TRAJEKTORII RUCHU FORMACJI

W warstwie generowania trajektorii ruchu zastosowano koncepcję sterowania behawioralnego w celu planowania trajektorii ruchu WMRF.

W sterowaniu tym wyróżnia się podstawowe zadania wzorowane na świecie organizów żywych, takie jak: GS i OA. W algorytmach generowania trajektorii ruchu WMR problem generowania trajektorii ruchu w złożonym zadaniu GSOA zazwyczaj jest rozwiązywany poprzez implementację algorytmów generujących stero- wania behawioralne w zadaniach typu GS i OA, a następnie ich stałe połączenie w heurystycznie dobra- nych proporcjach, czy miękkie przełączanie w zależności od warunków środowiska, stosując do tego celu oddziel- ny algorytm. W prezentowanym artykule zastosowano nowe podejście do problemu generowania trajektorii ruchu w zadaniu GSOA, poprzez zastosowanie tylko jednego układu sterowania, w którym zastosowano dwa układy FL, z których jeden generuje sygnał -123 steru- jący zadaną prędkością ruchu punktu M wirtualnej struktury, drugi algorytm generuje sygnał .123 sterują- cy zadanym kątem obrotu wirtualnej struktury K123.

Generator trajektorii zrealizowano stosując układy FL, z modelem Takagi-Sugeno oraz trójkątnymi lub trapezowymi funkcjami przynależności do zbiorów

(5)

rozmytych. Układ FL generujący sygnał sterowania

-123 posiada dwa wejścia – znormalizowaną odległość do celu L123# ML123/MRS, oraz znormalizowaną odległość do przeszkód T123# T123/ RS, gdzie MRS - maksymalna odległość do celu, T123 minV J123, H123, I123 W - minimalna odległość do przeszkód,

H123 min' X 123, Y 123( – minimalna odległość do przeszkód przed WMRF, J123 min' E 123, E 123( – minimalna odległość do przeszkód po lewej stronie WMRF, I123 min ' Z 123, Z 123E ( – minimalna odle- głość do przeszkód po prawej stronie, J123# 2 ' J123/V J1236 I123W( 8 0.5 – znormalizowana minimalna odległość do przeszkód po lewej stronie formacji, I123# 2 ' I123/V J1236 I123W( 8 0.5 - znormalizowana minimalna odległość do przeszkód po prawej stronie WMRF. Układ FL generujący sygnał sterowania .123 posiada bardziej złożoną strukturę. Jest wyposażony w cztery wejścia: L123# i T123# , oraz ]T123 i ^L123 zdefiniowane zależnościami

]T123 I123# 8 J123# ,

^L123 NL1238 K123. (7) Układ z logiką rozmytą zawiera bazę m=48 reguł typu

_R: IF V L123# JEST dGMW I V T123# JEST dOMW I V]T123 JEST eMW I V^L123# JEST pMW TO -123 JEST uDM,

(8) gdzie ^L123# op81,1r – znormalizowany kąt ^L123, dGM, dOM, eM, pM – lingwistyczne etykiety funkcji przyna- leżności do zbiorów rozmytych przesłanek, pokazanych na rys. 4, uUD=-1, uUM=-0.6, uDM=0.6, uDD=1 – funkcje przynależności typu singleton konkluzji, gdzie:

M – mały, S – średni, D – duży, UD – ujemny duży, UM – ujemny mały, DM – dodatni mały, DD – dodatni duży.

3.2 WARSTWA GENEROWANIA

TRAJEKTORII RUCHU ROBOTÓW W FORMACJI

Warstwa generowania trajektorii ruchu robotów w formacji bazuje na idei wirtualnej struktury z centralnym punktem M, której orientację określa kąt

K123. Położenie i orientacja wirtualnej struktury zmieniają się zgodnie z przyjętym algorytmem warstwy generowania trajektorii w zalezności od odległości do przeszkód oraz lokalizacji celu G. Zadane położenia środków ram WMR wchodzących w skład formacji określają punkty s> . Zadane trajektorie ruchu poszczególnych agentów są generowane w taki sposób, aby punkty A(j)( 123, 123) ramy WMR w kolejnym kroku iteracji osiągnęły zadane położenie

s> > 123, > 123 , wyznaczone na podstawie znajomości położenia i orientacji wirtualnej struktury formacji.

W warstwie generowania trajektorii ruchu robotów w formacji wyznaczane są wartości sygnałów sterowania

H-123 i H.123, umożliwiające obliczenie zadanych wartości prędości kątowych obrotu kół napędowych poszczególnych agentów zgodnie z zależnością

t4> 123

4> 123u vw"# #M

"# 8 #M x t H-123

H.123

u, (9) gdzie r, l1 – wymiary wynikające z geometrii WMR.

Algorytm ten został szczegółowo opisany w [8].

Rys. 4. Funkcje przynależności do zbiorów rozmytych przesła- nek zmiennych: a) L123# , b) T123# , c) ]T123, d) ^L123.

3.3 WARSTWA REALIZACJI RUCHU

Trajektoria ruchu wygenerowana dla j-tego WMR jest realizowana przez najniższą warstwę hierarchicznego układu sterowania, w której zastosowano neuronwe algorytmy sterowania ruchem nadążnym.

W algorytmach tych zastosowano struktury ADP w konfiguracji Dualnego Heurystycznego Programowania Dynamicznego (DHP, ang. Dual-Heuristic Dynamic

(6)

Programming) [15,16,17]. Całkowity sygnał sterowania ruchem nadążnym j-tego WMR ?123 123, 123 składa się z sygnału sterowania generowanego przez strukurę aktor-krytyk DHP ?123, sygnału sterowania regulatora PD, ?yz123, sygnał sterowania nadzorującego

?{123, o strukturze wynikającej z analizy stabilności zamkniętego układu sterowania przeprowadzonej z zastosowaniem teorii stabilności Lapunova, oraz dodatkowego sygnału sterowania ?|123. Całkowity sygnał sterowania ruchem nadążnym j-tego WMR w formacji przyjęto w formie zależności

?123 }9 ~8? 1236 ?{1238 ?yz1238 ?|123•. (9) Schemat neuronowego algorytmu sterowania ruchem nadążnym j-tego agenta przedstawiono na rys. 5.

Rys. 5. Schemat układu sterowania ruchem nadążnym Neuronowy układ sterowania ruchem nadążnym, w którym zastosowano algorytmy ADP w konfiguracji DHP, został szczegółowo omówiony w [9].

4. WYNIKI BADAŃ NUMERYCZNYCH

Testy numeryczne zaproponowanego hierarchicznego układu sterowania zostały zrealizowane w środowisku obliczeniowym Matlab/Simulink. W tym rozdziale, w celu uproszczenia zapisu, pominięto indeks k w ozna- czeniach zmiennych. Parametr dyskretyzacji czasu w trakcie symulacji przyjmował wartość h=0.01 [s].

W środowisku obliczeniowym zamodelowano labora- toryjny tor pomiarowy i zasymulowano pracę czujników ultradźwiękowych systemu pomiarowego agentów wcho- dzących w skład formacji. Na bazie tych sygnałów hierarchiczny układ sterowania wygenerował i zrealizo- wał bezkolizyjne trajektorie ruchu WMR wchodzących w skład formacji. Zadanie było uznawane za zrealizowa- ne, jeżeli w trakcie symulacji nie wystąpiła kolizja żadnego z agentów z przeszkodami, oraz gdy po zakoń- czeniu ruchu punkt M wirtualnej struktury znalazł się w odległości od celu ML123€ 0.05 [m]. Tory ruchu po- szczególnych agentów w formacji wraz z mapą wirtual- nego toru pomiarowego przedstawiono na rys. 6.

Rys. 6. Mapa otoczenia z torami ruchu robotów mobilnych do celów w punktach GA, GB i GC

Zadane położenia puntu M wirtualnej struktury GA(7.5, 8.5), GB(13.5, 13.5) i GC(1.5, 13.5) oznaczono symbolami X. Ich lokalizację dobrano tak, aby wygene- rowanie bezkolizyjnej trajektorii ruchu WMRF do celu nie było możliwe z zastosowaniem sterowań behawioral- nych typu GS lub OA. Rozwiązanie tego problemu wymaga zastosowania generatora trajektorii, który w odpowiedni sposób łączy sygnały sterowania charakte- rystyczne dla sterowań behawioralnych w zadaniach GS i OA, przez co umożliwia wygenerowanie bezkolizyjnej trajektorii ruchu w złożonym zadaniu GSOA.

Odległości do celu ML otrzymane w trakcie realizacji ruchu WMRF do zadanych punktów we współrzędnych mapy przedstawiono na rys. 7.a. Na rys. 7.b przedsta- wiono sygnały sterowania - i . warstwy planowania trajektorii wygenerowane w trakcie ruchu WMRF do punktu GA(7.5, 8.5). Z przebiegu wartości sygnału sterowania - wynika, że punkt M wirtualnej struktury formacji przez większość czasu przemieszczał się z pręd- kością bliską prędkości maksymalnej, jedynie w czasie

•op33; 35r [s], ze względu na odległość do przeszkód, wartość sygnału sterowania zadaną prędkością ruchu wirtualnej struktury została zredukowana. Po czasie

• „ 53 [s] sygnał sterowania został zredukowany do wartości bliskich zero, co wiąże się z osiągnięciem zada- nego położenia przez WMRF. Wartość sygnału sterowa- nia prędkością kątową obrotu własnego wirtualnej struktur WMRF, ., zmienia się w początkowej fazie ruchu w zależności od odległości od przeszkód w sposób zapewniający bezkolizyjny ruchu formacji. W końcowej fazie ruchu większe znaczenie w wartościach sygnałów sterowania ma zadanie GS, sygnał sterowania . zmie- nia się tak, aby możliwe było osiągnięcie celu przez punkt M wirtualnej struktury.

(7)

Rys. 7.a) Przebiegi wartości odległości lG do celów GA, GB i GC, b) przebiegi wartości sygnałów sterujących - i . w trakcie

ruchu do celu GA

Na podstawie wartości sygnałów sterowania warstwy generowania trajektorii ruchu robotów w formacji wyge- nerowano zadane trajektorie ruchu poszczególnych agentów. Na rys. 8a przedstawiono przebiegi wartości zadanych prędkości kątowych obrotu kół napędzających j=3 WMR w formacji. Zadane parametry ruchu zostały zrealizowane z zastosowaniem warstwy realizacji ruchu poprzez podanie na układy napędowe sygnałów sterowa- nia ruchem nadążnym, pokazanych na rys. 8b. Trajekto- ria ruchu WMR została zrealizowana z błędami nadąża- nia, których przebiegi dla i=1 koła j=3 WMR przedsta- wiono na rys. 8c.

Rys. 8.a) Przebiegi wartości zadanych prędkości kątowych obrotu kół 1 i 2 robota j=3 w formacji, b) przebiegi całkowi- tych sygnałów sterowania ruchem nadążnym, c) przebiegi

wartości błędów nadążania koła i=1 robota j=3

W algorytmie sterowania ruchem nadążnym zasto- sowano struktury DHP, w których znajdują się NN.

W prezentowanym teście numerycznym zastosowano zerowe wartości początkowe wag NN, co wiąże się z największymi błędami realizacji zadanej trajektorii w początkowej fazie ruchu, gdy proces adaptacji wag dopiero rozpoczyna się. Błędy realizacji trajektorii są następnie redukowane do wartości bliskich zeru. Prze- biegi wartości wag NN aktora 1 oraz krytyka 1 j=3 agenta przedstawiono na rys. 9a i b odpowiednio. Zasto- sowano NN Random Vector Functional Link (RVFL) o m=8 neuronach, stałych wartościach wag wejściowych dobieranych losowo w procesie inicjalizacji sieci, sigmo- idalnych bipolarnych funkcjach aktywacji neuronów oraz adaptowanych w czasie symulacji warstwach wag wyj- ściowych sieci. Przyjęto zerowe wartości początkowe wag warstw wyjściowych sieci, następnie były one adaptowa- ne w trakcie testu numerycznego zgodnie z przyjętym algorytmem adaptacji wag.

Wartości wag NN pozostają ograniczone w trakcie eksperymentu.

Rys. 9.a) Przebiegi wartości wag NN i=1 aktora układu stero- wania j=3 agenta, b) przebiegi wartości wag NN i=1 krytyka.

5. PODSUMOWANIE

W artykule zaprezentowano dyskretny, hierarchiczny układ sterowania ruchem WMRF, w którym zastosowa- no koncepcję wirtualnej struktury. Algorytm sterowania składa się z warstwy generowania trajektorii ruchu, w której zastosowano nowe podejście do sterowania behawioralnego, gdzie złożone zadanie „podążaj do celu z omijaniem przeszkód” zrealizowano z zastosowaniem jednej struktury warstwy generowania trajektorii zbu- dowanej z dwóch układów FL. Druga warstwa hierar- chicznego układu sterowania odpowiada za generowanie trajektorii ruchu poszczególnych agentów w formacji.

Najniższa warstwa hierarchicznego układu sterowania składa się z algorytmów realizacji ruchu nadążnego poszczególnych agentów. W warstwie tej zastosowano algorytmy ADP w konfiguracji DHP, zbudowane

(8)

z zastosowaniem NN RVFL. Zaprezentowany algorytm sterowania umożliwia generowanie bezkolizyjnych tra- jektorii ruchu WMRF w nieznanym środowisku 2D ze statycznymi przeszkodami. Algorytm sterowania działa

on-line i nie wymaga fazy wstępnego uczenia wag NN.

Wartości błędów nadążania i wag NN pozostają ograni- czone w trakcie symulacji ruchu WMRF.

Literatura

1. Arkin R. C.: Bahavioural-based robotics. Cambridge: MIT Press, 1998.

2. Burghardt A: Sterowanie behawioralne minirobota kołowego. „PAK” 2004, Vol. 11, p. 26 - 29.

3. Egerstedt, M., Hu, X.: Formation constrained multi-agent control. „IEEE Trans. Robot. Autom.” 2001, 16, Vol.

7, p. 947 - 951.

4. Fahimi F.: Autonomous robots. Modeling, path planning, and control. New York: Springer, 2009.

5. Giergiel J., Zylski W.: Description of motion of a mobile robot by Maggie’s Equations. „Journal Theoretical and Applied Mechanics” 2005, 3, Vol. 43, p. 511 - 521.

6. Giergiel M., Hendzel Z., Żylski W.: Modelowanie i sterowanie mobilnych robotów kołowych. Warszawa: PWN, 2002.

7. Hendzel Z.: Fuzzy reactive control of wheeled mobile robot. “Journal of Theoretical and Applied Mechanics”

2004, 3, Vol. 42, p. 503 - 517.

8. Hendzel Z., Burghardt A., Szuster M.: Artificial intelligence methods in reactive navigation of mobile robots formation. In: 4th International Conference on Neural Computation Theory and Applications, 2012. Proceedings.

SciTePress, p. 466 - 473.

9. Z. Hendzel, M. Szuster: Discrete model-based adaptive critic designs in wheeled mobile robot control.

L. Rutkowski et al. (Eds.): ICAISC 2010, Part II, „LNCS” 2010, Vol. 6114, p. 264 - 271.

10. Hendzel Z., Szuster M.: Neuronowe programowanie dynamiczne w sterowaniu behawioralnym mobilnym robo- tem kołowym, „Acta Mech. Automatica” 2011, 1, Vol. 5, p. 28 - 36.

11. Z. Hendzel, M. Szuster: Neural dynamic programming in reactive navigation of wheeled mobile robot.

L. Rutkowski et al. (Eds.): ICAISC 2012, Part II, „LNCS” 2012, Vol. 7268, p. 450 - 457.

12. Hendzel Z., Szuster M., Neural sensor-based navigation of wheeled mobile robot in unknown environment.

„PAR” 2013, 1, p. 114 - 120.

13. Maaref, H., Barret, C.: Sensor-based navigation of a mobile robot in an indoor environment. „Robot. Auton.

Syst.” 2002, Vol. 38, p. 1-18.

14. Millan, J.: Reinforcement learning of goal-directed obstacle-avoiding reaction strategies in an autonomous mobile robot. „Robot. Auton. Syst.” 1995, 4, Vol. 15, p. 275 - 299.

15. Powell W.B.: Approximate dynamic programming: solving the curses of dimensionality. Princeton: Willey- Interscience, 2007.

16. Prokhorov D., Wunch D.: Adaptive critic designs. „IEEE Trans. Neural Netw” 1997, Vol. 8, p. 997 - 1007.

17. Si, J., Barto, A.G., Powell, W.B., Wunsch, D.: Handbook of learning and approximate dynamic programming.

IEEE Press, Wiley-Interscience, 2004.

18. Yamaguchi, H.: Adaptive formation control for distributed autonomous mobile robot groups. In Robotics and Automation, 1997. Proceedings., 1997 IEEE International Conference on, Vol. 3, p. 2300 - 2305.

Cytaty

Powiązane dokumenty

W artykule przedstawione zostały rezultaty dostosowania uniwersalnego modelu zastępczego ogniwa do przykładowego modułu komercyjnego KC32T02 oraz za- prezentowano

Sterowanie ruchem WMR odbywa się z zastosowaniem hierarchicznego układu sterowania, złożonego z warstwy planowania trajektorii ruchu, oraz war- stwy realizacji ruchu.

Drgania typu „chatter” zainteresowały badaczy już ponad 100 lat temu. XX wieku wyprowa- dzono już pierwsze hipotezy oraz udowodniono przyczy- ny ich powstawania.

przez punkt A ramy WMR. Na podstawie wartości sygnałów sterowania warstwy planowania trajektorii ruchu WMR generowano w czasie ruchu zadane wartości parametrów kątowych obrotu kół

Przeprowadzono testy numeryczne zaproponowanego neuronowo-rozmytego algorytmu sterowania ruchem robota manipulacyjnego z narzuconymi więzami holo- nomicznymi. Testy

Zamodelowany system wrzecionowy poddano analizie częstotliwości drgań własnych oraz analizie odkształceń i naprężeń od działającej siły odśrodkowej. 4a)

Sterowanie ruchem WMR odbywa się z zastosowaniem hierarchicznego układu sterowania, złożonego z warstwy planowania trajektorii ruchu, oraz war- stwy realizacji ruchu.

Physbe - lewa komora serca.. Lądowanie na księżycu