• Nie Znaleziono Wyników

Zastosowanie metod przetwarzania obrazów w segmentacji danych pochodzących z dalmierza laserowego 3D / PAR 2/2009 / 2009 / Archiwum / Strona główna | PAR Pomiary - Automatyka - Robotyka

N/A
N/A
Protected

Academic year: 2021

Share "Zastosowanie metod przetwarzania obrazów w segmentacji danych pochodzących z dalmierza laserowego 3D / PAR 2/2009 / 2009 / Archiwum / Strona główna | PAR Pomiary - Automatyka - Robotyka"

Copied!
10
0
0

Pełen tekst

(1)

dr Barbara Siemitkowska

Politechnika Warszawska, Wydzia Mechatroniki Instytut Podstawowych Problemów Techniki PAN mgr Arkadiusz Zychewicz

dr in. Micha Gnatowski

Instytut Podstawowych Problemów Techniki PAN,

ZASTOSOWANIE METOD PRZETWARZANIA OBRAZÓW

W SEGMENTACJI DANYCH POCHODZCYCH

Z DALMIERZA LASEROWEGO 3D

W poniszej pracy zaprezentowana zostanie metoda tworzenia map semantycznych otoczenia robota mobilnego. Robot jest wyposaony w dalmierz laserowy, który umoliwia zbieranie trójwymiarowej informacji o rodowisku. Dane s zapamitywane jako kolorowy obraz. Proces segmentacji danych i tworzenia trójwymiarowej mapy otoczenia skada si z nastpujcych etapów: wyodrbnienie obszarów jednorodnych, opisanie krawdzi i powierzchni obszarów, klasyfikacja, tworzenie grafu opisujcego scen. Przyjto zaoenie, e klasyfikacja odbywa si na podstawie wprowadzonych wczeniej do bazy wiedzy zbioru regu i dodatkowej informacji przechowywanej w etykietowanych grafach. Przeprowadzone eksperymenty wykazay, e segmentacja powierzchni 3D przy pomocy klasycznych metod przetwarzania obrazów, które s stosowane w widzeniu maszynowym umoliwia przeprowadzanie oblicze w sposób efektywny. Proces tworzenia mapy semantycznej jest nadal opracowywany, ale wstpne wyniki s zadawalajce.

PICTURE SEGMENTATION METHODS IN 3D LASER DATA SEGMENTATION In the article a method of building semantic map of robots' environment is presented. A robot is equipped with a laser sensor which enables to obtain 3 dimensional information of the scene. Data is stored in a colour image. The segmentation and map building processes consist of the following parts: selecting homogeneous areas in the image obtained from the data, the edges and the areas description, classification, creating a graph which describes the scene. It is assumed, that classification is performed based on previously stored rules database and additional information stored in labelled graphs. Experiments which have been done showed that 3D area segmentation, using classical pattern recognition methods which are widely used in machine vision enables to perform computations effectively. The semantic map creation process is still under development but the performed results are satisfied.

1. WSTP

Autonomiczny robot mobilny, aby wykonywa powierzone mu zadania powinien posiada map otoczenia. Mapa taka moe by zadana lub tworzona na podstawie wskaza sensorów. W literaturze wymienione s nastpujce sposoby przechowywania informacji: reprezentacja rastrowa [1], mapa cech [2], topologiczny opis sceny [3], reprezentacja hybrydowa rastrowo-topologiczna, reprezentacja hybrydowa metryczno-metryczna [4]. W wikszoci przypadków tworzona jest mapa dwuwymiarowa. Mapa taka moe by jednak niewystarczajca w sytuacji, gdy robot porusza si na zewntrz budynków lub jeli przeszkody umieszczone s na rónej wysokoci. W takiej sytuacji konieczna jest reprezentacja 3D. W robotyce stosowa-ne s ukady stereowizyjstosowa-ne [5,6], ale wymagaj ostosowa-ne duych mocy obliczeniowych oraz

(2)

sta-wskaza dalmierza laserowego 3D [7] lub kamer metrycznych, które oprócz informacji o barwie obiektów przekazuj take informacj o odlegoci. Tworzc map trójwymiarow podstawowy problem, jaki naley rozwiza to bardzo dua liczba danych. Czas wykonywa-nia operacji takich jak agregacja i filtracji danych powinien by krótki. W literaturze spotyka si wiele sposobów reprezentacji map trójwymiarowych [8-12], jedna z nich to tworzenie 2,5D lub trójmiarowych map rastrowych. Inny powszechnie stosowany w grafice kompute-rowej sposób polega na generowaniu siatki wieloboków opisujcych powierzchnie obiektów znajdujcych si w rodowisku. W niedalekiej przyszoci roboty mobilne bd uczestniczyy w codziennym yciu czowieka, dlatego sposób opisu otoczenia powinien uwzgldnia oprócz cech metrycznych take cechy semantyczne sceny. Dziki temu mona bdzie wyda-wa robotowi polecenia typu: jed do kuchni i przynie talerz. Konieczne wic jest stworze-nie algorytmów, które umoliwiaj tworzestworze-nie map semantycznych. Opisywane w tej pracy metody s w fazie eksperymentów, ale otrzymane przez nas wyniki wydaj si by na tyle interesujce, aby je zaprezentowa na konferencji Automation 2009.

Proponowany w naszej pracy algorytm skada si z nastpujcych etapów: x zbieranie danych pomiarowych

x zapisanie danych w postaci obrazu kolorowego, x segmentacja obrazu,

x trójwymiarowa reprezentacja obszarów jednorodnych, x klasyfikacja obszarów, na podstawie bazy wiedzy, x tworzenie semantycznej mapy otoczenia.

2. ZBIERANIE DANYCH POMIAROWYCH

Dane zbierane s przy pomocy dalmierza laserowego SICK LNS 200, zamontowanego na gowicy obrotowej umoliwiajcej obrót lasera z pozycji poziomej do pionowej. Ukad zosta wykonany i zaprojektowany na wydziaach: Mechatroniki oraz Elektroniki i Technik Informacyjnych Politechniki Warszawskiej. Dane otrzymywane z dalmierza moemy zapisywa w postaci trójki liczb: { rij,Tj,Mi }, gdzie r jest odlegoci,ij Tj - jest ktem obrotu serwomchanizmu, Mi jest ktem skanowania dalmierza. Na rys. 1 przedstawiono

przestrze skanowania oraz sposób zbierania danych.

Otrzymane w ten sposób dane mog by przedstawione w postaci macierzy o rozmiarze

MxN. M okrela liczb rónych pooe gowicy skanujcej. N jest liczb odczytów

otrzymanych z dalmierza laserowego w danym cyku skanowania. Poniewa skaner zbiera dane z rozdzielczoci 1° z przedziau 0° - 180° to N = 181. Parametr M zaley od przyjtej rozdzielczoci obrotu serwomechanizmu.

Tak otrzymane dane s przeliczane z biegunowego do kartezjaskiego ukadu wspórzdnych wedug wzorów:

(3)

i j ij ij i ij ij i j ij ij r z r y r x M T M M T sin cos sin sin sin (1) a) b) c)

Rys. 1. Zbieranie danych pomiarowych: a) kt obrotu serwomechanizmu, b) kat skanowania, c) przestrze skanowania

Kolejnym etapem jest klasyfikacja punktów. Dla kadego punktu (z wyczeniem punktów brzegowych) obliczany jest wektor p normalny do powierzchni [13], do której naley dany ij

punkt [12]. Wektor ten jest wyznaczony jako iloczyn wektorowy pijokrelony nastpujco:

ij ij ij ij ij ij ij ij ij ij j i ij j i ij j i ij ij p p p z z y y x x p z z y y x x p 2 1 1 1 1 2 1 1 1 1 ] , , [ ] , , [ …             (2)

W przypadku, gdy odlegoci pomidzy punktami s niewielkie, to obliczony iloczyn wektorowy, jest obarczony duym bdem. W celu wyeliminowania tego bdu, zwikszany jest promie ssiedztwa i do wyliczania iloczynu wektorowego dla punktu (xij,yij,zij) brane s

takie punkty (xkl, ykl, zkl), które speniaj warunek [14]:

, ) ( ) ( ) ( 2 2 2 2 1 H H t xklxij  ykl yij  zkl zij t (3) gdzie H1, H2 przyjty próg dolny i górny.

Skadowe wektora normalnego mog by traktowane jako skadowe RGB pikseli obrazu.

W zwizku z tym, kademu punktowi zostaje przypisany kolor, okrelajcy kierunek normalnej w danym punkcie. Przykad obrazu, który powsta na podstawie chmury punktów i wyodrbnionych normalnych jest zaprezentowany na rys. 2. Wstpn segmentacj danych moemy wic przeprowadzi dla obrazu, a nastpnie otrzymane wyniki zapisa w postaci

(4)

a) b)

Rys. 2. Dane z dalmierza laserowego 3D: a) zdjcie otoczenia, b) chmura punktów

Rys. 3. Kolorowy obraz chmury punktów (rys. 2 b)

3. SEGMENTACJA OBRAZU

Celem segmentacji jest wydzielenie i klasyfikacja obszarów jednorodnych. W opisywanym przykadzie obszary jednorodne skadaj si ze zbioru punktów lecych na jednej paszczynie. Punkty te na otrzymanym kolorowym obrazie s reprezentowane jako zbiory punktów o takiej samej barwie. Przed przystpieniem do wyodrbniania tych obszarów naley wykona klasyczne algorytmy przetwarzania obrazów.

W pierwszej kolejnoci obraz zosta poddany obróbce wstpnej jej celem jest usunicie wystpujcych szumów. Zastosowano filtry: medianowy, gaussowski i progujcy.

Filtr medianowy – jest to nieliniowy filtr do przetwarzania obrazów, bardzo dobrze nadaje si do usuwania szumu drobnoziarnistego. Zalet jego jest to, e zachowuje krawdzie. Filtr operuje na punktach ssiednich szeregujc je od najmniejszej do najwikszej i wybierajc warto rodkow (tj. median) .

(5)

Filtr gaussowski – filtr bazujcy na ssiednich punktach, jest to splot odpowiedniego frag-mentu obrazu z mask w której znajduje si funkcja Gaussa dla przykadu wykorzystywana maska dla okna 3x3. Filtr ten rozmywa krawdzie.

» » » ¼ º « « « ¬ ª 1 1 1 1 4 1 1 1 1 12 1

Filtr progujcy – w klasycznej wersji wszystkie wartoci poniej zadanego progu s zamieniane na zero. Dziki czemu atwo jest usun tzw. biay szum.

Nastpnym etapem jest wykrycie krawdzi. W tym celu zostay zastosowane filtry Laplac'a i Canny'ego.

Filtr Laplace'a – szybki filtr do wykrywania krawdzi. Realizowany jest przez splot maski z obrazem. Przykad maski 3x3:

» » » ¼ º « « « ¬ ª         1 1 1 1 8 1 1 1 1

Filtr Sobel'a wykrywa krawdzie o okrelonym kierunku. Realizowany jest przez splot maski z obrazem. Przykad maski 3x3 dla kierunku 0º:

» » » ¼ º « « « ¬ ª    1 0 1 2 0 2 1 0 1

Jest on uywany w filtrze Canny'ego do wstpnego wykrywania krawdzi.

a) b) c)

Rys. 4. Etapy przetwarzania obrazu (rys. 2 b): a) wygadzanie, b) filtr Sobela, c) wykrywanie krawdzi

Filtr Canny'ego jest to wieloetapowy algorytm zoptymalizowany do wykrywania krawdzi. Zalet filtru Canny’ego jest to, e w wyniku stosowania otrzymujemy krawdzie zamknite o gruboci jednego piksela. Na rys. 4 przedstawiono etapy przetwarzania obrazu.

(6)

4. KLASYFIKACJA I OPIS OBSZARÓW

Po wyodrbnieniu na podstawie analizy obrazów grup punktów jednorodnych, s one zapisywane w postaci reprezentacji trójwymiarowej, a nastpnie s klasyfikowane. Obiekt jest opisywany jako para atrybutów (krawd, powierzchnia).

x Krawd jest reprezentowana jako amana w przestrzeni 3D, zapisywana jest jako cig wierzchoków {(xwi,ywi,zwi)}i=0,..,K, gdzie K jest liczb wierzchoków.

x Powierzchnia jest reprezentowana jako wektor [A,B,C] normalny do paszczyzny, która zawiera punkty nalece do powierzchni.

Metoda opisu podstawowych prymitywów geometrycznych jest wystarczajca w przypadku pomieszcze biurowych, ale moe okaza si zbyt uboga w przypadku rodowiska na zewntrz budynków. W przyszoci planujemy rozszerzenie modelu o modu analizy innych powierzchni. Zagadnienie to moemy sprowadzi do poszukiwania tekstur w obrazie.

a) b) c)

Rys. 5. Wykryte obiekty: a) podoga, b) sufit, c) elementy równolege do podogi

W kolejnym etapie, kadej powierzchni przypisujemy pewn etykiet. Cz etykiet ma znaczenie semantyczne. Tego typu etykiety to:

x Podoga – zbiór punktów lecych na jednej paszczynie, wyznaczonej przez unormowany wektor normalny [0,0,1] , i wartoci wspórzdnej z=0.

x Sufit - zbiór punktów lecych na jednej paszczynie, wyznaczonej przez unormowany wektor normalny [0,0,1] , i wartoci wspórzdnej z=max.

x ciana - zbiór punktów lecych na jednej paszczynie, wyznaczonej przez unormowany wektor normalny [a,b,0] dla którego co najmniej jeden z wierzchoków ma warto wspórzdnej z=0, co najmniej jeden z wierzchoków ma warto wspórzdnej z=max oraz powierzchnia wykrytego obiektu przekracza pewien

przyjty próg.

Pozostaym obiektom przypisujemy etykiety opisujce cechy geometryczne. Takie etykiety to:

Dua_powierzchnia – powierzchnia, której pole jest wiksze ni zadany próg, ale nie styka

si z sufitem lub z podog, i nie jest równolega, ani do sufitu, ani podogi.

Powierzchnia_równolega – zbiór punktów lecych ma powierzchni równolegej do podogi. Powierzchnia_prostopada – zbiór punktów nalecych do jednej paszczyzny, które nie

(7)

Brak_klasyfikacji – zbiór punktów, których nie mona opisa przy pomocy podanych regu.

Punkty nalece do obiektów typu podoga, sufit mog zosta wykryte bezporednio na

podstawie analizy obrazu. Na rys. 5 przedstawiono opisane powyej grupy obiektów równolegych do podogi, grupy te reprezentowane s przez punkty o barwie niebieskiej. Dokonujc podziau wykorzystujemy oprócz informacji o barwie take informacj metryczn (wspórzdnych punktów).

Na rys. 6 przedstawiono wynik klasyfikacji pozostaych obszarów. Kolorem czerwonym zaznaczono obszary zakwalifikowane jako ciana, ótym due powierzchnie, zielonym mae powierzchnie.

Rys. 6. Obiekty prostopade do podogi

W kolejnym kroku na podstawie wyodrbnionej grupy tworzony jest etykietowany graf. W grafie tym wzy reprezentuj wyodrbnione fragmenty sceny. Dwa wzy s ze sob poczone, jeli obszary ssiaduj ze sob. Etykieta gazi okrela sposób poczenia obszarów. Wyróniamy krawdzie: pionowe, poziome i ukone.

Dalszy proces tworzenia semantycznej otoczenia jest bardzo podobny do procesu analizy zda. Znaczenie danego sowa zaley nie tylko od cigu liter, ale take od kontekstu, w jakim dany wyraz zosta uyty. Dlatego kolejny etap klasyfikacji obiektów moemy przeprowadzi, analizujc nie tylko pojedynczy obszar, ale uwzgldniajc informacj o obszarach ssiednich.

5. BAZA WIEDZY

W wikszoci baz wiedzy przyjmuje si zaoenie, obiekty reprezentowane s przy pomocy wektorów, których wspórzdne opisuj stopie potwierdzenia hipotezy o wystpowaniu pewnych cech lub przekazuj pewn informuj metryczn np. waga, wzrost itp. W wielu za-daniach praktycznych np. w zaza-daniach zwizanych z rozpoznawaniem jzyka naturalnego czy zoonych struktur biologicznych opis w postaci wektora cech nie jest wystarczajcy. Do tego typu zagadnie naley równie semantyczny opis obiektów znajdujcych si w otoczeniu ro-bota. W pomieszczeniu typu wntrze pomieszczenia powierzchni wikszo obiektów

(8)

mo-laj ten obiekt w sposób jednoznaczny. W proponowanym systemie wyróniamy dwie klasy obiektów:

x obiekty proste - s to obiekty, które moemy w sposób jednoznaczny opisa przy pomocy zbioru regu do nich moemy zaliczy opisane w poprzednim rozdziale pojcia typu: podoga, sufit, ciana.

x obiekty zoone – s to obiekty, które skadaj si z kilku powierzchni (np. schody) lub wynik klasyfikacji zaley od etykiet obszarów ssiednich (np. drzwi).

W klasycznej teorii graf skada si z wzów, które s ze sob poczone jeli odpowiadajce wzom obiekty s ze sob w relacji, w przypadku grafów etykietowanych etykiety pocze midzy wzami okrelaj typ poczenia.

W naszym systemie obiekty zoone s reprezentowane przy pomocy grafów etykietowanych, informacja ta jest uzupeniona przez informacj metryczn.

Obiekt drzwi jest opisywany przy pomocy regu które uwzgldniaj pewn informacj

metryczn:

Obiektd naley do klasy drzwi_zamknite, jeli naley do klasy dua_powierzchnia oraz s1<

szeroko < s2, wysoko > h1, gdzies1, s2, h1 s parametrami. Dodatkowo powinny zachodzi

relacje zapisywane przy pomocy grafu przedstawionym na rys. 7, pp – jest etykiet

okrelajc krawd pionow, a pz – krawd poziom, pa – okrela relacj równolegoci

paszczyzn.

Rys. 7. Graf etykietowany opisujcy obiekt typu drzwi zamknite

Innym sposobem zapisu obiektów jest zapis relacji midzy prymitywami geometrycznymi obiektów. Na rys. 8 przedstawiono graf opisujcy obiekt typu schody. Kolorem jasno niebieskim zaznaczono obszary równolege do podogi, a kolorem ótym obszar prostopady do podogi. Etykieta pz okrela e midzy

obiektami wystpuje krawd pozioma, etykiety pr1, pr2, okrelaj e powierzchnie

(9)

Rys.8. Graf etykietowany opisujcy obiekt schody 6. PODSUMOWANIE

W powyszym artykule przedstawiono koncepcj i wstpne eksperymenty systemu automatycznego tworzenia semantycznych map otoczenia robota mobilnego. Do wstpnego przetwarzania danych pochodzcych ze skanera 3D wykorzystano klasyczne metody analizy obrazów paskich. W opracowanym systemie wykorzystano procedury biblioteki OpenCV, dziki temu czas przetwarzania obrazów nie przekracza 200 ms. Czas niezbdny do klasyfikacji obiektów jest zaleny od liczby obiektów, które powinny by zapamitanie w bazie wiedzy. W obecnym stanie systemu obiektów jest kilkanacie, w przyszoci planujemy proces przeszukiwania skróci przypisujc do kadego obiektu funkcj haszujc. Dziki temu przeszukiwane s jedynie elementy bazy o zadanej wartoci funkcji. Nawet jeli w pewnym pomieszczeniu nie wszystkie elementy zostay sklasyfikowane moliwe jest okrelenie typu pomieszczenia: np. korytarz, pokój. Moliwy jest te topologiczny opis sceny. Opisywany system jest niezbdny w przypadku wspópracy robota z czowiekiem. Umoliwia wydawanie polece typu: jed do drzwi. Mapy semantyczne mog by wykorzystywane w procesie lokalizacji robota. W przypadku planowania trasy oprócz informacji topologicznej potrzebna jest take informacja metryczna, dlatego oprócz informacji topologicznej z kadym elementem wizana jest informacja metryczna. Opisywany system jest nadal rozwijany i testowany konieczne jest wprowadzenie klasyfikatorów w których jest okrelana niepewno wyniku klasyfikacji. Planujemy take stworzenie opisu hierarchicznego w którym oprócz obiektów bd równie klasyfikowane cae pomieszczenia oraz budynek.

Opisane algorytmy zostay wykonane w ramach grantu MEiN. 4311/B/T02/2007/33. LITERATURA

1. Moravec H. , Elfes A.: High resolution maps from wide angle sonar, Proc. IEEE International Conference on Robotics and Automation, s. 116 - 121, 1985. 2. Andersen C.S. Jones S. and Crowley J.L. Appearance Based Processes for Visual

(10)

3. Triebel R. Frank B. Meyer J. Burgard W.: First Steps Towards a Robotic System for Flexible Volumetric Mapping of Indoor Environments, CD-ROM. IAV04, 2004. 4. B. Siemitkowska. Hybrydowa reprezentacja otoczenia robota mobilnego. PAR vol.

CD ROM, 2006.

5. Floryczyk R., Robot Vision, Wiley-Vch, 2005.

6. Gonzalez R. C., Digital Image Processing, Adison-Wesley, Reading MA, 1992. 7. Sakas G., Hartig J., Interactive Visualization of Large Scalar Voxel Fields.

Visualization, Boston, USA, s. 29--36, 1992.

8. Sawwa R., Siemitkowska B., Racz J., 2.5D Map Building Based on LRF Readouts. III-d Int. Symp. on Methods and Models in Automation and Robotics. s. 13--15. 1997.

9. Sawwa R., Siemitkowska B., Racz J.: A Laser Range Finder for Mobile Robot Navigation. 28-th International Symposium on Robotics. Detroit, MI USA. s. 13--15, 1997.

10. Siemitkowska B., Gnatowski M., Zychewicz A. Fast Method of 3D Map Building Based on Laser Range Data. Jamris. s. 65-70, 2007.

11. Schroeder W. , Zarge J. , Lorensen W., Decimation of Triangle Meshes. Computer Graphics. s. 65-70, 1992.

12. J. Weingarten, Siegwart R.: EKF-based 3D SLAM for Structured Environment Reconstruction. IROS 2005.

13. D.L. Page, Y. Sun, A.F. Koschan, J.Paik, M. A. Abidi, Normal Vector Voting: Crease Detection and Curave Estimation on Large, Noisy Mesh. Graphical Models, vol. 64, 2002, s. 199-229.

14. Siemitkowska B., Gnatowski M., Chojecki R.: Zastosowanie sieci komórkowych w procesie segmentacji danych pochodzcych z dalmierza laserowego 3D

Krajowa Konferencja Robotyki, Oficyna Wydawnicza Politechniki Warszawskiej, 2008, s. 121-130.

Cytaty

Powiązane dokumenty

W ramach transakcji, których celem jest zaanga¿owanie czasowo wolnych œrodków pieniê¿nych banków mo¿na wyró¿niæ kolejne dwa ich typy: – reverse repo – operacje

Z drugiej strony, różnego typu innowacje będące często wytworem poszczególnych osób, aby stały się elementem życia społecznego, muszą być przyswojone sobie przez

Dynamiczny rozwój proregionalnej polityki gospodarczej Unii Europejskiej jest przesłanką podjęcia głębszej refleksji naukowej nad problemem regionalizacji i towarzyszących

Wynikają one przede wszystkim z różnych rozwiązań szczegółowych stosowanych w tych krajach i dotyczą: - różnych form wprowadzania w życie przepisów z zakresu rachunkowości

Uwarunkowania poda˝y na rynku dzieł sztuki Mając na względzie niepowtarzalny charakter każdego dzieła sztuki, w niniejszym artykule autorka rozważy wielkość podaży dzieł

Emisja obligacji ma równie˝ pewne wady, z których najwi´ksze to: – koszty emisji, – obowiàzki informacyjne takie same dla wszystkich emitentów i pozwalajàce ujawniç o wiele

Odległe miejsce powiatu tatrzańskiego według liczby ludności, pracujących i zatrudnionych nie przekładało się na bardzo wysoką ocenę przedsiębiorczości, potencjału rozwojowego

przy których brak dostosowań cen nominalnych okazuje się optyma lną reakcją na szoki nomin;llne I 9 • Po l ożenie przez nowych keynesislów nacisku na interakcje między