• Nie Znaleziono Wyników

Statystyczne modele kształtu

W dokumencie Index of /rozprawy2/10605 (Stron 28-33)

3.3 Active Appearance Models

3.3.2 Statystyczne modele kształtu

W pracy [18] przedstawione zostały niuanse tworzenia statystycznych modeli kształtu i wyglądu obiektów w obrazach. Kształt obiektu jest reprezentowany przez zbiór n punktów w przestrzeni o dowolnym wymiarze. Najczęściej punkty znajdują się na płaszczyźnie, choć możliwe jest modelowanie kształtu w 3D jak i przestrzeniach o większym wymiarze. Sam kształt jest to geometryczna konfiguracja punktów, która jest odporna (nie zmienia się) po zastosowaniu transformacji podobieństwa, tj. translacji, rotacji oraz zmiany skali. Innymi słowy, kształt obiektu nie zmienia się po jego przesunięciu, obróceniu lub powiększeniu czy pomniejszeniu.

Aby stworzyć statystyczny model kształtu danego obiektu potrzebny jest zbiór uczący zawierający takie obiekty. Na każdy z obiektów w zbiorze uczącym muszą zostać ręcznie naniesione tzw. punkty orientacyjne, które definiują jego kształt. Na rys. 9 przedstawione zostały trzy obrazy noży z naniesionymi punktami orientacyjnymi. Każdy z trzech przedstawionych obiektów jest zdefiniowany przez wielokąt o wierzchołkach w punktach

29

orientacyjnych oraz poprzez intensywność pikseli znajdujących się w obrębie tego wielokąta. Punkty orientacyjne muszą zostać wybrane w taki sposób, aby można było je w sposób powtarzalny umieszczać na różnych obiektach w tych samych miejscach. W praktyce ręczne nanoszenie punktów na cały zbiór uczący jest nużącą i czasochłonną pracą. Oczywiście istnieją narzędzia programistyczne ułatwiające ten proces, jednak w dalszym ciągu musi on być nadzorowany przez człowieka. W przypadku obiektów znajdujących się na płaszczyźnie, punkty najlepiej nanosić w pobliżu rogów znajdujących na krawędziach. Niestety w praktyce często zdarza się, że takie punkty nie występują lub występują w zbyt małej liczbie by pozwolić na uogólniony opis kształtu. Dlatego należy punkty szczególne uzupełnić o punkty znajdujący się pomiędzy nimi w równych odstępach.

Kształt zdefiniowany przez n punktów w d-wymiarowej przestrzeni jest reprezentowany przez wektor o długości nd. Przykładowo, kształt opisany przez n punktów {( ) na płaszczyźnie jest zdefiniowany przez wektor:

( ) .

Kształty wszystkich obiektów znajdujących się w zbiorze uczącym można opisać w odniesieniu do ich średniego kształtu. Dlatego przed naniesieniem punktów orientacyjnych należy dokonać odpowiedniego przekształcenia, które pozwoli wyznaczyć średni kształt obiektów ze zbioru uczącego.

Metodą stosowaną w tym celu jest tzw. analiza Prokrusta. Prokrust to postać z mitologii greckiej, przestępca, który miał w zwyczaju rozciągać kończyny swoich ofiar, podobnie jak to ma miejsce z obiektami w zbiorze uczącym, co zostanie niżej pokazane.

Sposób postępowania w analizie Prokrusta jest następujący:

1. Wybrać dowolny obiekt w zbiorze uczącym, którego kształt będzie kształtem referencyjnym.

2. Nałożyć kształty pozostałych obiektów na kształt referencyjny. 3. Obliczyć średni kształt wszystkich nałożonych na siebie kształtów.

4. Jeśli odległość obliczonego średniego kształtu do kształtu referencyjnego jest większa niż pewna, ustalona wcześniej wartość progowa należy obliczony średni kształt ustawić jako kształt referencyjny i wrócić do punktu 2.

Odległość dwóch kształtów wyznaczonych przez wierzchołki wielokąta jest pierwiastkiem z sumy kwadratów odległości pomiędzy poszczególnymi punktami i jest to tzw. odległość

30

Prokrusta. Nakładanie na kształtu na kształt średni polega na zastosowaniu translacji, rotacji i skalowania obiektów i również odbywa się w czterech krokach:

1. Obliczyć środki ciężkości obu obiektów.

2. Zmienić rozmiar obiektu nakładanego, tak aby był równy średniemu rozmiarowi. 3. Nałożyć na obiekty, tak aby ich środki ciężkości się pokrywały.

4. Obrócić nakładany kształt, tak aby odległość Prokrusta pomiędzy oboma kształtami była możliwie najmniejsza.

Modelowanie kształtu

Po wykonaniu analizy Prokrusta, dysponujemy średnim kształtem, a ponadto kształty wszystkich obiektów znajdują się we wspólnym układzie współrzędnych. Załóżmy, że mamy zbiór kształtów obiektów o liczności s, a każdy kształt jest opisany przez n punktów w przestrzeni d-wymiarowej. Każdy z kształtów opisany jest zatem przez wektor nd-elementowy. Wektory te tworzą pewien rozkład. Jeśli uda się go zamodelować, możliwe będzie wytworzenie nowych wektorów opisujących nowe kształty, podobnych do tych ze zbioru uczącego. W ten sposób możliwe jest również sprawdzanie czy dowolny kształt należy do klasy kształtów ze zbioru uczącego. Niech będzie dowolnym nd-elementowym wektorem, pewnym zbiorem parametrów. Poszukiwany jest model taki, że:

( ) (3.13)

Wektor opisuje kształt, który jest zależny od parametrów . Możliwe jest zamodelowanie rozkładu parametrów ( ) i tym samym ograniczenie ich wartości w taki sposób, aby kształty ( ) były podobne do kształtów ze zbioru uczącego. W celu uproszczenia modelu można zredukować wymiar danych wynoszący nd. Można to osiągnąć poprzez zastosowanie analizy głównych składowych (PCA), jednej z metod statystycznej analizy czynnikowej. Dane ze zbioru uczącego opisujące kształty obiektów stanowią chmurę punktów w przestrzeni euklidesowej o wymiarze nd. Analizy głównych składowych przekształca układ współrzędnych w tej przestrzeni w ten sposób, aby maksymalizować w pierwszej kolejności wariancję pierwszej współrzędnej, następie drugiej itd. Sposób postępowania jest następujący:

1. Obliczyć wartość średnią wektorów opisujących kształt:

̅ ∑

2. Obliczyć macierz kowariancji:

∑( ̅)( ̅)

31

3. Obliczyć wartości wektory własne macierzy i odpowiadające im wartości własne .

Niech oznacza zbiór t wektorów własnych odpowiadających największym wartościom własnym. Dowolny element ze zbioru może być przybliżony jako:

̅ ,

gdzie ( | | | ), a jest t-wymiarowym wektorem zdefiniowanym jako: ( ̅)

Wektor ten jest wektorem parametrów modelu Manipulując jego parametrami można zmieniać kształt (3.13). Wariancja i-tego parametru w zbiorze uczącym wynosi . Autor w [26] ogranicza do √ w celu osiągnięcia pewności, że tak wygenerowany kształt, będzie podobny do tych w zbiorze uczącym. Liczba wektorów własnych t branych pod uwagę (tj. liczba nowych składowych głównych), jest ustalana w taki sposób, aby utworzony model reprezentował ustaloną dużą część całej wariancji danych, albo żeby odrzucone czynniki stanowiły sam szum. Przykład analizy głównych składowych dla przypadku

dwuwymiarowego został przedstawiony na rys. 10 zapożyczonym z pracy [26]. Każdy z dwuwymiarowych punktów może zostać przybliżony za pomocą punktu najbliższego mu punktu na głównej osi . Ten z kolei może zostać opisany za pomocą odległości od punktu średniego ̅:

̅ .

Metoda głównych składowych ma sens przy założeniu, że modelowane dane są powiązane zależnością liniową, co nie zawsze ma miejsce. Tak jest w przypadku nieliniowych zmian kształtu np. takich, które powstają przy obracaniu obiektu. Jednym z rozwiązań jest stosowanie wielowarstwowego perceptronu zamiast PCA lub użycie współrzędnych biegunowych.

32 Przykłady modelu kształtu

Autor w [26] jako przykład modelu kształtu podaje model kształtu swojej własnej dłoni. Obiekty służące do zbudowania tego modelu, tj. dłonie zostały pokazane na rys. 11. Dłoń na każdym zdjęciu ze zbioru uczącego została opisana za pomocą zbioru punktów orientacyjnych mających opisać jej kształt. Liczba punktów wynosiła 72.

Rys. 11 Kształty obiektów w zbiorze uczącym

Najlepszymi punktami orientacyjnymi są te leżące na końcach i przy łączeniu palców, pozostałe wyznaczają geometryczne granice dłoni. Zastosowanie analizy głównych składowych do zamodelowania zbioru kształtów prowadzi do uzyskania modelu opisanego przez średni kształt i zależącego od zbioru parametrów. Na rys. 12 pokazane zostały obiekty uzyskane przez manipulowanie pierwszymi trzema parametrami w zakresie ich odchyleń standardowych.

Rys. 12 Efekt zmian pierwszych trzech parametrów modelu dłoni w zakresie ich odchyleń standardowych.

W dokumencie Index of /rozprawy2/10605 (Stron 28-33)

Powiązane dokumenty