Parametry obrazu - D ESKRYPTORY POJAZDÓW - OPRACOWANIE ALGORYTMU KLASYFIKACJI RODZAJU POJAZDU

5. OPRACOWANIE ALGORYTMU KLASYFIKACJI RODZAJU POJAZDU

5.2 D ESKRYPTORY POJAZDÓW

5.2.2 Parametry obrazu

(5.12)

(5.13)

⌈ ⌉ (5.14)

Rozmiary obrazów pojazdów poruszających się w polu widzenia kamery zależą od ich odległości od kamery. Ponieważ pole widzenia kamery jest z założenia nieskalibrowane, zniekształcenia te nie mogą być automatycznie korygowane. Dlatego w zestawie parametrów opisujących maskę obiektu brak bezwzględnych wymiarów pojazdu.

Jednak rozmiar obiektu jest istotny z punktu widzenia klasyfikacji pojazdów (samochody osobowe są istotnie mniejsze od ciężarowych), dlatego został on niejawnie uwzględniony w momentach statystycznych.

Zbiór wszystkich parametrów opisujących kształt pojazdu zawiera 36 elementów i został oznaczony jako kształt.

5.2.2 Parametry obrazu

Druga grupa deskryptorów bazuje na wyglądzie pojazdów. Ze względu na brak korelacji między typem pojazdu, a jego barwą, do wyznaczania parametrów obrazu pojazdów wykorzystano tylko ich luminancję. Konwersji z przestrzeni kolorów RGB (wejściowej) do obrazu w odcieniach szarości Y dokonano za pomocą zależności zdefiniowanej w standardzie Międzynarodowej Unii Telekomunikacyjnej ITU-R (ang.

International Telecommunication Union – Radiocommunication Sector) BT.601 (inne nazwy: Rec. 601, BT.601, CCIR 601) definiującym standardy w dziedzinie cyfrowego kodowania obrazu [271]:

(5.15)

Wykorzystano cztery rodzaje parametrów wyglądu pojazdów; dwa z nich bazują na deskryptorach SURF, a kolejne dwa opierają się na gradiencie obrazu i filtracji Gabora.

Deskryptory SURF (ang. Speded Up Robust Features) zostały już przedstawione w rozdziale 4.4.3. W badaniach wykorzystano dwa rodzaje parametrów wyglądu pojazdu bazujących na deskryptorach SURF. W pierwszym z nich punkty charakterystyczne znajdowane są automatycznie z użyciem detektora bazującego na wyznacznikach macierzy Hessego (wzory (4.53) – (4.55)). Dla każdego punktu obliczono deskryptor SURF-64.

Ponieważ liczba automatycznie znalezionych punktów charakterystycznych może się istotnie różnić w zależności od analizowanego obrazu (w zakresie od kilku do ponad 100), zachodzi konieczność wyrównania ich liczby. W tym celu dokonano klasteryzacji wszystkich punktów kluczowych za pomocą algorytmu centroidów (ang. K-Means Algorithm) [134]. Algorytm ten służy do podziału n wektorów obserwacji na k zbiorów ( ) w taki sposób, aby zminimalizować wewnątrz-klasowy rozrzut zdefiniowany jako suma kwadratów odległości euklidesowych każdego wektora od środa klastra.

Wykorzystując algorytm centroidów, wszystkie punkty charakterystyczne dzielone są na 8 klastrów na podstawie ich położenia w obrazie (rys. 5.7). Następnie obliczane są średnie wartości wektorów SURF dla wszystkich punktów charakterystycznych w obrębie każdego klastra. Średnie wektory są uzupełnione o dwie wartości oznaczające położenie środka klastra (współrzędne x i y znormalizowane w stosunku do szerokości i wysokości obrazu pojazdu). Następnie średnie wektory są łączone ze sobą wg położenia środka klastrów (od prawej do lewej i od góry do dołu). W ten sposób uzyskuje się deskryptor wyglądu pojazdu oznaczony jako surf-8-kmeans, zawierający (64 + 2) × 8 = 528 elementów.

Rys. 5.7 Położenie automatycznie znalezionych punktów charakterystycznych (czerwone elipsy) oraz środki ośmiu klastrów wyznaczone algorytmem centroidów (żółte okręgi) dla dwóch przykładowych obrazów pojazdów o różnej rozdzielczości Drugi rodzaj deskryptorów obrazu pojazdu bazujących na lokalnych parametrach wykorzystuje 128-elementowy wektor SURF (SURF-128). Jednak algorytm automatycznego znajdowania punktów charakterystycznych nie jest używany. Zamiast

tego, 4 punkty charakterystyczne umiejscowione są „z góry” w środkach czterech prostokątnych, rozdzielnych i przyległych obszarów, na które dzielony jest obraz pojazdu;

obszary te są symetryczne względem środka ciężkości maski pojazdu (rys. 5.8). Rozmiar punktu charakterystycznego jest równy wysokości lub szerokości obszaru, w zależności od tego, która wartość jest większa. Ostatecznie otrzymuje się wynikowy deskryptor zawierający 128 × 4 = 512 elementów, oznaczony jako surf-4.

Rys. 5.8 Środek ciężkości maski pojazdu (żółty punkt) oraz położenie (i rozmiar) czterech punktów charakterystycznych (czerwone okręgi)

Ostatni rodzaj parametrów wyglądu pojazdów bazuje na filtracji gradientu obrazu przy użyciu banku filtrów Gabora. Gradient obrazu pojazdów liczony jest niezależnie w kierunku poziomym i pionowym za pomocą operatora Sobela z jądrem o rozmiarze 3×3.

Ostateczny obraz gradientu pojazdu IS uzyskuje się poprzez zsumowanie kwadratów gradientu poziomego i pionowego, a następnie poprzez przeskalowanie wynikowego obrazu do wymiarów 100×80.

Filtr Gabora jest filtrem liniowym, którego reprezentacje częstotliwościowe i kierunkowe odpowiadają zmysłowi widzenia człowieka [65]. Dwuwymiarowy filtr Gabora ma postać funkcji Gaussa modulowanej przez sinusoidę, zgodnie z wzorami [94]:

( ) (5.16)

(5.17) gdzie  oznacza długość fali składnika harmonicznego,  reprezentuje orientację prążków filtru Gabora,  jest wartością przesunięcia fazy,  charakteryzuje głębokość obwiedni gaussowskiej, a  jest współczynnikiem eliptyczności funkcji Gabora. W badaniach przyjęto   1 oraz  = 0,56 . Wymiary filtru Gabora wyznaczane są z zależności:

( | |) (5.18)

( | |) (5.19) gdzie s = 3 określa rozmiar jądra.

W eksperymentach wykorzystano bank F = 8 filtrów Gabora charakteryzowanych przez dwie różne długości fali  (2,5 i 4) oraz przez 4 różne kierunki  (0°, 45°, 90° and 135°). Gradient obrazu pojazdu I_S filtrowany jest każdym filtrem z banku g przy wykorzystaniu dwóch wariantów przesunięcia fazy , zgodnie ze wzorem:

√(  ) (  ) (5.20) gdzie xy oznacza operację splotu.

W wyniku obliczeń uzyskuje się F = 8 przefiltrowanych obrazów IG (rys. 5.9). Każdy z tych obrazów jest następnie dzielony równomiernie w pionie i w poziomie na T równych podobszarów. Przyjęto T równe 16, co w efekcie daje podział każdego obrazu IG na 4×4 podobszary. W efekcie każdy podobszar ma rozmiar 25×20 pikseli. Liczba podobszarów jest kompromisem pozwalającym osiągnąć wystarczającą rozdzielczość przestrzenną przy jednocześnie akceptowalnej wymiarowości wynikowego wektora cech. W każdym podobszarze liczona jest suma wartości odpowiednich pikseli obrazu IG. Wyniki zapisywane są w macierzy G o wymiarach T×F, gdzie wiersz oznacza określony filtr Gabora, a kolumna definiuje podobszar obrazu IG.

Następnie obliczane są udziały każdego elementu macierzy G w sumie wszystkich elementów leżących w tej samej kolumnie oraz w tym samym wierszu, co prowadzi do uzyskania dwóch macierzy GO oraz GF o rozmiarze T×F, których elementy dane są zależnościami:

∑ (5.21)

∑ (5.22)

Elementy macierzy GO definiują, niezależnie dla każdego filtru Gabora, udział przefiltrowanych krawędzi w każdym podobszarze obrazu IG w odniesieniu do całego

obrazu. Z kolei elementy macierzy GF zawierają, niezależnie dla każdego podobszaru, udział krawędzi przetworzonych przez określony filtr Gabora w odniesieniu do wszystkich zastosowanych filtrów. Elementy te tworzą, odpowiednio, dwa wektory parametrów nazwane Gabor-obraz i Gabor-filtr, z których każdy składa się ze 128 elementów.

a) b)

d) Rys. 5.9 Obliczanie parametrów obrazu pojazdu z wykorzystaniem filtru Gabora: a) przykładowy obraz pojazdu, b) jego obraz gradientu IS oraz wyniki filtracji bankiem filtrów Gabora z parametrem c)  = 2,5 i d)  = 4; w górnej części c) i d) ilustracja filtru Gabora dla kierunków  równych 0°, 45°, 90° i 135°, niżej:

przefiltrowany obraz gradientu pojazdu IG

W dokumencie Metody algorytmicznej analizy obrazu wizyjnego do zastosowań w monitorowaniu ruchu drogowego : rozprawa doktorska (Stron 128-132)