• Nie Znaleziono Wyników

Nadzorowana klasyfikacja pikselowa

W dokumencie Index of /rozprawy2/10750 (Stron 96-103)

7. Generowanie map błędów i odchylenia standardowego NMT

7.5. Pokrycie terenu

7.5.2. Nadzorowana klasyfikacja pikselowa

Proces tworzenia map pokrycia terenu przeprowadzono w podejściu nadzorowanym z wykorzystaniem algorytmu MLC. W wyniku działania tej metody poszczególne piksele przyporządkowywane są do klas na podstawie ich statystyk (wartość średnia, macierz wariancji/kowariancji) oraz przy założeniu normalności rozkładu próbek poszczególnych klas. Klasyfikację przeprowadzono w oparciu o dostępną ortofotomapę powstałą ze zdjęć lotniczych służących do pokolorowania chmury punktów wykonanych w ramach projektu ISOK (podrozdział 5.3). Dla wszystkich czterech klas pozyskano pola treningowe konieczne do przeprowadzenia klasyfikacji. Ich jakość zweryfikowano poprzez analizę rozłączności odpowiadających im sygnatur. W ten sposób wybrano możliwie najbardziej optymalny zestaw pól treningowych. Wartości średnie składowych RGB wraz z odchyleniami standardowymi dla poszczególnych klas pokrycia zestawiono w Tab. 26, a w formie wykresów funkcji gęstości rozkładu normalnego na Rys.50.

Tab. 26. Składowe RGB dla pól treningowych poszczególnych klas pokrycia terenu dla ortofotomapy ISOK

Składowa R Składowa G Składowa B Rodzaj pokrycia

terenu

Średnia SD Średnia SD Średnia SD Tereny podmokłe 94.4 14.0 107.6 14.3 114.9 14.0 Tereny niezadrzewione 107.5 10.1 126.8 8.5 129.0 14.4 Tereny zalesione 73.7 29.1 87.0 33.1 88.1 33.1 Tereny antropogeniczne 164.4 30.1 172.7 36.7 175.1 38.3

Ostatnim krokiem było oszacowanie dokładności przeprowadzonej klasyfikacji. W tym celu konieczne jest porównanie wyników klasyfikacji z obrazem wzorcowym, który reprezentuje rzeczywiste pokrycie terenu. Na podstawie różnic między tymi obrazami budowana jest macierz błędów wyszczególniająca statystykę zgodności pomiędzy poszczególnymi klasami. W praktyce

97

najczęściej stosuje się jednorodne pola weryfikacyjne lub pojedyncze piksele, których rzeczywiste pokrycie zostało określone na podstawie wiarygodnego wywiadu terenowego lub innych źródeł (np. map, ortofotomap). W niniejszej pracy zastosowano podejście pikselowe wykorzystując do tego celu łącznie pierwszy i drugi zbiór danych referencyjnych obejmujący w sumie 275 punktów, dla których pokrycie terenu zostało określone podczas pomiaru bezpośredniego. Jako podstawową miarę dokładności przyjęto tzw. całkowitą dokładność klasyfikacji. Wyraża ona stosunek ilości poprawnie sklasyfikowanych pikseli do wszystkich pikseli testowych i jest ona najczęściej stosowanym wskaźnikiem (Badurska, 2011).

Rys.50. Wykresy gęstości rozkładu normalnego dla składowych RGB ortofotomapy ISOK dla pól treningowych poszczególnych klas pokrycia reprezentujących tereny: podmokłe (niebieski),

antropogeniczne (szary), niezadrzewione (jasnozielony), zalesione (ciemnozielony)

Obraz uzyskany w procesie klasyfikacji pikselowej często charakteryzuje się tzw. „ziarnistością” związaną z przestrzenną zmiennością klas pojedynczych pikseli. Spowodowane to jest podobną odpowiedzią spektralną poszczególnych klas. W celu usunięcia pojedynczych, błędnie sklasyfikowanych pikseli wewnątrz większej klasy wykorzystano filtr analizy większości (ang. Majority Analysis Filter). Sposób jego działania polega na zastępowaniu piksela centralnego wartością klasy dominującej wewnątrz okna filtrującego o zdefiniowanym rozmiarze. Przeanalizowano maski o wielkości 3, 5, 7, 9 oraz 11 pikseli i najlepsze rezultaty uzyskano dla okna o wielkości 7. Pojedyncze, fałszywe piksele w wyniku działania tego filtru zostały usunięte co potwierdziła analiza wizualna, a całkowita dokładność klasyfikacji wzrosła z 43.3% do 45.1%.

Po przeprowadzeniu klasyfikacji konieczne było przepróbkowanie obrazu metodą najbliższego sąsiada (ang. Nearest Neighbour) do rozdzielczości modelu ISOK. Wynikało to z faktu, że wykorzystywana w procesie klasyfikacji ortofotomapa miała piksel o wielkości 0.5 m. Przepróbkowanie wykonano, podobnie jak samą klasyfikację i filtrowanie, w otwartym oprogramowaniu ILWIS Open v.3.4. W wyniku resamplingu całkowita dokładność klasyfikacji nieznacznie spadła (z 45.1% do 44.7%). Dla tak przygotowanego obrazu przeprowadzono szczegółową analizę uzyskanej macierzy błędów. Pozwala ona na wskazanie klas, dla których liczba błędnie sklasyfikowanych pikseli jest największa wraz z informacją, do których klas zostały one błędnie przyporządkowane. Macierz błędów jest bardzo efektywnym sposobem określania dokładności, gdyż opisuje ją dla każdej klasy z osobna przy pomocy tzw. dokładności producenta i użytkownika (za Jensen, 1996; cytowanym przez Badurska, 2011). Dokładność producenta stanowi proporcję poprawnie sklasyfikowanych pikseli w stosunku do wszystkich pikseli testowych danej klasy. Związana jest z błędem pominięcia (ang. omission error – podrozdział 2.2.1) i oznacza prawdopodobieństwo poprawnej klasyfikacji każdej z klas. Przez ten błąd należy rozumieć procent pikseli, które powinny znaleźć się w danej klasie, ale zostały niepoprawnie przypisane do innej. Dokładność użytkownika natomiast stanowi stosunek liczby poprawnie sklasyfikowanych pikseli rozpatrywanej klasy do sumy wszystkich pikseli sklasyfikowanych do tej klasy. Związany jest z nią błąd nadmiaru (ang. commision error – podrozdział 2.2.1), który wskazuje piksele niepoprawnie sklasyfikowane do klasy, do której nie powinny należeć. Dokładność ta oznacza prawdopodobieństwo, że dany piksel faktycznie reprezentuje konkretną klasę w terenie.

98

Inną miarą poprawności klasyfikacji opierającą się o macierz błędów jest współczynnik zgodności Kappa, który definiowany jest jako (za Fitzpatrick-Lins, 1981; Congalton, 1991; Jensen, 1996; cytowanymi przez Badurska, 2011):

(35)

( )

( )

= + + = + + =

=

r i i i r i i i r i ii

X

X

N

X

X

X

N

Kappa

1 2 1 1 ,gdzie:

r – liczba wierszy macierzy,

Xi+ – suma obserwacji (pikseli) w i-tym wierszu, X+i – suma obserwacji (pikseli) w i-tej kolumnie, Xii – wartość obserwacji (pikseli) na przekątnej, N – ogólna liczba obserwacji (pikseli).

Wartość tego współczynnika zawiera się w przedziale od 0 do 1. Wartość 1 oznacza pełną zgodność między polami testowymi (pikselami) a obrazem po klasyfikacji, natomiast 0 odpowiada poziomowi przypadkowej zgodności. Wyniki zestawiono w formie macierzy błędów (Tab. 27) oraz tabeli dokładności wyniku klasyfikacji pikselowej (Tab. 28).

Całkowita dokładność klasyfikacji wyniosła prawie 45%, ale znacznie niższa wartość współczynnika Kappa (0.25), wskazuje na duże różnice dokładności między klasami. Analizując macierz błędów można zauważyć, że całkowita dokładność klasyfikacji jest zaniżona przez niską dokładność producenta dla klasy terenów niezadrzewionych i terenów antropogenicznych. W przypadku tej pierwszej wiąże się to z faktem podobnej odpowiedzi spektralnej dla terenów niezadrzewionych i podmokłych (Rys.50). W efekcie 37 pikseli, które powinny zostać sklasyfikowane jako tereny niezadrzewione, zostało błędnie przypisanych do grupy terenów podmokłych. Niska dokładność producenta klasy terenów antropogenicznych natomiast wynika z występowania obszarów zadrzewionych wzdłuż ciągów komunikacyjnych, a także stosunkowo długim cieniom widocznym na ortofotomapie rzucanym przez Słońce. Istnieje możliwość poprawienia wyników klasyfikacji, ale wymaga ona zastosowania dodatkowych źródeł danych zarejestrowanych, dla przykładu w zakresie bliskiej podczerwieni lub za pomocą InSAR. Są to jednak dane kosztowne i na etapie badań w ramach niniejszej pracy nie były one dostępne. Ponadto celem było opracowanie metodyki jak najbardziej dostępnej, opierającej się o dane, które można pozyskać z CODGiK równocześnie z zakupem NMT dla danego obszaru bez konieczności wchodzenia w dodatkowe koszty.

Tab. 27. Macierz błędów dla klasyfikacji pikselowej dla głównego obszaru badań Piksele testowe

Rodzaj pokrycia terenu

Tereny podmokłe Tereny niezadrzewione Tereny zalesione Tereny antropogeniczne Ogółem Tereny podmokłe 24 39 17 8 88 Tereny niezadrzewione 9 52 10 6 77 Tereny zalesione 12 34 29 12 87 Tereny antropogeniczne 0 4 1 18 23 Klasa obrazu Ogółem 45 129 57 44 275

99

Tab. 28. Dokładność wyniku klasyfikacji pikselowej dla głównego obszaru badań Klasa obrazu producenta [%]Dokładność użytkownika [%] Dokładność Błąd nadmiaru [%] pominięcia [%]Błąd

Tereny podmokłe 53.3 27.3 72.7 46.7 Tereny niezadrzewione 40.3 67.5 32.5 59.7 Tereny zalesione 50.9 33.3 66.7 49.1 Tereny antropogeniczne 40.9 78.3 21.7 59.1 Dokładność całkowita 44.7 % (123/275) Współczynnik Kappa 0.25

Uzyskana mapa pokrycia terenu (Rys.51) jest jednocześnie mapą błędu i jego odchylenia standardowego. Poszczególnym klasom odpowiadają wartości ME oraz SD oznaczone w Tab. 24 pogrubioną czcionką. Ich weryfikację, a zarazem weryfikację metodyki samej w sobie, przeprowadzono dwuetapowo stosując drugi zbiór danych referencyjnych. W pierwszym etapie do obliczeń wykorzystano rodzaj pokrycia terenu uzyskany w drodze pomiaru bezpośredniego. Pozwoliło to porównać mapy błędu i odchylenia standardowego dla poszczególnych wariantów z pominięciem wpływu błędu pikselowej klasyfikacji nadzorowanej. Natomiast w drugim etapie w celu ustalenia rodzaju zagospodarowania użyto powstałej mapy pokrycia terenu. Poszczególnym klasom przyporządkowano określone wartości ME i SD z Tab. 24. Aby znaleźć najbardziej optymalny wariant, w każdym z dwóch etapów zdecydowano się na połączenie metod generujących mapy odchylenia standardowego zawartych w całym rozdziale 7. Wykorzystano dodatkowo mapy ESD uzyskane za pomocą metody Krausa i innych (2006) dla wariantu 6 oraz przy użyciu wzoru empirycznego (34). Wybór akurat tylko tych metod podyktowany jest faktem, że na potrzeby ich działania nie są konieczne dodatkowe, kosztowne i czasochłonne bezpośrednie pomiary referencyjne. Ponadto celem było również określenie metodyki usuwania wpływu błędu systematycznego. Analizując wyniki uzyskane metodą Krausa i innych (2006) (podrozdział 7.1) oraz przy pomocy wzoru empirycznego (podrozdział 7.4) można zauważyć, że odjęcie średniego błędu systematycznego NMT nie przynosi poprawy, a wręcz odwrotnie. W niniejszym podrozdziale dla wariantów wykorzystujących mapę błędu wynikającą z pokrycia terenu usunięto z NMT błąd średni (-0.132 m). Było to konieczne z uwagi na fakt, iż obliczone ME i SD zawarte w Tab. 24 były oparte o NMT ISOK, z którego usunięto średni błąd systematyczny. Wyniki uzyskane dla poszczególnych wariantów zamieszczono w Tab. 29 oraz Tab. 30 odpowiednio dla etapu pierwszego i drugiego.

Wyniki otrzymane dla etapu pierwszego potwierdzają zasadność tezy mówiącej o wpływie pokrycia terenu na błąd NMT. Usunięcie tego wpływu spowodowało uzyskanie w każdym wariancie większej liczby punktów n, których dokładność została prawidłowo oszacowana. Najlepsze rezultaty osiągnięto dla wariantu 3 wykorzystującego mapę błędu związaną z pokryciem terenu oraz odchylenie standardowe obliczone za pomocą wzoru empirycznego (34), wyprowadzonego przez Karela i Krausa (2006). Rezultaty są o wiele lepsze niż w przypadku zastosowania samej mapy odchylenia standardowego uzyskanej przy użyciu tegoż wzoru (por. Tab. 22). W przypadku etapu drugiego najlepszy wynik uzyskał wariant 1, opierający się o samą mapę odchylenia standardowego. Rezultaty tego etapu różnią się nieznacznie od tych uzyskanych dla etapu pierwszego z uwagi na względnie niską dokładność przeprowadzonej klasyfikacji nadzorowanej. Niemniej jednak wyniki etapu pierwszego jednoznacznie potwierdzają wykorzystanie tej metodologii na potrzeby estymacji przestrzennego rozkładu błędu w NMT. Do dalszych analiz jako najlepszy wybrano wariant 3, który osiągnął najwyższy średni wynik punktowy dla obydwu etapów. Porównanie poszczególnych wariantów przedstawiono graficznie w formie wykresu rozrzutu na Rys.53. Na Rys.52 natomiast przedstawiono histogram odchyłek dla wariantu 3 dla etapu pierwszego oraz drugiego.

100

Rys.51. Mapa pokrycia terenu, błędu NMT (E(Pokrycie)) oraz odchylenia standardowego błędu NMT (ESD(Pokrycie)) dla głównego obszaru badań, wygenerowana na podstawie klasyfikacji

pikselowej ortofotomapy ISOK dla zakresu NMT ISOK

Wykorzystanie w dalszych rozważaniach wariantu 3 o konfiguracji ESD(Empiryczny) i E(Pokrycie) jest uzasadnione również z innego powodu. NMT obarczone znaczącym błędem systematycznym do prawidłowej estymacji przestrzennej dokładności wymagają wykorzystania map błędów lub usunięcia wpływu tego błędu. Sytuacja taka miała miejsce w przypadku modelu LPIS, gdzie każda z analizowanych metod estymacji przynosiła lepsze rezultaty po uprzednim usunięciu wpływu błędu systematycznego. Dla NMT ISOK sytuacja przedstawia się zgoła inaczej. Przede wszystkim posiada on niewielki błąd systematyczny (-0.132 m – Tab. 8), który uwidacznia się tylko na obiektach płaskich i jednoznacznych z punktu widzenia ich wysokości, takich jak jezdnie czy chodniki. Pomiar GPS przeprowadzony na całym obszarze badań dla różnego rodzaju pokrycia terenu nie wykazał występowania błędu systematycznego (Tab. 9). Przyczynę takiego stanu rzeczy należy upatrywać w dwóch czynnikach. Po pierwsze pomiar referencyjny wykonany był w sposób równomierny, a ze względu na charakter obszaru badań, stosunkowo mała liczba punktów położona była na terenach antropogenicznych (44 na 275 punktów – Tab. 27). Po drugie najwięcej punktów pomierzonych zostało na terenach niezadrzewionych (129 na 275), dla których średni błąd NMT wynikający z pokrycia terenu wynosi 0.134 m (por. Tab. 24). Porównując tę wartość ze średnim błędem systematycznym modelu łatwo zauważyć, że się on znosi dając wartość 0. To wyjaśnia dlaczego pomiar GPS nie wykazał błędu systematycznego.

Podsumowując niniejszy rozdział należy nadmienić, iż przypadek modelu ISOK jest szczególny. Jest to model, który posiada błąd systematyczny o takiej samej wartości jak błąd wynikający z wpływu przeważającego na tym terenie rodzaju pokrycia terenu, ale o przeciwnym znaku. W takim przypadku zastosowanie mapy błędu razem z mapą odchylenia standardowego nie powoduje znaczącej poprawy wyników estymacji przestrzennego rozkładu błędu NMT. W każdym innym przypadku natomiast użycie tylko mapy ESD przyniosłoby gorsze rezultaty.

101

Rys.52. Histogram odchyłek dla wariantu 3 wykorzystującego mapę odchylenia standardowego pochodzącą ze wzoru empirycznego (34) oraz mapę błędu uwzględniającą wpływ pokrycia terenu

uzyskanego na podstawie pomiarów bezpośrednich (z lewej) oraz klasyfikacji nadzorowanej (z prawej) dla NMT ISOK.

Tab. 29. Porównanie wariantów map błędów i odchylenia standardowego wykonanych metodą wykorzystującą wpływ pokrycia terenu określonego na podstawie pomiaru terenowego dla

NMT ISOK (etap 1)

Wariant Wykorzystane dane μ [m] Wynik (μ) σ [m] Wynik (σ)

Liczba punktów n Wynik (n) Suma Wyników 1 etap 1 ESD(Pokrycie) 0.0000 50 0.1041 49 75 164 263 2 etap 1 ESD(Pokrycie), E(Pokrycie), ME = -0.132 m 0.0199 31 0.0934 54 87 191 275 3 etap 1 ESD(Empiryczny), E(Pokrycie), ME = -0.132 m 0.0523 0 0.0929 54 104 228 282 4 etap 1 ESD(Kraus), E(Pokrycie), ME = -0.132 m 0.0123 38 0.2029 0 68 149 187

Tab. 30. Porównanie wariantów map błędów i odchylenia standardowego wykonanych metodą wykorzystującą wpływ pokrycia terenu określonego na podstawie pikselowej klasyfikacji

nadzorowanej dla NMT ISOK (etap 2) Wariant Wykorzystane dane μ [m] Wynik

(μ) σ [m] Wynik (σ) Liczba punktów n Wynik (n) Suma Wyników 1 etap 2 ESD(Pokrycie) 0.0379 0 0.1103 48 94 206 254 2 etap 2 ESD(Pokrycie), E(Pokrycie), ME = -0.132 m 0.0380 0 0.1072 49 86 188 238 3 etap 2 ESD(Empiryczny), E(Pokrycie), ME = -0.132 m 0.0325 7 0.1068 50 87 191 247 4 etap 2 ESD(Kraus), E(Pokrycie), ME = -0.132 m -0.0078 40 0.2117 0 59 129 169

102

Rys.53. Wykres rozrzutu dla poszczególnych wariantów uwzględniających wpływ pokrycia terenu dla NMT ISOK. Liczby przy punktach odpowiadają numerom wariantów z Tab. 29 oraz Tab. 30.

103

W dokumencie Index of /rozprawy2/10750 (Stron 96-103)

Powiązane dokumenty