• Nie Znaleziono Wyników

Macierze i współczynniki

W dokumencie Index of /rozprawy2/10097 (Stron 99-102)

5. Strategia poszukiwań

5.3. Macierze i współczynniki

Wspomniano już w rozdziałach 2.3.1 i 2.3.2, że najlepsze rezultaty w analizie tekstur dają zazwyczaj metody bazujące na klasycznych macierzach współwystąpień (GLCM). Nie jest to, niestety, reguła, tym niemniej wydaje się, że właśnie te metody, chętnie wykorzystywane w analizie różnorakich obrazów medycznych, można uznać za potencjalnie najbardziej obiecujące. Dlatego też niniejsza praca, będąca jak się wydaje pierwszym opracowaniem dotyczącym zaawansowanej analizy obrazów p-CT prostaty, koncentrować się będzie właśnie na macierzach GLCM.

Kwestią dyskusyjną pozostaje ustalenie, dla jakich parametrów d i θ

(patrz rozdział 2.3.2) będą wyznaczane te macierze. Badacze często koncentrują się na najbliższym sąsiedztwie (d=1) [218,286], nie jest to wszelako jedyna rozważana odległość. Gadkari [83] wskazuje, że w wielu opracowaniach analizuje się różne wartości d, zazwyczaj od 1 do 10, najlepsze rezultaty osiąga się jednak dla d=1 lub d=2. Wynika to z faktu, że duża odległość d dla drobnoziarnistych tekstur powoduje generację GLCM nie uwzględniających istotnych informacji o teksturze. Przy doborze d przede wszystkim należy brać jednak pod uwagę specyfikę analizowanego obrazu. Gool [91] sugeruje, że odległość d dobierana powinna być zgodnie z ziarnistością analizowanego obrazu i zazwyczaj nie przekracza największego rozmiaru tekstonu. Jest to słuszna uwaga, sęk jednak w tym, że rozmiary tekstonów rzadko są znane a priori, często też różne tekstury występujące na tym samym obrazie istotnie różnią

się ziarnistością. Wstępne rozważania przedstawione w rozdziale 4.5 wskazały, że nawet dla tego samego obrazu można uzyskać zadowalające rezultaty przy znacznie różniących się d.

Z tego względu, a także z powodu braku wspomnianych wyżej apriorycznych informacji o teksturze badanych obiektów, w niniejszej pracy rozważano wszystkie możliwe odległości, począwszy od d=1, uzależniając górną granicę wartości tego parametru od rozmiarów oraz charakterystyki analizowanego ROI. W większości jednak rozważanych tutaj przypadków d nie przekracza 10-20 pikseli.

Również podejście do doboru kąta θ

różne jest u poszczególnych badaczy w zależno-ści od istoty podejmowanego problemu. Dla tekstur anizotropowych zazwyczaj określa się parametry macierzy dla każdego ze wskazanych w rozdziale 2.3.2. kątów, tj. dla 0º, 45º, 90º i 135º. Z kolei, gdy tekstura nie wykazuje kierunkowości, wyznacza się zwykle macierz niezależną od kierunku, zgodnie z równaniem 2.23.

Tekstura na analizowanych w pracy obrazach p-CT prostaty wykazuje wyraźną anizotropię (rys.38), która koncentruje się jednak głównie na kierunkach poziomym i piono-wym. Wydaje się zatem, że cechy tekstury wyznaczane dla kierunków skośnych nie wniosą szczególnie istotnych dla rozpoznania informacji. Również przeprowadzona w rozdziale 4.5 analiza zdaje się potwierdzać to przypuszczenie. Z tego względu w dalszej części niniejszej pracy zdecydowano się wyznaczać macierze i ich właściwości jedynie dla kątów θ

=0º oraz

θ

=90º.

Poszczególne współczynniki charakteryzujące zadaną macierz mogą osiągać różne wartości. W niektórych przypadkach ten zakres zmienności jest jasno określony, przykładowo energia (f1) zawsze zawiera się w przedziale [0,1], jednak nie jest to regułą – entropia (f2) jest zawsze nieujemna, ale jej maksymalna wartość nie jest z góry określona i zależy od rozmiaru macierzy95. Są także parametry o znacznie większym zakresie uzyskiwanych wartości. Z tej – nieraz dużej – dysproporcji w wartościach poszczególnych współczynników wynika potrzeba ich normalizacji. Przekształcenie to, w wyniku którego wartość każdej cechy będzie należała do przedziału [0,1] dane jest równaniem:

min max min x − − = ' x , (5.1)

gdzie: x’ – wartość znormalizowanego współczynnika x, max – największa wartość w norma-lizowanym zbiorze, min – najmniejsza wartość w tym zbiorze.

95 Autor zauważył, że przedstawione w [96] stwierdzenie, jakoby maksymalna wartość entropii wynosiła 0,5 jest nieprawdziwe. Aby oszacować teoretyczne maksimum dla rozważanych w niniejszej pracy macierzy 31x31, należy założyć jednakową wartość wszystkich elementów macierzy: P(i,j)=1/(31*31). Wówczas wartość entropii wyniosłaby ~6,87.

Strategia poszukiwań

Wykonywana w opisanych w dalszej części pracy doświadczeniach normalizacja dokonywana była na podstawie danych empirycznych, czyli rzeczywiście zmierzonych wartościach dla badanej cechy. Postępowanie to uzasadnione jest z jednej strony dążeniem do zagwarantowania w prezentowanych doświadczeniach jednakowej zmienności (cały przedział [0,1]) dla każdej z rozważanych cech, a z drugiej strony trudnościami w ocenie realnych ograniczeń dla wyznaczanych współczynników. Np. teoretycznie możliwa do uzyskania entropia o wartości powyżej 6 jest raczej nieprawdopodobna dla rzeczywistych obrazów p-CT stercza (w praktyce wartość ta ledwo dochodziła do 3). Można sobie jednak wyobrazić sytuację, gdy współczynniki dla nowego, nie analizowanego dotąd obrazu wyjdą poza zastosowany zakres normalizacji, na co także należy zwrócić uwagę.

Przed normalizacją, należy sprawdzić, czy w dostępnym dla rozważanej cechy zestawie danych nie znajdują się przypadkowe, pojedyncze wartości odstające. Są to obserwacje (z definicji) nietypowe i występujące rzadko. Wartości te nie pokrywają się z roz-kładem pozostałych danych, co może być odzwierciedleniem zarejestrowanych anomalii rozważanego zjawiska (zmiennej), np. szumu, które nie powinny być uwzględniane w mode-lowaniu. Ma to szczególne znaczenie w (opisanym dalej – rozdział 5.6) wyrównywaniu rozkładu, gdzie minimalizować będziemy odstępstwo od rozkładu teoretycznego badając nie zwykłą sumę, ale sumy kwadratów odległości punktów rozważanych dystrybuant. Podobnie wyznaczana miara odległości międzyklasowej (rozdział 5.5) bazować będzie na odległościach od średniej kwadratów badanych wartości. Miara kwadratowa jest dokładniejsza i bardziej wiarygodna od liniowej, ale też bardziej wrażliwa na zakłócenia, dlatego też zagadnienia tego nie możemy pominąć.

Najprostszym i zarazem najbardziej intuicyjnym sposobem wskazania wartości odstających jest wyznaczenie wewnątrzklasowych wartości średnich ( ) i odchyleń standardowych (σ ) dla badanego zestawu danych. Za wartości odstające uznane zostaną

punkty odległe od o więcej niż 3σ . Pewnym minusem tej metody jest wpływ skrajnych wartości na wyznaczane i σ . Innym sposobem może być wyznaczenie np. kwartyli oraz rozstępu międzykwartylowego i eliminację punktów danych wykraczających poza wskazany w ten sposób przedział [291]. W niniejszej pracy wartości odstające odrzucano pierwszą spośród przywołanych wyżej metod, czyli w dalszej analizie brały udział (wyłącznie) wszystkie współczynniki z przedziału [ -3σ , +3σ ].

Opisane powyżej eliminacja wartości odstających oraz normalizacja (a także wyjaśnione później wyrównanie rozkładu) wykonywane były niezależnie dla każdej z anali-zowanych cech.

W dokumencie Index of /rozprawy2/10097 (Stron 99-102)