Detekcja obiektów na obrazach Rezonansu Magnetycz- Magnetycz-negoMagnetycz-nego

Opracowane procedury

5.1 Automatyzacja tworzenia modeli wirtualnych z Rezonansu Magnetycznego

5.1.3 Detekcja obiektów na obrazach Rezonansu Magnetycz- Magnetycz-negoMagnetycz-nego

Zadaniem procesu wstępnej detekcji kręgów jest określenie położenia kręgów na po-szczególnych obrazach uzyskanych metodą Rezonansu Magnetycznego i określenie ob-szarów zainteresowania (ang. region of interest ) potrzebnych do szczegółowej segmen-tacji tkanek. Zastosowanie dwuetapowego algorytmu segmensegmen-tacji rozpoczynającego się wstępną klasyfikacją kręgów powala na ograniczenie ilości danych potrzebnych w

Dane wejściowe

Obszar wysokiej intensywności

Detekcja krawędzi

Segmentacja obszar tła obszar skóry obszar tkanki tłuszczonwej Obszar niskiej intensywności

Detekcja krawędzi kontrastu i jasności obszarów

Wyznaczanie lokalnych współczynników kontrastu i jasności obszarów

Łączenie obrazów

Rekalkulacja lokalnych poziomów intensywności zgodnie z funkcją wykładniczą wyznaczoną na podstawie

lokalnych współczynników kontrastu i jasności

Nieliniowe selektywne rozmycie Gaussa sparametryzowane przy pomocy tej samej funkcji wykładniczej

Wyjście obrazy o zredukowanej niejednorodności nasycenia

Rysunek 5-3: Schemat blokowy opracowanej metody filtracji wstępnej. Metoda składa się ze skalowania i interpolacji obrazów oraz korekcji niejednorodności nasycenia bazującej na rekalkulacji lokalnych poziomów intensywności zgodnie z funkcją wykładniczą spadku pro-mieniowania elektromagnetycznego.

Rysunek 5-4: Lewo: powiększony obraz prezentujący strzałkowy przekrój przez pojedynczy kręg pochodzący z danych wejściowych. Prawo: ten sam obraz po wstępnym skalowaniu i interpolacji z wykorzystaniem wysokiej rozdzielczości interpolacji bikubicznej.

drugim etapie Uczenia Maszynowego (ang. Machine Learning) do wyuczenia (ang.

training) prawidłowo działającego modelu.

Klasyfikacja (ang. classification) jest zadaniem opartym na określaniu przyna-leżności badanego obiektu do zbioru. Dobrym przykładem klasyfikacji jest zadanie rozpoznawania obrazu, gdzie badanym obiektem jest dwuwymiarowy obraz zwykle opisywany poprzez wartość intensywności poszczególnych pikseli, a wynikiem jest formacja o prawdopodobnej przynależności obiektu do konkretnego zbioru lub in-formacja o szansie przynależności obiektu do poszczególnych zbiorów. Współczesne metody rozpoznawania obiektów opierają się głównie na głębokim uczeniu (ang. Deep Learning) [87, 104, 118]. Większość algorytmów głębokiego uczenia (ang. Deep Le-arning) [124] łączy w sobie bazę danych (ang. database) z funkcją kosztu (ang. cost function), procedurą optymalizacji (ang. optimization procedure) i modelem (ang. mo-del ). Każdy z wymienionych elementów może zostać niezależnie zamieniony na inny tworząc odmienny algorytm uczenia maszynowego [86].

Konwolucyjna Sieć Neuronowa

W celu poprawnego działania procesu klasyfikacji kręgów, niezbędnego dla opraco-wanej metody segmentacji danych medycznych, zaimplementowano głęboką Konwo-lucyjną Sieć Neuronową (ang. Convolutional Neural Network ) [100, 118] (Rys. 5-5 i 5-6). Opracowana sieć składa się z 3 warstw konwolucyjnych (ang. convolutional lay-ers), warstwy całkowicie połączonej (ang. fully-connected layer ), warstwy redukującej (ang. dropout layer ) [100, 185] oraz warstwy odczytu (ang. readout layer ) [21, 86, 150].

Rysunek 5-5: Głęboka Konwolucyjna Sieć Neuronowa zaimplementowana w celu klasyfikacji i detekcji obiektów z Obrazowania Rezonansu Magnetycznego.

W przedstawionym rozwiązaniu, w warstwach konwolucyjnych, zastosowano neu-rony w postaci Skorygowanej Jednostki Liniowej (ang. Rectified Linear Unit, skr. Re-LU) [145] wykorzystujące Skorygowaną (ang. Rectifier ) funkcję aktywacji (ang. activa-tion funcactiva-tion) [83, 92]. Aby uniknąć wystąpienia symetrii i zerowych gradientów, wagi (ang. weights) zainicjalizowane zostały z niewielkim szumem (ang. noise) [100, 118].

Ze względu na wykorzystanie neuronów typu ReLU wprowadzono również dodatnią tendencję (ang. bias) początkową w celu uniknięcia martwych neuronów (ang. dead neurons) [37, 108]. Zastosowane warstwy konwolucyjne (ang. convolutional layers) wykorzystują pojedynczy krok (ang. single stride) z zerowym odsunięciem (ang. zero-padding), a podział informacji (ang. pooling stage) wykonywany jest jądrem (ang. ker-nel ) o rozmiarze 2 × 2 i oparty jest na metodzie maksymalnego podziału (ang. max pooling) [118, 175].

W warstwie całkowicie połączonej, do wyznaczania aktualnej jakości klasyfika-cji, potrzebnej w procesie wstecznej propagacji (ang. backpropagation) [170], wy-korzystano funkcję straty (ang. loss function) opartą na metodzie entropii krzy-żowej (ang. cross-entropy) [48, 86, 150] i funkcję aktywacji (ang. activation tion) w postaci znormalizowanej funkcji wykładniczej (ang. Softmax activation func-tion)[21, 86, 150].

Dane wejściowe obrazy o zredukowanej niejednorodności nasycenia

Przygotowanie bazy danych uczących przygotowana manualnie Inicjalizacja wag i tendencji

Porównanie wyników klasyfikacji z oczekiwanymi wartościami

funkcja kosztu Czy jakość rośnie

z kolejnymi iteracjami?

Aktualizacja wag i tendencji optymalizacja

Implementacja wyuczonego modelu klasyfikacji w procesie

detekcji Analiza generalizacji rozwiązania

na niezależnej bazie danych

Czy jakość klasyfikacji jest satysfakcjonująca?

Przygotowanie bazy danych testowych przygotowana manualnie

podział obrazów przypisanie etykiet

Wyjście wyuczony model klasyfikacji

Rysunek 5-6: Proces implementacji Konwolucyjnej Sieci Neuronowej. Architektura sieci i parametry uczenia muszą zostać manualnie przystosowane do charakterystyki danych.

Rysunek 5-7: Baza danych przygotowana na podstawie 50 badań Rezonansem Magnetycz-nym do uczenia modelu klasyfikacji. Z badań wyodrębniono ręcznie 1000 obrazów przedsta-wiających przekroje przez pojedyncze kręgi oraz kolejne 1000 obrazów przedstaprzedsta-wiających tło i otaczające kręgosłup tkanki. Lewa strona: przykładowe obrazy przedstawiające trzony kręgów. Prawa strona: przykładowe obrazy przedstawiające pozostałe tkanki.

Uczenie Modelu Klasyfikacji

Do uczenia modelu klasyfikacji wykorzystano opisywaną wcześniej bazę danych przy-gotowaną na podstawie 50 badań Rezonansem Magnetycznym. Ze wspomnianych ba-dań wyodrębniono ręcznie 1000 obrazów przedstawiających przekroje przez pojedyn-cze kręgi oraz kolejne 1000 obrazów przedstawiających tło i otaczające kręgosłup tkanki (Rys. 5-7).

Pierwsza warstwa konwolucyjna przyjmuje jednokanałowe obrazy z bazy uczącej o rozmiarze 56 × 56 pikseli w postaci tensorów wartości intensywności o wymiarach 56 × 56 × 1. Na etapie konwolucji wykonywane jest mnożenie splotowe z wykorzysta-niem jądra (ang. kernel ) o rozmiarze 5×5 zainicjalizowanego zgodnie z wcześniejszymi założeniami z niewielkim szumem wartości wagowych (ang. weights) oraz dodatnimi tendencjami (ang. biases). W pierwszej warstwie konwolucyjnej dla każdego obrazu założono wykorzystanie 16 jąder, przesuwających się po kolejnych polach odbiorczych (ang. receptive fields) i generujących poprzez mnożenie splotowe 16 niezależnych map aktywacji (ang. activation maps) wyodrębniających cechy charakterystyczne (ang. fe-atures) obiektów. Dalej na etapie detekcji (ang. detector stage) uzyskane liniowe akty-wacje poddawane są działaniu nieliniowej funkcji aktywacyjnej typu ReLU (ang. Recti-fied Linear Unit ) [145]. Finalnie na etapie podziału (ang. pooling stage), przy pomocy metody maksymalnego podziału (ang. max pooling) [118, 175], rozmiar wytworzonych map aktywacji redukowany jest o połowę do 28×28 pól. Redukcja rozmiarów kolejnych

map aktywacji pozwala na zwiększenie wydajności obliczeniowej oraz wykrywanie cech coraz to wyższych poziomów.

Kolejne warstwy konwolucyjne przyjmują za wejście mapy aktywacji z poprzednich warstw. Podobnie jak w pierwszej warstwie konwolucyjnej, w kolejnych warstwach wykonywane jest mnożenie splotowe jądrem o rozmiarze 5 × 5 tworzące odpowiednio 32 i 64 nowych map aktywacji dla 2 i 3 warstwy konwolucyjnej. Wyniki poddawane są działaniu nieliniowej funkcji aktywacyjnej typu ReLU i metody maksymalnego podziału redukującej rozmiary map odpowiednio do 14 × 14 oraz 7 × 7 pól.

Po warstwach konwolucyjnych zastosowano warstwę całkowicie połączoną (ang. ful-ly connected layer ) złożoną z 1024 neuronów analizujących cały obraz. Warstwa ta sprawdza występowanie cech charakterystycznych na wejściowych mapach aktywacji określając, które cechy najlepiej odpowiadają poszczególnym klasom. Następnie, aby uniknąć nadmiernego dopasowania (ang. overfitting) zastosowano technikę regulującą (ang. regularization technique) w postaci warstwy wyrzucania (ang. dropout layer ) zapobiegającej nadmiernemu dopasowaniu modelu do danych uczących, co w efekcie prowadziłoby do słabej generalizacji na niezależne zbiory danych. Ostatecznie w ko-lejnej warstwie całkowicie połączonej zwanej warstwą odczytu (ang. readout layer ) wykorzystano metodę entropii krzyżowej (ang. cross-entropy) [48, 86, 150] i znorma-lizowaną funkcję wykładniczą (ang. Softmax )[21, 86, 150] w celu określenia prawdo-podobieństwa przynależności danego obrazu do określonej grupy.

5.1.4 Segmentacja tkanek na obrazach Rezonansu

W dokumencie NOWE PROCEDURY TWORZENIA MODELI WIRTUALNYCH DLA POTRZEB MEDYCYNY (Stron 78-84)