• Nie Znaleziono Wyników

Przykładowe zastosowanie metody MCMC

W dokumencie Metody Monte-Carlo i MCMC (Stron 87-90)

Zastosowania symulacyjnych metod MCMC, jak zostało to wspomniane na początku tego rozdziału, obejmują bardzo szeroki zakres dziedzin i aplikacji praktycznych. W związku z tym omówimy tutaj pokrótce tylko jeden przykład zastosowania, związanego z odszumianiem i analizowaniem obrazów cyfrowych (patrz np. [21, 22]).

Konieczność wykorzystywania metod MCMC przy odszumianiu i analizowa-niu zdjęć związana jest nie tylko z częstokroć bardzo dużym rozmiarem prze-strzeni stanów, wynikającym z rozdzielczości zdjęcia, np. 20482, ale i z wpro-wadzeniem ewentualnego trzeciego wymiaru, czyli np. czasu w filmach. Genezy stosowanych przy tym algorytmów należy upatrywać w zastosowaniach fizycz-nych, np. w badaniach nad magnetycznością ciał stałych (patrz np. [2]).

W niniejszym rozdziale przyjrzymy się przede wszystkim problemowi odszu-miania obrazów cyfrowych. Przez X oznaczymy prawdziwy obraz, składający się z pikseli, czyli z pojedynczych elementów obrazu x(i). Zazwyczaj piksele x(i) tworzą ściśle określoną dwuwymiarową strukturę, np. prostokątną tablicę w przypadku standardowych zdjęć, a ich wartości mogą być binarne (np. dla zdjęć czarno-białych), dyskretne (w przypadku zdjęć w odcieniach szarości) lub rzeczywiste. Wartości przyjmowane przez piksele nazywać będziemy dalej kolo-rami.

Ogólniej rzecz ujmując, obraz X jest elementem przestrzeni AS, gdzie A jest zbiorem dopuszczalnych kolorów, a S – zbiorem wszystkich pikseli w obrazie. Na zbiorze S zadany jest graf K zadający strukturę sąsiedztw dla poszczególnych pikseli. Dla zdjęć przykładem takiego zbioru sąsiedztw pojedynczego piksela x(i) mogą być wszystkie piksele stykające się brzegiem lub wierzchołkiem z tym pikselem.

Obserwowany przez nas, zarejestrowany obraz Y składa się z kolei z pikseli oznaczanych przez y(i). Podobnie jak poprzednio, Y ∈ AS, choć w ogólności przestrzeń kolorów i zbiór pikseli dla obrazu zarejestrowanego mogą być inne niż dla obrazu rzeczywistego X.

Zakładamy, że zarejestrowany obraz Y jest zaszumionym zniekształceniem obrazu rzeczywistego X zgodnie z ogólnym modelem szumu zadanym przez prawdopodobieństwo

gdzie νi jest zbiorem wszystkich pikseli, które wpływają na stan piksela y(i). Jak łatwo zauważyć, w celu pełnego zdefiniowania modelu zaszumienia (6.22), niezbędne jest określenie postaci funkcji P (.|.), np. jako szumu gaussowskiego z bezpośrednim oddziaływaniem wartości piksela x(i) na y(i)

P gdzie σ2 jest ustaloną wariancją – poziomem szumu tła. Dla obrazów o binar-nych kolorach szum może być generowany poprzez losową zamianę „czarnego”

w „białe” i odwrotnie, zgodnie z regułą P

gdzie 1 − p jest prawdopodobieństwem zmiany koloru piksela.

Pełne wyspecyfikowanie modelu wymaga jeszcze poczynienia założeń odno-śnie prawdopodobieństw a priori dla pikseli rzeczywistego obrazu X. Założenia te mogą mieć postać bardzo ogólną, jak i szczegółową, jeśli dysponujemy do-datkowymi informacjami na temat odszumianego obrazu. Przykładem takiego ogólnego założenia jest model Pottsa, wykorzystywany także w zagadnieniach fizycznych

gdzie i ∼ j oznacza wszystkie piksele znajdujące się w pewnym określonym sąsiedztwie piksela x(i), zgodnie z zadanym wcześniej grafem K. Parametr β ma wpływ na wagę informacji a priori względem informacji obserwowanej.

Wzór (6.25) oznacza intuicyjne przekonanie, że sąsiednie piksele, np. bezpośred-nio stykające się ze sobą, mają ten sam kolor. Sprzyja to powstawaniu dużych, jednokolorowych obszarów.

Ze wzoru Bayesa mamy prawdopodobieństwo a posteriori

P (X|Y) ∝ P(X) P (Y|X) , (6.26)

skąd, dla modelu zadanego przez (6.22) i (6.25), łatwo otrzymujemy wzór na pełne warunkowe prawdopodobieństwa (porównaj z definicją wprowadzoną w rozdziale 6.3)

Zauważmy, że z założeń modelu wynika, iż skoro interesuje nas postać obra-zu rzeczywistego X, to oznacza, że sobra-zukamy najbardziej prawdopodobnej warto-ści rozkładu. Dysponując pełnymi warunkowymi prawdopodobieństwami (6.27), możemy do rozwiązania tego problemu bezpośrednio skorzystać z wielowymia-rowego próbnik Gibbsa (patrz rozdział 6.3). Na przykład, jeśli przez sąsiedztwo piksela i-tego zdefiniujemy jego ośmiu najbliższych sąsiadów (cztery piksele są-siadujące krawędziami i cztery wierzchołkami), a jako model szumu wykorzy-stamy (6.24), to otrzymujemy Jak łatwo zauważyć, ponieważ sąsiedztwo obejmuje w tym momencie tylko osiem innych pikseli, obliczenie czynnika normującego dla (6.28) jest bardzo łatwe. W konsekwencji umożliwia to bezproblemowe wykorzystanie próbnika Gibbsa.

Model Pottsa opisany wzorem (6.25) najlepiej odpowiada przypadkowi czar-no-białych zdjęć, czyli binarności stanów pikseli obrazu. Dla skali szarości lub obrazów kolorowych lepszym wyborem jest założenie prawdopodobieństwa a priori danego przez

gdzie ψ(.) jest pewną symetryczną funkcją (patrz np. [1, 13]). W tego typu pro-blemach pełne warunkowe prawdopodobieństwa mogą mieć zbyt skomplikowaną postać do bezpośredniego wykorzystania próbnika Gibbsa i niezbędne może być użycie algorytmu MH (patrz rozdział 6.1).

Innym przykładem związanym z analizowaniem i odszumianiem obrazów cy-frowych jest wykorzystanie metod MCMC w obróbce obrazów otrzymanych w tomografii komputerowej SPECT i PET (patrz np. [15, 21]). W modelach tych X jest opisem fizycznego modelu – odwzorowaniem ciała pacjenta poddanego badaniu tomograficznemu. Do ciała pacjenta wprowadzany jest radioaktywny izotop, emitujący pozytrony w wyniku rozpadu jąder atomów. Pozytrony te anihilując z elektronami, powodują powstanie fotonów, rejestrowanych następ-nie przez aparaturę medyczną. W takim ujęciu Y następ-nie jest jedynastęp-nie zaszumionym zniekształceniem obrazu reczywistego X, ale zupełnie inną przestrzenią – mo-delem odwzorowującym sensory rejestrujące fotony. Co istotne, w tego typu zastosowaniu możliwe jest wykorzystanie przedstawionej powyżej metody od-szumiania obrazów, ale w celu ich rekonstrukcji. Najogólniej rzecz ujmując, w tym przypadku problemem do rozwiązania jest znalezienie miejsca i wielkości emisji pozytronów, czyli odtworzenie modelu nieznanej emisji X bazując na za-obserwowanych wynikach sensorów Y. Dodatkowo sam proces odwzorowywania emisji przez aparaturę skutkuje dodatkowymi zmianami w stosunku do omó-wionej wcześniej metody odszumiana - np. sąsiedztwo „piksela” x(i) nie musi być zbiorem zwartym. Przy zastosowaniu metod MCMC możliwe jest jednak pozytywne rozstrzygnięcie, z którego miejsca ciała pacjenta emitowane są reje-strowane przez aparaturę fotony.

W tym miejscu warto jeszcze wspomnieć o modelach bayesowskich. Zwróć-my bowiem uwagę, iż opisana powyżej metoda odszumiania obrazu odpowiada dokładnie zasadom wnioskowania bayesowskiego. W szczególności próbnik Gib-bsa jest znakomicie dostosowany do tego typu zadań, dzięki wykorzystywaniu pełnych warunkowych gęstości przy generowaniu zmiennych z poszukiwanego rozkładu.

Zalety próbnika Gibbsa są szczególnie widoczne przy analizowaniu złożo-nych, wielopoziomowych modeli bayesowskich opisywanych zazwyczaj graficznie za pomocą DAG-ów, tzn. skierowanych, niecyklicznych grafów (w j. ang. direct, acyclic graph). DAG-i składają się z węzłów połączonych strzałkami. Rodzicami danego węzła w grafie DAG nazwiemy wszystkie węzły bezpośrednio połączone z rozpatrywanym węzłem, których strzałki skierowane są w kierunku do tego węzła, a dziećmi – węzły, których strzałki skierowane są od rozpatrywanego wę-zła. Dla przykładu – na rys. 6.1, dziećmi węzła A są węzły B i C, rodzicem węzła Cjest węzeł A, a dzieckiem C – węzeł D. W zastosowaniach statystycznych węzły reprezentują rozkłady poszczególnych parametrów modelu, od których to zależą rozkłady parametrów w węzłach – dzieciach.

Rysunek 6.1: Rodzice i dzieci w DAG-ach

W tego typu modelach wykorzystanie metod MCMC jest możliwe dzięki pewnej obserwacji. Otóż rozkład łączny wszystkich zmiennych można przedsta-wić jako iloczyn rozkładów warunkowych poszczególnych składowych, przy czym rozkłady te zależą tylko od parametrów węzłów – rodziców (patrz np. [23]), tzn.

P(V) = Y

v∈V

P (v | rodzice v ) , (6.30)

gdzie V są wszystkimi zmiennymi losowymi w rozpatrywanym modelu. Umożli-wia to szybkie konstruowanie niezbędnych w próbniku Gibbsa pełnych warun-kowych rozkładów prawdopodobieństw (patrz np. [15]).

W dokumencie Metody Monte-Carlo i MCMC (Stron 87-90)

Powiązane dokumenty