• Nie Znaleziono Wyników

Prof. dr hab. inż. Marek Kurzyński

N/A
N/A
Protected

Academic year: 2021

Share "Prof. dr hab. inż. Marek Kurzyński"

Copied!
6
0
0

Pełen tekst

(1)

Prof. dr hab. inż. Marek Kurzyński Wrocław, 30.11.2013 Politechnika Wrocławska

Wydział Elektroniki

Katedra Systemów i Sieci Komputerowych

R E C E N Z J A

rozprawy doktorskiej Pani mgr inż. Aleksandry ŚWIETLICKIEJ

pt. Stochastyczny model biologicznej sieci neuronowej oparty na kinetycznych schematach Markowa

1. Zakres tematyczny rozprawy

Modelowanie działania neuronów biologicznych i złożonych z nich sieci neuronowych jest przedmiotem intensywnych badań od połowy ubiegłego wieku, co wynika z dwóch okoliczności. Z jednej strony jest to aspekt poznawczy związany z dążeniem do jak najlepszego zrozumienia działania układu nerwowego zarówno w makroskali dotyczącej funkcjonowania poszczególnych struktur anatomicznych układu (np. interakcje pomiędzy neuronami, transmisja synaptyczna, procesy psychofizjologiczne), jaki i mikroskali, na poziomie elementarnych zjawisk chemicznych i elektrycznych zachodzących w poszczególnych komórkach (np. mechanizmy generowania impulsów, propagacja impulsu).

Korzystając z modelu matematycznego można np. symulować procesy i zdarzenia trudne lub niemożliwe do wykonania w warunkach rzeczywistych, można weryfikować neurofizjologiczne hipotezy badawcze, czy identyfikować ewentualne braki w materiale doświadczalnym podczas badań eksperymentalnych. Drugi aspekt ma charakter praktyczny i wiąże się ze znaną i szeroko wykorzystywaną inspiracją dyscyplin biologicznych do tworzenia metod i procedur (struktur, systemów) obliczeniowych, które – poprzez wynikające z tych inspiracji rozwiązania analityczne i/lub heurystyki – prowadzą do efektywnych formalnych narzędzi do rozwiązywania trudnych problemów decyzyjnych w szerokim zakresie różnorodnych zastosowań. Przykładami takich działań mogą być sztuczne sieci neuronowe, algorytmy ewolucyjne, czy metody rojowe.

Recenzowana rozprawa dotyczy właśnie problematyki modelowania biologicznych neuronów i sieci neuronowej oraz zastosowania opracowanych modeli do analizy technicznych obiektów dynamicznych oraz w zadaniu aproksymacji funkcji. Autorka skupiła się na modelach stochastycznych, które w sposób naturalny opisują nieprzewidywalną naturę oraz statystyczną różnorodność komórek nerwowych, i dodatkowo prowadzą do prostszej implementacji w porównaniu z modelami deterministycznymi.

Tematykę rozprawy uważam za w pełni uzasadnioną, interesującą i aktualną dla współczesnych prac z zakresu matematycznego modelowania procesów i obiektów biomedycznych i zastosowania takich modeli do budowy komputerowych systemów obliczeniowych i podejmowania decyzji.

(2)

2. Zawartość rozprawy

Opiniowana praca składa się z 8 rozdziałów, zestawienia symboli i skrótów oraz spisu literatury zawierającego 64 pozycje i obejmuje 120 stron maszynopisu. We wstępie przedstawiono motywację podjęcia tematu rozprawy, określono zakres pracy oraz na szeroko nakreślonym tle literaturowym sformułowana została teza i cele pracy. Przedstawiono tutaj także strukturę rozprawy i zawartość poszczególnych rozdziałów. Rozdział 2 obejmuje przykłady zastosowań impulsowych sieci neuronowych opartych na modelu neuronu integrate-and-fire lub resonate-and-fire. Przykłady te dotyczą różnych aspektów robotyki i automatyki (sterowanie manipulatorem robota, widzenie maszynowe, realizacja regulatora PID, układ sterowania serwomechanizmem) i demonstrują szerokie możliwości wybranych modeli biologicznych komórek i sieci neuronowych w zastosowaniach technicznych.

Rozdział 3 poświęcony został modelom matematycznym pojedynczej komórki nerwowej.

W pierwszej kolejności przedstawiony został klasyczny model Hodgkina-Huxleya, który – choć zaproponowany ponad 60 lat temu – ciągle jest wykorzystywany wraz z różnymi swoimi wariantami do konstrukcji mniej lub bardziej realistycznych modeli komórek nerwowych, stanowiąc tym samym jeden z ważnych paradygmatów neurobiologii obliczeniowej.

Następnie przedstawiono wariant stochastyczny modelu HH uzyskany przez wprowadzenie zakłócenia umożliwiającego modelowanie stochastycznego zachowania kanałów jonowych.

Kolejne rozszerzenie modelu to wprowadzenie tzw. kinetycznych schematów Markowa, które poprzez pojęcie stanu wraz z charakterystykami probabilistycznymi pozwalają opisać prawdopodobieństwa znalezienia się kanału jonowego w określonym stanie oraz prawdopodobieństwa przejścia pomiędzy stanami. Kinetyczny model HH został dalej przedstawiony w dwóch wariantach (deterministyczny i stochastyczny model kinetyczny), które stanowią punkt wyjścia do przedstawionego w rozdziale oryginalnego wariantu modelu HH zwanego kinetycznym modelem komórki nerwowej z rozszerzonym schematem Markowa, również w wersji deterministycznej i stochastycznej. Autorski model został zilustrowany bogatymi wynikami badan symulacyjnych.

W rozdziale 4 przedstawione zostały metody uczenia modelu komórki nerwowej pozwalających przystosować go do zadanego potencjału wzorcowego. Na tle opisu metody gradientu prostego i jej wykorzystania w podstawowym modelu HH przedstawione zostało autorskie rozszerzenie metody uczenia na przypadek stochastycznego modelu kinetycznego neuronu zilustrowane dodatkowo wynikami badań eksperymentalnych.

Dwa kolejne rozdziały stanowią naturalne rozbudowanie modeli i metod uczenia z rozdziałów 3 i 4 na przypadek struktur neuronów biologicznych tworzących sieć neuronową. I tak, w rozdziale 5 opisano model Hodgkina-Huxleya sieci neuronowej o strukturze drzewiastej oraz jego autorskie rozszerzenie na deterministyczny i stochastyczny model kinetyczny sieci neuronowej. Wszystkie przedstawione modele zostały eksperymentalnie zweryfikowane badaniami symulacyjnymi dla różnych struktur sieci neuronowej. Z kolei rozdział 6 zawiera prezentację algorytmów uczenia biologicznych sieci neuronowych opisanych stochastycznym modelem kinetycznym, w których parametry modelu są strojone poprzez łączne zastosowanie metody mnożników Lagrange’a i metody gradientu prostego.

Proces uczenia został zilustrowany przykładowymi wynikami.

W rozdziale 7 przedstawione zostały przykłady zastosowania opracowanych modeli biologicznych komórek neuronowych w wybranych problemach obliczeniowych i decyzyjnych. Jest to zadanie aproksymacji funkcji prostokątnej oraz problem lokalizacji w przestrzeni obiektu na podstawie pomiaru przyspieszeń liniowych i kątowych oraz zwrotu i siły ziemskiego pola magnetycznego. Zademonstrowano tu dodatkowo sposób przygotowania modelu pod implementację równoległą z wykorzystaniem kart graficznych.

Pracę podsumowuje rozdział 8, w którym przedstawiono syntetyczne wnioski wynikające

(3)

Przedstawiona rozprawa prezentuje najważniejsze rezultaty objęte jej tematyką w logicznym układzie oraz w szerokim kontekście aktualnego stanu wiedzy w zakresie modelowania biologicznych komórek nerwowych i ich struktur w postaci sieci neuronowych, a także procesów uczenia komórek i ich struktur. Na szczególnie pozytywne podkreślenie zasługuje dbałość autorki o wysoki poziom edytorski oraz bogata i staranna strona graficzna obejmująca liczne ilustracje przedstawiające w wygodnej formie wyniki badań eksperymentalnych oraz przeprowadzonych symulacji. Chociaż ogólnie zakres pracy i sposób ujęcia materiału oceniam pozytywnie, to należy tu wnieść uwagę krytyczną dotyczącą zbyt słabego rozróżnienia pomiędzy treściami zaczerpniętymi z literatury, a oryginalnym wkładem autorskim. Ponieważ oryginalny zestaw wyników nie budzi wątpliwości, dlatego – zdaniem recenzenta – zasługuje on na wyraźne podkreślenie, dokładne wyszczególnienie i odpowiednie wyeksponowanie, zarówno w trakcie prowadzonych wywodów, jak i w formie syntetycznej np. we wstępie lub w podsumowaniu.

3. Uzyskane wyniki

Celem pracy było wykazanie następujących tez (cyt.):

1. Możliwe jest efektywne sterowanie w czasie rzeczywistym obiektami automatyki i robotyki z wykorzystaniem sztucznej inteligencji, bazującym na impulsowym modelu neuronu wynikającym z odpowiednio zmodyfikowanego opisu neuronu Hodgkina-Huxleya;

2. Z uwagi na dużą złożoność obliczeniową istniejących modeli biologicznych komórek neuronowych, możliwe jest zbudowanie takich modeli, w których wierność procesów odtwarzania będzie większa od dotychczasowych przy jednoczesnym obniżeniu nakładów niezbędnych do obliczeń;

3. Wykorzystanie w zagadnieniach aproksymacji – można skonstruować matematyczny model neuronu biologicznego, który zdolny jest aproksymować wybraną funkcję nieliniową jednej zmiennej z dowolną dokładnością aproksymacji.

Wykazanie prawdziwości tez wymagało od doktorantki opracowania oryginalnych modeli biologicznych komórek nerwowych i sieci neuronowych o określonej strukturze, opracowanie algorytmów uczenia zamodelowanych komórek i sieci oraz zastosowanie opracowanych modeli i procesów uczenia do określonych problemów sterowania i aproksymacji funkcji, a także porównania uzyskanych wyników z metodami istniejącymi. Tak więc, realizacja sformułowanego celu doprowadziła do szeregu szczegółowych i konkretnych osiągnięć, które można ująć w następujące punkty:

1. Zaproponowanie poszerzonego kinetycznego modelu Hodgkina-Huxleya biologicznej komórki nerwowej. Opracowany model, który wykorzystuje rozbudowany kinetyczny schemat Markowa przedstawiający możliwe stany kanałów jonowych pozwala na pełniejszy opis komórek nerwowych i na budowę modelu biologicznej sieci nerwowej z różniącymi się modelami poszczególnych komórek. Model kinetyczny bazuje na diagramach stanów, w których prawdopodobieństwa wystąpienia określonego stanu opisane są schematem Markowa. Zaproponowany model występuje w dwóch wersjach.

Pierwszą stanowi model deterministyczny, w którym oddzielnie rozpatrywane są poszczególne kanały jonowe, drugą natomiast model stochastyczny, gdzie analizuje się średnią liczbę kanałów zmieniających stan przyjmując, iż jest to zmienna losowa o rozkładzie dwumianowym. Przykładowe wyniki implementacji modelu pokazały jego zgodność z innymi modelami zbudowanymi na bazie modelu HH (regularne skoki potencjału o częstotliwości rosnącej ze wzrostem prądu wymuszającego) oraz umożliwiły demonstrację różnicy pomiędzy przebiegiem potencjału dla modelu stochastycznego i deterministycznego.

(4)

2. Opracowanie modelu sieci neuronowych opartego na podstawowym modelu Hodgkina- Huxleya oraz na koncepcji rozszerzenia kinetycznego schematu Markowa. W zaproponowanym modelu, w odróżnieniu od modelu sieci neuronowej HH, funkcja konduktancji ma postać wynikającą ze schematu kinetycznego Markowa z odpowiednią liczba stanów dla kanałów jonowych sodu i potasu opisujących procesy przepuszczania lub nieprzepuszczania tych jonów przez błonę komórkową. Model posiada również dwa warianty (deterministyczny i stochastyczny), których różnica jest analogiczna, jak dla kinetycznego modelu pojedynczej komórki nerwowej. Ponieważ istotą modelu sieci neuronowej jest traktowanie jej jako struktury rozłożonej przestrzennie (komórka nerwowa jest elementem punktowym), dlatego model ujmuje potencjał na błonie komórki o określonym kształcie. Przyjmuje się tutaj kształt drzewiasty wynikający z dendrytowej budowy neuronu. W przeprowadzonych badaniach eksperymentalnych rozpatrywano prostą sieć zbudowaną z jednego odcinka oraz drzewa binarne o pięciu i siedmiu gałęziach. Analiza modelu wiąże się z dyskretyzacją i podziałem struktury sieci (punkty początkowe, rozgałęzienia sieci i końcowe) oraz z wyznaczeniem zmian wartości potencjałów w poszczególnych dyskretnych taktach czasu dla zadanych warunków początkowych. Rozwiązywane równania mają postać wektorowo-macierzową z tzw.

macierzą systemową zawierającą parametry geometrii poszczególnych gałęzi sieci i z macierzą diagonalną związaną z punktami rozgałęzień struktury drzewa. Opracowany model został poddany badaniom dla 3 wymienionych typów struktury sieci. Uzyskane wyniki symulacji przebiegu potencjału w wybranych punktach struktury sieci odpowiadają przebiegom rzeczywistym i pokazują, iż modele stochastyczny i deterministyczny dają porównywalne wyniki, co – wobec prostszej implementacji modelu stochastycznego – pozwala go rekomendować do praktycznych zastosowań.

3. Zaproponowanie algorytmów uczenia dla stochastycznego modelu kinetycznego neuronu oraz dla kinetycznego modelu biologicznej sieci neuronowej. W rozpatrywanych zadaniach, uczenie polega na takim doborze określonych parametrów modeli neuronów, aby uzyskać zadany przebieg potencjału na błonie komórkowej, zgodny z potencjałem wzorcowym. W przypadku stochastycznego modelu kinetycznego, proces uczenia oparty jest na minimalizacji błędu średniokwadratowego z iteracyjnym algorytmem gradientowym, a różnica w porównaniu z podstawowym modelem HH wynika ze specyfiki modelu stochastycznego, w którym reprezentacja przepływu jonów przez błonę komórkową wyznaczana jest w procesie losowym. Przykładowe porównanie procesu uczenia modelu HH i kinetycznego modelu stochastycznego pokazuje, iż czas trenowania (czas pojedynczej iteracji) dla modelu kinetycznego jest znacznie krótszy przy porównywalnych wynikach dopasowania do przebiegu wzorcowego. W zadaniu uczenia modelu kinetycznego biologicznych sieci neuronowych do aktualizacji parametrów modelu zastosowana została metoda gradientowa w połączeniu z metodą mnożników Lagrange’a. Wynika to z faktu, iż minimalizacji podlega – jak poprzednio – błąd średniokwadratowy dla wybranych punktów struktury, ale dodatkowo, przy ograniczeniach związanych z opisem potencjału na błonie komórkowej w tych punktach.

4. Zastosowanie opracowanych modeli biologicznych komórek i sieci neuronowych w wybranych zadaniach praktycznych. Zgodnie ze sformułowanymi tezami, przedstawione zostały dwa przykłady ilustrujące możliwości modelu kinematycznego biologicznej komórki nerwowej uczonej przy pomocy gradientowej metody optymalizacji. Pierwszy przykład dotyczy zadania aproksymacji funkcji prostokątnej przy pomocy pojedynczej komórki nerwowej z kinetycznym modelem stochastycznym. W zadaniu tym, jako wielkości wejściowe (w modelu jest to prąd wymuszający) zadawane są wartości argumentu funkcji, a odpowiedzi modelu (wartości potencjału na błonie komórkowej) stanowią wartości aproksymowanej funkcji. Przeprowadzona symulacja pokazuje krótki

(5)

czas nauki (niecałe 6 sek.) oraz bardzo dobre dopasowanie funkcji aproksymującej do oryginału (maksymalny błąd rzędu 10-5). Drugi przykład wiąże się z systemem AHRS (Attitude and Heading Reference System) umożliwiającym wyznaczenie orientacji obiektu w przestrzeni na podstawie danych pochodzących z akcelerometru, żyroskopu i magnetometru. Wynikiem działania systemu są tzw. kąty Eulera określające położenie obiektu wzg. 3 prostopadłych osi obrotu. Ponieważ algorytm wyznaczania kątów Eulera w systemie AHRS jest złożony obliczeniowo (duża liczba operacji macierzowych), dlatego zaproponowano i przebadano eksperymentalnie alternatywne rozwiązanie, w którym zastosowano sztuczną sieć neuronową Elmana w połączeniu z modelami biologicznych komórek nerwowych. Trzy wyjścia sieci Elmana (kąty Eulera względem 3 osi) podane zostały na 3 neurony biologiczne, których zadaniem było wygładzenie (uzyskanie wyniku o większej precyzji) wartości uzyskanych na wyjściu sztucznej sieci neuronowej.

Przeprowadzone badania eksperymentalne dowodzą, iż zastosowanie modeli neuronów biologicznych pozwoliło na znaczące zmniejszenie błędu w wyznaczeniu katów Eulera względem wartości referencyjnych.

4. Uwagi szczegółowe

W recenzowanej rozprawie dostrzega się usterki, które można ująć w następujące punkty:

1. Wśród przykładów praktycznych zastosowań zabrakło takiego, który wprost odnosiłby się do zadania sterowania, a więc bezpośrednio potwierdzałby pierwszą tezę rozprawy. W konsekwencji, pierwsza teza została wykazana poprzez przytoczony w rozdziale 2 przegląd literaturowy oraz poprzez zastosowanie opracowanego modelu w zadaniu lokalizacji obiektu dynamicznego, które – jak się wydaje – może być ważnym etapem w zadaniu sterowania tym obiektem. Należało jednak – zdaniem recenzenta – ten fakt wyraźnie podkreślić i przeanalizować układ sterowania quadrocopterem umieszczając w jego strukturze blok odpowiedzialny za lokalizację przestrzenną sterowanego obiektu.

2. Z punktu widzenia sformułowanych tez oraz przeprowadzonych porównawczych badań symulacyjnych modeli ważne jest jednoznaczne określenie różnic uzyskanych wyników.

W wielu przypadkach autorka stosuje słowne określenia (np. wyniki o podobnej precyzji), które są efektem subiektywnego odczucia przy oglądaniu graficznej prezentacji odpowiedzi modeli na identyczne pobudzenie. Można by takiej niejednoznaczności uniknąć, gdyby przeprowadzić statystyczną analizę wyników, np. poprzez weryfikację hipotezy o braku statystycznie istotnej różnicy (na przyjętym poziomie istotności) pomiędzy wynikami porównywanych metod.

3. W zadaniu aproksymacji funkcji prostokątnej autorka podkreśla, iż zastosowanie do tego zadania sztucznej sieci neuronowej wymagałoby sieci z jedną warstwą ukrytą, natomiast w przypadku modelu biologicznego wystarczy pojedynczy neuron. Takie stwierdzenie wcale nie musi oznaczać, iż sztuczna sieć neuronowa będzie prowadziła do gorszych wyników (dłuższy czas lub/i gorsza jakość aproksymacji). Należało również dokonać aproksymacji z wykorzystaniem sztucznej sieci neuronowej i uzyskane liczbowe wyniki dla obu zastosowanych metod porównać.

4. Brak opisu diagramów stanu (3.21) i (3.22) ((3.21) i (3.22) nie są – jak napisano – równaniami), w szczególności brak komentarza dotyczącego różnic pomiędzy modelem kinetycznym (3.14) –(3.17), a autorskim kinetycznym modelem rozszerzonym (3.21) – (3.24). Komentarza wymagałyby również wyniki symulacji (np. porównanie przebiegów potencjału na błonie komórkowej dla kinetycznego modelu podstawowego (rys. 3.6 i 3.7) i dla kinetycznego modelu rozszerzonego (rys. 3.11 – 3.14) w wersji deterministycznej i stochastycznej.

5. W badaniach symulacyjnych kinetycznego modelu rozszerzonego podkreśla się, że można dla niego (cyt.) zaobserwować te same cechy modelu, charakterystyczne dla

(6)

wszystkich modeli Ę Hąsy, otaz że poptzez one symulacje (cyt.) wylwzały, że model ten z podobnq precyzjq opisuje procesy zachodzqce na Nonie kłmórkowej.

Powstaje zatęm pytanie, jaki był §en§ opracowania nowego, bardziej ńożonego modelu oraz jak wyelądety badania" które pozwoliły rła wyciągnięcie wniosku o podobnej

precyzji porównywanyclł rnetod (rrie zostĄ one opisane w pracy}.

6. Brak dyskusji związanej z porównaniem wyników symulacji dla dwóch modeli sieci neuronowych (rys. 5.2,5.4 i 5.6 oraz rys. 5.7, 5.8 i 5.9)

7. Usterki językowe -np. biologiczne modele kłmórek (str.8)" ...najlepiej odwzorowuje ...

w najlepszy sposób (str. 41), pruszajqc się wgłqb {69).

8. Wszystkie wzory i formuły matematyczne naleĘ traktować jako fragmenty zdań, w kontekście których się pojawiły. amacza to, że w wzorarh powinny wyĘpić

odpowiednieznaki interpunkcyjne (np. przecinekprzeó słowem gdzie, kropka, gdy wzór kończy zdanie)"

5. Podsumowanie recenzji - ocen& rozprawy

Reasumując stwierdzam, D Pani mgr inZ. Aleksandra Świetlicka wykazał się duzą wiedą z zakresu matematycznego modelowania biologicznych komórek nerwowych i ich struktur oraz komputerowej implementacji Ęch modeli i prowadzeniabadań synrulacyjnych, a także opanowaniem i właściwym posfugiwaniem się odpowiednim wusńatem bńawcrym.

Przedstawiona praca zavłiera poprawnie sformułowany i ramłiązany problem badawczy araz stanowi wartościolvy wkład w óńędzinę kornputerowego modelowania obiektów i procesów biologioznych i jego technicznych zastosowań- 7avłarte w niej rezultaty obejmujące modele biologicznych komórek i ioh strukfur, algorytmy uczenia, badania synłulacyjrre ataz przykłady zastosowań, oryginalne i zostały pruedstawione w logicznym układzie i na

wysokim poziomie matemaĘcznych formalizmów. {Jwazam, że praca doktorska Pani mgr inż. Aleksandry Świetlickiej speŁria wymogi stawiane pracom doktorskim przez odpowiednią Ustawę i wnioskuję o dopuszczenie jej do publicznej obrony.

h,ŁF

Cytaty

Powiązane dokumenty

Celem rozprawy jest bowiem opracowanie metodyki, zapisanej w formie procedury, wspomagającej budowę systemu informatycznego, przeznaczonego do automatyzacji procesu

Arkadiusza Stojeckiego jest opracowana przez Niego metodyka badań wpływu topografii terenu na poziom emisji szkodliwych związków spalin środków transportu w

Streszczenie: Celem obsług prewencyjnych jak i korekcyjnych jest zachowanie lub przywrócenie akceptowalnego poziomu efektywności i bezpieczeństwa eksploatacji danego

Ze względu na konstrukcję dźwigara ( skos oraz wznios) zdecydowano się na odtworzenie całego badanego fragmentu, co wyeliminowało konieczność wprowadzania

Podczas analizy wpływu rozmieszczenia otworu na ugięcie ramy przyjęto wartość jego odległości d w przedziale od 50 do 100, co 10 mm (rys. 6a oraz tab. We wszystkich

W dalszej części badań wyznaczone średnie wartości amplitudy odkształcenia oraz moment pojawiania się pęknięć po określonej liczbie cykli posłużą do

Dla silników spełniających regulacje EPA 2004 wyznaczono obszary bez pomiaru emisji cząstek stałych (zależne m.in. Nie dotyczy to silników EPA 2007, ale w tym

W przypadku negatywnej odpowiedzi (struktura kompetencji nie jest wystarczająca do realizacji zadań) decydent ma możliwość wykorzystywania opracowanej metody