Stochastyczny model biologicznej sieci neuronowej oparty na kinetycznych schematach Markowa

(1)

mgr inż. Aleksandra Świetlicka

Stochastyczny model biologicznej sieci neuronowej oparty na kinetycznych schematach Markowa

Rozprawa doktorska

Promotor

dr hab. inż. Andrzej Rybarczyk, prof. nadzw.

Poznań, 2013

(2)

Pracę dedykuję mojemu Mężowi Hubertowi Świetlickiemu który dzielnie wytrzymał wszystkie moje

„jęki i stęki” i gdyby nie on w pracy nie istniałaby interpunkcja.

Serdecznie dziękuję Profesorowi Andrzejowi Rybarczykowi za każde słowo wsparcia i za okazaną mi cierpliwość, zwłaszcza przy organizacji wszystkich formalności.

Dziękuję również Rafałowi Długoszowi,

jego „drobne uwagi” bardzo mi pomogły

i zdecydowanie wzbogaciły zawartość

pracy.

(3)

Spis symboli i skrótów 1

1 Wstęp 5

1.1 Przedmiot pracy . . . . 5

1.2 Motywacja i cel pracy . . . . 7

1.3 Teza i układ pracy . . . . 8

2 Wykorzystanie biologicznych sieci neuronowych w rozwiązywaniu problemów automatyki i robotyki 11 3 Deterministyczne i stochastyczne modele komórki neuronowej 20 3.1 Wprowadzenie . . . . 20

3.2 Potencjał czynnościowy . . . . 21

3.3 Podstawowy model Hodgkina-Huxleya . . . . 22

3.3.1 Parametry modelu Hodgkina-Huxleya . . . . 24

3.4 Zakłócenia w modelu Hodgkina-Huxleya . . . . 25

3.5 Kinetyczny model Hodgkina-Huxleya . . . . 27

3.5.1 Kinetyczny schemat Markowa . . . . 27

3.5.2 Deterministyczny model kinetyczny . . . . 28

3.5.3 Stochastyczny model kinetyczny . . . . 30

3.5.4 Porównanie deterministycznego i stochastycznego modelu kinetycznego . . . . 32

3.6 Kinetyczny model komórki nerwowej z rozszerzonymi schematami Markowa . . . . 32

3.7 Stochastyczna wersja modelu o rozszerzonych schematach kinetycznych . . . . 36

3.8 Przykładowe wyniki implementacji modelu o rozszerzonych schematach kinetycznych . . . . 36

3.9 Podsumowanie . . . . 41

4 Metody uczenia komórki neuronowej 43 4.1 Metoda gradientu prostego . . . . 43

4.2 Nauka w modelu Hodgkina-Huxleya . . . . 44

4.3 Nauka w stochastycznym modelu kinetycznym neuronu . . . . 49

4.4 Wyniki eksperymentalne . . . . 50

5 Model biologicznej sieci neuronowej 56

5.1 Struktura rozpatrywanej sieci neuronowej . . . . 57

(4)

Spis treści

5.2 Dyskretyzacja i sposób rozwiązania układu . . . . 58

5.3 Wartości parametrów oraz wartości inicjujące . . . . 61

5.4 Wyniki eksperymentalne - sieć neuronowa zbudowana z jednej gałęzi . . . . 61

5.4.1 Macierz systemowa . . . . 62

5.4.2 Wyniki symulacji . . . . 62

5.5 Wyniki eksperymentalne - sieć neuronowa zbudowana z pięciu gałęzi . . . . 63

5.5.1 Macierz systemowa . . . . 65

5.5.2 Wyniki symulacji . . . . 66

5.6 Wyniki eksperymentalne - sieć neuronowa zbudowana z siedmiu gałęzi . . . . 66

5.6.1 Macierz systemowa . . . . 68

5.6.2 Wyniki symulacji . . . . 69

5.7 Deterministyczny model kinetyczny sieci neuronowej . . . . 71

5.8 Wyprowadzenie stochastycznej wersji modelu sieci neuronowej . . 71

5.9 Dyskretyzacja i sposób rozwiązania układu . . . . 71

5.9.1 Rozwiązanie równań wynikających ze schematów kinetycznych Markowa . . . . 74

5.9.2 Funkcje α i β oraz ich pochodne względem potencjału . . . 78

5.10 Wyniki eksperymentalne - sieć zbudowana z jednej gałęzi . . . . . 79

5.11 Wyniki eksperymentalne - sieć zbudowana z pięciu gałęzi . . . . . 80

5.12 Wyniki eksperymentalne - sieć zbudowana z siedmiu gałęzi . . . . 81

5.13 Porównanie modelu klasycznego sieci neuronowej z modelami kinetycznymi . . . . 83

6 Metody uczenia biologicznych stochastycznych sieci neuronowych 85 6.1 Metoda mnożników Lagrange’a . . . . 85

6.2 Sformułowanie problemu . . . . 86

6.3 Rozwiązanie postawionego problemu . . . . 88

6.4 Przykładowe wyniki . . . . 90

7 Przykłady zastosowania modeli biologicznych komórek neuronowych w automatyce i robotyce 96 7.1 Przygotowanie biologicznych sieci neuronowych dla implementacji z wykorzystaniem kart graficznych . . . . 96

7.2 Aproksymacja funkcji prostokątnej . . . . 98

7.3 Wykorzystanie komórek nerwowych w algorytmie wyznaczania kątów Eulera poprzez system AHRS . . . . 99

8 Podsumowanie 112

Literatura 115

ii

(5)

Wykaz symboli i oznaczeń występujących w pracy

a, b – skala czasu i wrażliwość „zmiennej odzysku” u a

_i

– promień przekroju gałęzi sieci neuronowej

A – macierz systemowa - pokazująca rozkład współczynników a

_i

, wynikająca z budowy sieci neuronowej

α

_m

, α

_n

, α

_h

– funkcje sigmoidalne zależne od potencjału V, reprezentujące współczynnik przejścia pomiędzy wnętrzem a zewnętrzem komórki nerwowej

β

_m

, β

_n

, β

_h

– funkcje sigmoidalne zależne od potencjału V, reprezentujące współczynnik przejścia pomiędzy zewnętrzem a wnętrzem komórki nerwowej

B (n, p) – rozkład dwumianowy o parametrach n i p C – kondensator powiązany z błoną komórkową dV – wartość stała - dV = 20

dW – przyrost procesu Wienera

D

_t

– człon różniczkujący regulatora PID

∆n

_AB

– średnia liczba kanałów, która przechodzi ze stanu A do stanu B (stochastyczny model kinetyczny komórki nerwo- wej)

∆t – przyrost czasu

∆x – długość podziału gałęzi sieci neuronowej na segmenty e (t) – uchyb regulacji

e

_x

, e

_y

, e

_z

– osie główne

E – funkcja minimalizowana w metodzie gradientu prostego η – współczynnik długości kolejnych kroków w metodzie gra-

dientu prostego

F – funkcja będąca sumą funkcji minimalizowanej G i funk- cji F

1

, F

2

, . . . , F

m

wymnożonych przez mnożniki Lagrange’a λ

₁

, λ

₂

, . . . , λ

_m

w metodzie mnożników Lagrange’a LUB pomocniczy zapis głównego równania modelu Hodgkina- Huxleya lub modelu kinetycznego w metodzie gradientu prostego

F

₁

, F

₂

, . . . , F

_m

– ograniczenia w metodzie mnożników Lagrange’a

G – funkcja minimalizowana w metodzie mnożników Lagrange’a LUB pochodna funkcji F względem potencjału

g

_{N a}

– stała o wymiarze konduktancji jonowej sodu mierzona na

cm

²

(6)

Spis symboli i skrótów

g

_K

– stała o wymiarze konduktancji jonowej potasu mierzona na cm

²

g

_L

– stała o wymiarze konduktancji jonowej chloru mierzona na cm

²

¯

g

_{N a}

– konduktancja jonowa sodu - ¯ g

_{N a}

= g

_{N a}

m

³

h

¯

g

_K

– konduktancja jonowa potasu - ¯ g

_K

= g

_K

n

⁴

ˇ

g

_{N a}

, ˇ g

_K

, ˇ g

_L

– wartości domyślnych parametrów g

_{N a}

, g

_K

, g

_L

˜

g

_{N a}

, ˜ g

_K

, ˜ g

_L

– wagi modelu Hodgkina-Huxleya i stochastycznego modelu kinetycznego

I – prąd wymuszający - wejście zewnętrzne komórki nerwowej I

_ext

– prąd wejściowy komórki nerwowej, powiązany z załącza-

niem i wyłączaniem kondensatora C

I

_ion

– prąd powiązany z ruchem poszczególnych typów jonów przez membranę

I

_t

– człon całkujący regulatora PID k

_P

, k

_I

, k

_D

– parametry regulatora PID

l – długość pojedynczej gałęzi sieci neuronowej

L – macierz koincydencji - przedstawienie połączeń między ga- łęziami sieci neuronowej

λ

₁

, λ

₂

, . . . , λ

_m

– mnożniki Lagrange’a

m, n, h – zmienne bezwymiarowe, przyjmujące wartości z przedziału h0, 1i , zmienne te pomagają w opisie prawdopodobieństwa tego, że pojedyncza bramka jest w stanie przepuszczania;

kombinacja zmiennych m i h kontroluje kanały sodowe, zmienna n - kanały potasowe

µ – wartość oczekiwana rozkładu normalnego

n

_A

, n

_B

– liczba kanałów odpowiednio w stanie A i w stanie B (sto- chastyczny model kinetyczny komórki nerwowej)

N (µ, σ) – rozkład normalny o wartości oczekiwanej µ i odchyleniu standardowym σ

ϑ – kąt główny

ϕ

_{N a}

– konduktancja pojedynczego kanału jonowego sodu będą- cego w stanie otwartym

ϕ

_K

– konduktancja pojedynczego kanału jonowego potasu będą- cego w stanie otwartym

p – prawdopodobieństwo przejścia jednego kanału ze stanu A do stanu B; p = ∆t · r

_AB

p

_i

– prawdopodobieństwo tego, że bramka i jest w stanie prze- puszczania

P (x

_i

, t) – prawdopodobieństwo znajdowania się kanału jonowego w stanie x

i

w chwili czasu t

P (x

_i

→ x

_j

) – prawdopodobieństwo przejścia kanału jonowego ze stanu x

_i

do stanu x

_j

P

_t

– człon proporcjonalny regulatora PID φ, θ, ψ – kąty Eulera - Roll, Pitch, Yaw

r

_AB

, r

_BA

– funkcja przejścia kanałów odpowiednio ze stanu A do stanu B i ze stanu B do stanu A (stochastyczny model kinetyczny komórki nerwowej)

2

(7)

R – rezystancja cytoplazmy komórki nerwowej (aksoplazmy) q – kwaternion

q

₀

– skalar kwaternionu iq

₁

+ jq

₂

+ kq

₃

– wektor kwaternionu

σ – wielkość stała (σ = 0.1), pozwala kontrolować wielkość za- kłóceń w modelu stochastycznym komórki nerwowej LUB odchylenie standardowe rozkładu normalnego

t – czas

u – „zmienna odzysku” (ang. recovery variable) w modelu Izhi- kevicha

u (t) – sygnał wyjściowy regulatora PID

v – potencjał na błonie komórkowej wg modelu Izhikevicha V – potencjał otrzymywany w wyniku działania komórki ner-

wowej

V

_{N a}

– potencjał równowagi jonów sodu V

_K

– potencjał równowagi jonów potasu

V

_L

– „potencjał wycieku” (ang. leakage current ) związany z jo- nami chloru

V

_α_n

, V

_α_m

, V

_α_h

– zapis ogólny wag w metodzie gradientu prostego dla modelu Hodgkina-Huxleya powiązanych z funkcjami α

n

, α

_m

, α

_h

V

_β_n

, V

_β_m

, V

_β_h

– zapis ogólny wag w metodzie gradientu prostego dla modelu

Hodgkina-Huxleya powiązanych z funkcjami β

_n

, β

_m

, β

_h

V ˇ

_α_n

, ˇ V

_α_m

, ˇ V

_α_h

– wartość domyślna parametrów V

_α_n

, V

_α_m

, V

_α_h

wynikająca

z postaci funkcji α

_n

, α

_m

, α

_h

V ˇ

_β_n

, ˇ V

_β_m

, ˇ V

_β_h

– wartość domyślna parametrów V

_β_n

, V

_β_m

, V

_β_h

wynikająca z postaci funkcji β

_n

, β

_m

, β

_h

V ˜

αn

, ˜ V

αm

, ˜ V

α_h

– wagi w metodzie gradientu prostego dla modelu Hodgkina- Huxleya, powiązane z funkcjami α

_n

, α

_m

, α

_h

V ˜

_β_n

, ˜ V

_β_m

, ˜ V

_β_h

– wagi w metodzie gradientu prostego dla modelu Hodgkina- Huxleya, powiązane z funkcjami β

_n

, β

_m

, β

_h

V

^∗

– potencjał wzorcowy w metodzie gradientu prostego

V

_i^(t)

(x) – opis potencjału w sieci neuronowej: i - numer rozpatrywa- nej gałęzi, (t) – moment czasu, (x) – punkt gałęzi

w

1

, w

2

, . . . , w

n

– wagi neuronu/sieci neuronowej

x

_i

, x

_j

– stany ogólnego schematu kinetycznego Markowa LUB war- tość funkcji (w metodzie gradientu prostego)

Wykaz skrótów

ASNN – Artificial Spiking Neural Network - sztuczna impulsowa sieć neuronowa

AHRS – Attitude and Heading Reference System - system senso- rów, zapewniający odczyt trzech stopni swobody związa- nych z ruchem obrotowym względem osi x, y i z

DCM – Direction Cosine Matrix - macierz kosinusów kierunkowych FPGA – Field Programmable Gate Array - programowalny układ lo-

giczny

(8)

Spis symboli i skrótów

GPU – Graphics Processing Unit - procesor graficzny

IMU – Inertial Measurement Unit - inercyjny zespół pomiarowy LIF – model Leaky Integrate-and-Fire

LSM – Liquid State Machine - struktura obliczeniowa podobna do sieci neuronowej

MEMS – Micro Electro-Mechanical Systems - mikrosystemy

ODLM – Oscillatory Dynamic Link Matcher - algorytm wyznacza- jący segmentację obrazu, dopasowanie obrazu i monofo- niczne oddzielenie źródła dźwięku

PCB – Printed Circuit Board - obwód drukowany

PID – regulator proporcjonalno-całkująco-różniczkujący SNN – Spiking Neural Network - impulsowa sieć neuronowa

SFR – Spike Frequency Reduction - adaptacja częstotliwości im- pulsów

SRM – Spike Response Model - model stanowiący generalizację mo- delu LIF

4

(9)

Wstęp

1.1 Przedmiot pracy

W ostatnich latach można zaobserwować zwiększenie liczby naukowców, któ- rzy próbują zrozumieć różnorodność działania systemu nerwowego i podejmują próby jego opisu z wykorzystaniem aparatu matematycznego [7]. Nieustannie gromadzone dane nie są wciąż jednak wystarczające do wykonania precyzyjnego modelu matematycznego tego systemu. Stąd potrzeba ciągłego rozwijania tej dziedziny i prowadzenia dalszych badań. Przedmiotem pracy są badania nad tworzeniem nowych modeli matematycznych, które w porównaniu z istniejącymi modelami, będą lepiej opisywać procesy zachodzące w mózgu. Praca ma też wymiar praktyczny, podano przykłady zastosowań w sterowaniu obiektami auto- matyki i robotyki.

Neuron jest podstawową jednostką układu nerwowego, która zbudowana jest zawsze z jednego aksonu i wielu dendrytów. Przystosowana jest do przewodze- nia, przetwarzania i generowania impulsów nerwowych. W rzeczywistości prze- wodzenie może odbywać się w różnych kierunkach, natomiast w rozpatrywanych modelach, zakładać się będzie, że odbywa się ono w jednym kierunku: od den- drytów do jądra oraz z komórki poprzez akson do następnej komórki. Impulsy, które wpływają do komórki poprzez dendryty są sumowane na błonie komórkowej.

Następnie z pomocą aksonu, który zakończony jest synapsą, impulsy przekazy- wane są do kolejnego neuronu lub grupy neuronów. Największe znaczenie przy przesyłaniu sygnałów nerwowych ma błona komórkowa, która równoważy różnicę potencjałów pomiędzy wnętrzem i zewnętrzem komórki.

Istnieje wiele modeli opisujących procesy zachodzące na błonie komórkowej, jednak każdy z nich opiera się na innych założeniach. Mianowicie z jednej strony zwiększa się liczba parametrów modelu, aby jak najwierniej odwzorować poten- cjał na błonie komórkowej. Z drugiej zaś strony poszukuje się również uproszczeń istniejących modeli, głównie w celu uproszczenia implementacji. Poniżej pokrótce przedstawiona zostanie charakterystyka wybranych modeli, podczas gdy w kolej- nych rozdziałach pracy znajduje się obszerny opis modeli stanowiących bazę dla nowo tworzonych.

Pierwszy model neuronu zaproponowany został w roku 1907 przez Louisa Lapicque - „integrate-and-fire” [1, 43] i opisany był jedynie prostym równaniem:

I (t) = C dV (t)

dt (1.1)

(10)

1.1 Przedmiot pracy

przedstawiającym zmianę w czasie potencjału V na błonie komórkowej o konduk- tancji C względem prądu wejściowego I.

Innym, przełomowym modelem, okazał się model Alana Lloyda Hodgkina i Andrew Huxleya podany w 1952 roku. Model ten, stanowiący również bazę dla analizy przeprowadzonej w niniejszej pracy, przyjmuje już więcej założeń zwią- zanych ze strukturą błony komórkowej. Podkreśla się tu fakt, że błona komór- kowa zbudowana jest z kanałów, na które składają się bramki regulujące procesy przepływu jonów pomiędzy wnętrzem a zewnętrzem komórki. W modelu tym wprowadzone zostało założenie, że właściwości błony komórkowej mogą być za- modelowane poprzez obwód elektryczny (bliższy opis w rozdziale trzecim). Stąd pojawiły się składowe prądowe wynikające z rodzajów jonów przepływających przez błonę:

C dV

dt = I

_ext

− I

_ion

(1.2)

gdzie I

_ext

jest prądem wymuszającym, natomiast I

_ion

powiązany jest z ruchem poszczególnych jonów przez błonę.

Powyżej przedstawione modele mają jedynie reprezentować sposób podejścia do komórki nerwowej. Mianowicie zakłada się tutaj, że komórka nerwowa jest strukturą punktową, to znaczy w każdym punkcie błony komórkowej potencjał jest identyczny. To znacznie ułatwia analizę matematyczną oraz implementację tych modeli. Podejście takie powoduje jednak utratę informacji o pewnych właści- wościach komórki nerwowej. Chcąc dążyć do jak najwierniejszego odwzorowania układu nerwowego należy przyjąć to rozumowanie za nieścisłe, gdyż komórka nie jest strukturą punktową. Stąd powstało wiele takich modeli, które zakładają że potencjał w różnych punktach błony komórkowej jest różny. Już Hodgkin i Huxley w artykule z roku 1952 [32] zaproponowali rozszerzenie swojego modelu w taki sposób aby opisywał „drzewiastą” strukturę neuronu (dla łatwiejszego rozróżnienia tych modeli w pracy stosowane będzie określenie neuronu czy też komórki nerwowej w odniesieniu do modeli reprezentujacych strukturę punktową oraz określenie sieci neuronowej dla komórki nerwowej o strukturze „drzewia- stej”). Również później wyprowadzony został model linii długiej („cable theory”

- rok 1959) [7] oraz jego zdyskretyzowany odpowiednik - model przedziałowy („compartmental model” - rok 1964) [7].

W modelach opisujących potencjał na błonie komórkowej z reguły stosuje się uproszczenia umożliwiające dużo mniej skomplikowany zapis równań różniczko- wych danego modelu. Do tych uproszczeń należy m.in. metoda wyznaczania liczby kanałów będących w stanie przepuszczania przy utrzymaniu stałego napię- cia wewnątrz i na zewnątrz komórki nerwowej (ang. voltage clamp) [26]. W ta- kim przypadku konieczne jest utrzymanie stałego poziomu napięcia w punkcie pomiaru, a co za tym idzie, założenie, że na całej błonie komórkowej potencjał rozkłada się równomiernie. Wykorzystanie modelu opartego o schematy Markowa umożliwia przywrócenie niektórych utraconych własności komórki nerwowej [9], wynikających np. z podejścia, w którym komórkę nerwową traktuje się jako strukturę punktową.

W związku z powyższym oprócz krótkiego przedstawienia modelu Hodgkina - Huxleya, w rozdziale trzecim pokazane zostały również niektóre z rozszerzeń tego modelu. Pokazany tu został przede wszystkim model kinetyczny w dwóch wersjach - deterministycznej oraz stochastycznej.

6

(11)

Rozważanie modeli biologicznych komórek neuronowych czy całych sieci tych komórek nie miałoby większego sensu bez prezentacji ich praktycznych zasto- sowań. Dlatego też w pracy skupiono się nie tylko na opisie matematycznym nowych modeli ale także na wybranych zastosowaniach tych modeli. Najważ- niejszą część stanowi wykorzystanie tego typu modeli w automatyce i robotyce, a w szczególności do sterowania obiektami automatyki.

1.2 Motywacja i cel pracy

Pierwszym celem niniejszej pracy było utworzenie rozszerzeń modeli przed- stawionych powyżej, aby można było możliwie wiernie odwzorowywać procesy zachodzące w układzie nerwowym. Zaproponowany został rozszerzony model ki- netyczny komórki nerwowej o strukturze punktowej oraz model kinetyczny sieci neuronowej o budowie „drzewiastej”.

Poza wprowadzeniem nowych modeli, celem pracy było opracowanie metody uczenia sieci neuronowej w opisywanych modelach - w stochastycznym modelu kinetycznym neuronu oraz w stochastycznym modelu kinetycznym sieci neurono- wej.

Najistotniejszą rzeczą są jednak proponowane możliwe zastosowania tych mo- deli, zwłaszcza w zagadnieniach automatyki i robotyki. Dlatego też jeden rozdział pracy poświęcony został wybranym zastosowaniom nauczonej komórki nerwowej, które podkreślają ich zalety i niejednokrotnie przewagę nad konwencjonalnymi sztucznymi sieciami neuronowymi.

Zadania postawione w pracy nie tylko mają prowadzić do lepszego zrozumie- nia czy przedstawienia nieprzewidywalnej natury komórki nerwowej, ale również do późniejszych jej zastosowań praktycznych, w odniesieniu do zastosowań kla- sycznych sztucznych sieci neuronowych. Biologiczne sieci komórkowe mają duże możliwości asocjacyjne [45], które dają im ogromną przewagę nad konwencjo- nalnymi sztucznymi sieciami neuronowymi. Dodatkowo przygotowanie modeli pod implementację z wykorzystaniem kart graficznych daje ogromne możliwo- ści obliczeniowe. Przeprowadzenie wielu obliczeń w trybie równoległym pozwala na szybką symulację sieci neuronowych zbudowanych z dużej liczby neuronów, niezbędnej do realizacji dużych, skomplikowanych zadań.

Modele biologiczne nie mają zastępować sztucznych sieci neuronowych, które już w pewnym stopniu modelują sieć biologiczną. Można to natomiast interpre- tować jako próbę dołączenia tych modeli do zasobu opracowanych już do tej pory modeli sztucznych, jako narzędzie, które jest w stanie rozwiązywać zagadnienia obliczeniowe (często z lepszym skutkiem). Wśród tych zagadnień można wyróż- nić takie problemy jak: przetwarzanie sygnałów, aproksymacja i prognozowanie danych wyjściowych na podstawie danych wejściowych bez konieczności definio- wania związku pomiędzy nimi, czy też problemy automatyki i robotyki dotyczące sterowania obiektami.

Dodatkowo wprowadzenie procesu nauki do omawianych modeli pozwala na

nakierowanie tych sieci na rozwiązywanie problemów, podobnych do problemów

rozwiązywanych przez sztuczne sieci neuronowe. Wykorzystano tutaj jedną z bar-

dziej popularnych metod nauki wykorzystywaną również w klasycznych sztucz-

nych sieciach neuronowych, mianowicie metodę gradientu prostego (ang. descent

(12)

1.3 Teza i układ pracy

gradient ). Wprowadzenie metod nauki do biologicznych modeli komórek neuro- nowych zapowiada ich dalszy rozwój.

W pracy skupiono się na modelach stochastycznych z wielu powodów. Przede wszystkim modele te w lepszy sposób odwzorowują nieprzewidywalną naturę ko- mórki nerwowej. Z drugiej strony jest to korzystniejsze z punktu widzenia imple- mentacji zarówno w środowisku obliczeniowym MATLAB jak i z wykorzystaniem kart graficznych. Możliwość zastąpienia dużych układów równań różniczkowych wyznaczaniem wartości z rozkładu normalnego daje dużą przewagę nad modelami deterministycznymi, ze względu na duże uproszczenia obliczeniowe.

Podsumowując powyższe założenia, można następująco przedstawić podsta- wowe cele postawione w tej pracy:

• Sformułowanie i opis rozszerzonych modeli komórki neuronowej, jako struk- tury punktowej. Celem tego zadania jest możliwe wierne odwzorowanie procesów zachodzących na błonie komórkowej neuronu.

• Sformułowanie i opis modeli neuronów opartych na strukturze „drzewiastej”

(sieci neuronowych) z wykorzystaniem formalizmu schematów kinetycznych Markowa.

• Opracowanie metody nauki (metoda gradientu prostego) w modelach sto- chastycznych komórki nerwowej oraz sieci neuronowej.

• Przedstawienie możliwości wykorzystania modeli w automatyce - wykorzy- stanie nowych modeli, które przechodząc proces nauki mają rozwiązywać klasyczne problemy automatyki i robotyki, takie jak sterowanie obiektami.

• Wykorzystanie modeli komórki nerwowej podobnie jak klasycznych sztucz- nych sieci neuronowych. Duże możliwości asocjacyjne biologicznych sieci neuronowych dają im przewagę nad konwencjonalnymi sztucznymi sieciami neuronowymi. Pokazanie możliwości modelu pojedynczego neuronu na przy- kładzie aproksymacji funkcji prostokątnej.

• Wykorzystanie modelu komórki nerwowej jako element końcowy w proce- sie sterowania quadrocopterem - w systemie zbudowanym z rekurencyjnej sztucznej sieci neuronowej Elmana oraz nauczonej komórki według stocha- stycznego modelu kinetycznego do obliczania AHRS (ang. Attitude Heading Reference System), czyli wyznaczania położenia obiektu w przestrzeni na podstawie odczytów z czujników.

1.3 Teza i układ pracy

Zanim przedstawione zostaną główne tezy pracy warto krótko podsumować założenia przyjęte podczas opracowywania modeli później wykorzystywanych w praktyce:

• Komórka nerwowa, jako podstawowa jednostka układu nerwowego, nie jest jednostką deterministyczną, a ma bardziej złożoną i stochastyczną naturę.

• Komórka nerwowa nie jest strukturą punktową, a ma budowę „drzewiastą”.

8

(13)

• Modele biologicznych komórek nerwowych oraz sieci tych komórek można wykorzystywać podobnie jak konwencjonalne sztuczne sieci neuronowe.

• W związku z powyższym, poprzez wprowadzenie nauki do tych modeli, możliwe jest ich wykorzystanie w zagadnieniach automatyki i robotyki.

W związku z powyższym można następująco sformułować tezy pracy:

1. Możliwe jest efektywne sterowanie w czasie rzeczywistym obiektami auto- matyki i robotyki z wykorzystaniem sztucznej inteligencji, bazującej na im- pulsowym modelu neuronu wynikającym z odpowiednio zmodyfikowanego opisu neuronu Hodgkina-Huxleya.

2. Z uwagi na dużą złożoność obliczeniową istniejących modeli biologicznych komórek neuronowych, które nadają się do tego celu, możliwe jest zbudowa- nie takich modeli, w których wierność procesów odtwarzania będzie większa od dotychczasowych przy jednoczesnym obniżeniu nakładów niezbędnych do obliczeń.

3. Wykorzystanie w zagadnieniach aproksymacji - można skonstruować ma- tematyczny model neuronu biologicznego, który zdolny jest aproksymować wybraną funkcję nieliniową jednej zmiennej z dowolną dokładnością apro- ksymacji.

Pracę można podzielić na trzy główne części wynikające z implementacji po- jedynczej komórki, całych sieci neuronowych oraz z wykorzystania nauczonych komórek nerwowych w zagadnieniach obliczeniowych. Pierwsza część obejmuje rozdział trzeci i czwarty, podczas gdy drugą część stanowią rozdziały piąty i szó- sty. Na trzecią część pracy składa się rozdział siódmy. Dodatkowo w rozdziale drugim przywołane zostały przykłady zastosowań impulsowych sieci neuronowych (ang. Spiking Neural Networks) w różnych zagadnieniach automatyki i robotyki.

W rozdziale trzecim przedstawiony został opis istniejących modeli pojedyn- czej komórki nerwowej. Został tu opisany model Hodgkina - Huxleya oraz wy- korzystywane w pracy jego rozszerzenia. Do tych rozszerzeń należy model z za- kłóceniami wprowadzonymi do niektórych równań modelu oraz model kinetyczny oparty o kinetyczne schematy Markowa w dwóch wersjach - deterministycznej oraz stochastycznej. Ponadto w rozdziale tym pokazany został nowy rozszerzony model kinetyczny komórki nerwowej wraz z wynikami jego symulacji. Głównym tematem rozdziału czwartego jest nauka pojedynczej komórki nerwowej zgod- nie z metodą gradientu prostego. W rozdziale tym przedmiotem badań jest za- równo komórka nerwowa według modelu Hodgkina-Huxleya jak i według stocha- stycznego modelu kinetycznego, który dzięki swojej postaci znacznie upraszcza proces nauki.

W drugiej części pracy skupiono się na modelach całych sieci neuronowych.

W rozdziale piątym pokazany został model Hodgkina - Huxleya sieci neuronowej o strukturze drzewiastej oraz jego rozszerzenie o schematy kinetyczne Markowa.

W drugim rozdziale tej części (rozdział szósty) przedstawiony został algorytm na-

uki biologicznych sieci neuronowych z wykorzystaniem metod gradientu prostego

oraz mnożników Lagrange’a.

(14)

1.3 Teza i układ pracy

Trzecia część, obejmująca rozdział siódmy, skupia się na niektórych zasto- sowaniach biologicznej komórki nerwowej. Na początku pokazany został sposób przygotowania modelu całej sieci neuronowej pod implementację równoległą z wy- korzystaniem kart graficznych, szczególnie istotną ze względu na to, że jest to model, który w swojej pierwotnej postaci jest kosztowny obliczeniowo. Ponadto pokazane zostały wybrane przykłady zastosowania modelu komórki nerwowej.

Jednym z elementarnych zastosowań, również w przypadku sztucznych sieci neu- ronowych, okazała się aproksymacja funkcji, a w szczególności funkcji prostokąt- nej. Ten z pozoru prosty przykład pokazuje jak duże znaczenie może mieć model biologicznej komórki nerwowej. Podczas gdy w przypadku sztucznych sieci neu- ronowych niezbędna jest struktura zbudowana z dwóch warstw ukrytych (zgodnie z teorią Kołmogorowa [47, 48]), w przypadku modelu neuronu wystarcza jedna komórka aby z dowolną dokładnością przeprowadzić aproksymację funkcji nieli- niowej. Drugim, być może istotniejszym z punktu widzenia automatyki i robotyki, zastosowaniem było wykorzystanie biologicznego neuronu jako element dostraja- jący (poprawiający dokładność) sztuczną sieć neuronową Elmana w zagadnieniu wyznaczania kątów Eulera w systemie AHRS sterowania quadrocopterem.

Na koniec pracy przedstawione zostało krótkie podsumowanie oraz możliwości dalszej pracy nad modelami i ich zastosowaniami.

Wszystkie modele implementowane były w środowisku MATLAB. Symula- cje przeprowadzane były na komputerze o parametrach: pamięć RAM 32 GB, procesor 2.80 GHz, karta graficzna NVIDIA Quadro K2000M.

10

(15)

Wykorzystanie biologicznych sieci neuronowych

w rozwiązywaniu problemów automatyki i robotyki

W obecnych czasach rozwój impulsowych sieci neuronowych (SNN, ang. Spi- king Neural Networks) jest bardzo intensywny. Istnieje wiele prac pokazujących aplikacje nawet pojedynczych neuronów. Dobry przykład zaprezentowany został w [12], gdzie pojedyncza żywa komórka szczura została zastosowana do sterowania manipulatorem. Ten pozornie prosty przykład pokazuje jak ogromne możliwości mogą dać modele biologicznych komórek nerwowych, które w przyszłości mogłyby zastąpić żywe komórki. Innym ciekawym przykładem jest praca przedstawiona w [63], gdzie wykorzystano 100 000 neuronów typu „leaky integrate-and-fire”

(LIF) do sterowania robotem grającym w baseball. Model „leaky integrate-and- fire” należy do grupy modeli bardzo uproszczonych, co prowadzi do przypuszcze- nia, że bardziej rozwinięte modele będą w stanie rozwiązywać bardziej skompli- kowane problemy.

Do najbardziej popularnych problemów w automatyce i robotyce rozwiązy- wanych z wykorzystaniem sztucznych sieci neuronowych należą zagadnienia:

- rozpoznawania kształtów przez roboty, - analiza obrazu sceny robota,

- ekstrakcja cech obrazu - np. wyławianie poruszających się obiektów, - sterowanie inteligentne (adaptacyjne),

- znajdowanie optymalnej drogi w środowisku o silnie zmiennych warunkach (robot porusza się w kierunku celu, który zmienia położenie, lub przeszkody zmieniające swoje położenie).

To oczywiście jest bardzo wąski obszar zastosowań sieci neuronowych. Fak-

tycznie nie ma takiego problemu o dużej złożoności i dużej dynamice w automa-

tyce i robotyce gdzie nie próbuje się zastosować układów sztucznej inteligencji,

(16)

Wykorzystanie biologicznych sieci neuronowych w rozwiązywaniu problemów automatyki i robotyki

zwłaszcza sztucznych sieci neuronowych, których pierwowzorem są sieci biolo- giczne. W literaturze istnieje tak wiele przykładów pokazujących implementacje z wykorzystaniem konwencjonalnych jednokierunkowych i rekurencyjnych sztucz- nych sieci neuronowych, że nie sposób niestety przywołać nawet większości z nich.

W pracy [6] pokazany został ciekawy przykład struktury impulsowej sieci neuronowej, która autonomicznie uczy się sterowania ramieniem robota (mani- pulatorem) o czterech stopniach swobody. Wykorzystano tutaj neurony według modelu Izhikevicha [35], które wykazują biologicznie realistyczne zachowanie przy dużej wydajności obliczeniowej. Wytrenowana sieć neuronowa testowana była na kinematycznym modelu ramienia robota humanoidalnego iCub (rys. 2.1).

Rys. 2.1: Robot humanoidalny iCub [6]

Sieć neuronów impulsowych została tutaj zorganizowana następująco [6]:

- dane wejściowe pogrupowane zostały w 7 „warstw” (warstwy traktowane jako grupy neuronów) po 1200 neuronów,

- 4 „warstwy” wyjściowe po 800 neuronów,

- 4 z „warstw” wejściowych odpowiadają za informację daną przez proprio- cepcję (zmysł kinestetyczny - zmysł orientacji ułożenia części własnego ciała), powiązane z trzema kątami ramienia (Roll, Pitch, Yaw ) i z łokciem, - pozostałe 3 „warstwy” reprezentują kierunek przestrzenny, w którym po- winien się poruszyć efektor końcowy (urządzenie umieszczone na końcu ra- mienia robota, które ma oddziaływać z otoczeniem), w następnym kroku czasu,

- wyjścia sieci reprezentują komendy silnika dla każdego złącza robota (prze- gubu).

W pracy [25] również pokazano wykorzystanie impulsowych sieci neurono-

wych (konkretnie model neuronu według Izhikevicha) w sterowaniu robotem hu-

manoidalnym iCub. Wykorzystano tutaj ogólnodostępną bibliotekę C++ iSpike,

12

(17)

która łączy symulator impulsowych sieci neuronowych z robotem. Biblioteka ta wykorzystuje biologicznie inspirowane podejście do konwersji informacji z czujni- ków robota w impulsy, które przekazywane są do symulatora sieci neuronowych, który następnie dekoduje wyjściowe impulsy z sieci na komendy silnika, które wysyłane są aby sterować robotem (rys. 2.2).

Rys. 2.2: Impulsowy interfejs między symulatorem impulsowych sieci neuronowych i robotem [25]

Robot humanoidalny iCub (pokazany na rysunku 2.3 - rzeczywisty i wir- tualny) ma 53 stopnie swobody i wyposażony jest w różnorodne czujniki: cy- frową kamerę, żyroskopy, akcelerometry, mikrofony, czujniki momentu obroto- wego, czujniki siły.

Rys. 2.3: Schemat konwersji danych wizualnych na impulsy [25]

Przykładowa schematyczna reprezentacja przekształcenia danych wizualnych na impulsy pokazana została na rysunku 2.4. Dane wejściowe są normalizowane do przedziału h0, 1i .

Rys. 2.4: Rzeczywisty i wirtualny robot humanoidalny iCub [25]

Regulator PID, stosowany w układach regulacji, składający się z trzech czło-

nów: proporcjonalnego, całkującego i różniczkującego, stanowi prosty (ogólnego

(18)

Wykorzystanie biologicznych sieci neuronowych w rozwiązywaniu problemów automatyki i robotyki

przeznaczenia) sposób czułego sterowania dynamicznymi systemami ze zreduko- wanym przeregulowaniem i oscylacjami. Impulsowe sieci neuronowe w swojej prostocie, oferują wiele zalet dla sterowania układami dynamicznymi, łącznie z umiejętnością adaptacji. W artykule [58] pokazany został impulsowy sterow- nik neuronowy PID zbudowany z małej sieci neuronów bazujących na modelu Izhikevicha, które wykorzystane zostały do aproksymacji równań różniczkowych i całkowych.

W pracy tej wykorzystano 3 neurony według modelu Izhikevicha opisane rów- naniami [35]:

v

⁰

= 0.04v

²

+ 5v + 140 − u + I

u

⁰

= a (bv − u) (2.1)

gdzie v opisuje potencjał na błonie komórkowej, u jest tak zwaną „zmienną od- zysku” (ang. recovery variable), która odpowiedzialna jest za adaptację często- tliwości impulsów (SFR, ang. Spike Frequency Reduction). Parametry a i b reprezentują odpowiednio skalę czasu i wrażliwość „zmiennej odzysku”.

Każdy, tak skonstruowany neuron, ma za zadanie nastroić parametry regula- tora k

_P

, k

_I

, i k

_D

, który opisany jest równaniami:

P

_t

= k

_P

e (t) I

_t

= k

_I

Z

e (t) dt D

_t

= k

_D

de (t)

dt

(2.2)

gdzie e (t) jest uchybem regulacji, zaś sygnał wyjściowy opisany jest jako:

u (t) = P

_t

+ I

_t

+ D

_t

(2.3)

Ogólna struktura regulatora neuronowego PID pokazana została na rysunku 2.5 [58].

Rys. 2.5: Przykładowa struktura regulatora neuronowego PID [58]

Inny przykład projektu regulatora PID przedstawiony został w pracy [36].

Wykonano tutaj kontroler silnika prądu stałego z wykorzystaniem impulsów dla

reprezentacji przetwarzania informacji. Zaprojektowano układ mechanizmów dla

prowadzenia, pomiaru i sterowania silnikiem prądu stałego jedynie za pomocą

impulsów. Struktura mechanizmu przedstawiona została na rysunku 2.6.

(19)

Rys. 2.6: Schemat blokowy i rzeczywisty układ eksperymentalnej platformy [36]

Matryca AER-Robot wykorzystana w tym projekcie ma zaimplementowany regulator PID bazujący na impulsach potencjału. Płyta ta ma możliwość urucho- mienia aż do 4 silników prądu stałego, zawiera ona matrycę FPGA oraz złącze USB 2.0. AER-Robot oryginalnie został zaprojektowany aby sterować antropo- morficznym ramieniem robota w sposób neuro-inspirowany [36].

Jednym z zastosowań impulsowych sieci neuronowych może być również za- gadnienie sterowania serwomechanizmem (zamkniętym układem sterowania ze sprzężeniem zwrotnym). W pracy [46] wykorzystano model sieci SRM (ang. Spike Response Model ), który stanowi generalizację modeli LIF (ang. Leaky Integrate- and-Fire). Impulsowe sieci neuronowe mają tu za zadanie konwersję (zarówno kodowanie jak i dekodowanie) liczb rzeczywistych w impulsy potencjału. Struk- turę wykorzystanej sieci można opisać następująco:

- neurony połączone są w strukturę sieci jednokierunkowej,

- pomiędzy neuronem presynaptycznym i neuronem postsynaptycznym wy- stępuje wiele połączeń synaptycznych,

- każde połączenie synaptyczne scharakteryzowane jest poprzez wagi, które reprezentują siłę połączenia, dodatkowo każda synapsa ma inne opóźnienie, - wejście i wyjście całej sieci zdefiniowane jest jako czas w którym dany neuron

wysłał impuls,

Ogólny stan neuronu postsynaptycznego opisany jest jako następująca funkcja [46]:

x

_j

(t) =

N

X

i=1 K

X

k=1

w

_ij^k

t − t

_i

− d

^k

(2.4)

gdzie N oznacza liczbę neuronów presynaptycznych, K - liczbę synaps. Ogólnie

równanie to można scharakteryzować jako impuls wytworzony przez presynap-

tyczny neuron i w chwili t

_i

, następnie k-ta synapsa przekazuje go do neuronu

postsynaptycznego w czasie t

i

+ d

^k

, gdzie d

^k

to opóźnienie powiązane z k-tą

synapsą. Parametr w

^k_ij

jest wagą między neuronem presynaptycznym i i post-

synaptycznym j dla k-tej synapsy. Funkcja opisuje wpływ potencjału neuronu

presynaptycznego na potencjał neuronu postsynaptycznego.

(20)

Wykorzystanie biologicznych sieci neuronowych w rozwiązywaniu problemów automatyki i robotyki

Tak utworzoną strukturę sieci neuronowej wykorzystano do systemu kontroli prędkości serwomechanizmu zmiennego w czasie i o nieliniowych warunkach ob- ciążenia [46]. Eksperymentalny układ składał się z dwóch silników prądu stałego połączonych sprzęgłem mechanicznym. Pierwszy z nich odpowiadał za kontrolę prędkości obrotu, drugi miał pracować jako generator za pomocą którego miały być tworzone warunki nieliniowe.

Struktura systemu sterowania opartego na impulsowych sieciach neurono- wych pokazana została na rysunku 2.7 [46]. Funkcja g (k) reprezentuje sygnał wejściowy, e (k) - uchyb, blok D - różnicę w błędzie i e

⁰

(k) zmianę uchybu wzglę- dem tej różnicy. W strukturze sieci neuronowej wykorzystano 3 neurony, 2 z nich reprezentują sygnały e (k) i e

⁰

(k) , trzeci z nich to bias powiązany z impulsem zadanym w początkowej chwili czasu.

Rys. 2.7: Schemat systemu sterowania w oparciu o impulsowe sieci neuronowe [46]

Ciekawym przykładem jest zagadnienie tworzenia map obszaru uwagi (ang.

visual attention map) pokazane w pracy [62]. System wykorzystuje impulsowe sieci neuronowe inspirowane siatkówką oka [60, 61]. System zbudowany jest z trzech warstw [62] (rys. 2.8):

- poziom ekstrakcji (ang. extraction level ) - sieci neuronowe wykorzystywane do detekcji linii [60] czy segmentacji koloru [61],

- poziom dekompozycji (ang. decomposition level ) - tutaj wyróżniane są kom-

ponenty niskiego poziomu (linie poziome, linie pionowe, narożniki, itp.),

- poziom uwagi (ang. attention level ) - uformowanie mapy.

(21)

Rys. 2.8: Schemat tworzenia mapy obszaru uwagi [62]

Jednym z szeroko opisywanych zagadnień jest problem planowania drogi ro- bota:

1. Zaprezentowany w [33] model zwierzęcia z systemem neuronowym luźno opartym na hipokampie gryzonia, ma za zadanie psychiczną eksplorację dla znalezienia drogi w świecie przestrzennym, którego wcześniej się na- uczył. Rozpoznanie drogi polega na mentalnym podsumowaniu (ang. men- tal exploration) wybranej drogi i jej konwersji w ruch. Wykorzystano tutaj neurony impulsowe z adaptacyjną częstotliwością występowania impulsów.

Przestrzeń po której porusza się obiekt zbudowany jest z komórek miej- sca hipokampa (ang. place cells), które, rozmieszczone losowo, reagują se- lektywnie na przestrzenną lokalizację. Wykorzystano tu 2016 neuronów z około 4 milionami synaps. Dalsza praca nad mentalną eksploracją prze- prowadzona została w pracy [51], gdzie wprowadza się założenie, że mózg niezwłocznie rozwiązuje problem planowania drogi przez równoległe umy- słowe przeszukiwanie.

2. Klasyczny problem planowania drogi robota (uwzględniający przeszkody) pokazany został w pracy [64]. Do symulacji wykorzystano tutaj sieci typu LSM (ang. Liquid State Machine), które mają strukturę jak klasyczne sieci neuronowe, które składają się z dużej liczby jednostek (neuronów).

Wykorzystano tutaj impulsowe modele neuronu.

3. W pracy [54] wykorzystano samoorganizujące się impulsowe sieci neuro-

nowe w reprezentacji środowiska robota mobilnego i w problemie plano-

wania drogi. Sieć neuronowa (rys. 2.9) zbudowana jest z dwóch warstw

neuronów typu SRM (ang. Spike Response Model ), który stanowi genera-

lizację modelu LIF (ang. Leaky Integrate-and-Fire). W pierwszej warstwie

występują połączenia tylko w jednym kierunku, podczas gdy w drugiej -

ze sprzężeniem zwrotnym. W każdym kroku planowania drogi współrzędne

robota wykorzystywane są jako wartości wejściowe sieci dla symulacji i pro-

cesu adaptacji.

(22)

Wykorzystanie biologicznych sieci neuronowych w rozwiązywaniu problemów automatyki i robotyki

Rys. 2.9: Struktura sieci neuronowej w zagadnieniu planowania drogi robota [54]

4. Sztuczną impulsową sieć neuronową (ASNN, ang. Artificial Spiking Neu- ral Network ) wykorzystano w sterowaniu mobilnym robotem wirtualnym o okrągłej strukturze i dwóch kołach, aby mógł się poruszać w świecie prze- strzennym [15]. Robot ma wbudowany sensor wibracji w punkcie central- nym, czujnik światła z przodu oraz 4 sensory dotykowe, każdy obejmujący zakres 90

^o

, aby móc skupić się na stymulacji dotykowej, wibracyjnej i świetl- nej. Wykorzystana sieć neuronowa zbudowana jest z sześciu transkonduk- torów (po jednym na każdy czujnik), jednego neuronu oscylacyjnego oraz dwóch neuronów ruchowych (motoneuronów) wykorzystanych do ruchu każ- dym kołem (jeden neuron jest pobudzający - dla ruchu do przodu, a drugi - hamujący - dla ruchu do tyłu). Ciekawym aspektem tej pracy jest wy- korzystanie metody uczenia zwanej habituacją, która należy do grupy nie- asocjacyjnych metod uczenia i polega na stopniowym zanikaniu reakcji na bodziec, który nie niesie ze sobą żadnej informacji. Zaimplementowaną sieć neuronową wykorzystano do symulacji na robocie Lego Mindstorm NXT (rys. 2.10).

Rys. 2.10: Przykładowe reaizacje robota Lego Mindstorm NXT

¹

Sieć neuronów według modelu Hodgkina-Huxleya zaimplementowana została jako model magazynu pamięci i wykorzystana dalej do odzyskiwania sekwencji

1

http://mindstorms.lego.com

(23)

zdarzeń w pracy [5]. Połączono tutaj dwie metody rozpoznawania sekwencji zdarzeń (obrazów):

1. metoda łańcuchowa (ang. chain method ) - zdarzenia są połączone w kolej- ności zadanej przez sekwencję,

2. metoda etykietowania (ang. labelling method ) - kolejność zdarzeń jest okre- ślona przez uporządkowane etykiety (ang. tags), które są powiązane ze zdarzeniami.

Wykorzystana sieć neuronowa zbudowana jest z dwóch interaktywnych warstw neuronów. Dolna warstwa reprezentuje następujące po sobie zdarzenia w formie aktywnych modułów, które są skomponowane z neuronów pobudzających i ha- mujących, gdzie występują połączenia każdego neuronu z każdym. Połączenia między dolną i górną warstwą reprezentują etykiety, które powiązane są z róż- nymi sekwencjami.

Metoda łańcuchowa realizowana jest przez warstwę dolną, gdzie reprezen- towana jest uporządkowana sekwencja zdarzeń dla przechowania i przywołania.

Etykiety są przypisane do neuronów w górnej warstwie aby skojarzyć każdy neu- ron w tej warstwie z określoną sekwencją zakodowaną w dolnej warstwie.

Tak utworzony system jest w stanie rzetelnie zapamiętać i odtworzyć kilka sekwencji uporządkowanych zdarzeń. Dodatkowo radzi sobie z kilkoma sekwen- cjami, również w sytuacji gdy zdarzenia się nakładają.

Inny przykład impulsowej sieci neuronowej, zaimplementowanej w matrycy FPGA (ang. Field Programmable Gate Array), do realizacji różnych zadań prze- twarzania sygnałów zaprezentowany został w pracy [10]. Zadaniem sieci oscyla- cyjnych neuronów według modelu „leaky integrate-and-fire” (LIF) było przepro- wadzenie dopasowania do wzorca, czyli sprawdzenie czy zadany wzorzec wystę- puje w sekwencji kilku wzorców. Sieć zbudowana jest z 648 neuronów i 419 904 synaps. Wykorzystano tutaj algorytm ODLM (ang. Oscillatory Dynamic Link Matcher ), który jest w stanie osiągnąć segmentację obrazu, dopasowania obrazu [50] i monofoniczne oddzielenie źródła dźwięku [49].

Przykładów na zastosowanie impulsowych sieci neuronowych jest w literatu-

rze przedmiotu znacznie więcej. W niniejszym rozdziale zostały zaprezentowane

jedynie selektywne implementacje, które wybrane zostały jako najbardziej inspi-

rujące. Impulsowe sieci neuronowe są narzędziem coraz popularniejszym, nie tylko

w świecie publikacji naukowych, ale także w przestrzeni rzeczywistych zastosowań

praktycznych.

(24)

Rozdział 3

Deterministyczne i stochastyczne modele komórki neuronowej

Jako wprowadzenie do teorii dotyczącej wyprowadzonych modeli neuronu w niniejszym rozdziale pokazany zostanie przegląd modeli, które stanowiły za- równo bazę jak i inspirację do pracy nad dalszymi ich rozwinięciami. W rozdziale tym przedstawiono pięć modeli, z których ostatni stanowi pomysł na rozszerzenie tych już istniejących. Spośród modeli znanych opisane zostały:

• klasyczny model Hodgkina-Huxleya, stanowiący bazę dla wszystkich modeli prezentowanych nie tylko w tym rozdziale ale również w dalszej części pracy,

• stochastyczne rozszerzenie modelu Hodgkina-Huxleya utworzone poprzez wprowadzanie zaburzeń do równań modelu,

• deterministyczna wersja modelu kinetycznego bazująca na schematach ki- netycznych Markowa,

• stochastyczna wersja modelu kinetycznego.

Jako efekt pracy nad powyższymi modelami powstał pomysł utworzenia modelu kinetycznego z rozszerzonymi schematami kinetycznymi, który przedstawiony zo- stał na końcu tego rozdziału.

Na początku jednak przedstawiona została teoria dotycząca potencjału czyn- nościowego na błonie komórkowej.

3.1 Wprowadzenie

Model stworzony przez Hodgkina-Huxleya bazuje na założeniu, że elektryczne

właściwości błony komórkowej mogą być zamodelowane przez równoważny obwód

elektryczny, pokazany na rysunku 3.1 [7, 26, 32, 39].

(25)

Rys. 3.1: Obwód elektryczny modelujący elektryczne właściwości błony komórkowej [7, 26, 32, 39]

Prąd przepływający przez błonę komórkową złożony jest z dwóch głównych składników, a mianowicie prądu jonowego I

ion

oraz prądu I

ext

podawanego z zew- nątrz - jako zewnętrzne źródło prądowe. Pierwszy z nich, I

_ion

, powiązany jest z ruchem poszczególnych typów jonów przez membranę. Wyróżniamy tutaj trzy rodzaje jonów: jony potasu, jony sodu oraz jony „małego przepływu”, zazwyczaj są to jony chloru. Drugi z tych prądów, I

_ext

, powiązany jest z załączaniem i wy- łączaniem kondensatora C. Stąd główne równanie opisujące obwód elektryczny przedstawiony na rysunku 3.1 ma postać

C dV

dt + I

_ion

= I

_ext

(3.1)

Ponieważ z każdym elementem jonowym związana jest pewna konduktancja g

_i

oraz potencjał V

_i

, dla i ∈ {N a, K, L} , stąd można zapisać równanie dla prądu jonowego w postaci:

I

_ion

= X

i

I

_i

= X

i

g

_i

(V − V

_i

) (3.2)

3.2 Potencjał czynnościowy

Na błonie komórkowej neuronu wytwarza się różnica potencjałów między wnę-

trzem i zewnętrzem komórki - polaryzacja. Różnica ta może być wynikiem nie-

równomiernego rozkładu jonów. Na zewnątrz komórki znajdują się jony dodatnie,

podczas gdy we wnętrzu znajdują się jony ujemne. Depolaryzacja oznacza zredu-

kowanie potencjału na błonie komórkowej. Zmiana potencjału może być efektem

napływu jonów sodu lub potasu do wnętrza komórki. Innym zjawiskiem jest

hyperpolaryzacja, która ma miejsce za każdym razem gdy potencjał na błonie

komórkowej wzrasta.

(26)

3.3 Podstawowy model Hodgkina-Huxleya

Rys. 3.2: Przykładowy przebieg potencjału na błonie komórkowej z uwzględnieniem potencjału czynnościowego

Na rysunku 3.2 przedstawiony został przykładowy przebieg potencjału na błonie komórkowej ze wskazaniem potencjału czynnościowego, który pojawia się na błonie komórkowej po depolaryzacji. W miarę wzrostu potencjału na błonie komórkowej kanały jonowe sodu są w stanie przepuszczania, stąd jony mogą na- pływać do wnętrza komórki. Po tym napływie kanały jonowe potasu są w stanie przepuszczania i pozwalają na wypływanie jonów na zewnątrz komórki. Kanały jonowe sodu zamykają się, gdy potencjał osiągnie wartość potencjału czynno- ściowego. Wówczas przemieszczanie się jonów potasu na zewnątrz komórki jest powodem hyperpolaryzacji (stan nadmiernej polaryzacji). Następnie następuje repolaryzacja, która przywraca polaryzację błony komórkowej. Po spadku poni- żej potencjału spoczynkowego potencjał na błonie wyrównuje się i znów osiąga wartość spoczynkową.

3.3 Podstawowy model Hodgkina-Huxleya

Podstawowy model Hodgkina-Huxleya składa się z czterech równań. Pierwsze z nich opisuje zmianę potencjału V na błonie komórkowej [7, 32, 37]:

C dV

dt = I − ¯ g

_{N a}

(V − V

_{N a}

) − ¯ g

_K

(V − V

_K

) − g

_L

(V − V

_L

) (3.3) gdzie elementy ¯ g

_{N a}

= g

_{N a}

m

³

h, ¯ g

_K

= g

_K

n

⁴

oraz g

_L

mają wymiar konduktancji jonowych (wyrażają przepuszczalność jonową błony komórkowej [32]), odpowied- nio dla sodu i potasu, natomiast g

N a

oraz g

K

są wartościami stałymi o wymiarze konduktancji mierzonymi na cm

²

. Parametry m, n i h są zmiennymi bezwymia- rowymi przyjmującymi wartości pomiędzy 0 a 1.

W podstawowym modelu zakładamy, że każdy kanał jonowy zbudowany jest

z niewielkiej liczby bramek, które kontrolują przepływ jonów przez ten kanał. Po-

jedyncza bramka może być w jednym z dwóch stanów, a mianowicie w stanie prze-

puszczania lub w stanie nieprzepuszczania (ang. permissive i non-permissive).

(27)

Prawdopodobieństwo, że pojedyncza bramka jest w stanie przepuszczania jest opisane przez dodatkowe zmienne m, n i h. Kombinacja zmiennych m i h kon- troluje bramki sodowe, podczas gdy zmienna n - bramki potasowe. Potencjał zależy od konduktancji jonowej dzięki założeniu, że prawdopodobieństwo tego, że pojedyncza bramka jest w stanie przepuszczania lub nieprzepuszczania zależy od potencjału na błonie komórkowej. Rozważmy bramkę typu i (i = m, n, h), wów- czas p

_i

reprezentować będzie prawdopodobieństwo tego, że bramka i jest w stanie przepuszczania. Zmiany pomiędzy dwoma stanami bramki przedstawia poniższe równanie [7]:

dp

_i

dt = α

_i

(V ) (1 − p

_i

) − β

_i

(V ) p

_i

(3.4) Funkcje α

_i

(V ) oraz β

_i

(V ) są funkcjami sigmoidalnymi, zależnymi od poten- cjału V. Reprezentują one współczynnik przejścia pomiędzy wnętrzem i zewnę- trzem komórki nerwowej [32]. Pierwsza część równania (3.4) (α

_i

(V ) (1 − p

_i

)) opisuje współczynnik przejścia bramki ze stanu nieprzepuszczania do stanu prze- puszczania, podczas gdy druga część (β

i

(V ) p

_i

) opisuje współczynnik przejścia bramki ze stanu przepuszczania do stanu nieprzepuszczania.

Jeżeli potencjał na błonie komórkowej ustali się na pewnej wartości, wówczas bramki w stanie przepuszczania osiągną stan ustalony przy czasie dążącym do nieskończoności

p

_i,t→∞

(V ) = α

_i

(V )

α

i

(V ) + β

i

(V ) (3.5) gdzie czas osiągnięcia tej wartości wynosi [7]:

τ

_i

(V ) = 1

α

i

(V ) + β

i

(V ) (3.6)

Zestawiając równania (3.3) oraz (3.4) dla konkretnych wartości i = m, n i h, otrzymujemy pełny układ równań opisujący podstawowy model Hodgkina- Huxleya:

C dV

dt = I − g

_{N a}

m

³

h (V − V

_{N a}

) − g

_K

n

⁴

(V − V

_K

) − g

_L

(V − V

_L

) dn

dt = α

n

(V ) (1 − n) − β

n

(V ) n dm

dt = α

_m

(V ) (1 − m) − β

_m

(V ) m dh

dt = α

_h

(V ) (1 − h) − β

_h

(V ) h

(3.7)

Na rysunku 3.3 zestawione zostały przykładowe przebiegi potencjału na bło-

nie komórkowej wyznaczone według równań różniczkowych układu (3.7) - zamo-

delowanych w środowisku MATLAB. Przedstawione tu zostały cztery różne prze-

biegi potencjału dla różnych wymuszeń prądowych (I = 0, 30, 40, 80 [nA]). Należy

przede wszystkim zwrócić uwagę na wzrost skoków napięcia wraz ze wzrostem

prądu wymuszającego. Ponadto, również wraz ze wzrostem prądu wmuszają-

cego, częstotliwość występowania impulsów potencjału stabilizuje się i występują

one regularnie, co jest charakterystyczne dla deterministycznych modeli komórki

nerwowej.

(28)

3.3 Podstawowy model Hodgkina-Huxleya

A B

C D

Rys. 3.3: Przebieg potencjału na błonie komórkowej według podstawowego modelu Hodgkina-Huxleya dla czterech różnych wymuszeń prądowych: A.

I = 0 [nA] B. I = 30 [nA] C. I = 40 [nA] D. I = 80 [nA]

3.3.1 Parametry modelu Hodgkina-Huxleya

W tabeli 3.1 zestawione zostały wszystkie wartości potencjałów V

_i

[mV ] i kon- duktacji g

_i

[mS/cm

²

] jonowych wykorzystywane w modelu podstawowym, a także w omówionym dalej modelu zakłóconym i deterministycznej wersji modelu kine- tycznego. Wartości zestawione w tabeli 3.1 przyjęte zostały zgodnie z założe- niem, że potencjał spoczynkowy jest równy zero. Dodatkowo przyjmujemy, że C = 1 [µF/cm

²

] oraz, że potencjał błony komórkowej w chwili t = 0 [ms] wynosi

−67 [mV ] [32].

i V

_i

[mV ] g

_i

[mS/cm

²

]

N a 115 120

K -12 36

L 10.6 0.3

Tab. 3.1: Parametry modelu Hodgkina-Huxleya

W tabeli 3.2 przedstawione zostały postacie funkcji α

i

(V ) oraz β

i

(V ) zależne

od potencjału V, dla i = m, n i h.

(29)

i α

_i

(V ) β

_i

(V )

n 0.01 · (10 − V ) exp

_10−V

10

− 1

0.125 · exp

− V 80

m 0.1 · (25 − V ) exp

_25−V

10

− 1

4 · exp

− V 18

h 0.07 · exp

− V 20

1 exp

_30−V

10

+ 1

Tab. 3.2: Postacie funkcji przejścia α

_i

(V ) i β

_i

(V ) [32]

3.4 Zakłócenia w modelu Hodgkina-Huxleya

Jednym ze sposobów stworzenia modelu stochastycznego jest wprowadzenie do równań jonowych pewnego zakłócenia postaci σdW [11, 24, 53]:

dp

_i

= (α

_i

(V ) (1 − p

_i

) − β

_i

(V ) p

_i

) dt + σdW (3.8) gdzie i = m, n i h.

Dodanie tego zakłócenia powoduje stochastyczne zachowanie kanałów jono- wych, które aktywowane są poprzez zmiany potencjału, mających miejsce w po- bliżu tych kanałów. Parametr σ jest wartością stałą (σ = 0.1), która pozwala kontrolować wielkość zakłóceń, natomiast dW oznacza przyrost procesu Wienera, który może być zaimplementowany za pomocą rozkładu normalnego [31]. Rów- nanie (3.3) opisujące dynamikę potencjału na błonie komórkowej pozostaje bez zmian. Zatem, zestawiając ponownie równania różniczkowe modelu otrzymujemy następujący układ równań różniczkowych:

C dV

dt = I − g

_{N a}

m

³

h (V − V

_{N a}

) − g

_K

n

⁴

(V − V

_K

) − g

_L

(V − V

_L

) dn = (α

_n

(V ) (1 − n) − β

_n

(V ) n) dt + σdW

dm = (α

_m

(V ) (1 − m) − β

_m

(V ) m) dt + σdW dh = (α

_h

(V ) (1 − h) − β

_h

(V ) h) dt + σdW

(3.9)

Na rysunku 3.4 zestawione zostały przykładowe przebiegi potencjału na bło-

nie komórkowej według modelu opisanego układem (3.9), zaimplementowane

w środowisku MATLAB.

(30)

3.4 Zakłócenia w modelu Hodgkina-Huxleya

A B

C D

Rys. 3.4: Przebieg potencjału na błonie komórkowej według stochastycznego modelu Hodgkina-Huxleya dla czterech różnych wymuszeń prądowych: A.

I = 0 [nA] B. I = 30 [nA] C. I = 40 [nA] D. I = 80 [nA]

W odniesieniu do charakterystycznych fragmentów wykresu potencjału czyn-

nościowego przedstawionych na rysunku 3.2 na rysunku 3.5 przedstawiona została

interpretacja przebiegów modelu stochastycznego. Pokazane zostały trzy charak-

terystyczne punkty czasowe: punkt wykresu po depolaryzacji (ADP - ang. After-

DePolarization) oraz dwa punkty wykresu po hyperpolaryzacji - szybki i wolny

(sAHP/fAHP - ang. slow/fast AfterHyperPolarization).

(31)

Rys. 3.5: Interpretacja przebiegów potencjału w modelu stochastycznym [53]

3.5 Kinetyczny model Hodgkina-Huxleya

3.5.1 Kinetyczny schemat Markowa

Kolejne rozszerzenie podstawowego modelu Hodgkina-Huxleya oparto o sche- maty kinetyczne Markowa o ogólnej postaci [17]:

x

₀

_{_}

^nαⁿ

βn

x

₁^(n−1)α

_{_}

ⁿ

2βn

x

₂^(n−2)α

_{_}

ⁿ

(n−1)βn

. . . _{_}

^αⁿ

nβn

x

_n

(3.10)

Według pracy [17] schematy kinetyczne Markowa zapewniają bardziej ogólną strukturę modelowania kanałów jonowych niż model Hodgkina-Huxleya. Bazują one na diagramach stanów, w których prawdopodobieństwa przejść są niezależne od czasu. Maszyna stanów ma podobne znaczenie jak diagramy reakcji w ki- netyce chemicznej - stany reprezentują sekwencję proteinowych struktur które podkreślają „bramkowość” kanałów.

Za ich pomocą można opisać prawdopodobieństwo P (x

_i

, t) znajdowania się w chwili t w stanie x

_i

oraz prawdopodobieństwo P (x

_i

→ x

_j

) przejścia ze stanu x

_i

do stanu x

_j

. Wówczas możemy zapisać:

dP (x

_i

, t)

dt =

n

X

j=1

P (x

_j

, t) P (x

_j

→ x

_i

) −

n

X

j=1

P (x

_i

, t) P (x

_i

→ x

_j

) (3.11)

Powyższe równanie można zinterpretować następująco: postęp czasu zależy

jedynie od aktualnego stanu systemu i jest definiowany w całości dzięki wie-

dzy o prawdopodobieństwach przejść. Pierwsza suma występująca w powyższym

równaniu reprezentuje wszystkie przejścia wchodzące w stan x

_i

(wkład source -

źródło) podczas gdy druga suma - wszystkie przejścia wychodzące z tego stanu

(wkład sink - wypływ).

(32)

3.5 Kinetyczny model Hodgkina-Huxleya

W przypadku gdy mamy do czynienia z dużą liczbą identycznych kanałów, różnych „cząsteczek”, można przeinterpretować równanie (3.11). Prawdopodo- bieństwo znajdowania się w stanie x

_i

będzie odpowiadało liczbie kanałów znaj- dujących się w tym stanie - co oznaczono po prostu przez [x

_i

] . Prawdopodo- bieństwo przejścia będzie natomiast traktowane jako funkcja przejścia oznaczana tutaj przez r

_ij

.

Stosując się do oznaczeń pokazanych na schemacie:

x

_i

_{_}

^r^ij

rji

x

_j

(3.12)

gdzie funkcje r

_ij

i r

_ji

są odpowiednio funkcjami przejścia ze stanu i do stanu j oraz ze stanu j do stanu i, można zapisać:

d [x

_i

] dt =

n

X

j=1

[x

_j

] r

_ji

−

n

X

j=1

[x

_i

] r

_ij

(3.13)

3.5.2 Deterministyczny model kinetyczny

W modelu kinetycznym kanały jonowe traktowane są jako elementy dys- kretne, co ułatwia ich stochastyczny opis. Najlepszym sposobem aby opisać ak- tywność komórek nerwowych jest pokazanie interakcji pomiędzy stochastycznymi elementami dyskretnymi. Zanim przedstawiona zostanie wersja stochastyczna modelu, pokazana zostanie prosta translacja podstawowego modelu Hodgkina- Huxleya (układ równań (3.7)) do wersji kinetycznej [9, 55].

n

₀

_{_}

^4αⁿ

βn

n

₁

_{_}

^3αⁿ

2βn

n

₂

_{_}

^2αⁿ

3βn

n

₃

_{_}

^αⁿ

4βn

n

₄

(3.14)

Kanały jonowe potasu mogą znajdować się w jednym z pięciu stanów, co poka- zane zostało na schemacie (3.14). [n

_i

] oznacza liczbę i stanów przepuszczających, zatem n

₄

(odwzorowujące n

⁴

w podstawowym modelu) oznacza, że potrzebne są 4 przepuszczające bramki, aby przepływ jonów potasu był możliwy, stąd

¯

g

_K

(V, t) = [n

₄

] · ϕ

_K

(3.15)

m

₀

h

₀

βh

?

α_h

3αm

_

βm

m

₁

h

₀

βh

?

α_h

_

2αm

2βm

m

₂

h

₀

βh

?

α_h

αm

_

3βm

m

₃

h

₀

βh

?

α_h

m

₀

h

₁

_{_}

^3α^m

βm

m

₁

h

₁

_{_}

^2α^m

2βm

m

₂

h

₁

_{_}

^α^m

3βm

m

₃

h

₁

(3.16)

Analogicznie kanały jonowe sodu mogą znajdować się w jednym z ośmiu sta- nów (schemat (3.16)) i [m

3

h

0

] oznacza stan otwarty (m

³

h - w modelu podstawo- wym), stąd:

¯

g

_{N a}

(V, t) = [m

₃

h

₀

] · ϕ

_{N a}

(3.17)

Parametry ϕ

_K

oraz ϕ

_{N a}