• Nie Znaleziono Wyników

Model matematyczny procesu rekombinacji chromosomów

N/A
N/A
Protected

Academic year: 2022

Share "Model matematyczny procesu rekombinacji chromosomów"

Copied!
16
0
0

Pełen tekst

(1)

ZESZYTY NAUKOW E POLITECHNIKI ŚLĄSKIEJ Seria: AUTO M A TY KA z. 122

\(m

N r kol. 1388

Joanna PO LA Ń SK A 0 Marek K IM M EL2>

MODEL M ATEM ATYCZNY PROCESU REKOM BINACJI CHROM OSOM ÓW 1’

S treszczenie. W pracy przedstawiono model matem atyczny ewolucji rozkładów alleli dla dwóch genów typu VNTR (Variable N um ber o f Tandem Repeats). W procesie two­

rzenia m odelu uwzględniono w szystkie możliwe zdarzenia, z jednoczesnym występo­

waniem trzech oddziaływań genetycznych: mutacji, dryfu genetycznego i rekombinacji.

Otrzym ane wzory znaleźć m ogą z powodzeniem zastosowanie w analizie statystycznej danych eksperymentalnych.

A MATHEMATICAL MODEL OF RECOMBINATION AND MUTATION PROCESS FOR MIKROSATELLITE LOCI

S u m m a ry . The m athem atical model o f two-linked microsatellite loci evolution is presented. It considers all possible events, and includes three genetic processes: m uta­

tion, genetic drift, and recombination. The obtained equations could be successfully applied to the stochastic analysis o f experimental data.

1. Wstęp

Rekom binacja polega na losowym krzyżowaniu się dw óch ramion chrom osom u a następ­

nie utworzeniu połączenia pomiędzy przeciwległymi ramionami. U w aża się, że w ewolucji proces rekom binacji m a znaczenie dla zw iększania różnorodności w populacjach, a przez to zwiększania ich zdolności dostosowawczych. W ykorzystując możliwości współczesnej bio-

’’ In sty tu t A u to m a ty k i, P o litec h n ik a Ś ląsk a, ul. A k a d em ick a 1 6 ,4 4 -1 0 0 G liw ic e e m ail: jp o la n s k a @ ia . p o lsI.g liw ice .p l

3) D e p artm e n t o f S ta tistic s, R ice U n iv e rsity , P .O .B o x 1892, H o u sto n , T X 7 7 2 5 1 , U SA 3) P raca c z ę ś c io w o fin a n so w an a p rz e z K B N G ra n t n r 8 T 1 1EO1511

(2)

168 J.K. Polańska, M. Kimmel

chemii dokonuje się obserwacji przypadków rekombinacji z wykorzystaniem technik se- kwencjonow ania DNA. Proces ten także wyjaśnia się na poziomie molekularnym.

W genetyce populacyjnej tworzy się modele matematyczne, których celem je st ujęcie iloś­

ciowe (lub choćby jakościow e) tego zjw iska z punktu w idzenia procesów, które zachodzą, gdy patrzymy na dziedziczenie genów w kolejnych generacjach różnych populacji [15]. 0 - prócz wartości poznawczej tego typu modele m ają ważne zastosowanie. Jest nim możliwość tw orzenia tzw. map genów, w których odległości między genami mierzy się częstotliwością przypadków rekombinacji zachodzących między tymi genami przy dziedziczeniu [4] [5] [13]

[7] [1] [14]. Im większa częstotliwość, tym większa je st odległość pom iędzy genami (mierzona w cM - centymorganach zdefiniowanych jako 100 x prawdopodobieństwo zajścia zdarzenia rekombinacji pomiędzy genami). W populacji ludzkiej, przy dziedziczeniu, w jed­

nym procesie mejozy zachodzi średnio ok. 30 przypadków rekombinacji. Biorąc pod uwagę wymiar ludzkiego genotypu (ok. 3.5 x 109 par nukleotydów) intensywność tego procesu na jed n ą parę nukleotydów je st bardzo mala. Dlatego do jego badania znaczenie m ają metody statystyczne oparte na dużych próbach z populacji oraz modele matem atyczne genetyki popu­

lacyjnej [13] [2] [12].

N ależy podkreślić, że z punktu w idzenia m odelowania matem atycznego zjawisko rekom­

binacji w procesie dziedziczenia przez kolejne pokolenia je st bardzo złożone - zawiera szereg nieliniowości i wym aga tworzenia skomplikowanych genealogii.

W artykule niniejszym przedstawiony je st model ewolucji rozkładów alleli dla dwóch ge­

nów typu VNTR (Variable N um ber o f Tandem Repeats) [11]. Zam iast określenia „geny typu VNTR” używać będziemy terminu „lokusy”, który podkreśla neutralność ew olucyjną więk­

szości kodów zawierających powtórzenia m otywów w postaci di-tri- czy kwardrupletów.

Liczba alleli na lokusach tego typu je st zwykle dość duża, różnorodoność może obejmować nawet kilkadziesiąt wariantów. Stąd wynika ich duża użyteczność w badaniach wykorzystują­

cych metody statystyczne. Utworzony model w najbardziej ogólnym przypadku m a postać relacji pom iędzy prawdopodobieństwami przejść dla pewnego łańcucha M arkowa. M ożna mu także nadać postać złożonego równania różniczkowego dla funkcji tworzącej. Model ten jest bardzo skomplikowany z uwagi na uwzględnienie w nim wszystkich m ożliwych zdarzeń, z jednoczesnym występowaniem trzech oddziaływań genetycznych: mutacji, dryftu genetyczne­

go i rekombinacji. Jednak przy wprowadzeniu odpowiednich uproszczeń do tego m odelu uda­

je się wyprowadzić, jako przypadki szczególne, znane wcześniej w literaturze zależności dla uproszczonych opisów ewolucji z mutacją. Wyprowadzamy także równania ewolucji dla mo­

mentów odpowiednich zm iennych losowych. M etoda m omentów została zaproponowana w pracy jako sposób tworzenia miary odległości między lokusami. W yprowadzone wzory mogą być podstaw ą do analizy szeroko dostępnych danych statystycznych, dotyczących rozkładów alleli liczb powtórzeń na lokusach typu VNTR. Poniżej przedstawiamy postulaty dotyczące zmiennych losowych i procesów statystycznych występujących w modelu.

(3)

Model matem atyczny procesu. 169

2. Model populacji

Rozważa się populację ewoluujących w czasie 2N haploidalnych osobników, odpow iada­

jącą ciągłej w czasie wersji modelu M orana [9]. Analizie poddaje się przypadek dwu VNTR lokusów (mikrosatelitów), oznaczanych odpowiednio przez 1 i 2 , o przeliczalnym zbiorze alłeli indeksowanych przez liczby całkowite.

2.1. Proces narodzin i śmierci, losowanie z puli alleli i rekombinacja

• Każdy osobnik w momencie śmierci je st natychmiast zastępowany przez innego osobnika (następuje jego odrodzenie). Szereg kolejnych narodzin i śmierci danego osobnika tworzy jednorodny proces Poissona o intensywności X/2 w zakresie [0,oo), zwany jego linią czasu lub historią osobniczą. Czas życia (czas trwania jednego cyklu od momentu narodzin do śmierci) je st zatem zm nienną losow ą o rozkładzie wykładniczym z param etrem 7J2.

• W każdym mom encie narodzin m ateriał genetyczny odradzającego się osobnika je s t od­

twarzany poprzez proces losowania z puli alleli, przy czym:

- z praw dopodobieństw em 1 - r para lokusów je st losowana ze zw racaniem spomiędzy par lokusów wszystkich osobników, wliczając w to zmarłego osobnika,

- z prawdopodobieństwem r każdy z lokusów je st niezależnie losowany spomiędzy od­

pow iednich lokusów wszystkich oobników (proces rekombinacji).

• Stała r je st nazywana współczynnikiem rekombinacji. Zmienia się on w zakresie od 0 dla bardzo blisko położonych lokusów, do — - dla bardzo odległych. Schematycznie proces

2

rekombinacji przedstawia rys. 1 [8].

C r o s s i n g - o u e r and R e c o m b in a tio n

R y s.l. K o le jn e eta p y p ro c e su rek o m b in a c ji Fig. 1. T h e p h a se s o f re c o m b in a tio n

(4)

170 J.K. Polańska, M. Kimmel

2.2. M u ta c ja

• Linia życia każdego z osobników zawiera mutacje występujące niezależnie na każdym z lokusów. Zdarzenia te definiują niezależne jednorodne procesy Poissona w zakresie [0, co) z intensywnościami odpowiednio V| i V2-

M ożliwe procesy mutacyjne ideowo przedstawia rys.2 [10].

M u t a t i o n s o t C h r o m o s o m e s

a ) D e le tio n _______________________________________________________

G ÎÂfalc.tolEji-ltO— - C Mal'Elf&Hlciol

_________________________ (W K)

t>) D u p lica tio n arvd d e l e t i o n ______________________________

G3a1b|c1d}61f|g) Q a|bJe|f1g)

Q a|b1c|d|e|f|g) " r r i A l B l c l o l e l D l E l F l o )

c ) In v e rsio n

r ^ I i ! 3 M Ë F r ^ — G 3AiB[elo|ciF|.G)

d ) R e c ip r o c a l t r a n s lo c a lio n betu ue e n turo d it f c r e n l c h ro r o o t o r n e t

C 1a|b1c|d1e|f]'o> C H Ü H B

R y s.2 . O b ra z o w e p rz e d sta w ie n ie p ro c e su m utacji F ig .2 . T h e ty p e s o f m u ta tio n p ro c e ss

• W przypadku w ystąpienia mutacji na danym lokusie i (i = 1 ,2 ) następuje zam iana allela o długości X, przez allel o długości X, + U , , gdzie U, je st calkowitoliczbow ą zm ienną loso­

w ą o następującej funkcji tworzącej:

< P i ( s ) = E s V , u = E s “ P r [ £ / i = u ] = E [ s t/' ] j ( 1 )

u = — o o u — — o o

zdefiniowanej dla zmiennej zespolonej s leżącej w ewnątrz koła jednostkow ego na płasz­

czyźnie zespolonej.

Zdarzenia narodzin i śmierci oraz mutacje są procesami wzajemnie niezależnym i dla każ­

dego z oobników. S ą one również niezależne od procesów narodzin i śmierci oraz mutacji pozostałych osobników.

3. M odel matematyczny

Przedstawiony proces stanowi ciągły w czasie łańcuch M arkowa o przestrzeni stanu S, zawierającej wszystkie możliwe pary alleli dla każdego z 2N osobników, tzn. E = (Zx2)x(2N) i momentach zatrzymania zdeterminowanych przez poissonowski proces narodzin i śmierci oraz zdarzenia mutacyjne. Zapisane w sposób jaw ny macierzy tranzycji może być dla takiego

(5)

Model matematyczny procesu. 171

systemu bardzo skomplikowane, dlatego też w pracy proponuje się wykorzystanie równań perspektywnych do opisu dynamiki populacji.

Rozważa się niskończenie mały przedział czasu (t, t + dt) oraz zakłada się, że prawdopo­

dobieństwa zdarzeń zależne od (dt)1 dla i > 1 są pomijalnie małe. Wówczas prawdopodo­

bieństwo śmierci osobnika w przedziale (t, t + dt) wynosi ~ dt, podczas gdy prawdopodo­

bieństwo m utacji na lokusie 1 lub 2 je st równe odpowiednio v( dt i v 2 dt. Zapis

P r [haplotypt = ( n i ,n 2), haplotyp> = (mL, m 2); dla chwili i] (2)

oznacza prawdopodobieństwo wystąpienia haplotypów (m , n2) i (m i, m2) w chwili t dla o- sobników 1 i 2. Symbol 5y oznacza, iż dany składnik równania występuje jedynie dla przy­

padku, gdy i - j (identical by State). Natomiast A,j określa składnik, który pojawia się w przy­

padku, gdy chromosony i oraz j są i b.d (identical by descent).

Proponowane równania m ają następującą postać:

^(ni,n2)(m,,m2)(f + dt) = [l — Xdt — 2(iZi + I/2)(5t]P(ni

»I^(ni-»i.n2)(mi.m2 ) ( 0 +

E

^l>i ^(ni.n2)(^ i-;i.m2 )(0J i 3l

E ^

2,2

+

+

2 N \ bV nj2

»1*1

(6)

172 J.K.. Polańska. M. Kinunel

+ 2^^r 2/V9 ( ^"(,‘>.Kj)tńJ2)(*:iim2) W j ^nimt^l.2 +

\Ji.J1.k\ /

+ 2 d ir27V2 ( ? W )

\iijiM J

+ ^ d t r 2 N i ^ ^ n i 'n j )tm i '"‘2 )(fc,-,;2> ( ^ ) A u +

"^~2^r 2/V2 ( ^ ni,niHmiJ2)(fci>*a)W )

^ " 2 d ^r ^2N2 l ^ ■^>('‘ l .» 2 ) ( j l .’" j ) ( fcl A ' l ) W j ^ n i m i ^ l , 3 +

\jl,k\M 1

^ ~ 2 ^ r 2" v ( ) A - ':1

~ ^ " 2 ^ r 2 N 2 ( ^ ^ ' ‘ ••'2 )(m i . m 2 )(fci . fc2) W J ^ n* 2 '* 2 ^ -.3 "b

^ 2 ^ 2 N 2 ( ^ ^3('>in2Kmi-m2)(*:i'*:2) ( ^ j ^mini ^ 2,3

\'\,klM /

~ ~ 2 ^ r 2 A/ 2 1 ^ ^>(>ii»2)(mi,"*2)(*:l.*2 )(0 J ~

\'l.'2.fcl.*2 /

2 <^ r 2 N 2 1 J

\ h j l J c i . k i 1

,3 +

A ,

"**2

A , + 2

+ - d t rA J

+ - d i rA J

\ ____ł___ 3^ z i

[2 N ) 1 ( 2 N f .

!

____i ___ 3^ i

(2 JV) 2 (27V)'J .

' i _ 1 3 2 N ~ f

(2 /V)2 (27V)2 .

„ 2 W - 1

2 i ^ ■fyn.iłKmt.młKfci.mlCO j +

1 r 2 N - 1 1 ( ^ n /iN\

1 ~ (2N ) 2 ~ (2N ) 2 2 l ■“ £' (ni’n3^ l ’msK"*iM i W

(3) gdzie:

1 - Adt - (2 j/i + 2 i/2) d i określa praw dopodobieństw o, że nie w ystąpi śm ierć żadnego z osobników oraz nie zajdzie m u tacja n a żadnym z lokusów;

(7)

Model matematyczny procesu. 173

• " f r i h '^ JC;it praw dopodobieństw em , że m u ta cja o wym iarze w ystąpi na lokusie 1 osob­

nika 1;

• ulę l d t je st praw dopodobieństw em , że m u ta cja o w ym iarze j i w ystąpi n a lokusie i osob­

nika 2 ;

• ł' 2V32 j est praw dopodobieństw em , że m u tacja o w ym iarze ¿2 w ystąpi n a lokusie 2 osol>

nika 1;

n dt je st praw dopodobieństw em , że m u ta cja o w ym iarze j> w ystąpi n a lokusie 2 osob­

nika 2 ;

• | d t ( l —r ) ^ je st praw dopodobieństw em , że jeden z osobników (1 lub 2 ) um rze, wylosowany haplotyp o dradzającego się osobnika będzie taki sam ja k tego, k tó ry nie um arł (odpowiednio 2 lub 1) oraz nie w ystąpi m utacja;

• j d t ^ r je s t praw dopodobieństw em , że jeden z osobników (1 lub 2 ) um rze, wylosowany haplotyp odradzającego się osobnika będzie taki sam ja k tego, k tó ry nie u m arł (odpowiednio 2 lub 1) oraz w ystąpi m utacja;

• $dt( 1 — r-)(l — 277) je s t praw dopodobieństw em , że jeden z osobników (1 lub 2 ) umrze, wylosowany h aplotyp odradzającego się osobnika będzie różny od tego, k tóry nie um arł (odpowiednio 2 lub 1) oraz nie w ystąpi m utacja.

Zdefiniujmy funkcję tworzącą rozkładu łącznego dla wymiaru alleli na obu lokusach dla obu osobników.

P {.s,u \t) = P [ s u S2, u i , u 2; i) = Y , zL -

nj U2 niy m2

(4)

gdzie [X| (t), X2 (t)] i [Y| (t), Y2(t)] określają odpowiednio haplotypy osobników 1 i 2. Argu­

ment t będzie w dalszych rozważaniach pomijany tam, gdzie nie spowoduje to jakichkolwiek niejednoznaczności. Sprowadzając równanie (3) do równania różniczkowego w dziedzinie czasu, następnie m nożąc obustronnie przez i sumując po m , n2> m i, m 2 o- trzymujemy następującą zależność:

d P { s \,S 2 ,U \U 2 ,t) r , \ Df

--- —--- = - 2 [ V x + L ' 2 ) P { S \ , S 2 ,U u U2,t) +

1 b l(si) + V’i(ui)]P(5l,52iWli«2,i) +

+ ^ 2 [^(-Sż) + <^2(^ 2)] P(SI,S2,U U U2, t) + A .. , „ A

(8)

174 J.K . P o la ń sk a . M . K im m e l

+ P (S l,S -),K i. 1, l,u-2, i)] (5)

Ze względu na skom plikowaną postać powyższego równania oraz zależność jego rozwią­

zania od znajomości rozkładów trójek chromosom ów w analizowanej populacji nie m ożna w świetle dzisiejszej wiedzy literaturowej podać jawnej postaci funkcji tworzącej P (si, S2, ui, ui, t). Jednakże możliwe jest przeanalizowanie przypadków szczególnych, wyjaśniających niektóre z aspektów badanego procesu.

4. Przypadki szczególne

Poprzez odpowiednie podstawienie zmiennych do równania (5) otrzym uje się wyrażenia określające dynam ikę zmian w czasie interesujących wielkości. Istotnym, z punktu widzenia genetyki populacyjnej, zagadnieniem je st analiza dynamiki zmian zarówno rozkładu alleli (a tym samym liczby, powtórzeń sekwencji postawowej) w badanej populacji, ja k i różnic wiel­

kości alleli dla odpowiednich lokusów.

4.1. R ozkłady g raniczne

• P ojedynczy chrom osom , pojedynczy Iokus [Xi]

Podstawienie S2 = Ui = U2 = 1 oraz S| = s umożliwia podanie równania dynam iki funkcji tworzącej rozkładu alleli na pojedynczym chromosomie. Ma ono postać:

• P a ra chrom osom ów , pojedynczy lokus [Xi, Yi]

Funkcja tworząca rozkładu par [X|, Yj] uzyskana może być poprzez podstawienie w rów­

naniu (5) S2 = U2 = 1 oraz Si = s i Ui = u. Wówczas:

1,1,1. i) _ dPj j s. t)

(

6

)

d t

U zyskana tą drogą funkcja tworząca je st następująca:

P i ( M ) = Pi{s, 0 )e - ‘' 4 1-v>i(s)li

(7)

d P { s i, l . u i , l , t ) d t

dP2( s , u , t ) d t

+ ~ 2 y i •^(•SiUi, 1, 1, 1, 0

(9)

Model matematyczny procesu. 175

Znajomość funkcji tworzącej dla pojedynczego lokusa na jednym chromosomie P| (s, u, t) pozw ala na wyliczenie funkcji tworzącej rozkładu par. Podstawiając zależność (7) do rów­

nania (8 ) otrzymujemy:

0 P 2( s . u . t)

d i - 2 v ,

M N - r)

2 N ' 1 Ą ( 6*: U : 0 H"

Rozwiązując powyższe równanie uzyskuje się następującą postać funkcji P2

•Jr. [1 *

P2( s , u : t) = P j(s u ,0 ) e t J J e - *w* +

, f i - « i M + » i W | t

L J e

+ p _x_________ ____________________________

+ l(A'Ul 2 N ’ [1 - y l(aM)] + 2„ , [l - ^

(

10

)

przy czym:

M s ) := ^ + ■ £■(£12 (ii)

oznacza funkcję tw orzącą prawdopodobieństwa zmiennej losowej odpowiadającej syme- tiyzowanej wielkości mutacji na 1 lokusie. Natomiast

N 2

N ' = ] v T 7 « N ( dla 7V » 1) ( 12)

określa tzw. uogólnioną liczebność populacji (pojęcie wprowadzone między innymi przez J. Crow i M. Kimura w [3]).

Para lokusów, pojedynczy chromosom [Xi, Xż]

Funkcję tw orzącą takiego rozkładu uzyskać można w wyniku podstawienia U] = u2 = 1 do równania (5). Po niewielkich przekształceniach otrzymuje się:

ą P ( s 1, s 2, 1 ,1 ,0 = d P „ ( , u * £ = _ ( ^ + u2) P H(su s2,t) +

d t dt

+ (-si) + ^ 2^2 (*'2)] Ph{s 1. *'2. £) _

“ f ( 1 " ^ V + 2^ ) FH(Sl' S2’i) +

4 r ( 1 ~ E 7 + 2^ ) Po(si,a2,t)> ° 3)

gdzie:

PD{si,S2lt ) = P ( s l , l , l , S 2 , i ) (14) jest funkcją tworzącą rozkładu par skrośnych [Xi, Y2],

(10)

! 76 J.K. Polańska. M. Kimmel

Sprzężone do równania (13) równanie dla funkcji tworzącej par skrośnych ma postać:

d P ( . t u 1, l . s 3,i) d P 0 ( s i,s -i,t)

--- j t--- = j t--- = - ( / • / [ + o < ) P 0 ( s l , s - i , t . ) +

+ (ł/t¥,i ( s i) + Pd[s\ ,s>, t) - A / 1 „ 1 1 \ _ .

- 2 l r + Ń ~ 3 r 2 N - r W > ) PD{s" S2' t) +

+K r + ^ ~ 3r277 " r 2^ ) Ph{SuS7' t}

(15)

Rozwiązanie układu równań (13) (15) daje w efekcie funkcje tworzące rozkładu par za­

równo wzdłużnych, jak i skrośnych. M ają one następującą postać:

P o ( s i , S2 ,t) = P D(s l l s2,0 ) e - (/łl+'42) t [ 5 1e - Ar(1- ^ )ie - A(1- r)^ t -B .> l +

L ' J (16)

(17)

)

+ P H (sl , s 2,0)e~(-A' +A-i)t [ ą -

P « (st.«

2,0

= Ą j(« i,ia ,0 )e" Wl+>lł,‘ [B2e"Ar(l"*l»)*e-A(1- r,3if* - £■>] + + P w(.si1s 2,0)e"(/'1+/,l)1 [£ , - B2e - Ar(1- ^ )Ie - A(1- r>^ ‘]

gdzie

_ ~ 27v ~ 7 r ( l ~ 2 /v ) + ^ r (2<vy‘

—Ar(i — — A(l. — r ) ^ (18)

■1T fl 7N + -(1 - 777) “ A(1 -

Al = l/l [1 - ipi(si)] A? = Ul [1 - IP2(S2)]

2 —Ar(l — jjy) — A(1 — r)jjy (19)

(20)

4.2. Zależności funkcyjne

4.2.1. Różnica liczby powtórzeń na poszczególnych lokusach

• Pojedynczy lokus

Zdefinujm y funkcję tworzącą rozkładu różnic pCj - Yj] jako:

I

^ ( $ l i $2» *^2i 0 lii=a,52s=l,ui=J"'l,U2=l|

wówczas:

(

21

)

(11)

Model matematyczny procesu. 177

Równanie to je st dla r = 0 zgodne z modelem uzyskanym przy analiie procesu bez udziału rekombinacji [6 ].

1

v \ [ l — + ■

+

1

W analogiczny sposób defmuje się funkcję;

J ó’2 , U ] , U'/ , ¿) =l,d3 = U.U| a=l.u-j=:u“ 1

+

(23)

(24)

P a ra lokusów

Funkcję tw orzącą rozkładu różnic [Xi - Y |, X 2 - Yj] defmuje się jako:

R(*US2 , t ) = ^ a,6 -2 ,ir, . ^ , . 0 = E E E E /5n , „ ( i K , " m,4 I" m2 =

n j n j rnt m j

(25)

Stosując powyższe podstawienie do równania (5) otrzymuje się:

d R ( s \,s -2,t)

dt = - 2 {i/j [1 - t/'1(s1)] + t'i {1 - V>a(»a)]} 0 +

+

Ar r 1 _ a) _ _Ł.

Vfv y 2/v /?(*>], «a, i) +

A

V

A + 2 r

1 - Z W ~ l

1 •

(2fV)2 (2AQ2 _

1 „ 2 N - \

r r - 3 ( 2 W ) 2 ( 2 P / ) 2

2 N v* ' ' ~ ( 2 f V ) '

/ » K l i * 'i 1 >st *> l t s 2i f) +

^ ( s iIs2,sj'11l ,l ,s .J 1,f) (26)

Rozwiązanie równania (26) wymaga znajomości pewnych granicznych rozkładów trójek chromosom ów i nie może być znalezione w sposób bezpośredni.

4.2.2. Suma liczby powtórzeń na określonym lokusie

Problem poszukiwania rozkładu sum [Xi + Yi] traktować można jako zagadnienie poszu­

kiwania następującej funkcji:

Si{s,t) = P (s, l . s . l . i )

(12)

178 J.K . P o la ń sk a . M . K im m e l

Korzystając z równania (5) oraz podstawienia Si = s, S2 = 1, U| = s, 112 = 1 otrzymujemy:

<9Si ( s ,i) dt

\ _ i _

2 N + r 2 N i S, (s. t) -ł-

_ Ł _ a

2 N r 2N'2 (27)

Dzięki obliczonej wcześniej funkcji Pi (s,t) możliwe je st podanie rozwiązania powyższego równania różniczkowego, które przyjm uje postać:

o - + A ^ . 0) - — ca>

Tak zdefiniowana zm ienna losowa m a istotne znaczenie w procesie szacowania współ­

czynnika rekombinacji r. W ażną cechę tej zmiennej losowej podaje następujące twierdzenie:

Twierdzenie 1

Rozkład graniczny zmiennej standaryzowanej Z |, której funkcja tworząca dana je st wzo-

rem: .«.o r .

2 i( s , t) - s • S \ ( s , t ) ,

gdzie:

oraz dla t - * 00 wariancja

M s ( t ) = |i=o= 2Af,(0) + 2 u lV \ ( l ) t

as a=l

V,(t) ~ VI

jest przy t -> 00 rozkładem normalnym

Z\ (0 -* N{ 0, 4vi [v i(l) + V>i(l)]) = N ( 0 , W ; ( 1 ) )

(29)

(30)

(31)

(32)

Słuszność powyższego twierdzenia pokazuje następujące rozumowanie. Dokonując stan­

daryzacji zmiennej losowej Si = [X| + Y 1] otrzymujemy następującą zależność w dziedzinie funkcji tworzących:

Z i i s . t ) = s 7 7 - 1— { 5 1(s 7 r ,0 ) e - 2,/‘l1-v’. ^ 7 : )l1e - ^ 1 +

)l‘

2 N ’ 1/1 [1 + - 2ę j j ( s ^ ) ] +

P ( s $ 0) ^

2 N '

^ ( 1

+ V l( s * ) -

2

y>!(s^)] +

5^7

(33)

(13)

Model matem atyczny procesu. 179

Dla t -» co równanie (33) przyjmuje postać:

Z i(s ,a o ) ~ s _2l/1v,'i(1) ^ e - ‘'i( i - v l(J7 ‘)|i (34)

Rozwijając funkcję <p1(s'A ) wokół punktu 1 + jO oraz podstawiając s = ¿ “ otrzymujemy:

- i / i [ l - V i(s 7 t)]i = i/ii | s P i ( l ) ^ - 2^ ( 1) ^ - 2^ ( 1) y | =

2 j u 1i p \ ( l ) w \ / t - 2 u 1(fi\{l) - 2i/l<p"l (l)uj2 (35)

Zatem:

lim Z x( s ,t ) = e - ^ d / d D W / d ) ] ^ _ e-&i*?(i)<-* ,

i-co (36)

co kończy dowód.

5. M omenty zmiennych losowych

Z całej grupy możliwych do obliczenia mom entów zdefiniowanych w pracy zmiennych losowych na szczególną uwagę zasługuje m oment faktoralny.

Cov[{Xi - Yl){X1 - Y7)\ = Cm)[XiXj] - Cou[A'1y'2] - Cou(yiX2] + Cou[YiY2] = E{X xX 2} - E[X\]E[X-i[ - E[XxY2] + E[X\\E\Y2\ - - E[ YxX 7) + E[Yl]E{X2] + E p M ] - E W E W

= 2E[XxX 7] - 2E[X{Y7] (37)

W yliczając składnik E[Xi X2] należy wykorzystać znalezioną wcześniej funkcję tworzącą rozkładu par Ph (si, S2, t). Podwójne jej zróżniczkowanie i podstawienie Sj = s2 = 1 daje w rezultacie następującą zależność:

E[XxX 7\ = E[XxY2] + (C*(0) - CD{0)]e-(Cl+C2)1 >

(38)

przy czym

C

h

( 0) =

C D( 0) =

0I P ff( s i , s i l O)

d s i d s i

d2PD(su s7,0)

d s i d s 2

l* i= i 43=1

1*1 = 1

■*2 = 1 (39)

(14)

180 J.K. Polańska. M. Kimmel

oraz Ci = Xr(l - — )

V 2 /V

Cz = A(1 — r ) ——

; 2 ;V (4 0 )

Ostatecznie:

C o v [ X i ~ YuX 2 - Y2\ = 2 [ C « ( 0 ) - C’c ( 0 ) ] e - Ar<1- ^ )ie - A(I- r> ^ t

(41)

W przypadku gdy r = 0 (dla bardzo blisko położonych lokusów), zależność (41) przyjmuje postać:

C ov[X i - y ,, X 2 - y2] = 2 [C„(0) - Co(0)] e " w ‘ . (42)

natomiast dla r = 1

2

C o v [ X i — Yi, X 2 — y2] — 2 [C*(0) — C o(0)] e

(43)

Oznacza to, że dla mocno oddalonych lokusów prędkość zanikania kowariancyjnego wa­

runku początkowego będzie znacznie większa niż dla lokusów ulokowanych w relatywnie niewielkiej odległości. Analogiczne wnioski wysunąć można, analizując zachowanie się współczynnika korelacji wyliczanego z próby. Może on być również m iarą oceny poziomu rekombinacji w populacji, a tym samym pośrednio wzajemnego ulokowania lokusów. Wia­

domo, że:

^Var[Xx)Var{X7\ '

stąd

2 |[C „ ( 0 ) - C D(0 )] e -377‘e " * r<1+^ > £|

= 11'/... i „ ■■ — ... (45)

^ l o e - ^ + ( l - e - & t) J v 20e - ™ t + ( i _

dla r = 0

2 |C w ( 0 ) - C o ( 0 ) |

^ i o + (e^ r r i ) ( ^ ‘ - 0

(46)

zmierza do 0 dla t -> co wolniej niż dla r -> - i .

(15)

Model matematyczny procesu.. 181

6. Podumowanic

W pracy przedstawiono model matematyczny dynamiki populacji, w której w procesie rowoju w ystępują niezależnie trzy procesy: proces narodzin i śmierci, mutacja i rekombinacja.

Uwzględnienie na etapie formułowania zadania wszystkich trzech zjawisk prowadzi wpraw­

dzie do bardzo skomplikowanego modelu, którego jaw ne rozwikłanie nie je st możliwe, nie­

mniej jednak przeanalizowanie pewnych przypadków szczególnych nakłania do wniosków w istotny sposób ułatwiających tworzenie mapy genetycznej populacji. Uzyskane np. drogą u- proszczeń rozkłady graniczne pokryw ają się ze znanymi z wcześniejszych publikacji wyni­

kami, co wskazuje na poprawność przeprowadzonego rozumowania. Autorzy planują w naj­

bliższej przyszłości zweryfikowanie uzyskanych rezultatów teoretycznych badaniami sym ula­

cyjnymi i na rzeczywistych danych dostępnych w specjalistycznych, internetowych bazach danych.

LITERATURA

1. Carter T., Falconer D.: Stocks for detecting linkage in the mouse and the theory o f their design. Journal o f Genetics 1951, 50: 307-323.

2. Chakravarti A., Lasher L.K., Reefer J.E.: A maximum likelihood method for estimating genom e length using genetic linkage data. Genetics 1991, 128: 175-182.

3. Crow J., Kim ura M.: An introduction to population genetics theory. Harper & Row, New York 1970.

4. Goldstein D., Linares A.R., Feldman M., Cavalli-Sforza L.: An evaluation o f genetic di­

stances for use with m icrosatellite loci. Genetics 1995b, 139: 463-471.

5. Haldane J.B.S.: The com bination o f linkage values, and the calculation o f distance betwe­

en the loci o f linked factors” Genetics 1919, 8 : 299-309.

6. Kimmel M., Chakraborty R., Stivers D., Deka R.: Dynamics o f repeat polym orphism un­

der forward-backward mutation model: W ithin- and between- population variability at microsatcllite loci” Genetics 1996.

7. Kosambi D.D.: „The estimation o f map distance from recombination values” Annals o f Eugenics 1944, 12: 172-175.

8. „M eiosis and G enetic Recombination”, Access Excellence WWW site, Genentech Inc.

9. M oran P.A.: W andering distribution and the electrophoretic profile” Theor. Pop. Biol.

1975,8:318-330.

10. „M utation o f Chromosom e During Replication”, Access Excellence W W W site, Genen­

tech Inc.

(16)

182 J.K. Polańska, M. Kimmel

11. N akam ura Y .( Leppert M ., O ’Connell P., W olf R., Holm T., Culver M ., M artin C., Fu- jim oto E., H off M., Kum lin E., W hite R.: Variable num ber o f tandem repeat (VNTR) markers for human gene mapping. Science 1987,235: 1616-1622.

12. Ott J.: Estim ation o f recombination fraction in hum an pedigrees: Efficient com putation of the likelihood for human linkage studies. American Journal o f Human Genetics 1974, 26:

588-597.

13. Ott J.: Analysis o f hum an genetic linkage Johns Hopkins University Press, Baltimore 1991.

14. Rao D.C., M orton N .E., Lindstcn J., Hulten M., Yee S.: A m apping function for man.

Human Heredity 1977, 27: 99-104.

15. Tavare S.: Calibrating the clock: Using stochastic processes to m easure the rate o f evolu­

tion w Lander E.S., W aterman M. (eds.) Calculating the secrets o f Life N ational Academy Press, W ashington 1995, 114-152.

Recenzent: Prof.dr hab. Ryszard Tadeusiewicz

W płynęło do Redakcji 9.12.1997 r.

Abstract

The mathem atical model o f two-linked microsatellite loci evolution is presented. The described population model is a tim e-continuous M arkov chain. It is transform ed into diffe­

rential equations’ system o f probability generating function. The obtained model is very com plicated because o f considering all possible events, and including three genetic processes:

mutation, genetic drift, and recombination. Appropriate specification o f hypotheses leads to the w ell-known formulae. The equations could be successfully applied to the stochastic ana­

lysis o f experim ental data.

Cytaty

Powiązane dokumenty

VII.2 Obroty bryły sztywnej dookoła ustalonej osi... Jan Królikowski Fizyka

Schemat obliczeniowy UD procesu wiercenia wibracyjnego przedstawiono w postaci modelu dwumasowego, poniewaŜ największy wpływ na proces kształtowania otworu przy

W teorii populacji model z czasem ciągłym jest uprawniony, gdy osobniki populacji rozmnażają się w sposób ciągły tak, że osobniki różnych pokoleń współegzystują ze

Corollary 22 is a straightforward consequence of Theorem 21, which can be proved by the application of the similar result for ψα systems on Vilenkin groups [4].. The proof of Theorem

Zaproponowane sformułowanie lokalne przyrostowego uogólnionego problemu kontaktowego dwóch ciał sprężystych oparte na nieprzyrostowych równaniach sprężystości i

Przedstawiony model matematyczny po identyfikacji parametrycznej ściśle określonego obiektu latającego z odkrytym człowiekiem, umożliwia pełną analizę własności

lu. Dwa bezwymiarowe parametry, od których zależy przebieg odgazowania... Model matematyczny procesu odazotowania. Zależność zawartości azotu od czasu

cowania) należy wyznaczyć harmonogram podrzędny (re ge n e r a c j i ).Harmonogram regeneracji winien określać dla każdego walca przedział czaau, w którym walec Jest