Badanie dynamiki konformacyjnej homopeptydów

Poniewa» biaªka nieuporz¡dkowane zmieniaj¡ dynamicznie konformacje z jednej na drug¡, interesuj¡ce jest pytanie jak dªugo pozostaj¡ w jednej konformacji. Jedn¡ z metod odpowiedzi jest próbkowanie

ukªadu co 1 τ i wyznaczanie czasu, a» RMSD (pierwiastek ze ±redniego kwadratowego odchylenia

poªo-»enia atomów Cα, ang. root mean square deviation) liczone wzgl¦dem zadanej konformacji przekroczy 5 Å. Dla Q60 rozkªad tych czasów rozci¡ga si¦ do 65 τ, ma ±redni¡ 24 τ i odchylenie standardowe 10 τ.

Tak zdeniowany typowy czas »ycia konformacji w symulacji peªnoatomowej [34] jest rz¦du 20 ns, a wi¦c porównywalny z symulacjami gruboziarnistymi.

Innym sposobem na scharakteryzowanie przej±¢ konformacyjnych jest u»ycie uªamka fcckontaktów, które s¡ wspólne z dan¡ konformacj¡ odniesienia. RMSD zale»y od ksztaªtu caªego biaªka, za± fcc

od oddziaªywa« zachodz¡cych w biaªku. Na przykªad zgi¦cie ªa«cucha na póª powoduje du»¡ zmian¦

RMSD, ale dopóki obie poªówki nie utworz¡ mi¦dzy sob¡ kontaktów, fcc wiele si¦ nie zmieni, co b¦dzie

±wiadczy¢ o zachowaniu dotychczasowej mapy kontaktów. Zale»no±¢ obu wielko±ci (RMSD i fcc) od czasu dla symulacji Q60pokazuje Rys. 3.2. Rozwa»ane s¡ 3 konformacje odniesienia: pierwsza (nazwana A i oznaczona zielonymi liniami) pochodzi z chwili tA= 10⁵ τ, druga (nazwana B i oznaczona czarnymi liniami) z chwili tB = 2 10⁵ τ, a trzecia (nazwana C i oznaczona niebieskimi liniami) z chwili tC = 3 10⁵ τ. Czerwone pionowe linie oznaczaj¡ czas, w którym, wg uªamka fcc, konformacja zaczyna bardziej przypomina¢ konformacj¦ C ni» A. Dzieje si¦ to dla tA/C = 1.53 10⁵ τ, co oznacza, »e zmiany w mapie kontaktów zachodz¡ w skali mikrosekund. Podobne przej±cie do konformacji podobnej do B (oznaczone czarn¡ pionow¡ lini¡), dzieje si¦ w pó¹niejszej chwili tA/B = 1.67 10⁵ τ. Natomiast RMSD przekracza próg 5 Å du»o szybciej - w ci¡gu pierwszych 0.05 10⁵ τ.

Rysunek 3.2: Zale»no±¢ od czasu uªamka fcc (góra) i RMSD (dóª) dla pojedynczej symulacji Q60. Wielko±ci s¡ obliczane co 1000 τ w odniesieniu do trzech wybranych konformacji uzyskanych dla tA= 10⁵τ (A), tB = 2·10⁵τ (B, przerywana linia) i tC = 3·10⁵τ (C). Struktury odniesienia s¡ przedstawione na górze. Czerwona pionowa linia oznacza przej±cie (dla f ) mi¦dzy A i C. Czarna pionowa linia:

Rys. 3.3 pokazuje macierze fcc dla 4 ró»nych homopolimerów o ró»nej dªugo±ci i skªadzie. Uªamek wspólnych kontaktów (fcc) mi¦dzy dwiema konformacjami jest liczony jako liczba wspólnych kontaktów podzielona przez caªkowit¡ liczb¦ kontaktów w tej konformacji, która ma ich wi¦cej. Ka»dy punkt na macierzy fcc oznacza fcc mi¦dzy dwiema konformacjami (z chwil oznaczonych na osiach wykresu), zaznaczone w skali szaro±ci. Macierz jest symetryczna, wi¦c pokazano tylko fragment nad diagonal¡.

Du»e zmiany w fcc odpowiadaj¡ przej±ciom konformacyjnym.

Q15 A30

N60 V60

Rysunek 3.3: Macierze fcc (uªamka wspólnych kontaktów dla konformacji z ró»nych czasów, zapisywa-nych co 1000 τ) dla ró»zapisywa-nych homopeptydów. Oparte na rys. S9 z artykuªu [I].

Aby opisa¢ te przej±cia ilo±ciowo, zostaª wymy±lony autorski algorytm klastrowania konformacji:

dwie konformacje s¡ w jednym klastrze je±li fcc pomi¦dzy nimi jest wi¦ksze od pewnego progu (50 %) i s¡siaduj¡ one ze sob¡ w czasie (algorytm dziaªa poprzez ª¡czenie s¡siednich klastrów, a fcc mi¦dzy klastrami jest liczone jako ±rednie fcc mi¦dzy strukturami z obu klastrów). W przeciwie«stwie do znanych algorytmów klastrowania, takich jak k-means, które nie s¡ w »aden sposób sprz¦»one z czasem symulacji, ten algorytm potra nie tylko podzieli¢ symulacj¦ na reprezentatywne konformacje, ale tak»e powiedzie¢ ile ka»da z nich trwa (i nie zale»y to od wyboru reprezentanta).

Czerwone linie na Rys. 3.3 oznaczaj¡ granice mi¦dzy klastrami. Próg wynosi 0.5, chocia» powinien zale»e¢ od ukªadu (np. A30 bardzo cz¦sto zmienia konformacje, a N60 pozostaje przez wi¦kszo±¢ czasu w jednym ksztaªcie). Dla niektórych ukªadów du»e zmiany konformacyjne zachodz¡ w skali setek mikrosekund. PolyA wci¡» tworzy helis¦, rozwija j¡ i nast¦pnie do niej wraca, w przeciwie«stwie do symulacji peªnoatomowych, w których helisa wydaje si¦ by¢ trwaªa. Takie przej±cia mog¡ wynika¢ z przybli»onej natury modelu gruboziarnistego, ale mog¡ tak»e ukazywa¢ prawdziwe zachowanie polyA w du»ych skalach czasowych, niedost¦pnych dla symulacji peªnoatomowych.

Opisanej wy»ej metody klastrowania mo»na u»y¢ dla ka»dego deskryptora, który mówi na ile dwie konformacje s¡ ilo±ciowo podobne. W przypadku fccpodobie«stwo musi by¢ powy»ej 0.5, natomiast dla RMSD mo»na zastosowa¢ próg 5 Å. Poniewa» progi zale»¡ od ukªadu, du»o wygodniej jest zmodykowa¢

algorytm tak, aby ª¡czyª s¡siednie klatki w klastry, a» zostanie osi¡gni¦ta zadana liczba klastrów. W ten sposób nie trzeba szuka¢ progu dla ka»dego ukªadu oddzielnie. Nieprzemy±lane zastosowanie progu 5 Å do tak du»ego ukªadu jak Q60 skutkuje podziaªem na zbyt wiele klastrów, jak na Rys. 3.4.

Rysunek 3.4: Macierz RMSD (dla konformacji zapisywanych co 1000 τ) dla Q60. Zlewaj¡ce si¦ czerwone linie s¡ obja±nione w tek±cie.

Rys. 3.5 pokazuje efekt dziaªania algorytmu z zadan¡ liczb¡ klastrów (10) dla tej samej symulacji Q60 (klatki byªy zapisywane co 1000 τ), jednak w jednym przypadku klastrowana jest macierz fcc, a w drugim RMSD. Wida¢, »e fcc tworzy du»o wyra¹niej podzielon¡ macierz, a przej±cia s¡ lepiej widoczne i dobrze zaznaczone. Tymczasem algorytm klastrowania dla RMSD pokazuje przej±cia w caªkiem innych miejscach, co potwierdza, »e te dwa deskryptory s¡ ró»nymi, komplementarnymi metodami opisu dynamiki biaªka.

Interesuj¡ce jest zbadanie czasów trwania konformacji wyznaczonych bez zadanego z góry progu RMSD lub fcc, lecz jedynie z zadan¡ z góry liczb¡ klastrów (10). Wtedy mo»na porównywa¢ ze sob¡

f_cc RMSD

Rysunek 3.5: Porównanie macierzy fcc(po lewej) i macierzy RMSD (po prawej) dla tej samej symulacji Q60. Obie macierze zostaªy podzielone na 10 klastrów (rozdzielonych przez zielone pionowe linie).

razie czas trwania zale»aªby od wybranego progu). Oczywi±cie im wi¦ksza liczba klastrów na jak¡ ma by¢ podzielona symulacja, tym krótszy czas trwania pojedynczego klastra. Jednak liczba klastrów jest wielko±ci¡ niezale»n¡ od deskryptora. Rys. 3.6 pokazuje czasy trwania klastrów z 10 niezale»nych symulacji Q60, ka»da trwaj¡ca 1 000 000 τ. Pierwsze 50 000 τ jest przeznaczone na doj±cie ukªadu do stanu równowagi i nie jest brane pod uwag¦ przy klastrowaniu, w zwi¡zku z tym pocz¡tek klastra 0 τ oznacza czas 50 000 τ od pocz¡tku symulacji. Poniewa» koniec symulacji oznacza automatycznie koniec klastra, nie znamy tak naprawd¦ czasów trwania klastrów dotykaj¡cych zielonej linii, dlatego nie nale»y ich bra¢ pod uwag¦. Wida¢, »e niektóre klastry trwaj¡ nawet 600 000 τ (czas bardzo trudny do osi¡gni¦cia dla symulacji peªnoatomowych). Statystyka jest za maªa aby stworzy¢ rozkªad czasów trwania klastra, jednak Rys. 3.6 sugeruje, »e czasy trwania uzyskane wg RMSD s¡ porównywalne do uzyskanych wg fcc.

Rysunek 3.6: Czasy trwania klastrów z 10 niezale»nych symulacji Q60, ka»da trwaj¡ca 1 000 000 τ.

W dokumencie Dynamika molekularna biaªek strukturalnie nieuporz¡dkowanych oraz ich agregatów w (Stron 74-79)