• Nie Znaleziono Wyników

Cel pracy

4.2. Operacje zaimplementowane w programie ModeRNA

4.2.2. Modelowanie struktury

4.2.2.4. Modelowanie insercji i delecji

W sekwencji celu mogą pojawić się trzy rodzaje insercji (przerw w sekwencji szablonu):

na końcu 5′ (sekwencja AAAAA w poniższym przykładzie), we wnętrzu sekwencji (GGGGG w poniższym przykładzie) lub na końcu 3′ (sekwencja CCCCC w poniższym przykładzie):

>cel

AAAAAUUUUUUGGGGGUUUUUUCCCCC

>szablon

---UUUUUU---UUUUUU---

Dla każdej insercji do modelu zostaje wprowadzony fragment o długości odpowiadającej przerwie w sekwencji szablonu. Insercja może oznaczać pojawienie się w modelu nieobecnego w szablonie wybrzuszenia, pętli (lub wydłużenie istniejącej pętli), albo całego elementu struktury drugorzędowej.

Budowa fragmentu

Fragment zbudowany jest z reszt nukleotydów, których liczba odpowiada długości insercji oraz z reszt kotwiczących, które są punktem odniesienia pomiędzy fragmentem i modelem (w modelu są to reszty okalające insercję, na które zostanie nałożony fragment (pogrubione U w powyższym przykładzie), we fragmencie są to dodatkowe reszty, które po procesie nałożenia przestrzennego zostaną usunięte). Fragment wstawiany wewnątrz struktury ma dwie reszty kotwiczące, natomiast fragment dodawany na końcu 5′ lub 3′ ma tylko jedną taką resztę, odpowiednio na końcu 3′ lub 5′.

Fragmenty używane podczas modelowania insercji i delecji we wnętrzu struktury zostały uzyskane ze zbioru rnaDB2005 – 172 struktur pochodzących z różnych rodzin RNA (rozdział 2.1.2). Źródłem fragmentów wstawianych na końcu 5′ lub 3′ jest pojedyncza nić helisy o odpowiedniej długości. Biblioteka fragmentów zawiera 131316 ciągłych fragmentów o długości od dwóch do dziewiętnastu reszt nukleotydów. Na podstawie tej biblioteki modelowane mogą być insercje i delecje o maksymalnej długości siedemnastu reszt nukleotydów (długość insercji/delecji + dwie reszty kotwiczące). Rozmiar ten został wybrany ze względu na wielkość biblioteki – 20MB, przy większej długości fragmentów rozmiar

wzrasta, co może być niepożądane ze strony użytkownika instalującego oprogramowanie na dysku. W przypadku konieczności modelowania insercji/delecji o większej długości użytkownik ma możliwość pobrania ze strony programu ModeRNA pliku z rozszerzoną biblioteką z fragmentami o długości do 100 reszt nukleotydów (111MB). Wszystkie fragmenty z biblioteki (zarówno standardowej jak i rozszerzonej) charakteryzowane są przez:

 Długość (ilość reszt bez reszt kotwiczących, od zera do siedemnastu).

 Identyfikator struktury i łańcucha, z których pochodzi fragment.

 Identyfikatory reszt kotwiczących na końcu 5′ i 3′.

 Sekwencję (zawiera reszty kotwiczące).

 Strukturę drugorzędową.

 Sześć dystansów międzyatomowych.

Wyszukiwanie fragmentu

Program ModeRNA dla każdej insercji/delecji identyfikuje fragment o odpowiedniej długości, dla którego dopasowanie reszt kotwiczących pomiędzy modelem i fragmentem jest jak najlepsze, a liczba zderzeń sterycznych ze strukturą modelu minimalna (Rycina 19).

Poszukiwanie odpowiedniego fragmentu obejmuje dwa etapy. W pierwszym sprawdzane jest dopasowanie reszt kotwiczących wszystkich fragmentów o odpowiedniej długości z biblioteki. Drugi etap polega na wstawieniu do modelu 50 najlepszych kandydatów i ich ewaluacji.

Rycina 19. Operacja wstawienia fragmentu strukturalnego o długości 9 reszt nukleotydowych do modelu.

Pierwszy etap wyszukiwania fragmentu

Wstępne przeszukiwanie obejmuje porównanie sześciu dystansów między atomami reszt, pomiędzy które ma zostać wstawiony fragment (reszty kotwiczące modelu) oraz atomami pierwszej i ostatniej reszty fragmentu (reszty kotwiczące fragmentu).

Porównywane dystanse to: O5′r5-O5′r3; C5′r5-C5′r3; C4′r5-C4′r3; C3′r5-C3′r3; C1′r5-C1′r3; N1r5/N9r5-N1r3/N9r3, gdzie r3 i r5 oznaczają reszty kotwiczące:

Model: 5′ ___________ (r5) (r3)____________ 3′

Fragment: 5′ (r5) ______________ (r3) 3′

Dystanse brane pod uwagę podczas wstępnego etapu wyboru fragmentów zostały przedstawione poniżej (Rycina 20).

Rycina 20. Odległości pomiędzy atomami używane jako wstępne kryterium dopasowania przy wyszukiwaniu fragmentów do wstawienia między dwie wskazane reszty (reszty kotwiczące).

Wartości dystansów są zgromadzone w bibliotece fragmentów, co przyspiesza procedurę wstępnego dopasowania. Jedynie dystanse dla reszt kotwiczących modelu muszą

zostać obliczone. Różnice odpowiadających dystansów z modelu i fragmentu zostają podniesione do kwadratu i zsumowane:

, gdzie indeks m oznacza model, indeks fr fragment, a u; w; v; x; y i z to kolejne dystanse (np. u oznacza dystans O5′r5-O5′r3).

Jest to przybliżone oszacowanie wartości RMSD nałożenia danego fragmentu. Porównanie pozwala wyłonić 50 najlepiej dopasowanych fragmentów, które podlegają dalszej ewaluacji.

Drugi etap wyszukiwania fragmentu

Najlepiej dopasowane fragmenty zostają wstawione do modelu przez nałożenie atomów C1′r5, C4′r5, C3′r5,O3′r5 i N1r5/N9r5 reszty kotwiczącej na końcu 5′ oraz atomów C1′r3, C4′r3, C3′r3, O5′r3, N1r3/N9r3 i C5′r3 reszty kotwiczącej na końcu 3′ fragmentu na odpowiadające atomy w resztach kotwiczących modelu. Sekwencja fragmentu zostaje zmieniona tak, aby odpowiadała przyrównaniu. Fragment jest oceniany na podstawie RMSD uzyskanego po nałożeniu reszt kotwiczących, niepodobieństwa oryginalnej sekwencji fragmentu i sekwencji z przyrównania oraz liczby zderzeń sterycznych z resztą modelu:

Największą wagę przy ocenie fragmentu ma nałożenie reszt kotwiczących (a = 10.0), następnie liczba zderzeń sterycznych pomiędzy fragmentem i modelem (c = 2.0).

W przypadku, gdy dla dwóch fragmentów wartości te są bardzo zbliżone decydujące znaczenie ma niepodobieństwo sekwencji (b = 1.0). Jest ono liczone przez zastosowanie następującej matrycy substytucji dla każdej pozycji w przyrównaniu:

 0.0 – takie same nukleotydy (np. A + A; m6t6A + m6t6A).

 0.1 – nukleotyd i jego modyfikacja (np. A + m6t6A; U + D).

 0.5 – tranzycja (np. A + G; C + U).

 1.0 – transwersja (np. A + U; C + G).

Liczone jest niepodobieństwo zamiast podobieństwa sekwencji tak, aby wszystkie wyniki cząstkowe równania, jak i ostateczna ocena, były tym lepsze im niższą wartość osiągną.

Modelowanie delecji w sekwencji celu

Wstawienie fragmentu strukturalnego ma również miejsce w przypadku, gdy sekwencja szablonu jest dłuższa od sekwencji celu, np.:

>cel

AAAAAU---UAAAAA

>szablon

AAAAAUGGGGGUAAAAA

Przykład takiej sytuacji to usunięcie pętli zmiennej tRNA, lub zastąpienie jej przez krótszą pętlę. Niepotrzebny element struktury zostaje usunięty, a pozostające po nim dwa wolne końce muszą ulec połączeniu. W tym celu wyszukiwany jest i wstawiany fragment składający się z dwóch połączonych ze sobą reszt kotwiczących.

Podsumowanie

Program ModeRNA pozwala na modelowanie sekwencji celu niemającej odpowiednika w szablonie oraz na usuwanie zbytecznych fragmentów szablonu z zachowaniem ciągłości struktury modelu poprzez wprowadzanie do modelu fragmentów strukturalnych wybranych na podstawie kryteriów geometrycznych z wewnętrznej biblioteki programu. Podejście to jest podobne do zastosowanego w programie SWISS-MODEL (Schwede, i wsp., 2003).

Funkcje związane z operacją wstawiania do modelu fragmentów to:

apply_all_indels(), apply_indel(), apply_missing_ends(), crete_fragment(), find_fragment(), insert_fragment().