• Nie Znaleziono Wyników

7 Praktyczne wykorzystanie języka ModeLang do modelowania mechanizmu CRISPR/Cas9

7.2 Model mechanizmu CRISPR/Cas9

W rozdziale tym opisany został model mechanizmu CRISPR/Cas9. Ze względu na zróżnicowane formy zapisu, które były stosowane w ramach tej pracy model CRISPR/Cas9 jest zapisany w trzech róż-nych postaciach.

W podrozdziale 7.2.1 przedstawiony jest model CRISPR/Cas9 w pełnej postaci. Uwzględnia on elementy, które zostały w wersji uproszczonej wyeliminowane, aby uprościć maksymalnie obliczenia jednocześnie nie tracąc poprawności działania modelu. W rozdziale 2.4 przedstawiony jest diagram mechanizmu CRISPR/Cas9. Na podstawie tego diagramu zostały zidentyfikowane agenty, które mogą w ramach modelu pełnić zasadniczą rolę i rozrysowane zostały również interakcje, które mogą być podstawą działania mechanizmu CRISPR/Cas9.

Następnie zapisany i omówiony jest model, który został stworzony w celu przeprowadzenia eks-perymentów symulacyjnych. Podstawą stworzenia modelu, który przedstawiony jest w podrozdziale 7.2.2 jest opis, który udało się zrealizować w ramach analizy systemu przedstawionego na diagramie, który opisany został w podrozdziale 2.4. Kluczowy w ramach prac symulacyjnych był również dobór parametrów i wartości początkowych. Kwestie związane z tymi zmiennymi zostały omówione w roz-dziale 7.3. Model, który reprezentowany jest w postaci SBML nazywamy modelem kinetycznym i zbu-dowanie takiego modelu wymagało w pierwszym kroku przekształcenia istniejącego modelu, który zo-stałby potwierdzony w ramach eksperymentów badawczych. W związku z tym projektowanie modelu kinetycznego było oparte o model, który opisany został w postaci układu równań różniczkowych. Opis tego podstawowego modelu został zawarty w podrozdziale 7.2.1.

W kolejnym kroku powstał model zapisany w języku ModeLang. Model ten powstał na etapie, na którym dostępny był zarówno model w postaci układu równań różniczkowych jak i postaci kinetycz-nej. Pozwoliło to na dwa eksperymenty porównawcze. Po pierwsze możliwe dzięki takiej kolejności prac było dokonanie konwersji pomiędzy modelem zapisanym w postaci języka ModeLang na model zapisany w języku SBML. Konwersja ta pozwalała potwierdzić, czy wynikowy model zapisany w postaci SBML był zbieżny z modelem, który został przygotowany wcześniej w ramach prac badawczych. Po-twierdzenie tego faktu było istotne z punktu widzenia weryfikacji działania narzędzi związanych z języ-kiem ModeLang. Potwierdzenie jednakże poprawności modelu zostało zrealizowane w ramach ekspe-rymentów obliczeniowych, które były oparte o model zapisany w postaci SBML. W związku z tym moż-liwe było potwierdzenie zarówno poprawności działania narzędzi jak i poprawności zbudowanego mo-delu w języku ModeLang. Projekt, który zakładał nie tylko możliwość zapisu modeli w postaci kontro-lowanych języków naturalnych, lecz także interpretację ich w celach wydobywania informacji z nich do postaci zapisu, która była użyteczna, mógł zostać potwierdzony na poziomie badań eksperymental-nych.

Podrozdział 7.2.2 opisuje model zapisany w postaci uproszczonej. Wersja ta wykorzystana zo-stała w ramach prac eksperymentalnych z użyciem środowiska CellDesigner. Powzo-stała ona w celu zde-finiowania postaci modelu, którego symulacja będzie wygodna, a jednocześnie jej wyniki będą nie-znacznie odbiegać od wyników uzyskiwanych z wykorzystaniem pełnej wersji modelu. Osiągnięcie tak znacznych uproszczeń było dziełem analizy wpływu poszczególnych składowych modelu na wyniki koń-cowe obliczeń. Dostępna była również wersja tego modelu w postaci SBML po konwersji z modelu w języku ModeLang, jednakże pokazanie skonwertowanej wersji modelu pozwala na zapoznanie się z wersjami zapisu modelu CRISPR/Cas9 w kolejności w jakiej powstawały w ramach prac badawczych.

7.2.1 Projekt pełnego modelu mechanizmu CRISPR/Cas9

W tym podrozdziale opisany jest pełny model mechanizmu CRISPR/Cas9. Równanie 12 przed-stawia układ równań różniczkowych, który jest zapisem matematycznym omawianego modelu (Iranzo et al. 2013). Model składa się z trzech typów agentów. Są to bakterie Cas+, Cas-, a także komórki wi-rusa. Model w takiej postaci uwzględnia współistnienie komórek gospodarzy Cas+ i Cas-, czyli komórek posiadających fragment CRISPR i nie posiadających go. W tym modelu uwzględnionych jest kilka istot-nych elementów modelowanego środowiska. Prawdopodobieństwo, że w skutek replikacji nie nastąpi mutacja chroniąca wirus przed mechanizmem CRISPR/Cas9 zostało zamodelowane za pomocą para-metru p. Model umożliwia odzwierciedlenie horyzontalnego transferu genów za pomocą parapara-metru 𝜎. Stała K pełni funkcję stałej Michaelisa, czyli odzwierciedla powinowactwo enzymu Cas9. Stała 𝜆 oznacza prawdopodobieństwo, że w trakcie replikacji fragment CRISPR zostanie usunięty. Stała c okre-śla koszt działania mechanizmu CRISPR, w skutek którego bakterie Cas+ replikują wolniej.

𝑑𝑁𝑏+ Równanie 12. Model mechanizmu CRISPR/Cas9.

Opisane charakterystyki reprezentowane są przez trzy równania w układzie równań różniczko-wych. Pierwsze równanie definiuje agenta Cas+, który jest opisany w równaniu jako Nb+. Równanie to składa się z dwóch wyrażeń. Pierwsze wyrażenie opisuje wzrost populacji Cas+. Wzrost ten jest zależny od stałych λ, c i σ, a także parametru K opisanego powyżej. Wzrost populacji jest zależny zarówno od rozmiarów populacji Cas+, jak i od horyzontalnego transferu genów. Ponadto zdefiniowana jest pojem-ność środowiskowa, która poza rozmiarem populacji Cas+ i Cas- uwzględnia parametr K. Populacja Cas+

maleje głównie pod wpływem działania wirusa, lecz także zamodelowane jest umieranie, które jest wprost proporcjonalne do rozmiaru populacji.

Drugie równanie opisuje dynamikę populacji Cas-, zapisanej w układzie równań różniczkowych jako Nb-. Podobnie, jak w przypadku populacji Cas+ na wzrost populacji wpływa jej rozmiar, w przy-padku populacji Cas- również rozmiar jest istotnym czynnikiem warunkującym jej rozwój. Rozmiar po-pulacji Cas- jest również istotny z punktu widzenia horyzontalnego transferu genów, który dla popo-pulacji Cas- jest czynnikiem zmniejszającym ją poprzez horyzontalny transfer odporności. Jest on również w tym przypadku ograniczony w zależności od rozmiarów populacji Cas+ i Cas-, a także w oparciu o czyn-nik K. Parametr s oznacza prawdopodobieństwo, że infekcja komórki się nie powiedzie.

Trzecie równanie opisuje populację wirusa. Została ona oznaczona symbolem Nv. W związku z tym, że komórki wirusa rozwijają się w oparciu o komórki gospodarza, którego zarażają, ich rozwój jest zależny od dostępności gospodarzy. Rozwój wirionów jest zatem zamodelowany w oparciu o rozmiar populacji wirionów Nv, a także rozmiar populacji komórek Cas+ i Cas-. Znaczącym parametrem, który wpływa na ten rozmiar jest M, który opisuje rozmiar populacji wirionów, które są uwalniane

jednora-7.2.2 Model uproszczony obsługiwany w programie CellDesigner

Pełny model mechanizmu CRISPR/Cas9, który został opisany w rozdziale 7.2.1 zawiera dużą liczbę parametrów, których uwzględnienie w procesie przygotowawczym do symulacji komplikuje prace badawcze, a niekoniecznie zwiększa precyzję modelu. W celu uproszczenia tego procesu został wykorzystany model uproszczony (Iranzo et al. 2013), który był podstawą do prac eksperymentalnych związanych z opisywanymi badaniami. Model ten przedstawia Równanie 13 (Iranzo et al. 2013).

𝑑𝑁𝑏

𝑑𝑡 = 𝑎𝑁𝑏(1 − 𝑁𝑏

𝑁𝑏𝑚𝑎𝑥) − 𝑏(1 − 𝑠)𝑁𝑏𝑁𝑣 𝑑𝑁𝑣

𝑑𝑡 = 𝑀𝑏(1 − 𝑠)𝑁𝑏𝑁𝑣− 𝑔𝑁𝑣− 𝑏𝑠𝑁𝑏𝑁𝑣

Równanie 13. Model uproszczony mechanizmu CRISPR/Cas9.

Układ równań różniczkowych zaprezentowany przez Równanie 13 zawiera dwa równania, które repre-zentują komórki bakterii i wiriony. W takim wariancie modelu, jest on bardzo zbliżony do klasycznego modelu Lotka-Volterra. W takim rozumieniu modelu, wiriony są drapieżnikiem, natomiast bakterie re-prezentują ofiarę.

Trzy główne czynniki, które są uwzględnione w tym modelu, to tempo zachodzenia kolizji bak-terii i wirusów, które jest reprezentowane za pomocą parametru b, rywalizacja bakbak-terii zdefiniowana za pomocą parametru a, a także wrodzona odporność, którą opisuje parametr s. Rozwój populacji wi-rusa jest zależny od liczby uwalnianych wirionów przy rozerwaniu komórki gospodarza M, a także od rozmiaru populacji wirusa i populacji komórek bakterii. Liczba wirionów jest redukowana pod wpły-wem kolizji, która zachodzi pomiędzy wirionami i bakteriami. Czynnikiem, który redukuje liczbę wirio-nów jest również umieranie wiriowirio-nów, które jest zamodelowane za pomocą parametru g.

Rozwój populacji bakterii jest zdefiniowany w oparciu o parametr a, który kontroluje tempo reprodukcji bakterii. Namnażanie bakterii jest również zależne od liczności ich populacji. Zdefiniowana jest również pojemność środowiskowa komórek bakterii, którą reprezentuje Nbmax. Redukcja rozmiaru populacji bakterii ma miejsce w oparciu o reakcję, która zachodzi pomiędzy wirionami i komórkami bakterii, która jest zależna od rozmiaru obydwóch populacji. Istotnym czynnikiem są również parame-try b i s, które reprezentują tempo zachodzenia kolizji bakterii i wirusów, a także wrodzoną odporność.

Zasadniczą różnicą pomiędzy wariantem pełnym i uproszczonym modelu jest pominięcie kwe-stii rozróżnienia komórek bakterii, na te, które posiadają fragment CRISPR i te, które jeszcze takiego fragmentu nie posiadają. Pominięcie tego elementu pozwala nadal na symulację procesów, ich sku-teczności i interakcji pomiędzy wirusami i komórkami, które ulegają zmianom. Możliwe jest zatem wy-korzystanie modelu w takiej postaci do celów eksperymentalnych, które pozwalają na śledzenie prze-biegu interakcji pomiędzy wirusem i komórkami bakterii, w celu weryfikacji poprawności modelu i sto-sowania go do późniejszego przewidywania przebiegu podobnych interakcji. W związku z tym, model w postaci przedstawionej w tym podrozdziale został wykorzystany w dalszych pracach eksperymental-nych.

7.2.3 Zapis modelu uproszczonego w języku ModeLang

Weryfikacja modelu nastąpiła w dwóch fazach. Najpierw został zapisany za pomocą języka Mo-deLang, przekonwertowany do SBML i wczytany w programie CellDesigner, gdzie wykonane zostały eksperymenty symulacyjne. Drugi sposób obejmował zapisanie modelu w programie Mathematica, gdzie dokonane zostały eksperymenty symulacyjne. W tym podrozdziale zaprezentowana jest postać modelu w języku ModeLang. Pełen jego zapis przedstawia Listing 12.

b = 10e-4

s = 0.1

bs = b*s

Target Bacteria is created by Target Bacteria at speed a

Number of Target Bacteria is less than tmax

Target Bacteria is killed by Virions at speed b

Target Bacteria and Virions merge into Virions at speed bs

Virions die at speed g

Listing 12. Model uproszczony zapisany w języku ModeLang.

Zgodnie ze standardem języka ModeLang, zapis składa się z dwóch części. Pierwsza część za-wiera definicje wartości początkowych oraz parametrów. Listing 12 przedstawia deklarację dwóch zmiennych b i s, które są odpowiednikiem parametrów o tych samych symbolach w modelu zapisanym w układzie równań różniczkowych. Następnie zadeklarowany jest parametr pomocniczy bs, który re-prezentuje iloczyn parametrów podstawowych. Taka forma deklaracyjna pozwala na centralne stero-wanie wartościami parametrów podstawowych i jednoczesne wykorzystanie formuł matematycznych, które są zastosowane w modelach bardziej złożonych.

Druga część opisuje interakcje, które zachodzą pomiędzy agentami, a także ograniczenia, które dotyczą tych interakcji. Pierwsza reguła opisuje reprodukcję bakterii „Target Bacteria”, która jest

ogra-środowiskowa. Określa ona stałą tmax, która ogranicza maksymalną liczbę „Target Bacteria”, czyli ko-mórek bakterii. Kolejna reguła opisuje redukcję populacji bakterii, która wynika z interakcji z wirusami, a także tempo zachodzenia tych interakcji oznaczone symbolem b. Następnie przedstawiona jest re-guła, która opisuje łączenie się bakterii i wirionów, w efekcie czego dochodzi do śmierci bakterii i po-wstawania nowych wirionów. Tempo zachodzenia tej reakcji jest zdefiniowane w oparciu o zadeklaro-wany wcześniej parametr BS. Ostatnią regułą, która została zdefiniowana jest reguła, która opisuje rozpad wirionów. Jest ona określona z wykorzystaniem parametru g, który reprezentuje tempo umie-rania wirusa.

Z wykorzystaniem narzędzi, które zostały zaimplementowane w ramach prac badawczych możliwe jest przekonwertowanie przedstawionego modelu do postaci SBML, a także zweryfikowanie jego postaci matematycznej poprzez analizę automatycznie wygenerowanego układu równań różnicz-kowych, który powstaje na podstawie reguł języka ModeLang. Zrzut ekranu 4 przedstawia automatycz-nie wygenerowany układ równań różniczkowych za pomocą narzędzia do parsowania języka Mode-Lang.

Zrzut ekranu 4. Automatycznie wygenerowany układ równań różniczkowych w parserze ModeLang.

Rezultat parsowania przedstawia układ równań różniczkowych, który zawiera przedstawione w postaci matematycznej informacje, które zostały zebrane w procesie parsowania. Pierwszym ele-mentem widocznych zapisów jest legenda, która przedstawia w jaki sposób oznaczenia, które widzimy na równaniach odnoszą się do zapisów w języku ModeLang. W związku z tym, że kontrolowany język naturalny sprzyja wykorzystywaniu pełnych opisywanych nazw, potrzebne było rozwiązanie, które po-zwoliłoby na przedstawienie takich zapisów matematycznie w postaci czytelnej. Długie nazwy zamiast symboli uniemożliwiłyby sprawną analizę przedstawionych formuł. W tym celu zostało zaimplemento-wane rozwiązanie, które redukuje nazwy do pierwszych liter, a w przypadku konfliktu, nadaje za po-mocą cyfry oznaczenie unikatowe (przykładowo t1). W taki sposób mamy wiriony oznaczone literą v i bakterie oznaczone za pomocą litery t. Ponadto zapis generuje się w oparciu o cechy charakterystyczne zdefiniowanych reguł. Jeżeli interakcja powoduje efekt dla obydwóch agentów (na przykład łączenie się komórek) jest to odzwierciedlone matematycznie w równaniach opisujących danych agentów. Je-żeli jest to interakcja jednostronna (na przykład zabijanie) lub reakcja samoczynna (na przykład umie-ranie), takie zjawisko odzwierciedlone jest jedynie w równaniu, które opisuje byt, na który wpływa dana reakcja. W modelu tym zostało dokonane pewne uproszczenie, mianowicie nie został przedsta-wiony parametr M. Możliwe było pominięcie tego parametru ponieważ występuje on wyłącznie w po-łączeniu z innymi parametrami co powoduje, że jego wpływ mógł zostać określony na etapie definicji wartości pozostałych parametrów, z którymi występuje.