• Nie Znaleziono Wyników

6 Eksperymentalna weryfikacja języka ModeLang

6.1 Założenia

6.2.3 Modele ekspresji genu

Ekspresja genu oznacza proces, w którym informacja zawarta w genie zostaje przepisana na białka lub RNA. Jest to kolejny obszar biologii, dla którego powstał szereg modeli matematycznych.

Zainteresowanie biologii systemowej obszarem ekspresji genów jest związane z wpływem, jaki ma ten proces na wiele procesów biologicznych. Ekspresja genu, a co za tym idzie, regulacja poziomów białek ma istotny wpływ na przebieg chorób, różnic w populacji, a także ewolucji morfologicznej (Ay and Ar-nosti 2011). Z matematycznego punktu widzenia istotnym elementem modeli ekspresji genu jest tak zwana polimeryzacja białkowa. Jest to proces, w którym istotny jest czas przebiegu reakcji. Oznacza to, że wiązanie nie następuje natychmiastowo i zamodelowanie tego faktu jest istotne z punktu widzenia poprawności wyników symulacyjnych. W ten sposób powstały modele, których reakcje zachodzą z opóźnieniem czasowym. Istotne z punktu widzenia poprawności otrzymywanych wyników jest uwzględnienie tego podczas modelowania. Zatem jednym z czynników, który przemawiał za modelami ekspresji genu (poza możliwością przetestowania języka ModeLang z uwzględnieniem kolejnego istot-nego obszaru biologiczistot-nego) była możliwość przetestowania reakcji zachodzących z opóźnieniem.

Pierwszym modelem, który należy do grupy modeli ekspresji genu jest model transkrypcji i translacji. Jest to model o relatywnie prostej postaci matematycznej w stosunku do pozostałych modeli biorących udział w eksperymencie, który pozwala na sprawne przetestowanie podstawowych interak-cji pomiędzy agentami systemu dynamicznego.

Drugim modelem, który został uwzględniony jest model ekspresji genu. Jest to pierwszy model, który wykorzystuje tak zwane reakcje z opóźnieniem. W przeciwieństwie do pierwszego modelu został sklasyfikowany jako model złożony. Związane jest to z dwoma czynnikami. Po pierwsze jego zapis ma-tematyczny zawiera bardziej złożone operacje, których zamodelowanie nie jest tak oczywiste, jak w przypadku najprostszych modeli, które były uwzględnione podczas eksperymentu. Drugim powodem jest wykorzystanie zapisów związanych z opóźnieniem przebiegu reakcji. Modelowanie zawierające niestandardowe cechy reakcji jest związane z utrudnieniem dla użytkownika i zbadanie czy zamodelo-wanie tego typu modelu się powiodło powinno zawierać istotną adnotację na temat złożoności zdefi-niowanego modelu.

Trzecim modelem, który został uwzględniony jest model ekspresji genu z opóźnieniem wyko-nywania reakcji. Jest to kolejny model, który zawiera reakcje z opóźnieniem. W przeciwieństwie do poprzednich modeli jest jeszcze bardziej złożony matematycznie. Podobnie jak w przypadku drugiego

modelu towarzyszą mu dwa różne opóźnienia reakcji. Rozróżnione są one poprzez stosowne indeksy dolne, które zawierają identyfikatory stosownego opóźnienia reakcji. Z punktu widzenia przebiegu eks-perymentu zebrane zostały dwa złożone modele o podobnych cechach matematycznych i tematycz-nych, podobnie, jak w przypadku modeli epidemiologicznych zestawiony zostały ze sobą modele HIV i HCV. Takie zestawienie było spowodowane możliwością przetestowania podobnych elementów na nieco odmiennych przypadkach, dzięki czemu możliwe było zbadanie czy wyniki eksperymentu z punktu widzenia poprawności modeli, które w konsekwencji zostały zbudowane, były podobne i sku-teczność stosowania języka ModeLang mogła zostać potwierdzona wielokrotnie.

6.2.3.1 Model transkrypcji i translacji genów

Model transkrypcji i translacji genów (Chen et al. 1999) opisuje przebieg procesów związanych z ekspresją genu. Składa się z dwóch głównych elementów, związanych z opisywanym procesem. Zgod-nie z nazwą pierwszym opisywanym i zdefiniowanym zjawiskiem jest funkcja transkrypcji. Drugim zja-wiskiem, które zostało opisane jest translacja.

W modelu transkrypcji i translacji zdefiniowane są dwa główne agenty. Pierwszym z nich jest koncentracja mRNA. Drugim agentem modelu jest koncentracja białek. Koncentracja mRNA jest opi-sana za pomocą funkcji transkrypcji oraz macierzy degradacji mRNA. Do opisania koncentracji białek wykorzystywana jest macierz stałych translacji oraz macierz degradacji białek.

Rysunek 30. Schemat modelu transkrypcji i translacji genu.

Przebieg transkrypcji i translacji przedstawia Rysunek 30 (Chen et al. 1999). Równanie 9 przed-stawia układ równań różniczkowych, który opisuje model ten w postaci uproszczonej (Chen et al.

1999). Funkcja transkrypcji jest tutaj zapisana za pomocą oznaczenia f(p), natomiast w diagramie jest opisana za pomocą parametru C regulującego szybkość reakcji.

𝑑𝑟

𝑑𝑡 = 𝑓(𝑝) − 𝑉𝑟 𝑑𝑝

𝑑𝑡 = 𝐿𝑟− 𝑈𝑝

Równanie 9. Model transkrypcji i translacji genów.

Model składa się z dwóch równań, które reprezentują w sposób uproszczony przebieg procesu transkrypcji i translacji. Pierwsze równanie opisuje koncentracje mRNA. Opisane są one w oparciu o funkcję transkrypcji (f), która wpływa na wzrost koncentracji mRNA i jest oparta na koncentracjach białek. W niniejszym uproszczonym modelu nie wymagano od użytkowników zamodelowania samej funkcji f. Białko ulega degradacji, co jest zamodelowane za pomocą drugiego składnika pierwszego równania, mianowicie macierzy tempa degradacji mRNA (V). Drugie równanie opisuje koncentrację białek. Są one zamodelowane za pomocą macierzy stałych translacji (L), która wpływa na wzrost liczeb-ności białek oraz macierzy tempa degradacji białek. Degradacja białek jest procesem, który wpływa negatywnie na ich liczebność, zatem tempo degradacji decyduje o tempie ich zanikania.

6.2.3.2 Model ekspresji genu

Model ekspresji genu (Tian et al. 2007) jest pierwszym zaawansowanym modelem opisującym tematykę związaną z genetyką, który został włączony do próby modeli eksperymentalnych. Cechą cha-rakterystyczną poniższego modelu w stosunku do poprzedniego jest wykorzystanie reakcji z opóźnie-niem. Modelowanie reakcji z opóźnieniem wynika z potrzeby odwzorowania środowiska naturalnego w sposób jak najbardziej realny. W środowisku naturalnym czas trwania reakcji związanych z ekspresją genu jest istotnym czynnikiem wpływającym na przebieg zachodzących reakcji kształtujących system dynamiczny. Pomimo, że w próbie modeli eksperymentalnych reakcje z opóźnieniem znalazły się wy-łącznie w modelach ekspresji genu, jest to czynnik, który może zostać szeroko wykorzystany w różnych typach modeli.

Model ekspresji genu składa się z dwóch głównych elementów. Są to koncentracje białek oraz mRNA. Przebieg reakcji jest podobny do tego, jaki znamy z poprzedniego modelu ekspresji genu, jed-nakże matematycznie zostało to zamodelowane w sposób, który umożliwia wykluczenie pewnych błę-dów obliczeniowych związanych z nieuwzględnieniem opóźnienia wykonywania reakcji.

𝑑𝑝(𝑡)

𝑑𝑡 = 𝑎𝑚(𝑡 − 𝑇𝑝) − 𝑏𝑝(𝑡) 𝑑𝑚(𝑡)

𝑑𝑡 = 𝑔(𝑝(𝑡 − 𝑇𝑚)) − 𝑐𝑚(𝑡)

𝑔(𝑝) = 𝑘

1 + 𝑝2/𝑝02

Równanie 10. Model ekspresji genu.

Równanie 10 prezentuje model ekspresji genu (Tian et al. 2007). Składa się on z układu dwóch równań różniczkowych, które modelują liczność dwóch agentów oraz wzoru pomocniczego, który zo-stał wykorzystany w jednym z równań różniczkowych. Zastosowanie wzoru pomocniczego związane

jest z koniecznością uproszczenia zapisu drugiego równania. Uproszczenie takie zostało dokonane przez samych autorów modelu. Pierwsze równanie modeluje koncentrację białek, które zostały ozna-czone symbolem p. Zdefiniowane są one w oparciu o liczebność mRNA, która jest zależna od czasu oraz parametru a. Zależność od czasu zdefiniowana jest w oparciu o zapis funkcyjny, w którym długość opóźnienia jest zapisana z wykorzystaniem parametru Tp dla mRNA oraz o parametru Tm dla koncen-tracji białek. Koncentracja białek, która wpływa negatywnie na wzrost liczebności białek zależna jest również od parametru b. W przypadku koncentracji mRNA, sytuacja jest odwrotna, mianowicie pozy-tywny wpływ na populację mRNA ma liczebność białek w funkcji czasu, natomiast liczebność mRNA wpływa na zanikanie samego mRNA. Parametr czasowy, o który opóźniona jest reakcja związana z kon-centracją białek w drugim równaniu to Tm.

6.2.3.3 Model ekspresji genu uwzględniający miejsca wiązań

Badania związane z regulacyjnymi modułami miejsc wiązań (ang. binding site) prowadzone są od lat w obszarze bioinformatyki (Wilczyński et al. 2006). Było to jednym z powodów, aby w ramach prac eksperymentalnych wykorzystać drugi wariant modelu ekspresji genu, który uwzględnia dostęp-ność miejsc wiązań (Roussel 2010). W ten sposób wybrany został trzeci model opisujący ekspresję genu, który jest najbardziej złożonym przykładem układu równań różniczkowych w obszarze związa-nym z genetyką jaki został wykorzystany w pracach eksperymentalnych. Opisuje on ekspresję genu z wykorzystaniem trzech agentów. Pierwszym uwzględnionym agentem jest polimeraza. Drugi agent, to dostępność miejsc wiązania rybosomów, która ulega zmniejszeniu w czasie transkrypcji (modelowanej przez parametr 𝜏1). Trzecim elementem modelu jest RNA. Model ten został sklasyfikowany jako naj-bardziej złożony z dwóch powodów. Po pierwsze ze względu na skomplikowane relacje, które wystę-pują pomiędzy trzema typami agentów, które są częścią modelowanego systemu. Po drugie ze względu na jednoczesne wykorzystanie reakcji z opóźnieniem do scharakteryzowania każdego z wymienionych agentów, w tym dwóch różnych wartości opóźnień.

Model opisuje proces transkrypcji DNA do RNA poprzez polimerazę. Polimeraza wiąże się z promotorem genu w miejscu wiązania, gdzie następuje inicjalna transkrypcja. Jest on zdecydowanie różny od najprostszego modelu ekspresji genu, gdzie transkrypcja była zamodelowana w sposób uproszczony.

𝑑𝑃

𝑑𝑡 = 𝑘𝑡𝑃(𝑡)𝐵(𝑡) + 𝑘𝑡𝑃(𝑡 − 𝜏2)𝐵(𝑡 − 𝜏2) 𝑑𝐵

𝑑𝑡 = 𝑘𝑡𝑃(𝑡)𝐵(𝑡) + 𝑘𝑡𝑃(𝑡 − 𝜏1)𝐵(𝑡 − 𝜏1) 𝑑𝑅

𝑑𝑡 = 𝑘𝑡𝑃(𝑡 − 𝜏2)𝐵(𝑡 − 𝜏2)

Równanie 11. Model ekspresji genu uwzględniający miejsca wiązań.

Równanie 11 przedstawia układ równań różniczkowych, który jest definicją matematyczną opi-sywanego modelu ekspresji genu. Składa się z trzech równań, które opisują trzy agenty, które są częścią zamodelowanego systemu. Pierwsze równanie opisuje polimerazę, która jest oznaczona symbolem P.

Drugie równanie charakteryzuje dostępność miejsc wiązań promotora genu, która jest częścią całego

zależy od koncentracji polimerazy i liczby miejsc wiązań DNA. Różnica pomiędzy składnikami równania tkwi w czasie przebiegu reakcji. Pierwsza reakcja następuje natychmiast, natomiast druga jest realizo-wana z opóźnieniem. Opóźnienie drugiej reakcji dla polimerazy jest określone poprzez parametr 𝜏2. Drugie równanie modeluje dostępność miejsc wiązań, które zdefiniowane są w sposób bardzo po-dobny. Wiąże się to z tym, że wymienione reakcje zachodzą pomiędzy opisywanymi agentami i następ-stwem reakcji jest zmniejszenie liczby dostępnych miejsc wiązań na czas transkrypcji. Różnica tkwi w parametrze charakteryzującym czas realizacji reakcji, który w przypadku miejsca wiązania ma wartość 𝜏1 (z założenia, polimeraza jest blokowana dłużej). Trzecie równanie charakteryzuje koncentrację RNA, która rośnie pod wpływem jedynej charakteryzującej je reakcji. Jest to reakcja z opóźnieniem, która została już wcześniej scharakteryzowana dla wzrostu polimerazy.