Transkrypcja u eukaryota i jej regulacja
Andrzej Jerzmanowski
Co to jest gen - zmieniające się wyobrażenia i
definicje
gen
Definicja wg encyklopedii:
Funkcjonalna i fizyczna jednostka
dziedziczności przekazywana
potomstwu przez rodziców w trakcie mitozy.
Geny są fragmentami DNA,
większośc genów zawiera informację potrzebna do wytworzenia
specyficznych białek i, w konsekwencji, komórek.
Terapia genowa bada możliwości
wykorzystania genów do leczenia nowotworów.
Klasyczne wyobrażenie genu – fragment DNA,
który koduje funkcjonalny mRNA
Definicje historyczne
Niektórzy wciąż używają definicji podobnej do tej, z przed pół
wieku: gen to sekwencja kodująca polipeptyd.
Jest tak zwana definicja ‘jeden gen – jedno białko’. Raczej
staromodna.
Istnieją geny, które nie kodują białek, choć zwykle, gdy mówimy
o typowych genach, mamy na myśli właśnie geny kodujące białka. Są geny kodujące przenośnikowe RNA (tRNA),
rybosomalne RNA (rRNA), czy wielkie heterogenne RNA (hnRNA). Żadne z nich nie mają rejonów kodujących białka.
Transkrypt jest produktem funkcjonalnym, często powstającym
Współczesne definicje odnoszą się do produktu, jakim jest transkrypt, i nie biorą pod uwagę białka
Jak zawsze w biologii, istnieją wyjątki. Oto lista genów, które nie pasują do ‘definicji odnoszącej się do transkryptu’.
Operony: Niekiedy sąsiadujące ‘geny’ są transkrybowane łącznie, co prowadzi do powstania wielkiego początkowego transkryptu zawierającego szereg rejonów
kodujących. W innych wypadkach początkowy transkrypt jest szybko przecinany na liczne funkcjonalne RNA. Nie ma sensu w tej sytuacji odnosić się do
ko-transkrybowanych genów, jako do ‘pojedynczego genu’. Zamiast tego, ‘genami’ nazwiemy odcinki DNA odpowiadające pojedynczym jednostkom funkcjonalnym. Tak więc, operon lac operon zawiera trzy “geny” a operony rRNA zawierają, dwa, trzy lub cztery ‘geny’.
Trans-splicing: Istnieją geny ‘ w kawałkach’. Transkrypt pochodzący z jednego
fragmentu jest łączony z transkryptem z innego fragemntu, aby mógł powstać funkcjonalny RNA.
Geny nakładające się: Niektóre ‘geny’ nakładają się. Oznacza to, że pojedynczy
fragment DNA może być częścią dwóch lub nawet trzech genów.
Redagowanie RNA: Niekiedy pierwotny transkrypt ulega intensywnemu redagowaniu
zanim stanie się transkryptem funkcjonalnym. W najbardziej skrajnych przypadkach dochodzi do wstawiania lub usuwania nukleotydów. Ozna cza to, że zawartość
informacyjna ‘genu’ jest niepełna dla zapewnienia jego funkcjonalności i musi być uzupełniona z udziałem innych ‘genów’
Czy gen obejmuje także sekwencje regulatorowe?
Niektóre definicje genu obejmują promotor i rejony regulatorowe.Takie definicje rodzą problemy logiczne i semantyczne.
Nie mówimy, że tylko ‘część’ genu jest transkrybowana, albo że sekwencje
regulatorowe kontrolują ekspresję ‘części’ genu, co byłoby poprawne, gdyby definicja obejmowała także sekwencje regulatorowe.
Włączając sekwencje regulatorowe do definicji genu, rozmywamy jego tożsamość. W odniesieniu do większości genów nie wiemy, jak daleko
rozciągają się sekwencje regulatorowe, ani gdzie dokładnie są zlokalizowane w stosunku do początku genu. Tak więc tracimy pewnośc, gdzie zaczyna się i gdzie kończy tak zdefiniowany gen.
Nowa definicja genu według Encode
Ten obszar genomu wytwarza trzy transkrypty. Po alternatywnym splicingu, produkty dwóch z
tych transkryptów kodują pięć białek, natomiast trzeci traskrypt zawiera informacje o
niekodującym RNA (ncRNA).
Białka są kodowane przez trzy zestawy sekwencji
DNA łączących różne fragmenty (A, B, i C; D; i E). W przypadku trzech fragmentów (A, B, C), każdy występuje przynajmniej w dwóch białkach. Dwa pierwotne transkrypty mają ten sam nie ulegający translacji rejon 5’, ale ich ulegające translacji rejony D i E nie nakładają się. Ponieważ trzeci transkrypt koduje ncRNA, fakt że jego
fragmenty X i Y pokrywają się z fragmentami genów kodujących białka A i E, nie oznacza, że jest on ko-produktem tych genów.
W sumie, w tym rejonie DNA występują cztery
geny obejmujące zaznaczone sekwencje: Gen 1 składa się z fragmentów sekwencji A, B, i C; gen 2 to sekwencja D; gen 3 - E; gen 4 składa się z fragmentów sekwencji X i Y.
Kontekst transkrypcji – chromosomy
eukariotyczne
Nukleosomy
Struktury chromatynowe wyższego rzędu
Umiejscowienie transkrypcji w komórce
Zawartość nie kodującego białek DNA (jako % całkowitego
DNA) u różnych organizmów
Płazy cechuje najwyższa zmienność wartości C wśród
kręgowców
. Paradoks wartości C oddaje
niemożliwość wyjaśnienia relacji
między wielkością genomu a funkcją na poziomie organizmu.
Jedną z większych zagadek w biologii
jest ogromne zróżnicowanie wartości C pomiędzy gatunkami, których
przedstawiciele nie różnią się w
podobny sposób poziomem złożoności.
Skrajne różnice w wartości C
charakteryzują płazy. Najmniejsze genomy w tej gromadzie zawierają nieco poniżej 109 par zasad, podczas
gdy największe – prawie 1011. Nie jest
możliwe, by do funkcjonowania
jednych płazów potrzeba było 100 razy więcej genów niż do funkcjonowania innych.
Transkrypcja
Przetwarzanie informacji z zapisanej w DNA na
zapisaną w RNA
Katalizowana przez zależne od DNA RNA-polimerazy
RNA zawiera rybonukleotydy,
a nie deoksyrybonukleotydy, jak DNA
Grupa 2’ hydroksylowa w RNA, w DNA ta grupa jest ‘deoksy’ (nie zawiera
atomu tlenu)
U replaces T in RNA Różnice pomiędzy RNA i DNA
RNA jest syntetyzowany w kierunku 5’ 3’
Matryca
DNA
Nowy RNA
3’
5’
3’
5’
Geny mogą być ułożone w różnych kierunkach
Promoter region
Reakcja polimeryzacji RNA
β- i γ-grupy fosforanowe są
usuwane z dołączanego trifosfonukleozydu, a grupa hydroksylowa jest usuwana z atomu węgla 3′- nukleotydu na końcu łańcucha.
Rozpad powstającego w reakcji
pirofosforanu przesuwa
równowagę na korzyść reakcji polimeryzacji
Rodzaje RNA w komórkach eukariontów
Initiation
Elongation
Termination
This is a file from the Wikimedia Commons
Typy eukariotycznych polimeraz RNA
Chloroplasty: jak mitochondria
Struktura α-amanityny i innych inhibitorów transkrypcji
Rifampicina hamuje polimerazy prokariotyczne, α-amanityna hamuje eukariotyczną RNA pol II.
Polimerazy RNA u pro- i eukariontów
Homologi Homologi
Kompleks z inhibitorem wiązania RNA
Widok z boku (w przekroju) kompleksu transkrybującego RNA Pol II, ukazujący ułożenie kwasów nukleinowych i lokalizację niektórych elementów
funkcjonalnych enzymu
Bushnell D A et al. PNAS 2002;99:1218-1222
©2002 by The National Academy of Sciences
Duża liczba równoległych łańcuchów DNA tworzy grube
prążki widoczne w chromosomach politenicznych
Kluczowe znaczenie domeny karboksylowej (C-końcowej) RNA Pol II
“CTD” to domena C-końcowa największej
podjednostki RNA polimerazy II.
U człowieka liczy ponad 350
aminokwasów złożonych z wielokrotnych powtórzeń 7-aminokwasowego motywu o sekwencji konsensusowej: tyr-ser-pro-thr-ser-pro-ser.
CTD ma kluczowe znacznie dla
mechanizmów, które łączą zdarzenia po-transkrypcyjne z transkrypcją. Na
przykład, praktycznie wszystkie
kompleksy zaangażowane w obróbkę RNA (RNA processing) zawierają składniki, które wiążą się do CTD.
Wciąż niewiele wiadomo, jak CTD
lokalizuje się przestrzennie w stosunku do głównej części polimerazy. Wiadomo jedynie, że CTD jest bardzo elastyczna i może się dynamicznie przekształcać w trakcie pełnienia swoich licznych funkcji.
Chromosomy politeniczne uwidocznione za pomocą przeciwciał: czerwone – fosforylowana domena CTD RNA Pol II, zielone - nieufosforylowana domena CTD RNA Pol II. Kolor czerwony kolokalizuje z ’puffami’, w których
Sekwencje regulatorowe w transkrypcji
RNA POL II – promotor i ‘TATA box’
DNA
RNA
Do czego służy regulacja?
‘Włączanie’ i ‘wyłączanie’ genów zależy od
sekwencji DNA i oddziałujących z nimi
Idea działania białek wiążących się do sekwencji
cis-regulatorowych
Operon laktozowy
Prokarionty
Operon tryptofanowy
Promotory
i
Enhancery (wzmacniacze)
Podstawowe elementy bliskiego promotora Pol II
- 10 0 - 5 0 +1 5 0 100
core pro mot e r
C A G A G C A T A T A A G G T G A G G T A G G A T C A G T T G C T C C T C A C C T T
-30 -20 - 1 0 + 1
Sekwencyjny model składania Kompleksu Preinicjacyjnego (PIC) -30 +1 TATA Inr
Polimeryzacja pierwszych kilku
nukleozydotrifosforanów i fosforylacja CTD prowadzą do uwolnienia
promotora. TFIIB, TFIIE i TFIIH dysocjują, PolII+IIF rozpoczyna elongację, a TFIID + TFIIA pozostają na TATA. IIB RNA polimeraza II TFIID
}
TBP TAFs IIB IIE Pol IIa or TBP IIA IIF helicase protein kinase IIH TATA InrIIA Pol IIa IIF IIE
Kompleks preinicjacyjny
TATA Inr
IIA
IIB Pol IIa
IIF IIE
ATP - hydroliza
Kompleks inicjacyjny, DNA na I nukl. stopiony IIH
IIH
= PIC
Activated PIC
TFII A, B, D,E, H, F – Ogólne Czynniki Transkrypcyjne (GTF) TFIID TAFs - TBP Associated Factors CTD
TATA binding protein (TBP) w kompleksie z DNA w rejonie ‘TATA-box’
Elementy cis-regulatorowe w sekwencji
DNA (dalszy promotor, enhancery)
Sekwencje w promotorze Pol II
Motywy sekwencji cis-regulatorowych i czynniki transkrypcyjne (TF) regulujące geny histonów rdzeniowych
Motywy w TF umożliwiające oddziaływania z DNA
-helix
Zinc fingers
Kompleks Mediatora – wielopodjednostkowy kompleks 25
białek, kluczowy podczas aktywacji RNA polimerazy II w
trakcie inicjacji transkrypcji (odkrywca: R. Kornberg)
Lokalizacja Mediatora w stosunku do Ogólnego Aparatu Transkrypcyjnego (OAT) w układzie aktywacji transkrypcji
CTD Pol II Aktywatory
OAT Pol II
Osobny moduł kompleksu Mediatora odpowiedzialny za represję transkrypcji
Lokalizacja Mediatora w stosunku do Ogólnego Aparatu Transkrypcyjnego (OAT) w układzie represji transkrypcji
Mediator przyłączony do Represora (REPR) zawiera moduł SRB 8-11, który uniemożliwia oddziaływanie z Pol II i OAT
Regulacja przez TF działające na kompleks mediatora
Enhancer
Enhancer
y
y
i
i
Silencer
Silencer
y
y
Enhancery stymulują transkrypcję, silencery hamują
transkrypcję .
Jedne i drugie działają niezależnie od orientacji, tj
odwrócenie ich sekwencji nie wpływa na efekt.
Jedne i drugie działają niezależnie od miejsca położenia w
genomie.
– Mogą działać na odległość w stosunku do promotora
– Enhancery wykrywa się nieomal wszędzie
Jedne i drugie stanowią miejsce wiązania dla specyficznie
regulowanych czynników transkrypcyjnych.
Czynniki transkrypcyjne i
Zawartość i liczebność rodzin czynników transkrypcyjnych u
eukariontów
Gen kontrolujący inne geny za pomocą kodowanego
czynnika transkrypcyjnego
Czynniki transkrypcyjne w ogólnej sieci sygnałowej komórki
Białka stanowiące czynniki transkrypcyjne zaznaczono kolorem niebieskim
Oscylacje różnych czynników transkrypcyjncyh w cyklu dobowym .
Mierzono poziom transkryptów poziom 42 TF z trzech rodzin: MYB, bHLH, i bZIP Hanano et al. BMC Genomics 2008 9:182 doi:10.1186/1471-2164-9-182
Obróbka nowozsyntetyzowanego (prekursorowego)
mRNA
Czapeczka “Cap”
jest dodawana na 5’ końcu
mRNA
Introny są usuwane
Funkcje ‘CAP’
5' cap pełni 4 główne funkcje:
Reguluje eksport z jądra.
Zapobiega degradacji przez egzonukleazy. Promuje translację.
Promuje wycinanie sąsiadującego z końcem 5’ intronu.
Eksport RNA z jądra jest regulowany przez Cap Binding Complex (CBC),
który przyłącza się wyłącznie do RENA z ‘CAP’. CBC jest następnie rozpoznawany przez Kompleks Poru Jądrowego i eksportowany.
Zapobieganie degradacji 5‘ końca przez egzonuklelazy polega na upodobnieniu tego
końca funkcjonalnie do końca 3'. Wydłuża to okres pół-trwania mRNA, co jest niezbędne u eukariontów ze względu na długi czas potrzebny na eksport mRNA z jądra.
Podczas aktywnej translacji do ‘CAP’ wiąże się czynnik inicjacji translacji eIF-4E,
który następnie przyłącza czynnik eIF-4G i w następstwie, rybosom.
Usunięcie ‘CAP’ z mRNA jest katalizowane przez kompleks białkowy (Decapping
complex) zawierający czynniki dcp1 i dcp2, które konkurują z eIF-4E o wiązanie z ‘CAP’.
Mechanizm promowania przez ‘CAP’ wycinania sąsiadującego z 5' końcem intronu
Introny
U prokariontów geny są ciągłe, tj.
kolinearne z ich mRNA.
U wyższych eukariontów geny są
nieciągłe, tj. niekolinearne z ich mRNA.
Części genu ulegające ekspresji noszą
nazwę eksonów, zaś sekwencje
przedzielające eksony – intronów.
Precyzyjne usuwanie intronów
Sekwencje konsensusowe oskrzydalające
miejca:
5’ donorowe i 3’ akceptorowe
nnnnnnG//
GU
n---nnAnn---
AG
//Gnnnnn
Current Drug Discovery Nov. 2004, page 15
W każdej chwili w jądrze komórki ludzkiej odbywa się średnio 63,000
Genom ludzki zawiera 22 tysiące genów, ale koduje
ponad 100 tysięcy białek
• Przyczyna?
• Alternatywny splicing prekursorów
I
GU AGII
GU AGIII
I
II
III
mRNA 1I
III
mRNA 2Alternatywny splicing pre-mRNA
Z jednego genu powstają dwa mRNA kodujące dwa różne białka
Terminacja – dodawanie poliA
NMD- Nonsense-Mediated Decay
System degradacji nieprawidłowych mRNA, zawierających PTC (Premature Terminantion Codon) - przedwczesne kodony terminacyjne translacji
Ścieżka NMD wywiera bezpośredni wpływ na setki zaburzeń genetycznych w populacji ludzkiej. ¼ wszystkich znanych mutacji u człowieka
Świat małych RNA
Czym są małe RNA?
•Małe RNA to populacja cząsteczek RNA o
długości 21 to 24 nt, które generalnie powodują wyciszanie genów (gene silencing)
•Małe RNA przyczyniają się do
potranskrypcyjnego wyciszania genów
(post-transcriptional gene silencing-PTGS) poprzez
negatywne działanie na translację lub stabilność mRNA
•Małe RNA przyczyniają się do transkrypcyjnego wyciszania genów (transcriptional gene
silencing-TGS) poprzez epigenetyczne
modyfikacje chromatyny
AAAAA
RNA Pol
Podstawa wyciszania przez RNA
– białka Dicer i Argonaute
Wyciszanie przez RNA
opiera się na dwóch
podstawowych reakcjach:
a) Dwuniciowy RNA (dsRNA) jest rozcinany przez Dicer i jego
homologi na krótkie dwuniciowe
RNA.
b) Te małe RNA asocjują następnie z białkami rodziny ARGONAUTE i powodują wyciszenie.
DICER
AGO
Dicer i białka podobne do Dicer
From MacRae, I.J., Zhou, K., Li, F., Repic, A., Brooks, A.N., Cande, W.., Adams, P.D., and Doudna, J.A. (2006) Structural basis for double-stranded RNA processing by Dicer. Science 311: 195 -198. Reprinted with permission from AAAS. Photo credit: Heidi
Struktura Dicer’a pozwala mu „mierzyć” RNA, który rozcina. Podobnie jak kucharz szatkujący marchewkę, Dicer tnie RNA na równe
fragmenty.
W biogenezie siRNA i miRNA, Dicer lub białka podobne do Dicer (Dicer-like – DCL proteins) rozcinają dsRNA lub RNA ze spinką (hairpin) na fragmenty ~ 21 – 25 nt.
Białka Argonaute
Reprinted by permission from Macmillan Publishers Ltd: EMBO J. Bohmert, K., Camus, I., Bellini, C., Bouchez, D., Caboche, M., and Benning, C. (1998) AGO1 defines a novel locus of Arabidopsis controlling leaf development. EMBO J. 17: 170–180. Copyright 1998; Reprinted from Song, J.-J., Smith, S.K., Hannon, G.J., and Joshua-Tor, L. (2004) Crystal structure of Argonaute and its implications for RISC slicer activity. Science 305: 1434 – 1437. with permission of AAAS.
Białka ARGONAUTE
wiążą małe RNA i ich cele
Mutant Arabidopsis ago1 i ośmiornica Argonauta argo Białka ARGONAUTE
nazwano tak ze względu na wygląd mutanta
Arabidopsis argonaute1 ;
ago1 ma promieniście
rozłożone liście przez co przypomina ośmiornicę o nazwie Argonauta.
Wyciszanie przez RNA – obraz ogólny
DCL MIR gene RNA Pol AAAn AGO AAAn RNA PolMicroRNA
– działa poprzez wyciszanie mRNA i represję translacji mRNA AAAn AGO DCL AGO AAAn AGO RNA Pol AGOsiRNA
- działa poprzez potranskrypcyjne i transkrypcyjne wyciszanie genów AGO AAAnZastosowania technologii małych
RNA
Huang, G., Allen, R., Davis, E.L., Baum, T.J., and Hussey, R.S. (2006) Engineering broad root-knot resistance in transgenic plants by RNAi silencing of a conserved and essential root-knot nematode parasitism gene. Proc. Natl. Acad. Sci. USA 103: 14302–14306. Wyciszanie genów służy do eliminacji alergenów z orzeszków ziemnych. Wyciszanie genów służy do usuwania szkodliwych związków z nasion bawełny, co pozwala na ich zastosowanie jako pokarmu. DNA tworzące siRNA lub miRNA mogą być stabilnie wprowadzane do genomów roślin w celu selektywnego
wyciszenia genów. Kontrola
zainfekowana przez pasożytniczegio nicienia Oporność indukowana RNAi
Rośliny wyrażające dsRNA
odpowiadające wybranym genom nicienia sa odporne na infekcje. Wchlonietę przez nicienia dsRNA indukuje wyciszenie jego genów.
Podsumowanie
Małe RNA biorą udział w regulacji aktywności i ochronie
genomu; specyficzność ich działania wyciszającego opiera się na parowaniu zasad.
Celami dla siRNA sa bogate w sekwencje powtarzalne rejony heterochromatyny, transpozony, wirusy i inne patogeny.
Celami dla miRNAs i tasiRNAs sa geny regulatorowe wpływające za czasowy i przestrzenny wzór rozwoju,