• Nie Znaleziono Wyników

tworzenia się natywnej struktury białka według modelu FOD

N/A
N/A
Protected

Academic year: 2022

Share "tworzenia się natywnej struktury białka według modelu FOD"

Copied!
181
0
0

Pełen tekst

(1)

Rola liganda w procesie

tworzenia się natywnej struktury białka według modelu FOD

Katarzyna Prymula

Praca doktorska wykonana

w Zakładzie Bioinformatyki i Telemedycyny Collegium Medicum UJ pod kierunkiem Prof. dr hab. Ireny Roterman-Koniecznej

Kraków 2010

(2)

Mojemu promotorowi Pani Prof. dr hab. Irenie Roterman-Koniecznej składam serdeczne podziękowania za wszelkie starania, które umożliwiły powstanie niniejszej pracy, a szczególnie za zaangażowanie i wyrozumiałość w sprawowaniu opieki naukowej.

Dziękuję Pani Prof. dr hab. Barbarze Oleksyn za podjęcie opieki naukowej z ramienia Wydziału Chemii, dzięki której możliwa była realizacja niniejszych badań.

(3)

Wykaz skrótów i symboli . . . . vi

1. Wstęp . . . . 1

1.1. Fałdowanie się białek in vivo . . . . 2

1.2. Fałdowanie się białek w obecności kofaktorów . . . . 3

1.2.1. Kofaktory nieorganiczne . . . . 4

Miedź . . . . 4

Magnez i wapń . . . . 5

Cynk i kobalt . . . . 5

Klastry żelazowo-siarkowe . . . . 5

1.2.2. Kofaktory organiczne . . . . 6

Mononukleotyd flawinowy . . . . 6

Hem . . . . 6

1.3. Model „Rozmytej Kropli Oliwy” (FOD) . . . . 7

1.3.1. Wczesne etapy fałdowania się białka . . . . 8

1.3.2. Późne etapy fałdowania się białka . . . . 11

Hydrofobowość teoretyczna . . . . 11

Hydrofobowość obserwowana . . . . 12

Rozmiar siatki oraz parametry kropli . . . . 12

Skala hydrofobowości . . . . 13

Procedura symulacji fałdowania się białka . . . . 14

1.3.3. Symulacja fałdowania się białka . . . . 14

Pierwsze symulacje . . . . 14

Symulacje z uwzględnieniem liganda . . . . 16

1.3.4. Nieregularności w rozkładzie różnic hydrofobowości . . . . 18

1.4. Przewidywanie funkcji białka . . . . 20

1.4.1. Definicja funkcji białka . . . . 20

1.4.2. Metody przewidywania miejsc wiążących ligandy w białkach . . . . 21

2. Cele pracy . . . . 23

3. Materiały i metody . . . . 24

3.1. Przygotowanie danych . . . . 25

3.1.1. Białka o długości około 70 reszt aminokwasowych . . . . 25

3.1.2. Białka NBPs . . . . 28

3.1.3. Białka ultraszybko fałdujące się . . . . 29

3.1.4. Miejsca aktywne enzymów . . . . 30

3.1.5. Miejsca wiążące jony metali . . . . 31

3.1.6. Miejsca wiążące ligandy cząsteczkowe . . . . 32

3.1.7. Miejsca wiążące kofaktory . . . . 33

3.1.8. Kieszenie wiążące . . . . 33

3.2. Charakterystyka białek . . . . 33

3.2.1. Polarność reszt aminokwasowych . . . . 33

(4)

Spis treści iii

3.2.2. Struktura drugorzędowa oraz mostki dwusiarczkowe . . . . 34

3.2.3. Powierzchnia dostępna dla rozpuszczalnika . . . . 34

3.2.4. Klasyfikacja domen . . . . 34

3.2.5. Charakterystyka rozmiaru i kształtu białka . . . . 34

3.2.6. Topologia struktury . . . . 35

3.2.7. Profile hydrofobowości . . . . 35

3.2.8. Parametry z teorii informacji . . . . 36

3.2.9. Kontakty białko-białko, białko-kwas nukleinowy, białko-ligand . . . . 37

3.3. Analiza porównawcza białek . . . . 37

3.4. Wpływ parametrów metody FOD na wyniki przewidywania miejsc funkcyjnych . . . . 37

3.4.1. Hydrofobowość teoretyczna . . . . 38

3.4.2. Hydrofobowość obserwowana . . . . 38

3.4.3. Reprezentacja reszty aminokwasowej . . . . 39

3.4.4. Skale hydrofobowości . . . . 39

3.4.5. Testowane warianty modelu FOD . . . . 39

3.5. Przewidywanie miejsc funkcyjnych w białkach . . . . 40

3.5.1. Metody przewidywania miejsc funkcyjnych . . . . 40

CASTp . . . . 40

ConSurf . . . . 41

FOD . . . . 41

PASS . . . . 41

Pocket-Finder . . . . 41

Q-SiteFinder . . . . 42

SuMo . . . . 42

WebFEATURE . . . . 42

3.5.2. Obliczenia na dużą skalę . . . . 42

3.5.3. Wspólna reprezentacja wyników . . . . 43

3.5.4. Wizualizacja wyników . . . . 44

3.6. Ocena przewidywania miejsc funkcyjnych w białkach . . . . 44

3.6.1. Parametry oceny . . . . 44

3.6.2. Krzywe ROC . . . . 45

3.6.3. Perspektywa oceny . . . . 46

3.7. Analiza statystyczna . . . . 46

3.8. Opracowanie graficzne . . . . 46

4. Wyniki . . . . 47

4.1. Białka o długości około 70 reszt aminokwasowych . . . . 47

4.1.1. Charakterystyka białek . . . . 47

4.1.2. Podobieństwo białek . . . . 53

4.1.3. Oddziaływania białko-białko, białko-kwas nukleinowy, białko-ligand . . . . 57

Kontakty białko-białko . . . . 59

Kontakty białko-kwas nukleinowy . . . . 61

Kontakty białko-metal . . . . 63

Kontakty białko-ligand cząsteczkowy . . . . 64

(5)

4.2. Białka NBPs . . . . 65

4.2.1. Charakterystyka struktur . . . . 65

4.2.2. Analiza porównawcza modeli S oraz R . . . . 67

4.2.3. Podobieństwo modeli NBPs do białek naturalnych . . . . 71

4.3. Białka ultraszybko fałdujące się . . . . 73

4.3.1. Charakterystyka białek . . . . 73

4.3.2. Profile ∆ ˜H . . . . 76

4.3.3. Kinetyka fałdowania . . . . 78

4.3.4. Kieszenie . . . . 79

4.4. Miejsca aktywne enzymów . . . . 83

4.4.1. Wstępna walidacja modelu FOD pod względem przewidywania reszt katalitycznych 83 4.4.2. Wpływ parametrów metody FOD na wyniki przewidywania miejsc funkcyjnych . 88 Charakterystyka białek . . . . 88

Hydrofobowość teoretyczna, obserwowana i różnica hydrofobowości . . . . 89

Skale hydrofobowości . . . . 91

Hydrofobowość teoretyczna . . . . 93

Hydrofobowość obserwowana . . . . 94

Normalizacja . . . . 95

Pierwotna wersja modelu FOD . . . . 97

Klasy enzymatyczne . . . . 97

Kryteria stosowalności (a posteriori) . . . . 99

4.5. Miejsca wiążące ligand . . . 101

4.5.1. Miejsca wiążące jony metali . . . 101

4.5.2. Miejsca wiążące ligandy cząsteczkowe . . . 103

4.5.3. Miejsca wiążące kofaktory . . . 104

4.5.4. Kieszenie wiążące . . . 104

4.6. Analiza porównawcza metod do przewidywania miejsc funkcyjnych w białkach . . . 105

4.6.1. Charakterystyka białek . . . 105

4.6.2. Porównanie przewidywań ze zbiorem reszt katalitycznych . . . 106

4.6.3. Ocena trafności przewidywań . . . 110

4.6.4. Podział struktur ze względu na trafność przewidywań . . . 113

4.6.5. Przykłady łańcuchów trudnych . . . 118

Enzym restrykcyjny typu-2 Cfr10l . . . 119

Rybonukleaza H . . . 120

Endo-alfa-sialidaza . . . 121

Arg-gingipaina . . . 122

5. Dyskusja wyników i wnioski . . . 123

5.1. Zależność struktura-profil hydrofobowości . . . 123

5.2. Podobieństwo strukturalne a profile hydrofobowości . . . 124

5.3. Modele białek NBPs . . . 125

5.4. Białka ultraszybko fałdujące się . . . 125

5.5. Zależność funkcja-profil hydrofobowości . . . 126

5.5.1. Miejsca aktywne enzymów . . . 127

(6)

Literatura v

5.5.2. Miejsca wiążące ligandy . . . 128

5.6. Porównanie metod do przewidywania miejsc funkcyjnych w białkach . . . 130

6. Podsumowanie . . . 133

7. Streszczenie . . . 135

8. Summary . . . 137

9. Wytworzone narzędzia . . . 139

9.1. Przypisywanie numerów EC łańcuchom PDB . . . 139

9.2. Wyznaczanie kontaktów białko-ligand . . . 139

9.3. Wyznaczanie profili hydrofobowości według modelu FOD . . . 140

9.4. Analiza profili hydrofobowości . . . 142

9.5. Unifikacja formatów metod przewidywania miejsc funkcyjnych w białkach . . . 142

9.6. Wizualizacja wyników przewidywania miejsc funkcyjnych w białkach . . . 143

9.7. Meta serwis do przewidywania miejsc funkcyjnych w białkach . . . 144

Dodatki . . . 145

Dodatek A: Identyfikatory PDB . . . 145

Dodatek B: Profile ∆ ˜H oraz rozmieszczenie wartości ∆ ˜H w strukturze . . . 147

Dodatek C: Skale hydrofobowości . . . 151

Literatura . . . 153

(7)

Wykaz skrótów i symboli

αHb łańcuch α hemoglobiny

∆ ˜H różnica hydrofobowości, różnica pomiędzy ˜Ht a ˜Ho

hAi asferyczność

H˜o hydrofobowość obserwowana H˜t hydrofobowość teoretyczna

mmec minimalny oczekiwany koszt (ang. Minimal Expected Cost ) r współczynnik korelacji Pearsona

Rg promień obrotu

rS współczynnik korelacji rang Spearmana

AD choroba Alzheimera (ang. Alzheimer’s Disease)

AHSP białko stabilizujące łańcuch α hemoglobiny (ang. α-Hemoglobin Stabilizing Protein) Ala alanina, A

Arg arginina, R

ASA powierzchnia dostępna dla rozpuszczalnika (ang. (Solvent) Accessible Surface Area) Asn asparagina, N

Asp kwas asparaginowy, D ATP adenozynotrifosforan

AUC pole powierzchni pod krzywą ROC (ang. Area Under ROC Curve)

BPTI trzustkowy inhibitor trypsyny wołu (ang. Bovine Pancreatic Trypsin Inhibitor ) CA analiza korespondencji (ang. Correspondence Analysis)

CO rząd kontaktu (ang. Contact Order ) CoA koenzym A

CpA 2’-deoksycytydyno-2’-deoksyadenozyno-3’,5’-monofosforan CSA baza Catalytic Site Atlas

Cys cysteina, C

DNA kwas deoksyrybonukleinowy

EC numer Komisji Enzymatycznej (ang. Enyzme Comission) ES wczesny etap modelu FOD (ang. Early Stage)

FAD dinukleotyd flawinoadeninowy FMN mononukleotyd flawinowy

FN liczba niepoprawnie zidentyfikowanych przykładów negatywnych, błąd II rodzaju (ang.

False Negative)

FOD model „Rozmytej Kropli Oliwy” (ang. Fuzzy Oil Drop model )

FP liczba niepoprawnie zidentyfikowanych przykładów pozytywnych, błąd I rodzaju (ang.

False Positive)

FPR swoistość (ang. False Positive Rate)

(8)

vii

Gln glutamina, Q

Glu kwas glutaminowy, E Gly glicyna, G

GO projekt Gene Ontology

HiPIP wysokopotencjałowe białko żelazowo-siarkowe (ang. High-Potential Iron-Sulfur Protein) His histydyna, H

IgG immunoglobulina G Ile izoleucyna, I

Leu leucyna, L

LS późny etap modelu FOD (ang. Late Stage) Lys lizyna, K

MCC współczynnik korelacji Matthewsa (ang. Matthews Correlation Coefficient ) Met metionina, M

Moco kofaktor molibdenowy

MSA nałożenie wielosekwencyjne (ang. Multiple Sequence Alignment ) MWW test Manna-Whitneya-Wilcoxona

NAC kompleks NAC (ang. Nascent chain-Associated Complex ) NAD dinukleotyd nikotynoamidoadeninowy

NBPs białka nie występujące w organizmach żywych (ang. Never Born Proteins) NEF aktywator wymiany nukleotydów (ang. Nucleotide-Exchange Factor ) NMR jądrowy rezonans magnetyczny (ang. Nuclear Magentic Resonance) NN sieć neuronowa

PD choroba Parkinsona (ang. Parkinson’s Disease) PDB baza Protein Data Bank

PDB ID identyfikator bazy PDB PFD prefoldyna (ang. Prefoldin) Phe fenyloalanina, F

PPV dokładność (ang. Positive Predictive Value) Pro prolina, P

RCO względny rząd kontaktów (ang. Relative Contact Order )

RMSD pierwiastek średniego kwadratowego odchylenia (ang. Root Mean Square Deviation) RNA kwas rybonukleinowy

ROC charakterystyka operacyjna odbiornika (ang. Receiver Operating Characteristics) ROCCH otoczka wypukła krzywej ROC ( ang. ROC Convex Hull )

rRNA rybosomowy RNA

RSA względna powierzchnia dostępna dla rozpuszczalnika (ang. Relative Solvent Accessibility) SE entropia strukturalna

Ser seryna, S

(9)

SO perspektywa w ocenie przewidywania reszt funkcyjnych rozszerzająca zbiór TP do reszt wskazanych wewnątrz sfery miejsca funkcyjnego (ang. Sphere Overlap)

SVM wektorowa maszyna wspierająca

TF czynnik inicjujący (ang. Trigger Factor ) Thr treonina, T

TN liczba poprawnie zidentyfikowanych przykładów negatywnych (ang. True Negatives) TP liczba poprawnie zidentyfikowanych przykładów pozytywnych (ang. True Positives) TPR czułość (ang. True Positive Rate)

Trp tryptofan, W Tyr tyrozyna, Y

UP ID identyfikator bazy UniProtKB Val walina, V

W-E parametr Watermana-Eggerta

(10)

1

1. Wstęp

Poznanie mechanizmów tworzenia się natywnej struktury białek jest jednym z głównych celów badawczych w biochemii. Struktura przestrzenna białka determinuje jego funkcję biolo- giczną, która z kolei warunkuje przebieg procesów biologicznych w organizmach żywych. Zabu- rzenie struktury białka wynikające ze zmiany sekwencji może powodować stany chorobowe, na przykład anemię sierpowatą [1], pląsawicę Huntingtona [2]. Wyróżnia się równocześnie choroby ściśle związane z fałdowaniem się białek i akumulacją nieprawidłowo ufałdowanych struktur, określane mianem chorób konformacyjnych [3], do których zalicza się chorobę Alzheimera (AD), chorobę Parkinsona (PD).

Sprawdzianem postępów w zrozumieniu podstawowych zasad budowy białek są m.in. kon- kursy przewidywania struktury białka na podstawie sekwencji aminokwasowej [4], jak rów- nież badania poświęcone projektowaniu białek o zadanej strukturze czy określonych właści- wościach [5]. Zadania te coraz częściej kończą się sukcesem, lecz nadal w wielu przypadkach stanowią duże wyzwanie [6]. W celu ich rozwiązania formułowane są mniejsze podproblemy takie jak przewidywanie struktury drugorzędowej, rejonów transbłonowych czy nieuporządko- wanych na podstawie sekwencji aminokwasowej. Dodatkowo ważnym wsparciem, szczególnie w projektowaniu białek o zadanych właściwościach, są badania zależności struktura–funkcja [7].

Badania te mają także duże znaczenie w identyfikacji funkcji nowo odkrywanych białek, bada- nych m.in. w ramach projektów genomiki strukturalnej. Fałdowanie się, dynamika strukturalna oraz funkcja biologiczna białka są silnie powiązane w kontekście procesów biologicznych [8].

Aspekty te są także coraz częściej rozpatrywane łącznie na etapie badań [9–11].

Białka spełniają swoją funkcję poprzez oddziaływanie z różnego typu cząsteczkami w tym z makrocząsteczkami, takimi jak inne białka czy kwasy nukleinowe, ze związkami niskoczą- steczkowymi pochodzenia organicznego lub nieorganicznego czy jonami, na przykład metali. W biochemii, cząsteczki bądź jony, które wykazują zdolność wiązania się do biocząsteczek oraz wykazują działanie biologiczne, nazywane są ligandami. W niniejszej pracy termin ligand rozumiany jest zgodnie z tą definicją. Jako że, ujęcie to jest szerokie, dodatkowo rozważania zawężono do grupy związków nie będących pochodzenia białkowego równocześnie wykluczając kwasy nukleinowe.

Na szczególną uwagę w rozważanej grupie ligandów zasługują metale. Jedna trzecia struktur białkowych scharakteryzowanych pod względem struktury zawiera metal, a według przewidy- wań ponad połowa wszystkich białek, należy do grupy metaloprotein [12]. Dlatego też metale w strukturze białka oprócz pełnienia funkcji takich jak stabilizacja struktury (palce cynkowe), transfer elektronów (nitrogenazy), wiązanie, transport tlenu (mioglobina, hemoglobina) czy ka- taliza enzymatyczna mogą również odgrywać ważną rolę w tworzeniu się natywnych struktur białek. Podobną funkcję mogą pełnić kofaktory, związki niskocząsteczkowe, których obecność w białku jest niezbędna do pełnej aktywności biologicznej. Najbardziej śmiała jest jednak hi-

(11)

poteza, że obecność innych związków tj. na przykład substratów, inhibitorów, przekaźników sygnałów czy leków może mieć wpływ na fałdowanie się białek [13, 14].

W niniejszej pracy została poddana weryfikacji hipoteza dotycząca wpływu liganda na proces tworzenia się natywnej struktury białka w ramach autorskiego modelu procesu fałdowania się białka rozwijanego w Zakładzie Bioinformatyki i Telemedycyny Collegium Medicum Uniwersy- tetu Jagiellońskiego. Model ten w dalszej części oznaczany jest skrótem FOD, który pochodzi od pierwszych liter angielskiego terminu Fuzzy Oil Drop, a na język polski tłumaczony jest jako model „Rozmytej Kropli Oliwy”.

W kolejnych rozdziałach oprócz opisu rozwijanego modelu oraz jego założeń zamieszczono przegląd dotyczący aktualnego stanu wiedzy na temat fałdowania się białek in vivo oraz roli liganda w fałdowaniu się białek. Przedstawiono także zagadnienie przewidywania funkcji białka, ze szczególnym uwzględnieniem metod identyfikacji miejsc funkcyjnych, w tym także miejsc wiążących ligand.

1.1. Fałdowanie się białek in vivo

Proces tworzenia się natywnej struktury białka przebiegający in vivo jest bardzo złożony [15, 16]. Rozpoczyna się już na etapie translacji, gdy łańcuch polipeptydowy syntetyzowany jest na rybosomie [17]. Ograniczona przestrzeń kanału wyprowadzającego łańcuch z rybosomu [18, 19], zatłoczone środowisko komórki [20] odciskają swoje piętno na powstającej strukturze już na wczesnych jej etapach. Proces fałdowania się białka w środowisku komórki wspomagany jest przez inne białka, do których należą białka opiekuńcze (chaperony) [21, 22], enzymy [23] oraz inne czynniki obecne w komórce [24–26]. Rozbudowane mechanizmy kontroli struktury białek identyfikują błędnie ufałdowane białka (ang. misfolded ), uruchamiają mechanizmy naprawy struktury, które poddają je rozfałdowaniu (ang. unfolding), aby możliwe było podjęcie próby ponownego ufałdowania (ang. refolding). Alternatywą jest rozpoczęcie procesu degradacji [27, 28]. W procesie fałdowania białek in vivo uczestniczą układy kontrolujące oraz kierujące [29–31], które odpowiedzialne są za kierowanie do właściwych struktur w komórce, w których przebiega naprawa lub obróbka białka, np. modyfikacje reszt aminokwasowych [32].

Białka wspomagane są w procesie fałdowania na rozmaite sposoby. Najbardziej jednak po- wszechne w pełnieniu tych funkcji są chaperony, gdyż biorą one udział w fałdowaniu de novo (pierwotny szlak od momentu syntezy), ponownemu fałdowaniu białek (w przypadku dena- turacji), oligomeryzacji, wewnątrzkomórkowym transporcie oraz wspomaganiu proteolitycznej degradacji białek [33]. Zależnie jednak od domeny ewolucyjnej (Bakterie, Archeowce, Eukarioty) proces wspomagania fałdowania się de novo np. białek cytozolowych przebiegać może według różnych scenariuszy. Na przykład nowo powstające białka bakterii oddziałują z czynnikiem inicjującym (TF), co w przypadku około 70% białek bakteryjnych prowadzi do utworzenia się struktury natywnej, a pozostałe 30% podlega dalszym etapom wspomagania, które są zależne od ATP (aktywator wymiany nukleotydów – NEF, chaperoniny GroEL, GroES). Z kolei u

(12)

1.2 Fałdowanie się białek w obecności kofaktorów 3

archeowców zamiast TF, bezpośrednio na rybosomie działa NAC, a fragmenty łańcucha po- lipeptydowego dodatkowo stabilizowane są przez prefoldynę (PFD). Eukarioty wypracowały więcej ścieżek fałdowania de novo. Tutaj działają układy Hsp70, Hsp90 i chaperoniny w postaci TRiC lub CCT.

Sposób fałdowania się białka zależny jest także od typu białka. Odmiennie proces ten prze- biega w przypadku białek cytozolowych [34], sekrecyjnych [29] i transbłonowych [35]. Podobnie rozmiar białka oraz architektura struktury natywnej determinuje scenariusz fałdowania zarówno pod względem mechanizmów kontroli jak i aspektów kinetycznych oraz termodynamicznych [25].

Kolejnym czynnikiem jest funkcja biologiczna, do której pełnienia wymagane są modyfikacje po- sttranslacyjne, wiązanie kofaktorów czy tworzenie kompleksów w postaci asocjacji podjednostek.

Obecnie możliwa jest obserwacja procesów syntezy białka na rybosomie [18, 36–39] jak rów- nież oddziaływania z chaperonami [40, 41]. Opracowano także metody badania in vivo procesów niekorzystnych w postaci agregacji białek [42, 43]. Badania w całych komórkach możliwe są głów- nie przy wykorzystaniu technik NMR [44] oraz zjawiska fluorescencji i specjalnych znaczników [42, 43]. Pomimo znacznego rozwoju metod służących do badań in vivo ich zastosowanie ma swoje ograniczenia i wiąże się z różnymi trudnościami, dlatego głównym źródłem wiedzy na temat fałdowania się białek są badania in vitro.

1.2. Fałdowanie się białek w obecności kofaktorów

Rozszerzanie repertuaru funkcji biologicznych, w tym także reakcji katalitycznych, reali- zowane jest poprzez wprowadzanie kofaktorów, czyli niebiałkowych związków, które są w strukturze białka niezbędne dla jego pełnej aktywności. Ponad 30% białek występujących w komórkach żywych funkcjonuje z udziałem kofaktorów [45, 46]. Ze względu na trwałość wiąza- nia białko-kofaktor, wyróżnia się grupy prostetyczne połączone z białkiem wiązaniem kowa- lencyjnym oraz koenzymy, w przypadku których połączenie to ma charakter niekowalencyjny.

Kofaktorami mogą być jony metali lub cząsteczki związków organicznych bądź nieorganicznych.

Najlepiej poznaną a zarazem największą grupą białek zawierających kofaktory są enzymy. Białko bez związanego kofaktora nazywane jest apobiałkiem (forma apo), natomiast pełna struktura białka ze związanym kofaktorem to holobiałko (forma holo). Często jednak terminy te używane są w szerszym kontekście, który dotyczy ogólnie obecności ligandów.

Białka fałdują się w środowisku komórki, w którym obecne są m.in. kofaktory w postaci jonów metali lub związane przez białka „dostarczające”. Dodatkowo zaobserwowana zdolność zachowywania oddziaływań pomiędzy kofaktorem a białkiem (nawet gdy nie są to wiązania kowalencyjne) po jego rozfałdowaniu [47–50], wskazuje że kofaktory mogą mieć kontakt z łań- cuchem polipeptydowym przed osiągnięciem struktury natywnej i wpływać na przebieg fał- dowania. Do białek pozostających w kontakcie z kofaktorem po rozfałdowaniu należą m.in.

cytochrom b562 [48, 50], mioglobina [51], azuryna [52], domena CuA [53].

(13)

Struktura rozfałdowanego białka nie jest całkowicie przypadkowa (po rozfałdowaniu in vi- tro; po wyjściu z rybosomu in vivo), pomimo tego że nie zwiera większości elementów struktury drugo- i trzeciorzędowej [54]. Sekwencje aminokwasowe wykazują preferencje do przyjmowania określonych struktur (mimo że podlegają fluktuacjom pod wpływem czynników zewnętrznych).

Podobnie obecność kofaktora może być czynnikiem mającym wpływ na lokalną bądź nielokalną strukturę rozfałdowanego białka, warunkując tym samym powstanie zalążka nukleacji. Ogra- niczenie w ten sposób przestrzeni konformacyjnej może ukierunkowywać, a nawet przyspieszać proces fałdowania. Niewątpliwie obecność kofaktorów w wielu przypadkach ma wpływ na sta- bilność struktury białka [47, 48, 55, 56], natomiast ich rola w procesie fałdowania się białek dopiero zaczyna być poznawana o czym świadczy liczba prac poświęconych tej tematyce jak również opinie autorów [57, 58]. Poniżej zamieszczono doniesienia dotyczące badań wpływu kofaktora na fałdowanie i stabilność białek. Równocześnie zastosowano podział na kofaktory nieorganiczne oraz organiczne, przy czym hem zaliczono do drugiej grupy.

1.2.1. Kofaktory nieorganiczne

Do grupy kofaktorów nieorganicznych należą jony metali oraz centra żelazowo-siarkowe.

Metale są równocześnie najczęściej spotykaną grupą kofaktorów. Badania fałdowania się białek w ich obecności są jednak w fazie początkowej. Dotyczą one głównie jonów miedzi (azuryna, chaperony miedziowe) i wapnia (α-laktoalbumina, rybonukleaza HI, nukleaza A). Można zna- leźć także doniesienia na temat cynku (palce cynkowe, anhydraza węglanowa) oraz kobaltu (anhydraza węglanowa) jednak już w mniejszym wymiarze [59–62].

Miedź

Azuryna jest białkiem miedziowym, pełniącym funkcję transportu elektronów. Struktury azuryny w formach apo i holo są identyczne, przy czym obserwuje się większą stabilność struk- tury po związaniu miedzi [63]. Postuluje się, że stabilizacja ta jest wynikiem obniżenia szybkości rozfałdowania [64]. Wiązanie miedzi przez natywną strukturę azuryny w warunkach in vitro zachodzi samorzutnie, jednak jest to proces 4000 razy wolniejszy niż gdy łańcuch fałduje się w obecności miedzi [64]. Sama obecność miedzi nie ma jednak istotnego wpływu na szybkość fałdowania się tego białka. Nie wyklucza to jednak faktu, że in vivo szybkość powstawania ho- loenzymu ma duże znaczenie dla funkcji, przez co korzystniejszy wydaje się wariant fałdowania w obecności kofaktora.

Ze względu na dużą toksyczność miedzi jej stężenie in vivo utrzymywane jest na bardzo ni- skim poziomie (< 10−18M), który regulują m.in. metalotioneiny i chaperony miedziowe. Badania stabilności chaperonów miedziowych CopZ i Atox1 pokazują, że jest ona większa w przypadku form holo [65]. Niestety nie ma doniesień na temat ich fałdowania. Z kolei peryplazmowe białko CopC (transportujące miedź) zawiera dwa miejsca wiążące miedź, przy czym jedno ma wpływ

(14)

1.2 Fałdowanie się białek w obecności kofaktorów 5

na stabilność i ścieżkę rozfałdowywania, a drugie ma niewielki wpływ na stabilność [66], co może mieć znaczenie w transporcie in vivo.

Magnez i wapń

Struktura rybonukleazy HI jest stabilizowana przez jony dwuwartościowe (magnez, wapń) poprzez obniżenie szybkości rozfałdowywania [55]. Ścieżka fałdowania tego białka jest w mini- malnym stopniu zaburzona przez obecność metalu, który wiąże się w kieszeni w momencie gdy enzym osiąga strukturę natywną [55]. Podobnie stabilizowana jest struktura nukleazy A jest przez jony wapnia [67, 68]. Z kolei w przypadku α-laktoalbuminy nie obserwuje się wpływu na rozfałdowywanie, lecz przyspieszenie refałdowania w obecności wapnia [69, 70]. Jony te mają wpływ na stabilność struktury [71]. W innych badaniach dodatkowo zaobserwowano, że jony metali ziem alkalicznych przyspieszają fałdowanie α-laktoalbuminy, natomiast pozostałe me- tale z wyjątkiem manganu(II) nie mają takiego wpływu [69]. Wprowadzenie wapnia powoduje zmianę struktury miejsca wiążącego oraz zmiany w rejonie oddziaływań międzydomenowych.

Cynk i kobalt

Kofaktory w postaci jonów cynku(II) lub kobaltu(II) indukują refałdowanie anhydrazy wę- glanowej [59].

Rozważając jony cynku, warto też pamiętać o ich szczególnej roli w strukturach palców cynkowych. Wiązanie cynku lub innego metalu przejściowego jest w ich przypadku niezbędne dla prawidłowego przebiegu fałdowania [60, 61]. Indukowanie fałdowania palców cynkowych badano także stosując metody obliczeniowe [62].

Klastry żelazowo-siarkowe

Fałdowanie ferredoksyny zaliczanej do białek żelazowo-siarkowych jest indukowane poprzez wprowadzenie kofaktora [72]. Oddysocjowanie klastrów żelazowo-siarkowych powoduje, że re- fałdowanie jest niemożliwe. Dlatego też sugeruje się, że pod nieobecność klastrów żelazowo- siarkowych białko to jest w stanie osiągnąć struktury natywnej. Podobnie w warunkach in vivo wiązanie klastrów żelazowo-siarkowych może być koniecznym etapem poprzedzającym właściwe fałdowanie [46].

Badania NMR częściowo rozfałdowanej struktury wysokopotencjałowego białka żelazowo- siarkowego (HiPIP) wskazują, że obecność Fe4S4 wprowadza preferencje strukturalne w oto- czeniu kofaktora [73]. Wyniki te nakierowują uwagę na rolę tego typu kofaktorów w tworzeniu miejsc nukleacji. Centra żelazowosiarkowe utrzymują uporządkowanie w warunkach silnie dena- turujących. Pojawiają się także hipotezy mówiące, że tworzenie połączeń Fe-S(Cys) może być

(15)

kluczowym etapem w fałdowaniu się aktywnej formy białka HiPIP również w warunkach in vivo [47].

Niestety nadal mało wiadomo na temat mechanizmów transferu i inkorporacji klastrów żelazowo-siarkowych do struktur białkowych [74].

1.2.2. Kofaktory organiczne

Do grupy kofaktorów organicznych należy wiele witamin, ich pochodnych, związki zawie- rające fragmenty nukleotydowe takie jak NAD, FAD, CoA oraz wiele innych w tym struktura hemu. Ich wpływ na proces fałdowania się białek jest jednak mało poznany. Najwięcej doniesień na ten temat dotyczy mononukleotydu flawinowego (FMN) oraz hemu.

Mononukleotyd flawinowy

Flawodoksyna jest białkiem intensywnie badanym pod względem wiązania mononukleotydu flawinowego (FMN), jego wpływu na stabilność i fałdowanie [57, 75–81]. Struktury apo- i ho- loenzymu są identyczne, pomimo różnicy w dynamice pętli wiążących FMN. Struktura holo flawodoksyny charakteryzuje się większą stabilnością w odniesieniu do formy apo [76, 82, 83], choć znane są także doniesienia, że stabilizacja ta nie jest duża (< 2kJ/mol) [84]. Zbadano także, że wiązanie FMN do struktury natywnej jest szybsze w porównaniu ze strukturą rozfałdowaną, równocześnie sugerując, że wiązanie kofaktora następuje w końcowym etapie fałdowania [26].

Wcześniej jednak stwierdzono, że obecność kofaktora wpływa na kinetykę fałdowania flawodok- syny równocześnie powodując jego przyspieszenie w porównaniu z formą apo [75]. Równocześnie inne doniesienia wyraźnie wskazują, że fałdowanie flawodoksyny jest niezależne od obecności kofaktora, FMN nie działa jako zalążek nukleacji, a rozfałdowanie przebiega po wcześniejszym uwolnieniu FMN i zachodzi dopiero w warunkach silnie denaturujących [57]. Dopiero późniejsze prace badające mutanty w rejonie miejsca wiążącego potwierdzają przyspieszenie refałdowa- nia pod wpływem obecności FMN [78], równocześnie wskazując, że różnice w określeniu roli kofaktora najprawdopodobniej wynikają z budowy badanych łańcuchów polipeptydowych fla- wodoksyny (długi występujący u np. A. vinelandii i krótki pochodzący z np. D. desulfuricans).

Oznacza to, że to samo białko pochodzące z różnych organizmów może mieć różne mechani- zmy fałdowania, a same badania tych procesów są trudne ze względu na brak metod dających bezpośredni wgląd i wymagają ostrożnej interpretacji.

Hem

Różnorodność struktur i funkcji hemoprotein jest ogromna, a wspólnym ich elementem jest obecność hemu [85]. Znaczenie tej grupy białek przekłada się na ogromny wysiłek poświęcony badaniom ekspresji, lokalizacji w komórce z jednej strony, oraz chemii i struktury z drugiej.

Podobnie dobrze poznany jest proces syntezy hemu in vivo. Pomimo to, z wyjątkiem cyto-

(16)

1.3 Model „Rozmytej Kropli Oliwy” (FOD) 7

chromów c mało wiadomo na temat powiązania procesu syntezy hemu i apobiałka, jak również tworzenia kompleksu białko-hem [74]. Różne miejsca syntezy hemu i występowania hemoprotein jak również lipofilowy charakter kofaktora przy rozpuszczalnym białku wskazują na istnienie białek uczestniczących w tworzeniu kompleksów białko-hem.

Połączenie pomiędzy hemem a białkiem w cytochromach typu c jest nietypowe, gdyż oprócz koordynacji żelaza, występuje wiązanie kowalencyjne z grupą winylową. Enzymem odpowie- dzialnym za prawidłowe tworzenie tego połączenia są cytochromowe c hemowe liazy. Poprawne wiązanie kofaktora w przypadku cytochromów c warunkuje prawidłowy przebieg fałdowania.

Nie-natywne połączenia białko-hem wytworzone w trakcie lub przed fałdowaniem dramatycznie zmieniają jego przebieg [86–88]. Intensywne badania w tym kierunku doprowadziły do odkrycia trzech układów charakterystycznych dla różnych organizmów, które służą do składania apocy- tochromu c i hemu [89], co dodatkowo podkreśla znaczenie wytworzenia poprawnego połączenia białko-hem.

Badania dotyczące fałdowania się podjednostek hemoglobiny, inkorporacji hemu oraz asocja- cji podjednostek także wskazują na konieczność obecności dodatkowych czynników w powsta- waniu struktury tego białka [90–92]. Na przykład konieczna jest stabilizacja łańcucha α (αHb) poprzez wiązanie do białka AHSP. Równocześnie białko to zabezpiecza komórkę przed niszczą- cym działaniem aktywnego żelaza, obecnego w strukturze hemu [91]. W kompleksie αHb-AHSP struktura hemu związana jest z łańcuchem α poprzez histydynę dystalną [90]. Cały proces wy- nikający z oddziaływania αHb-AHSP niesie ze sobą duże zmiany konformacyjne w strukturze αHb wiążące się z reorientacją helis.

Powyższe przykłady białek pokazują, że kofaktory mogą być ważnym czynnikiem wpływa- jącym na fałdowanie się białek in vivo. Dodatkowo konieczność inkorporacji do struktury białka zachęca do przyjęcia takiego stanowiska. W przypadkach gdy kofaktor jest nietrwały wpływ taki może odbywać się poprzez oddziaływanie z układami stabilizującym strukturę kofaktora.

Inkorporacja kofaktora może być związana z mechanizmem jego aktywacji, jak jest to sugero- wane w przypadku kofaktora molibdenowego (Moco) [93]. Zatem dodatkowo ważny jest szlak syntezy kofaktora.

W chwili obecnej brak doniesień na temat wpływu obecności innego typu ligandów nisko- cząsteczkowych na fałdowanie się białek.

1.3. Model „Rozmytej Kropli Oliwy” (FOD)

Model FOD w pierwotnej formie został stworzony do przewidywania struktury białka na podstawie sekwencji aminokwasowej. Później rozszerzono jego zastosowanie do przewidywaniu miejsc związanych z funkcją białka m.in. miejsc wiążących ligandy.

Pierwsze prace opisujące założenia modelu dotyczą zależności pomiędzy kątem dwuściennym przy dwóch sąsiadujących płaszczyznach wiązań peptydowych (V) a promieniem krzywizny wyznaczonym dla pięciopeptydowego fragmentu białka (R). Analizy te doprowadziły do wpro-

(17)

wadzenia ograniczonej przestrzeni konformacyjnej w postaci elipsy na mapie Ramachandrana, która to z kolei jest punktem wyjścia dla tzw. wczesnego etapu fałdowania się białek (ES).

Kolejne prace stanowią rozwinięcie oraz poddają analizie koncepcję ograniczenia przestrzeni konformacyjnej łańcucha głównego. Ważnym krokiem w rozwoju modelu FOD jest wprowadze- nie tzw. późnych etapów fałdowania się białek (LS). Kluczowym pojęciem jest tutaj hydrofo- bowość, która stanowi jeden z głównych czynników napędzających proces fałdowania. Pierwsze próby symulacji fałdowania ujawniły, że utworzone struktury pozbawione są kieszeni wiążących ligandy. Doprowadziło to do powstania hipotezy, że obecność liganda może być niezbędna w trakcie symulacji.

Obecnie model FOD jest nadal rozwijany i modyfikowany, ze szczególnym naciskiem na tworzenie się miejsc wiążących w białkach.

1.3.1. Wczesne etapy fałdowania się białka

Głównym założeniem konstruowania struktury białka na wczesnym etapie jest ograniczenie rozważań do przestrzeni konformacyjnej łańcucha głównego, zaniedbując łańcuchy boczne. Od- działywania pomiędzy łańcuchami bocznymi mają znaczenie w późniejszych etapach fałdowania się białka [94–96]. Przestrzeń ta zdefiniowana poprzez zbiór par kątów φ, ψ jest zredukowana do podprzestrzeni przyjmującej formę elipsy na mapie Ramachandrana (Rysunek 1.1A) [97, 98].

Wprowadzenie tego ograniczenia oparte jest na analizie zależności dwóch parametrów geome- trycznych V (kąt dwuścienny dla dwóch sąsiadujących płaszczyzn wiązań peptydowych) i R (promień krzywizny dla pięciopeptydowego fragmentu białka) w strukturach modelowych po- krywających dostępną przestrzeń konformacyjną [99, 100]. Podprzestrzeń eliptyczna zawiera istotne rejony mapy Ramachandrana (helisa prawo- i lewoskrętnej oraz minimum energetycz- nemu C7eq – zgodnie z polem siłowym ECEPP/3 [101–103]), wśród których jest stan pośredni prowadzący do obszaru struktury β. Podprzestrzeń ta jest optymalna z punktu widzenia teorii informacji (ilość informacji związanej z typem reszty aminokwasowej jest zbliżona do informacji potrzebnej do określenia dla niej właściwej konformacji z dokładnością do 10). Podprzestrzeń elipsy podzielona jest na siedem fragmentów, które zostały zdefiniowanego na podstawie ana- lizy reprezentatywnego zbioru struktur zdeponowanych w bazie Protein Data Bank (PDB) [97].

W tym celu dla każdego typu reszty aminokwasowej zostały wyznaczone profile określające częstość występowania danej konformacji opisanej w postaci parametru t, występującego w równaniu parametrycznym elipsy (Rysunek 1.1B). Sposób przejścia od struktury natywnej do podprzestrzeni eliptycznej opisano w dalszej części rozdziału. Porównanie tych histogramów dla dwudziestu typów reszt aminokwasowych ujawniło, że wszystkie profile mają siedem maksimów.

Skłoniło to autorów do podzielenia elipsy na siedem fragmentów, którym przypisano litery A-G interpretowane jako typy struktury w obrębie modelu (Rysunek 1.1C). Nowy alfabet struktu- ralny jest rozszerzeniem standardowo stosowanej klasyfikacji struktur drugorzędowych, gdyż C

(18)

1.3 Model „Rozmytej Kropli Oliwy” (FOD) 9

odpowiada prawoskrętnej helisie α, E, F – strukturze β, G – lewoskrętnej helisie α, natomiast A, B, D – pozostałym, mniej regularnym strukturom.

A B C

Rysunek 1.1. Ograniczona przestrzeń konformacyjna dla wczesnego etapu modelu FOD. Niskoenerge- tyczne obszary zaznaczone w postaci punktów połączone ścieżką eliptyczną (A).

Przykładowe profile rozkładu częstości występowania struktur reszt aminokwasowych opisanych poprzez parametr t (B). t przyjmuje wartości h0, 2π) w parametrycznym równaniu opisującym elipsę:

x(t) = xc+ a· cos(t)cos(φ) − b · sin(t)sin(φ), y(t) = yc+ a· cos(t)sin(φ) + b · sin(t)cos(φ), oraz φ = 3/4π, (xc, yc) = (0, 0).

Podprzestrzeń eliptyczna oraz siedmioliterowy alfabet strukturalny, A-G (C).

Zakłada się, że struktury zawierające się w podprzestrzeni eliptycznej reprezentują tzw.

wczesny etap (ES) w modelu FOD i stanowią punkt startowy do symulacji procesu fałdowania się białka. Strukturę ES można otrzymać dwiema drogami: na podstawie struktury lub na pod- stawie sekwencji (przewidywanie struktury). W pierwszej punktem startowym jest struktura, w której pary kątów φ, ψ zamieniane są na wartości odpowiadające najbliżej położonym punktom na elipsie z przestrzeni konformacyjnej. Na drodze tej struktura ES zostaje otrzymana poprzez częściowe rozfałdowanie struktury natywnej (Rysunek 1.2).

Druga droga opiera się na bardziej złożonym algorytmie [104], w którym punktem startowym jest sekwencja aminokwasowa. W tym celu wykorzystywana jest zależność sekwencja-struktura stworzona dla tetrapeptydów w oparciu o analizę struktur białkowych z bazy PDB [104]. Zależ- ność ta w postaci tabeli kontyngencji zawiera częstości występowania czteroaminokwasowych fragmentów w postaci określonych czteroliterowych sekwencji liter strukturalnych (alfabet zde- finiowany dla struktur ES). W rezultacie dla danego tetrapeptydu określona jest najczęściej spotykana struktura (czteroliterowy kod). Procedura tworzenia tabeli kontyngencji obejmuje utworzenie struktur ES dla reprezentatywnego zbioru struktur natywnych (droga częściowego rozfałdowania), przypisanie aminokwasom liter strukturalnych (siedmioliterowy alfabet), a w dalszym etapie analizę fragmentów czteroaminokwasowych (czteroznakowa ramka odczytu, prze- suwająca się co jeden aminokwas). Zatem sekwencja, dla której tworzona jest struktura ES, odczytywana jest na cztery sposoby (cztery ramki odczytu).

(19)

A

B

Rysunek 1.2. Trzustkowy inhibitor trypsyny wołu. Struktura natywna (po lewej) oraz ES otrzymana na podstawie struktury natywnej (po prawej) (A). Mapy Ramachandrana dla struktury natywnej (po lewej) oraz ES (po prawej) (B). Opracowano na podstawie [97].

Każdej czwórce aminokwasowej z sekwencji przypisywana jest na podstawie tabeli kontyn- gencji najczęściej występująca sekwencja liter strukturalnych. Następnie dla każdego amino- kwasu wybierany jest najbardziej reprezentatywna struktura (ze zbioru czterech elementów;

wyjątek stanowią trzy pierwsze i trzy ostatnie reszty dla których zbiór ten jest mniejszy) (Ry- sunek 1.3). Na przykładzie rybonukleazy A (Rysunek 1.3C) widoczne są różnice na poziomie liter alfabetu strukturalnego dla dwóch dróg otrzymywania struktury ES. Mając przypisane litery strukturalne do aminokwasów sekwencji, odczytywane są optymalne dla nich wartości kątów φ, ψ, czyli wartości odpowiadające maksimum dla danego fragmentu z histogramu danej reszty, przykładowo przedstawionego na Rysunku 1.1B.

Zastosowanie struktur wczesnego pośrednika do symulacji zostało zweryfikowanie na przy- kładzie trzustkowego inhibitora trypsyny wołu (BPTI) [97], hemoglobiny [105], lizozymu [106]

oraz rybonukleazy A [98]. Procedura minimalizacji powoduje optymalizację struktury, jednak nie jest wystarczająca aby uzyskać strukturę natywną. Rozkład reszt hydrofobowych w strukturach ES nie odpowiada ogólnej tendencji wśród białek globularnych, w których reszty niepolarne są głównie schowane we wnętrzu białka, natomiast reszty polarne oraz obdarzone ładunkiem są eksponowane do rozpuszczalnika. Dlatego też po etapie wczesnego pośrednika, konieczny jest kolejny etap, symulujący powstawanie właściwego upakowania reszt w strukturze białka.

(20)

1.3 Model „Rozmytej Kropli Oliwy” (FOD) 11

A

B

C

Rysunek 1.3. Etapy tworzenia struktury ES na przykładzie rybonukleazy A. Sekwencja aminokwa- sowa (A). Cztery ramki odczytu z przypisanymi literami kodu strukturalnego zdefiniowanego dla ES (B).

Porównanie ostatecznego przypisania kodów strukturalnych drogą przewidywania (w oparciu o sekwen- cję) oraz drogą częściowego rozfałdowania (w oparciu o strukturę natywną – 5RAT) (C). Opracowano na podstawie [104].

1.3.2. Późne etapy fałdowania się białka

Punktem startowym dla późnych etapów fałdowania się białka w modelu FOD jest struktura wczesnego pośrednika. Wieloetapowy proces symulacji przyjęty na tym etapie ma na celu mo- delowanie powstawania centrum hydrofobowego. Model ten rozwija koncepcję struktury białka wprowadzoną przez Kauzmanna [107], który wprowadził analogię pomiędzy wnętrzem białka a kroplą oliwy (ang. oil-drop). Według tej koncepcji białka globularne zawierają hydrofobowy rdzeń oraz hydrofilową powierzchnię [108–113].

Ważnym przybliżeniem zaadoptowanym na tym etapie fałdowania jest model siatkowy, w którym przeszukiwana przestrzeń ograniczona jest do węzłów siatki. Ponadto wprowadzona jest uproszczona reprezentacja reszt aminokwasowych w postaci pojedynczych punktów (atomy efektywne).

Hydrofobowość teoretyczna

Idealny rozkład hydrofobowości w białku według modelu FOD reprezentuje trójwymiarowa funkcja Gaussa, równanie (1). Węzły siatki (xj, yj, zj) znajdujące się blisko centrum geome- trycznego białka (¯x, ¯y, ¯z) mają przypisaną najwyższą wartość hydrofobowości ( ˜Ht), podczas gdy punkty znajdujące się w większej odległości, np. przekraczającej odchylenie standardowe σx, σy lub σz w wybranym kierunku mają już znacznie niższe wartości ˜Ht, zawsze większe lub równe zero. ˜Htsum w równaniu (1) pełni funkcję czynnika normalizującego. Parametry σx, σy, σz definiują rozmiary kropli hydrofobowej. Opis procedury do ich wyznaczenia zamieszczono w dalszej części.

(21)

H˜tj = 1 H˜tsumexp

(−(xj− ¯x)2 x2

) exp

(−(yj− ¯y)2 y2

) exp

(−(zj− ¯z)2 2z

)

(1) Dokładny opis dotyczący teoretycznego rozkładu hydrofobowości w białkach, zastosowanego w modelu FOD znajduje się w kilku pracach [114–117].

Hydrofobowość obserwowana

Rzeczywisty rozkład hydrofobowości w białku według modelu FOD opisuje funkcja wzo- rowana na funkcji opracowanej przez Levitta [118], która stanowiła człon odpowiedzialny za oddziaływania łańcuchów bocznych z rozpuszczalnikiem w symulacjach fałdowania się białek.

Hydrofobowość obserwowana ( ˜Ho) obliczana jest dla każdego j-tego węzła siatki w następujący sposób:

H˜oj = 1 H˜osum

N i=1

H˜ir

[

112(7(rijc )2− 9(rcij)4+ 5(rcij)6(rcij)8)] , gdy rij ¬ c

0 , gdy rij > c (2)

H˜ir jest parametrem określającym hydrofobowość i-tej reszty, zależnym od przyjętej skali hy- drofobowości. Węzły, w których nie znajduje się reszta aminokwasowa, mają przypisaną wartość H˜ir = 0. Z kolei rij oznacza odległość pomiędzy węzłami i oraz j. Sumowanie w równaniu (2) przebiega po wszystkich N węzłach siatki, w praktyce jednak obejmuje węzły znajdujące się w odległości mniejszej lub równej wartości parametru c, który wynosi 9˚A (podobnie jak w pracy Levitta [118]) od węzła j. ˜Hosum pełni funkcję czynnika normalizującego.

Rozmiar siatki oraz parametry kropli

Dla struktury startowej białka obliczany jest środek geometryczny (¯x, ¯y, ¯z) przy uwzględ- nieniu atomów ciężkich. Każda reszta aminokwasowa reprezentowana jest przez tzw. atom efektywny, czyli środek geometryczny łańcucha bocznego lub atom Cα w przypadku glicyny.

Cząsteczka białka poddawana jest rotacjom oraz translacjom w trakcie następującej procedury wyznaczania rozmiaru siatki:

1. Dwa najbardziej oddalone atomy efektywne wyznaczają oś z oraz rozmiar białka w tym kierunku.

2. Dwa najbardziej oddalone atomy efektywne w płaszczyźnie prostopadłej do osi znalezionej w punkcie 1. wyznaczają oś x oraz rozmiar białka w tym kierunku.

3. Oś y jest prostopadła do wcześniej wyznaczonych osi z oraz x, a dwa najbardziej oddalone w tym kierunku atomy efektywne wyznaczają rozmiar białka wzdłuż tej osi.

4. Środek geometryczny białka (atomy ciężkie) umieszczony zostaje w początku układu współ- rzędnych.

(22)

1.3 Model „Rozmytej Kropli Oliwy” (FOD) 13

Aminokwas Hydrofobowość

Lys 0.000

Asp 0.108

Glu 0.126

Gln 0.215

Pro 0.233

Asn 0.256

Arg 0.265

Ser 0.314

Thr 0.422

Gly 0.435

Ala 0.552

His 0.655

Tyr 0.655

Met 0.825

Leu 0.834

Trp 0.874

Val 0.892

Ile 0.942

Phe 0.982

Cys 1.000

Tabela 1.1. Skala hydrofobowości otrzy- mana w oparciu o model idealnego rozkładu hydrofobowości ˜Ht, równanie (1). Opraco- wano na podstawie [115].

5. Każdy z wymiarów białka wyznaczonych w punktach 1-3 zwiększany jest o wartość co naj- mniej 2· 9˚A tak aby każda reszta znajdowała się w odległości nie mniejszej niż 9˚A od brzegów siatki (wartość promienia odcięcia wprowadzona w pracy Levitta [118]). W ten sposób wyznaczany jest ostateczny rozmiar siatki (dx, dy, dz).

Trójwymiarowa siatka wypełniona jest węzłami, których gęstość wynosi 5 ˚A. Z kolei para- metry σx, σy, σz, które określają rozmiar kropli, równe są 1/3 długości odpowiednich wymiarów siatki.

Skala hydrofobowości

Na potrzeby symulacji późnych etapów fałdowania białek według modelu FOD została opra- cowana nowa skala hydrofobowości. Skala ta została zoptymalizowana pod kątem prezentowa- nego modelu. W tym celu dla jednodomenowych białek zawierających co najmniej 50 reszt aminokwasowych zostały wyznaczone rozmiary kropli, a następnie obliczone wartości hydrofobo- wości teoretycznych. Obliczenia przeprowadzono wstawiając współrzędne atomów efektywnych (xj, yj, zj) w równaniu (1). W ten sposób resztom aminokwasowym przypisano wartości ˜Ht. Dla każdego typu reszty obliczona została wartość średnia < ˜Ht>, która została przeskalowana na zakres <0, 1>. Tak otrzymaną skalę hydrofobowości w oparciu o model FOD zamieszczono w Tabeli 1.1.

(23)

W literaturze istnieją także inne skale hydrofobowości [110, 119–137], które również mogą mieć zastosowanie w modelu FOD, po uprzednim przeskalowaniu na zakres<0, 1>.

Procedura symulacji fałdowania się białka

Symulacja fałdowania się białka według modelu FOD polega na optymalizacji rozkładu hy- drofobowości przy stopniowo malejącym rozmiarze kropli. Optymalizowany jest parametr ∆ ˜Htot, który jest sumą kwadratów różnic hydrofobowości teoretycznej i obserwowanej dla wszystkich N punktów węzłowych siatki:

∆ ˜Htot=

N j=1

( ˜Htj− ˜Hoj)2 (3)

Zmniejszenie rozmiaru kropli wiąże się z liniowym zmniejszeniem rozmiarów siatki, czyli parametrów σx, σy, σz. Procedura ta przeprowadzana jest w 10 krokach. Każdy krok składa się z dwóch etapów optymalizacji: minimalizacji ∆ ˜Htot, a następnie minimalizacji energii peł- noatomowej reprezentacji białka w polu siłowym ECEPP/3. Docelowy rozmiar siatki określany jest na początku symulacji na podstawie zależności pomiędzy objętością siatki (V = dz· dx· dy) wyznaczonej dla struktur natywnych a długością łańcucha polipeptydowego, równanie (4) oraz stosunku wymiarów siatki dla struktur natywnych, równanie (5). Szczegóły dotyczące wyzna- czenia tych zależności opisane są w literaturze [114].

logV = 3.5671 + 0.7725· logN (4)

dz : dx: dy = 1.00 : 0.85± 0.08 : 0.79 ± 0.09 (5) Proces optymalizacji rozkładu hydrofobowości oraz energii realizowany jest poprzez zastosowa- nie algorytmu Rosenbrocka [138], natomiast procedura ortonormalizacji wektorów kierunków poszukiwań w przebiegu optymalizacji opiera się na algorytmie Grama-Schmidta [139].

1.3.3. Symulacja fałdowania się białka

Model FOD został zweryfikowany poprzez przewidywania struktury przestrzennej białka.

Testy przeprowadzono na kilku przykładach (Tabela 1.2). W procedurach przewidywania struk- tur tych białek można wyróżnić dwa główne etapy: tworzenie struktury wczesnego pośrednika oraz symulację kolapsu hydrofobowego poprzez generowanie struktur późnych pośredników.

Pierwsze symulacje

Pierwszym białkiem, dla którego przeprowadzono symulację fałdowania według modelu, FOD była struktura BPTI [116]. Otrzymane wyniki okazały się bardzo obiecujące, gdyż ogólna topologia przewidzianej struktury podobna jest do struktury natywnej (Rysunek 1.4A). Główne różnice występują w sposobie upakowania reszt (Rysunek 1.4B). Najprawdopodobniej są one spowodowane m.in. nieuwzględnieniem możliwości powstawania wiązań dwusiarczkowych w trakcie symulacji.

(24)

1.3 Model „Rozmytej Kropli Oliwy” (FOD) 15

Nazwa białka Organizm PDB ID Długość Liczba mostków RMSD [˚A]

Literatura łańcucha dwusiarczkowych ES LS

Hipotetyczne białko Thermoplasma

1X9B 53 0 5.66

błonowe acidophilum [117]

BPTI Bos taurus 4PTI 58 3 13.60 10.22 [116]

Lizozym Equus caballus 2EQL 129 4 20.21 17.58 [114]

Rybonukleaza A Bos taurus 5RAT 124 4 32.27 18.07

(14.49) [115]

Hemoglobina: Homo sapiens 3HHB

podjednostka α 141 0 22.49 14.24

(14.83) [140]

podjednostka β 146 0 25.02 15.82

(10.15) [140]

Tabela 1.2. Krótka charakterystyka białek do weryfikacji procedury przewidywania struktury białka według modelu FOD. Wartości RMSD (uwzględniające atomy Cα) w odniesieniu do struktur natywnych dla modeli wczesnego pośrednika (ES), późnego pośrednika (LS). W nawiasie podano wartości RMSD dla struktury otrzymanej w symulacji uwzględniającej obecność liganda.

A

B

Rysunek 1.4. Przewidywanie struktury BPTI. Struktury: startowa (ES), końcowa (LS), natywna – 4PTI (A). Mapy kontaktów dla struktur ES, LS i natywnej przyjmując, że reszty są w kontakcie gdy atomy Cα znajdują się w odległości poniżej 14 ˚A (B). Kolorem czarnym oznaczono kontakty natywne odtworzone w modelach ES i LS, natomiast szarym pozostałe kontakty. Opracowano na podstawie [116].

W przypadku hipotetycznego białko błonowego (TA0354 69 121) nie jest konieczne modelo- wanie mostków dwusiarczkowych i zgodnie z oczekiwaniami wynik przewidywania struktury jest znacznie lepszy (Tabela 1.2). Z kolei lizozym jest białkiem mającym ponad dwa razy dłuższą sekwencję aminokwasową w odniesieniu do białek omówionych powyżej, a jego struktura sta- bilizowana jest przez 4 mostki dwusiarczkowe. Symulacja kolapsu hydrofobowego w przypadku

(25)

lizozymu przybliża do struktury natywnej jednak do niej nie doprowadza. Równocześnie ujawnia dodatkowy czynnik mogący mieć wpływ na jakość przewidywań. Porównanie wartości ∆ ˜H, czyli H˜t− ˜Ho przypisanych poszczególnym resztom aminokwasowym ujawnia różnice w rozkładach hydrofobowości dla struktur LS i natywnej (Rysunek 1.5). Struktura natywna lizozymu ma dobrze określoną kieszeń wiążącą ligand. Dodatkowo reszty tworzące miejsce wiążące charakte- ryzują się wysokimi wartościami hydrofobowości teoretycznej w porównaniu z hydrofobowością obserwowaną, co skutkuje stosunkowo wysokimi wartościami ∆ ˜H (kolor czerwony na Rysunku 1.5). Z kolei struktura LS jest bardziej zwarta, pozbawiona kieszeni wiążącej, a reszty na jej powierzchni wykazują niskie wartości ∆ ˜H (kolor zielony na Rysunku 1.5). Zatem obok mo- delowania mostków dwusiarczkowych, obecność liganda może być czynnikiem, który powinien zostać uwzględniony w trakcie symulacji.

A B

Rysunek 1.5. Struktury lizozymu. Struktura natywna (A). Struktura późnego pośrednika – LS (B).

Skala kolorystyczna czerwony-żółty-zielony odpowiada wartościom ∆ ˜H od największej do najmniejszej.

Struktura liganda (NAG) przedstawiona jest w reprezentacji niebieskich patyczków. Opracowano na podstawie [114].

Symulacje z uwzględnieniem liganda

Symulacja z uwzględnieniem liganda wymaga przygotowania parametryzacji określającej jego hydrofobowość (optymalizacja ∆ ˜Htot), a także ładunki cząstkowe i inne parametry pola siłowego (optymalizacja energii). Obecnie używane narzędzia do modelowania molekularnego umożliwiają przygotowanie parametryzacji dla cząsteczek niebiałkowych, kompatybilnych z da- nym polem siłowym. Większym wyzwaniem jest przypisanie parametrów opisujących hydro- fobowość ( ˜Hr). Obecne podejście w modelu FOD w tym celu korzysta z równania opisują- cego hydrofobowość teoretyczną, równanie (1). Niezbędne są przy tym struktury kompleksów białko-ligand. Cząsteczka liganda dzielona jest na fragmenty, które w trakcie obliczeń reduko- wane są do punktów (centra geometryczne fragmentów), obliczane są wymiary białka (zgodnie z procedurą opisaną w rozdziale 1.3.2) a następnie wartości ˜Ht i w końcu parametry ˜Hr, po- dobnie jak dla reszt aminokwasowych (Tabela 1.1). W literaturze znajdują się parametryzacje dla dwóch ligandów: CpA [115] oraz hemu B [140]. W przypadku CpA parametryzacja opiera

(26)

1.3 Model „Rozmytej Kropli Oliwy” (FOD) 17

się na strukturze rybonukleazy A (PDB ID: 1RPG), natomiast do sparametryzowania hemu B wykorzystano zbiór 1353 struktur kompleksów białko-hem. Wartości parametrów oraz podział ligandów na fragmenty przedstawiono na Rysunku 1.6.

A

CpA

B

Hem B

Fragment liganda Hydrofobowość

CpA E 0.430

CpA D 0.513

CpA A 0.579

CpA C 0.797

CpA B 0.892

Hem A 0.532

Hem D 0.574

Hem C 0.716

Hem Fe 0.726

Hem B 0.763

Rysunek 1.6. Parametryzacja opisująca hydrofobowość przykładowych ligandów. Struktury ligandów (CpA, hem B) oraz ich podział na fragmenty (B). Wartości parametrów opisujących hydrofobowość (B).

Opracowano na podstawie [115, 140].

Symulacja uwzględniająca obecność liganda przebiega według procedury opisanej w roz- dziale 1.3.2, dodatkowo jednak w układzie obecna jest struktura liganda, która w trakcie etapu optymalizacji ∆ ˜Htot reprezentowana jest przez zestaw punktów odpowiadających centrom geo- metrycznym wcześniej zdefiniowanych fragmentów. Posiada ona wtedy sześć stopni swobody w postaci swobodnej rotacji i translacji. Cząsteczka liganda oddziałuje z białkiem zarówno w trakcie optymalizacji rozkładu hydrofobowości (parametryzacja dotycząca hydrofobowości), jak i podczas minimalizacji energii układu (parametryzacja liganda w polu siłowym). W rezultacie ligand w aktywny sposób uczestniczy w symulacji fałdowania według modelu FOD.

Uwzględnienie obecności liganda w symulacji poprawia wyniki przewidywania struktury białka. Widoczne jest to na przykładzie rybonukleazy A, dla której przeprowadzone zostały ob- liczenia zarówno bez jak i w obecności liganda w postaci CpA (Tabela 1.2). Poprawa nastąpiła zarówno pod względem podobieństwa otrzymanego modelu do struktury natywnej (mniejsza wartość RMSD) jak i rozkładu hydrofobowości (Rysunek 1.7). Model LS otrzymany w symula- cji z ligandem zawiera kieszeń wiążącą, ma większą liczbę natywnych kontaktów niż model LS otrzymany bez liganda, nadal jednak różni się pod względem upakowania reszt od struktury natywnej, która stabilizowana jest dodatkowo przez cztery mostki dwusiarczkowe. Monitoro- wanie odległości cystein w trakcie symulacji wykazało jednak, że jest duże prawdopodobień- stwo utworzenia się przynajmniej trzech natywnych mostków dwusiarczkowych (Cys65-Cys72, Cys40-Cys95 oraz Cys26-Cys84) [115].

Kolejne struktury, które poddano symulacji w obecności liganda, nie są stabilizowane przez sieć mostków dwusiarczkowych. Są to podjednostki α i β hemoglobiny [140] – białka globularne

Cytaty

Powiązane dokumenty

Centralny rejestr osób posiadających uprawnienia zawodowe w dziedzinie geodezji i kartografii zawiera miedzy innymi następujące dane:a. Osobom wpisanym do centralnego rejestru

Właściwość miejscową organu administracji publicznej w sprawach dotyczących nieruchomości ustala się:a. według miejsca zamieszkania właściciela nieruchomości,

Musimy umieć sprawnie znajdować miejsca zerowe danej funkcji kwadratowej korzystając ze odpowiednich wzorów.... Funkcja ma dwa

Dokładne przedstawienie sytuacji na miejscu zdarzenia, oraz udokumentowanie wszystkich ujawnionych przedmiotów i śladów, które mogą znajdować się poza granicami

sycznych metafizycznych opozycji4. Wydaje się, że miejscami Vu ar net zbliża się do takiego właśnie rozumienia figury filozofa-artysty: „Filozof-artysta nie jest

Spotkanie zatem zawsze dokonuje się w miejscu, nawet wtedy, kiedy z człowiekiem spotyka się Ten, który jest poza jakimkolwiek miejscem.. Ale przecież spotkania to nie tylko

zarobione wodą dają plastyczny zaczyn łatwo formujący się i wiążący po pewnym czasie.. oraz twardniejący na powietrzu lub

„Powołując się na podobne jak w obozie braterstwo ludzi różnych narodów i wyznań, prosimy współczesnych i potomnych z całego świata, aby nie