Modelowanie molekularne
metodami chemii kwantowej
Dr hab. Artur Michalak Zakład Chemii Teoretycznej
Wydział Chemii UJ
http://www.chemia.uj.edu.pl/~michalak/mmod2007/
Wykład 5
•Podstawowe idee i metody chemii kwantowej:
Funkcja falowa, gęstość elektronowa; równanie Schrodingera; Teoria Funkcjonałów Gęstości (DFT); przyblienie Borna-Oppenheimera, zasada wariacyjna w mechanice kwantowej i w DFT, przyblienie jednoelektronowe; metoda HF; korelacja elektronowa; metody korelacyjne oparte na funkcji falowej; metoda Kohna-Shama
• Dane do obliczeń kwantowo-chemicznych; GAMESS:
Geometria czasteczki; macierz Z; bazy funkcyjne
w obliczeniach ab initio ; input/output programu GAMESS
•
Struktura geometryczna układów molekularnych:
Optymalizacja geometrii; optymalizacja z wiazami;
analiza konformacyjna; problem minimum globalnego
• Struktura elektronowa układów molekularnych:
Orbitale molekularne, orbitale KS; wiazanie chemiczne; gęstość rónicowa; orbitale zlokalizowane; analiza populacyjna; analiza rzędów wiązań
• Analiza wibracyjna; Wielkości termodynamiczne; Reaktywność chemiczna:
Analiza wibracyjna; wielkosci termodynamiczne; modelowanie reakcji chemicznych;
optymalizacja geometrii stanu przejściowego, IRC; indeksy reaktywności chemicznej,
molekularny potencjał elektrostatyczny, funkcja Fukui’ego i teoria orbitali granicznych; jedno- i dwu-reagentowe indeksy reaktywności
• Inne zagadnienia:
Metody hybrydowe QM/MM; modelowanie wielkich układów; efety rozpuszczalnika;
modelowanie w katalizie homo- i heterogenicznej; oddziaływania międzycząsteczkowe, i. in.
Przybliżenie adiabatyczne i Borna-Oppenheimera
Punkty charakterystyczne na PES:
-minima odpowiadają geometriom równowagowym (substraty, produkty reakcji chemicznych);
- punkty siodłowe – stany przejściowe (TS) reakcji chemicznych
Ścieżki reakcji chemicznej – krzywe na PES łączące substraty i produkty reakcji poprzez odpowiedni TS
TS TS
Poszukiwanie
minimum
na PES
Analiza konformacyjna
GAMESS - wybór współrzędnych dla optymalizacji
• grupa $CNTRL:
zmienna NZVAR=n, gdzie n=ilość współrzędnych wewnętrznych
– wymusza optymalizację we współrzędnych wewnętrznych:
jeśli COORDS=ZMT, ZMTMPC - współrzędne z $DATA
jeśli COORDS= inne - współrzędne w grupie $ZMAT
Domyślnie: optymalizacja we współrzędnych kartezjańskich (NZVAR=0)
• grupa $CNTRL:
zmienna NZVAR=n, gdzie n=ilość współrzędnych wewnętrznych
– wymusza optymalizację we współrzędnych wewnętrznych:
jeśli COORDS=ZMT, ZMTMPC - współrzędne z $DATA
jeśli COORDS= inne - współrzędne w grupie $ZMAT
Domyślnie: optymalizacja we współrzędnych kartezjańskich
(NZVAR=0)
Analiza konformacyjna n-butanu Analiza konformacyjna n-butanu
RHF/3-21G
0 2 4 6 8 10 12
-180 -150 -120 -90 -60 -30 0 30 60 90 120 150 180 kąt torsyjny
E [ k ca l/ m o l]
CH3
CH3 CH3
CH3 CH3
CH3
CH3 H3C
CH 3 CH 2 ----CH 2 CH 3
Analiza konformacyjna n-butanu Analiza konformacyjna n-butanu
RHF/3-21G
0 2 4 6 8 10 12
-180 -150 -120 -90 -60 -30 0 30 60 90 120 150 180 kąt torsyjny
E [ k ca l/ m o l]
CH3
CH3 CH3
CH3 CH3
CH3
CH3 H3C
CH 3 CH 2 ----CH 2 CH 3
Pełna optymalizacja geometrii dla punktów ‘na zboczach’
doprowazi do znaleziema minimów.
Analiza konformacyjna n-butanu Analiza konformacyjna n-butanu
RHF/3-21G
0 2 4 6 8 10 12
-180 -150 -120 -90 -60 -30 0 30 60 90 120 150 180 kąt torsyjny
E [ k ca l/ m o l]
CH3
CH3 CH3
CH3 CH3
CH3
CH3 H3C
CH 3 CH 2 ----CH 2 CH 3
Wymagana jest optymalizacja z więzami, tj. dla każdej wartosci kata torsyjnego - optymalizacja pozstałych
współrzędnych, poza tym kątem torsyjnym
Optymalizacja geometrii z więzami Optymalizacja geometrii z wi
Optymalizacja geometrii z wi ę ę zami zami
Program GAMESS:
• grupa $CNTRL:
-zmienna NZVAR=n, gdzie n=ilość współrzędnych wewnętrznych – wymusza optymalizację we współrzędnych wewnętrznych
- grupa $STATPT:
Słowo kluczowe IFREEZ(1)=n,m,k....;
gdzie n,m,k numer kolejny elementu macierzy Z
- „zamraża” współrzędne n,m,k, itd..
Program GAMESS – przykładowy input Program GAMESS – przykładowy input
$CONTRL SCFTYP=RHF RUNTYP=OPTIMIZE COORD=ZMT NZVAR=3 $END
$SYSTEM TIMLIM=2 MEMORY=100000 $END
$STATPT OPTTOL=1.0E-5 IFREEZ(1)= 3 $END
$BASIS GBASIS=STO NGAUSS=2 $END
$GUESS GUESS=HUCKEL $END
$DATA
Methylene...1-A-1 state...RHF/STO-2G Cnv 2
C
H 1 rCH
H 1 rCH 2 aHCH rCH=1.09
aHCH=110.0
$END
„zamrożenie” trzeciej z kolei współrzędnej wewnętrznej,
czyli kąta HCH
RHF/3-21G
0 2 4 6 8 10 12
-180 -150 -120 -90 -60 -30 0 30 60 90 120 150 180 kąt torsyjny
E [ k ca l/ m o l]
Wykonanie obliczeń dla szeregu punktów odpowiadającym różnym wartościom wybranego kąta torsyjnego może wymagać zmiany również innych kątów w przygotowanych plikach z danymi. Może to zależeć od kolejności atomów w macierzy Z i wyboru konkretnych współrzędnych
Analiza konformacyjna – wybór macierzy Z
Analiza konformacyjna – wybór macierzy Z
0 1
2
3 180
o60
o-60
oPrzykład:
Przykład: difenyl – obrót wokół wiązania łączącego pierścienie
1 2
3 4
5 6 7
8 10 11 12 9
Założmy że:
- atom 8 zdefiniowany jest względem atomów 7 6 4
- atom 9 – względem 7 6 4
Przykład: difenyl – obrót wokół wiązania łączącego pierścienie
1 2
3 4
5 6 7
8 10 11 12 9
Założmy że:
- atom 8 zdefiniowany jest względem atomów 7 6 4 - atom 9 – względem 7 6 4
wtedy: zmiana kąta 8 7 4 6 o wartość +δ
pociąga za sobą konieczność zmiany kąta 9 7 6 4 również o +δ W przeciwnym wypadku pierścień 7-8-10-12-11-10
zostanie zdeformowany! (atom 9 pozostanie w tej samej pozycji)
Przykład: difenyl – obrót wokół wiązania łączącego pierścienie
1
2 3 5 4
6 7 8
1211 10 9
W tym przypadku pomocna jest zmiana numeracji atomów:
- atom 8 zdefiniowany jest teraz względem atomów 7 4 3 - atom 12 (poprzedni 9) – względem 11 10 9
Zmiana kąta 8 7 4 3 o wartość +δ
Powoduje obrót pierścienia bez jego deformacji oraz bez
konieczności zmian innych kątów.
W przypadku związków acyklicznych również możliwy jest taki wybór macierzy Z, aby obrotu wokół wybranego wiązania dokonywać poprzez zmianę tylko jednego kąta
Aby to osiągnąć należy unikać definicji innych kątów
poprzez wiązanie wokół którego obracamy.
Przykład:
α α α 1 α
2 3
4
5
6 7
8
9
10 11
Obrót dookoła zaznaczonego wiązania możliwy jest poprzez zmianę kąta 9-8-2-1. Jednak przyjęta numeracja atomów
spowoduje, że zmiana kąta 9-8-2-1 pociąga za sobą konieczność
zmiany kątów 10-8-2-1 oraz 11-8-2-1 (o tę samą wartość)
Przykład (cd.):
α α α 1 α
2 3
4 5 6
7
8
9 10
11
Problem przestanie istnieć przy przedstawionej poniżej numeracji atomów, jeśli atom 4 zdefiniowany zostanie np. względem 3,2,1 A atomy 11 i 12 – względem 3, 4, 5.
Wówczas obrotu wokół wiązania 3-2 dokonać można poprzez zmianę wyłącznie kąta 4-3-2-1.
12 13
14
Przykład (cd.):
α α α 1 α
2 3
4 5 6
7
8
9 10
11
UWAGA! Przy identycznej numeracji atomów problem pojawi się jeśli atom 4 zdefiniowany zostanie np. względem 3,2,1
ale atomy 11 i 12 – np. także względem 3, 2, 1 !.
Wówczas obrotu wokół wiązania 3-2 dokonać można poprzez
zmianę kąta 4-3-2-1, ale trzeba zadbać o zmianę kątów 11-3-2-1 i 12-3-2-1.
12 13
14
Podsumowując, dokonując obrotu wokół wybranego wiązania należy dwie grupy atomów, które ono rozdziela (grupa A i grupa B) zdefiniować niezależnie, tj. tak aby tylko jeden atom z grupy B był zdefiniowany z użyciem kąta torsyjnego związanego z obrotem wokół wybranego wiązania.
Grupa A
Grupa B
wiązanie
Analiza konformacyjna Analiza konformacyjna
CH2-X Y-H2C
X-(CH 2 ) n ----(CH 2 ) m Y
CH2-X
Y-H2C
CH2-X
CH2-Y
W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy
nierównocenne konformacje
naprzemianległe
Analiza konformacyjna Analiza konformacyjna
N wiązań daje zatem 3 N konformacji
CH2-X Y-H2C
CH2-X
Y-H2C
CH2-X
CH2-Y
W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy
nierównocenne konformacje
naprzemianległe
Analiza konformacyjna Analiza konformacyjna
N wiązań daje zatem 3 N konformacji
Np. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji
CH2-X Y-H2C
CH2-X
Y-H2C
CH2-X
CH2-Y
W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy
nierównocenne konformacje
naprzemianległe
Analiza konformacyjna Analiza konformacyjna
N wiązań daje zatem 3 N konformacji
Np. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji chlorooktan:
CH2-X Y-H2C
CH2-X
Y-H2C
CH2-X
CH2-Y
W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy
nierównocenne konformacje
naprzemianległe
Analiza konformacyjna Analiza konformacyjna
N wiązań daje zatem 3 N konformacji
Np. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji chlorooktan: 6 wiązań, czyli 729 konformacji (!!!)
CH2-X Y-H2C
CH2-X
Y-H2C
CH2-X
CH2-Y
W ogólnym przypadku obrót wokół każdego wiązania pojedynczego daje trzy
nierównocenne konformacje
naprzemianległe
Analiza konformacyjna Analiza konformacyjna
N wiązań daje zatem 3 N konformacji
Np.. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji chlorooktan: 6 wiązań, czyli 729 konformacji (!!!)
Problem znalezienia minimum globalnego
- optymalizacja geometrii wystartowana z okolic jednego z wielu minimów lokalnych zakończy się
uzyskaniem struktury tego minimum lokalnego Problem znalezienia minimum globalnego
- optymalizacja geometrii wystartowana z okolic jednego z wielu minimów lokalnych zakończy się
uzyskaniem struktury tego minimum lokalnego
Analiza konformacyjna Analiza konformacyjna
N wiązań daje zatem 3 N konformacji
Np. chlorobutan: 2 wiązania, czyli 3 2 =9 konformacji chlorooktan: 6 wiązań, czyli 729 konformacji (!!!)
Problem znalezienia minimum globalnego
- optymalizacja geometrii wystartowana z okolic jednego z wielu minimów lokalnych zakończy się
uzyskaniem struktury tego minimum lokalnego Problem znalezienia minimum globalnego
- optymalizacja geometrii wystartowana z okolic jednego z wielu minimów lokalnych zakończy się
uzyskaniem struktury tego minimum lokalnego
W wielu układach można a priori wyeliminować szereg konformacji, ale często ilość minimów jest tak wielka, że problem jest nierozwiązywalny
W wielu układach można a priori wyeliminować szereg konformacji,
ale często ilość minimów jest tak wielka, że problem jest nierozwiązywalny
Problem minimum globalnego Problem minimum globalnego
Może pojawiać się już dla względnie
małych układów Może pojawiać się
już dla względnie
małych układów
Problem minimum globalnego Problem minimum globalnego
Może pojawiać się już dla względnie małych układów Może pojawiać się już dla względnie małych układów
Przykład:
peptyd opiatowy – enkefalina metioninowa (Met-Enkefalina);
5 aminokwasów
Tyr-Gly-Gly-Phe-Met
łączna liczba atomów: 75
Standardowa molekuła testowa dla modeli struktury białek.
Problem minimum globalnego Problem minimum globalnego
enkefalina metioninowa enkefalina metioninowa
Tyr-Gly-Gly-Phe-Met
N
O O
N
O N
O
N
O N
O
O
S
Problem minimum globalnego Problem minimum globalnego
enkefalina metioninowa enkefalina metioninowa
Tyr-Gly-Gly-Phe-Met
N
O O
N
O N
O
N
O N
O O
1 S
2 3
4 5 6
7
8
9 10
11
12 13
14 15
16
17 19 18
20 21
22
23
Problem minimum globalnego Problem minimum globalnego
enkefalina metioninowa enkefalina metioninowa
Tyr-Gly-Gly-Phe-Met
N
O O
N
O N
O
N
O N
O O
1 S
2 3
4 5 6
7
8
9 10
11
12 13
14 15
16
17 19 18
20 21
22
23
3
23= 94 143 178 827
Problem minimum globalnego Problem minimum globalnego
enkefalina metioninowa enkefalina metioninowa
Tyr-Gly-Gly-Phe-Met
N
O O
N
O N
O
N
O N
O O
1 S
2 3
4 5 6
7
8
9 10
11
12 13
14 15
16
17 19 18
20 21
22
23
3
23= 94 143 178 827
Zakł. 1sek. na konformację
- czas obliczeń:
Problem minimum globalnego Problem minimum globalnego
enkefalina metioninowa enkefalina metioninowa
Tyr-Gly-Gly-Phe-Met
N
O O
N
O N
O
N
O N
O O
1 S
2 3
4 5 6
7
8
9 10
11
12 13
14 15
16
17 19 18
20 21
22
23
3
23= 94 143 178 827
Zakł. 1sek. na konformację
- czas obliczeń: 2985 lat !
0 10 20 30 40 50 60
0-40 51- 60
71- 80
91- 100
111- 120
131- 140
151- 160
171- 180
0 200 400 600 800 1000 1200 1400
0-40 51- 60
71- 80
91- 100
111- 120
131- 140
151- 160
171- 180
Rozkład kątów torsyjnych w konformacjach nisko-energetycznych
E < 1 kcal/mol
E < 3 kcal/mol
3 14 = 4 782 969
3
14= 4 782 969
3 14 = 4 782 969 3
14= 4 782 969
E Populacja (300K) *
Emin (1) 8 %
Emin2 (2) 4%
0-1 kcal/mol 33%
1-2 kcal/mol 67%
E Liczba konformerów
< 1 kcal /mol 11
< 2 kcal/mol 69
< 3 kcal/mol 262
* zał. rozkł Maxwella-Boltzmana, jednakowa entropia
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
τ τ τ τ 1
τ τ τ τ
2
τ τ τ τ
3
τ τ τ τ
4
τ τ τ τ 5
τ τ τ τ
6
τ τ τ τ 7
τ τ τ
τ 1 = 180 o τ
τ τ
τ 2 = 180 o τ
τ τ
τ 3 = 180 o τ
τ τ
τ 4 = 180 o τ τ τ
τ 5 = 180 o τ τ τ
τ 6 = 180 o τ τ τ
τ 7 = 180 o
τ τ τ
τ 1 = 180 o τ τ τ
τ 2 = 180 o τ
τ τ
τ 3 = 180 o τ
τ τ
τ 4 = 180 o τ
τ τ
τ 5 = 180 o τ
τ τ
τ 6 = 180 o τ
τ τ
τ 7 = 180 o + δ δ δ δ
τ τ τ
τ 1 = 180 o τ τ τ
τ 2 = 180 o τ
τ τ
τ 3 = 180 o τ
τ τ
τ 4 = 180 o τ
τ τ
τ 5 = 180 o τ
τ τ
τ 6 = 180 o τ
τ τ
τ 7 = 180 o + 2δ δ δ δ itd.
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
τ τ τ τ 1
τ τ τ τ
2
τ τ τ τ
3
τ τ τ τ
4
τ τ τ τ 5
τ τ τ τ
6
τ τ τ τ 7
τ τ τ
τ 1 = 180 o τ
τ τ
τ 2 = 180 o τ
τ τ
τ 3 = 180 o τ
τ τ
τ 4 = 180 o τ τ τ
τ 5 = 180 o τ τ τ
τ 6 = 180 o + δ δ δ δ τ τ τ
τ 7 = 180 o
τ τ τ
τ 1 = 180 o τ τ τ
τ 2 = 180 o τ
τ τ
τ 3 = 180 o τ
τ τ
τ 4 = 180 o τ
τ τ
τ 5 = 180 o τ
τ τ
τ 6 = 180 o + δ δ δ δ τ
τ τ
τ 7 = 180 o + δ δ δ δ
τ τ τ
τ 1 = 180 o τ τ τ
τ 2 = 180 o τ
τ τ
τ 3 = 180 o τ
τ τ
τ 4 = 180 o τ
τ τ
τ 5 = 180 o τ
τ τ
τ 6 = 180 o + δ δ δ δ τ
τ τ
τ 7 = 180 o + 2δ δ δ δ
itd..
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
τ τ τ τ 1
τ τ τ τ
2
τ τ τ τ
3
τ τ τ τ
4
τ τ τ τ 5
τ τ τ τ
6
τ τ τ
τ 7
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
konformacje niedopuszczalne
np.
tzw. „pentane violation”
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
τ τ τ
τ 1 τ τ τ τ
2 τ τ τ τ
3
τ τ τ τ 1
τ τ τ τ 2
τ τ τ τ
3
δ δ δ
δ = -120 o
180
o60
o-60
o180
o60
o-60
o180
o60
o-60
o180
o60
o-60
o180o
60o -60o 180o
60o -60o 180o
60o-60o 180o
60o -60o 180o
60o-60o 180o
60o -60o 180o
60o-60o 180o
60o -60o 180o
60o -60o
CH 3 CH 2 CH 2 CH 2 CH 2 CH 3
3
3= 27 konf.
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
τ τ τ τ
5
τ τ τ τ
6
τ τ τ τ
7
δ δ δ
δ = -120 o
180
o60
o-60
o180
o60
o-60
o180
o60
o-60
o180
o60
o-60
o180o
60o -60o 180o
60o -60o 180o
60o-60o 180o
60o -60o 180o
60o-60o 180o
60o -60o 180o
60o-60o 180o
60o -60o 180o
60o -60o
τ τ τ τ 1
τ τ τ τ
2
τ τ τ τ
3
τ τ τ τ
4
τ τ τ τ 5
τ τ τ τ
6
τ τ τ τ 7
τ τ τ τ
4
τ τ τ τ
3
τ τ τ τ
2
3
7= 2187 konf.
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
τ τ τ τ
5
τ τ τ τ
6
τ τ τ τ
7
δ δ δ
δ = -120 o
180
o60
o-60
o180
o60
o-60
o180
o60
o-60
o180
o60
o-60
o180o
60o -60o 180o
60o -60o 180o
60o-60o 180o
60o -60o 180o
60o-60o 180o
60o -60o 180o
60o-60o 180o
60o -60o 180o
60o -60o
τ τ τ τ
4
τ τ τ τ
3
τ τ τ τ
2
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
Układy cykliczne: problem z „otwarciem” pierścieni
konieczność sprawdzania spełnienia dodatkowych
więzów
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
• mało efektywne dla dużych układów
• przeszukiwana przestrzeń konformacyjna
ograniczona ze względu na założoną rozdzielczość
• zmiana rozdzielczości przeszukiwania wymaga
powtórnego przejścia przez poprzednio zgenerowane konformacje
• kolejne generowane konformacje nieznacznie różne
Przeszukiwanie systematyczne Przeszukiwanie systematyczne
Punktem wyjścia jest jedno ze znalezionych minimów (wybierana w oparciu o tzw. uniform usage protocol) Sekwencja zmian kątów torsyjnych inna niż w
systematycznym podejściu klasycznym,
np. (0,0,0,0), (120,0,0,0), (120,120,0,0), (120,120,120,0) itd.
Metoda SUMM [Gooman, Still 1991)]
(Systematic unbounded multiple minimum)
Konstrukcja układu z mniejszych fragmentów molekularnych
Konstrukcja układu z mniejszych fragmentów molekularnych
N H
O
O H
N H
Model building approach
Konstrukcja układu z mniejszych fragmentów molekularnych
Konstrukcja układu z mniejszych fragmentów molekularnych
N H
O
O H
N H
O H
N H
O
N H
N
H
Metoda drgań normalnych Metoda drgań normalnych
Low Mode Search (LMS) [Kollosovary, Guida 1996]
Przeszukiwanie w oparciu o analizę drgań normalnych:
systematyczne „przesuniecie” w kierunku
wyznaczonym przez drgania o niskiej częstości, aż do
przejścia przez barierę
Metoda drgań normalnych Metoda drgań normalnych
Low Mode Search [Kollosovary, Guida 1996]
Przeszukiwanie w oparciu o analizę drgań normalnych:
systematyczne „przesuniecie” w kierunku
wyznaczonym przez drgania o niskiej częstości, aż do przejścia przez barierę
Znalezione struktury stanowią punkt wyjścia do dalszych poszukiwań
Przeszukiwana przestrzeń ograniczona poprzez wybór
granicznej częstości
Przeszukiwanie losowe Przeszukiwanie losowe
zmiana losowa
współrzędnych kartezjanskich lub kątów torsyjnych
Random Search
Przeszukiwanie losowe Przeszukiwanie losowe
Wybór struktury startowej do kolejnej iteracji:
• ostatnia wygenerowana konformacja
• losowa wybrana spośród poprzednio uzyskanych
• struktura o najniższej energii spośród poprzednio uzyskanych
Przeszukiwanie losowe Przeszukiwanie losowe
• umożliwia eksplorację różnych obszarów przestrzeni konformacyjnej już w małej liczbie kroków
• możliwe jest powtórne generowanie struktur już przebadanych
• niezdefiniowany koniec przeszukiwania
Dynamika molekularna Dynamika molekularna
Struktury do minimalizacji wybrane z trajektorii MD (500K – 1000K)
E
t
Symulowane wyżarzanie (symulowane schładzanie) Symulowane wyżarzanie (symulowane schładzanie)
Układ równowagowany termicznie w wysokiej temperaturze (MD) i schładzany
Simulated annealing
Symulowane wyżarzanie (symulowane schładzanie) Symulowane wyżarzanie (symulowane schładzanie)
Układ równowagowany termicznie w wysokiej temperaturze (MD) i schładzany
Simulated annealing
Deformacje PES Deformacje PES
metoda równań dyfuzji [Piela, Kostrowicki, Scheraga, 1989]
metoda skalowania odleglości [Piela, Pillardy 1997]
Piela et al. J. Phys. Chem. 1989, 93, 3339
ACGT TGAT
CCTA GTGA
TCTG ATCA
TTCC TAC AC GT TG AC TA CA CT AC GT TG AG TC CT AC
ACGT TGAT
CCTA GTGA
TCTG ATCA
TTCC TAC
TTAGCAT TGACTAC ACTACGT TGAGTCC TAC
Algorytmy genetyczne i ewolucyjne
Algorytmy genetyczne i ewolucyjne
Chromosom ludzki w stadium metafazy
[Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Chromosom ludzki w stadium metafazy
[Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Algorytmy genetyczne Algorytmy genetyczne
Algorytmy poszukiwania oparte na mechanizmach doboru
naturalnego i dziedziczności
D.E. Goldberg, Algorytmy genetyczne i ich zastosowania, WNT, 2003
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne
Algorytmy genetyczne Algorytmy genetyczne
AC GT TG AC TA CA CT AC GT TG AG TC CT AC ACGT TGAT
CCTA GTGA
TCTG ATCA
TTCC TAC AC GT TG AC TA CA CT AC GT TG AG TC CT AC
CCA TTG
ACT ACA
CTA CGT TGA
GTC CTA C GT AC AC TG
CA TA AC CT
TG GT TC AG
AC CT
GT AC AC TG
CA TA AC CT
TG GT TC AG
AC CT
ACGTTGACTACACTACGTTGAGTC CTAC
GC GT TG AC TA CA CT AC GT TG AG TC CT AC
TTAGCAT TGACTAC ACTACGT TGAGTCC TAC
CTTGCTATTGACACTGAAGAAGAAGAA
ACGTTGACTACATTACGTTGAGTCCTAC
Rekombinacja Rekombinacja
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Rekombinacja Rekombinacja
CTTGCTATTGACACTGAAGAAGAAGAA
ACGTTGACTACATTACGTTGAGTCCTAC
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Rekombinacja Rekombinacja
CTTGCTATTGACACTGAAGAAGAAGAA
ACGTTGACTACATTACGTTGAGTCCTAC
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
ACGT TGAC TACA TTACGTTGAGT CCTAC CTTGCT
ATTGAC ACT GAA GAA GAA GAA
Rekombinacja Rekombinacja
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
AC GT TG AC TA CA TTA
CGT TGA
GTC CTA C CTT GCT
ATT GAC
AC TG AA GA AG AA GA A
Rekombinacja Rekombinacja
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
AC GT TG AC TA CA AC TG AA GA AG AA GA A CTT GCT
ATT GAC
TTA CGT
TGA GTC
CTA C
Rekombinacja Rekombinacja
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
AC GT TG AC TA CA AC TG AA GA AG AA GA A CTT GCT
ATT GAC
TTA CGT
TGA GTC
CTA C
Rekombinacja Rekombinacja
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
ACGTT GACTA CA ACTGA AGAAG AAGAA CTTGCTATTGAC
TTACGTTGAGTCCTA C
Rekombinacja Rekombinacja
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Tetrada w stadium profazy I podz. Mejotycznego; X-chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
ACGTTGACTACAACTGAAGAAGAAGAA CTTGCTATTGACTTACGTTGAGTCCTAC
Rekombinacja Rekombinacja
Tetrada w stadium profazy I podz. mejotycznego; X: chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
Tetrada w stadium profazy I podz. mejotycznego; X: chiazmy powstałe na skutek wymiany fragmentów DNA (crossing-over) [Solomon, Berg,Martin, Vilee Biologia, Multico, 1996]
ACGTTGACTACAACTGAAGAAGAAGAA CTTGCTATTGACTTACGTTGAGTCCTAC
Rekombinacja Rekombinacja
chromosomy potomne chromosomy potomne chromosomy macierzyste
chromosomy macierzyste
CTTGCTATTGACACTGAAGAAGAAGAA
ACGTTGACTACATTACGTTGAGTCCTAC
ACGTTGACTACAACTGAAGAAGAAGAA
Mutacja
Mutacja
ACGTTGACTACAA CTGAAGAAGAAGAA
Mutacja
Mutacja
ACGTTGACTACAT CTGAAGAAGAAGAA
Mutacja
Mutacja
ACGTTGACTACAT CTGAAGAAGAAGAA
Mutacja Mutacja
ACGTTGACTACAA CTGAAGAAGAAGAA
chromosom potomny chromosom potomny chromosom macierzysty
chromosom macierzysty
Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Losowanie populacji początkowej (N osobników)
Zakodowanie populacji początkowej - zestaw chromosomów początkowych
Ocena osobników populacji - wartości funkcji przystosowania
Wybór N/2 par
Rekombinacje
→
→
→
→ populacja potomna
Mutacje
Koniec
Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Przykład: analiza konformacyjna dekanu
Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Przykład: analiza konformacyjna dekanu
τ τ τ τ 1
τ τ τ τ
2
τ τ τ τ
3
τ τ τ τ
4
τ τ τ τ 5
τ τ τ τ
6
τ τ τ
τ 7
Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Przykład: analiza konformacyjna dekanu
TTG 348.75
GAA 180.0
...
TTT 354.375
...
28.125 ACC 22.5 ACA 16.875 AAT
AAG 11.25
AAC 5.625
AAA 0.0
Kod Kąt
τ τ τ τ 1
τ τ τ τ
2
τ τ τ τ
3
τ τ τ τ
4
τ τ τ τ 5
τ τ τ τ
6
τ τ τ τ 7
τ 7 τ 6
τ 5 τ 4
τ 3 τ 2
τ 1
TCA GAA
AGC ACG
CGC TTG
AGT
chromosom:
Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Przykład: analiza konformacyjna dekanu
TTG 348.75
GAA 180.0
...
TTT 354.375
...
28.125 ACC 22.5 ACA 16.875 AAT
AAG 11.25
AAC 5.625
AAA 0.0
Kod Kąt
180
o180
o180
o180
o180
o180
o180
oGAA GAA
GAA GAA
GAA GAA
GAA
90
o180
o90
o180
o90
o180
o90
oCAA GAA
CAA GAA
CAA GAA
CAA
populacja: 8 osobników
Chromosomy:
TCCATAGTTACAGATATTCAA ATCCGCCGAACTCTTTTGTAC GGAGCTTTCAGAGATCGTGCT CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT AGGAGAAATGTAACCCGGTAT GCTAGCGTTGACAATTTGACA AGATGATTGGTACAACACTGT
Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Przykład: analiza konformacyjna dekanu
populacja: 8 osobników
Chromosomy:
TCCATAGTTACAGATATTCAA ATCCGCCGAACTCTTTTGTAC GGAGCTTTCAGAGATCGTGCT CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT AGGAGAAATGTAACCCGGTAT GCTAGCGTTGACAATTTGACA AGATGATTGGTACAACACTGT
Funkcja
przystosowania 2.2 * 10
-411.2 * 10
-40.0
10.8 * 10
-43.0 * 10
-40.3 * 10
-40.0
10.4 * 10
-4Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Przykład: analiza konformacyjna dekanu
populacja: 8 osobników
Chromosomy:
TCCATAGTTACAGATATTCAA ATCCGCCGAACTCTTTTGTAC GGAGCTTTCAGAGATCGTGCT CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT AGGAGAAATGTAACCCGGTAT GCTAGCGTTGACAATTTGACA AGATGATTGGTACAACACTGT
Prawdopodobieństwo rekombinacji:
0.060 0.292 0.000 0.286 0.080 0.009 0.000 0.273
Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Przykład: analiza konformacyjna dekanu
populacja: 8 osobników
Chromosomy:
TCCATAGTTACAGATATTCAA ATCCGCCGAACTCTTTTGTAC GGAGCTTTCAGAGATCGTGCT CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT AGGAGAAATGTAACCCGGTAT GCTAGCGTTGACAATTTGACA AGATGATTGGTACAACACTGT
Prawdopodobieństwo rekombinacji:
0.060 0.292 0.000 0.286 0.080 0.009 0.000 0.273
Wybrane pary:
4-5, 2-8, 2-8, 4-8 Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Przykład: analiza konformacyjna dekanu
CGACCATCACTCTTACAGTCG ATATAATCTTCTTACTTCCAT
CGACCATCTTCTTACTTCCAT ATATAATCACTCTTACAGTCG
Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Rekombinacja:
Przykład: analiza konformacyjna dekanu
0,00 5,00 10,00 15,00 20,00
0 5 10 15 20 25 30
Pokolenie
F u n k cj a p rz y st o so w a n ia
0,00 5,00 10,00 15,00 20,00
0 5 10 15 20 25 30
Pokolenie
F u n k cj a p rz y st o so w a n ia
osobnik najlepszy
osobnik najgorszy[* 1 0
4]
Algorytmy genetyczne – jak działają Algorytmy genetyczne – jak działają
Przykład: analiza konformacyjna dekanu
0,00 5,00 10,00 15,00 20,00
0 10 20 30 40 50
Pokolenie
F u n k cj a p rz y st o so w a n ia
0,00 5,00 10,00 15,00 20,00
0 10 20 30 40 50
Pokolenie
F u n k cj a p rz y st o so w a n ia
osobnik najlepszy
osobnik najgorszy[* 1 0
4]
Przykład: analiza konformacyjna dekanu
Algorytmy genetyczne Algorytmy genetyczne
………...
28.125 22.5 16.875
11.25 5.625
0.0 Zmienno- przecinkowa
Reprezentacja chromosomu
ACC ACA AAT AAG AAC AAA Czwórkowa
literowa
011 010 003 002 001 000
Czwórkowa
101
100
011
010
001
000
Binarna
………...
28.125 22.5 16.875
11.25 5.625
0.0 Zmienno- przecinkowa
Reprezentacja chromosomu
ACC ACA AAT AAG AAC AAA Czwórkowa
literowa
011 010 003 002 001 000
Czwórkowa
101 100 011 010 001 000 Binarna
111 110 010 011 001 000 Kod Graya
Algorytmy genetyczne
Algorytmy genetyczne
AC GT TG AC TA CA CT AC GT TG AG TC CT AC
AC GT TG AC TA CA CT AC GT TG AG TC CT AC ACGT TGAT
CCTA GTGA
TCTG ATCA
TTCC TAC GT AC
AC TG CA TA
AC CT TG GT
TC AG AC CT
GT AC AC TG
CA TA AC CT
TG GT AG CT TC
AC
ACGTTGACTACACTACGTTGAGTC GCGT TGAC TACA CTAC GTTG AGTC CTAC CTAC
TTAGCAT TGACTAC ACTACGT TGAGTCC TAC AC GT TG AC TA CA CT AC GT TG AG TC CT AC
Algorytmy genetyczne, a metody „tradycyjne”
Algorytmy genetyczne, a metody „tradycyjne”
Metody „tradycyjne”:
• metody analityczne
• metody enumeratywne
• metody losowe
Metody „tradycyjne”:
• metody analityczne
• metody enumeratywne
• metody losowe
Algorytmy genetyczne:
• nie przetwarzają bezpośrednio parametrów zadania, lecz ich zakodowaną postać
• prowadzą poszukiwania nie z pojedynczego punktu, ale ich populacji
• korzystają jedynie z funkcji celu, a nie jej pochodnych lub innych wielkości
• stosują probabilistyczne, a nie deterministyczne reguły wyboru Algorytmy genetyczne:
• nie przetwarzają bezpośrednio parametrów zadania, lecz ich zakodowaną postać
• prowadzą poszukiwania nie z pojedynczego punktu, ale ich populacji
• korzystają jedynie z funkcji celu, a nie jej pochodnych lub innych wielkości
• stosują probabilistyczne, a nie deterministyczne reguły wyboru
„Algorytm genetyczny jest przykładem procedury używającej wyboru losowego jako „przewodnika” w prowadzeniu wysoce ukierunkowanego poszukiwania w zakodowanej przestrzeni rozwiązań”
„Algorytm genetyczny jest przykładem procedury używającej wyboru losowego jako „przewodnika” w prowadzeniu wysoce ukierunkowanego poszukiwania w zakodowanej przestrzeni rozwiązań”
D.E. Goldberg, Algorytmy genetyczne i ich zastosowania, WNT, 2003
D.E. Goldberg, Algorytmy genetyczne i ich zastosowania, WNT, 2003
0 10 20 30 40 50 60
0-40 51- 60
71- 80
91- 100
111- 120
131- 140
151- 160
171- 180
0 200 400 600 800 1000 1200 1400
0-40 51- 60
71- 80
91- 100
111- 120
131- 140
151- 160
171- 180