• Nie Znaleziono Wyników

Wstęp do analizy sekwencji

N/A
N/A
Protected

Academic year: 2021

Share "Wstęp do analizy sekwencji"

Copied!
68
0
0

Pełen tekst

(1)

Bioinformatyka

Wykład 2a - analiza sekwencji

(2)

Przyrównanie dwóch sekwencji

Białko

heteropolimer składający się z 20 amiokwasów.

Kody jedniliterowe

A. Alanina B.

C. Cysteina

D. Kwas asparaginowy E. Kwas glutaminowy F. Fenyloalanina

G. Glicyna H. Histydyna I. Izoleucyna J.

K. Lizyna L. Leucyna

N. Asparagina O.

P. Prolina Q. Glutamina R. Arginina S. Seryna T. Treonina U.

V. Walina W. Tryptofan X.

Y. Tyrozyna

(3)

Dwie sekwencje

WCARNDQEGHIQ WAARNGDQEGHIC

Można dopasować w następujący sposób

WCARN-DQEGHIQ WAARNGDQEGHIC

Przyrównanie sekwencji

(4)

Jednak trudniej dopasować do siebie następującą parę sekwencji

Jedno rozwiązanie to

WCARN-DQEGHIQ RYGQDGEHDSRLK

WCARNDQEGHIQ RYGQDGEHDSRLK

Przyrównanie sekwencji

(5)

Czemu?

Odpowiadające sobie aminokwasy są podobne do siebie chemicznie

WCARN-DQEGHIQ RYGQDGEHDSRLK

Przyrównanie sekwencji

(6)

Czemu?

Odpowiadające sobie aminokwasy są podobne do siebie chemicznie

Ale to nie jest najlepsze możliwe dopasowanie - znajdziemy lepsze

WCARN-DQEGHIQ RYGQDGEHDSRLK

Przyrównanie sekwencji

(7)

Macierze podobieństwa aminokwasów

Uzyskane z obserwowanych w naturze częstości mutacji W użyciu są dwie główne rodziny

PAM

BLOSUM

Miary podobieństwa aminokwasów

(8)

Otrzymane z częstości obserwowanych mutacji

# Matrix made by matblas from blosum62.iij

# * column uses minimum score

# BLOSUM Clustered Scoring Matrix in 1/2 Bit Units

# Blocks Database = /data/blocks_5.0/blocks.dat

# Cluster Percentage: >= 62

# Entropy = 0.6979, Expected = -0.5209

( )

( ) ( )

log

2 i j

ij

i j

f A A

M a

f A f A

! "

# $

= # $

% &

Macierze podobieństwa aminokwasów

(9)

A R N D C Q E G H I L K M F P S T W Y V A 4 -1 -2 -2 0 -1 -1 0 -2 -1 -1 -1 -1 -2 -1 1 0 -3 -2 0 R -1 5 0 -2 -3 1 0 -2 0 -3 -2 2 -1 -3 -2 -1 -1 -3 -2 -3 N -2 0 6 1 -3 0 0 0 1 -3 -3 0 -2 -3 -2 1 0 -4 -2 -3 D -2 -2 1 6 -3 0 2 -1 -1 -3 -4 -1 -3 -3 -1 0 -1 -4 -3 -3 C 0 -3 -3 -3 9 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1 Q -1 1 0 0 -3 5 2 -2 0 -3 -2 1 0 -3 -1 0 -1 -2 -1 -2 E -1 0 0 2 -4 2 5 -2 0 -3 -3 1 -2 -3 -1 0 -1 -3 -2 -2 G 0 -2 0 -1 -3 -2 -2 6 -2 -4 -4 -2 -3 -3 -2 0 -2 -2 -3 -3 H -2 0 1 -1 -3 0 0 -2 8 -3 -3 -1 -2 -1 -2 -1 -2 -2 2 -3 I -1 -3 -3 -3 -1 -3 -3 -4 -3 4 2 -3 1 0 -3 -2 -1 -3 -1 3 L -1 -2 -3 -4 -1 -2 -3 -4 -3 2 4 -2 2 0 -3 -2 -1 -2 -1 1 K -1 2 0 -1 -3 1 1 -2 -1 -3 -2 5 -1 -3 -1 0 -1 -3 -2 -2 M -1 -1 -2 -3 -1 0 -2 -3 -2 1 2 -1 5 0 -2 -1 -1 -1 -1 1 F -2 -3 -3 -3 -2 -3 -3 -3 -1 0 0 -3 0 6 -4 -2 -2 1 3 -1 P -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4 7 -1 -1 -4 -3 -2 S 1 -1 1 0 -1 0 0 0 -1 -2 -2 0 -1 -2 -1 4 1 -3 -2 -2 T 0 -1 0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1 1 5 -2 -2 0 W -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1 1 -4 -3 -2 11 2 -3

(10)

R Q E K D N H T S A G Y W F I L V M C P R 5 1 0 2 -2 0 0 -1 -1 -1 -2 -2 -3 -3 -3 -2 -3 -1 -3 -2 Q 1 5 2 1 0 0 0 -1 0 -1 -2 -1 -2 -3 -3 -2 -2 0 -3 -1 E 0 2 5 1 2 0 0 -1 0 -1 -2 -2 -3 -3 -3 -3 -2 -2 -4 -1 K 2 1 1 5 -1 0 -1 -1 0 -1 -2 -2 -3 -3 -3 -2 -2 -1 -3 -1 D -2 0 2 -1 6 1 -1 -1 0 -2 -1 -3 -4 -3 -3 -4 -3 -3 -3 -1 N 0 0 0 0 1 6 1 0 1 -2 0 -2 -4 -3 -3 -3 -3 -2 -3 -2 H 0 0 0 -1 -1 1 8 -2 -1 -2 -2 2 -2 -1 -3 -3 -3 -2 -3 -2 T -1 -1 -1 -1 -1 0 -2 5 1 0 -2 -2 -2 -2 -1 -1 0 -1 -1 -1 S -1 0 0 0 0 1 -1 1 4 1 0 -2 -3 -2 -2 -2 -2 -1 -1 -1 A -1 -1 -1 -1 -2 -2 -2 0 1 4 0 -2 -3 -2 -1 -1 0 -1 0 -1 G -2 -2 -2 -2 -1 0 -2 -2 0 0 6 -3 -2 -3 -4 -4 -3 -3 -3 -2 Y -2 -1 -2 -2 -3 -2 2 -2 -2 -2 -3 7 2 3 -1 -1 -1 -1 -2 -3 W -3 -2 -3 -3 -4 -4 -2 -2 -3 -3 -2 2 11 1 -3 -2 -3 -1 -2 -4 F -3 -3 -3 -3 -3 -3 -1 -2 -2 -2 -3 3 1 6 0 0 -1 0 -2 -4 I -3 -3 -3 -3 -3 -3 -3 -1 -2 -1 -4 -1 -3 0 4 2 3 1 -1 -3 L -2 -2 -3 -2 -4 -3 -3 -1 -2 -1 -4 -1 -2 0 2 4 1 2 -1 -3 V -3 -2 -2 -2 -3 -3 -3 0 -2 0 -3 -1 -3 -1 3 1 4 1 -1 -2 M -1 0 -2 -1 -3 -2 -2 -1 -1 -1 -3 -1 -1 0 1 2 1 5 -1 -2

(11)

A R N D C Q E G H I L K M F P S T W Y V A 2 -2 0 0 -2 0 0 1 -1 -1 -2 -1 -1 -3 1 1 1 -6 -3 0 R -2 6 0 -1 -4 1 -1 -3 2 -2 -3 3 0 -4 0 0 -1 2 -4 -2 N 0 0 2 2 -4 1 1 0 2 -2 -3 1 -2 -3 0 1 0 -4 -2 -2 D 0 -1 2 4 -5 2 3 1 1 -2 -4 0 -3 -6 -1 0 0 -7 -4 -2 C -2 -4 -4 -5 12 -5 -5 -3 -3 -2 -6 -5 -5 -4 -3 0 -2 -8 0 -2 Q 0 1 1 2 -5 4 2 -1 3 -2 -2 1 -1 -5 0 -1 -1 -5 -4 -2 E 0 -1 1 3 -5 2 4 0 1 -2 -3 0 -2 -5 -1 0 0 -7 -4 -2 G 1 -3 0 1 -3 -1 0 5 -2 -3 -4 -2 -3 -5 0 1 0 -7 -5 -1 H -1 2 2 1 -3 3 1 -2 6 -2 -2 0 -2 -2 0 -1 -1 -3 0 -2 I -1 -2 -2 -2 -2 -2 -2 -3 -2 5 2 -2 2 1 -2 -1 0 -5 -1 4 L -2 -3 -3 -4 -6 -2 -3 -4 -2 2 6 -3 4 2 -3 -3 -2 -2 -1 2 K -1 3 1 0 -5 1 0 -2 0 -2 -3 5 0 -5 -1 0 0 -3 -4 -2 M -1 0 -2 -3 -5 -1 -2 -3 -2 2 4 0 6 0 -2 -2 -1 -4 -2 2 F -3 -4 -3 -6 -4 -5 -5 -5 -2 1 2 -5 0 9 -5 -3 -3 0 7 -1 P 1 0 0 -1 -3 0 -1 0 0 -2 -3 -1 -2 -5 6 1 0 -6 -5 -1 S 1 0 1 0 0 -1 0 1 -1 -1 -3 0 -2 -3 1 2 1 -2 -3 -1 T 1 -1 0 0 -2 -1 0 0 -1 0 -2 0 -1 -3 0 1 3 -5 -3 0 W -6 2 -4 -7 -8 -5 -7 -7 -3 -5 -2 -3 -4 0 -6 -2 -5 17 0 -6

(12)

W C A R N D Q E G H I Q W 15 -4 -4 -3 -5 -5 -2 -3 -3 -3 -3 -2 A -4 0 5 -2 -2 -2 -1 -1 0 -2 -2 -1 A -4 0 5 -2 -2 -2 -1 -1 0 -2 -2 -1 R -3 -4 -2 8 -1 -2 1 0 -3 0 -4 1 N -5 -3 -2 -1 8 2 0 0 0 1 -4 0 G -3 -3 0 -3 0 -2 -2 -3 8 -2 -5 -2 D -5 -4 -2 -2 2 8 0 2 -2 -1 -4 0 Q -2 -4 -1 1 0 0 7 2 -2 1 -4 7 E -3 -4 -1 0 0 2 2 7 -3 -1 -4 2 G -3 -3 0 -3 0 -2 -2 -3 8 -2 -5 -2 H -3 -4 -2 0 1 -1 1 -1 -2 11 -4 1 I -3 -2 -2 -4 -4 -4 -4 -4 -5 -4 6 -4

Można przyrównać dwie sekwencje w następujący

sposób:

!

!

WCARN-DQEGHIQ WAARNGDQEGHIC

Przyrównanie sekwencji

(13)

Ale jeśli podobieństwo nie jest oczywiste stosujemy bardziej zaawansowane metody

Przyrównanie sekwencji

(14)

Globalne

Przyrównujemy całe sekwencje - co oznacza, że wymuszamy dopasowanie globalnie dl całych sekwencji - nawet jeśli do siebie słabo pasują.

Lokalne

Przyrównujemy do siebie tylko te fragmenty sekwencji, które naprawdę są do siebie podobne.

Przyrównanie sekwencji

(15)

Jak oszacować jakość dopasowania?

Te dwie sekwencje pasują doskonale WCARNDQEGHIQ

WAARNGDQEGHIC

Przyrównanie sekwencji

(16)

W C A R N D Q E G H I Q W 15 -4 -4 -3 -5 -5 -2 -3 -3 -3 -3 -2 A -4 0 5 -2 -2 -2 -1 -1 0 -2 -2 -1 A -4 0 5 -2 -2 -2 -1 -1 0 -2 -2 -1 R -3 -4 -2 8 -1 -2 1 0 -3 0 -4 1 N -5 -3 -2 -1 8 2 0 0 0 1 -4 0 G -3 -3 0 -3 0 -2 -2 -3 8 -2 -5 -2 D -5 -4 -2 -2 2 8 0 2 -2 -1 -4 0 Q -2 -4 -1 1 0 0 7 2 -2 1 -4 7 E -3 -4 -1 0 0 2 2 7 -3 -1 -4 2 G -3 -3 0 -3 0 -2 -2 -3 8 -2 -5 -2 H -3 -4 -2 0 1 -1 1 -1 -2 11 -4 1 I -3 -2 -2 -4 -4 -4 -4 -4 -5 -4 6 -4 C -4 13 0 -4 -3 -4 -4 -4 -3 -4 -2 -4

WCARN-DQEGHIQ WAARNGDQEGHIC

15 0 5 8 8 -10 8 7 7 8 11 6 -4

15 15 20 28 36 26 34 41 48 56 67 73 69

Przyrównanie sekwencji

Jak oszacować jakość dopasowania?

Te dwie sekwencje pasują doskonale WCARN-DQEGHIQ

WAARNGDQEGHIC

(17)

WCARNDQEGHIQ RYGQDGEHDSRLK

W C A R N D Q E G H I Q R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 Y 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4 G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1 Q -5 -5 0 1 1 2 4 2 -1 3 -2 4 D -7 -5 0 -1 2 4 2 3 1 1 -2 2 G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1 E -7 -5 0 -1 1 3 2 4 0 1 -2 2 H -3 -3 -1 2 2 1 3 1 -2 6 -2 3 D -7 -5 0 -1 2 4 2 3 1 1 -2 2 S -2 0 1 0 1 0 -1 0 1 -1 -1 -1 R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 L -2 -6 -2 -3 -3 -4 -2 -3 -4 -2 2 -2 K -3 -5 -1 3 1 0 1 0 -2 0 -2 1

WCARN-DQEGHIQ RYGQDGEHDSRLK

!

Suma wynosi 11 (kara za przerwę w przyrównaniu is 10)

Przyrównanie sekwencji

(18)

WCARNDQEGHIQ RYGQDGEHDSRLK

WCARN-DQEGHIQ RYGQDGEHDSRLK

Score: 11

WCARNDQEGHIQ

RYGQDGEHDSRLK

Score 22

W C A R N D Q E G H I Q R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 Y 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4 G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1 Q -5 -5 0 1 1 2 4 2 -1 3 -2 4 D -7 -5 0 -1 2 4 2 3 1 1 -2 2 G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1 E -7 -5 0 -1 1 3 2 4 0 1 -2 2 H -3 -3 -1 2 2 1 3 1 -2 6 -2 3 D -7 -5 0 -1 2 4 2 3 1 1 -2 2 S -2 0 1 0 1 0 -1 0 1 -1 -1 -1 R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 L -2 -6 -2 -3 -3 -4 -2 -3 -4 -2 2 -2 K -3 -5 -1 3 1 0 1 0 -2 0 -2 1

Przyrównanie sekwencji

(19)

Przyrównanie pary sekwencji P i Q od długościach odpowiednio M i N.

Zbuduj macierz prostokątną A o wymiarze MxN

• Wypełnij macierz tak, że A[i,j] jest miarą podobieństwa

między i-tym aminokwasem z P i j-tym aminokwasem z Q

• Przetwórz macierz, zaczynając od górnego lewego roku używając wzoru

[ ]

[ ]

[ ]

[ ] [ ]

1,

, max , 1

1, 1 ,

i j GapPenalty

i j i j GapPenalty

i j i j

! − − "

$ $

= % − − &

$ − − + $

' (

A

A A

A A

Algorytm Needlemana-Wunscha

(20)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2

Y 0

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

R 0

L 0

K 0

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

(21)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4

Y 0

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

R 0

L 0

K 0

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

(22)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2

Y 0

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

R 0

L 0

K 0

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

(23)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

Y 0

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

R 0

L 0

K 0

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

(24)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

Y 0 0

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

R 0

L 0

K 0

Y 0 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4

(25)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 Y 0 0 2 -7 -4 4 -4

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

R 0

L 0

K 0

Y 0 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4

(26)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 Y 0 0 2 -7 -4 4 -4 -5 -3 -6 -3 1 -6

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

R 0

L 0

K 0

Y 0 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4

(27)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 Y 0 0 2 -7 -4 4 -4 -5 -3 -6 -3 1 -6 G 0 -7 -3 3 -7 -4 5 -5 -5 2 -8 -6 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

R 0

L 0

K 0

G 0 -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

(28)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 Y 0 0 2 -7 -4 4 -4 -5 -3 -6 -3 1 -6 G 0 -7 -3 3 -7 -4 5 -5 -5 2 -8 -6 0

Q 0 -5 -12 -3 4 -6 -2 9 -1 -6 5 -5 -2

D 0 -7 -10 -12 -4 6 -2 0 12 2 -5 3 -3

G 0

E 0

H 0

D 0

S 0

R 0

L 0

K 0

(29)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 Y 0 0 2 -7 -4 4 -4 -5 -3 -6 -3 1 -6 G 0 -7 -3 3 -7 -4 5 -5 -5 2 -8 -6 0

Q 0 -5 -12 -3 4 -6 -2 9 -1 -6 5 -5 -2

D 0 -7 -10 -12 -4 6 -2 0 12 2 -5 3 -3

G 0 -7 -10 -9 -14 -4 7 -3 2 17 7 -3 2

E 0 -7 -12 -10 -10 -13 -1 9 1 7 18 8 -1 H 0 -3 -10 -13 -8 -8 -11 2 10 0 13 16 11 D 0 -7 -8 -10 -14 -6 -4 -8 5 11 3 11 18

S 0

R 0

L 0

K 0

(30)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 Y 0 0 2 -7 -4 4 -4 -5 -3 -6 -3 1 -6 G 0 -7 -3 3 -7 -4 5 -5 -5 2 -8 -6 0

Q 0 -5 -12 -3 4 -6 -2 9 -1 -6 5 -5 -2

D 0 -7 -10 -12 -4 6 -2 0 12 2 -5 3 -3

G 0 -7 -10 -9 -14 -4 7 -3 2 17 7 -3 2

E 0 -7 -12 -10 -10 -13 -1 9 1 7 18 8 -1 H 0 -3 -10 -13 -8 -8 -11 2 10 0 13 16 11 D 0 -7 -8 -10 -14 -6 -4 -8 5 11 3 11 18 S 0 -2 -7 -7 -10 -13 -6 -5 -5 6 10 2 10

R 0 2 -6 -9 -1 -10 -14 -5 -6 -4 8 8 3

L 0 -2 -4 -8 -11 -4 -14 -15 -8 -10 -2 10 6 K 0 -3 -7 -5 -5 -10 -4 -13 -15 -10 -10 0 11

(31)

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1 Y 0 0 2 -7 -4 4 -4 -5 -3 -6 -3 1 -6 G 0 -7 -3 3 -7 -4 5 -5 -5 2 -8 -6 0

Q 0 -5 -12 -3 4 -6 -2 9 -1 -6 5 -5 -2

D 0 -7 -10 -12 -4 6 -2 0 12 2 -5 3 -3

G 0 -7 -10 -9 -14 -4 7 -3 2 17 7 -3 2

E 0 -7 -12 -10 -10 -13 -1 9 1 7 18 8 -1 H 0 -3 -10 -13 -8 -8 -11 2 10 0 13 16 11 D 0 -7 -8 -10 -14 -6 -4 -8 5 11 3 11 18 S 0 -2 -7 -7 -10 -13 -6 -5 -5 6 10 2 10

R 0 2 -6 -9 -1 -10 -14 -5 -6 -4 8 8 3

L 0 -2 -4 -8 -11 -4 -14 -15 -8 -10 -2 10 6 K 0 -3 -7 -5 -5 -10 -4 -13 -15 -10 -10 0 11

WCARN-DQEGHIQ

WCARNDQEGHIQ

RYGQDGEHDSRLK Punkty 22

(32)

Globalne – algorytm Needlemana Wunscha

Dopasowujemy do siebie całe sekwencje (wymuszamy możliwie najlepsze dopasowanie dla całych sekwencji, nawet jak

dopasowanie jest kiepskie)

Lokalne – algorytm Smitha Watermana

Dopasowujemy do siebie tylko fragmenty które są naprawdę podobne

Przyrównanie sekwencji

(33)

[ ] [ ] [ ]

[ ] [ ]

! "

# #

# #

$ %

# #

# #

& '

0

H i - 1, j - GapPenalty H i, j = max

H i, j - 1 - GapPenalty H i - 1, j - 1 + H i, j

Algorytm Smitha-Watermana dla pary sekwencji P i Q o długościach odpowiednio M i N.

Przyrównanie sekwencji

Zbuduj macierz prostokątną A o wymiarze MxN

• Wypełnij macierz tak, że A[i,j] jest miarą podobieństwa

między i-tym aminokwasem z P i j-tym aminokwasem z Q

• Przetwórz macierz, zaczynając od górnego lewego roku używając wzoru

(34)

W 0 C 0 A 0 R 0 N 0 D 0 Q 0 E 0 G 0 H 0 I 0 Q 0

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

Y 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

Q -5 -5 0 1 1 2 4 2 -1 3 -2 4

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

E -7 -5 0 -1 1 3 2 4 0 1 -2 2

H -3 -3 -1 2 2 1 3 1 -2 6 -2 3

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

S -2 0 1 0 1 0 -1 0 1 -1 -1 -1

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

L -2 -6 -2 -3 -3 -4 -2 -3 -4 -2 2 -2

K -3 -5 -1 3 1 0 1 0 -2 0 -2 1

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2

Y 0

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

(35)

W 0 C 0 A 0 R 0 N 0 D 0 Q 0 E 0 G 0 H 0 I 0 Q 0

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

Y 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

Q -5 -5 0 1 1 2 4 2 -1 3 -2 4

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

E -7 -5 0 -1 1 3 2 4 0 1 -2 2

H -3 -3 -1 2 2 1 3 1 -2 6 -2 3

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

S -2 0 1 0 1 0 -1 0 1 -1 -1 -1

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

L -2 -6 -2 -3 -3 -4 -2 -3 -4 -2 2 -2

K -3 -5 -1 3 1 0 1 0 -2 0 -2 1

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 0 0 6 0 0 1 0 0 2 0 1

Y 0

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

(36)

W 0 C 0 A 0 R 0 N 0 D 0 Q 0 E 0 G 0 H 0 I 0 Q 0

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

Y 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

Q -5 -5 0 1 1 2 4 2 -1 3 -2 4

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

E -7 -5 0 -1 1 3 2 4 0 1 -2 2

H -3 -3 -1 2 2 1 3 1 -2 6 -2 3

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

S -2 0 1 0 1 0 -1 0 1 -1 -1 -1

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

L -2 -6 -2 -3 -3 -4 -2 -3 -4 -2 2 -2

K -3 -5 -1 3 1 0 1 0 -2 0 -2 1

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 0 0 6 0 0 1 0 0 2 0 1

Y 0 0 2 0 0 4 0 0 0 0 0 1 0

G 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

(37)

W 0 C 0 A 0 R 0 N 0 D 0 Q 0 E 0 G 0 H 0 I 0 Q 0

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

Y 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

Q -5 -5 0 1 1 2 4 2 -1 3 -2 4

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

E -7 -5 0 -1 1 3 2 4 0 1 -2 2

H -3 -3 -1 2 2 1 3 1 -2 6 -2 3

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

S -2 0 1 0 1 0 -1 0 1 -1 -1 -1

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

L -2 -6 -2 -3 -3 -4 -2 -3 -4 -2 2 -2

K -3 -5 -1 3 1 0 1 0 -2 0 -2 1

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 0 0 6 0 0 1 0 0 2 0 1

Y 0 0 2 0 0 4 0 0 0 0 0 1 0

G 0 0 0 3 0 0 5 0 0 5 0 0 0

Q 0

D 0

G 0

E 0

H 0

D 0

S 0

(38)

W 0 C 0 A 0 R 0 N 0 D 0 Q 0 E 0 G 0 H 0 I 0 Q 0

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

Y 0 0 -3 -4 -2 -4 -4 -4 -5 0 -1 -4

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

Q -5 -5 0 1 1 2 4 2 -1 3 -2 4

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

G -7 -3 1 -3 0 1 -1 0 5 -2 -3 -1

E -7 -5 0 -1 1 3 2 4 0 1 -2 2

H -3 -3 -1 2 2 1 3 1 -2 6 -2 3

D -7 -5 0 -1 2 4 2 3 1 1 -2 2

S -2 0 1 0 1 0 -1 0 1 -1 -1 -1

R 2 -4 -2 6 0 -1 1 -1 -3 2 -2 1

L -2 -6 -2 -3 -3 -4 -2 -3 -4 -2 2 -2

K -3 -5 -1 3 1 0 1 0 -2 0 -2 1

W C A R N D Q E G H I Q

0 0 0 0 0 0 0 0 0 0 0 0

R 0 2 0 0 6 0 0 1 0 0 2 0 1

Y 0 0 2 0 0 4 0 0 0 0 0 1 0

G 0 0 0 3 0 0 5 0 0 5 0 0 0

Q 0 0 0 0 4 1 2 9 2 0 8 0 4

D 0

G 0

E 0

H 0

D 0

S 0

Cytaty

Powiązane dokumenty

Salwa przypatruje się, w jaki sposób na poszczególnych poziom ach narracji funk­ cjonuje w tych now elach w artościow anie przedstawionych zdarzeń i w

Obiekt typu ContactGroup zawiera atrybut typu kolekcja referencji do obiektów typu Contact (strona wiele do wiele) oraz atrybut typu rerefencja obiektu typu AddressBook (strona

(14) Wykonanie rezerwacji przez obiekt typu Client – 1-y etap public void addReservation(Book book, LocalDate

(np. referencja do obiektu typu Team występuje w obiekcie typu Player jako atrybut oraz kolekcja referencji obiektów typu Player w obiekcie klasy Team jako

pierwsza wiadomość jest synchroniczna, kompletna i posiada return (wywołanie metody obiektu Target przez obiekt przez Source),.. druga wiadomość jest asynchroniczna (wywołanie

Zdanie „p lub q” nazywamy alternatywą zdań p, q i oznaczamy symbolem p ∨ q. Al- ternatywa jest prawdziwa, gdy przynajmniej jedno ze zdań jest prawdziwe... Zdanie „p i q”

Sinus jest funk- cją okresową o okresie podstawowym 2π oraz nieparzystą. Cosinus jest funk- cją okresową o okresie podstawowym 2π

The team working on the project for the publication of the decoration and architecture of the Chapel of Hathor in the Temple of Hatshepsut in Deir el-Bahari completed the most