BIOINFORMATYKA Kod przedmiotu (USOS) 1120-IN000-MSP-0504

PRZETWARZANIE I ANALIZA DANYCH W JĘZYKU PYTHON Kod przedmiotu (USOS)

BIOINFORMATYKA Kod przedmiotu (USOS) 1120-IN000-MSP-0504

Nazwa przedmiotu w

ję-zyku polskim Bioinformatyka Nazwa przedmiotu w

ję-zyku angielskim Bioinformatics A. Usytuowanie przedmiotu w systemie studiów Poziom kształcenia Studia drugiego stopnia Forma i tryb prowadzenia

studiów Stacjonarne

Kierunek studiów

(dedyko-wany) Informatyka i Systemy Informacyjne

176 Inne kierunki studiów Inżynieria i Analiza Danych Profil studiów Profil ogólnoakademicki

Specjalność -

Jednostka prowadząca Wydział Matematyki i Nauk Informacyjnych Jednostka realizująca Wydział Matematyki i Nauk Informacyjnych Koordynator przedmiotu Dr hab. Dariusz Plewczyński, prof. uczelni

Zakład SPI, D.Plewczynski@mini.pw.edu.pl Osoby prowadzące zajęcia Dr hab. Dariusz Plewczyński, prof. uczelni,

Mgr Michał Własnowolski, Mgr Zofia Parteka, Mgr Michał Kadlof, Dr Michał Łaźniewski

B. Ogólna charakterystyka przedmiotu Blok przedmiotów Kierunkowe

Poziom przedmiotu Średniozaawansowany Grupa przedmiotów Obieralne

Status przedmiotu Obieralny Język prowadzenia zajęć Polski

Semestr nominalny Zimowy (II stopień IAD + Informatyka) Minimalny numer semestru 1 (II stopień)

Usytuowanie realizacji

w roku akademickim Semestr zimowy Wymagania wstępne /

przed-mioty poprzedzające Algorytmy i struktury danych, Statystyka, Bazy danych, Programowanie Limit liczby studentów Liczba grup: bez ograniczeń

Ćwiczenia – 30 osób / grupa Laboratoria – 15 osób / grupa C. Efekty uczenia się i sposób prowadzenia zajęć

Cel przedmiotu Celem wykładów jest wprowadzenie studentów w zaawansowane metody i idee bioinformatyki, chemoinformatyki oraz biologii systemów, ze specjal-nym uwzględnieniem algorytmów informatycznych.

Efekty uczenia się Patrz TABELA 1.

Formy zajęć i ich wymiar

(se-mestralny) Wykład 30

Ćwiczenia 0

Laboratorium 30

Projekt 0

Treści kształcenia Bioinformatyka to interdyscyplinarna dziedzina, której celem jest przetwa-rzanie i analiza danych biologicznych. Obejmuje ona budowę, rozwój i zasto-sowanie metod obliczeniowych, służących do badania struktury, funkcji, ewolucji białek. Ważnym celem bioinformatyki, szczególnie w ostatnich la-tach (w związku z coraz powszechniejszym zastosowaniem w biologii mole-kularnej tzw. technik wysokoprzepustowych) jest rozwój metod wykorzysty-wanych do zarządzania ogromnymi ilościami danych, zawartymi w biologicz-nych i medyczbiologicz-nych bazach dabiologicz-nych, oraz ich eksploracji (ang. data mining).

Wykład obejmie różne biologiczne bazy danych i algorytmy stosowane w bio-informatyce, genetyce, biologii molekularnej i biotechnologii, a także powią-zania między różnymi typami danych. Omówione zostaną podstawowe ope-racje na pojedynczych sekwencjach, jak również ich masowych zbiorach (tagenomika), trójwymiarowych strukturach białek i metabolitów wraz z me-todami umożliwiającymi ich porównywanie, przeszukiwanie baz danych z sekwencjami nukleotydowymi, aminokwasowymi i strukturami białka. Pod-czas wykładu wprowadzimy koncepcję rodzin białkowych, motywy sekwen-cyjne i strukturalne związane z funkcją biologiczną, segregację komórek i se-gregację sygnałów oraz modelowanie na poziomie pojedynczej komórki.

177

Wprowadzimy zaawansowane metody wykrywania podobieństwa między sekwencjami i strukturami oraz oceny zmienności sekwencyjnej i struktural-nej między białkami, metabolitami i kompleksami. Wykład będzie dotyczył teorii baz danych białkowych i metabolicznych, narzędzi wykorzystywanych do wizualizacji, modelowania struktur białkowych i metabolitów, reprezen-tacje struktury biopolimerów, kompleksów białko-metabolit, inhibitor, pro-jektowanie leków i inhibitorów małocząsteczkowych, sieci sygnałowych i metabolicznych białek, typów sieci biologicznych, motywów funkcjonalnych białek, a także analizę danych „omicznych” w powiązaniu z podstawowymi pojęciami w biologii systemów.

Wykładom będą towarzyszyły zajęcia praktyczne, na których studenci mają przeprowadzić proste zadania bioinformatyczne, w tym samodzielnie pro-gramować i przeprowadzać analizę statystyczną. Studenci zaznajomią się z podstawowymi algorytmami bioinformatycznymi, jak również istniejącymi zasobami danych biologicznych. Istotnym celem jest nauczenie studenta przeszukiwania, manipulacji i analizy danych proteomicznych, metabolicz-nych i systemowych. Planujemy wykorzystywanie istniejących narzędzi do budowy uliniowienia sekwencji, przewidywania struktury białek, anotacji funkcjo oraz analizy mikromacierzy, jak również bibliotek języków progra-mowania Python i R do bioinformatycznej analizy danych (w szczególności biologicznych).

Wykład:

1. Wprowadzenie. Formaty i pochodzenie analizowanych danych. Krótki za-rys ich znaczenia biologicznego. Przegląd najważniejszych baz danych.

2. Analiza danych sekwencyjnych - algorytmy porównywania sekwencji, za-stosowanie programowania dynamicznego, ukrytych łańcuchów Mar-kowa, statystyczna ocena dopasowania sekwencji.

3. Algorytmy szybkiego wyszukiwania informacji z sekwencyjnych baz da-nych.

4. Najważniejsze metody do przewidywania struktur trzeciorzędowych i funkcji białek na podstawie sekwencji.

5. Analiza ekspresji genów. Zastosowanie metod rzutowania i wykrywania zmiennych ukrytych do analizy mikromacierzy.

6. Biologia systemowa. Algorytmy przewidywania i badania złożonych od-działywań występujących w systemach biologicznych.

7. Metody eksploracji niesekwencyjnych baz danych, w tym danych biblio-graficznych, klinicznych, struktur molekularnych czy ścieżek metabolicz-nych i oddziaływań pomiędzy cząsteczkami biologicznymi.

8. Wykorzystanie języków programowania do omawianych wcześniej zagad-nień (Python/R).

Laboratorium:

1. Wprowadzenie do biologicznych baz danych.

178

2. Wprowadzenie do języka programowania Python.

3. Budowa uliniowień sekwencji aminokwasowych i nukleotydowych z uży-ciem biblioteki BioPython.

4. Testowanie wybranego algorytmu szybkiego wyszukiwania informacji z sekwencyjnych baz danych z użyciem biblioteki BioPython.

5. Zastosowanie metod klasyfikacji biomolekuł opartych na estymacji rozkła-dów prawdopodobieństwa oraz niesparametryzowanego odtwarzania ewolucji molekularnej.

6. Budowa modeli struktur trzeciorzędowych białek na podstawie sekwencji, wizualizacja struktury trzeciorzędowej w PyMol i/lub Chimera.

7. Wprowadzenie do środowiska R i/lub python.

8. Analiza ekspresji genów. Analizy mikromacierzy z zastosowaniem biblio-tek dostępnych w R i/lub python.

9. Metody eksploracji niesekwencyjnych baz danych, w tym danych biblio-graficznych, klinicznych, struktur molekularnych czy ścieżek metabolicz-nych i oddziaływań pomiędzy cząsteczkami biologicznymi.

10. Dokowanie molekularne (AutoDock vina) - algorytm genetyczny, jego im-plementacja i wykorzystanie z wizualizacją w Chimerze.

Metody dydaktyczne Wykład:

Wykład informacyjny Laboratorium:

Samodzielne rozwiązywanie zadań – projektów informatycznych Metody i kryteria oceniania /

regulamin zaliczenia Zaliczenie opiera się na stworzeniu w ciągu semestru czterech programów bioinformatycznych związanych z wykładem, każdy program wraz z jego opi-sem to maksymalnie 10 punktów. Aby zaliczyć przedmiot należy uzyskać co najmniej 20 punktów. Ocena dobra (4) to 30 punktów lub więcej, ocena bar-dzo dobra (5) to 38 punktów lub więcej. Student może poprawić ocenę koń-cową poprzez opcjonalną odpowiedź ustną.

Metody sprawdzania

efek-tów uczenia się Patrz TABELA 1.

Egzamin Nie

Literatura i oprogramowanie 1. S. Hartmann, J. Selbig, Introductory Bioinformatics, Fourth Edition, 2013 2. J. Pevsner, Bioinformatics and Functional Genomics, Second Edition, 2009 3. J.T.L. Wang, et al., Data Mining in Bioinformatics, Springer, 2010

4. G. Alterovitz, M. Ramoni, Knowledge-Based Bioinformatics: From analysis to interpretation, Wiley, 2010

5. Branden, Carl Ivar, and John Tooze. Introduction to protein structure. Gar-land Science, 2012.

6. Attwood Teresa K., Higgs Paul G., Bioinformatics and Molecular Evolution, Wiley-Blackwell; 1 edition (April 30, 2013)

Witryna www przedmiotu D. Nakład pracy studenta Liczba punktów ECTS 4 E. Informacje dodatkowe

179

Uwagi -

TABELA 1. EFEKTY PRZEDMIOTOWE

1. Efekty uczenia się i ich odniesienie do charakterystyk drugiego stopnia Polskiej Ramy Kwalifikacji oraz efektów uczenia się dla kierunków Informatyka i Systemy Informacyjne, Matematyka oraz Inżynieria i Ana-liza Danych

Efekty ucze-nia się dla

modułu

OPIS EFEKTÓW UCZENIA SIĘ Absolwent studiów I/II stopnia na kierunku Informatyka i Systemy Informacyjne / Matematyka /

Inżynieria i Analiza Danych

Odniesienie

W01 Zna metody komputerowe wykorzystywane do zarządza-nia ogromnymi ilościami danych, zawartymi w biologicz-nych i medyczbiologicz-nych bazach dabiologicz-nych oraz algorytmy bioin-formatyczne wykorzystywane do przeszukiwania, eksplo-racji i klasyfikacji tak przechowywanych danych

I.P7S_WG SI_W11, CC_W11

W02 Zna algorytmy przewidywania i badania złożonych od-działywań występujących w systemach biologicznych oraz w poszczególnych cząsteczkach biologicznych (w szczególności w białkach)

I.P7S_WG SI_W11, CC_W11

W03 Zna podstawowe algorytmy modelowania molekularnego

oraz techniki wizualizacji cząstek molekularnych I.P7S_WG SI_W11, CC_W11 UMIEJĘTNOŚCI

U01 Potrafi dokonać klasyfikacji problemu

bioinformatycz-nego i podać jego przybliżone rozwiązanie I.P7S_UW SI_U01-, CC_U01-, SI_U09-, CC_U09- U02 Używając bibliotek zawartych w środowisku R i języku

Python potrafi zaimplementować program, którego celem jest umożliwienie użytkownikowi przeprowadzenia wnioskowania statystycznego

I.P7S_UW SI_U06, CC_U06, SI_U21-, CC_U21- KOMPETENCJE SPOŁECZNE

K01 Ma świadomość wpływu i zastosowania technik

kompute-rowych w różnych dziedzinach nauki i życia I.P7S_KK SI_K06, CC_K06 2. Formy prowadzenia zajęć i sposób weryfikacji efektów uczenia się

Zamierzone

efekty Forma zajęć Sposób weryfikacji

W01, W02, W03, U01, U02, K01

wykład, laboratorium ocena i dyskusja programów pisanych na labo-ratoriach

Opis przedmiotu

COMPUTATIONAL GENOMICS

W dokumencie Karty przedmiotów (Stron 175-179)