• Nie Znaleziono Wyników

Recenzja rozprawy doktorskiej mgr inż. Anny Papież pt. Integrative data analysis methods in multi-omics molecular biology studies for disease of affluence biomarker research

N/A
N/A
Protected

Academic year: 2021

Share "Recenzja rozprawy doktorskiej mgr inż. Anny Papież pt. Integrative data analysis methods in multi-omics molecular biology studies for disease of affluence biomarker research"

Copied!
3
0
0

Pełen tekst

(1)

Biuro Dziekana

13

;

<

Wpłynęło dnia

i Q£

Nr . / zał...

Dr hab. January Weiner Berlin Institute of Health Anna-Louisa-Karsch-Str. 2 10178 Berlin

Szanowny Pan Prof. dr hab. inż. Adam Czornik, Dziekan Wydział Automatyki, Elektroniki i Informatyki

R e c e n z ja ro z p ra w y d o k to rsk ie j A n n y P a p ie ż

T y tu ł ro z p ra w y : Integrative data analysis methods in multi-omics molecular biology studies for disease of affluence biomarker research.

A u to r ro z p ra w y : Anna Papież

P r o m o to r ro z p ra w y : Prof. Joanna Polańska

S tre s z c z e n ie : Rozprawa doktorska pani Anny Papież porusza niezwykle ważne zagadnienie z dziedziny biologii systemów: integracji wysokowy mi arowych danych

(high throughput data) pochodzących z różnych źródeł oraz kohort. Ogól­

nie mówiąc, dane wysokowy miarowe - takie jak dane transkryptom iczne albo metaboliczne - pozyskiwane są obecnie stosunkowo niewielkim kosztem, czego wynikiem jest olbrzymia liczba produkowanych zestawów danych, wykładniczo rosnąca z każdym rokiem. Jednak zadanie polegające na zestawieniu danych, które zostały pozyskane w różnych badaniach, z wykorzystaniem różnych technik analitycznych nie jest trywialne.

Zagadnienie to nadal wymaga wyjątkowej dbałości o szczegóły i nie ma ogólnego rozwiązania, jednak praca (a właściwie: prace) p. Papież stanow ią niebalny przyczynek w tej trudnej dziedzinie, proponując nowe podejścia i algorytmy. P r z e d s ta w ie n ie p ra c y : P. Papież zebrała w swojej rozprawie szereg badań z dziedziny integracji wysokowy miarowych zestawów danych. Po pierwsze, opra­ cowała i zaim plem entowała algorytm do identyfikacji system atycznego efektu specyficznego dla zestawu danych ( batch effect). Algorytm opiera się na pro­ gramowaniu dynamicznym i umożliwia korektę danych nawet w sytuacji, gdy nie znana jest stru k tu ra danych (tzn. umożliwia rozdzielenie próbek na grupy ob­ ciążone specyficznym efektem). Jest to szczególnie ciekawa część pracy, ponieważ, jak pokazała autorka, brak odpowiedniej korekcji błędów może w efekcie do­ prowadzić do braku wyników analizy funkcjonalnej (rozdz. 4.1.2).

Metody integracji wieloplatformowej zostały wykorzystane do analizy szeregu ory­ ginalnych zestawów danych z dziedziny radiologii i onkologii. Analizy doczekały się publikacji w recenzowanych pracach naukowych. Na przykład, korzystając z integracji danych z różnych platform dokonano analizę biomarkerów służących

(2)

do dyskryminacji między pacjentami wrażliwymi na promieniowanie jonizujące (w terapii) a niewrażliwymi (rozdz 4.2). W pracy tej wykorzystano nowe podejście do identyfikacji grup genów wykazujących różny rodzaj trendów w zależności od otrzymanej dawki promieniowania. W tym celu zastosowano test Jon ckheere- Te pstry znakomity pomysł, który przyniósł też dobre wyniki. W dalszej części pracy autorka dokonała analizy i integracji danych uzyskanych metodami transkryptom iki oraz proteomiki (rozdz. 4.3). W tym celu wykorzys­ ta ła integracje wartości p m etodą Fishera, wzmacniając w ten sposób wyniki uzyskane tylko w oparciu o analizę transkryptom u. Na koniec (rozdz. 4.4) autorka dokonała integracji danych pochodzących z różnych tkanek czy typów komórek.

W pracy położono nacisk na systematyczną kontrolę stosowanych metod i anal­ izę porównawczą różnych rozwiązań. Wyliczenie wszystkich zastosowanych i porównanych metod wzbudziło mój podziw: autorka wykonała olbrzymią pracę (która czasem jest w rozprawie zbyta jednym zdaniem!).

O p in ia : Należy przede wszystkim podkreślić, że rozprawa doktorska przed­ stawia badania, które zostały opublikowane już recenzowanych czasopismach naukowych. Liczba i jakość publikacji naukowych w yrasta znacząco powyżej europejskiej średniej: prace p. Papież ukazały się w czterech czasopismach, w tym w Bioinform atics, jednym z najlepszych czasopism z dziedziny bioinformatyki. W swojej pracy naukowej i rozprawie p. Papież w ykazała się bardzo szeroką znajomością statystyki i bioinformatyki, a także biologii: myślę, że właśnie umiejętność nie tylko programowania i rozumowania algorytmicznego, ale również rozumowania statystycznego i biologicznego (obce wielu adeptom bioinformatyki) zadecydowała o sukcesie prezentowanych metod. P Papież swobodnie posługuje się zarówno modelowaniem liniowym, jak i uczeniem maszynowym (np. z wyko­ rzystaniem maszyn wektorów nośnych, supporł rector rnachines) czy funkcjonalną analizą z dziedziny biologii systemów. Rozwiązania zaprezentowane w pracy są oryginalne, pomysłowe i świeże; autorka poszukiwała (skutecznie) nowych d róg,

a czasem wykorzystywała b a r d z o p r o s te r o z w ią z a n ia (n a które je d n a k jednak inni nie wpadli) żeby uzyskać znakomite efekty

Główny punkt mojej krytyki to niedostateczne uwypuklenie swojego dorobku naukowego w rozprawie. Uważam, ze zbędne jest rozpisywanie się na tem aty, które zostały już szczegółowo przedstawione w recenzowanych czasopismach, ale brak wystarczających odniesień do tych prac może sprawić wrażenie, że rozprawa doktorska jest trywialna. To nieprawda: streszcza ona olbrzymią pracę, jednak by to w pełni docenić, należy, niestety, sięgnąć po publikacje.

To, że p. Papież ma na swoim koncie już szereg prac naukowych miało też inny pozornie negatywny efekt dla rozprawy: chociaż w pracy sformułowano centralne cele (rozdział 1.2 oraz początek rozdz. 5), spora jej część dotyczy narzędzi, które trzeba było najpierw wykonać. Myślę, że było to trudne do uniknięcia, zwłaszcza w pracy p ar excellance bioinformatycznej. co w pełni usprawiedliwia też brak wyraźnej biologicznej hipotezy. Efektem ubocznym jest też nieco zagm atw ana

(3)

struktura rozdziału “Wyniki i Dyskusja”, gdzie czasem ciężko się zorientować, o której ze swoich prac autorka akurat pisze.

Dorobek p. Papież stanowi nietrywialny przyczynek do pracy z wysokowymi- arowymi zestawami danych. Szczególnie BatchI, algorytm służący do identy­ fikacji efektu specyficznego dla zestawu danych (batch effect) zaimplementowany w języku R wydaje się bardzo obiecującym nowym narzędziem, które sam zamierzam wykorzystać w swojej pracy. Również w dziedzinie biomarkerów wykazała nowatorskie podejście do analizy danych transkryptomowych i proteo- mowych.

U w ag i te c h n ic z n e d o ty c z ą c e w y k o n a n ia ro z p ra w y : Praca jest wykonana bardzo starannie. Ilustracje są czytelne i właściwie opisane; jedyne zastrzeżenie to używanie ilustracji łączących czerwony i zielony kolor, co może być problemem dla czytelników cierpiących na ślepotę barw. Podobnie, wzory matematyczne są czytelne i dobrze opisane. Rozdział między wstępnym omówieniem problemu, m etodam i oraz wynikami nie budzi zastrzeżeń. Dyskusja została połączona z wynikami, co jest częstym zabiegiem w pracach, w których trzeba omówić szereg uzyskanych wyników. W dziedzinach, które mogę ocenić (bioinformatyka, transkryptom ika, proteom ika, biomarkery), nie pom inięto żadnych istotnych publikacji, p. Papież w ykazała się dobrym przygotowaniem merytorycznym. Język pracy (pomijając drobne lapsusy) jest zwięzły, poprawny i czytelny. R e o k o m e n d a c ja : Dopuszczenie rozprawy doktorskiej do publicznej obrony i jej wyróżnienie. U z a s a d n ie n ie : dorobek p. Anny Papież w pełni uzasadnia przyznanie jej stopnia doktora; wykonana praca leży znacznie powyżej przeciętnej europejskiej zarówno pod względem obszernego ujęcia tem atu, jak i osiągniętych publikacji naukowych.

January Weiner

Cytaty

Powiązane dokumenty

Sformułowany cel pracy – praktyczne wykorzystanie symulacji ruchu drogowego do oceny przewidywanego wpływu modyfikacji infrastruktury drogowej na poziom emisji zanieczyszczeń

Ten temat jest przedmiotem rozdziału piątego, w którym autor wymienia podzespoły, które spowodowały co najmniej 80% awarii maszyn odstawczych.. Jest to cenna informacja dla

Przyjęto, że ogólny algorytm doboru tłumienia będzie się składał z czterech algorytmów cząstkowych: szacowania masy nadwozia, szacowania typu nawierzchni drogi, algorytmu

Mariusza Grajka uważam, że postawiony przez Autora rozprawy problem badawczy ma charakter dysertabilny i w pełni nawiązuje do współczesnych osiągnięć oraz

Ze względu na usankcjonowanie, już obecnie, emisji cząstek stałych (masy i liczby) w przepisach dotyczących badań homologacyjnych, a w przyszłości także podczas badań

Wybór roku 1989 jako daty otwierającej obszar literatury, którą autorka się zajmuje, jest uzasadniony „odrębnością prozy pisanej przez ostatnie ćwierć wieku bez

public class Worker extends SwingWorker&lt;Integer , Void&gt; {

Autor opisal podstawowe wlasciwosci polimerow przewodz^cych, a nastypnie dokonal przegl^du literaturowego dotycz^cego wlasciwosci rozgal?zionych polimerow przewodzqcych