• Nie Znaleziono Wyników

Identyfikacja związków i analiza półilościowa

W dokumencie Swarcewicz Barbara Rozprawa doktorska (Stron 50-54)

3. MATERIAŁY I METODY

3.6. Analiza danych

3.6.1. Identyfikacja związków i analiza półilościowa

W przypadku analizy związków występujących na powierzchni liści, dane były integrowane ręcznie w programie MassLynx v. 4.1. Obliczenia statystyczne, w tym obliczenie wartości średnich i odchyleń standardowych, oraz graficzną prezentację danych wykonano w programie Microsoft Office Excel. Jeśli chodzi o analizę metabolitów liści i korzeni część obróbki danych została wykonana ręcznie (jw.), jednak większość, ze względu na duży zbiór danych (ponad 3 tys. próbek), została przetworzona przy pomocy programu do automatycznej

MATERIAŁY I METODY

identyfikacji i analizy ilościowej widm uzyskanych techniką GC-MS – TargetSearch (opisany w podrozdziale 3.6.1.1).

Obliczenie indeksów retencji (RI, ang. retention index) związków przeprowadzono zgodnie z poniższym wzorem dla analiz chromatograficznych przeprowadzonych w gradiencie temperaturowym z wykorzystaniem jako markerów RI alkanów o parzystej liczbie węgli (Zellner i in. 2008):

przy czym:

gdzie:

RI – indeks retencji Kovátsa,

n – liczba atomów węgla w alkanie wypływającym przed związkiem badanym, N – liczba atomów węgla w alkanie wypływającym za związkiem badanym, tr – czas retencji,

zw. – związek o nieznanym indeksie retencji.

W analizach metabolomicznych pewne wyzwanie stanowi identyfikacja związków, z tego względu że pojedynczy metabolit może być obecny w postaci różnych pochodnych. W analizach opartych o technikę GC-MS z wykorzystaniem chemicznej modyfikacji grup funkcyjnych można przykładowo obserwować aminokwasy z jedną, dwiema lub trzema grupami TMS (Zaikin i Halket 2009). MSI wyróżnia 4 poziomy określające wiarygodność identyfikacji (tab. 3.3). Zgodnie z powyższymi zaleceniami jedynie pierwszy poziom – pełna identyfikacja potwierdzona przez porównanie ze związkiem wzorcowym – został oznaczony w niniejszej pracy gwiazdką (*). Poziom drugi – adnotacja związku – został przypisany na podstawie porównania uzyskanych widm z widmami zdeponowanymi w bazach danych:

Wiley Registry of Mass Spectral Data, Golm Metabolome Database oraz MassBank. Związki

niezidentyfikowane, opisane są w pracy jako N_x, gdzie x odpowiada indeksowi retencji (zaokrąglonemu do liczby całkowitej) nieznanego związku. Dokładne masy monoizotopowe związków zostały obliczone przy użyciu Molecular Weight Calculator v. 6.49 (www.alchemistmatt.com).

MATERIAŁY I METODY

Tab. 3.3. Poziomy identyfikacji związków zdefiniowane przez MSI (Dunn i in. 2013).

POZIOM

IDENTYFIKACJI PODSTAWA PRZYPISANIA DO DANEGO POZIOMU

1 pełna identyfikacja

związku

Porównanie z dwóch lub większej liczby cech względem substancji wzorcowej w tych samych warunkach analitycznych.

2 przypuszczalna

adnotacja związku

Opiera się o właściwości fizykochemiczne i/lub podobieństwo widm zdeponowanych w publicznych lub komercyjnych bazach

danych, bez odniesienia do związków wzorcowych. 3

przypuszczalna adnotacja klasy

związku

Opiera się o charakterystyczne właściwości fizykochemiczne danej klasy związków lub podobieństwo widm do danej grupy.

4 brak identyfikacji –

związki nieznane

Pomimo braku identyfikacji i klasyfikacji do danej grupy związków, związki te można odróżnić od innych i obliczyć ich

ilość w oparciu o dane zawarte w widmie. 3.6.1.1 TargetSearch

Pakiet TargetSearch (Cuadros-Inostroza i in. 2009) działa w środowisku R (R Development Core Team 2010) i jest narzędziem do wstępnego przetwarzania danych pochodzących z profilowania metabolicznego przeprowadzonego z wykorzystaniem techniki GC-MS. Ponadto program ten umożliwia jednoczesną analizę jakościową i ilościową związków obecnych w próbkach.

Na dane wejściowe wprowadzone przez użytkownika składały się: pliki z danymi GC-MS, opis próbek oraz biblioteka widm związków. Analiza danych pochodzących z liści i korzeni była wykonana oddzielnie, jako dwa odrębne zestawy danych, jednak przy takim samym ustawieniu parametrów programu. Pierwszym etapem przetwarzania danych była konwersja surowych danych programu MassLynx do powszechnie uznawanego i niezależnego od stosowanej platformy obliczeniowej formatu NetCDF (ang. network

common data form) przy użyciu dodatku DataBridge (Waters). Łącznie wprowadzono do

programu 3360 plików (2  1680). Na wymagany do przetworzenia plików opis próbek

składała się tabela zawierająca: nazwy wszystkich próbek i ich przypisanie do odpowiednich grup (linia, kontrola/susza, powtórzenie biologiczne/techniczne) oraz czas przeprowadzenia analizy GC-MS liczony w dniach (1-59 dni dla liści i 1-57 dla korzeni). Dodatkowo wprowadzono plik opisujący stosowane jako markery indeksów retencji alkany, tj. przypisany im indeks retencji, zakres czasów retencji podany w sekundach (dolna i górna granica), przy których użyte alkany eluowały, oraz masę charakterystyczną dla tych markerów (85 m/z), względem której miały być wyszukiwane w próbkach. Ostatnim elementem wprowadzonym do programu była biblioteka widm związków. Ze względu na niecelowany charakter analizy wykorzystano publiczną bazę GMD (Kopka i in. 2005) kompatybilną z programem

MATERIAŁY I METODY

TargetSearch, zawierającą blisko 2600 wpisów. Wybrana baza:

GMD_20120203_VAR5_ALK_TargetSearch.txt (gmd.mpimp-golm.mpg.de/download),

oparta jest na indeksach retencji obliczonych na podstawie 9 alkanów (C10-C36) i kolumnie kapilarnej wypełnionej 5%-fenylo-95%-dimetylopolisiloksanem, co najbardziej odpowiada warunkom, w których przeprowadzono analizy instrumentalne.

Analizy bioinformatyczne z wykorzystaniem pakietu TargetSearch zostały przeprowadzone we współpracy z dr Anetą Sawikowską z Zakładu Biometrii i Bioinformatyki Instytutu Genetyki Roślin PAN w Poznaniu i obejmowały następujące etapy:

i. Konwersja dokładnych mas do mas nominalnych.

ii. Usunięcie linii bazowej i identyfikacja wierzchołków pików we wszystkich

chromatogramach.

iii. Wyszukanie czasów retencji alkanów i ich konwersja na indeksy retencji. Na tym etapie tworzony jest raport (ryc. 3.2), na który składają się wykresy czasów retencji każdego alkanu we wszystkich próbkach, co pozwala na wyznaczenie obserwacji odstających (w odniesieniu do dnia przeprowadzenia analizy) i ich ewentualne ręczne skorygowanie bądź usunięcie odstających próbek.

iv. Przeszukiwanie poszczególnych analiz pod kątem obecności związków zawartych

w bibliotece widm GMD na podstawie charakterystycznych mas występujących w zadanym okienku czasowym przy oczekiwanym RI.

v. Utworzenie macierzy zawierających:

a. Informacje o metabolitach (w tym: nazwa związku, RI z biblioteki, RI z prób, liczba korelujących mas i ich rzeczywiste wartości oraz współczynnik określający podobieństwo widm pochodzących z biblioteki i prób),

b. Intensywności związków w poszczególnych próbkach.

Uzyskane w ten sposób macierze metabolitów były następnie ręcznie sprawdzone pod kątem prawidłowości przypisania identyfikacji. Ostatecznie w próbkach ekstraktów liści zostało adnotowanych 101 związków, z kolei w próbkach pochodzących z korzeni adnotowano 100 związków. Następnie dane normalizowano względem standardu wewnętrznego.

MATERIAŁY I METODY

Ryc. 3.2. Przykładowy raport przedstawiający rozkład czasu retencji tetradekanu w 1680

próbkach ekstraktów liści. Niebieskimi kółkami zaznaczono obserwacje odstające. Czerwone linie wyznaczają dni analizy (ok. 30 próbek/dobę).

W dokumencie Swarcewicz Barbara Rozprawa doktorska (Stron 50-54)

Powiązane dokumenty