• Nie Znaleziono Wyników

Aproksymacja i funkcje aproksymujące

W dokumencie POLITECHNIKA POZNAN SKA (Stron 34-38)

4. Sposoby opisu sygnału

4.4. Aproksymacja i funkcje aproksymujące

Przebiegi czasowe biosygnałów mogą przybierać skomplikowane kształty warunkowane specyficzną budową systemu biologicznego, w skład którego wchodzi wiele wpływających na siebie podsystemów. Opis takiego obiektu jest bardzo skomplikowany i wymaga uwzględnienia wielu czynników. Teoria aproksymacji leży u podstaw większości analitycznych metod i algorytmów przetwarzania sygnałów. Definiuje ona przestrzenie liniowe, w których poszukiwana jest reprezentacja sygnału. W badaniach eksperymentalnych każdy sygnał pomiarowy to zbiór pozyskanych doświadczalnie wyników w eksperymencie, reprezentujący badaną wielkość mierzoną i zebranych najczęściej w dziedzinie czasu. Dane wejściowe przeważnie znane są wystarczająco dokładnie, natomiast dane wyjściowe często zawierają dodatkowe zaburzenia natury losowej (błędy przypadkowe) oraz określone błędy systematyczne. Wygodną postacią w procesie analizy sygnału lub cech obiektu pomiarowego jest przedstawienie zależności w postaci sparametryzowanej funkcji. Jeśli f(x) jest funkcją aproksymowaną a p(x) jest funkcją aproksymującą, to zadanie aproksymacji polega na wyznaczeniu takich funkcji p(x), które najlepiej przybliżają funkcję f(x). Rozwiązanie tego typu problemu polega na wyborze klasy funkcji i jej parametrów najlepiej przybliżających wybrany badany przebieg. W wyniku zastosowania takiej procedury otrzymuje się zależność pomiędzy danymi wejściowymi a wyjściowymi, co pozwala na wyznaczenie wartości wielkości mierzonej pomiędzy próbkami (interpolacja), a także poza obserwowanym zakresem danych pomiarowych (ekstrapolacja). Zależność funkcyjna w sposób jednoznaczny opisuje dane pomiarowe, redukując szum pomiarowy i wygładzając przebieg sygnału.

Opisując w ten sposób dane eksperymentalne, otrzymuje się model parametryczny określony funkcją p(x) wraz z wyznaczonymi współczynnikami [34]. W wyniku aproksymacji funkcja aproksymująca jest tylko pewnym przybliżeniem rzeczywistej zależności, co określane jest przez błąd  definiowany w danym i-tym punkcie jako:

gdzie:

– nieznana rzeczywista wartość pomiaru w i-tym punkcie ̂ – wartość funkcji aproksymującej p(x) w punkcie i

Jakość aproksymacji określana jest przez estymatory wyrażone w postaci kryteriów, z których podstawowym jest suma kwadratów błędu SSE (Sum of Squares Error), wyrażona w postaci zależności :

Przedstawiona zależność dopasowania funkcji aproksymującej do danych pomiarowych informuje zarówno o dokładności uzyskanego wyniku zastosowanej procedury numerycznej, jak i o wrażliwości na „odstające” punkty pomiarowe, wpływając na ostateczne rozwiązanie.

Metody aproksymacji

Ze względu na rodzaj zastosowanych modeli funkcji aproksymujących, metody aproksymacji można podzielić na dwie kategorie wykorzystujące:

 modele funkcji liniowych,

 modele funkcji nieliniowych.

Pierwsza grupa metod w procesie obliczania parametrów zadanego modelu funkcji bazuje głównie na minimalizacji błędu średniokwadratowego (4.13) i nazywana jest LS (Least Square).

∑ ̂

(4.13) Jednak metoda ta jest bardzo czuła na duży rozrzut punktów pomiarowych, ponieważ w równaniu (4.13) wyznaczany błąd jest zależnością kwadratową. Jednym z prostszych przykładów tego rodzaju aproksymacji jest przypadek regresji liniowej, w której na podstawie danych pomiarowych poszukuje się współczynników równania prostej. Jeśli uogólnić ten przypadek na większą liczbę poszukiwanych parametrów funkcji aproksymującej, można mówić o tzw. regresji wielowymiarowej, sprowadzonej do liniowego równania macierzowego o postaci:

gdzie:

A – wektor poszukiwanych współczynników funkcji aproksymującej, X – macierz wielu zmiennych wejściowych,

Y – wektor zmiennych wyjściowych.

Przedstawiony zapis stanowi tzw. nadokreślony układ równań, którego nie można rozwiązać w prosty sposób. Rozwiązanie dla przyjętego układu można otrzymać z wystarczająco małym błędem, minimalizując sumę kwadratów błędów. Po przekształceniach otrzymuje się rozwiązanie równania będące klasycznym estymatorem LS o postaci:

dzięki czemu wyznacza się współczynniki poszukiwanej aproksymowanej funkcji.

Obliczenia głównie polegają na transformowaniu i odwracaniu macierzy realizowanych w oparciu o przekształcenia SVD, QR itp. Inne kryteria uzupełniają metodę LS o dodatkowe informacje pomocne przy poszukiwaniu współczynników funkcji aproksymującej. Ich stosowanie jest szczególnie uzasadnione w przypadkach, gdy analizowany zbiór danych charakteryzuje rozrzut poszczególnych wyników. Jeśli znane są wariancje mierzonego trendu, można uzupełniając wzór (4.13) o współczynnik wagowy wi, uzyskać kryterium metody ważonego błędu średniokwadratowego WLS (Weighted Linear Least Squares).

(4.14)

̂ (4.15)

∑ ̂

(4.16) Kolejne wyrażenie (4.17) minimalizuje wartość bezwzględną błędu, a metoda nazywa się LAR (Least Absolute Residuals). Ponieważ zależność (4.17) nie jest kwadratowa, metoda może być bardziej skuteczna w sytuacji większego rozrzutu wartości. W szczególności redukuje się wpływ punktów rozproszonych leżących daleko od głównego trendu.

∑ | ̂ |

(4.17) Ostatnia metoda BW (Bisquare Weights) jest bardziej skomplikowana, gdyż iteracyjnie minimalizuje ważony błąd średniokwadratowy, a współczynniki wagi uzależnione są od odległości danego punktu od wyznaczonego przebiegu funkcji aproksymującej.

Oprócz modeli liniowych często wykorzystuje się nieliniowe modele funkcji aproksymujących lub kombinacji modeli liniowych i nieliniowych (funkcja Gaussa, funkcja wymierna, funkcja potęgowa). Część z nich można poprzez przekształcenia matematyczne sprowadzić do postaci liniowej, upraszczając w ten sposób procedury aproksymacji. Jako główne kryterium obliczeniowe poszczególnych współczynników modelu funkcji aproksymującej używa się również sumy błędu średniokwadratowego. Jeśli jako funkcję aproksymującą przyjmie się bardziej skomplikowany model nieliniowy, to obliczenia realizuje się na drodze iteracyjnej w kilku krokach. W celu realizacji procesu obliczeniowego współczynników stosuje się algorytmy optymalizacji nieliniowej: Trust-region, Levenberg-Marquardt, Gauss-Newton. Tego rodzaju procedury pochłaniają znacznie więcej czasu, co często nie pozwala na ich stosowanie w trybie on-line [25].

Przedziały czasowe aproksymacji i ich normalizacja

Sygnał PPG jest sygnałem pochodzenia biologicznego, jego kształt ulega zmianom w czasie, a każdy kolejny okres może znacząco różnić się od poprzedniego. Zatem procedura aproksymacji powinna obejmować określone okno czasowe wycinające kolejne fragmenty analizowanego sygnału, dla którego wyznaczane są współczynniki funkcji aproksymującej.

Dla krótkich odcinków czasowych analizowanej funkcji liczba współczynników jest mała.

Dla długich odcinków czasowych następuje wzrost liczby współczynników spowodowany większą liczbą szczegółów odtwarzanych przez funkcję aproksymującą. W przypadku sygnału PPG naturalnym oknem czasowym staje się pojedynczy okres fali tętna. Ponadto można dokonać dalszego jego podziału względem zawartych w nim ekstremów, co upraszcza postać funkcji aproksymujących. W programie komputerowym aproksymacji krzywej PPG można wybrać okno czasowe, dzieląc podstawowy okres sygnału:

 równomiernie na zadaną liczbę części, lub

 uwzględniając występujące kolejne ekstrema.

Drugim ważnym zagadnieniem związanym z procesem aproksymacji jest normalizacja i skalowanie zbioru wartości x, co ma wpływ na przebieg, czas i dokładność obliczeń. Na przykład wysoki stopień wielomianu aproksymującego oraz szeroki zakres wartości x generują macierz wejściową obliczeń źle uwarunkowaną, w której pojawiają się

współczynniki o bardzo dużych wartościach, co w kolejnych krokach obliczeń może prowadzić do błędów. Problem ten można rozwiązać przez przesunięcie wartości xi o średnią ̅ i przeskalowanie wartości odchyleniem standardowym Sx zgodnie ze wzorem:

̅ (4.18)

Innym przypadkiem, w którym należy dokonać normalizacji wartości x, są bazy funkcji ortogonalnych, które często określa się tylko w pewnym przedziale. Zatem należy dokonać liniowej transformacji dyskretnego zbioru punktów do określonego przedziału o długości (t1,t2), co przedstawia wzór:

(4.19)

W związku ze zmianą zbioru wartości, otrzymane współczynniki w wyniku aproksymacji również ulegają zmianie, co do wartości, ale parametry statystyczne tak przekształconego zbioru wartości xi są przed i po normalizacji takie same [25].

Miary jakości aproksymacji

Przeprowadzenie procedury aproksymacji na podstawie danych pomiarowych wymaga sprawdzenia jej dokładności poprzez wyznaczenie graficznego przebiegu błędu aproksymacji i parametrów statystycznych go opisujących. Jeśli występowanie poszczególnych błędów ma charakter losowy, to można przyjąć, że funkcja dobrze odwzorowuje zachowanie danych pomiarowych. W przypadku występowania pewnych powtarzalnych sekwencji wartości błędu, model funkcji nie w pełni określa zbiór danych pomiarowych. Dlatego do oceny jakości aproksymacji oprócz analizy graficznej błędów wykorzystuje się następujące 4 współczynniki:

 sumę kwadratów błędów SSE (wzór 4.12),

błąd średniokwadratowy MSE (Mean Square Error) określony jako:

∑ ̅

(4.20) gdzie: n – liczba pomiarów; tak jak w przypadku współczynnika SSE, mniejsza wartość MSE świadczy o lepszym dopasowaniu funkcji do przyjętego modelu,

 współczynnik determinacji R2 określany jako:

(4.21)

gdzie błąd całkowity:

∑ ̅

(4.22)

a błąd wnoszony przez model funkcji:

∑ ̂ ̅

(4.23)

Wartość SSR bliska 1 oznacza, iż model w znacznym stopniu odwzorowuje wariancję danych pomiarowych. Inaczej mówiąc, jest to korelacja pomiędzy danymi pomiarowymi a danymi odtwarzanymi przez funkcję aproksymującą,

 pierwiastek błędu średniokwadratowego:

√ (4.24)

będący oceną odchylenia standardowego wartości losowych w danych pomiarowych [94].

Metody aproksymacji są podstawą wielu metod analizy sygnałów, zarówno w dziedzinie czasu, jak i częstotliwości. Wybór odpowiedniej postaci funkcji aproksymującej, a następnie wyznaczenie jej współczynników może:

 zredukować liczbę danych opisujących badany sygnał (kompresja),

 wyznaczyć bezpośrednio cechy morfologiczne sygnałów w dziedzinie czasu,

 ułatwić bardziej selektywną filtrację zakłóceń [161].

Przedstawione sposoby aproksymacji funkcji stały się podstawą do opracowania algorytmów filtracji i analizy sygnałów fotopletyzmograficznych na potrzeby skonstruowanego przez autora systemu pomiarowego (rozdział 5.5).

W dokumencie POLITECHNIKA POZNAN SKA (Stron 34-38)