• Nie Znaleziono Wyników

Miary tonalności stosowane do wykrywania tonów astmatycznych

W dokumencie Index of /rozprawy2/10729 (Stron 29-33)

3. Rozpoznawanie tonalności sygnału

3.2 Miary tonalności stosowane do wykrywania tonów astmatycznych

(3.4)

Dodatkowo niektóre deskryptory liczone były na widmie zawężonym do wybranego przedziału częstotliwości. W takich przypadkach podano wartości zadanych krańcowych częstotliwości zawężenia fmin oraz fmax oraz przeliczono je na odpowiednie indeksy prążków widma kmin i kmax. Mając na uwadze fakt różnych rozdzielczości widm, zadane częstotliwości krańcowe zostały podane w przybliżeniu, a obliczone na ich podstawie indeksy granicznych prążków widma otrzymano w wyniku zaokrąglenia (w dół dla kmin i w górę dla kmax):

(3.5)

W przeprowadzonych badaniach rozpoznawania świstów astmatycznych wykorzystano:  wybrane deskryptory tonalności, które były już wykorzystywane do detekcji świstów

astmatycznych (jako tło porównawcze),

 niektóre z miar, które były już używane do detekcji tonalności w innych zastosowaniach ale nie do detekcji świstów astmatycznych,

 nowe miary tonalności, zaproponowane na potrzeby tej pracy.

Celem badań było opracowanie metody mało złożonej obliczeniowo, której zaimplementowanie na sprzęcie mobilnym nie stanowiłoby problemu.

W dalszej części pracy x oznacza analizowany sygnał, a x(n) i xn jego n-tą próbkę. Krótsze oznaczenie jest preferowane jeśli zwiększona jest dzięki temu czytelność równań.

3.2

Miary tonalności stosowane do wykrywania tonów astmatycznych

Do chwili obecnej opracowano różne algorytmy do detekcji świstów, wykorzystując najnowocześniejsze metody z dziedziny cyfrowego przetwarzania sygnałów oraz sztucznej inteligencji. Najnowszy przegląd metod do detekcji świstów astmatycznych można znaleźć w [SSP12, PSA13].

Poniżej zestawiono definicje miar tonalności, które były już stosowane w astmie. Skoncentrowano się na miarach mniej złożonych obliczeniowo, mając na uwadze ich późniejsze zastosowanie na tanim sprzęcie cyfrowym.

3.2.1 Miary tonalności liczone w dziedzinie czasu Kurtoza [ASK09]:

3

)

(

4 4

x

E

K

(3.6)

to miara koncentracji i spłaszczenia rozkładu próbek, gdzie x jest sygnałem wejściowym w dziedzinie czasu, a  i 2 oznaczają jego wartość średnią i wariancję. Wartość kurtozy dla rozkładu normalnego (gaussowskiego) przyjmuje wartość 0, natomiast dla sygnałów okresowych kurtoza jest większa od 0. Z tego wynika, że dla sygnałów normalnego oddechu należy oczekiwać kurtozy na poziomie zbliżonym do zera natomiast dla świstów wartość ta powinna być wyższa. Zdziwić może fakt, że w [ASK09] wartości tego deskryptora przyjmują

30 odpowiednio 3 dla sygnału normalnego oddechu i powyżej 3 dla świstów. Dzieje się tak, ponieważ definicja kurtozy zawiera odejmowanie (normalizowanie do szumu gaussowskiego), które nie wszyscy stosują. Kurtoza bez unormowania przybiera wartość 3 dla rozkładu gaussowskiego. W niniejszej rozprawie przyjęto oficjalną definicję kurtozy (z odejmowaniem) oraz zaobserwowano, że w przypadku świstów astmatycznych korzystniejsze jest liczenie kurtozy wartości prążków widma sygnału.

Entropia Renyi’a [ASK09] jest uogólnieniem entropii Shannona:

(3.7)

gdzie xn oznacza n-tą próbkę sygnału w czasie. Jako deskryptor do detekcji świstów entropia ta jest wyznaczana ze wzoru (3.7), z parametrem α = 2. Dla szumu entropia ta jest mniejsza niż dla sygnału tonalnego.

Nieregularność przejścia przez wartość średnią [ASK09]. Autorzy wyszli z założenia,

że sygnały okresowe mają inny współczynnik przejścia przez wartość średnią sygnału w stosunku do sygnałów losowych. Do wyznaczenia tego współczynnika posłużyli się stosunkiem wartości odchylenia standardowego do wartości średniej:

(3.8)

Dla szumu wartość MC jest większa w porównaniu z sygnałami zawierającymi świsty.

Metoda liniowej predykcji (ang. Linear Prediction - LP) [IRP89, SKG94]. Ponieważ suma

P sinusoid jest sygnałem samo przewidującym się (nowa próbka jest liniową kombinacją 2P próbek poprzednich): 2* 1 , 2 * ,..., 1 P n k n k k x a x n P N  

  (3.9)

można rozpoznawać fakt występowania sygnałów okresowych metodą obserwacji wartości błędu liniowej predykcji:

2 2 1 1 2* 2* 2* 1 N N P n n n k n k n P n P k LP err x x x a x        

  

(3.10)

Zakładając, że sygnał tonalny posiada N próbek, spełniony jest układ równań:

, (3.11)

31

1

(

T

)

T

 

a X X X y

(3.12)

Dla sygnałów okresowych (świsty astmatyczne), błąd liniowej predykcji (3.10) jest znacząco mniejszy niż dla sygnałów o charakterze szumowym.

3.2.2 Miary tonalności liczone w dziedzinie częstotliwości

Maksima uśrednionego widma. Algorytm przedstawiony w [TH07] opiera się na

uśrednianiu modułów widm STFT w osi czasu (3.4). W pierwszej kolejności, używając okna Hanninga o długości NFFT = 256 próbek przesuwanego z krokiem Nstep = 128 próbek, wyliczano sekwencję widm za pomocą FFT. Z modułu tych widm odjęta została linia trendu obliczona za pomocą filtrów uśredniających. Kolejnym krokiem była detekcja maksimów prążków częstotliwościowych, czyli prążków świstów. Oś częstotliwości została podzielona na 4 grupy: B-I: 100–300 Hz, B-II: 300–500 Hz, B-III: 500–800 Hz oraz B-IV: 800–1000 Hz, co pozwoliło na użycie innych progów detekcji dla każdej z grup. Wybierano wszystkie maksima, które przekraczały wcześniej zdefiniowane progi, tj. AB-I = 3; AB-II = 3; AB-III = 2; AB-IV = 2. Następnie wybrane maksima były analizowane pod względem spełnienia 4 kryteriów, na podstawie których można było powiedzieć czy wykryte maksimum należy do grupy świstów astmatycznych. Kryteria te były następujące:

 lokalnego maksimum – szukane metodą przesuwania okna o szerokości 70 Hz po wszystkich częstotliwościach dla każdej ramki czasowej STFT;

 koegzystencji maksimów – określanego jako liczba maksimów, które zostały wykryte w ramce czasowej STFT. Liczba maksimów nie powinna przekraczać 4, gdyż według autorów jest to maksymalna liczba składowych harmonicznych świstu;

 ciągłości w czasie – maksima powinny trwać nie krócej niż 150 ms;

 grupowania – maksima z kolejnych widm FFT są uznawane za jedną grupę świstów, jeśli: 1) ich różnica częstotliwości nie przekracza 50 Hz, 2) czas pomiędzy potencjalną grupą nie przekracza 23,2 ms oraz 3) całkowity czas trwania grupy nie przekracza 2,5 s.

Entropia maksimów widma [ZSY09] (SPE – Spectral Peaks Entropy). Detekcję rozpoczyna

się od przekształcenia analizowanego sygnału do dziedziny czasowo-częstotliwościowej za pomocą krótkoczasowej transformacji Fouriera STFT (3.2). W tym celu przesuwa się okno Hanninga o długości NFFT 60 ms. Następnie widmo STFT sygnału służy do wyliczenia uśrednionego w czasie widma mocy P(k) (3.3). Dodatkowo wycina się składowe widma leżące poniżej 70 Hz. Dla normalnego oddechu energia sygnału jest rozproszona w całym zakresie częstotliwości, a dla zaburzeń tonalnych energia koncentruje się w częstotliwościach występowania świstów.

Zakładając, że P(k) (3.3), czyli średnie (względem l) widmo mocy sygnału, posiada N dominujących maksimów (c1, c2,..., cN), wylicza się stosunek pn dowolnego maksimum cn do sumy tych maksimów:

1 n n N n n

c

p

c

(3.13)

32 ) ( log10 1 n N n n p p SPE

  (3.14)

Dla szumu miara SPE jest większa niż dla składowej tonalnej.

Stosunek częstotliwości f50/f90 średniego widma mocy [ASK09], określono równaniem:

(3.15)

Częstotliwości f50 i f90 oznaczają takie punkty na osi częstotliwości średniego widma mocy sygnału P(k) (3.3), dla których stosunek pola powierzchni ograniczonych tymi punktami oraz krzywą widma do całkowitego pola powierzchni pod widmem, wynoszą odpowiednia 50% i 90% (rys. 3.1)

Rysunek 3.1 Graficzne przedstawienie cechy stosunku częstotliwości f50 i f90

Zadaniem stosunku częstotliwości jest wykrycie prążków widma, skupionych w jednej częstotliwości, czyli sygnału tonalnego.

Bispektrum fourierowskie [CC08] bazuje na wyliczeniu bispektrum sygnału, które

wygładza prążki widma o charakterze szumu, a eksponuje prążki tonalne. Ważną cechą bispektrum jest zachowanie informacji o kącie fazowym. Niestety wyznaczanie bispektrum jest bardzo czasochłonne, dlatego autorzy, proponują zrezygnowanie z 2-wymiarowej macierzy bispektrum, na rzecz 1-wymiarowej przekątnej bispektrum.

(3.16)

gdzie X(ω) oznacza transformatę Fouriera sygnału wejściowego a X*(ω) jej sprzężenie zespolone. Proces rozpoznawania prowadzono w [CC08] za pomocą algorytmu DTW (Dynamic Timing Warping).

Bispektrum falkowe oraz falkowa bikoherencja [TH10] i ich analiza statystyczna.

Detekcja tonalności opiera się na analizie falkowej wyższego rzędu, która jest bardzo złożona obliczeniowo. Autorzy posługują się falkowym bispektrum (Wavelet Bispectrum – WBS):

W dokumencie Index of /rozprawy2/10729 (Stron 29-33)

Powiązane dokumenty