• Nie Znaleziono Wyników

Krzysztof Cisowski, Detekcja zakłóceń impulsowych w sygnałach fonicznych z wykorzystaniem wygładzonych lokalnych histogramów sygnału.Sesja: Multimedia.Politechnika Gdańska, Wydział ETiI, Katedra Systemów Automatyki

N/A
N/A
Protected

Academic year: 2021

Share "Krzysztof Cisowski, Detekcja zakłóceń impulsowych w sygnałach fonicznych z wykorzystaniem wygładzonych lokalnych histogramów sygnału.Sesja: Multimedia.Politechnika Gdańska, Wydział ETiI, Katedra Systemów Automatyki"

Copied!
6
0
0

Pełen tekst

(1)www.pwt.et.put.poznan.pl. Krzysztof Cisowski Politechnika Gdańska, Wydział ETiI Katedra Systemów Automatyki, ul. G. Narutowicza 11/12, 80-952 Gdańsk, e-mail: krci@eti.pg.gda.pl. 2005. Poznańskie Warsztaty Telekomunikacyjne Poznań 8 - 9 grudnia 2005. DETEKCJA ZAKŁÓCEŃ IMPULSOWYCH W SYGNAŁACH FONICZNYCH Z WYKORZYSTANIEM WYGŁADZONYCH LOKALNYCH HISTOGRAMÓW SYGNAŁU Streszczenie: W artykule omówiono parametryczną metodę detekcji zakłóceń impulsowych sygnałów fonicznych opartą o analizę wygładzonych, ocen rozkładów prawdopodobieństwa (histogramów) błędów resztowych sygnału. We wstępie scharakteryzowano ideę detekcji próbek nadmiarowych z wykorzystaniem testów statystycznych. Następnie omówiono metodę aproksymacji histogramu przy użyciu rozkładu t-Studenta. Na koniec przedstawiono wyniki doświadczalne, w których porównano własności proponowanego algorytmu z metodą opartą na założeniu o gaussowskim charakterze sygnału fonicznego.. 1. WSTĘP W pracy przedstawiono nową parametryczną metodę detekcji zakłóceń impulsowych sygnałów fonicznych wykorzystującą statystyczne własności analizowanych przebiegów. Omawiane rozwiązanie pozwala na wykrywanie zniekształceń w postaci pojedyńczych lub złożonych impulsów powstających w analogowej części toru fonicznego. Przykładowymi źródłami zakłóceń mogą być rysy na płytach analogowych odczytane łącznie z sygnałem użytecznym za pomocą wkładki gramofonowej, trzaski wytwarzane przez różnego rodzaju elementy stykowe oraz gniazda i wtyki np. mikrofonowe itp. Detekcja danych nadmiarowych jest pierwszym etapem procesu rekonstrukcji zakłóconych impulsowo sygnałów fonicznych (inne istotne z punktu widzenia jakości sygnałów audio rodzaje zakłóceń to: szum addytywny oraz zniekształcenia nieliniowe). W parametrycznej metodzie detekcji zakłada się, że sygnał foniczny {y(t)} jest lokalnie stacjonarnym procesem autoregresyjnym (AR) rzędu p. W kolejnych przedziałach stacjonarności {y(t)} poddawany jest wstępnej filtracji za pomocą filtru analizującego (wybielającego) o współczynnikach równych parametrom modelu AR. Otrzymany sygnał błędów resztowych {e(t)} ma w porównaniu z {y(t)} znacznie mniejszą wariancję (σe2  σy2 ), a w związku z tym zmniejszoną wartość stosunku sygnał/szum. Dzięki temu nieciągłości wprowadzane do sygnału przez zakłócenia impulsowe są bardziej wyeksponowane – łatwiejsze do wykrycia. Dodatkowo sygnał {e(t)} ma wartość oczekiwaną me bliską ze-. PWT 2005 - POZNAŃ 8-9 GRUDNIA 2005. ru – jest skupiony wokół zera. Jak wykazano w [1] zakłócenia impulsowe po przejściu przez filtr analizujący ulegają nieznacznemu rozmyciu, przy czym pierwsza próbka zakłócenia nie ulega przesunięciu w czasie, w związku z tym detektor prawidłowo wykrywa początki impulsów nieznacznie wydłużając stan ich wykrycia. Proces detekcji zniekształceń w {e(t)} polega na porównaniu amplitudy chwilowej sygnału z wartościami progowymi, ustalanymi w sposób zależny od apriorycznej wiedzy o własnościach statystycznych badanego sygnału oraz zastosowanego algorytmu detekcji. Sygnał błędów resztowych uzyskany w procesie dekorelacji (wybielania) {y(t)} ma charakter szumu białego o nieznanym rozkładzie prawdopodobieństwa. W przypadku, gdy rozkład ten jest znany progi detekcji można ustalić w oparciu o klasyczne kryterium Neymana-Pearsona [4]. Dolne i górne wartości progowe odpowiadają wówczas wartościom krytycznym zd oraz zg testu statystycznego, w którym dla danego poziomu istotności α weryfikowane są dwie hipotezy dotyczące braku przynależności lub przynależności poszczególnych próbek {e(t)} do zbioru próbek nadmiarowych (próbki o bardzo dużych amplitudach występują w „czystym“ sygnale {e(t)} bardzo rzadko - częstość ich występowania określamy dobierając prawdopodobienstwo α). Hipoteza zerowa Ho mówi, że w chwili ti dana próbka sygnału e(ti ) nie jest nadmiariowa (zd ¬ e(ti ) ¬ zg z prawdopodobieństwem równym 1−α), a hipoteza alternatywna H1 zakłada, że próbka e(ti ) jest nadmiarowa – zawiera zakłócenie impulsowe (e(ti ) > zg lub e(ti ) < zd z prawdopodobieństwem równym α). W trakcie weryfikacji hipotez można popełnić dwa błędy: błąd I rodzaju – gdy niezakłócona impulsowo próbka sygnału zostanie uznana za zakłóconą (próbka „dobra“ będzie miała poziom należący do obszaru krytycznego testu statystycznego) lub błędy II rodzaju – gdy próbka zakłócona impulsowo zostanie uznana za „dobrą“ – będzie należała do obszaru dopuszczalności H0 . Jak wiadomo, podczas analizy rzeczywistych sygnałów fonicznych najczęściej nie jest znamy rozkład prawdopodobieństwa {y(t)} a tym samym {e(t)}, uniemożliwia to dla przyjętego poziomu istotności α wyznaczenie progów zd i zg . W wielu praktycznych rozwiązaniach stosuje się wówczas uproszczenie polegające na założeniu, że sygnał {e(t)} ma rozkład normalny, w pełni określo-. 1/6.

(2) www.pwt.et.put.poznan.pl. ny przez dwa parametry: wartość oczekiwaną me oraz wariancję σe2 (parametry te oszacowuje się w oparciu o sygnał {e(t)}). W tym przypadku progi zd oraz zg wyznacza się dla przyjętego poziomu istotności α z odpowiednio przeskalowanej funkcji gęstości unormowanego rozkładu gaussowskiego – N (mn = 0, σn2 = 1). Uzyskane w ten sposób wartości są z praktycznego punktu widzenia najczęściej zbyt „niskie“ [1]. Detektor kwestionuje zbyt wiele próbek „dobrych“ – popełnia zbyt wiele błędów pierwszego rodzaju. Na rys. 1. zamieszczono wykres przykładowego fragmentu standaryzowanego sygnału błędów resztowych {e e(t)} ( m e e = 0, σ ee2 = 1 – od poszczególnych próbek sygnału {e(t)} odjęto oszacowaną wartość oczekiwaną m b e, a następnie każdą z nich podzielono przez oszacowane odchylenie standardowe σ be ) oraz wykres funkcji gęstości rozkładu prawdopodobieństwa unormowanego rozkładu gaussowskiego z zaznaczonymi obszarami krytycznymi testu statystycznego dla przyjętego poziomu istotności α = 0,0027. Sygnał zawiera próbki „dobre“ i jeden znaczący impuls zakłócający. Ponieważ przyjęto, że obszar krytyczny jest dwustronny ( p (e e(t) < zd ) = p (e e(t) > zg ) = α/2, gdzie p (A) oznacza prawdopodobieństwo zdarzenia A, α – zakładany poziom istotności ), progi detekcji wyznaczone w oparciu o funkcję gęstości unormowanego rozkładu gaussowskiego są równe odpowiednio zd ' −3 σ ee = −3, zg ' 3 σ ee = 3. Jak można zauważyć pomimo tego, iż obszar dopuszczalności hipotezy H0 jest bardzo szeroki – aż 99,74%, czyli praktycznie wszystkie próbki „dobre“ powinny mieć poziom należący do przedziału < zd , zg > – dwie próbki nie będące zakłóceniem „znalazły się“ w obszarze krytycznym testu. Detektor pracujący w oparciu o tak przyjęte wartości zd oraz zg generowałby dużą liczbę błędów pierwszego rodzaju. Przykład ten pokazuje, że w tym jak i w wielu innych przypadkach sygnał błędów resztowych nie jest procesem gaussowskim. Testy opisane w pracy [1] pokazały, że dla sygnałów fonicznych należy stosować kryterium k σ, w którym współczynniki k spełnia warunek k ­ 3,5.. tekcji. W pracy [2] zaproponowano metodę opartą o analizę lokalnych histogramów sygnału. Z uwagi na zauważaną asymetrię ocen rozkładów prawdopodobieństwa progi detekcji zd oraz zg wyznaczano oddzielnie. Wartość zd odpowiadała poziomowi sygnału, dla którego ocena dystrybuanty, czyli skumulowana postać histogramu F (e(t)) (liczona od najmniejszej wartości {e(t)} do zd ) osiągnęła α/2, z kolei zg odpowiadało poziomowi sygnału, przy którym dopełnienie oceny dystrybuanty Φ(e(t)) = 1−F (e(t)) liczone od największej wartości {e(t)} do zg będzie równe α/2. Z uwagi na fakt, iż histogram budowano w oparciu o rzeczywiste próbki sygnału, których poziom praktycznie biorąc nigdy nie osiąga wielkich, małoprawdopodobnych wartości, otrzymywane oceny rozkładów miały obcięte ogony. W związku z tym progi detekcji obliczane z postaci skumulowanych rozkładów prawdopodobieństwa dawały „zaniżone“ wartości zd oraz zg . Autor zaproponował wprawdzie heurystyczną metodę poprawy działania detektora, jednak należało to rozwiązanie traktować jako tymczasowe, wymagające dalszych prac badawczych. W niniejszej pracy autor proponuje metodę pozwalającą na „odzyskiwanie“ obciętych ogonów ocen rozkładów poprzez zastosowania wygładzania histogramów za pomocą odpowiednio dobranych funkcji analitycznych. Z wcześniej zamieszczonych uwag wynika, że aproksymacja histogramów za pomocą krzywej Gaussa jest niecelowa ze względu na szybkie opadanie do zera ogonów rozkładu powyżej 3σ oraz poniżej −3σ (progi detekcji są zaniżone). Funkcje używane do wygładzania histogramów powinny zatem opadać do zera wolniej, co oznacza, że prawdopodobieństwo tego, iż moduł sygnału osiągnie wartość porównywalną z 3σ nie jest już bliski zera. W proponowanym rozwiązaniu do wygładzania histogramów autor zastosował funkcję gęstości rozkładu t-Studenta. Regulacji grubości ogonów rozkładu dokonuje się za pomocą jednego parametru nazywanego liczbą stopni swobody. Ze względu na asymetrię histogramu aproksymacja dokonywana była oddzielnie dla lewej oraz prawej jego części. Jako kryterium dopasowania funkcji analitycznej do oceny rozkładu zastosowano minimum średniego kwadratu błędów aproksymacji. Dane foniczne przetwarzane były blokowo ze stałym rozmiarem przedziału stacjonarności. P(Y) 0.4 120 8 3 1. 0.3. 0.2. Rys. 1: Standaryzowany sygnał błędów predykcji {e e(t)} oraz krzywa unormowanego gaussowskiego rozkładu prawdop. z zaznaczonymi wartościami krytycznymi testu statystycznego rozdzielającymi obszar dopuszczalności hipotezy H0 od obszarów krytycznych (hipoteza H1 ) dla poziomu istotności α = 0,0027 (kryterium 3 σ). Oś t – numery próbek.. 0.1. 0 −5. −4. −3. −2. −1. 0. 1. 2. 3. 4. Y. Rys. 2: Wykresy krzywych rozkładu t-Studenta dla kilku różnych wartości parametru v – liczby stopni swobody.. Powyższe spostrzeżenia skłoniły autora pracy do poszukiwania innych metod wyznaczania progów de-. PWT 2005 - POZNAŃ 8-9 GRUDNIA 2005. 5. 2/6.

(3) www.pwt.et.put.poznan.pl. 2. WYGŁADZANIE LOKALNYCH HISTOGRAMÓW SYGNAŁU FONICZNEGO. sygnału błędów resztowych w analizowanym bloku stacjonarności (o rozmiarze N ) przeprowadzana jest po zamianie {e(t)} do postaci standardowej {e e(t)}:. W pracy przyjęto, że zakłócony impulsowo sygnał foniczny {y(t)} opisany jest w przedziale stacjonarności zależnościami: y(t) = s(t) + z(t),. s(t) =. p X. aj s(t − j) + n(t), (1). j=1. gdzie aj , j = 1, . . . , p, oznaczają wartości współczynników AR, {s(t)} jest niezakłóconym sygnałem fonicznym, {n(t)} to szum wejściowy o nieznanym rozkładzie prawdopodobieństwa (posiadający wartość oczekiwaną mn = 0 i wariancję σn2 < ∞) formujący sygnał {s(t)}, a {z(t)} jest sygnałem zakłóceń impulsowych. W przypadku sygnałów fonicznych funkcja gęstości rozkładu prawdopodobieństwa {n(t)} ma najczęściej kształt zbiliżony do krzywej Gaussa. Poddając sygnał {y(t)} filtracji odwrotnej za pomocą filtru analizującego o skończonej odpowiedzi impulsowej (FIR), którego współczynnikami są oszacowania parametrów b aj , j = 1, . . . , p, otrzymuje się sygnał błędów resztowych {e(t)} o wartości oczekiwanej me ' 0 i wariancji σe2 < ∞ wyrażony równaniem: e(t) = y(t) −. p X. b aj y(t − j). (2). j=1. = s(t)+z(t) −. p X. b aj (s(t−j)+ z(t−j)).. j=1. Wprowadźmy oznaczenia n e(t) = n(t) + ∆n (t) = Pp aj s(t − j), ze(t) = z(t) + ∆z (t) = z(t) − s(t) − j=1 b Pp aj z(t−j), gdzie {e n(t)} oznacza szum wejściowy j=1 b powiększony o część {∆n (t)} powstałą na skutek błędów oszacowań parametrów modelu aj , j = 1, . . . , p, a {e z (t)} jest sygnałem zakłóceń impulsowych {z(t)} powiększonym o składową {∆z (t)} (składnik {∆z (t)} zawiera sumy ważone opóźnionych w czasie p wartości {z(t)}, oznacza to, że w {e z (t)} „rozmyte“ impulsy zanikają dłużej niż w sygnale {z(t)}). Wykorzystując wprowadzone oznaczenia równanie (2) można zapisać w postaci: e(t). = n e(t) + ze(t) = n(t) + [∆n (t) + ze(t)]. (3). Rozkład prawdopodobieństwa {e(t)} jest najczęściej podobny do rozkładu prawdopdobieństwa sygnału {n(t)} - składowa ∆n (t) jest niewielka, gdy stosowane są efektywne algorytmy estymacji parametrów {aj }, z kolei jeśli zakłócenia impulsowe w sygnale {e z (t)} nie pojawiają się nazbyt często (szum impulsowy nie jest zbyt intensywny), obydwa rozkłady prawdopodobieństw różnią się nieznacznie grubościami ogonów. Druga z własności oznacza, że funkcja gęstości rozkładu {e(t)} nieznacznie wolniej opada przy wzroście wartości poziomu sygnału (prawdopodobieństwo próbek o dużych poziomach jest większe), co powoduje niewielki wzrost modułów progów detekcji. Procedura wyznaczania za pomocą histogramu oceny unormowanego rozkładu prawdopodobieństwa. PWT 2005 - POZNAŃ 8-9 GRUDNIA 2005. ee(t) = (e(t) − me )/σe ,. (4). p. σe2 - jest średnim odchyleniem stangdzie σe = dardowym sygnału błędów resztowych. Histogram o M przedziałach jest tworzony po uporządkowaniu i pogrupowaniu względem poziomu wszystkich próbek {e e(t)} a następnie ustaleniu wartości parametrów takich jak: • rozpiętość szeregu ΛR = (emax −emin ), gdzie emax oraz emin są to odpowiednio największa i najmniejsza wartość sygnału {e e(t)} w danym bloku stacjonarności. • szerokość przedziałów Λp = ΛR /M, • górne i dolne granice przedziałów dΛi , gΛi : dΛi = emin + (i − 1) Λp , gΛi = emin + i Λp ,. i = 1, . . . , M,. i = 1, . . . , M,. Przedziały histogramu definiowane są następująco: ∆i = < dΛi , gΛi), i = 1, . . . , M − 1, ∆M = < dΛM , gΛM > Każdy przedział reprezentowany jest przez wartość środkową δi = ( gΛi + dΛi )/2. Procedura wyznaczania oceny rozkładu prawdopodobieństwa polega na klasyfikacji sygnału bloku stacjonarności {e e(t)} poprzez określenie przynależności poszczególnych jego próbek do przedziałów histogramu. Liczba próbek w przedziale L∆i , i=1,. . . ,M, podzielona przez rozmiar bloku N określa prawdopodobieństwo p∆i = L∆i /N tego, że sygnał {e e(t)} przyjmuje wartości z zakresu < dΛi , gΛi ). Dla uproszczenia przyjęto, iż wyznaczone prawdopodobieństwo odnosi się do wartości środkowej δi przedziału ∆i . Otrzymany histogram H poddawany jest następnie procesowi wygładzania, przy czym ze względu na swoją asymetrię względem zera (patrz rys. 3 c i d) operacja ta wykonywana jest oddzielnie dla części H− oraz H+ odpowiadających ujemnym i dodatnim wartościom {e e(t)}. W celu ułatwienia procesu aproksymacji H− i H+ za pomocą funkcji analitycznej, każda z części oceny rozkładu prawdopodobieństwa poddawana jest niezależnie normalizacji: X X e − = H− / e + = H+ / p∆i H p∆i H i∈M−. i∈M+. gdzie M− , M P P+ to indeksy przedziałów H− i H+ a p , p to sumy prawdopodobieństw ∆ i∈M− i∈M+ ∆i i obydwu części P histogramu. W P wyniku normalizacji otrzymuje się p e = 1, pe = 1, gdzie i∈M− ∆i i∈M+ ∆i P P wyrażenia pe , pe , są sumami prawi∈M− ∆i i∈M+ ∆i e − oraz H e+. dopodobieństw pe odpowiednio H ∆i. 3/6.

(4) www.pwt.et.put.poznan.pl. Jak już wspomniano we wstępie, do wygładzania histogramu sygnału {e e(t)} zastosowano funkcję rozkładu t-Studenta zapisaną równaniem f (e e(t), v) =. Γ((v + 1)/2) ee(t)2 −(v+1)/2 √ (1 + ) , v Γ(v/2) vπ. (5). gdzie współczynnik v zwany liczbą stopni swobody służy do sterowania grubościami ogonów funkcji rozkładu, Γ(·) – funkcja Gamma (patrz [4] e− i H e + aproksy– str 385). Każda z części H mowana była niezależnie, z wykorzystaniem kryterium najmniejszych kwadratów. Parametr v wybierany był ze skończonego zbioru wartości: V = {1, 2, 3, . . . , 29, 30, 40, 60, 120} (dla v > 100 kształt funkcji (5) jest praktycznie identyczny z kształtem funkcji gęstości rozkładu normalnego). Ze względu na niewielką liczność zbioru wybranych wartości zmiennej v, poszukiwanie dwóch optymalnych funkcji aproksymujących f− (e e(t), v) oraz f+ (e e(t), v) ode− i H e + odbywało się noszących się odpowiednio do H z zastosowaniem identycznej metody symulacyjnej. Schemat postępowania zostanie omówiony dla części f+ (e e(t), v): • dla kolejnych wartości współczynnika v wyznaczano zbiór wartości {f+ (δi , v)} funkcji rozkłae + (ardu t-Studenta dla środków przedziałów H gument δi ) z zakresu < 0, emax >, • {f+ (δi , v)} był normalizowany tak, by suma otrzymanego ciągu danych {fe+ (δi , v)} była równa 1 (każdy z elementów ciągu {f+ (δi , v)} był dzielony przez sumę wszystkich jego elementów), • obliczano sumę kwadratów błędów resztowych S+ (v) zgodnie z zależnością S+ (v) =. X. (e p∆i − fe+ (δi , v))2 ,. i∈M+. • optymalną wartość współczynnika v+opt wybierano w oparciu o kryterium: v+opt = min S+ (v). v∈V. W przypadku wyznaczania v−opt zbiór wartości {f− (δi , v)} funkcji rozkładu t-Studenta wyznaczano z zakresu < emin , 0) a dalej postępowano analogicznie.. 3. DETEKCJA ZAKŁÓCEŃ IMPULSOWYCH Dla standaryzowanego sygnału błędów resztowych o rozkładzie t-Studenta progi detekcji dolny zed i górny zeg odpowiadają takim wartościom ee(t), dla których spełnione są odpowiednio dwie równości: Z e zd. Z f (e e(t), v) de e = α/2,. −∞. ∞. e zg. f (e e(t), v) de e = α/2,. PWT 2005 - POZNAŃ 8-9 GRUDNIA 2005. co można zapisać w postaci F (e zd , v) = α/2,. Φ(e zg , v) = 1 − F (e zg , v) = α/2. gdzie F (e zd , v) oznacza dystrybuantę rozkładu tStudenta a Φ(e zg , v) uzupełnienie dystrybuanty F (e zg , v). Ze wzgledu na symetrię funkcji rozkładu powyższe dwa warunki można zapisać w formie: F (e zd , v) = α/2,. F (−e zg , v) = α/2.. Korzystając z powyższych oznaczeń funkcje detektora dla ujemnych i dodatnich wartości sygnału {e e(t)} można wyrazić zależnościami: F−d (v, α) = F−−1 (v, α/2). dla ee(t) ¬ 0 (6). F+d (v, α) = −F−−1 (v, α/2) dla ee(t) > 0 , gdzie F−−1 (v, α) oznacza funkcję odwrotną dystrybuanty rozkładu t-Studenta o v stopniach swobody dla ujemnych wartości standaryzowanego sygnału błędów resztowych: ee(t) ∈<−∞, 0). Ostatecznie progi detekcji zd i zg niestandaryzowanego sygnału {e(t)} można wyznaczyć korzystając z równań: zd = F−d (v−opt , α) σe + me , zg = F+d (v+opt , α) σe + me , Wiedząc, że me ' 0, powyższe zależności można przekształcić do postaci: zd ' F−d (v−opt , α) σe = F−−1 (v−opt , α/2) σe , zg ' F+d (v+opt , α) σe = −F−−1 (v+opt , α/2) σe . Jak można zauważyć, progi detekcji są wielokrotnościami średniego odchylenia standardowego sygnału {e(t)}. Analizując własności proponowanego algorytmu detekcji stosowano jedynie dwie wartości współczynnika α = {0,05; 0,0027}. Wybór taki nie był przypadkowy, gdyż gdyby sygnał błędów resztowych miał rozkład gaussowski, co oznaczałoby, że v+opt = v−opt  100, zmienne zd oraz zg byłyby równe odpowiednio: dla α = 0,05: zd = −1,96 σe , zg = 1,96 σe , dla α = 0,0027: zd = −3 σe , zg = 3 σe (tzw. kryterium 3 σ) – wartości te można odczytać z tablic rozkładu normalnego. W tabeli (1) zamieszczono wartości funkcji detektora F+d (v, α) (dla dodatnich próbek {e e(t)}) w zależności od wybranego zbioru wartości v (liczba stopni swobody) i poziomu istotności α = {0,05; 0,0027}. Jak można zauważyć, dla danej wielkości α uzyskiwane wielokrotności σ (wartości funkcji detektora) są większe niż dla rozkładu gaussowskiego. Obserwowana zależność pogłębia się w miarę malenia współczynnika v. Oznacza to, że proponowany algorytm detekcji jest bardziej tolerancyjny dla zakłóceń – wykrywa jedynie znaczące zniekształcenia sygnału, popełnia mniej błędów pierwszego rodzaju polegających na kwestionowaniu próbek dobrych o poziomach przekraczających wartość 3σ. W celu zapamiętania informacji o momentach występowania zakłóceń tworzony jest pomocniczy sy-. 4/6.

(5) www.pwt.et.put.poznan.pl. Liczba stopni swobody v. 0,0027. Poziom istotności α 0,01. 0,05. 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120. 19.207 9.219 6.621 5.507 4.904 4.530 4.277 4.095 3.957 3.850 3.765 3.695 3.636 3.587 3.545 3.508 3.476 3.448 3.423 3.400 3.380 3.362 3.345 3.330 3.316 3.304 3.292 3.281 3.271 3.199 3.130 3.064. 9.925 5.841 4.605 4.033 3.708 3.500 3.356 3.250 3.170 3.106 3.055 3.013 2.977 2.947 2.921 2.899 2.879 2.861 2.846 2.832 2.819 2.808 2.797 2.788 2.779 2.771 2.764 2.757 2.750 2.705 2.661 2.618. 4.303 3.183 2.777 2.571 2.447 2.365 2.307 2.263 2.229 2.201 2.179 2.161 2.145 2.132 2.120 2.110 2.101 2.094 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.049 2.046 2.043 2.022 2.001 1.980. Tabela 1: Funkcja detektora (opis w tekście) dla wybranych wartości poziomu istotności α oraz liczby stopni swobody v. gnał {d(t)}, zawierający zero-jedynkowe dane zakodowane zgodnie z regułą:  0 gdy zd ¬ e(t) ¬ zg d(t) = 1 gdy e(t) < zd lub e(t) > zg. 4. WYNIKI DOŚWIADCZALNE Testując własności proponowanego algorytmu detekcji analizowano sygnały foniczne odczytane z analogowych płyt gramofonowych, zawierające typowe dla tego typu nośnika zakłócenia impulsowe. Głównie były to nagrania muzyki klasycznej, próbkowane z częstotliwością 44100 Hz oraz rozdzielczością 16 bitów. W trakcie badań ustalono empirycznie, że dla bardzo wielu sygnałów fonicznych wystarczy przyjmować długości przedziałów stacjonarności równe: 128, 256 lub 512 próbek sygnału. Najczęściej stosowano bloki danych o rozmiarach 256 próbek (taki rozmiar bloku danych stosowano w omawianych dalej przykładach). Na rys. 3 a zamieszczono blok próbek przykładowego sygnału {y(t)}, poniżej przedstawiono {e(t)} – sygnał błędów resztowych – uzyskany w wyniku filtracji {y(t)} za pomocą filtru wybielającego o współczynnikach równych parametrom modelu AR rzędu p = 10. Parametry oszacowano stosując blokową postać algorytmu Burga [3], a wariancję {e(t)} poprzez uśrednianie kwadratu błędów resztowych [2]. Histogram wyznaczono w oparciu o standaryzowany sygnał błędów resztowych {e e(t)} (patrz zależność (4)). Początkowo w badaniach analizowano dwa przypadki wygładzania histogramu: a) za pomocą jednej funkcji aproksymującej f (e e(t), vopt ) (rys. 3 c), b) przy użyciu dwóch funkcji f− (e e(t), vopt ) i e− i H e + (rys. 3 d). f+ (e e(t), vopt ) – oddzielnie dla H Ostatecznie ze względu na często zauważalną asymetrię histogramów względem zera, w dalszych ba-. PWT 2005 - POZNAŃ 8-9 GRUDNIA 2005. daniach zdecydowano się na metodę dwuczęściowego wygładzania. a) 5000 y(t) 0 −5000. 50. 100. 50. 100. 150. 200. t. 250. 150. 200. t. 250. b) 500 e(t) 0 −500. c). e H d). e H. 0.1. e. f (e(t), vopt ) .. 0.05. 0 −4 0.1. 0.05. 0 −4. −3. −2. −1. 0. −2. 2. 3. ∼ e(t) 4. 3. ∼ e(t) 4. e. e. f+ (e(t), vopt ) ↓. f− (e(t), vopt ) ↓ −3. 1. −1. 0. 1. 2. Rys. 3: Wygładzanie histogramu standaryzowanego sygnału błędów resztowych {e e(t)} za pomocą jednej (rys. c) oraz dwóch (rys. d) funkcji aproksymujących. Rys. a - sygnał wejściowy, Rys. b - niestandaryzowany sygnał błędów resztowych. Na pierwszych dwóch wykresach oś pionowa to amplituda sygnału, a oś pozioma to numery próbek. Na rys. 4 zilustrowano proces detekcji zakłóceń impulsowych we fragmencie zniekształconego sygnału muzycznego. Rys. 4 a zawiera wykres analizowanego sygnału {y(t)} z wyraźnie widocznym jednym impulsem zakłócającym. Kolejne dwa wykresy 4 b i 4 c zawierają sygnał błędów resztowych uzyskany na wyjściu filtru analizującego o współczynnikach równych oszacowanym parametrom modelu AR rzędu p = 10. Na rysunku 4 c dodatkowo umieszczono linie łamane będące wykresami odchylenia standardowego σe (t) oraz zanegowanego odchylenia standardowego −σe (t). Jak można zauważyć, w sygnale błędów resztowych występują dodatkowe dwa impulsy zakłócające, które ze względu na niski poziom są z trudem zauważalne w sygnale {y(t)}. Na rys. 4 d–f zamieszczono sygnały uzyskiwane w procesie detekcji zakłóceń opartym o „dwuczęściowe“ wygładzanie histogramów (detektor nr 1) przy zastosowaniu poziomu istotności α = 0,0027 (odpowiednik reguły 3 σ). Rys. 4 d zawiera wykres funkcji detektora (w trakcie procesu optymalizacji zmienną v wybierano z zakresu v ∈< 4, 120 >). Jak można zauważyć, moduły wartości funkcji detektora odpowiadające progom górnym oraz dolnym najczęściej różnią się od siebie. Na rys. 4 e zamieszczono sygnał błędów resztowych wraz z progami detekcji zd1 (t) i zg1 (t). Jak widać, wyznaczone progi detekcji nie zawsze „są skorelowane“ z poziomem sygnału. Rys. 4 f zawiera wykres sygnału {d1 (t)} otrzymanego na wyjściu detektora. „Jedynki“ oznaczają wykryte zakłócenia. Poniżej na rys. 4 g znajduje się wykres sygnału, w którym umieszczono zakwestionowane próbki {e(t)} (sygnał powstał przez wymnożenie próbek sygnałów {e(t)} i {d1 (t)}). Dla porównania na rys. 4 h–j zilustrowano proces detekcji zakłóceń oparty na założeniu o gaussowskim charakterze sygnału {e(t)} i zastosowniu reguły 3 σ (detek-. 5/6.

(6) www.pwt.et.put.poznan.pl. tor nr 2). Rys. 4 h zawiera sygnał {e(t)} wraz z progami zd2 (t) i zg2 (t) wyzaczonymi w oparciu o oszacowanie wariancji (średni kwadrat błędów resztowych). Na rysunkach 4 i oraz 4 j zamieszczono odpowiednio: sygnał wyjściowy detektora {d2 (t)} i sygnał zawierający zakwestionowane próbki {e(t)}. Jak można zauważyć, obydwa detektory wykryły wszystkie zakłócenia impulsowe, jednak detektor nr 1 popełnił mniej błędów pierwszego rodzaju. Analizując wiele podobnych sygnałów fonicznych zaobserwowano, że przy stosunkowo małych rozmiarach bloków danych (128, 256 próbek) mniej błędów polegających na zakwestionowaniu próbek „dobrych“ popełnia detektor oparty o wygładzanie histogramów. W przypadku zwiększania rozmiaru bloku, detektor nr 1 stopniowo „upodabnia się“ do detektora nr 2 – histogramy są aproksymowane z minimalnym błędem za pomocą funkcji rozkładu t-Studenta o liczbie stopni swobody v zbliżającej się do 120. a). 5000 0. y(t). −5000 −10000. b). 7400. 7600. 7800. 8000. 8200. 8400. 8600. 8800. 9000. 9200. t. 7600. 7800. 8000. 8200. 8400. 8600. 8800. 9000. 9200. t. 7800. 8000. 8200. 8400. 8600. 8800. 9200. t. 9000. 9200. t. 8000 6000 4000 2000 0 −2000. e(t). 7400. c). σe (t). 500. e(t). 0. −σe (t). −500 7400. d). 7600. F. 5. +d. 9000. (v, α, t). 0. F. −5 7400. e). 7600. 7800. 2000. e(t). 8200. 8400. 8600. −d. (v, α, t) 8800. zg (t) 1. 0. −2000. f). 8000. zd (t) 1 7400. 7600. 7800. 8000. 8200. 8400. 8600. 8800. 9000. 9200. t. 7400. 7600. 7800. 8000. 8200. 8400. 8600. 8800. 9000. 9200. t. 1.5. d1 (t). 1. 5. WNIOSKI KOŃCOWE W pracy omówiono nową metodę wykrywania zakłóceń impulsowych powstających na skutek transmisji, zapisu i przechowywania analogowych sygnałów fonicznych. Algorytm jest odmianą parametrycznego detektora zakłóceń, wykorzystującego model autoregresyjny sygnału. Oparty jest o analizę ocen rozkładów prawdopodobieństw (histogramów) błędów resztowych otrzymywanych na wyjściu filtru analizującego o współczynnikach równych parametrom modelu AR. W algorytmie tym wyznaczanie wartości progowych detektora oparte jest na wygładzonych za pomocą funkcji analitycznej histogramach sygnału, obliczonych w kolejnych przedziałach stacjonarności. Jako funkcję wygładzającą zastosowano funkcję rozkładu t-Studenta, w której grubość ogonów można regulować jednym parametrem – nazywanym liczbą stopni swobody. Ze względu na często pojawiającą się asymetrię ocen rozkładów zastosowano dwuczęściowe wygładzanie, oddzielnie dla ujemnych, oddzielnie dla dodatnich wartości sygnału błędów resztowych. Zaproponowany algorytm porównano z metodą opartą na założeniu o gaussowskim charakterze sygnału błędów resztowych – jest to rozwiązanie opracowane i stosowane przez autora we wcześniejszych pracach. Porównując efekty działania obydwu algorytmów można zauważyć, że nowe rozwiązanie detektora wykazuje się równie dobrą skutecznością wykrywania zakłóceń impulsowych przy czym dla bloków stacjonarności o małych rozmiarach generuje mniej błędów detekcji pierwszego rodzaju – mniej próbek „dobrych“ uznawanych jest za zakłócenie. Ze wzrostem rozmiarów bloków własności detekcyjne obydwu algorytmów upodabniają się do siebie. W dalszych pracach należałoby zbadać możliwość zastosowania innych metod wygładzania histogramów np. za pomocą funkcji uogólnionego procesu gaussowskiego lub sumy ważonej kilku funkcji rozkładu normalnego.. 0.5 0. g). e(t) · d1 (t) 0 −2000. h). 2000. e(t). 7400. 7600. 7800. 8000. 8200. 8400. 8600. 8800. 9000. 9200. t. zg2 = 3 · σe (t). 0. zd. −2000. i). 7400. 7600. 7800. 8000. 8200. 8400. 2. 8600. = −3 · σe (t) 8800. 9000. 9200. t. 1.5. d2 (t). 1. 0.5 0. j). SPIS LITERATURY. 2000. 7400. 7600. 7800. 8000. 8200. 8400. 8600. 8800. 9000. 9200. t. [1] Cisowski K.: Adaptacyjna filtracja i rekonstrukcja sygnałów fonicznych. Rozprawa doktorska, Politechnika Gdańska, Gdańsk, 2000. [2] K. Cisowski, Proc. Poznańskie Warsztaty Telekomunikacyjne PWT2004, Poznań, 9–10 grudnia 2004, str. 131–136. [3] S. L. Marple Jr., “Digital spectral analysis with applications”, Prentice-Hall. Inc. Englewood Cliffs, New Jersey 07632, 1987.. 2000. e(t) · d2 (t) 0 −2000. 7400. 7600. 7800. 8000. 8200. 8400. 8600. 8800. 9000. 9200. t. Rys. 4: Przykład detekcji zakłóceń impulsowych w sygnale fonicznym. Szczegółowy opis wykresów zamieszczono w tekście. Oś pionowa – amplituda sygnału, oś pozioma – numery próbek.. PWT 2005 - POZNAŃ 8-9 GRUDNIA 2005. [4] Kay S. M.: Fundamentals of Statistical Signal Processing, Volume II Detection Theory. Prentice Hall PTR, Prentice-Hall, Inc. Upper Saddle River. New Jersey 07458, 1998.. 6/6.

(7)

Cytaty

Powiązane dokumenty

Do ograniczenia długości odpowiedzi impulsowych (ucięcia) wykorzystano zmodyfikowane okno Blackmana [4]. Obwiednie a rz znormali- zowano do ich maksymalnych

Tego rodzaju fałszywych alarmów można by uniknąć poprzez rozdzielenie sygnału na dwie części, z których jedna zawierałaby wyłącznie wolnozmienne składowe

Klasyczna metoda momentów wykorzystuje odpowiedź impulsową układu, natomiast w referacie, proponuje się sposób wykorzystania metody momentów dla odpowiedzi

Technika filtracji bazująca na estymacji widma szumu, z wykorzystaniem rozkładu na wartości szczególne, jest jedną ze skutecznych metod filtracji szumu.. Rozkład na

Porównanie poziomu zakłóceń radioelektrycznych emitowanych przez silnik w stanie obciążenia i biegu jałowego można przeprowadzić na podstawie

W pierw- szej, w której dokonywana jest wstępna selekcja da- nych, progi wyzwalania detektora wyznaczane są w oparciu o znany rozkład prawdopodobieństwa sygna- łu {e(t)} jako

Opracowany detektor ma dobre własności wykrywa- nia zakłóceń impulsowych w sygnałach fonicznych w szczególności, gdy analizowany sygnał nie jest proce- sem gaussowskim..

Jeśli żaden wektor ofertowy nie będzie poprawiał aktualnego wyniku i wszystkie sztuczne zmienne wynoszą zero (z założoną dokładnością), to oznacza to, że