ZASTOSOWANIE TESTÓW STATYSTYCZNYCH DO DETEKCJI ZAKŁÓCEŃ IMPULSOWYCH W SYGNAŁACH FONICZNYCH

(1)

2004

Poznańskie Warsztaty Telekomunikacyjne Poznań 9 - 10 grudnia 2004 Krzysztof Cisowski

Politechnika Gdańska, Wydział ETiI Katedra Systemów Automatyki,

ul. G. Narutowicza 11/12, 80-952 Gdańsk, e-mail: krci@eti.pg.gda.pl

ZASTOSOWANIE TESTÓW STATYSTYCZNYCH DO DETEKCJI ZAKŁÓCEŃ IMPULSOWYCH W SYGNAŁACH FONICZNYCH

Streszczenie: Artykuł poświęcony jest omówie- niu opartej o testy statystyczne metody detek- cji zakłóceń impulsowych występujących w sygna- łach fonicznych. We wstępie scharakteryzowano ogólnie zasadę działania parametrycznych detek- torów zniekształceń. Następnie omówiono pod- stawowe rodzaje zakłóceń impulsowych typowych dla archiwalnych i współczesnych sygnałów fonicz- nych. Szczegółowo przedstawiono podstawy teo- retyczne parametrycznych detektorów cyfrowych.

Omówiono ideę wykorzystania testów statystycz- nych do detekcji zakłóceń impulsowych. Na koniec przedstawiono wyniki doświadczalne, w których dokonano porównania własności zaproponowane- go algorytmu z metodą opartą o analizę wariancji sygnałów.

1. WSTĘP

W artykule omówiono nową parametryczną me- todę detekcji zakłóceń impulsowych sygnałów fonicz- nych wykorzystującą własności statystyczne analizo- wanych sygnałów. Metoda pozwala na wykrywanie zakłóceń powstających w analogowych torach fonicz- nych, w których zniekształcenia mają charakter po- jedynczych impulsów, grup impulsów lub zakłóceń o złożonym charakterze.

W proponowanym algorytmie zakłada się, że sy- gnał foniczny {y(t)} jest lokalnie stacjonarnym pro- cesem autoregresyjnym (AR) rzędu p. Sygnał {y(t)}

poddawany jest wstępnej filtracji za pomocą fil- tru analizującego (wybielającego) o współczynnikach równych parametrom modelu AR. Otrzymany sygnał błędów resztowych {e(t)} ma w porównaniu z {y(t)}

zmniejszoną wartość stosunku sygnał/szum, dzięki czemu nieciągłości wprowadzane do sygnału przez za- kłócenia impulsowe są bardziej wyeksponowane – ła- twiejsze do wykrycia. Proces detekcji zniekształceń w {e(t)} polega na porównaniu amplitudy chwilowej sygnału z pewną wartością progową, ustalaną w spo- sób zależny od zastosowanego algorytmu detekcji. Sy- gnał błędów resztowych uzyskany w procesie dekore- lacji (wybielania) {y(t)} ma charakter szumu białego o nieznanym rozkładzie prawdopodobieństwa. Stosu- jąc dodatkowe założenie o gaussowskim charakterze szumu wejściowego {n(t)} formującego {y(t)} moż- na przyjąć, że {e(t)} ma rozkład zbliżony do rozkła-

du normalnego. W dotychczasowych pracach autora (patrz [5], [2]) zakładano, że {n(t)} a tym samym {e(t)} mają rozkład gaussowski oraz poziom odnie- sienia detektora ustalany był jako wartość chwilo- wa oszacowania średniego odchylenia standardowego p b σ

²_n

(t) sygnału {n(t)} (b σ

_n²

(t) – wariancja {n(t)}).

W proponowanym rozwiązaniu brak jest założeń o gaussowskim charakterze {n(t)} (i {e(t)}). Nieznany rozkład prawdopodobieństwa sygnału błędów resz- towych jest estymowany za pomocą histogramu. W oparciu o oszacowanie rozkładu prawdopodobieństwa ustalane są dwa progi detekcji: dolny i górny. Progi te odpowiadają wartościom krytycznym z

d

oraz z

g

testu statystycznego, w którym dla danego poziomu istotności α weryfikowane są dwie hipotezy dotyczące przynależności (lub jej braku) poszczególnych próbek {e(t)} do zbioru próbek nadmiarowych. Hipoteza ze- rowa H

o

mówi, że w chwili t

i

dana próbka sygnału e(t

_i

) nie jest nadmiariowa (z

_d

¬ e(t

_i

) ¬ z

_g

z praw- dopodobieństwem równym 1 − α) a hipoteza alterna- tywna H

1

zakłada, że e(t

i

) jest nadmiarowa - zawie- ra zakłócenie impulsowe (e(t

i

) > z

g

lub e(t

i

) < z

d

z prawdopodobieństwem równym α). W trakcie we-

ryfikacji hipotez można popełniać dwa błędy: błąd I

rodzaju – gdy niezakłócona impulsowo próbka sygna-

łu (próbka „dobra“) zostanie uznana za zakłóconą lub

błędy II rodzaju - gdy próbka zakłócona impulsowo

zostanie potraktowana jako próbka „dobra“. Ponie-

waż zakłada się dodatkowo, że sygnał {y(t)} a tym sa-

mym {e(t)} jest lokalnie stacjonarnym procesem loso-

wym, estymacja rozkładu prawdopodobieństwa oraz

wyznaczanie wartości krytycznych z

d

oraz z

g

przepro-

wadza się dla poszczególnych przedziałów stacjonar-

ności. W proponowanym rozwiązaniu stosowane jest

blokowe przetwarzanie danych, w którym dla ustalo-

nego rozmiaru segmentu (odpowiadającego długości

przedziału stacjonarności) sygnał {y(t)} dzielony jest

na jednakowe bloki, w których wyznaczane są: para-

metry modelu AR, sygnał błędów resztowych oraz

histogram {e(t)}. Dla przyjętego poziomu istotności

obliczane są wartości z

d

oraz z

g

. Wszystkie próbki

{e(t)} należące do danego bloku danych są porów-

nywane z wartościami progowymi. Wyniki porówna-

nia zapisywane są w specjalnym pliku, w którym je-

dynymi niezerowymi danymi są te, których indeksy

odpowiadają próbkom nadmiarowym. Próbki zakwe-

stionowane przez detektor w chwili t

i

zapisywane są

(2)

w postaci e(t

i

) − z

d

gdy e(t

i

) < z

d

lub e(t

i

) − z

g

gdy e(t

i

) > z

g

. Lokalny histogram sygnału oblicza- ny jest w oparciu o stosunkowo niewielką liczbę da- nych. Uzyskiwane przybliżenia rozkładu prawdopo- dobieństwa mają zatem niedoszacowane tzw. „ogo- ny“, czyli fragmenty rozkładu odpowiadające bardzo mało prawdopodobnym wartościom e(t) (wartościom sygnału dużo mniejszym od z

d

oraz dużo większym od z

_g

). Wartości krytyczne wyznaczane na podstawie histogramu są zbyt „pesymistyczne“ (z

d

powinno być

„nieco“ mniejsza a z

g

powinno byś „nieco“ większe).

Na skutek powyższej własności część próbek sygna- łu {e(t)} o lokalnie największych poziomach lokuje się w obszarze odrzuceń hipotezy H

o

i jest traktowa- na jako zakłócenie impulsowe. Algorytm detekcji pró- bek nadmiarowych musi zatem zawierać drugi etap, w którym analizowany jest plik z wynikami detek- cji uzyskanymi w pierwszym etapie: wartości bliskie zeru traktowane są jako błędy pierwszego rodzaju i wskazania tych danych są usuwane z pliku detekto- ra. Ostatecznie tworzony jest drugi plik detektora za- wierający zero-jedynkową informację o próbkach nad- miarowych – „1“ zakłócenie, „0“ brak zakłócenia.

2. TYPY ZAKŁÓCEŃ IMPULSOWYCH Zakłócenia impulsowe występujące w sygnałach fonicznych można klasyfikować na wiele sposobów (odpowiednie przykłady można znaleźć w pracach [2]

oraz [6]). Jednym z kryteriów podziału może być ro- dzaj toru akustycznego, w którym sygnał foniczny jest transmitowany bądź przetwarzany.

2.1. Zakłócenia impulsowe powstające w analogowych torach fonicznych

Najbardziej charakterystycznymi zakłóceniami występującymi w analogowych torach fonicznych są zniekształcenia pojawiające się przy odczycie gra- mofonowych nagrań fonicznych. Mechaniczne urzą- dzenie odczytujące (igła gramofonowa) napotkawszy uszkodzenie rowka płyty, wytwarza w przetworniku mechaniczno-elektrycznym impuls elektryczny. Wiel- kość oraz kształt impulsu uzależnione są od stopnia uszkodzenia rowka (rozmiaru nieciągłości nośnika).

Zakłócenia tego typu można podzielić na pojedyncze impulsy (lub grupy pojedynczych impulsów) oraz im- pulsy złożone (przejściowe).

6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200

−4000

−2000 0 2000 4000 6000 8000

t [num. próbek]

y(t)

Rys. 1: Przebieg czasowy przykładowo wybranego fragmentu nagrania muzycznego zarejestrowanego na płycie gramofonowej zawierającego kilka pojedyn- czych zakłóceń impulsowych.

Pojedyncze impulsy o czasie trwania do 10 ns (wg. [4]) lub grupy pojedynczych impulsów o łącz- nym czasie trwania od kilkuset ns do 3 ms (wg.

[6]) stanowią podstawowy rodzaj zakłóceń impulso- wych pojawiających się w sygnałach otrzymanych przy odczycie gramofonowych nagrań fonicznych.

Pojedyncze impulsy składają się z kilku do kilku- nastu próbek i mają najczęściej kształt taki jak na Rys. 1. Zakłócenia tego typu można traktować ja- ko odpowiedź impulsową analogowego kanału trans- misyjnego, przez który przesłano zakłócenia w po- staci zmodulowanej amplitudowo delty Kroneckera

δ(t) =

n 1 dla t = 0 0 dla t 6= 0

.

250 0 -250

0 400 800 1200 t

y(t)

Rys. 2: Przykład zakłócenia impulsowego przejścio- wego wg. [6] (Oś t – numery próbek).

Impulsy złożone (przejściowe) różnią się od po- jedynczych impulsów dłuższymi czasami trwania, większą energią, innym rozkładem energii w wid- mie (składowe niskoczęstotliwościowe dominują) oraz rzadszym występowaniem. Budowa impulsu złożone- go to najczęściej krótki, o stromych zboczach im- puls początkowy oraz następujące po nim zanikają- ce niskoczęstotliwościowe oscylacje. Dobrym przykła- dem impulsu złożonego jest sygnał uzyskany w wyni- ku odtwarzania na gramofonie płyty analogowej po- siadającej głęboką rysę. Fizyczna nieciągłość nośnika powoduje, że igła systemu odczytującego po chwi- lowej utracie kontaktu z powierzchnią nośnika ude- rza z dużą siłą w przeciwległy brzeg rysy i konty- nuuje odtwarzanie przerwanego rowka płyty. Kształt impulsu wynika z własności elektro–mechanicznych układu odczytującego. W pierwszej fazie jest to od- powiedź układu na nieciągłość nośnika, a w drugiej – wynik występowania rezonansów własnych (zani- kające oscylacje nałożone w sposób addytywny na sygnał). Czas trwania fazy pierwszej wynosi 1 − 5 ms a fazy drugiej jest dłuższy i wynosi do 50 ms [6].

Przykład zakłócenia impulsowego przejściowego za- mieszczono na Rys. 2.

2.2. Zakłócenia impulsowe powstające w cyfrowych torach fonicznych

Zakłócenia impulsowe generowane przez cyfrowe tory foniczne związane są z błędami numerycznymi powstającymi w wyniku przesyłania, przetwarzania, bądź przechowywania zakodowanych cyfrowo sygna- łów fonicznych.

5200 5300 5400 5500 5600 5700 5800 5900 6000

−2 0 2

x 10⁴

a) b) c)

t y(t)

Rys. 3: Przykłady kilku rodzajów cyfrowych zakłóceń

impulsowych. (Oś t – numery próbek).

(3)

Przykładami źródeł zakłóceń cyfrowych mo- gą być: „obcinanie“ próbek sygnału w przetworniku analogowo-cyfrowym po przekroczeniu dozwolonego poziomu amplitudy (Rys. 3a), błędy numeryczne al- gorytmów przetwarzania sygnałów (Rys. 3b), utra- ta bloków próbek w trakcie transmisji danych (bra- kujące próbki zastępowane są najczęściej zerami - Rys. 3c) itp. Cechą charakterystyczną jest to, że na raz powstałe zakłócenia w żaden sposób nie oddzia- ływują dalsze elementy cyfrowego toru fonicznego.

3. CYFROWY PARAMETRYCZNY DETEKTOR ZAKŁÓCEŃ

IMPULSOWYCH

Detektory parametryczne wykorzystują w pro- cesie detekcji modelowanie sygnałów – zakłócenia im- pulsowe poszukiwane są nie w samym sygnale {y(t)}, lecz w sygnale błędów modelowania {e(t)}. Wykorzy- stywane jest przy tym spostrzeżenie, że proces ró- zniczkowania sygnału fonicznego (na ogół silnie we- wnętrznie skorelowanego) powoduje znaczne uwypu- klenie nieciągłości wprowadzanych do sygnału przez zakłócenia impulsowe. Operacja różniczkowania od- powiada dekorelacji lub widmowemu wybielaniu sy- gnału, stąd zastosowanie metod dekorelacji opartych o modelowanie daje poprawę wykrywalności zakłó- ceń. W dotychczas stosowanych przez autora rozwią- zaniach opisanych w [1], [2], [3] oraz [5] wykorzysty- wane były modele AR. Przyjmijmy, że zakłócony im- pulsowo sygnał foniczny {y(t)} opisany jest zależno- ściami:

s(t) = X

p j=1

a

j

s(t − j) + n(t), y(t) = s(t) + z(t), (1) gdzie a

j

, j = 1, . . . , p, oznaczają wartości współczyn- ników AR, {s(t)} jest niezakłóconym sygnałem fo- nicznym, {n(t)} to szum wejściowy (o wartści oczeki- wanej m

n

= 0 i wariancji σ

²_n

< ∞) formujący sygnał {s(t)}, a z(t) = A

₀

δ(t − t

₀

) jest sygnałem zawiera- jącym zakłócenie impulsowe o amplitudzie A

0

poja- wiające się w chwili t

0

. Poddając sygnał {y(t)} filtra- cji odwrotnej za pomocą filtru analizującego o skoń- czonej odpowiedzi impulsowej (FIR), którego współ- czynnikami są parametry a

j

, j = 1, . . . , p, otrzymuje się sygnał błędów resztowych {e(t)} o wartści ocze- kiwanej m

e

= 0 i wariancji σ

_e²

< ∞ wyrażony rów- naniem:

e(t) = y(t) − X

p j=1

a

j

y(t − j) (2)

= s(t)+z(t) − X

p j=1

a

j

(s(t−j)+ z(t−j)).

Korzystając z zależności n(t) = s(t)− P

_p

j=1

a

j

s(t−j) równanie (2) można zapisać w postaci:

e(t) = n(t) + z(t) − X

p j=1

a

_j

z(t − j) (3)

= n(t) + z(t) + ∆

z

(t),

gdzie ∆

z

(t) = −A

0

h(t − t

0

− 1), przy czym h(t) = P

_p

j=1

a

j

δ(t − j) jest odpowiedzią impulsową filtru analizującego. Składnik ∆

z

(t) jest więc sygnałem za- wierającym „rozmyty“ przez filtr wybielający poje- dynczy impuls zakłócenia. Pojawia się on tuż za im- pulsem pierwotnym wydłużając czas trwania zakłó- cenia o p okresów próbkowania. W chwili t

0

sygnały y(t

0

) oraz e(t

0

), są równe odpowiednio (∆

z

(t

0

) = 0):

e(t

0

) = n(t

0

) + A

0

, y(t

0

) = s(t

0

) + A

0

, (4) przy czym n(t

0

) s(t

0

). Jeśli w próbce sygnału y(t

0

) poziom zakłócenia A

0

jest porównywalny z poziomem s(t

0

) (detekcja takiego zakłócenia byłaby trudna lub wręcz niemożliwa), w e(t

0

) dominującym składnikiem jest zakłócenie, gdyż n(t

0

) A

0

. Jak widać w chwili t

0

zakłócenie w sygnale {e(t)} ma znacznie wyższy względny poziom niż w sygnale {y(t)}, stąd detek- cja zakłócenia w {e(t)} jest łatwiejsza. Przez p chwil czasu następujących po chwili t = t

0

zależność (3) przyjmuje postać

e(t) = n(t) − A

0

a

t−t0

, t = t

0

+1, . . . , t

0

+p, podczas gdy (1) wyraża się równaniem

y(t) = s(t), t = t

0

+ 1, . . . , t

0

+ p.

Sygnał {e(t)} zawiera zatem składniki, których od- powiedniki nie występują w sygnale {y(t)}. Powstałe

„zaburzenie“ może powodować fałszywe alarmy de- tektora, a w szczególności wydłużanie czasu wskazań obecności zakłócenia.

Powyższe wnioski bardzo łatwo można przenieść na przypadek, gdy impuls zakłócenia składa się z M próbek występujących się w sygnale {z(t)} od chwili t = t

0

, tj.

z(t) =

M −1

X

i=0

A

i

δ(t − (t

0

− i)).

Impuls taki po przejściu przez filtr analizujący o od- powiedzi impulsowej h(t) ulegnie rozmyciu. W sy- gnale {e(t)} jego przetransformowane składniki będą występowały przez p + M chwil czasu w przedziale t= t

0

, . . . , t

0

+ p +M −1. Niezniekształcona będzie je- dynie pierwsza próbka zakłócenia o amplitudzie A

0

występująca w chwili t = t

0

(patrz pierwsze z dwóch równań (4)). Poprawa wykrywalności pierwszej prób- ki zakłócenia złożonego z wielu impulsów jest ta- ka sama, jak zakłócenia składającego się z impul- su pojedynczego (porównaj (4)). Pewne zniekształ- cenie kolejnych M − 1 próbek zakłócenia nieco ten stan pogarsza, jednak nadal zakłócenie takie łatwiej jest wykryć w sygnale {e(t)} niż {y(t)}. Pewien pro- blem mogą stanowić dodatkowe próbki z przedziału t = t

0

+M −1, . . . , t

0

+p+M −1, których odpowiedni- ki nie występują w sygnale {y(t)}. Często powodują one niepotrzebne wydłużanie czasu wskazań obecno- ści zakłócenia.

Detekcja zakłóceń impulsowych w sygnale błę-

dów resztowych {e(t)} oparta jest na założeniu, że

(4)

szum wejściowy {n(t)} jest gaussowskim procesem lo- sowym.Próbki {e(t)} są segregowane do dwóch wza- jemnie rozłącznych zbiorów: danych niezakłóconych oraz zakłóconych – próbek nadmiarowych. Klasyfika- cja sygnału przeprowadzana jest w oparciu o znaną ze statystyki regułę 3σ, w myśl której w danej chwili czasu t

i

sygnał e(t

i

) reprezentuje zakłócenie impul- sowe, gdy spełniony jest warunek:

| e(t

i

) | > 3b σ

n

(t

i

). (5) gdzie b σ

n

(t

i

) = p

b

σ

_n²

(t

i

), b σ

_n²

(t

i

) – jest oszacowaniem wariancji szumu wejściowego w chwili t

i

. Warunek ten oznacza, że próbka e(t

i

) traktowana jest jako za- kłócona impulsowo, gdy przekracza poziom osiągany przez {n(t)} z bardzo małym prawdopodobieństwem, mniejszym od 0,003 [5].

Warunek powyższy można również opisać na gruncie teorii weryfikacji hipotez statystycznych. W związku z tym formułujemy hipotezę zerową H

0

mó- wiącą, ze poziom próbki e(t

i

) jest niewielki, tylko nieznacznie różni się od zera (wariancja szumu wej- ściowego jest „niewielka“) oraz hipotezę alternatywną H

1

zakładającą, że wartość e(t

i

) jest nadmiarowa – dużo większa od zera. W procesie detekcji zakłóceń dokonujemy weryfikacji powyższych hipotez starając się, dla przyjętego poziomu istotności α = 0,003, od- rzucić hipotezę zerową H

0

na rzecz hipotezy alter- natywnej. Obszar odrzuceń H

0

wyznaczają wartości krytyczne z

d

oraz z

g

, będące odpowiednio dolnym i górnym progiem detekcji. W przypadku rozkładu normalnego dla α = 0,003 progi przyjmują warto- ści z

d

= −3b σ

n

(t

i

) oraz z

g

= 3b σ

n

(t

i

). Jak można za- uważyć symetria rozkładu gaussowskiego sprawia, że moduły wartości krytycznych są sobie równe. W ogól- nym przypadku można wybrać inną wartość poziomu istotności α (0 < α < 1), odpowiednie progi detek- cji można wówczas wyznaczyć w oparciu o tablice rozkładu normalnego. W tym celu dla wielkości α/2 (rozkład gaussowski jest symetryczny) odczytujemy wartość krytyczną z

kr

. Odpowiednie progi detekcji wyznaczamy zgodnie z zależnościami:

z

d

= −z

kr

b σ

n

(t

i

), z

g

= z

kr

b σ

n

(t

i

).

Jak wiadomo w trakcie detekcji zakłóceń impulso- wych pojawiają się błędne wskazania detektora. Jeśli niezakłócona próbka sygnału zostanie mimo wszyst- ko uznana za zakłóconą, tzn. gdy w sposób nieupraw- niony odrzucimy H

0

na rzecz H

1

, popełnimy błąd I rodzaju. Z kolei przyjmując H

0

, gdy dana jest fałszy- wa, tzn. traktując próbkę zakłóconą impulsowo jako

„dobrą“, popełnimy błąd II rodzaju. Liczba niewła- ściwych wskazań detektora zależy od stopnia „sepa- racji“ w sygnale błędów predykcji próbek „dobrych“ i zakłóconych. Separacja ta zależy głownie od własno- ści korelacyjnych oraz stacjonarności samego sygnału {y(t)} a następnie od stopnia wybielenia {e(t)} jak również intensywności zakłóceń. Pierwszy z warun- ków jest od nas niezależny i sprawia, że jeśli sygnał jest słabo skorelowany wewnętrznie, ma cechy sygna- łu szumopodobnego, proces wybielania nie uwypukli

dodatkowo zakłóceń. Szansę bezbłędnego wykrycia będą miały jedynie zniekształcenia wyraźnie „góru- jące“ nad sygnałem.

Trzeci z warunków ma znaczenie, gdy sygnał jest silnie wewnętrznie skorelowany, np. ma widmo prąż- kowe (wieloton harmoniczny + szum) a filtr wybiela- jący ma błędnie wyznaczone parametry lub zbyt ni- ski rząd, mniejszy od rzędu autoregresji procesu loso- wego. Wówczas filtracja odwrotna tylko nieznacznie lub wcale nie uwypukla zakłóceń. Efektywność detek- cji jest wówczas podobna, jak w przypadku sygnału szumopodobnego.

Duży problem dla prawidłowej detekcji zakłóceń stanowią sygnały niestacjonarne, których charakte- rystyki szybko zmieniają się w czasie, np. wibrowany dźwięk skrzypiec. Flitr analizujący o „uśrednionych“

współczynnikach będzie dawał taki sam skutek jak filtr o błędnie wyznaczonych parametrach. Problem ten można rozwiązać stosując adaptacyjne algorytmy identyfikacji (patrz [5], [2]).

Intensywność zakłóceń impulsowych również może wpływać na liczbę błędnych decyzji detekto- ra. Jeśli w silnie wewnętrznie skorelowanym sygnale pojawią się grupy blisko następujących po sobie za- kłóceń, charakter sygnału może ulec lokalnemu zabu- rzeniu. Składnik „szumowy“ może zdominować pozo- stałe składowe sygnału. Lokalne oceny parametrów ulegną znaczącym zmianom, co będzie miało wpływ na pracę detektora tuż po ustaniu zakłócenia. Lokal- ne oceny wariancji wzrosną uniemożliwiając wykrycie wielu rzeczywistych zakłóceń.

Do wyznaczenia oszacowania wariancji szumu wejściowego b σ

_n²

(t) należy wykorzystać sygnał e(t). W pracy [1] zaproponowano dwa typy estymatorów re- kurencyjnych. Pierwszy z nich jest oparty na prostym modelu ważenia wykładniczego a drugi na modelu średniej ruchomej. Obydwie metody zostały zmody- fikowane w ten sposób, aby estymacja wariancji od- bywała się z pominięciem próbek nadmiarowych. Ko- lejne wartości {e(t)} są wykorzystywane do uaktual- nienia b σ

²_n

(t) tylko wtedy, gdy przejdą pomyślnie we- ryfikację za pomocą detektora zakłóceń impulsowych (tzn. jeśli w stosunku do nich nie zostanie odrzucona hipoteza H

0

na rzecz H

1

). W niniejszej pracy oma- wiany jest algorytm detekcji zakłóceń impulsowych w wersji blokowej. Zaproponowano zatem blokowy algo- rytm estymacji b σ

_n²

(t) posiadający wyżej wspomnianą zaletę algorytmów rekurencyjnych. Dane dzielone są na bloki o długościach M próbek, gdzie M T (T – okres próbkowania) jest czasem trwania przedziału lokalnej stacjonarności sygnału. Przyjmując określo- ną wartość poziomu istotności α, któremu odpowiada odczytana z tablic rozkładu normalnego wartość kry- tyczna z

kr

, oszacowanie wariancji szumu wejściowego dla i-tego bloku danych oblicza się zgodnie z proce- durą:

− Ustaw wartość początkową indeksu pomocniczego I

p

= 0.

− Zmieniaj indeks j w przedziale < 1, M > i wyko-

nuj operacje:

(5)

jeżeli | e(j) | ¬ z

kr

b σ

n

(i − 1) lub j = 1 I

p

= I

p

+ 1, c(I

p

) = e(j).

− Oblicz wariancję w i-tym bloku:

b σ

²_n

(i) =

P

_I_p

j=1

c

²

(j) I

p

− P

_I_p

j=1

c(j) I

p

!

2

,

gdzie wielkość c = [c

1

(t), . . . , c

M

(t)]

^T

jest pomocni- czym wektorem o długości M służącym do przecho- wywania wartości e(t). Jak można zauważyć, kolej- ne wartości sygnału {e(t)} są uwzględniane w obli- czeniach tylko wtedy, gdy ich poziom nie przekracza przyjętej wielokrotności oszacowania wariancji obli- czonego dla poprzedniego bloku danych i − 1.

4. DETEKCJA ZAKŁÓCEŃ IMPULSO- WYCH Z WYKORZYSTANIEM

TESTÓW STATYSTYCZNYCH W dotychczasowych rozważaniach zakładano, że sygnał {e(t)} (a tym samym {y(t)}) jest procesem gaussowskim. Praktyka pokazuje, że założenie takie jest błędne. W wielu wypadkach najprostszy test po- legający na obserwacji wzrokowej przebiegu czaso- wego {e(t)} pozwala zauważyć asymetrię rozkładu prawdopodobieństwa sygnału (np. wartości dodatnie pojawiają się częściej niż ujemne), świadczącą o nie- zerowych nieparzystych momentach procesu losowe- go. W takich sytuacjach należy domniemywać, że sy- gnał {e(t)} nie jest procesem gaussowskim, gdyż jak wiadomo dla rozkładu normalnego wartości nieparzy- stych momentów są równe zeru. W ogólnym przy- padku proces wyznaczania progów detekcji (wartości krytycznych z

d

oraz z

g

) powinien być oparty o rze- czywisty, lecz nieznany rozkład prawdopodobieństwa sygnału. W proponowanym rozwiązaniu lokalne osza- cowanie rozkładu prawdopodobieństwa wyznaczane jest przy wykorzystaniu histogramu obliczanego dla przedziału lokalnej stacjonarności sygnału. Progiem dolnym z

d

jest największa wartość sygnału {e(t)}, dla której całka histogramu liczona w przedziale całkowa- nia < e

min

, z

d

> jest mniejsza od połowy przyjętego poziomu istotności α/2, gdzie e

min

jest najmniejszą wartością osiąganą przez sygnał w analizowanym blo- ku danych. Progiem górnym z

g

jest natomiast naj- mniejsza wartość {e(t)}, dla której całka histogramu liczona w przedziale całkowania < z

g

, e

max

> jest mniejsza od połowy przyjętego poziomu istotności α/2, gdzie e

max

jest największą wartością osiąganą przez sygnał w analizowanym bloku danych.

Histogram jest tylko dosyć zgrubnym oszacowa- niem nieznanego rozkładu prawdopodobieństwa sy- gnału, w szczególności nie zawiera tzw. „ogonów“

rozkładu (w kierunku ∞ oraz −∞) informujących o prawdopodobieństwach występowania bardzo wiel- kich i bardzo małych wartości {e(t)}. Jak można się domyślać, skrajne wartości sygnału praktycznie nie

występują w stosunkowo mało liczebnym bloku da- nych. Progi detekcji wyznaczone wyżej opisaną me- todą są przeszacowane - z

d

lub niedoszacowane - z

g

. Konsekwencją tego zjawiska jest generowanie przez detektor dużej liczby błędów pierwszego rodzaju – część próbek „dobrych“ o lokalnie dużych amplitu- dach uznawana jest za zakłócenie. Konieczne jest za- tem wprowadzenie drugiego etapu detekcji służacego do wyeliminowania jak największej liczby błędnych wskazań detektora. W proponowanej metodzie two- rzony jest pomocniczy plik danych {d(t)}, zawierają- cy informacje o momentach występowania zakłóceń t

i

, zakodowaną zgodnie z regułą:

d(t) =

 



0 gdy z

d

¬ e(t

i

) ¬ z

g

e(t

i

) − z

d

gdy e(t

i

) < z

d

e(t

i

) − z

g

gdy e(t

i

) > z

g

Jak można zauważyć sygnał {d(t)} jest niezerowy tyl- ko w momentach wykrycia zakłóceń. Próbki d(t

i

) są równe wartościom e(t

i

) pomniejszonym o odpowied- nie progi detekcji z

_d

lub z

_g

. Z zasady tworzenia histo- gramu oraz zastosowanego sposobu obliczania warto- ści krytycznych wynika, że większość danych {d(t)} o relatywnie małych amplitudach będzie odpowiadała fałszywym wykryciom detektora. Analizując sygnał {d(t)} z odpowiednio dobranymi progami detekcji z

sd

oraz z

sg

, można odrzucić błędne wskazania detekto- ra. Dobór wartości z

sd

i z

sg

najlepiej jest przeprowa- dzić dla danego sygnału {e(t)} metodą doświadczal- ną. Liczne eksperymenty wykazały jednak, że w wielu przypadkach dobre rezultaty selekcji danych można uzyskać stosując następujące podstawienia: z

sd

∼ = z

d

oraz z

sg

∼ = z

g

Z zależności tej wynika, że stosując detekcję jednoetapową należałoby dodatkowo zwięk- szyć moduły progów z

d

i z

g

o około 100%.

5. WYNIKI DOŚWIADCZALNE Na rys. 4 porównano efekty działania propono- wanego algorytmu detekcji z metodą opartą o analizę wariancji sygnału (wykorzystującą założenie o gaus- sowskim charakterze sygnału). Rys. 4 a) zawiera wy- kres sygnału {y(t)} posiadającego kilka zakłóceń w postaci impulsów prostych. Jest to zapisany cyfro- wo fragment nagrania pochodzącego z płyty analogo- wej – kwartet smyczkowy. Sygnał przetwarzany był blokowo, rozmiar bloku M = 256 próbek. Na rys.

4 b) pokazano efekty uzyskane po zastosowaniu fil-

tracji odwrotnej, filtrem o współczynnikach równych

parametrom modelu AR rzędu p = 10 (do identyfi-

kacji modelu zastosowano metodę Burga). Jak moż-

na zauważyć zakłócenia uległy uwypukleniu – stosu-

nek sygnał/szum uległ zmniejszeniu. Na wykresie za-

znaczono również progi detekcji wyznaczone poprzez

analizę wariancji – poziome linie schodkowe. Do es-

tymacji wariancji zastosowano opisaną wcześniej me-

todę blokową z poziomem istotności α

w

= 0,005

(z

krw

= 2,81). Progi detekcji ustalono dla poziomu

istotności α

d

= 0,0002 (z

krd

= 3,71). Rys. 4 c) zawie-

ra zero-jedynkowy sygnał wyjściowy detektora „wa-

riancyjnego“ {d

w

(t)}. Na rys. 4 d) znajduje się sy-

(6)

gnał {e(t)} wraz z zaznaczonymi progami detekcji wyznaczonymi dla poszczególnych bloków danych w oparciu o histogramy obliczone z poziomem istotno- ści α

h

= 0,05. Jak widać progi te położone są asyme- trycznie względem zera, co świadczy o niegaussow- skim charakterze sygnału {e(t)}. Rys. 4 e) to sygnał zero-jedynkowy {d

h1

(t)} uzyskiwany po pierwszym etapie detekcji. Widać w nim bardzo wiele wykryć zakłóceń - większość z nich jest błędna. Rys. 4 f) za- wiera sygnał {d(t)}, w którym można zauważyć du- żą liczbę próbek o małych poziomach. Są to najczę- ściej „dobre“ próbki sygnału mylnie zakwestionwane przez detektor jako zakłócenia. Zastoswanie drugie- go etapu detekcji powoduje odrzucenie większości z nich (zastosowano progi detekcji: z

sd

= 0,9z

d

oraz z

sg

= 0,9z

g

). Porównanie ostatecznych wyników de- tekcji (sygnał {d

h2

(t)} z rys. 4 g) ) z efektami uzy- skanymi metodą opartą o analizę wariancji (sygnał {d

w

(t)}) pokazuje, że dla rozpatrywanego sygnału obydwie metody dają podobne rezultaty – najbar- dziej istotne zakłócenia zostały wykryte.

6. WNIOSKI KOŃCOWE

W pracy omówiono nową metodę wykrywania zakłóceń impulsowych powstających w trakcie trans- misji, zapisu i przechowywania analogowych sygna- łów fonicznych. Algorytm jest odmianą parametrycz- nego detektora zakłóceń wykorzystującego model au- toregresyjny sygnału. Oparty jest o analizę rozkła- dów prawdopodobieństw błędów resztowych otrzy- mywanych na wyjściu filtru analizującego o współ- czynnikach równych parametrom modelu AR. W al- gorytmie tym, w odróżnieniu od wcześniej opraco- wanych przez autora rozwiązań detektorów parame- trycznych, brak jest założeń odnośnie gaussowskie- go charakteru analizowanych sygnałów fonicznych.

Zaproponowany sposób wyznaczania wartości progo- wych detektora w oparciu o histogram sygnału spra- wia, że konieczne jest zastosowanie dwuetapowej me- tody detekcji. W pracy podano heurystyczną zależ- ność pozwalającą w znacznym stopniu usunąć błędne wskazania detektora pojawiające się w znacznej licz- bie po pierwszym etapie detekcji. W dalszych pra- cach należałoby się skupić na eliminacji drugiej fazy detekcji przez np. zaproponowanie metody estymacji tzw. „ogonów“ funkcji rozkładu prawdopodobieństwa.

Opracowany detektor ma dobre własności wykrywa- nia zakłóceń impulsowych w sygnałach fonicznych w szczególności, gdy analizowany sygnał nie jest proce- sem gaussowskim.

SPIS LITERATURY

[1] Cisowski K.: Efficiency of impulsive noise detec- tion in audio recordings using the adaptive fil- tering method. 94th AES Convention, preprint No 3464 (B1-4), Berlin, Germany, 1993.

[2] Cisowski K.: Adaptacyjna filtracja i rekonstruk- cja sygnałów fonicznych. Rozprawa doktorska,

Politechnika Gdańska, Gdańsk, 2000.

[3] Cisowski K.: Detekcja zakłóceń impulsowych w sygnałach fonicznych. VI KKNT Diagnostyka procesów Przemysłowych, DPP’03, Władysła- wowo, 15-17 września, 2003, str. 157-162.

[4] Królewski M.: An electronic circuit for removing impulse noise from analog program. 84th AES Convention, preprint No 2571 (B-5), Paris, 1988.

[5] Niedźwiecki M., Cisowski K.: Adaptive scheme for elimination of broadband noise and impulsive disturbances from AR and ARMA signals. IEEE Trans. on Signal Processing., vol. 44, no. 3, 1996, str. 528-537.

[6] Vaseghi S.V.: Advanced signal processing and di- gital noise reduction. John Wiley & Sons Ltd.

and B. G. Teubner, 1996.

6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200

−400

−200 0 200 400

6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200

−100 0 100 200 300

62000 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200 0.5

1 1.5

6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200

−100 0 100 200 300

62000 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200 0.5

1 1.5

6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200

−100 0 100 200 300

62000 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200 0.5

1 1.5

y(t)

e(t)

d

w

(t)

e(t)

d

h1

(t)

d(t)

d

h2

ZASTOSOWANIE TESTÓW STATYSTYCZNYCH DO DETEKCJI ZAKŁÓCEŃ IMPULSOWYCH W SYGNAŁACH FONICZNYCH

2004

Poznańskie Warsztaty Telekomunikacyjne Poznań 9 - 10 grudnia 2004 Krzysztof Cisowski

Politechnika Gdańska, Wydział ETiI Katedra Systemów Automatyki,

ul. G. Narutowicza 11/12, 80-952 Gdańsk, e-mail: krci@eti.pg.gda.pl

ZASTOSOWANIE TESTÓW STATYSTYCZNYCH DO DETEKCJI ZAKŁÓCEŃ IMPULSOWYCH W SYGNAŁACH FONICZNYCH

Omówiono ideę wykorzystania testów statystycz- nych do detekcji zakłóceń impulsowych. Na koniec przedstawiono wyniki doświadczalne, w których dokonano porównania własności zaproponowane- go algorytmu z metodą opartą o analizę wariancji sygnałów.

1. WSTĘP

W proponowanym algorytmie zakłada się, że sy- gnał foniczny {y(t)} jest lokalnie stacjonarnym pro- cesem autoregresyjnym (AR) rzędu p. Sygnał {y(t)}

poddawany jest wstępnej filtracji za pomocą fil- tru analizującego (wybielającego) o współczynnikach równych parametrom modelu AR. Otrzymany sygnał błędów resztowych {e(t)} ma w porównaniu z {y(t)}

du normalnego. W dotychczasowych pracach autora (patrz [5], [2]) zakładano, że {n(t)} a tym samym {e(t)} mają rozkład gaussowski oraz poziom odnie- sienia detektora ustalany był jako wartość chwilo- wa oszacowania średniego odchylenia standardowego p b σ

(t) sygnału {n(t)} (b σ

(t) – wariancja {n(t)}).

oraz z

testu statystycznego, w którym dla danego poziomu istotności α weryfikowane są dwie hipotezy dotyczące przynależności (lub jej braku) poszczególnych próbek {e(t)} do zbioru próbek nadmiarowych. Hipoteza ze- rowa H

mówi, że w chwili t

dana próbka sygnału e(t

) nie jest nadmiariowa (z

¬ e(t

) ¬ z

z praw- dopodobieństwem równym 1 − α) a hipoteza alterna- tywna H

zakłada, że e(t

) jest nadmiarowa - zawie- ra zakłócenie impulsowe (e(t

) > z

lub e(t

) < z

z prawdopodobieństwem równym α). W trakcie we-

ryfikacji hipotez można popełniać dwa błędy: błąd I

rodzaju – gdy niezakłócona impulsowo próbka sygna-

łu (próbka „dobra“) zostanie uznana za zakłóconą lub

błędy II rodzaju - gdy próbka zakłócona impulsowo

zostanie potraktowana jako próbka „dobra“. Ponie-

waż zakłada się dodatkowo, że sygnał {y(t)} a tym sa-

mym {e(t)} jest lokalnie stacjonarnym procesem loso-

wym, estymacja rozkładu prawdopodobieństwa oraz

wyznaczanie wartości krytycznych z

oraz z

przepro-

wadza się dla poszczególnych przedziałów stacjonar-

ności. W proponowanym rozwiązaniu stosowane jest

blokowe przetwarzanie danych, w którym dla ustalo-

nego rozmiaru segmentu (odpowiadającego długości

przedziału stacjonarności) sygnał {y(t)} dzielony jest

na jednakowe bloki, w których wyznaczane są: para-

metry modelu AR, sygnał błędów resztowych oraz

histogram {e(t)}. Dla przyjętego poziomu istotności

obliczane są wartości z

oraz z

. Wszystkie próbki

{e(t)} należące do danego bloku danych są porów-

nywane z wartościami progowymi. Wyniki porówna-

nia zapisywane są w specjalnym pliku, w którym je-

dynymi niezerowymi danymi są te, których indeksy

odpowiadają próbkom nadmiarowym. Próbki zakwe-

stionowane przez detektor w chwili t

zapisywane są

w postaci e(t

) − z

gdy e(t

) < z

lub e(t

) − z

gdy e(t

) > z

oraz dużo większym od z

). Wartości krytyczne wyznaczane na podstawie histogramu są zbyt „pesymistyczne“ (z

powinno być

„nieco“ mniejsza a z

powinno byś „nieco“ większe).

Na skutek powyższej własności część próbek sygna- łu {e(t)} o lokalnie największych poziomach lokuje się w obszarze odrzuceń hipotezy H

2. TYPY ZAKŁÓCEŃ IMPULSOWYCH Zakłócenia impulsowe występujące w sygnałach fonicznych można klasyfikować na wiele sposobów (odpowiednie przykłady można znaleźć w pracach [2]

oraz [6]). Jednym z kryteriów podziału może być ro- dzaj toru akustycznego, w którym sygnał foniczny jest transmitowany bądź przetwarzany.

2.1. Zakłócenia impulsowe powstające w analogowych torach fonicznych

Zakłócenia tego typu można podzielić na pojedyncze impulsy (lub grupy pojedynczych impulsów) oraz im- pulsy złożone (przejściowe).

t [num. próbek]

y(t)

Rys. 1: Przebieg czasowy przykładowo wybranego fragmentu nagrania muzycznego zarejestrowanego na płycie gramofonowej zawierającego kilka pojedyn- czych zakłóceń impulsowych.

Pojedyncze impulsy o czasie trwania do 10 ns (wg. [4]) lub grupy pojedynczych impulsów o łącz- nym czasie trwania od kilkuset ns do 3 ms (wg.

[6]) stanowią podstawowy rodzaj zakłóceń impulso- wych pojawiających się w sygnałach otrzymanych przy odczycie gramofonowych nagrań fonicznych.

