2004
Poznańskie Warsztaty Telekomunikacyjne Poznań 9 - 10 grudnia 2004 Krzysztof Cisowski
Politechnika Gdańska, Wydział ETiI Katedra Systemów Automatyki,
ul. G. Narutowicza 11/12, 80-952 Gdańsk, e-mail: krci@eti.pg.gda.pl
ZASTOSOWANIE TESTÓW STATYSTYCZNYCH DO DETEKCJI ZAKŁÓCEŃ IMPULSOWYCH W SYGNAŁACH FONICZNYCH
Streszczenie: Artykuł poświęcony jest omówie- niu opartej o testy statystyczne metody detek- cji zakłóceń impulsowych występujących w sygna- łach fonicznych. We wstępie scharakteryzowano ogólnie zasadę działania parametrycznych detek- torów zniekształceń. Następnie omówiono pod- stawowe rodzaje zakłóceń impulsowych typowych dla archiwalnych i współczesnych sygnałów fonicz- nych. Szczegółowo przedstawiono podstawy teo- retyczne parametrycznych detektorów cyfrowych.
Omówiono ideę wykorzystania testów statystycz- nych do detekcji zakłóceń impulsowych. Na koniec przedstawiono wyniki doświadczalne, w których dokonano porównania własności zaproponowane- go algorytmu z metodą opartą o analizę wariancji sygnałów.
1. WSTĘP
W artykule omówiono nową parametryczną me- todę detekcji zakłóceń impulsowych sygnałów fonicz- nych wykorzystującą własności statystyczne analizo- wanych sygnałów. Metoda pozwala na wykrywanie zakłóceń powstających w analogowych torach fonicz- nych, w których zniekształcenia mają charakter po- jedynczych impulsów, grup impulsów lub zakłóceń o złożonym charakterze.
W proponowanym algorytmie zakłada się, że sy- gnał foniczny {y(t)} jest lokalnie stacjonarnym pro- cesem autoregresyjnym (AR) rzędu p. Sygnał {y(t)}
poddawany jest wstępnej filtracji za pomocą fil- tru analizującego (wybielającego) o współczynnikach równych parametrom modelu AR. Otrzymany sygnał błędów resztowych {e(t)} ma w porównaniu z {y(t)}
zmniejszoną wartość stosunku sygnał/szum, dzięki czemu nieciągłości wprowadzane do sygnału przez za- kłócenia impulsowe są bardziej wyeksponowane – ła- twiejsze do wykrycia. Proces detekcji zniekształceń w {e(t)} polega na porównaniu amplitudy chwilowej sygnału z pewną wartością progową, ustalaną w spo- sób zależny od zastosowanego algorytmu detekcji. Sy- gnał błędów resztowych uzyskany w procesie dekore- lacji (wybielania) {y(t)} ma charakter szumu białego o nieznanym rozkładzie prawdopodobieństwa. Stosu- jąc dodatkowe założenie o gaussowskim charakterze szumu wejściowego {n(t)} formującego {y(t)} moż- na przyjąć, że {e(t)} ma rozkład zbliżony do rozkła-
du normalnego. W dotychczasowych pracach autora (patrz [5], [2]) zakładano, że {n(t)} a tym samym {e(t)} mają rozkład gaussowski oraz poziom odnie- sienia detektora ustalany był jako wartość chwilo- wa oszacowania średniego odchylenia standardowego p b σ
2n(t) sygnału {n(t)} (b σ
n2(t) – wariancja {n(t)}).
W proponowanym rozwiązaniu brak jest założeń o gaussowskim charakterze {n(t)} (i {e(t)}). Nieznany rozkład prawdopodobieństwa sygnału błędów resz- towych jest estymowany za pomocą histogramu. W oparciu o oszacowanie rozkładu prawdopodobieństwa ustalane są dwa progi detekcji: dolny i górny. Progi te odpowiadają wartościom krytycznym z
doraz z
gtestu statystycznego, w którym dla danego poziomu istotności α weryfikowane są dwie hipotezy dotyczące przynależności (lub jej braku) poszczególnych próbek {e(t)} do zbioru próbek nadmiarowych. Hipoteza ze- rowa H
omówi, że w chwili t
idana próbka sygnału e(t
i) nie jest nadmiariowa (z
d¬ e(t
i) ¬ z
gz praw- dopodobieństwem równym 1 − α) a hipoteza alterna- tywna H
1zakłada, że e(t
i) jest nadmiarowa - zawie- ra zakłócenie impulsowe (e(t
i) > z
glub e(t
i) < z
dz prawdopodobieństwem równym α). W trakcie we-
ryfikacji hipotez można popełniać dwa błędy: błąd I
rodzaju – gdy niezakłócona impulsowo próbka sygna-
łu (próbka „dobra“) zostanie uznana za zakłóconą lub
błędy II rodzaju - gdy próbka zakłócona impulsowo
zostanie potraktowana jako próbka „dobra“. Ponie-
waż zakłada się dodatkowo, że sygnał {y(t)} a tym sa-
mym {e(t)} jest lokalnie stacjonarnym procesem loso-
wym, estymacja rozkładu prawdopodobieństwa oraz
wyznaczanie wartości krytycznych z
doraz z
gprzepro-
wadza się dla poszczególnych przedziałów stacjonar-
ności. W proponowanym rozwiązaniu stosowane jest
blokowe przetwarzanie danych, w którym dla ustalo-
nego rozmiaru segmentu (odpowiadającego długości
przedziału stacjonarności) sygnał {y(t)} dzielony jest
na jednakowe bloki, w których wyznaczane są: para-
metry modelu AR, sygnał błędów resztowych oraz
histogram {e(t)}. Dla przyjętego poziomu istotności
obliczane są wartości z
doraz z
g. Wszystkie próbki
{e(t)} należące do danego bloku danych są porów-
nywane z wartościami progowymi. Wyniki porówna-
nia zapisywane są w specjalnym pliku, w którym je-
dynymi niezerowymi danymi są te, których indeksy
odpowiadają próbkom nadmiarowym. Próbki zakwe-
stionowane przez detektor w chwili t
izapisywane są
w postaci e(t
i) − z
dgdy e(t
i) < z
dlub e(t
i) − z
ggdy e(t
i) > z
g. Lokalny histogram sygnału oblicza- ny jest w oparciu o stosunkowo niewielką liczbę da- nych. Uzyskiwane przybliżenia rozkładu prawdopo- dobieństwa mają zatem niedoszacowane tzw. „ogo- ny“, czyli fragmenty rozkładu odpowiadające bardzo mało prawdopodobnym wartościom e(t) (wartościom sygnału dużo mniejszym od z
doraz dużo większym od z
g). Wartości krytyczne wyznaczane na podstawie histogramu są zbyt „pesymistyczne“ (z
dpowinno być
„nieco“ mniejsza a z
gpowinno byś „nieco“ większe).
Na skutek powyższej własności część próbek sygna- łu {e(t)} o lokalnie największych poziomach lokuje się w obszarze odrzuceń hipotezy H
oi jest traktowa- na jako zakłócenie impulsowe. Algorytm detekcji pró- bek nadmiarowych musi zatem zawierać drugi etap, w którym analizowany jest plik z wynikami detek- cji uzyskanymi w pierwszym etapie: wartości bliskie zeru traktowane są jako błędy pierwszego rodzaju i wskazania tych danych są usuwane z pliku detekto- ra. Ostatecznie tworzony jest drugi plik detektora za- wierający zero-jedynkową informację o próbkach nad- miarowych – „1“ zakłócenie, „0“ brak zakłócenia.
2. TYPY ZAKŁÓCEŃ IMPULSOWYCH Zakłócenia impulsowe występujące w sygnałach fonicznych można klasyfikować na wiele sposobów (odpowiednie przykłady można znaleźć w pracach [2]
oraz [6]). Jednym z kryteriów podziału może być ro- dzaj toru akustycznego, w którym sygnał foniczny jest transmitowany bądź przetwarzany.
2.1. Zakłócenia impulsowe powstające w analogowych torach fonicznych
Najbardziej charakterystycznymi zakłóceniami występującymi w analogowych torach fonicznych są zniekształcenia pojawiające się przy odczycie gra- mofonowych nagrań fonicznych. Mechaniczne urzą- dzenie odczytujące (igła gramofonowa) napotkawszy uszkodzenie rowka płyty, wytwarza w przetworniku mechaniczno-elektrycznym impuls elektryczny. Wiel- kość oraz kształt impulsu uzależnione są od stopnia uszkodzenia rowka (rozmiaru nieciągłości nośnika).
Zakłócenia tego typu można podzielić na pojedyncze impulsy (lub grupy pojedynczych impulsów) oraz im- pulsy złożone (przejściowe).
6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200
−4000
−2000 0 2000 4000 6000 8000
t [num. próbek]
y(t)
Rys. 1: Przebieg czasowy przykładowo wybranego fragmentu nagrania muzycznego zarejestrowanego na płycie gramofonowej zawierającego kilka pojedyn- czych zakłóceń impulsowych.
Pojedyncze impulsy o czasie trwania do 10 ns (wg. [4]) lub grupy pojedynczych impulsów o łącz- nym czasie trwania od kilkuset ns do 3 ms (wg.
[6]) stanowią podstawowy rodzaj zakłóceń impulso- wych pojawiających się w sygnałach otrzymanych przy odczycie gramofonowych nagrań fonicznych.
Pojedyncze impulsy składają się z kilku do kilku- nastu próbek i mają najczęściej kształt taki jak na Rys. 1. Zakłócenia tego typu można traktować ja- ko odpowiedź impulsową analogowego kanału trans- misyjnego, przez który przesłano zakłócenia w po- staci zmodulowanej amplitudowo delty Kroneckera
δ(t) =
n 1 dla t = 0 0 dla t 6= 0
.
250
0 -250
0 400 800 1200 t
y(t)
Rys. 2: Przykład zakłócenia impulsowego przejścio- wego wg. [6] (Oś t – numery próbek).
Impulsy złożone (przejściowe) różnią się od po- jedynczych impulsów dłuższymi czasami trwania, większą energią, innym rozkładem energii w wid- mie (składowe niskoczęstotliwościowe dominują) oraz rzadszym występowaniem. Budowa impulsu złożone- go to najczęściej krótki, o stromych zboczach im- puls początkowy oraz następujące po nim zanikają- ce niskoczęstotliwościowe oscylacje. Dobrym przykła- dem impulsu złożonego jest sygnał uzyskany w wyni- ku odtwarzania na gramofonie płyty analogowej po- siadającej głęboką rysę. Fizyczna nieciągłość nośnika powoduje, że igła systemu odczytującego po chwi- lowej utracie kontaktu z powierzchnią nośnika ude- rza z dużą siłą w przeciwległy brzeg rysy i konty- nuuje odtwarzanie przerwanego rowka płyty. Kształt impulsu wynika z własności elektro–mechanicznych układu odczytującego. W pierwszej fazie jest to od- powiedź układu na nieciągłość nośnika, a w drugiej – wynik występowania rezonansów własnych (zani- kające oscylacje nałożone w sposób addytywny na sygnał). Czas trwania fazy pierwszej wynosi 1 − 5 ms a fazy drugiej jest dłuższy i wynosi do 50 ms [6].
Przykład zakłócenia impulsowego przejściowego za- mieszczono na Rys. 2.
2.2. Zakłócenia impulsowe powstające w cyfrowych torach fonicznych
Zakłócenia impulsowe generowane przez cyfrowe tory foniczne związane są z błędami numerycznymi powstającymi w wyniku przesyłania, przetwarzania, bądź przechowywania zakodowanych cyfrowo sygna- łów fonicznych.
5200 5300 5400 5500 5600 5700 5800 5900 6000
−2 0 2
x 104
a) b) c)
t y(t)
Rys. 3: Przykłady kilku rodzajów cyfrowych zakłóceń
impulsowych. (Oś t – numery próbek).
Przykładami źródeł zakłóceń cyfrowych mo- gą być: „obcinanie“ próbek sygnału w przetworniku analogowo-cyfrowym po przekroczeniu dozwolonego poziomu amplitudy (Rys. 3a), błędy numeryczne al- gorytmów przetwarzania sygnałów (Rys. 3b), utra- ta bloków próbek w trakcie transmisji danych (bra- kujące próbki zastępowane są najczęściej zerami - Rys. 3c) itp. Cechą charakterystyczną jest to, że na raz powstałe zakłócenia w żaden sposób nie oddzia- ływują dalsze elementy cyfrowego toru fonicznego.
3. CYFROWY PARAMETRYCZNY DETEKTOR ZAKŁÓCEŃ
IMPULSOWYCH
Detektory parametryczne wykorzystują w pro- cesie detekcji modelowanie sygnałów – zakłócenia im- pulsowe poszukiwane są nie w samym sygnale {y(t)}, lecz w sygnale błędów modelowania {e(t)}. Wykorzy- stywane jest przy tym spostrzeżenie, że proces ró- zniczkowania sygnału fonicznego (na ogół silnie we- wnętrznie skorelowanego) powoduje znaczne uwypu- klenie nieciągłości wprowadzanych do sygnału przez zakłócenia impulsowe. Operacja różniczkowania od- powiada dekorelacji lub widmowemu wybielaniu sy- gnału, stąd zastosowanie metod dekorelacji opartych o modelowanie daje poprawę wykrywalności zakłó- ceń. W dotychczas stosowanych przez autora rozwią- zaniach opisanych w [1], [2], [3] oraz [5] wykorzysty- wane były modele AR. Przyjmijmy, że zakłócony im- pulsowo sygnał foniczny {y(t)} opisany jest zależno- ściami:
s(t) = X
p j=1a
js(t − j) + n(t), y(t) = s(t) + z(t), (1) gdzie a
j, j = 1, . . . , p, oznaczają wartości współczyn- ników AR, {s(t)} jest niezakłóconym sygnałem fo- nicznym, {n(t)} to szum wejściowy (o wartści oczeki- wanej m
n= 0 i wariancji σ
2n< ∞) formujący sygnał {s(t)}, a z(t) = A
0δ(t − t
0) jest sygnałem zawiera- jącym zakłócenie impulsowe o amplitudzie A
0poja- wiające się w chwili t
0. Poddając sygnał {y(t)} filtra- cji odwrotnej za pomocą filtru analizującego o skoń- czonej odpowiedzi impulsowej (FIR), którego współ- czynnikami są parametry a
j, j = 1, . . . , p, otrzymuje się sygnał błędów resztowych {e(t)} o wartści ocze- kiwanej m
e= 0 i wariancji σ
e2< ∞ wyrażony rów- naniem:
e(t) = y(t) − X
p j=1a
jy(t − j) (2)
= s(t)+z(t) − X
p j=1a
j(s(t−j)+ z(t−j)).
Korzystając z zależności n(t) = s(t)− P
pj=1
a
js(t−j) równanie (2) można zapisać w postaci:
e(t) = n(t) + z(t) − X
p j=1a
jz(t − j) (3)
= n(t) + z(t) + ∆
z(t),
gdzie ∆
z(t) = −A
0h(t − t
0− 1), przy czym h(t) = P
pj=1
a
jδ(t − j) jest odpowiedzią impulsową filtru analizującego. Składnik ∆
z(t) jest więc sygnałem za- wierającym „rozmyty“ przez filtr wybielający poje- dynczy impuls zakłócenia. Pojawia się on tuż za im- pulsem pierwotnym wydłużając czas trwania zakłó- cenia o p okresów próbkowania. W chwili t
0sygnały y(t
0) oraz e(t
0), są równe odpowiednio (∆
z(t
0) = 0):
e(t
0) = n(t
0) + A
0, y(t
0) = s(t
0) + A
0, (4) przy czym n(t
0) s(t
0). Jeśli w próbce sygnału y(t
0) poziom zakłócenia A
0jest porównywalny z poziomem s(t
0) (detekcja takiego zakłócenia byłaby trudna lub wręcz niemożliwa), w e(t
0) dominującym składnikiem jest zakłócenie, gdyż n(t
0) A
0. Jak widać w chwili t
0zakłócenie w sygnale {e(t)} ma znacznie wyższy względny poziom niż w sygnale {y(t)}, stąd detek- cja zakłócenia w {e(t)} jest łatwiejsza. Przez p chwil czasu następujących po chwili t = t
0zależność (3) przyjmuje postać
e(t) = n(t) − A
0a
t−t0, t = t
0+1, . . . , t
0+p, podczas gdy (1) wyraża się równaniem
y(t) = s(t), t = t
0+ 1, . . . , t
0+ p.
Sygnał {e(t)} zawiera zatem składniki, których od- powiedniki nie występują w sygnale {y(t)}. Powstałe
„zaburzenie“ może powodować fałszywe alarmy de- tektora, a w szczególności wydłużanie czasu wskazań obecności zakłócenia.
Powyższe wnioski bardzo łatwo można przenieść na przypadek, gdy impuls zakłócenia składa się z M próbek występujących się w sygnale {z(t)} od chwili t = t
0, tj.
z(t) =
M −1
X
i=0
A
iδ(t − (t
0− i)).
Impuls taki po przejściu przez filtr analizujący o od- powiedzi impulsowej h(t) ulegnie rozmyciu. W sy- gnale {e(t)} jego przetransformowane składniki będą występowały przez p + M chwil czasu w przedziale t= t
0, . . . , t
0+ p +M −1. Niezniekształcona będzie je- dynie pierwsza próbka zakłócenia o amplitudzie A
0występująca w chwili t = t
0(patrz pierwsze z dwóch równań (4)). Poprawa wykrywalności pierwszej prób- ki zakłócenia złożonego z wielu impulsów jest ta- ka sama, jak zakłócenia składającego się z impul- su pojedynczego (porównaj (4)). Pewne zniekształ- cenie kolejnych M − 1 próbek zakłócenia nieco ten stan pogarsza, jednak nadal zakłócenie takie łatwiej jest wykryć w sygnale {e(t)} niż {y(t)}. Pewien pro- blem mogą stanowić dodatkowe próbki z przedziału t = t
0+M −1, . . . , t
0+p+M −1, których odpowiedni- ki nie występują w sygnale {y(t)}. Często powodują one niepotrzebne wydłużanie czasu wskazań obecno- ści zakłócenia.
Detekcja zakłóceń impulsowych w sygnale błę-
dów resztowych {e(t)} oparta jest na założeniu, że
szum wejściowy {n(t)} jest gaussowskim procesem lo- sowym.Próbki {e(t)} są segregowane do dwóch wza- jemnie rozłącznych zbiorów: danych niezakłóconych oraz zakłóconych – próbek nadmiarowych. Klasyfika- cja sygnału przeprowadzana jest w oparciu o znaną ze statystyki regułę 3σ, w myśl której w danej chwili czasu t
isygnał e(t
i) reprezentuje zakłócenie impul- sowe, gdy spełniony jest warunek:
| e(t
i) | > 3b σ
n(t
i). (5) gdzie b σ
n(t
i) = p
b
σ
n2(t
i), b σ
n2(t
i) – jest oszacowaniem wariancji szumu wejściowego w chwili t
i. Warunek ten oznacza, że próbka e(t
i) traktowana jest jako za- kłócona impulsowo, gdy przekracza poziom osiągany przez {n(t)} z bardzo małym prawdopodobieństwem, mniejszym od 0,003 [5].
Warunek powyższy można również opisać na gruncie teorii weryfikacji hipotez statystycznych. W związku z tym formułujemy hipotezę zerową H
0mó- wiącą, ze poziom próbki e(t
i) jest niewielki, tylko nieznacznie różni się od zera (wariancja szumu wej- ściowego jest „niewielka“) oraz hipotezę alternatywną H
1zakładającą, że wartość e(t
i) jest nadmiarowa – dużo większa od zera. W procesie detekcji zakłóceń dokonujemy weryfikacji powyższych hipotez starając się, dla przyjętego poziomu istotności α = 0,003, od- rzucić hipotezę zerową H
0na rzecz hipotezy alter- natywnej. Obszar odrzuceń H
0wyznaczają wartości krytyczne z
doraz z
g, będące odpowiednio dolnym i górnym progiem detekcji. W przypadku rozkładu normalnego dla α = 0,003 progi przyjmują warto- ści z
d= −3b σ
n(t
i) oraz z
g= 3b σ
n(t
i). Jak można za- uważyć symetria rozkładu gaussowskiego sprawia, że moduły wartości krytycznych są sobie równe. W ogól- nym przypadku można wybrać inną wartość poziomu istotności α (0 < α < 1), odpowiednie progi detek- cji można wówczas wyznaczyć w oparciu o tablice rozkładu normalnego. W tym celu dla wielkości α/2 (rozkład gaussowski jest symetryczny) odczytujemy wartość krytyczną z
kr. Odpowiednie progi detekcji wyznaczamy zgodnie z zależnościami:
z
d= −z
krb σ
n(t
i), z
g= z
krb σ
n(t
i).
Jak wiadomo w trakcie detekcji zakłóceń impulso- wych pojawiają się błędne wskazania detektora. Jeśli niezakłócona próbka sygnału zostanie mimo wszyst- ko uznana za zakłóconą, tzn. gdy w sposób nieupraw- niony odrzucimy H
0na rzecz H
1, popełnimy błąd I rodzaju. Z kolei przyjmując H
0, gdy dana jest fałszy- wa, tzn. traktując próbkę zakłóconą impulsowo jako
„dobrą“, popełnimy błąd II rodzaju. Liczba niewła- ściwych wskazań detektora zależy od stopnia „sepa- racji“ w sygnale błędów predykcji próbek „dobrych“ i zakłóconych. Separacja ta zależy głownie od własno- ści korelacyjnych oraz stacjonarności samego sygnału {y(t)} a następnie od stopnia wybielenia {e(t)} jak również intensywności zakłóceń. Pierwszy z warun- ków jest od nas niezależny i sprawia, że jeśli sygnał jest słabo skorelowany wewnętrznie, ma cechy sygna- łu szumopodobnego, proces wybielania nie uwypukli
dodatkowo zakłóceń. Szansę bezbłędnego wykrycia będą miały jedynie zniekształcenia wyraźnie „góru- jące“ nad sygnałem.
Trzeci z warunków ma znaczenie, gdy sygnał jest silnie wewnętrznie skorelowany, np. ma widmo prąż- kowe (wieloton harmoniczny + szum) a filtr wybiela- jący ma błędnie wyznaczone parametry lub zbyt ni- ski rząd, mniejszy od rzędu autoregresji procesu loso- wego. Wówczas filtracja odwrotna tylko nieznacznie lub wcale nie uwypukla zakłóceń. Efektywność detek- cji jest wówczas podobna, jak w przypadku sygnału szumopodobnego.
Duży problem dla prawidłowej detekcji zakłóceń stanowią sygnały niestacjonarne, których charakte- rystyki szybko zmieniają się w czasie, np. wibrowany dźwięk skrzypiec. Flitr analizujący o „uśrednionych“
współczynnikach będzie dawał taki sam skutek jak filtr o błędnie wyznaczonych parametrach. Problem ten można rozwiązać stosując adaptacyjne algorytmy identyfikacji (patrz [5], [2]).
Intensywność zakłóceń impulsowych również może wpływać na liczbę błędnych decyzji detekto- ra. Jeśli w silnie wewnętrznie skorelowanym sygnale pojawią się grupy blisko następujących po sobie za- kłóceń, charakter sygnału może ulec lokalnemu zabu- rzeniu. Składnik „szumowy“ może zdominować pozo- stałe składowe sygnału. Lokalne oceny parametrów ulegną znaczącym zmianom, co będzie miało wpływ na pracę detektora tuż po ustaniu zakłócenia. Lokal- ne oceny wariancji wzrosną uniemożliwiając wykrycie wielu rzeczywistych zakłóceń.
Do wyznaczenia oszacowania wariancji szumu wejściowego b σ
n2(t) należy wykorzystać sygnał e(t). W pracy [1] zaproponowano dwa typy estymatorów re- kurencyjnych. Pierwszy z nich jest oparty na prostym modelu ważenia wykładniczego a drugi na modelu średniej ruchomej. Obydwie metody zostały zmody- fikowane w ten sposób, aby estymacja wariancji od- bywała się z pominięciem próbek nadmiarowych. Ko- lejne wartości {e(t)} są wykorzystywane do uaktual- nienia b σ
2n(t) tylko wtedy, gdy przejdą pomyślnie we- ryfikację za pomocą detektora zakłóceń impulsowych (tzn. jeśli w stosunku do nich nie zostanie odrzucona hipoteza H
0na rzecz H
1). W niniejszej pracy oma- wiany jest algorytm detekcji zakłóceń impulsowych w wersji blokowej. Zaproponowano zatem blokowy algo- rytm estymacji b σ
n2(t) posiadający wyżej wspomnianą zaletę algorytmów rekurencyjnych. Dane dzielone są na bloki o długościach M próbek, gdzie M T (T – okres próbkowania) jest czasem trwania przedziału lokalnej stacjonarności sygnału. Przyjmując określo- ną wartość poziomu istotności α, któremu odpowiada odczytana z tablic rozkładu normalnego wartość kry- tyczna z
kr, oszacowanie wariancji szumu wejściowego dla i-tego bloku danych oblicza się zgodnie z proce- durą:
− Ustaw wartość początkową indeksu pomocniczego I
p= 0.
− Zmieniaj indeks j w przedziale < 1, M > i wyko-
nuj operacje:
jeżeli | e(j) | ¬ z
krb σ
n(i − 1) lub j = 1 I
p= I
p+ 1, c(I
p) = e(j).
− Oblicz wariancję w i-tym bloku:
b σ
2n(i) =
P
Ipj=1
c
2(j) I
p− P
Ipj=1
c(j) I
p!
2,
gdzie wielkość c = [c
1(t), . . . , c
M(t)]
Tjest pomocni- czym wektorem o długości M służącym do przecho- wywania wartości e(t). Jak można zauważyć, kolej- ne wartości sygnału {e(t)} są uwzględniane w obli- czeniach tylko wtedy, gdy ich poziom nie przekracza przyjętej wielokrotności oszacowania wariancji obli- czonego dla poprzedniego bloku danych i − 1.
4. DETEKCJA ZAKŁÓCEŃ IMPULSO- WYCH Z WYKORZYSTANIEM
TESTÓW STATYSTYCZNYCH W dotychczasowych rozważaniach zakładano, że sygnał {e(t)} (a tym samym {y(t)}) jest procesem gaussowskim. Praktyka pokazuje, że założenie takie jest błędne. W wielu wypadkach najprostszy test po- legający na obserwacji wzrokowej przebiegu czaso- wego {e(t)} pozwala zauważyć asymetrię rozkładu prawdopodobieństwa sygnału (np. wartości dodatnie pojawiają się częściej niż ujemne), świadczącą o nie- zerowych nieparzystych momentach procesu losowe- go. W takich sytuacjach należy domniemywać, że sy- gnał {e(t)} nie jest procesem gaussowskim, gdyż jak wiadomo dla rozkładu normalnego wartości nieparzy- stych momentów są równe zeru. W ogólnym przy- padku proces wyznaczania progów detekcji (wartości krytycznych z
doraz z
g) powinien być oparty o rze- czywisty, lecz nieznany rozkład prawdopodobieństwa sygnału. W proponowanym rozwiązaniu lokalne osza- cowanie rozkładu prawdopodobieństwa wyznaczane jest przy wykorzystaniu histogramu obliczanego dla przedziału lokalnej stacjonarności sygnału. Progiem dolnym z
djest największa wartość sygnału {e(t)}, dla której całka histogramu liczona w przedziale całkowa- nia < e
min, z
d> jest mniejsza od połowy przyjętego poziomu istotności α/2, gdzie e
minjest najmniejszą wartością osiąganą przez sygnał w analizowanym blo- ku danych. Progiem górnym z
gjest natomiast naj- mniejsza wartość {e(t)}, dla której całka histogramu liczona w przedziale całkowania < z
g, e
max> jest mniejsza od połowy przyjętego poziomu istotności α/2, gdzie e
maxjest największą wartością osiąganą przez sygnał w analizowanym bloku danych.
Histogram jest tylko dosyć zgrubnym oszacowa- niem nieznanego rozkładu prawdopodobieństwa sy- gnału, w szczególności nie zawiera tzw. „ogonów“
rozkładu (w kierunku ∞ oraz −∞) informujących o prawdopodobieństwach występowania bardzo wiel- kich i bardzo małych wartości {e(t)}. Jak można się domyślać, skrajne wartości sygnału praktycznie nie
występują w stosunkowo mało liczebnym bloku da- nych. Progi detekcji wyznaczone wyżej opisaną me- todą są przeszacowane - z
dlub niedoszacowane - z
g. Konsekwencją tego zjawiska jest generowanie przez detektor dużej liczby błędów pierwszego rodzaju – część próbek „dobrych“ o lokalnie dużych amplitu- dach uznawana jest za zakłócenie. Konieczne jest za- tem wprowadzenie drugiego etapu detekcji służacego do wyeliminowania jak największej liczby błędnych wskazań detektora. W proponowanej metodzie two- rzony jest pomocniczy plik danych {d(t)}, zawierają- cy informacje o momentach występowania zakłóceń t
i, zakodowaną zgodnie z regułą:
d(t) =
0 gdy z
d¬ e(t
i) ¬ z
ge(t
i) − z
dgdy e(t
i) < z
de(t
i) − z
ggdy e(t
i) > z
gJak można zauważyć sygnał {d(t)} jest niezerowy tyl- ko w momentach wykrycia zakłóceń. Próbki d(t
i) są równe wartościom e(t
i) pomniejszonym o odpowied- nie progi detekcji z
dlub z
g. Z zasady tworzenia histo- gramu oraz zastosowanego sposobu obliczania warto- ści krytycznych wynika, że większość danych {d(t)} o relatywnie małych amplitudach będzie odpowiadała fałszywym wykryciom detektora. Analizując sygnał {d(t)} z odpowiednio dobranymi progami detekcji z
sdoraz z
sg, można odrzucić błędne wskazania detekto- ra. Dobór wartości z
sdi z
sgnajlepiej jest przeprowa- dzić dla danego sygnału {e(t)} metodą doświadczal- ną. Liczne eksperymenty wykazały jednak, że w wielu przypadkach dobre rezultaty selekcji danych można uzyskać stosując następujące podstawienia: z
sd∼ = z
doraz z
sg∼ = z
gZ zależności tej wynika, że stosując detekcję jednoetapową należałoby dodatkowo zwięk- szyć moduły progów z
di z
go około 100%.
5. WYNIKI DOŚWIADCZALNE Na rys. 4 porównano efekty działania propono- wanego algorytmu detekcji z metodą opartą o analizę wariancji sygnału (wykorzystującą założenie o gaus- sowskim charakterze sygnału). Rys. 4 a) zawiera wy- kres sygnału {y(t)} posiadającego kilka zakłóceń w postaci impulsów prostych. Jest to zapisany cyfro- wo fragment nagrania pochodzącego z płyty analogo- wej – kwartet smyczkowy. Sygnał przetwarzany był blokowo, rozmiar bloku M = 256 próbek. Na rys.
4 b) pokazano efekty uzyskane po zastosowaniu fil-
tracji odwrotnej, filtrem o współczynnikach równych
parametrom modelu AR rzędu p = 10 (do identyfi-
kacji modelu zastosowano metodę Burga). Jak moż-
na zauważyć zakłócenia uległy uwypukleniu – stosu-
nek sygnał/szum uległ zmniejszeniu. Na wykresie za-
znaczono również progi detekcji wyznaczone poprzez
analizę wariancji – poziome linie schodkowe. Do es-
tymacji wariancji zastosowano opisaną wcześniej me-
todę blokową z poziomem istotności α
w= 0,005
(z
krw= 2,81). Progi detekcji ustalono dla poziomu
istotności α
d= 0,0002 (z
krd= 3,71). Rys. 4 c) zawie-
ra zero-jedynkowy sygnał wyjściowy detektora „wa-
riancyjnego“ {d
w(t)}. Na rys. 4 d) znajduje się sy-
gnał {e(t)} wraz z zaznaczonymi progami detekcji wyznaczonymi dla poszczególnych bloków danych w oparciu o histogramy obliczone z poziomem istotno- ści α
h= 0,05. Jak widać progi te położone są asyme- trycznie względem zera, co świadczy o niegaussow- skim charakterze sygnału {e(t)}. Rys. 4 e) to sygnał zero-jedynkowy {d
h1(t)} uzyskiwany po pierwszym etapie detekcji. Widać w nim bardzo wiele wykryć zakłóceń - większość z nich jest błędna. Rys. 4 f) za- wiera sygnał {d(t)}, w którym można zauważyć du- żą liczbę próbek o małych poziomach. Są to najczę- ściej „dobre“ próbki sygnału mylnie zakwestionwane przez detektor jako zakłócenia. Zastoswanie drugie- go etapu detekcji powoduje odrzucenie większości z nich (zastosowano progi detekcji: z
sd= 0,9z
doraz z
sg= 0,9z
g). Porównanie ostatecznych wyników de- tekcji (sygnał {d
h2(t)} z rys. 4 g) ) z efektami uzy- skanymi metodą opartą o analizę wariancji (sygnał {d
w(t)}) pokazuje, że dla rozpatrywanego sygnału obydwie metody dają podobne rezultaty – najbar- dziej istotne zakłócenia zostały wykryte.
6. WNIOSKI KOŃCOWE
W pracy omówiono nową metodę wykrywania zakłóceń impulsowych powstających w trakcie trans- misji, zapisu i przechowywania analogowych sygna- łów fonicznych. Algorytm jest odmianą parametrycz- nego detektora zakłóceń wykorzystującego model au- toregresyjny sygnału. Oparty jest o analizę rozkła- dów prawdopodobieństw błędów resztowych otrzy- mywanych na wyjściu filtru analizującego o współ- czynnikach równych parametrom modelu AR. W al- gorytmie tym, w odróżnieniu od wcześniej opraco- wanych przez autora rozwiązań detektorów parame- trycznych, brak jest założeń odnośnie gaussowskie- go charakteru analizowanych sygnałów fonicznych.
Zaproponowany sposób wyznaczania wartości progo- wych detektora w oparciu o histogram sygnału spra- wia, że konieczne jest zastosowanie dwuetapowej me- tody detekcji. W pracy podano heurystyczną zależ- ność pozwalającą w znacznym stopniu usunąć błędne wskazania detektora pojawiające się w znacznej licz- bie po pierwszym etapie detekcji. W dalszych pra- cach należałoby się skupić na eliminacji drugiej fazy detekcji przez np. zaproponowanie metody estymacji tzw. „ogonów“ funkcji rozkładu prawdopodobieństwa.
Opracowany detektor ma dobre własności wykrywa- nia zakłóceń impulsowych w sygnałach fonicznych w szczególności, gdy analizowany sygnał nie jest proce- sem gaussowskim.
SPIS LITERATURY
[1] Cisowski K.: Efficiency of impulsive noise detec- tion in audio recordings using the adaptive fil- tering method. 94th AES Convention, preprint No 3464 (B1-4), Berlin, Germany, 1993.
[2] Cisowski K.: Adaptacyjna filtracja i rekonstruk- cja sygnałów fonicznych. Rozprawa doktorska,
Politechnika Gdańska, Gdańsk, 2000.
[3] Cisowski K.: Detekcja zakłóceń impulsowych w sygnałach fonicznych. VI KKNT Diagnostyka procesów Przemysłowych, DPP’03, Władysła- wowo, 15-17 września, 2003, str. 157-162.
[4] Królewski M.: An electronic circuit for removing impulse noise from analog program. 84th AES Convention, preprint No 2571 (B-5), Paris, 1988.
[5] Niedźwiecki M., Cisowski K.: Adaptive scheme for elimination of broadband noise and impulsive disturbances from AR and ARMA signals. IEEE Trans. on Signal Processing., vol. 44, no. 3, 1996, str. 528-537.
[6] Vaseghi S.V.: Advanced signal processing and di- gital noise reduction. John Wiley & Sons Ltd.
and B. G. Teubner, 1996.
6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200
−400
−200 0 200 400
6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200
−100 0 100 200 300
62000 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200 0.5
1 1.5
6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200
−100 0 100 200 300
62000 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200 0.5
1 1.5
6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200
−100 0 100 200 300
62000 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200 0.5
1 1.5