• Nie Znaleziono Wyników

T ESTOWANIE ALGORYTMU ANALIZATORA

4. BIFAKTORYZACJA VOELCKERA-KUMARESANA

4.6. T ESTOWANIE ALGORYTMU ANALIZATORA

[n

spif (ich części rzeczywiste i urojone). Można z niego wyprowadzić również przebiegi ]

[n

a lub [n], amp[n] i pif[n]. Za jego pomocą możemy więc uzyskać nie tylko stosowane w tej pracy czynniki bifaktoryzacji V-K oraz ich ICF, ale także inne reprezentacje sygnału zespolonego (np. AM∙FM, AM∙PIF, reprezentację poprzez s[n]). Ponieważ w praktycznych systemach na wejściu mamy do czynienia z sygnałami rzeczywistymi, jak sygnał mowy, pierwszym ogniwem algorytmu jest zespolony filtr Hilberta, który pozwala uzyskać zespoloną reprezentację rzeczywistego sygnału x[n]. Wykorzystany filtr ma pasmo przenoszenia od 200 Hz do 7.2 kHz, dzięki czemu można ograniczyć pasmo mowy, zachowując jednocześnie wszystkie istotne formanty.

4.6. Testowanie algorytmu analizatora

Dla przetestowania działania algorytmu bifaktoryzacji V-K oraz określenia właściwości czynników tej faktoryzacji i ich zespolonych pulsacji chwilowych przeprowadzono serię symulacji na sygnałach syntetycznych. Do testów wybrano klasę ośmiu sygnałów okresowych, 4-tonowych, mających tę samą obwiednię a[n], zadanych wzorem

 

4

1 0,

4[ ] exp[ (2 )]

l al j fln l

n

u (4.36)

Poszczególne składowe (składniki powyższej sumy) sygnałów w tej klasie mają te same częstotliwości f , różnią się natomiast amplitudami l a oraz fazami początkowymi l 0,l. Pierwszym rozważanym przez nas sygnałem z tej klasy jest sygnał minimalnofazowy, charakteryzujący się tym, że składowa o najniższej częstotliwości jest dominująca, natomiast jego widmo amplitudowe jest funkcją nierosnącą, tzn.

4 3 2 1 4

3 2

1 a a a 0 oraz a a a a

a       

4 3 2

0 1

dla  ffff (4.37)

Jeśli tak jak Voelcker przedstawimy sygnał 4-tonowy w postaci wielomianu, będzie on miał trzy zera, z których dwa są ze sobą sprzężone. Dla sygnału minimalnofazowego wszystkie zera leżą wewnątrz okręgu jednostkowego: z1 0.5exp(j), z2 0.5exp(j/2),

) 2 / exp(

5 .

3 0 j

z  . Zmieniając położenie poszczególnych zer tak, by znajdowały się poza okręgiem jednostkowym (zmieniając ich amplitudę na odwrotną), otrzymuje się pozostałe siedem sygnałów z omawianej klasy. W szczególności, zmieniając położenia wszystkich zer otrzymujemy sygnał maksymalnofazowy, dla którego wszystkie zera leżą poza okręgiem jednostkowym, dominującym prążkiem jest prążek o najwyższej częstotliwości, a widmo jest niemalejące. Pozostałe sygnały są mieszanofazowe, o pewnym stopniu zawartości minimalnofazowości (0-100%). W dalszej części pracy pokażemy, jak w oparciu o przebiegi ICF obliczać stopień minimalnofazowości sygnałów. Rys. 4.2 – 4.11 przedstawiają wyniki faktoryzacji wszystkich ośmiu sygnałów z omawianej klasy, zaczynając od sygnału minimalnofazowego u4,1[n] (rys. 4.2 – 4.4). W opisie eksperymentów stosujemy oznaczenia analogiczne z wprowadzonymi w podrozdz. 4.4 z dodatkowymi indeksami dolnymi: 4, który odnosi się do sygnałów 4-tonowych oraz i (i=1,2,3,4,5,6,7,8), który określa kolejne sygnały z omawianej klasy. Wykresy na rys. 4.2 przedstawiają oscylogramy (lewa kolumna) sygnału

]

1[

,

4 n

u , jego obwiedni minimalnofazowej i fazora dodatnioskrętnego, ich trajektorie zespolone (środkowa kolumna) oraz periodogramy (prawa kolumna). Na podstawie tych wykresów wnioskujemy, że dla sygnału minimalnofazowego:

1) periodogram MPE jest taki sam jak periodogram sygnału u4,1[n] tylko przesunięty na osi częstotliwości (prążki znajdują się na częstotliwościach 0, 1000, 2000 i 3000 Hz);

2) PIFP jest zespoloną sinusoidą o częstotliwości równej częstotliwości dominującego prążka sygnału u4,1[n] (2000 Hz), jego amplituda jest stała i równa 1, co wynika z właściwości bifaktoryzacji V-K, opisanych w podrozdz. 4.2;

3) periodogram PIFP to pojedynczy prążek usytuowany na częstotliwości dominującego prążka sygnału u4,1[n] (co jest zgodne z poprzednim punktem), skąd wnioskujemy, że fazor dodatnioskrętny niesie informacje o położeniu widma sygnału.

Zespolone pulsacje chwilowe obliczone dla obu czynników faktoryzacji, jak również dla sygnału u4,1[n], pokazano na rys. 4.3. Na rys. 4.4 zobaczyć można ich zestawienie dla dalszych badań. Wartości w hercach uzyskano mnożąc części rzeczywiste i urojone ICF przez współczynnik FS /2. Na podstawie rys. 4.3 i 4.4 można stwierdzić, że: urojona (e) MPE, trajektoria zespolona MPE (f), periodogram MPE (g), część rzeczywista (h) i urojona (i) PIFP, trajektoria zespolona PIFP (j), periodogram PIFP (k).

0 1 2 3 4 5 (niebieski) i PIFP (czerwony).

1) części rzeczywiste ICF sygnału u4,1[n] oraz jego MPE są sobie równe, natomiast część rzeczywista ICF fazora dodatnioskrętnego jest równa zeru, co wynika oczywiście stąd, że jego amplituda jest stała i równa 1; ta prawidłowość zachodzi dla czynników bifaktoryzacji V-K dowolnego sygnału zespolonego i wynika z właściwości tej faktoryzacji;

2) część urojona ICF fazora dodatnioskrętnego, czyli jego IF jest stała i równa częstotliwości dominującego prążka sygnału u4,1[n] (2000 Hz), nie pokrywa się z częstotliwością środkową pasma sygnału ani też ze środkiem ciężkości widma, obliczonym jako moment unormowany I rzędu;

3) wartość średnia częstotliwości chwilowej sygnału u4,1[n] jest równa częstotliwości chwilowej i widmowej PIFP;

4) części urojone ICF sygnału u4,1[n] oraz jego MPE mają taki sam przebieg, z tym że dla obwiedni minimalnofazowej składowa stała IF równa jest zeru, natomiast dla

5) wartość IF żadnego z omawianych przebiegów nie wskazuje na częstotliwość

Kolejne rysunki przedstawiają wyniki bifaktoryzacji pozostałych siedmiu sygnałów z omawianej klasy. Oznaczymy je jako u4,2[n] (z poza okręgiem jednostkowym), 1 u4,3[n](z 2 poza okręgiem jednostkowym), u4,4[n](z poza okręgiem jednostkowym), 3 u4,5[n] (z i 1 z 2 poza okręgiem jednostkowym), u4,6[n] (z i 1 z poza okręgiem jednostkowym), 3 u4,7[n] (z i 2 z poza okręgiem jednostkowym) oraz 3 u4,8[n] (wszystkie zera poza okręgiem jednostkowym – sygnał maksymalnofazowy). Parametry składowych wszystkich ośmiu sygnałów z omawianej kasy zostały zebrane w tab. 4.1.

TAB.4.1.PARAMETRY SKŁADOWYCH UŻYTYCH DO TESTÓW SYGNAŁÓW

a 1 a 2 a 3 a 4 0,1 0,2 0,3 0,4

Porównując wykresy uzyskane dla tych sygnałów widzimy, że:

1) wszystkie przebiegi wyznaczone dla MPE sygnałów z omawianej klasy są identyczne, co wynika oczywiście stąd, że sygnały te mają takie same amplitudy chwilowe;

2) im więcej zer znajduje się poza okręgiem jednostkowym tym więcej razy trajektoria sygnału zespolonego obiega początek układu współrzędnych w czasie jednego okresu (dwa razy dla sygnału minimalnofazowego, trzy razy dla sygnałów z jednym zerem poza okręgiem jednostkowym, cztery dla sygnałów z dwoma zerami poza okręgiem jednostkowym i pięć dla sygnału maksymalnofazowego); uwidocznione jest to również w większej liczbie przejść przez zero przebiegów części rzeczywistej tych

sygnałów oraz w ich widmach, w których prążkiem dominującym jest prążek pierwszy (2000 Hz) dla sygnału u4,1[n], drugi (3000 Hz) dla sygnałów u4,2[n], u4,3[n] i u4,4[n], trzeci (4000 Hz) dla sygnałów u4,5[n], u4,6[n] i u4,7[n] oraz czwarty (5000 Hz) dla sygnału u4,8[n];

3) PIFP obliczone dla sygnałów od u4,2[n] do u4,8[n] nie są czystymi sinusoidami zespolonymi (o niemodulowanej amplitudzie i częstotliwości); w ich przebiegach można zauważyć modulację częstotliwości;

4) prążki dominujące PIFP pokrywają się z prążkami dominującymi sygnałów zespolonych;

5) przebiegi IF fazorów dodatnioskrętnych nie są stałe, ich zmiany wskazują na modulację częstotliwości fazorów;

6) wartości średnie IF fazorów dodatnioskrętnych są równe wartościom średnim IF sygnałów zespolonych i pokrywają się z częstotliwościami dominującego prążka w widmach tych przebiegów (nie z częstotliwością środkową pasma sygnału zespolonego ani też z środkiem ciężkości widma) – są tym wyższe im więcej zer znajduje się poza okręgiem jednostkowym;

7) części rzeczywiste i urojone przebiegów s4,i[n] oraz smp4,i[n] zachowują okresowość sygnałów u4,i[n]; ta prawidłowość nie zawsze jest obserwowana dla przebiegów

]

,[

4 n

spif i , bowiem pif4,1[n] jest stała;

8) trajektorie sygnałów zespolonych, w których oba zera sprzężone (z i 2 z ) znajdują się 3 wewnątrz okręgu jednostkowego (sygnały u4,1[n] i u4,2[n]) lub poza tym okręgiem (sygnały u4,7[n] i u4,8[n]) wskazują, że faza początkowa tych sygnałów jest równa zeru (fazy początkowe wszystkich ich składowych są równe zeru); gdy jedno z zer sprzężonych znajduje się wewnątrz okręgu jednostkowego, a drugie poza nim faza początkowa sygnału wynosi 0 (dla sygnałów u4,3[n] i u4,5[n] – dodatnie fazy początkowe drugiej i trzeciej składowej) lub 0 (dla sygnałów u4,4[n] i u4,6[n] - ujemne fazy początkowe drugiej i trzeciej składowej); ponadto dla par sygnałów

składowych jednego sygnału z pary przyjmują te same wartości co w drugim sygnale z pary, ale w odwrotnej kolejności, natomiast dla par sygnałów u4,3[n] i u4,4[n] oraz

]

5[

,

4 n

u i u4,6[n] amplitudy kolejnych składowych są takie same, ale fazy składowych drugiej i trzeciej są przeciwne względem siebie. Wynikające z tego dalsze spostrzeżenia są następujące:

a) periodogramy sygnałów u4,3[n] i u4,4[n] oraz u4,5[n] i u4,6[n] są takie same, różnią się natomiast od periodogramów sygnałów odpowiednio u4,2[n] i u4,7[n]; b) periodogramy fazorów pif4,2[n], pif4,3[n] i pif4,4[n] są takie same; dotyczy to

również periodogramów przebiegów pif4,5[n] i pif4,6[n];

c) przebiegi pif4,2[n], pif4,3[n] i pif4,4[n] różnią się od siebie wyłącznie przesunięciem fazowym; dotyczy to również przebiegów pif4,5[n] i pif4,6[n]; d) podobnie przebiegi pif4,2[n], pif4,3[n] i pif4,4[n] różnią się od siebie

wyłącznie przesunięciem fazowym; dotyczy to również przebiegów pif4,5[n] i ]

6[

,

4 n

pif ;

e) trajektorie przebiegów s4,3[n] i s4,4[n] oraz s4,5[n] i s4,6[n] są symetryczne względem osi urojonej (sygnały z tych par mają odwrotny układ zer z pary sprzężonej – mają dokładnie przeciwne fazy początkowe dwóch środkowych prążków, natomiast amplitudy poszczególnych składowych są takie same);

f) trajektorie przebiegów s4,1[n] i s4,8[n], s4,3[n] i s4,6[n]; s4,4[n] i s4,5[n] oraz ]

2[

,

4 n

s i s4,7[n] są symetryczne względem linii imaginaris=0.4581, co odpowiada 3500 Hz – dokładnie środek pasma zajmowanego przez sygnały (sygnały z tych par mają wzajemnie odwrotny układ zer, przebiegi ich IF są odwrócone, jeśli usunąć z nich składową stałą, która jest oczywiście inna dla każdego przebiegu);

9) poszczególne sygnały z omawianej klasy różnią się brzmieniem:

a) im wyższą częstotliwość ma prążek dominujący w widmie, tym wyższa jest percypowana wysokość dźwięku (choć częstotliwość podstawowa wszystkich sygnałów jest taka sama);

b) kolejne sygnały z omawianej klasy mają również coraz jaśniejszą barwę, co wynika z coraz większego udziału wyższych częstotliwości w widmie;

c) dźwięki u4,3[n] i u4,4[n] oraz u4,5[n] i u4,6[n] (które w parach różnią się wyłącznie fazami początkowymi drugiej i trzeciej składowej) w ogóle nie różnią się brzmieniem; jest to zgodne z przyjętym powszechnie założeniem, że różnice w fazach początkowych poszczególnych składowych sygnałów wielotonowych nie są percypowane (lub są bardzo słabo słyszalne) przez ucho ludzkie.

Warto w tym miejscu powrócić do definicji IF zaproponowanych przez Oliveirę i Barroso [OL00] oraz Loughlina i Tacera [LO96], o których pisaliśmy w podrozdz. 3.4. W obu wspomnianych definicjach sygnał analityczny zapisywany był w postaci (3.41), którą przytaczamy ponownie poniżej dla wygody Czytelnika

) ( )

) (

( )

(t a t ej A t ej F t

u (4.38)

a IF było pochodną F(t). Według interpretacji Oliveiry i Barrosy [OL00], u(t) jest wynikiem heterodynowania sygnału a(t)ejA(t) do częstotliwości F(t), a A(t) odpowiada za brak symetrii widma sygnału. Natomiast Loughlin i Tacer [LO96] argumentują, że u(t) jest wynikiem modulacji częstotliwościowej sygnału a(t)ejA(t) (gdzie A(t) może być interpretowane jako kwadraturowa modulacja amplitudy lub, alternatywnie, jako modulacja fazy), a IF jest średnią częstotliwością furierowską rozkładu czasowo-częstotliwościowego w każdej chwili czasu. Zauważmy, że w przypadku wykorzystania bifaktoryzacji V-K u(t) zapisuje się jako u(t)a(t)ejmp(t)ejpif(t), a więc podobnie jak w (4.22), rozdziela się chwilową fazę sygnału na dwie składowe. W tym przypadku IF jest pochodną pif(t). Jak pokazały omawiane symulacje tak wyznaczona IF nie wskazuje na średnią częstotliwość rozkładu czasowo-częstotliwościowego (jak u Louglina i Tacera) ani na częsotliwość wokół której chwilowe widmo u(t) wykazuje największą symetrię (jak u Oliveiry i Barosso), ale na prążek dominujący w widmie u(t). Jak pokażemy dalej taka interpretacja ma uzasadnienie we właściwościach sygnału mowy, gdyż IF fazora dodatnioskrętnego wskazuje na częstotliwość

0 1 2 3 4 5

Rys. 4.5. Wyniki bifaktoryzacji sygnału 4-tonowego u4,2[n]: część rzeczywista i obwiednia (linia przerywana) sygnału (a), trajektoria zespolona (b) i periodogram (c) sygnału, część rzeczywista (d) i urojona (e) MPE, trajektoria zespolona MPE (f) oraz periodogram MPE (g), część rzeczywista (h) i urojona (i) PIFP, trajektoria zespolona PIFP (j) oraz periodogram PIFP (k); przebiegi części rzeczywistych i urojonych ICF sygnału (l,m), jego obwiedni minimalnofazowej (n,o) oraz fazora dodatnioskrętnego (p,q); porównanie przebiegów IF (r) oraz trajektorii zespolonych pulsacji chwilowych (s) sygnału u4,2[n] (kolor czarny), jego obwiedni minimalnofazowej (niebieski) i fazora dodatnioskrętnego (czerwony); rozkład zer na płaszczyźnie zespolonej (t).

0 1 2 3 4 5

Rys. 4.6. Wyniki bifaktoryzacji sygnału 4-tonowego u4,3[n]: część rzeczywista i obwiednia (linia przerywana) sygnału (a), trajektoria zespolona (b) i periodogram (c) sygnału, część rzeczywista (d) i urojona (e) MPE, trajektoria zespolona MPE (f) oraz periodogram MPE (g), część rzeczywista (h) i urojona (i) PIFP, trajektoria zespolona PIFP (j) oraz periodogram PIFP (k); przebiegi części rzeczywistych i urojonych ICF sygnału (l,m), jego obwiedni minimalnofazowej (n,o) oraz fazora dodatnioskrętnego (p,q); porównanie przebiegów IF (r) oraz

0 1 2 3 4 5

Rys. 4.7. Wyniki bifaktoryzacji sygnału 4-tonowego u4,4[n]: część rzeczywista i obwiednia (linia przerywana) sygnału (a), trajektoria zespolona (b) i periodogram (c) sygnału, część rzeczywista (d) i urojona (e) MPE, trajektoria zespolona MPE (f) oraz periodogram MPE (g), część rzeczywista (h) i urojona (i) PIFP, trajektoria zespolona PIFP (j) oraz periodogram PIFP (k); przebiegi części rzeczywistych i urojonych ICF sygnału (l,m), jego obwiedni minimalnofazowej (n,o) oraz fazora dodatnioskrętnego (p,q); porównanie przebiegów IF (r) oraz trajektorii zespolonych pulsacji chwilowych (s) sygnału u4,4[n] (kolor czarny), jego obwiedni minimalnofazowej (niebieski) i fazora dodatnioskrętnego (czerwony); rozkład zer na płaszczyźnie zespolonej (t).

0 1 2 3 4 5

Rys. 4.8. Wyniki bifaktoryzacji sygnału 4-tonowego u4,5[n]: część rzeczywista i obwiednia (linia przerywana) sygnału (a), trajektoria zespolona (b) i periodogram (c) sygnału, część rzeczywista (d) i urojona (e) MPE, trajektoria zespolona MPE (f) oraz periodogram MPE (g), część rzeczywista (h) i urojona (i) PIFP, trajektoria zespolona PIFP (j) oraz periodogram PIFP (k); przebiegi części rzeczywistych i urojonych ICF sygnału (l,m), jego obwiedni minimalnofazowej (n,o) oraz fazora dodatnioskrętnego (p,q); porównanie przebiegów IF (r) oraz

0 1 2 3 4 5

Rys. 4.9. Wyniki bifaktoryzacji sygnału 4-tonowego u4,6[n]: część rzeczywista i obwiednia (linia przerywana) sygnału (a), trajektoria zespolona (b) i periodogram (c) sygnału, część rzeczywista (d) i urojona (e) MPE, trajektoria zespolona MPE (f) oraz periodogram MPE (g), część rzeczywista (h) i urojona (i) PIFP, trajektoria zespolona PIFP (j) oraz periodogram PIFP (k); przebiegi części rzeczywistych i urojonych ICF sygnału (l,m), jego obwiedni minimalnofazowej (n,o) oraz fazora dodatnioskrętnego (p,q); porównanie przebiegów IF (r) oraz trajektorii zespolonych pulsacji chwilowych (s) sygnału u4,6[n] (kolor czarny), jego obwiedni minimalnofazowej (niebieski) i fazora dodatnioskrętnego (czerwony); rozkład zer na płaszczyźnie zespolonej (t).

0 1 2 3 4 5

Rys. 4.10. Wyniki bifaktoryzacji sygnału 4-tonowego u4,7[n]: część rzeczywista i obwiednia (linia przerywana) sygnału (a), trajektoria zespolona (b) i periodogram (c) sygnału, część rzeczywista (d) i urojona (e) MPE, trajektoria zespolona MPE (f) oraz periodogram MPE (g), część rzeczywista (h) i urojona (i) PIFP, trajektoria zespolona PIFP (j) oraz periodogram PIFP (k); przebiegi części rzeczywistych i urojonych ICF sygnału (l,m), jego obwiedni minimalnofazowej (n,o) oraz fazora dodatnioskrętnego (p,q); porównanie przebiegów IF (r) oraz

0 1 2 3 4 5

Rys. 4.11. Wyniki bifaktoryzacji sygnału 4-tonowego u4,8[n]: część rzeczywista i obwiednia (linia przerywana) sygnału (a), trajektoria zespolona (b) i periodogram (c) sygnału, część rzeczywista (d) i urojona (e) MPE, trajektoria zespolona MPE (f) oraz periodogram MPE (g), część rzeczywista (h) i urojona (i) PIFP, trajektoria zespolona PIFP (j) oraz periodogram PIFP (k); przebiegi części rzeczywistych i urojonych ICF sygnału (l,m), jego obwiedni minimalnofazowej (n,o) oraz fazora dodatnioskrętnego (p,q); porównanie przebiegów IF (r) oraz trajektorii zespolonych pulsacji chwilowych (s) sygnału u4,8[n] (kolro czarny), jego obwiedni minimalnofazowej (niebieski) i fazora dodatnioskrętnego (czerwony); rozkład zer na płaszczyźnie zespolonej (t).