• Nie Znaleziono Wyników

Kształtowanie wi ˛ azki

W dokumencie Index of /rozprawy2/11076 (Stron 50-60)

Skuteczno´s´c algorytmów rozpoznawania mowy i mówców spada dramatycznie wraz ze spadkiem jako´sci rejestrowanego sygnału. Mo˙zna zało˙zy´c, ˙ze skuteczno´s´c rozpoznania poje-dynczego fonemu spada o 5%-10% na ka˙zde 3 dB pogorszenia SNR [46]. Wpływ zmiany SNR na jako´s´c rozpoznania mówcy zostanie szczegółowo przedstawiony w kolejnym rozdziale. Oznacza to, ˙ze ró˙znica w jako´sci sygnału, która jest ledwie odczuwalna przez człowieka, jest bardzo znacz ˛aca dla systemu komputerowego. Z tego powodu tak wiele wysiłku jest wkładane w prace nad systemami poprawy jako´sci sygnału mowy. Wiele z tych systemów opiera si˛e na matrycach wielomikrofonowych [77]. Spo´sród wszystkich algorytmów opartych na matrycach wielomikrofonowych najbardziej popularne jest kształtowanie wi ˛azki [69].

Kształtowanie wi ˛azki mo˙ze odbywa´c si˛e poprzez zastosowanie podstawowych algorytmów polegaj ˛acych na sumowaniu przesuni˛etych lub przefiltrowanych sygnałów. Oczywi´scie kluczem do działania w tej drugiej sytuacji jest dobór odpowiednich wag filtrów. Oprócz rozwi ˛aza´n opisanych w dalszej cz˛e´sci tego rozdziału (wykorzystuj ˛acych m. in. algorytm optymalizacyjny Neldera-Meada) nale˙zy wspomnie´c o rozwi ˛azaniach opartych o koncepcj˛e linearly constrained minimum variance(LCMV) [7, 50] zaproponowan ˛a przez Frosta w 1972 [28], czy generalized sidelobe canceller(GSC)) [29, 11].

Rozwa˙zmy matryc˛e liniow ˛a zło˙zon ˛a z N mikrofonów rozmieszczonych w odległo´sciach d od siebie oraz fal˛e płask ˛a e2jπf padaj ˛ac ˛a na matryc˛e pod k ˛atem θ i generowan ˛a przez ´zródło umieszczone w polu dalekim (Rysunek 5.1). Zgodnie z zasadami opisanymi w rozdziale 2, odle-gło´s´c pomi˛edzy mikrofonami powinna by´c mniejsza ni˙z połowa długo´sci fali, aby nie nast ˛apiło niekorzystne zjawisko aliasingu przestrzennego. We wszystkich rozwa˙zaniach, podobnie jak wcze´sniej, zakłada´c b˛edziemy ˙ze sensory składaj ˛ace si˛e na matryc˛e s ˛a sensorami wszechkie-runkowymi. Model teoretyczny zakłada równie˙z, ˙ze charakterystyka cz˛estotliwo´sciowa mikro-fonów jest płaska w interesuj ˛acym nas (czyli nios ˛acym informacje przydatne do rozpoznawa-nia mówcy) pa´smie cz˛estotliwo´sci 100 - 4000 Hz. Zało˙zenie to b˛edzie skorygowane podczas omawiania wyników rzeczywistych eksperymentów. Je´sli ´zródło d´zwi˛eku znajduje si˛e w polu dalekim, mo˙zemy zało˙zy´c, ˙ze fala docieraj ˛aca do matrycy jest fal ˛a płask ˛a, tak jak zostało to przedstawione na rysunku. K ˛at θ oznacza kierunek, z którego dochodz ˛a d´zwi˛eki (DOA). Sygnał z ka˙zdego z mikrofonów poddawany jest opó´znieniu, które pozwala urz ˛adzeniu „nastraja´c” si˛e

51 H H H H H H H H H H j H H H H H H H H H H j H H H H H H H H H H j H H H H H H H H H H j θ h h h h m1 m2 m3 mN .. . --w1(f ) w2(f ) w3(f ) wN(f ) .. . -6 ? ?   P -y(t)

Rysunek 5.1: Ogólny schemat układu realizuj ˛acego kształtowanie wi ˛azki.

na okre´slony kierunek, z którego dochodz ˛a d´zwi˛eki. Wyj´scie z matrycy mo˙ze by´c zapisane jako

ˆ y(f ) = N X n=1 ˆ wn(f ) ˆmn(f ), (5.1)

gdzie ˆmn(f ) jest sygnałem docieraj ˛acym do mikrofonu n, który mo˙zemy zapisa´c jako ˆ

mn(f ) = e2πf j(t−τn), (5.2)

gdzie τn = ndc−1sin θ jest czasem propagacji fali pomi˛edzy pierwszym a n-tym sensorem matrycy z pr˛edko´sci ˛a d´zwi˛eku c. Zespolony współczynnik wn(f ) ma posta´c

ˆ

wn(f ) = an(f )en(f ), (5.3)

gdzie an(f ) i φn(f ) s ˛a rzeczywistymi, zale˙znymi od cz˛estotliwo´sci współczynnikami okre´sla-j ˛acymi amplitudow ˛a i fazow ˛a modyfikacj˛e sygnału. Poprzez modyfikacj˛e warto´sci poszczegól-nych współczynników an(f ) mo˙zemy wpływa´c na kształt charakterystyki kierunkowej, a po-przez modyfikacj˛e φn(f ) mo˙zemy decydowa´c o poło˙zeniu listka głównego.

5.1. Kształtowanie wi ˛azki poprzez sumowanie opó´znionych sygnałów 52

5.1. Kształtowanie wi ˛azki poprzez sumowanie opó´znionych

sygnałów

Rozwa˙zmy, dla uproszczenia, układ, w którym współczynniki amplitudowe równaj ˛a si˛e 1. Charakterystyka kierunkowo-cz˛estotliwo´sciowa takiego układu okre´slona jest nast˛epuj ˛aco

P (f, θ) = N X

n=1

ej(φn(f )+2πf ndc−1sin θ). (5.4)

Najprostszym algorytmem umo˙zliwiaj ˛acym kształtowanie wi ˛azki jest opó´znianie sygnałów docieraj ˛acych do poszczególnych mikrofonów, a nast˛epnie ich sumowanie (ang. delay-and-sum beamforming). Wró´cmy do równania (5.4). Zauwa˙zmy, ˙ze ustawiaj ˛ac wagi przesuni˛e´c fazo-wych w poszczególnych kanałach na

φn(f ) = −2πf ndc−1sin θ0 (5.5)

mo˙zemy spowodowa´c, ˙ze charakterystyka kierunkowo-cz˛estotliwo´sciowa przyjmie posta´c

P (f, θ) = N X

n=1

e2πf ndc−1(sin θ−sin θ0). (5.6)

Jak wida´c sprowadza si˛e to do stwierdzenia, ˙ze nowa charakterystyka kierunkowo-cz˛estotliwo´sciowa ma kształt to˙zsamy z charakterystyk ˛a wyj´sciow ˛a, a zmienił si˛e jedynie kie-runek, w którym skierowany jest główny listek

P0(f, θ) = P (f, θ − θ0). (5.7)

Odpowiednikiem przesuni˛ecia fazy sygnału w dziedzinie cz˛estotliwo´sci jest odpowiednie przesuni˛ecie sygnału w dziedzinie czasu. A zatem mo˙zemy wyznaczy´c przesuni˛ecie w dziedzi-nie czasu, którym powinny by´c poddane sygnały w poszczególnych kanałach matrycy wielo-mikrofonowej τn = φn 2πf (5.8) = −2πf nd sin θ0c−1 2πf (5.9) = −nd sin θ0c−1. (5.10)

Jak wida´c czas ten pokrywa si˛e z czasem, jaki zajmuje fali propagacja od pierwszego do n-tego mikrofonu. Dzi˛eki temu nast˛epuje konstruktywne sumowanie fal, które docieraj ˛a z wybranego przez nas kierunku przy jednoczesnym tłumieniu fal docieraj ˛acych z innych stron.

5.2. Kształtowanie wi ˛azki poprzez sumowanie filtrowanych sygnałów 53

Oczywi´scie, chc ˛ac zachowa´c moc sygnału na wyj´sciu układu zbli˙zon ˛a do mocy sygnału na wej´sciu nale˙zy zastosowa´c wagi amplitudowe w poszczególnych kanałach o warto´sci an = 1/N . To prowadzi ostatecznie do zespolonych współczynników

wn(f ) = 1 Ne

−j2πf nd sin θ0c−1

, (5.11)

które mo˙zemy bezpo´srednio zastosowa´c w układzie takim, jak na Rysunku 5.1. Sygnał wyj-´sciowy jest okre´slony jako

ˆ y(f ) = 1 N N X n=1 ˆ mn(f )e−j2πf nd sin θ0c−1. (5.12)

Odpowiednio w dziedzinie czasu

y(n) = 1 N N X n=1 mn(t − τn), (5.13)

gdzie τnokre´slone jest przez (5.10).

Kształtowanie wi ˛azki poprzez sumowanie opó´znionych sygnałów jest algorytmem niezwy-kle wydajnym. Jednak˙ze wraz ze wzrostem mocy obliczeniowej, równie˙z systemów wbudowa-nych, czy mobilwbudowa-nych, straciło nieco na popularno´sci na korzy´s´c rozwi ˛aza´n bardziej zło˙zonych, które omówione zostan ˛a w dalszej cz˛e´sci rozdziału.

5.2. Kształtowanie wi ˛azki poprzez sumowanie filtrowanych

sygnałów

Opisany w poprzedniej cz˛e´sci algorytm działa skutecznie dla sygnałów o charakterze w ˛ a-skopasmowym. Sygnał mowy jest sygnałem o charakterze szerokopasmowym, którego pasmo (uwzgl˛edniaj ˛ac 30 dB dynamik˛e) rozci ˛aga si˛e od ok. 100 do 4000 Hz. Cecha ta powoduje znaczne utrudnienie w konstruowaniu rozwi ˛aza´n wielomikrofonowych, które musz ˛a pracowa´c w tak szerokim zakresie cz˛estotliwo´sci. Ideałem byłaby sytuacja, w której charakterystyka kie-runkowa matrycy nie byłaby zale˙zna od cz˛estotliwo´sci. Do tego ideału zbli˙za nas zast ˛apienie zwykłego przesuwania sygnałów w czasie przez filtrowanie sygnałów (ang. filter-and-sum be-amforming) [50].

Schemat takiego układu został przedstawiony na rysunku 5.2. Jak wida´c, współczynniki ˆ

wn(f ) wyst˛epuj ˛ace w równaniu (5.1), odpowiadaj ˛a tym razem za filtracj˛e sygnału. Zwró´cmy uwag˛e, ˙ze w opisie algorytmu przeszli´smy do dziedziny dyskretnej. Dzi˛eki temu łatwiejszy jest opis filtrów wchodz ˛acych w skład układu. A zatem sygnał wyj´sciowy mo˙ze zosta´c, w dziedzinie

5.2. Kształtowanie wi ˛azki poprzez sumowanie filtrowanych sygnałów 54

Rysunek 5.2: Struktura układu realizuj ˛acego kształtowanie wi ˛azki poprzez sumowanie filtro-wanych sygnałów.

czasu, zapisany jako

y(t) = N X n=1 K X k=0 wn,kxn(t − kTs), (5.14)

gdzie Tsjest okresem próbkowania, K jest rz˛edem filtru FIR u˙zytego do przetwarzania sygnału, a wn,ks ˛a współczynnikami filtru stowarzyszonego z n-tym mikrofonem.

Podobnie jak wcze´sniej mo˙zemy przeanalizowa´c fal˛e płask ˛a (generowan ˛a przez ´zródło umieszczone w polu dalekim) ej2πf t padaj ˛ac ˛a na matryc˛e wielomikrofonow ˛a. W tej sytuacji (5.14) mo˙ze by´c przepisane jako

y(t) = N X n=1 K X k=0 wn,kej 2πf[t−(nd sin θc−1+kTs)]. (5.15)

Ostatecznie charakterystyka kierunkowo-cz˛estotliwo´sciowa układu okre´slona jest jako

P (f, θ) = N X n=1 K X k=0 wn,ke−j2πf (nd sin θc−1+kTs) . (5.16)

Aby unikn ˛a´c aliasingu przestrzennego, odległo´s´c d pomi˛edzy mikrofonami musi by´c mniej-sza ni˙z połowa najkrótszej interesuj ˛acej nas długo´sci fali, tzn.

d < λmin

2 =

c 2fmax

5.3. Iteracyjna optymalizacja układów kształtuj ˛acych wi ˛azk˛e 55

Oczywi´scie, spełniony musi by´c równie˙z warunek Nyquista o próbkowaniu w dziedzinie czasu według którego

Ts< 1

2fmax. (5.18)

5.3. Iteracyjna optymalizacja układów kształtuj ˛acych

wi ˛azk˛e

Oczywi´scie, najistotniejszym elementem układu realizuj ˛acego kształtowanie wi ˛azki po-przez sumowanie przefiltrowanych sygnałów s ˛a współczynniki wn,k filtrów FIR. Odpowiedni ich dobór decyduje o kształcie charakterystyki kierunkowej oraz o tym, jak zmienia si˛e ona wraz z cz˛estotliwo´sci ˛a. Jedn ˛a z metod doboru współczynników wn,k jest filtracja adaptacyjna opisana w Rozdziale 4. Jej zalet ˛a jest fakt, ˙ze mo˙ze przystosowywa´c si˛e do zmieniaj ˛acych si˛e warunków akustycznych. Jednak˙ze, je´sli zało˙zymy, ˙ze warunki akustyczne nie zmieniaj ˛a si˛e podczas nagrania (co jest prawd ˛a dla opisywanego kontekstu systemu konferencyjnego) mo-˙zemy ustali´c współczynniki filtrów, a nast˛epnie je korygowa´c je´sli zajdzie taka potrzeba. Takie rozwi ˛azanie jest znacznie mniej obci ˛a˙zaj ˛ace obliczeniowo, a co za tym idzie, nawet dla wielo-kanałowego systemu mo˙ze by´c przygotowane do działania w czasie rzeczywistym. W ramach niniejszej pracy do optymalizacji współczynników filtru został zaproponowany iteracyjny algo-rytm optymalizacji współczynników b˛ed ˛acy rozwini˛eciem metody Neldera-Meada [55].

Oznaczmy przez Pd(f, θ) charakterystyk˛e kierunkowo-cz˛estotliwo´sciow ˛a, któr ˛a chcieliby-´smy aby nasze urz ˛adzenie posiadało. Mo˙zemy ustali´c Φ(w) jako sum˛e kwadratów ró˙znic po-mi˛edzy Pd(f, θ) a rzeczywist ˛a charakterystyk ˛a układu P (f, θ, w), która zale˙zy od współczyn-ników w filtrów matrycy

Φ(w) = Z fd Z θd [P (f, θ, w) − Pd(f, θ)]2df dθ. (5.19)

Φ(w) jest nieliniow ˛a funkcj ˛a celu w N (K + 1) kierunkowej przestrzeni. A zatem wykorzy-sta´c nale˙zy jeden z algorytmów nieliniowej optymalizacji bez ogranicze´n. Algorytm Neldera i Meada [55] (zwany równie˙z sympleksow ˛a metod ˛a spadku, ang. downhill simplex method) jest metod ˛a numeryczn ˛a na znajdowanie ekstremum (w szczególno´sci minimum) nieliniowej funk-cji wielu zmiennych f : Rn → R bez konieczno´sci obliczenia pochodnych. Jest to znaczne uproszczenie procesu poszukiwania ekstremum. Rozwi ˛azanie to nie było stosowane wcze´sniej do optymalizacji współczynników filtrów stowarzyszonego z matryc ˛a wielomikrofonow ˛a. Jego niew ˛atpliw ˛a zalet ˛a jest znacznie mniejsza zło˙zono´s´c obliczeniowa.

Algorytm Neldera-Meada jest oparty na poj˛eciu sympleksu. Sympleks jest uogólnieniem poj˛ecia trójk ˛ata w wielowymiarowej przestrzeni. W ka˙zdej iteracji porównywane s ˛a warto´sci funkcji celu Φ(w) we wszystkich wierzchołkach sympleksu (w naszym wypadku jest to N (K + 1) + 1 wierzchołków). Wierzchołek, w którym warto´s´c funkcji jest najwi˛eksza jest zast˛epowany

5.4. Symulacja procesu optymalizacji współczynników 56 -50 0 50 0 2000 4000 6000 -40 -30 -20 -10 0 DOA f [Hz] D [dB]

Rysunek 5.3: Charakterystyka kierunkowo-cz˛estotliwo´sciowa układu realizuj ˛acego sumowanie opó´znionych sygnałów.

nowym. Z ka˙zd ˛a kolejn ˛a iteracj ˛a sympleks staje si˛e coraz mniejszy, co prowadzi w ko´ncu do odnalezienia minimum [53].

5.4. Symulacja procesu optymalizacji współczynników

Zmniejszanie odległo´sci pomi˛edzy mikrofonami w układzie kształtuj ˛acym wi ˛azk˛e jest ko-rzystne ze wzgl˛edu na lepsz ˛a prac˛e takiego układu w wysokich cz˛estotliwo´sciach. Z drugiej strony zmniejszanie odległo´sci pomi˛edzy mikrofonami prowadzi do pogorszenia własno´sci ma-trycy w zakresie niskich cz˛estotliwo´sci. Na drodze eksperymentów ustalona została odległo´s´c równa d = 7 cm, która zapewnia brak aliasingu przestrzennego dla cz˛estotliwo´sci poni˙zej 2.5 kHz, co okazało si˛e by´c wystarczaj ˛ac ˛a szeroko´sci ˛a pasma do naszych zastosowa´n. Oczy-wi´scie nie oznacza to, ˙ze dla wy˙zszych cz˛estotliwo´sci układ nie b˛edzie pracował. Oznacza to, ˙ze mog ˛a dla wy˙zszych cz˛estotliwo´sci pojawia´c si˛e listki boczne, co b˛edzie widoczne w pre-zentowanych w dalszej cz˛e´sci rozdziału charakterystykach kierunkowo-cz˛estotliwo´sciowych. We wszystkich opisanych w niniejszym rozdziale wynikach (zarówno symulacji, jak i pomia-rów) został wykorzystany układ zło˙zony z czterech mikrofonów. W obu przypadkach były to mikrofony o charakterystyce dookólnej.

Na Rysunku 5.3 przedstawiona została charakterystyka kierunkowo-cz˛estotliwo´sciowa układu kształtuj ˛acego wi ˛azk˛e opartego o sumowanie opó´znionych sygnałów (K = 0 na Ry-sunku 5.2). w zakresie od 0 do 6 kHz. W przypadku tego układu wszystkie współczynniki filtrów były takie same, a opó´znienia dobrane w ten sposób, ˙zeby główny listek charakterystyki kierunkowej skierowany był w kierunku θ = 0.

5.4. Symulacja procesu optymalizacji współczynników 57 -50 0 50 0 2000 4000 6000 -30 -25 -20 -15 -10 -5 0 DOA  f [Hz] M a g n it u d e r e s p o n s e [ d B ]

Rysunek 5.4: Charakterystyka kierunkowo-cz˛estotliwo´sciowa układu realizuj ˛acego sumowanie filtrowanych sygnałów o współczynnikach dobranych na drodze optymalizacji.

Na charakterystyce zobrazowanej na Wysunku Rysunku 5.3 widoczne s ˛a wyra´zne listki boczne, które pojawiaj ˛a si˛e w wy˙zszych cz˛estotliwo´sciach i powoduj ˛a, ˙ze, oprócz sygnału do-cieraj ˛acego z interesuj ˛acego nas ´zródła odbierane s ˛a równie˙z zakłócenia pochodz ˛ace z innych kierunków. Jest to zjawisko szczególnie dotkliwe w systemach, które maj ˛a pracowa´c z sygna-łem mowy we wdro˙zeniach konferencyjnych, gdzie w kierunku listków bocznych mo˙ze rów-nie˙z znajdowa´c si˛e mówca, którego wypowied´z nie jest dla nas w danym momencie istotna. St ˛ad zastosowanie w tego typu układach rozwi ˛aza´n polegaj ˛acych na sumowaniu filtrowanych sygnałów, które zostały opisane w poprzednim podrozdziale.

Rysunek 5.4 przedstawia charakterystyk˛e kierunkowo-cz˛estotliwo´sciow ˛a układu opartego o sumowanie filtrowanych sygnałów. Współczynniki filtrów zostały dobrane na drodze opty-malizacji Neldera-Meada opisanej w poprzednim podrozdziale. Rz ˛ad filtru wynosił 9 (K = 9). Warto´sci współczynników zostały dobrane w wyniku 5506 iteracji. Wymagana charakterystyka Pd(f, θ) została zdefiniowana jako

Pd(f, θ) = (

1 for θ = 0

0 for θ 6= 0 . (5.20)

Listki boczne obni˙zyły si˛e do 5 dB, z -5 dB w przypadku układu z K = 0 do -10 dB. W tym samym czasie listek główny nie uległ zmianie w interesuj ˛acym nas zakresie 400 Hz - 4000 kHz. W kolejnym rozdziale przedstawione zostan ˛a wyniki pomiarów rzeczywistej charakterystyki kierunkowej układu, w którym zastosowano obliczone współczynniki filtrów.

5.5. Wyniki eksperymentu z sygnałami rzeczywistymi 58

Rysunek 5.5: Matryca czteromikrofonowa podczas pomiarów w komorze bezechowej AGH.

5.5. Wyniki eksperymentu z sygnałami rzeczywistymi

Kolejnym etapem prac zwi ˛azanych z zastosowaniem kształtowania wi ˛azki w przetwarzaniu mowy były eksperymenty maj ˛ace potwierdzi´c słuszno´s´c wyboru algorytmu Neldera-Meada do optymalizacji współczynników matrycy. Praktyka zwi ˛azana z konstruowaniem urz ˛adze´n operu-j ˛acych w pa´smie akustycznym wskazuje, ˙ze cz˛esto wyniki symulacji nie pokrywaj ˛a si˛e z wyni-kami pomiarów. St ˛ad niezb˛ednym etapem pracy nad ka˙zdym urz ˛adzeniem akustycznym s ˛a jego pomiary w komorze bezechowej, które daj ˛a jednoznaczn ˛a odpowied´z na temat charakterystyki kierunkowo-cz˛estotliwo´sciowej urz ˛adzenia. Urz ˛adzenie fizycznie zło˙zone z czterech wysokiej jako´sci mikrofonów o charakterystyce dookólnej było testowane w du˙zej komorze bezechowej b˛ed ˛acej cz˛e´sci ˛a Laboratorium Akustyki Technicznej Wydziału In˙zynierii Mechanicznej i Robo-tyki AGH. Wygl ˛ad urz ˛adzenia podczas testów przedstawiony został na Rysunku 5.5. W prawym górnym rogu widoczna jest matryca, w lewym dolnym gło´snik - ´zródło d´zwi˛eku. W tle znajduj ˛a si˛e kliny d´zwi˛ekochłonne.

Opisywana komora bezechowa1 to w istocie du˙zy ˙zelbetowy sze´scian, o boku 10 m o ma-sie 600 ton umieszczony na 100 spr˛e˙zynach, których zadaniem jest odseparowanie komory od wibracji terenu spowodowanych np. ruchem samochodów po pobliskiej drodze. Wewn ˛atrz kon-strukcji znajduj ˛a si˛e kliny wykonane z d´zwi˛ekochłonnego materiału, których zadaniem jest roz-praszanie i pochłanianie d´zwi˛eków generowanych wewn ˛atrz komory. Znajduj ˛a si˛e one równie˙z na podłodze komory zatem wewn ˛atrz niej badacze poruszaj ˛a si˛e po stalowej kracie umieszczo-nej 0,5 metra powy˙zej ostrosłupów. Obj˛eto´s´c dost˛epna do bada´n wynosi 342 m3(6, 7×7, 1×7, 2

1Opis dotyczy komory bezechowej w 2012 roku czyli w czasie, gdy prowadzone były opisywane pomiary. W roku 2014 komora przeszła generalny remont, podczas którego uległy zmianie niektóre z jej parametrów.

5.5. Wyniki eksperymentu z sygnałami rzeczywistymi 59

Rysunek 5.6: Wynik pomiaru charakterystyki kierunkowo-cz˛estotliwo´sciowej.

m). Ci´snienie akustyczne zmierzone wewn ˛atrz komory wynosi 1,5 dBA (w nocy spada nawet poni˙zej 0 dBA).

Podczas pomiarów charakterystyki kierunkowej urz ˛adze´n opisywanych w niniejszej pracy została wykorzystana niezwykle precyzyjna platforma obrotowa b˛ed ˛aca elementem wyposa˙ze-nia komory. Pozwala ona na ustawienie badanego układu z dokładno´sci ˛a 0,01 stopnia. Popraw-no´s´c pomiaru w dziedzinie cz˛estotliwo´sci zapewniał układ emituj ˛acy szum biały. Zło˙zony był on z analogowego generatora szumu (BK1405) oraz wysokiej klasy gło´snika o płaskiej cha-rakterystyce cz˛estotliwo´sciowej (JBL LSR2325P). Charakterystyka kierunkowa mierzona była co 1 stopie´n. Dla ka˙zdego z poło˙ze´n matrycy nagrywany był 5 sekundowy fragment szumu białego. Do akwizycji u˙zyta została zewn˛etrzna karta d´zwi˛ekowa Lexicon I-O 82.

Po dokonaniu pomiarów sygnały zarejestrowane przez matryc˛e były filtrowane z wykorzy-staniem współczynników uzyskanych za pomoc ˛a algorytmu opisanego w poprzednim rozdziale, a nast˛epnie sumowane w celu otrzymania sygnału wyj´sciowego y(t) zgodnie z (5.15). Cha-rakterystyka cz˛estotliwo´sciowa dla ka˙zdego z poło˙ze´n była obliczana z wykorzystaniem FFT. Jeden z wyników (dla matrycy o odległo´sciach pomi˛edzy mikrofonami równych 7 cm) został przedstawiony na Rysunku 5.6. Wyra´zna jest zgodno´s´c kształtu charakterystyki kierunkowej z zało˙zeniami oraz efektami wcze´sniejszej symulacji. Co istotne, mimo tak dobranej odległo´sci pomi˛edzy mikrofonami, dzi˛eki odpowiednio dobranym współczynnikom filtrów została znacz-nie zredukowana wysoko´s´c listków bocznych charakterystyki kierunkowej.

Wyniki eksperymentów zwi ˛azanych z zastosowaniem matrycy wielomikrofonowej i kształ-towania wi ˛azki w rozpoznawaniu mówcy zostały przedstawione w Rozdziale 6.

6. Matryce wielomikrofonowe w rozpoznawaniu

W dokumencie Index of /rozprawy2/11076 (Stron 50-60)

Powiązane dokumenty