Dwięk w
multimediach
Ryszard Gubrynowicz
Ryszard.Gubrynowicz@pjwstk.edu.pl
Wykład 10
1
2
Układ akustyczny Układ akustyczny odbiornik
odbiornik - - ośrodek ośrodek - - źródło źródło
Fala akustyczna
3
4
Parametry fali akustycznej Parametry fali akustycznej
długość fali (
= cT
Założenie: ruch cząsteczek wokół położenia równowagi jest harmoniczny
c – prędkość
rozchodzenia się fali
= c/f
f – częstotliwość drgań T – okres drgań
Lokalne maksymalne wzrosty ciśnienia-czoła fali
5
Model sprężysty ośrodka Model sprężysty ośrodka
rozciąganie – naprężenie ujemne
ściskanie – naprężenie dodatnie
6
Model sześcianu akustycznego Model sześcianu akustycznego
Układ 3D – sześcian akustyczny
7
Drugie prawo Newtona w układzie 3D Drugie prawo Newtona w układzie 3D
dz dy x dx
p
dz dy x dx
p p p
dz dy p
p Fx
( 1 0) 1 ( 1 )
bezwładność - 0 22
t dz u dy
dx
przyśpieszenie-
2 2
t u
masa elementu- ρ0dxdydz P0 – ciśnienie równowagi
Prawo Hooke’a stwierdza:
odkształcenie rozchodzące się w ośrodku oddziaływuje na
ścianki sześcianu z ciśnieniem
liniowo proporcjonalnym do zmian jego objętości.
8
Prawo Hooke’a Prawo Hooke’a
V=dx dy dz – objętość przed odkształceniem du, dw, dv – zmiany wymiarów
wzdłuż odpowiednio osi x, y, z
Ciśnienie P odnosi się jedynie do nadwyżki ciśnienia w stosunku do ciśnienia równowagi p0 w środowisku (ciśnienie atmosferyczne). Ciśnienie P nazywane jest
ciśnieniem akustycznym.
9
Zmienne akustyczne Zmienne akustyczne
Podczas rozchodzenia się dźwięku w powietrzu (lub dowolnym ośrodku sprężystym), w każdym punkcie przestrzeni występują mierzalne
fluktuacje ciśnienia, prędkości, temperatury i gęstości. Fizyczny stan ośrodka można opisać jako zmiany (stosunkowo małe) wokół pewnego stanu równowagi opisany przez wartości średnie powyższych parametrów. W akustyce obiektem analiz są właśnie zmiany wartości parametrów wokół pewnych wartości średnich.
10
Zależności fizyczne Zależności fizyczne
Dla ośrodka idealnie sprężystego istnieje liniowa zależność między ciśnieniem akustycznym i
zgęszczeniem lokalnym t.j.
gdzie zgęszczenie lokalne s jest definiowane jako stosunek przyrostu gęstości s do gęstości średniej w miejscu obserwacji
0
s d
zaś K - współczynnikiem sprężystości objętościowej zaś K - współczynnikiem sprężystości objętościowej
11
Ciśnienie akustyczne Ciśnienie akustyczne
Mierząc ciśnienie w określonym punkcie pola
akustycznego otrzymamy przebieg jego zmian w czasie:
Fala akustyczna Ciśnienie
atmosferyczne
12
Amplituda fali akustycznej
duża amplituda – dźwięk głośny mała amplituda – dźwięk cichy
13
Przebieg zmian ciśnienia w polu fali dźwiękowej wokół pewnej wartości
średniej p
atm= 1000 hPa
1 Pa = 1 N/m2
Ciśnienie akustyczne jest łatwe do bezpośredniego zmierzenia za pomocą mikrofonu (pomiarowego!).
14
Ciśnienie fali akustycznej
Ciśnienie fali akustycznej odnosi się jedynie do nadwyżki ciśnienia w stosunku do ciśnienia
równowagi w ośrodku rozchodzenia się fali (np. w powietrzu będzie to ciśnienie atmosferyczne).
Ciśnienie P nazywane jest ciśnieniem akustycznym, czyli P = pa.
15
fala podłużna – fala poprzeczna fala podłużna – fala poprzeczna
fala powierzchniowa
16
Energia niesiona przez dźwięk
Amplituda jest
bezpośrednio związana z intensywnością, która
określa ilość energii akustycznej
przepływającej przez powierzchnię 1 m2.
Mnożąc intensywność przez powierzchnię kuli można otrzymać
wielkość mocy źródła (jest ona stała).
Intensywność jest
proporcjonalna do kwadratu ciśnienia skutecznego.
Im większa jest intensywność dźwięku, tym jest odbierany jako głośniejszy.
W polu idealnie rozproszonym
intensywność dźwięku maleje odwrotnie
proporcjonalnie do kwadratu odległości od źródła.
17
Zmniejszanie się poziomu dźwięku
wraz ze wzrostem odległości od źródła
18
Ile energii niesie sygnał mowy?
" . . . 500 osób mówiących bez przerwy przez 12 miesięcy wytworzy energię
wystarczającą do zaparzenia zaledwie 1 filiżanki herbaty."
Speech and Hearing in Communication
-
H. Fletcher,1953,1995Sygnał mowy generowany przez mężczyznę niesie energię 34 W, przez kobietę – 18 W (pomiar w
odległości 1 m)
19
Zakres intensywności dźwięków słyszalnych
Minimalna intensywność dźwięku
słyszalnego wynosi w przybliżeniu 10-12
W/m2. Intensywność dźwięku powodująca uszkodzenie słuchu – powyżej 1 W/m2.
20
Głośność a intensywność dźwięków Głośność a intensywność dźwięków
wywołujących wrażenie słuchowe wywołujących wrażenie słuchowe
Zakres dźwięków odbieranych od najcichszego do najgłośniejszego (tzw. próg bólu) jest jak
1 do 1 000 000 000 000 (12 zer!!!).
Wrażenie głośności jednak nie wzrasta liniowo ze wzrostem intensywności
nie
21
Prawo Webera-Fechnera Prawo Webera-Fechnera
Z badań psycho- akustycznych
prowadzonych nad
postrzeganiem różnic w głośności dźwięków
wynika, że zgodnie z prawem Webera-
Fechnera głośność dźwięku jest liniowo proporcjonalna do logarytmu z wartości bodźca.
22
100 hPa
Ciśnienie
atmosferyczne
=1 000 hPa Mowa (1m) ok. 70-75 dB
Poziomy
Poziomy
dźwięków
dźwięków
słyszalnych
słyszalnych
Wrażenie głośności
a natężenie i częstotliwość tonu
23
Zależność wrażenia głośności dźwięku od częstotliwości (krzywe równej głośności)
Dla 1000 Hz, fon = dB!
Krzywe równej głośności są krzywymi uśrednionymi
w grupie osób o normalnym słuchu
Słuch jest mniej czuły na dźwięki o niskiej
częstotliwości
Czułość maksymalna słuchu jest w pobliżu częstotliwości
3-4 kHz i jest związana z rezonansem przewodu słuchowego i ucha
środkowego
24
Łączna charakterystyka przenoszenia ucha zewnętrznego i środkowego
25
Czułość słuchu na zmiany poziomu i częstotliwości tonu
26
27
Zależność postrzeganej wysokości
tonu od głośności dźwięku
28
Decybele A Decybele A
Składowe dźwięku są filtrowane zgodnie z
charakterystyką równej głośności (odwróconą) w zakresie średnich poziomów (40 fonów)
Eliminowane są przede wszystkim dźwięki z dolnego zakresu częstotliwości.
Poziom dźwięku uwzględniający
charakterystykę częstotliwościową słuchu
dB(A)
29
30
Porównanie wielkości dB i dBA
Sygnał alarmu przeciwpożarowego – 71 dB 75 dBA Szum tła w hallu uniwersytetu - 70 dB 38 dBA
różnica - 1 dB 27 dBA
A więc pomiar w skali dB nie jest miarodajny dla oceny słyszalności dźwięków ostrzegawczych
Szum tła jest niskoczęstotliwościowy !
Ocena subiektywna zmian głośności
31
Minimalne postrzegane zmiany poziomu dźwięku są bliskie 1 dB. Zmiana poziomu o 10 dB wywołuje
wrażenie dwukrotnej zmiany głośności dźwięku.
Pole słyszenia
32
Zakres słyszenia mowy i muzyki
33
Co wpływa na jakość brzmienia dźwięku stacjonarnego ?
1. Liczba i amplitudy harmonicznych 2. Składowe nieharmoniczne
3. Wysokość i zmiany tonu podstawowego
4. Tony różnicowe (zwiększają słyszalność tonu podstawowego)
5. Pasma krytyczne i maskowanie (formanty)
34
Percepcja przestrzeni
35
Uginanie się czoła fali wokół głowy – źródło fali jest punktowe
36
Przestrzenna lokalizacja źródła dźwięku
37
Przestrzenna lokalizacja - subiektywna ocena
położenia źródła dźwięku w przestrzeni (kierunku i odległości) przez osobę znajdującą się w polu rozchodzącej się wokół niego fali akustycznej.
- percepcja w przestrzeni otwartej
- percepcja w przestrzeni zamkniętej (z odbiciami)
2 aspekty lokalizacji źródła
38
1) Korelacja między postrzeganym i
rzeczywistym położeniem źródła dźwięku
2) Wykrywalność minimalnych zmian położenia źródła
Czułość przestrzenna
39
Na współrzędne kierunku – lewo – prawo Współrzędne podniesienia – góra – dół
Współrzędne odległości – od obserwatora Słuchacze na ogół dość dobrze lokalizują
położenie źródeł dźwięku znajdujących się na wprost nich, gorzej gdy są one z boku lub z tyłu głowy.
Lokalizacja dwuuszna - monouszna
W monousznej – decydujący jest fakt, że
małżowina i głowa wpływają na charakterystykę częstotliwościową odbieranych dźwięków.
Trzy współrzędne słyszenia przestrzennego
40
Płaszczyzny lokalizacji źródła
• Zmysł słuchu jest wszechkierunkowy,
aczkolwiek dźwięki z różnych kierunków nie są jednakowo odbierane
• Płaszczyzny analizy lokalizacji dźwięków:
Płaszczyzna horyzontalna (na poziomie uszu)
Płaszczyzny pionowe
41
Współrzędne sferyczne w przestrzeni
42
Kąt azymutalny Kąt biegunowy
źródło
Wright Patterson Air Force Base - Dayton
Średnica kuli - 5 m, 277 głośników 43
Ocena subiektywna położenia źródła dźwięku
44
= rzeczywiste położenie
= oszacowane położenie
45
Percepcja odległości
46
Percepcja odległości
Czynniki wpływające na ocenę odległości od źródła
47
Znajomość głośności znajomych źródeł
Barwa dźwięku znanych źródeł (częstotliwości tonów wysokich są silniej tłumione w powietrzu, co powoduje zmianę barwy dźwięku przy oddalaniu się od jego źródła
uwypuklenie czoła fali dźwiękowej
stosunek natężenia dźwięku bezpośredniego do dźwięków odbitych
doświadczenie słuchowe i wiązanie zjawisk akustycznych z obserwacjami wzrokowymi
Lokalizacja źródła dźwięku w płaszczyźnie poziomej
(horyzontalnej)
48
Cień akustyczny
49
Gdy rozmiary głowy są porównywalne z
długością fali, lub większe, powstaje
wskutek odbić tzw. cień akustyczny od strony głowy, przeciwnej do strony padania fali dźwiękowej
Lokalizacja źródła dźwięku
Poziom dźwięku
docierającego do lewego ucha jest większy, niż do
prawego. ILD– międzyuszna różnica poziomów jest
podstawą do ustalania
kierunku, z którego dociera fala dźwiękowa. Drugim
elementem pomocnym w lokalizacji jest ITD–
międzyuszna różnica czasu.
Jednakże skuteczność lokalizacji w oparciu o
pierwszy lub drugi parametr zależy od częstotliwości fali.
50
Rozkład poziomów intensywności (dBA) mowy wokół głowy
Osoba mówiąca znajduje się w odległości ok. 90 cm od
słuchacza, który obracając głowę może modyfikować różnicę poziomów fali docierającej do lewego i prawego ucha o
±1÷1.5 dBA/300 obrotu głowy względem mówcy. 51
Międzyuszna różnica poziomów przy zmianie kąta położenia źródła
Część energii niesiona
przez falę dźwiękową jest pochłaniana/odbijana
przez głowę, wskutek czego powstaje „cień
akustyczny”, to jest obszar o zmniejszonym poziomie energii, w wyniku efektu ekranującego głowy.
52
Ocena kąta położenia źródła na
podstawie oceny różnicy poziomu (ILD)
53
ILD- - interaural level difference
Dlaczego dla dostatecznie niskich częstotliwości różnica
poziomów ILD staje się niezauważalna ?
54
Międzyuszna różnica poziomów
55
Pełny
sygnał zmniejszony sygnał
Dla niskich częstotliwości za głową nie ma cienia akustycznego, ponieważ rozmiary głowy są znacznie mniejsze od długości fali λ.
Zakres długości fal słyszalnych – od 2.15 cm do 17 m
Międzyuszna różnica poziomu (ILD)
Międzyuszna różnica poziomów zależy od kąta padania, i również od częstotliwości fali. Te o wysokiej częstotliwości ulegają mniejszemu ugięciu, a więc i cień akustyczny wokół
głowy jest większy, niż w przypadku fal o niskiej częstotliwości.
Dla głowy o średnicy ok. 17 cm, cień ten jest pomijalnie mały dla f< 500 Hz (λ=68 cm). Dla f>3000 Hz różnica jest istotna.56
Zależność różnicy poziomów
natężenia (ILD) od kąta azymutalnego i częstotliwości fali dźwiękowej
57
Pomiary różnicy poziomów ILD od kąta azymutalnego i częstotliwości
58
Częstotliwościowa zależność ILD dla kąta 30
059
300 Hz – 1 dB 1100 Hz – 4 dB 4200 Hz – 5 dB 10 000 Hz – 6 dB 15 000 Hz – 10 dB
Również i dla niskich częstotliwości fali dźwiękowej obserwuje się
zdolność słuchacza do określenia położenia źródła, ale mechanizm jest inny.
60
Międzyuszna różnica czasu ITD Międzyuszna różnica czasu ITD
61
Zależność różnicy czasu ITD od kierunku padania fali
62
Jak obliczyć ITD ?
63
Różnica w czasie wynikająca z różnicy długości dróg d od źródła do lewego i prawego
ucha (<1,3 kHz) : d = r∙θ + r∙sin(θ)
r – promień głowy (8 cm)
θ – kąt ustawienia źródła, dla θ=300 (π/6), ITD=0.24 ms (dla prędkości fali 344 m/s)
Różnica czasu dla niskich częstotliwości
64
Uwzględniając różnicę dróg ugięcia czoła fali
kulistej na kuli o promieniu a, różnica czasu ITD
tjest określona wzorem:
a– promień głowy, ok. 8,75 cm;
c – prędkość rozchodzenia się fali, 34 400 cm/s
= 763 s dla α=900
Gdy fala dźwiękowa o zadanej
częstotliwości dociera do (prawego) ucha określona grupa komórek rzęskowych (te związane z tą częstotliwością) jest
pobudzona do wyładowań
Transformacja dźwięku na pobudzenia impulsowe w neuronach :
Komórki te generują ciągi impulsów stało- fazowe (phase-locked) względem fazy sygnału pobudzającego.
Ta fala dociera z pewnym opóźnieniem do lewego ucha. W wyniku tego powstaje przesunięcie fazy między impulsami z lewego i prawego ucha. Ciągi impulsów w lewym uchu są również stało-fazowe.
65
Różnica w czasach wyładowań ~kąt azymutalny
Każdy neuron jest pobudzany z obu uszu. Z powodu różnic długości aksonów pobudzenia docierają do neuronu w różnym czasie.
Neuron działa jak detektor koincydencji i wyładowuje tylko w momentach, gdy docierają do niego jednocześnie oba impulsy.
Korelator z linią opóźniającą:
=> Każdy neuron koduje określoną międzyuszną różnicę
czasów. 66
Korelacja:
) ( t R
) (
* )
(t R t L
L(t)* R(t dt )Ciąg impulsów lewego ucha
Ciąg impulsów
prawego ucha Opóźnienie czasowe Detekcja
koincydencji Uśrednienie po czasie
67
Fizjologia percepcji ITD i ILD (w pniu mózgu)
Fig 10.5
medial superior olive (MSO) przyśrodkowe jądro oliwki górnej – oblicza różnicę czasów z sygnałów neuronów czułych na ITD
lateral superior olive (LSO) boczne jądro oliwki górnej – oblicza różnicę z sygnałów neuronów czułych na ILD 68
Czasy ITD dla wybranych kątów azymutalnych
69