• Nie Znaleziono Wyników

Dwięk w multimediach

N/A
N/A
Protected

Academic year: 2021

Share "Dwięk w multimediach"

Copied!
69
0
0

Pełen tekst

(1)

Dwięk w

multimediach

Ryszard Gubrynowicz

Ryszard.Gubrynowicz@pjwstk.edu.pl

Wykład 10

1

(2)

2

Układ akustyczny Układ akustyczny odbiornik

odbiornik - - ośrodek ośrodek - - źródło źródło

(3)

Fala akustyczna

3

(4)

4

Parametry fali akustycznej Parametry fali akustycznej

długość fali (

= cT

Założenie: ruch cząsteczek wokół położenia równowagi jest harmoniczny

c – prędkość

rozchodzenia się fali

= c/f

f – częstotliwość drgań T – okres drgań

Lokalne maksymalne wzrosty ciśnienia-czoła fali

(5)

5

Model sprężysty ośrodka Model sprężysty ośrodka

rozciąganie – naprężenie ujemne

ściskanie – naprężenie dodatnie

(6)

6

Model sześcianu akustycznego Model sześcianu akustycznego

Układ 3D – sześcian akustyczny

(7)

7

Drugie prawo Newtona w układzie 3D Drugie prawo Newtona w układzie 3D

dz dy x dx

p

dz dy x dx

p p p

dz dy p

p Fx

( 1 0) 1 ( 1 )

bezwładność - 0 22

t dz u dy

dx

przyśpieszenie-

2 2

t u

masa elementu- ρ0dxdydz P0 – ciśnienie równowagi

(8)

Prawo Hooke’a stwierdza:

odkształcenie rozchodzące się w ośrodku oddziaływuje na

ścianki sześcianu z ciśnieniem

liniowo proporcjonalnym do zmian jego objętości.

8

Prawo Hooke’a Prawo Hooke’a

V=dx dy dz – objętość przed odkształceniem du, dw, dv – zmiany wymiarów

wzdłuż odpowiednio osi x, y, z

Ciśnienie P odnosi się jedynie do nadwyżki ciśnienia w stosunku do ciśnienia równowagi p0 w środowisku (ciśnienie atmosferyczne). Ciśnienie P nazywane jest

ciśnieniem akustycznym.

(9)

9

Zmienne akustyczne Zmienne akustyczne

Podczas rozchodzenia się dźwięku w powietrzu (lub dowolnym ośrodku sprężystym), w każdym punkcie przestrzeni występują mierzalne

fluktuacje ciśnienia, prędkości, temperatury i gęstości. Fizyczny stan ośrodka można opisać jako zmiany (stosunkowo małe) wokół pewnego stanu równowagi opisany przez wartości średnie powyższych parametrów. W akustyce obiektem analiz są właśnie zmiany wartości parametrów wokół pewnych wartości średnich.

(10)

10

Zależności fizyczne Zależności fizyczne

Dla ośrodka idealnie sprężystego istnieje liniowa zależność między ciśnieniem akustycznym i

zgęszczeniem lokalnym t.j.

gdzie zgęszczenie lokalne s jest definiowane jako stosunek przyrostu gęstości s do gęstości średniej w miejscu obserwacji

0

s d

zaś K - współczynnikiem sprężystości objętościowej zaś K - współczynnikiem sprężystości objętościowej

(11)

11

Ciśnienie akustyczne Ciśnienie akustyczne

Mierząc ciśnienie w określonym punkcie pola

akustycznego otrzymamy przebieg jego zmian w czasie:

Fala akustyczna Ciśnienie

atmosferyczne

(12)

12

Amplituda fali akustycznej

duża amplituda – dźwięk głośny mała amplituda – dźwięk cichy

(13)

13

Przebieg zmian ciśnienia w polu fali dźwiękowej wokół pewnej wartości

średniej p

atm

= 1000 hPa

1 Pa = 1 N/m2

Ciśnienie akustyczne jest łatwe do bezpośredniego zmierzenia za pomocą mikrofonu (pomiarowego!).

(14)

14

Ciśnienie fali akustycznej

Ciśnienie fali akustycznej odnosi się jedynie do nadwyżki ciśnienia w stosunku do ciśnienia

równowagi w ośrodku rozchodzenia się fali (np. w powietrzu będzie to ciśnienie atmosferyczne).

Ciśnienie P nazywane jest ciśnieniem akustycznym, czyli P = pa.

(15)

15

fala podłużna – fala poprzeczna fala podłużna – fala poprzeczna

fala powierzchniowa

(16)

16

Energia niesiona przez dźwięk

Amplituda jest

bezpośrednio związana z intensywnością, która

określa ilość energii akustycznej

przepływającej przez powierzchnię 1 m2.

Mnożąc intensywność przez powierzchnię kuli można otrzymać

wielkość mocy źródła (jest ona stała).

Intensywność jest

proporcjonalna do kwadratu ciśnienia skutecznego.

Im większa jest intensywność dźwięku, tym jest odbierany jako głośniejszy.

W polu idealnie rozproszonym

intensywność dźwięku maleje odwrotnie

proporcjonalnie do kwadratu odległości od źródła.

(17)

17

Zmniejszanie się poziomu dźwięku

wraz ze wzrostem odległości od źródła

(18)

18

Ile energii niesie sygnał mowy?

" . . . 500 osób mówiących bez przerwy przez 12 miesięcy wytworzy energię

wystarczającą do zaparzenia zaledwie 1 filiżanki herbaty."

Speech and Hearing in Communication

-

H. Fletcher,1953,1995

Sygnał mowy generowany przez mężczyznę niesie energię 34 W, przez kobietę – 18 W (pomiar w

odległości 1 m)

(19)

19

Zakres intensywności dźwięków słyszalnych

Minimalna intensywność dźwięku

słyszalnego wynosi w przybliżeniu 10-12

W/m2. Intensywność dźwięku powodująca uszkodzenie słuchu – powyżej 1 W/m2.

(20)

20

Głośność a intensywność dźwięków Głośność a intensywność dźwięków

wywołujących wrażenie słuchowe wywołujących wrażenie słuchowe

Zakres dźwięków odbieranych od najcichszego do najgłośniejszego (tzw. próg bólu) jest jak

1 do 1 000 000 000 000 (12 zer!!!).

Wrażenie głośności jednak nie wzrasta liniowo ze wzrostem intensywności

nie

(21)

21

Prawo Webera-Fechnera Prawo Webera-Fechnera

Z badań psycho- akustycznych

prowadzonych nad

postrzeganiem różnic w głośności dźwięków

wynika, że zgodnie z prawem Webera-

Fechnera głośność dźwięku jest liniowo proporcjonalna do logarytmu z wartości bodźca.

(22)

22

100 hPa

Ciśnienie

atmosferyczne

=1 000 hPa Mowa (1m) ok. 70-75 dB

Poziomy

Poziomy

dźwięków

dźwięków

słyszalnych

słyszalnych

(23)

Wrażenie głośności

a natężenie i częstotliwość tonu

23

(24)

Zależność wrażenia głośności dźwięku od częstotliwości (krzywe równej głośności)

Dla 1000 Hz, fon = dB!

Krzywe równej głośności są krzywymi uśrednionymi

w grupie osób o normalnym słuchu

Słuch jest mniej czuły na dźwięki o niskiej

częstotliwości

Czułość maksymalna słuchu jest w pobliżu częstotliwości

3-4 kHz i jest związana z rezonansem przewodu słuchowego i ucha

środkowego

24

(25)

Łączna charakterystyka przenoszenia ucha zewnętrznego i środkowego

25

(26)

Czułość słuchu na zmiany poziomu i częstotliwości tonu

26

(27)

27

Zależność postrzeganej wysokości

tonu od głośności dźwięku

(28)

28

Decybele A Decybele A

Składowe dźwięku są filtrowane zgodnie z

charakterystyką równej głośności (odwróconą) w zakresie średnich poziomów (40 fonów)

Eliminowane są przede wszystkim dźwięki z dolnego zakresu częstotliwości.

(29)

Poziom dźwięku uwzględniający

charakterystykę częstotliwościową słuchu

dB(A)

29

(30)

30

Porównanie wielkości dB i dBA

Sygnał alarmu przeciwpożarowego – 71 dB 75 dBA Szum tła w hallu uniwersytetu - 70 dB 38 dBA

różnica - 1 dB 27 dBA

A więc pomiar w skali dB nie jest miarodajny dla oceny słyszalności dźwięków ostrzegawczych

Szum tła jest niskoczęstotliwościowy !

(31)

Ocena subiektywna zmian głośności

31

Minimalne postrzegane zmiany poziomu dźwięku są bliskie 1 dB. Zmiana poziomu o 10 dB wywołuje

wrażenie dwukrotnej zmiany głośności dźwięku.

(32)

Pole słyszenia

32

(33)

Zakres słyszenia mowy i muzyki

33

(34)

Co wpływa na jakość brzmienia dźwięku stacjonarnego ?

1. Liczba i amplitudy harmonicznych 2. Składowe nieharmoniczne

3. Wysokość i zmiany tonu podstawowego

4. Tony różnicowe (zwiększają słyszalność tonu podstawowego)

5. Pasma krytyczne i maskowanie (formanty)

34

(35)

Percepcja przestrzeni

35

(36)

Uginanie się czoła fali wokół głowy – źródło fali jest punktowe

36

(37)

Przestrzenna lokalizacja źródła dźwięku

37

Przestrzenna lokalizacja - subiektywna ocena

położenia źródła dźwięku w przestrzeni (kierunku i odległości) przez osobę znajdującą się w polu rozchodzącej się wokół niego fali akustycznej.

- percepcja w przestrzeni otwartej

- percepcja w przestrzeni zamkniętej (z odbiciami)

(38)

2 aspekty lokalizacji źródła

38

1) Korelacja między postrzeganym i

rzeczywistym położeniem źródła dźwięku

2) Wykrywalność minimalnych zmian położenia źródła

(39)

Czułość przestrzenna

39

Na współrzędne kierunku – lewo – prawo Współrzędne podniesienia – góra – dół

Współrzędne odległości – od obserwatora Słuchacze na ogół dość dobrze lokalizują

położenie źródeł dźwięku znajdujących się na wprost nich, gorzej gdy są one z boku lub z tyłu głowy.

Lokalizacja dwuuszna - monouszna

W monousznej – decydujący jest fakt, że

małżowina i głowa wpływają na charakterystykę częstotliwościową odbieranych dźwięków.

(40)

Trzy współrzędne słyszenia przestrzennego

40

(41)

Płaszczyzny lokalizacji źródła

• Zmysł słuchu jest wszechkierunkowy,

aczkolwiek dźwięki z różnych kierunków nie są jednakowo odbierane

• Płaszczyzny analizy lokalizacji dźwięków:

 Płaszczyzna horyzontalna (na poziomie uszu)

 Płaszczyzny pionowe

41

(42)

Współrzędne sferyczne w przestrzeni

42

Kąt azymutalny Kąt biegunowy

źródło

(43)

Wright Patterson Air Force Base - Dayton

Średnica kuli - 5 m, 277 głośników 43

(44)

Ocena subiektywna położenia źródła dźwięku

44

= rzeczywiste położenie

= oszacowane położenie

(45)

45

Percepcja odległości

(46)

46

Percepcja odległości

(47)

Czynniki wpływające na ocenę odległości od źródła

47

 Znajomość głośności znajomych źródeł

Barwa dźwięku znanych źródeł (częstotliwości tonów wysokich są silniej tłumione w powietrzu, co powoduje zmianę barwy dźwięku przy oddalaniu się od jego źródła

uwypuklenie czoła fali dźwiękowej

stosunek natężenia dźwięku bezpośredniego do dźwięków odbitych

doświadczenie słuchowe i wiązanie zjawisk akustycznych z obserwacjami wzrokowymi

(48)

Lokalizacja źródła dźwięku w płaszczyźnie poziomej

(horyzontalnej)

48

(49)

Cień akustyczny

49

Gdy rozmiary głowy są porównywalne z

długością fali, lub większe, powstaje

wskutek odbić tzw. cień akustyczny od strony głowy, przeciwnej do strony padania fali dźwiękowej

(50)

Lokalizacja źródła dźwięku

Poziom dźwięku

docierającego do lewego ucha jest większy, niż do

prawego. ILD– międzyuszna różnica poziomów jest

podstawą do ustalania

kierunku, z którego dociera fala dźwiękowa. Drugim

elementem pomocnym w lokalizacji jest ITD–

międzyuszna różnica czasu.

Jednakże skuteczność lokalizacji w oparciu o

pierwszy lub drugi parametr zależy od częstotliwości fali.

50

(51)

Rozkład poziomów intensywności (dBA) mowy wokół głowy

Osoba mówiąca znajduje się w odległości ok. 90 cm od

słuchacza, który obracając głowę może modyfikować różnicę poziomów fali docierającej do lewego i prawego ucha o

±1÷1.5 dBA/300 obrotu głowy względem mówcy. 51

(52)

Międzyuszna różnica poziomów przy zmianie kąta położenia źródła

Część energii niesiona

przez falę dźwiękową jest pochłaniana/odbijana

przez głowę, wskutek czego powstaje „cień

akustyczny”, to jest obszar o zmniejszonym poziomie energii, w wyniku efektu ekranującego głowy.

52

(53)

Ocena kąta położenia źródła na

podstawie oceny różnicy poziomu (ILD)

53

ILD- - interaural level difference

(54)

Dlaczego dla dostatecznie niskich częstotliwości różnica

poziomów ILD staje się niezauważalna ?

54

(55)

Międzyuszna różnica poziomów

55

Pełny

sygnał zmniejszony sygnał

Dla niskich częstotliwości za głową nie ma cienia akustycznego, ponieważ rozmiary głowy są znacznie mniejsze od długości fali λ.

Zakres długości fal słyszalnych – od 2.15 cm do 17 m

(56)

Międzyuszna różnica poziomu (ILD)

Międzyuszna różnica poziomów zależy od kąta padania, i również od częstotliwości fali. Te o wysokiej częstotliwości ulegają mniejszemu ugięciu, a więc i cień akustyczny wokół

głowy jest większy, niż w przypadku fal o niskiej częstotliwości.

Dla głowy o średnicy ok. 17 cm, cień ten jest pomijalnie mały dla f< 500 Hz (λ=68 cm). Dla f>3000 Hz różnica jest istotna.56

(57)

Zależność różnicy poziomów

natężenia (ILD) od kąta azymutalnego i częstotliwości fali dźwiękowej

57

(58)

Pomiary różnicy poziomów ILD od kąta azymutalnego i częstotliwości

58

(59)

Częstotliwościowa zależność ILD dla kąta 30

0

59

300 Hz – 1 dB 1100 Hz – 4 dB 4200 Hz – 5 dB 10 000 Hz – 6 dB 15 000 Hz – 10 dB

(60)

Również i dla niskich częstotliwości fali dźwiękowej obserwuje się

zdolność słuchacza do określenia położenia źródła, ale mechanizm jest inny.

60

(61)

Międzyuszna różnica czasu ITD Międzyuszna różnica czasu ITD

61

(62)

Zależność różnicy czasu ITD od kierunku padania fali

62

(63)

Jak obliczyć ITD ?

63

Różnica w czasie wynikająca z różnicy długości dróg d od źródła do lewego i prawego

ucha (<1,3 kHz) : d = r∙θ + r∙sin(θ)

r – promień głowy (8 cm)

θ – kąt ustawienia źródła, dla θ=300 (π/6), ITD=0.24 ms (dla prędkości fali 344 m/s)

(64)

Różnica czasu dla niskich częstotliwości

64

Uwzględniając różnicę dróg ugięcia czoła fali

kulistej na kuli o promieniu a, różnica czasu ITD

tjest określona wzorem:

a– promień głowy, ok. 8,75 cm;

c – prędkość rozchodzenia się fali, 34 400 cm/s

= 763 s dla α=900

(65)

Gdy fala dźwiękowa o zadanej

częstotliwości dociera do (prawego) ucha określona grupa komórek rzęskowych (te związane z tą częstotliwością) jest

pobudzona do wyładowań

Transformacja dźwięku na pobudzenia impulsowe w neuronach :

Komórki te generują ciągi impulsów stało- fazowe (phase-locked) względem fazy sygnału pobudzającego.

Ta fala dociera z pewnym opóźnieniem do lewego ucha. W wyniku tego powstaje przesunięcie fazy między impulsami z lewego i prawego ucha. Ciągi impulsów w lewym uchu są również stało-fazowe.

65

Różnica w czasach wyładowań ~kąt azymutalny

(66)

Każdy neuron jest pobudzany z obu uszu. Z powodu różnic długości aksonów pobudzenia docierają do neuronu w różnym czasie.

Neuron działa jak detektor koincydencji i wyładowuje tylko w momentach, gdy docierają do niego jednocześnie oba impulsy.

Korelator z linią opóźniającą:

=> Każdy neuron koduje określoną międzyuszną różnicę

czasów. 66

(67)

Korelacja:

) ( t   R

) (

* )

(t R t L

L(t)* R(t  dt )

Ciąg impulsów lewego ucha

Ciąg impulsów

prawego ucha Opóźnienie czasowe Detekcja

koincydencji Uśrednienie po czasie

67

(68)

Fizjologia percepcji ITD i ILD (w pniu mózgu)

Fig 10.5

medial superior olive (MSO) przyśrodkowe jądro oliwki górnej – oblicza różnicę czasów z sygnałów neuronów czułych na ITD

lateral superior olive (LSO) boczne jądro oliwki górnej – oblicza różnicę z sygnałów neuronów czułych na ILD 68

(69)

Czasy ITD dla wybranych kątów azymutalnych

69

Cytaty

Powiązane dokumenty

Zwężenie toru głosowego przy artykulacji spółgłoskowej jest znacznie większe (może prowadzić nawet do chwilowego zamknięcia toru), niż w przypadku

W wyniku nakładania się tych ruchów spółgłoska /b/ w sekwencji /ibi/ jest inna, niż w sekwencji /ibu/.... Sekwencje ruchów artykulacyjnych Sekwencje

melodyczny – gdy akcentowanie sylaby jest realizowane poprzez zmianę wysokości głosu Dla języka polskiego przyjmuje się , że akcent jest zazwyczaj dynamiczny, choć jest

Komórki rzęskowe rozmieszczone wzdłuż błony podstawnej są odpowiednio dostrojone. częstotliwościowo elektrycznie, jak i

Po przekroczeniu pewnej wartości (pasma krytycznego filtru słuchowego) dalszy wzrost szerokości pasma szumu maskującego nie wpływa na wartość progu detekcji tonu (Fletcher,

• głośny dźwięk maskuje inne, które w skali częstotliwości znajdują się w bezpośrednim sąsiedztwie.. • pasmo krytyczne – pasmo wewnątrz którego nie słyszy się tonów

wszystkie informacje o dźwięku (np. IID, ITD, widmo) istotne dla lokalizacji źródła przez obserwatora. Charakterystyka filtrów zmienia się w zależności od miejsca, z

sytuacji, w których brak dźwięku odbierany jest jako silnie nienaturalny. 2) Oczywiście, słuch jest także zmysłem mowy, wówczas informacja wizualna jest na ogół tylko jej