1
Dwięk w
multimediach
Ryszard Gubrynowicz
Ryszard.Gubrynowicz@pjwstk.edu.pl
Wykład 4
2
Formant „śpiewaczy”
a – średnie widmo mowy
b – średnie widmo akompaniamentu orkiestry c – dobry śpiewak z orkiestrą
Johan Sundberg: The Acoustics of the Singing Voice; Sci. Amer., March 1977
Gdzie jest tworzony rezonans śpiewaczy ?
3
Artykulacja i własności akustyczne spółgłosek
4
5
Artykulacja spółgłoski /s/
6
Model przejścia z artykulacji
samogłoskowej do spółgłoskowej
Dynamika ruchów
artykulacyjnych spółgłoskowych
7
Miejsce artykulacji spółgłosek
http://www.chass.utoronto.ca/~danhall/phonetics/sammy.html
wargowe
zębowe dziąsłowe Podniebienne/palatalne velarne
języczkowe gardłowe
krtaniowe/głośniowe
9
Miejsce artykulacji spółgłosek
Zwężenie toru głosowego przy artykulacji spółgłoskowej jest znacznie większe (może prowadzić nawet do chwilowego zamknięcia toru), niż w przypadku artykulacji
samogłoskowej.
Tak więc w przypadku spółgłosek można mówić o miejscu artykulacji określającego np. położenia środka zwężenia lub miejsca chwilowego
zamknięcia toru głosowego. Miejsce artykulacji ma wyraźny wpływ na strukturę akustyczną
dźwięku mowy.
10
Źródło - filtr: spółgłoski trące
Widmo źródła szumowego jest formowane przez charakterystykę rezonansową
przedniej komory znajdującą się między ustami i szczeliną. Na ogół wpływ tylnej komory jest pomijalnie mały, im mniejsza jest powierzchnia przekroju szczeliny, tym mniejszy jest jej wpływ.
11
Wpływ źródła na kształt spektrogramu
12
Obwiednia widma spółgłosek trących
Elementem formującym kształt widma
spółgłosek trących jest komora utworzona z przodu szczeliny.
Długość tej komory wyznacza najniższą jej częstotliwość rezonansową. Im jest dłuższa, tym ta częstotliwość jest mniejsza.
13
Klasyfikacja spółgłosek trących wg umiejscowienia zwężenia i/lub
przeszkody w torze głosowym
Trące /x/ /S/ /s’/ /s/ /f/
szczelina głośnia Palatalno-
dziąsłowa palatalna dziąsłowa Wargowo-zębowa
przeszkoda dolne
zęby górne
zęby górne
zęby górne zęby Przednia
komora Charakterystyka
samogłoskowa 2-6 kHz 2-6 kHz >4 kHz b. mały wpływ
Źródło szumu dla głosek /S,s’,s/ powstaje przede wszystkim na przeszkodzie i przy zachowaniu tej samej prędkości
przepływu strugi powietrza ma największą energię w porównaniu z pozostałymi spółgłoskami trącymi (/x,f/).
14
Spółgłoska /S/
15
Rezonanse /s - S/
/ s - S/ ( Stevens,
Acoustic Phonetics, 1998)
l = 4
cm : 2500 Hz
l= 2.6
cm :
3500 Hz C=340 m/s, l – długość komory l fr c
4
Częstotliwość rezonansowa
/s/
/S/
16
Widma /s – S/
/s/
/S/
Wyliczone z modelu
17
Długość szczeliny
Szczelina przy artykulacji /s,s’/ jest stosunkowo krótka, dla /S/ - jest dłuższa.
Jeżeli długość przedniej komory jest bardzo mała, to jej najniższa częstotliwość rezonansowa jest tak wysoka, że jej udział w kształtowaniu widma
dźwięku jest pomijalnie mały. Wówczas obwiednia widma promieniowanego dźwięku jest płaska. Tak jest np. w przypadku spółgłoski /f/.
Widmo głosek trących
19
Spektrogramy „s” i „sz”
“s” ”sz”
20 5
10 15 20 25 30 35
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Widma głosek szumowych
/S/ /s/
/s’/
/ts’/
Głoski o paśmie szumu różnie Głoski o paśmie szumu różnie położonym w skali częstotliwości położonym w skali częstotliwości
kliknij 21 5
10 15 20 25
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Widma spółgłosek /x/ i /f/
/x/
/f/
Wpływ miejsca artykulacji na widmo spółgłosek trących /x,f/
22
Aerodynamika spółgłosek zwartych (wybuchowych)
Tor głosowy podczas artykulacji tych głosek jest na chwilę zamknięty, a następnie szybko rozwarty.
W pierwszej fazie następuje szybki wzrost ciśnienia ponadkrtaniowego i zamknięcie przepływu powietrza.
W drugiej fazie – rozwarcie powoduje powstanie krótkiego impulsu szumowego.
Źródło pobudzenia, podobnie jak w przypadku trących ma charakter turbulentny, ale czas pobudzenia jest znacznie krótszy (5-10 ms zamiast 100-200 ms).
Szum jest formowany przez komorę utworzoną w torze głosowym z przodu, przed zwarciem.
23
Miejsce artykulacji –głosek zwartych
/p/ /t/ /k/
24
Aspiracja
Niekiedy przy artykulacji spółgłosek zwartych, fałdy głosowe stosunkowo wolno przechodzą do pozycji, w której drgają. Powstaje przejściowa szczelina powodująca pojawienie się turbulencji.
/k/
25
Percepcja takiej samej struktury akustycznej Percepcja takiej samej struktury akustycznej
CV(CV) w zależności od kontekstu CV(CV) w zależności od kontekstu
Szum+
samogłoska +CV
Kliknij na rysunek
26
Percepcja takiej samej struktury akustycznej po modyfikacji
Po segmencie szumowym wstawiono krótką pauzę
Kliknij na rysunek
27
Percepcja sekwencji (C)VCV Percepcja sekwencji (C)VCV
Z przebiegu usunięto początkowy segment szumowy
Kliknij na rysunek
28
Udźwięcznianie spółgłosek – zwarta dźwięczna
a g a
29
Udźwięcznianie spółgłosek – zwarta dźwięczna
aba
a b a
30
Spółgłoski zwarto-trące /ts, tS,ts’/
Już sama transkrypcja fonetyczna sygnalizuje, że artykulacja spółgłoski zwarto-trącej składa się z 2 faz: w pierwszej powstaje segment zwarcia
(całkowite zamknięcie toru głosowego jak w przypadku głosek wybuchowych), w drugiej -
utworzenie szczeliny (brak plozji), w wyniku czego zostaje wygenerowany krótki segment szumowy.
31
Zwarto-trące w sygnale rzeczywistym
/ts’/
/tS/
32
Udźwięcznianie spółgłosek
Uformowanie w torze głosowym szczeliny, czy nawet jego chwilowe zamknięcie nie musi
spowodować zaprzestania ruchów fałdów
głosowych. W języku polskim wszystkie spółgłoski bezdźwięczne (z wyjątkiem /x/) mają swoje
dźwięczne odpowiedniki. Przy artykulacji
spółgłosek bezdźwięcznych fałdy głosowe są rozwarte – przy dźwięcznych są do siebie
zbliżone. Wówczas w formowaniu dźwięków mowy uczestniczą jednocześnie dwa źródła pobudzające różne części toru głosowego.
33
Wpływ rozmiarów zwężenia w torze na pracę źródła krtaniowego
szczelina pełne zwarcie
34
Widma dźwięcznych głosek trących
oza ava
35
Artykulacja /r/ -> /ar/
24-26 Przejście z
konfiguracji /a/ do /r/ (27 ms)
Środkowa i tylna część języka utrzymuje konfigurację samogłoski /a/
36
Artykulacja /r/ -> /are/
26-27 Konfiguracja /r/ (przód) i /a/ (środek i tył) W trakcie opadania koniuszka języka masa
jego przechodzi z konfiguracji /a/ do /e/.
37
Porównanie ruchów koniuszka języka przy artykulacji /t/-/r/
5-12 : 93 ms 24-26 : 27 ms
38
Analiza realizacji spółgłoski /r/
Koniuszek języka (apex) raz (najczęściej) lub dwa (niekiedy więcej) przywiera do
wałka dziąsłowego. Zwarcie jest
krótkotrwałe, na ogół niepełne. Realizacja tej spółgłoski silnie zależy od pozycji,
kontekstu, często od nawyków osobniczych.
Przykłady dźwiękowe
39
Nazalizacja
40
Modelowanie nazalizacji
41
Artykulacja nosowa
Artykulacja nosowa powoduje opuszczenie
podniebienia miękkiego i otwarcie wlotu do jamy nosowej. Od strony akustycznej powoduje to
modyfikację charakterystyki przenoszenia toru głosowego. Przy artykulacji samogłosek
nazalizowanych energia akustyczna jest
promieniowana równolegle przez usta i nos. W przypadku samogłosek nosowych – przede
wszystkim przez nos. Jednoczesne pobudzenie do drgań jamy ustnej i nosowej powoduje
pojawienie się w charakterystyce toru tzw.
antyformantów.
42
Dźwięki nosowe i nazalizowane
Dźwięki tego typu są artykułowane z udziałem jamy nosowej, modyfikującej funkcję rezonansową toru
artykulacyjnego.
43
Antyformanty
W przeciwieństwie do samogłosek charakterystyka widmowa spółgłosek jest wyznaczona nie tylko
przez formanty, ale również przez antyformanty.
Antyformant – przeciwieństwo formantu,
charakterystyczne minimum w widmie dźwięku, tłumi składowe źródła w określonym zakresie częstotliwości.
44
Ilustracja modyfikacji widma źródła przez formant i antyformant
45
Jakie elementy toru mogą powodują pojawianie się antyformantów
Częstotliwości antyformantów są określone przez wymiary tylnej komory i rozmiarów
szczeliny (dla trących), wymiary komory ustnej ustnej (dla spółgłosek nosowych).
46
Kiedy mogą pojawiać się antyformanty ?
1) Gdy tor głosowy jest rozdzielony na dwie sprzężone ze sobą części np. w przypadku nazalizacji, czy artykulacji spółgłoski nosowej 2) Jama ustna zostaje rozdzielona na dwie
równoległe do siebie części, jak to ma miejsce w przypadku artykulacji spółgłoski /l/
3) Szczelina przy artykulacji spółgłosek trących jest stosunkowo szeroka i występuje
sprzężenie ze sobą tylnej i przedniej komory
47
Charakterystyka toru gardłowo-ustnego /a/ z włączonym torem nosowym
antyformanty
48
Wpływ nosowania na charakterystykę samogłoski /i/ 3 różne stopnie
otwarcia wlotu do jamy nosowej
/m/ 49
Widmo spółgłoski nosowej wymówionej między /a/
50
Miejsce artykulacji spółgłosek – ruchy formantów
Ruchy formantów wskazują jakiego typu jest zmiana konfiguracji toru głosowego. Każdemu miejscu artykulacji spółgłoski odpowiadają
odpowiednie ruchy formantów na przejściach od/do samogłoski. Największe ruchy
formantów występują w pobliżu spółgłosek zwartych, najmniejsze dla przymkniętych.
Ruchy formantów odwzorowujace ruchy artykulacyjne języka
51
/ada/
Dynamika ruchów
artykulacyjnych spółgłoskowych
52
53
Ruchy artykulacyjne spółgłoski przymkniętej
„aja”
j l w 54
Formanty F1, F2 i F3 samogłosek polskich i spółgłosek (/j,w/) i bocznej /l/
55
F2
Ruch formantu F2 przy przejściu do (i od) artykulacji spółgłoski dwuwargowej - /b/
56
F2
Ruch formantu F2 przy przejściu do (i od) artykulacji spółgłoski dziąsłowej /d/
57
Ruch formantu F2 przy przejściu do (i od) artykulacji spółgłoski zwarto-
trącej podniebiennej /ts’/
58
Ruch formantu F2 przy przejściu od artykulacji spółgłoski trącej
podniebiennej /S/
59
Ruchy formantów F1 i F2 zależnie od miejsca i sposobu artykulacji
60
Różne tranzjenty – ta sama spółgłoska
di da
1400 Hz <-- tranzjent F2 --->
Liberman et al. (1967) Perception of the speech code.
Psych Rev 74, 431-461
Tranzjenty formantów spółgłosek wybuchowych dźwięcznych
61
62
Sposób artykulacji spółgłosek
1. Pobudzenie dźwięczne, bezdźwięczne, lub mieszane
2. Przepływ strugi powietrza zaburzony (szczelina, lub zwarcie lub ich kombinacja) lub nie
3. Konfiguracja toru głosowego stacjonarna lub nie w momencie artykulacji spółgłoski
4. Struktura jedno- lub polisegmentalna 5. Jama nosowa włączona lub nie
63
Klasyfikacja artykulacyjna spółgłosek
64
Wybrane cechy dystynktywne
niektórych spółgłosek w płaszczyźnie miejsca artykulacji i typu pobudzenia
Cecha artyk.\głoska b d g p t k s z m n
wargowa + - - + - - - - + -
zębowe - + - - + - + + - +
tylno-językowa - - + - - + - - - - pobudzenie
krtaniowe + + + - - - - + + +
65
Efekty akustyczne spółgłoskowych ruchów artykulacyjnych
Artykulacji spółgłosek towarzyszą ruchy
formantów spowodowane zmianami konfiguracji toru głosowego.
Gdy powstaje znaczne przewężenie w torze głosowym pojawia się źródło pobudzenia
szumowego.
Chwilowemu zamknięciu toru głosowego
towarzyszy niemal całkowity zanik sygnału (jeżeli wlot do jamy nosowej jest zamknięty), po którym może wystąpić pobudzenie impulsowe (głoski
zwarte), bądź krótki segment pobudzenia szumowego (głoski zwarto-trące).
66
Cechy akustyczne dźwięków mowy
Akustyczny sygnał mowy niesie informacje umożliwiające rozpoznanie poszczególnych głosek wypowiedzianych w określonej
sekwencji. Te elementy sygnału, które
umożliwiają rozróżnienie lub identyfikację
nazywamy cechami akustycznymi – obejmują one częstotliwości formantów, ich tranzjenty, widma plozji spółgłosek zwartych, widma
szumu spółgłosek trących, obecność zwarcia – b. mała amplituda sygnału itp.
67
Cechy akustyczne sposobu artykulacji
Periodyczna - aperiodyczna (szum lub impuls)
Poziom formantów wysoki
niski formantówruch nosowe
tranzjentowe
szybki
samogłoski
stosunkowo stałe częstotliwości formantów
składowa nieperiodyczna, stosunkowo duża energia HF
Czas trwania szumu impuls krótki długi
wybuchowe
zwarto- trące
trące
wyraźna składowa periodyczna
68
Oscylogram wyrazu „szesnaście”
69
Widmo samogłoski /n/ w sylabie /na/
00
Czas [s]
0.4
0.33 0.34 0.35 0.36 0.37 0.38 0.39 0.4 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
0.33 0.34 0.35 0.36 0.37 0.38 0.39 0.4 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 Czas [s]
50 60 70 80 90 100 110
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Czestotliwosc [Hz]
50 60 70 80 90 100 110
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Czestotliwosc [Hz]
70
-0.75 -0.5 -0.25 0 0.25 0.5 0.75
0 0.1 0.2 0.3 0.4
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 6000 6500 7000 7500 8000
S tS e p j o n a
Sekwencja /StSepj/
71
Cechy akustyczne artykulacji
położenie
formantów tranzjent F2 zakres szumu
F2 wysoki - przednia
samogłoski Spółgłoski tranzjentowe
F2 niski - tylna
F1 niski - wysoka F1 wysoki - niska
F2 wysoki - /j/
F2 średni - /l/
F2 niski - /w/
spółgłoski
(boczna)
W przypadku samogłosek mowa jest o ułożeniu masy języka, a nie o miejscu artykulacji !
72
Cechy akustyczne miejsca artykulacji spółgłosek
tranzjent F2 zakres szumu zwarte i
nosowe zwarto- trące trące
w dół - wargowe
w górę – podniebienne
dziąsłowe (w otoczeniu /a/) w górę – podniebienne
w górę – /S/ trące zwarte i
zwarto- trące
wysoki - /s/
niski - S
szeroki - /f,x/
wysoki - podniebienne niski - wargowe
Anatomia artykulacji
spółgłoskowej - podsumowanie
73
74
Zasadnicze tematy
1. Modele źródeł pobudzenia szumowego 2. Charakterystyka spółgłosek trących
3. Charakterystyka spółgłosek zwartych – źródło pobudzenia
4. Charakterystyka spółgłosek zwarto-trących 5. Ruchy artykulacyjne i ruchy formantów
6. Jak pracuje źródło krtaniowe przy pobudzeniu mieszanym
7. Artykulacja dźwięków nosowych i nazalizowanych
8. Antyformanty
75
Terminy angielskie
Zwężenie, szczelina – constriction Zwarcie – closure
Ciśnienie podgłośniowe – subglottal pressure
Ciśnienie ponadgłośniowe – supraglottal pressure Cechy dystynktywne – distinctive features
Impuls szumowy, plozja – burst
Laminar, turbulent flow, airflow – przepływ (struga) laminarny, turbulentny
Spółgłogłoski trące – fricatives, fricative consonants Spółgłoski zwarte, plozyjne, wybuchowe – stops Spółgłoski zwarto-trące, afrykaty – affricates
dźwięczna, bezdźwięczna spółgłoska - voiced, voiceless consonant Aspiracja – aspiration
Nosowe, nazalizowane dźwięki – nasals, nasalized sounds Podniebienie miękkie – soft palate, velum