• Nie Znaleziono Wyników

Dwięk w multimediach

N/A
N/A
Protected

Academic year: 2021

Share "Dwięk w multimediach"

Copied!
75
0
0

Pełen tekst

(1)

1

Dwięk w

multimediach

Ryszard Gubrynowicz

Ryszard.Gubrynowicz@pjwstk.edu.pl

Wykład 4

(2)

2

Formant „śpiewaczy”

a – średnie widmo mowy

b – średnie widmo akompaniamentu orkiestry c – dobry śpiewak z orkiestrą

Johan Sundberg: The Acoustics of the Singing Voice; Sci. Amer., March 1977

(3)

Gdzie jest tworzony rezonans śpiewaczy ?

3

(4)

Artykulacja i własności akustyczne spółgłosek

4

(5)

5

Artykulacja spółgłoski /s/

(6)

6

Model przejścia z artykulacji

samogłoskowej do spółgłoskowej

(7)

Dynamika ruchów

artykulacyjnych spółgłoskowych

7

(8)

Miejsce artykulacji spółgłosek

http://www.chass.utoronto.ca/~danhall/phonetics/sammy.html

wargowe

zębowe dziąsłowe Podniebienne/palatalne velarne

języczkowe gardłowe

krtaniowe/głośniowe

(9)

9

Miejsce artykulacji spółgłosek

Zwężenie toru głosowego przy artykulacji spółgłoskowej jest znacznie większe (może prowadzić nawet do chwilowego zamknięcia toru), niż w przypadku artykulacji

samogłoskowej.

Tak więc w przypadku spółgłosek można mówić o miejscu artykulacji określającego np. położenia środka zwężenia lub miejsca chwilowego

zamknięcia toru głosowego. Miejsce artykulacji ma wyraźny wpływ na strukturę akustyczną

dźwięku mowy.

(10)

10

Źródło - filtr: spółgłoski trące

Widmo źródła szumowego jest formowane przez charakterystykę rezonansową

przedniej komory znajdującą się między ustami i szczeliną. Na ogół wpływ tylnej komory jest pomijalnie mały, im mniejsza jest powierzchnia przekroju szczeliny, tym mniejszy jest jej wpływ.

(11)

11

Wpływ źródła na kształt spektrogramu

(12)

12

Obwiednia widma spółgłosek trących

 Elementem formującym kształt widma

spółgłosek trących jest komora utworzona z przodu szczeliny.

 Długość tej komory wyznacza najniższą jej częstotliwość rezonansową. Im jest dłuższa, tym ta częstotliwość jest mniejsza.

(13)

13

Klasyfikacja spółgłosek trących wg umiejscowienia zwężenia i/lub

przeszkody w torze głosowym

Trące /x/ /S/ /s’/ /s/ /f/

szczelina głośnia Palatalno-

dziąsłowa palatalna dziąsłowa Wargowo-zębowa

przeszkoda dolne

zęby górne

zęby górne

zęby górne zęby Przednia

komora Charakterystyka

samogłoskowa 2-6 kHz 2-6 kHz >4 kHz b. mały wpływ

Źródło szumu dla głosek /S,s’,s/ powstaje przede wszystkim na przeszkodzie i przy zachowaniu tej samej prędkości

przepływu strugi powietrza ma największą energię w porównaniu z pozostałymi spółgłoskami trącymi (/x,f/).

(14)

14

Spółgłoska /S/

(15)

15

Rezonanse /s - S/

/ s - S/ ( Stevens,

Acoustic Phonetics, 1998)

l = 4

cm 2500 Hz

l= 2.6

cm

3500 Hz C=340 m/s, l – długość komory l fr c

4

Częstotliwość rezonansowa

/s/

/S/

(16)

16

Widma /s – S/

/s/

/S/

Wyliczone z modelu

(17)

17

Długość szczeliny

Szczelina przy artykulacji /s,s’/ jest stosunkowo krótka, dla /S/ - jest dłuższa.

Jeżeli długość przedniej komory jest bardzo mała, to jej najniższa częstotliwość rezonansowa jest tak wysoka, że jej udział w kształtowaniu widma

dźwięku jest pomijalnie mały. Wówczas obwiednia widma promieniowanego dźwięku jest płaska. Tak jest np. w przypadku spółgłoski /f/.

(18)

Widmo głosek trących

(19)

19

Spektrogramy „s” i „sz”

“s” ”sz”

(20)

20 5

10 15 20 25 30 35

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Widma głosek szumowych

/S/ /s/

/s’/

/ts’/

Głoski o paśmie szumu różnie Głoski o paśmie szumu różnie położonym w skali częstotliwości położonym w skali częstotliwości

(21)

kliknij 21 5

10 15 20 25

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Widma spółgłosek /x/ i /f/

/x/

/f/

Wpływ miejsca artykulacji na widmo spółgłosek trących /x,f/

(22)

22

Aerodynamika spółgłosek zwartych (wybuchowych)

 Tor głosowy podczas artykulacji tych głosek jest na chwilę zamknięty, a następnie szybko rozwarty.

 W pierwszej fazie następuje szybki wzrost ciśnienia ponadkrtaniowego i zamknięcie przepływu powietrza.

 W drugiej fazie – rozwarcie powoduje powstanie krótkiego impulsu szumowego.

 Źródło pobudzenia, podobnie jak w przypadku trących ma charakter turbulentny, ale czas pobudzenia jest znacznie krótszy (5-10 ms zamiast 100-200 ms).

 Szum jest formowany przez komorę utworzoną w torze głosowym z przodu, przed zwarciem.

(23)

23

Miejsce artykulacji –głosek zwartych

/p/ /t/ /k/

(24)

24

Aspiracja

Niekiedy przy artykulacji spółgłosek zwartych, fałdy głosowe stosunkowo wolno przechodzą do pozycji, w której drgają. Powstaje przejściowa szczelina powodująca pojawienie się turbulencji.

/k/

(25)

25

Percepcja takiej samej struktury akustycznej Percepcja takiej samej struktury akustycznej

CV(CV) w zależności od kontekstu CV(CV) w zależności od kontekstu

Szum+

samogłoska +CV

Kliknij na rysunek

(26)

26

Percepcja takiej samej struktury akustycznej po modyfikacji

Po segmencie szumowym wstawiono krótką pauzę

Kliknij na rysunek

(27)

27

Percepcja sekwencji (C)VCV Percepcja sekwencji (C)VCV

Z przebiegu usunięto początkowy segment szumowy

Kliknij na rysunek

(28)

28

Udźwięcznianie spółgłosek – zwarta dźwięczna

a g a

(29)

29

Udźwięcznianie spółgłosek – zwarta dźwięczna

aba

a b a

(30)

30

Spółgłoski zwarto-trące /ts, tS,ts’/

Już sama transkrypcja fonetyczna sygnalizuje, że artykulacja spółgłoski zwarto-trącej składa się z 2 faz: w pierwszej powstaje segment zwarcia

(całkowite zamknięcie toru głosowego jak w przypadku głosek wybuchowych), w drugiej -

utworzenie szczeliny (brak plozji), w wyniku czego zostaje wygenerowany krótki segment szumowy.

(31)

31

Zwarto-trące w sygnale rzeczywistym

/ts’/

/tS/

(32)

32

Udźwięcznianie spółgłosek

Uformowanie w torze głosowym szczeliny, czy nawet jego chwilowe zamknięcie nie musi

spowodować zaprzestania ruchów fałdów

głosowych. W języku polskim wszystkie spółgłoski bezdźwięczne (z wyjątkiem /x/) mają swoje

dźwięczne odpowiedniki. Przy artykulacji

spółgłosek bezdźwięcznych fałdy głosowe są rozwarte – przy dźwięcznych są do siebie

zbliżone. Wówczas w formowaniu dźwięków mowy uczestniczą jednocześnie dwa źródła pobudzające różne części toru głosowego.

(33)

33

Wpływ rozmiarów zwężenia w torze na pracę źródła krtaniowego

szczelina pełne zwarcie

(34)

34

Widma dźwięcznych głosek trących

oza ava

(35)

35

Artykulacja /r/ -> /ar/

24-26 Przejście z

konfiguracji /a/ do /r/ (27 ms)

Środkowa i tylna część języka utrzymuje konfigurację samogłoski /a/

(36)

36

Artykulacja /r/ -> /are/

26-27 Konfiguracja /r/ (przód) i /a/ (środek i tył) W trakcie opadania koniuszka języka masa

jego przechodzi z konfiguracji /a/ do /e/.

(37)

37

Porównanie ruchów koniuszka języka przy artykulacji /t/-/r/

5-12 : 93 ms 24-26 : 27 ms

(38)

38

Analiza realizacji spółgłoski /r/

Koniuszek języka (apex) raz (najczęściej) lub dwa (niekiedy więcej) przywiera do

wałka dziąsłowego. Zwarcie jest

krótkotrwałe, na ogół niepełne. Realizacja tej spółgłoski silnie zależy od pozycji,

kontekstu, często od nawyków osobniczych.

Przykłady dźwiękowe

(39)

39

Nazalizacja

(40)

40

Modelowanie nazalizacji

(41)

41

Artykulacja nosowa

Artykulacja nosowa powoduje opuszczenie

podniebienia miękkiego i otwarcie wlotu do jamy nosowej. Od strony akustycznej powoduje to

modyfikację charakterystyki przenoszenia toru głosowego. Przy artykulacji samogłosek

nazalizowanych energia akustyczna jest

promieniowana równolegle przez usta i nos. W przypadku samogłosek nosowych – przede

wszystkim przez nos. Jednoczesne pobudzenie do drgań jamy ustnej i nosowej powoduje

pojawienie się w charakterystyce toru tzw.

antyformantów.

(42)

42

Dźwięki nosowe i nazalizowane

Dźwięki tego typu są artykułowane z udziałem jamy nosowej, modyfikującej funkcję rezonansową toru

artykulacyjnego.

(43)

43

Antyformanty

W przeciwieństwie do samogłosek charakterystyka widmowa spółgłosek jest wyznaczona nie tylko

przez formanty, ale również przez antyformanty.

Antyformant – przeciwieństwo formantu,

charakterystyczne minimum w widmie dźwięku, tłumi składowe źródła w określonym zakresie częstotliwości.

(44)

44

Ilustracja modyfikacji widma źródła przez formant i antyformant

(45)

45

Jakie elementy toru mogą powodują pojawianie się antyformantów

Częstotliwości antyformantów są określone przez wymiary tylnej komory i rozmiarów

szczeliny (dla trących), wymiary komory ustnej ustnej (dla spółgłosek nosowych).

(46)

46

Kiedy mogą pojawiać się antyformanty ?

1) Gdy tor głosowy jest rozdzielony na dwie sprzężone ze sobą części np. w przypadku nazalizacji, czy artykulacji spółgłoski nosowej 2) Jama ustna zostaje rozdzielona na dwie

równoległe do siebie części, jak to ma miejsce w przypadku artykulacji spółgłoski /l/

3) Szczelina przy artykulacji spółgłosek trących jest stosunkowo szeroka i występuje

sprzężenie ze sobą tylnej i przedniej komory

(47)

47

Charakterystyka toru gardłowo-ustnego /a/ z włączonym torem nosowym

antyformanty

(48)

48

Wpływ nosowania na charakterystykę samogłoski /i/ 3 różne stopnie

otwarcia wlotu do jamy nosowej

(49)

/m/ 49

Widmo spółgłoski nosowej wymówionej między /a/

(50)

50

Miejsce artykulacji spółgłosek – ruchy formantów

Ruchy formantów wskazują jakiego typu jest zmiana konfiguracji toru głosowego. Każdemu miejscu artykulacji spółgłoski odpowiadają

odpowiednie ruchy formantów na przejściach od/do samogłoski. Największe ruchy

formantów występują w pobliżu spółgłosek zwartych, najmniejsze dla przymkniętych.

(51)

Ruchy formantów odwzorowujace ruchy artykulacyjne języka

51

/ada/

(52)

Dynamika ruchów

artykulacyjnych spółgłoskowych

52

(53)

53

Ruchy artykulacyjne spółgłoski przymkniętej

„aja”

(54)

j l w 54

Formanty F1, F2 i F3 samogłosek polskich i spółgłosek (/j,w/) i bocznej /l/

(55)

55

F2

Ruch formantu F2 przy przejściu do (i od) artykulacji spółgłoski dwuwargowej - /b/

(56)

56

F2

Ruch formantu F2 przy przejściu do (i od) artykulacji spółgłoski dziąsłowej /d/

(57)

57

Ruch formantu F2 przy przejściu do (i od) artykulacji spółgłoski zwarto-

trącej podniebiennej /ts’/

(58)

58

Ruch formantu F2 przy przejściu od artykulacji spółgłoski trącej

podniebiennej /S/

(59)

59

Ruchy formantów F1 i F2 zależnie od miejsca i sposobu artykulacji

(60)

60

Różne tranzjenty – ta sama spółgłoska

di da

1400 Hz <-- tranzjent F2 --->

Liberman et al. (1967) Perception of the speech code.

Psych Rev 74, 431-461

(61)

Tranzjenty formantów spółgłosek wybuchowych dźwięcznych

61

(62)

62

Sposób artykulacji spółgłosek

1. Pobudzenie dźwięczne, bezdźwięczne, lub mieszane

2. Przepływ strugi powietrza zaburzony (szczelina, lub zwarcie lub ich kombinacja) lub nie

3. Konfiguracja toru głosowego stacjonarna lub nie w momencie artykulacji spółgłoski

4. Struktura jedno- lub polisegmentalna 5. Jama nosowa włączona lub nie

(63)

63

Klasyfikacja artykulacyjna spółgłosek

(64)

64

Wybrane cechy dystynktywne

niektórych spółgłosek w płaszczyźnie miejsca artykulacji i typu pobudzenia

Cecha artyk.\głoska b d g p t k s z m n

wargowa + - - + - - - - + -

zębowe - + - - + - + + - +

tylno-językowa - - + - - + - - - - pobudzenie

krtaniowe + + + - - - - + + +

(65)

65

Efekty akustyczne spółgłoskowych ruchów artykulacyjnych

Artykulacji spółgłosek towarzyszą ruchy

formantów spowodowane zmianami konfiguracji toru głosowego.

Gdy powstaje znaczne przewężenie w torze głosowym pojawia się źródło pobudzenia

szumowego.

Chwilowemu zamknięciu toru głosowego

towarzyszy niemal całkowity zanik sygnału (jeżeli wlot do jamy nosowej jest zamknięty), po którym może wystąpić pobudzenie impulsowe (głoski

zwarte), bądź krótki segment pobudzenia szumowego (głoski zwarto-trące).

(66)

66

Cechy akustyczne dźwięków mowy

Akustyczny sygnał mowy niesie informacje umożliwiające rozpoznanie poszczególnych głosek wypowiedzianych w określonej

sekwencji. Te elementy sygnału, które

umożliwiają rozróżnienie lub identyfikację

nazywamy cechami akustycznymi – obejmują one częstotliwości formantów, ich tranzjenty, widma plozji spółgłosek zwartych, widma

szumu spółgłosek trących, obecność zwarcia – b. mała amplituda sygnału itp.

(67)

67

Cechy akustyczne sposobu artykulacji

Periodyczna - aperiodyczna (szum lub impuls)

Poziom formantów wysoki

niski formantówruch nosowe

tranzjentowe

szybki

samogłoski

stosunkowo stałe częstotliwości formantów

składowa nieperiodyczna, stosunkowo duża energia HF

Czas trwania szumu impuls krótki długi

wybuchowe

zwarto- trące

trące

wyraźna składowa periodyczna

(68)

68

Oscylogram wyrazu „szesnaście”

(69)

69

Widmo samogłoski /n/ w sylabie /na/

00

Czas [s]

0.4

0.33 0.34 0.35 0.36 0.37 0.38 0.39 0.4 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

0.33 0.34 0.35 0.36 0.37 0.38 0.39 0.4 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 Czas [s]

50 60 70 80 90 100 110

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Czestotliwosc [Hz]

50 60 70 80 90 100 110

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Czestotliwosc [Hz]

(70)

70

-0.75 -0.5 -0.25 0 0.25 0.5 0.75

0 0.1 0.2 0.3 0.4

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 6000 6500 7000 7500 8000

S tS e p j o n a

Sekwencja /StSepj/

(71)

71

Cechy akustyczne artykulacji

położenie

formantów tranzjent F2 zakres szumu

F2 wysoki - przednia

samogłoski Spółgłoski tranzjentowe

F2 niski - tylna

F1 niski - wysoka F1 wysoki - niska

F2 wysoki - /j/

F2 średni - /l/

F2 niski - /w/

spółgłoski

(boczna)

W przypadku samogłosek mowa jest o ułożeniu masy języka, a nie o miejscu artykulacji !

(72)

72

Cechy akustyczne miejsca artykulacji spółgłosek

tranzjent F2 zakres szumu zwarte i

nosowe zwarto- trące trące

w dół - wargowe

w górę – podniebienne

dziąsłowe (w otoczeniu /a/) w górę – podniebienne

w górę – /S/ trące zwarte i

zwarto- trące

wysoki - /s/

niski - S

szeroki - /f,x/

wysoki - podniebienne niski - wargowe

(73)

Anatomia artykulacji

spółgłoskowej - podsumowanie

73

(74)

74

Zasadnicze tematy

1. Modele źródeł pobudzenia szumowego 2. Charakterystyka spółgłosek trących

3. Charakterystyka spółgłosek zwartych – źródło pobudzenia

4. Charakterystyka spółgłosek zwarto-trących 5. Ruchy artykulacyjne i ruchy formantów

6. Jak pracuje źródło krtaniowe przy pobudzeniu mieszanym

7. Artykulacja dźwięków nosowych i nazalizowanych

8. Antyformanty

(75)

75

Terminy angielskie

Zwężenie, szczelina – constriction Zwarcie – closure

Ciśnienie podgłośniowe – subglottal pressure

Ciśnienie ponadgłośniowe – supraglottal pressure Cechy dystynktywne – distinctive features

Impuls szumowy, plozja – burst

Laminar, turbulent flow, airflow – przepływ (struga) laminarny, turbulentny

Spółgłogłoski trące – fricatives, fricative consonants Spółgłoski zwarte, plozyjne, wybuchowe – stops Spółgłoski zwarto-trące, afrykaty – affricates

dźwięczna, bezdźwięczna spółgłoska - voiced, voiceless consonant Aspiracja – aspiration

Nosowe, nazalizowane dźwięki – nasals, nasalized sounds Podniebienie miękkie – soft palate, velum

Cytaty

Powiązane dokumenty

Funkcjonalny schemat organu mowy Funkcjonalny schemat organu mowy.. Układ oddechowy- płuca Układ oddechowy- płuca.. Cykle oddechowe: proporcje czasowe Cykle oddechowe:

Podczas artykulacji spółgłosek w ponadkrtaniowej części toru głosowego powstaje zwężenie znacznie mniejsze, niż w przypadku

W wyniku nakładania się tych ruchów spółgłoska /b/ w sekwencji /ibi/ jest inna, niż w sekwencji /ibu/.... Sekwencje ruchów artykulacyjnych Sekwencje

melodyczny – gdy akcentowanie sylaby jest realizowane poprzez zmianę wysokości głosu Dla języka polskiego przyjmuje się , że akcent jest zazwyczaj dynamiczny, choć jest

Komórki rzęskowe rozmieszczone wzdłuż błony podstawnej są odpowiednio dostrojone. częstotliwościowo elektrycznie, jak i

Po przekroczeniu pewnej wartości (pasma krytycznego filtru słuchowego) dalszy wzrost szerokości pasma szumu maskującego nie wpływa na wartość progu detekcji tonu (Fletcher,

• głośny dźwięk maskuje inne, które w skali częstotliwości znajdują się w bezpośrednim sąsiedztwie.. • pasmo krytyczne – pasmo wewnątrz którego nie słyszy się tonów

Barwa dźwięku znanych źródeł (częstotliwości tonów wysokich są silniej tłumione w powietrzu, co powoduje zmianę barwy dźwięku przy oddalaniu się od jego