Kontakt
Katedra Systemów Multimedialnych Wydział ETI
dr hab. inż. Józef Kotus, pok. EA 729 e-mail: joseph@sound.eti.pg.gda.pl
jozkotus@pg.edu.pl
tel. 58 347 29 72
http://www.sound.eti.pg.gda.pl
Wprowadzenie
Wykład obejmuje prezentację szeregu
podstawowych pojęć z zakresu szeroko rozumianej akustyki mowy.
Akustyka mowy obejmuje takie zagadnienia jak badanie sposobu wytwarzania dźwięków mowy, sposoby rozumienia mowy, metody analizy
i przetwarzania sygnałów mowy oraz metody
Cel przedmiotu
Celem przedmiotu jest zapoznanie studentów
z podstawowymi zagadnieniami z zakresu
wytwarzania, analizy i parametryzacji sygnału mowy.
W ramach przedmiotu prezentowane są również
zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy.
Efekty kształcenia
Student zna cechy, metody analizy, syntezy, przetwarzania i kompresji sygnału mowy,
mechanizmy wytwarzania dźwięków mowy, metody parametryzacji, resyntezy i rozpoznawania mowy
Student zapoznaje się z cechami sygnału mowy
i modelowaniem mechanizmów wytwarzania
dźwięków mowy. Ponadto poznaje metody analizy, syntezy i przetwarzania sygnału mowy. Opanowuje metody parametryzacji i resyntezy, a także metody kompresji sygnału mowy. Poznaje także
Zaliczenie
Wynik kolokwium (na koniec semestru) + ocena z laboratorium (60%W + 40%L)
Dodatkowe punkty za obecność na wykładach:
na wszystkich wykładach + 3 pkt.
nieobecność tylko na 1 wykładzie + 2 pkt. nieobecność tylko na 2 wykładach + 1 pkt
Plan wykładu
Nr wykładu termin prowadzący Temat
1 25.02.2021 dr hab. inż. J.Kotus
Teoria wytwarzania dźwięków mowy, podstawowe wiadomości na temat sygnału
mowy i traktu głosowego
2 04.03.2021 dr hab. inż. J.Kotus Modelowanie mechanizmów wytwarzania dźwięków mowy
3 11.03.2021 dr hab. inż. J.Kotus Analiza widmowa – cz. 1
4 18.03.2021 dr hab. inż. J.Kotus Analiza widmowa – cz. 2
5 25.03.2021 dr hab. inż. J.Kotus Parametryzacja sygnału mowy, perceptualne skale częstotliwości – cz. 1
6 01.04.2021 dr hab. inż. J.Kotus Parametryzacja sygnału mowy, perceptualne skale częstotliwości – cz. 2
7 08.04.2021 dr hab. inż. J.Kotus Podstawy syntezy mowy – cz. 1
Plan wykładu
Nr wykładu termin prowadzący Temat
9 22.04.2021 dr hab. inż. G.Szwoch
Kodowanie i kompresja sygnału mowy, cz. 1
10 29.04.2021 dr hab. inż. G.Szwoch
Kodowanie i kompresja sygnału mowy, cz. 2
11 06.05.2021 dr hab. inż. J.Kotus Zrozumiałość mowy w warunkach zakłóceń
12 13.05.2021 dr hab. inż. J.Kotus Podstawy automatycznego rozpoznawania mowy
13 20.05.2021 dr hab. inż. J.Kotus Audiowizualne rozpoznawanie mowy
14 27.05.2021 dr hab. inż. J.Kotus Przetwarzanie sygnału mowy w czasie rzeczywistym
Laboratorium
Nr ćwiczenia Temat
1 Metody detekcji aktywności głosowej w sygnale akustycznym
2 Badanie formantowości sygnału mowy 3 Synteza mowy
4 Badanie algorytmów spowalniania mowy 5 Rozpoznawanie mowy
Laboratorium
Czwartek, 14.15-16.00, enauczanie
Nr ćwiczenia Termin 1 Termin 2 1 04.03.2021 11.03.2021 2 18.03.2021 25.03.2021 3 01.04.2021 08.04.2021 4 15.04.2021 22.04.2021 5 29.04.2021 06.05.2021 6 13.05.2021 20.05.2021 rezerwa 27.05.2021 10.06.2021