• Nie Znaleziono Wyników

Index of /rozprawy2/10009

N/A
N/A
Protected

Academic year: 2021

Share "Index of /rozprawy2/10009"

Copied!
2
0
0

Pełen tekst

(1)

Rozprawa przedstawia zastosowanie dyskretnej transformacji falkowej do nierównomiernej segmentacji oraz parametryzacji sygnału mowy polskiej dla celów jej automatycznego rozpoznawania.

Segmentacja nierównomierna jest coraz częściej stosowanym sposobem porcjowania sygnału mowy zgodnie z jego strukturą akustyczną. W dwóch zaproponowanych algorytmach sygnał poddawany jest analizie widmowej za pomocą dyskretnej dekompozycji falkowej. W pierwszym z proponowanych algorytmów ekstrahowany jest wskaźnik zmienności widma, który służy do wyznaczenia brzegów między atomami akustycznymi sygnału. Drugi algorytm polega na wygenerowaniu dyskretnej funkcji zdarzeń widmowych, które wskazują na brzegi segmentów.

Parametryzacja sygnału realizowana jest za pomocą dyskretnej dekompozycji falkowej. Najlepsza baza (drzewo) dekompozycji wyznaczana jest za pomocą nowego algorytmu Mean Best Basis oraz nowego wskaźnika koncentracji widma w dziedzinie transformacji falkowo-kosinusowej.

Jakość zaproponowanych rozwiązań zmierzona została za pomocą systemu rozpoznawania fonemów na zbiorze mowy polskiej Corpora'97. Jako kryteria jakości posłużyły m. in. wskaźnik nad- i podsegmentacji, liczba rozpoznanych fonemów (PRR, ang. Phone Recognition Rate, PRA, ang. Phone Accuracy Rate) otrzymane za pomocą klasyfikatora k-NN oraz modelowania HMM.

(2)

"Optimization of signal parameterization for Polish speech recognition"

This thesis presents the use of discrete wavelet transform to non-uniform segmentation and parameterization of Polish speech signal, for recognition systems. Non-uniform segmentation is used for extraction of acoustically uniform sub-word units from speech. Both proposed segmentation methods base on discrete wavelet spectral analysis. First one is used for extraction of spectral rate-of-change function which is then used for segment borders' detection. The second of the algorithms is based on extraction of the event-detection function from the discrete wavelet spectrum of the speech signal. Those events indicate segment borders. Signal parameterization is performed with the use of discrete wavelet decomposition. Best decomposition base (tree) is selected with a new Mean Best Basis algorithm and a new-designed cost function, applied for measuring the concentration of the wavelet-cosine spectrum. Efficacy of proposed methods was evaluated with the use of phone-recognition system and Polish speech corpus -Corpora'97. Segment insertion and deletion rates, and phone recognition rate (PRR) were used as the most important efficacy indicators. Results were obtained with k-NN and HMM classifiers.

Cytaty

Powiązane dokumenty

A model relation for predicting the stability of bed particles that includes turbulence is argued and validated by using experimental data from Aguirre Pe (2006), Maynord (1988)

W ciągu niespełna 17 lat swego wpływu na rządy w Polsce przede wszystkim zaj- mował się Wojskiem jako siłą obronną oraz polityką zagraniczną, do której przywią- zywał

These facts, together with the knowledge that lifting line procedures are extremely versatile, particularly in conjunction with the desire to incorporate viscous effects and the

W okresie poprzedzającym powołanie zespołów organizacja pracy adwo­ katów niczym się nie różniła od wykonywania zawodu w ustroju kapita­ listycznym. Indywidualna

Te cechy wskazują na to, że mamy tu do czynienia ze stosunkiem krzyżowa­ nia, który może stanowić podstawę za­ równo dla niewłaściwego (pomijalnego) zbiegu

Although diffusiv{ties in the non - unifo rm region tended towa r ds uniformity with downst rea m distance the vertical diffusive transport rate was relate d to

Sampling the signal at the variable rate involves two independent processes controlled by the adapted importance function: adjustment of the anti-alias filter's cut-off frequency

to „zanieczyszczenie” spo- wodowane jest dostosowaniem się przedstawicieli mass mediów do nowej rzeczywis- tości społeczeństwa sieciowego.. Aby utrzymać swoją pozycję na