Wykład 8: Kwantyzacja i kompresja PCM, ADPCM, filtry adaptacyjne, kodowanie
sygnałów mowy
PG – Katedra Systemów Mikroelektronicznych
ZASTOSOWANIE PROCESORÓW SYGNAŁOWYCH
Marek Wroński
Błędy kwantyzacji w przetwornikach A/D
(są też mid-rised)
e(n)=x(n)-x
Q(n)
Sym:
k=-
-koraz
k=-
-kDla kwabtyzatora liniowego |e|</2 (2M+1) poziomów gdzie M=2
(B-1)-1
Punkt krytyczny:
M+1=V oraz =V/ 2
(B-1)Dla liniowej gęstości prawdopodobieństwa p
e(e)=1/ dla |e|</2
Dla +3dBm0 (max mocy) więc dla X<3:
SNR rozkładu Gausowskiego
Maska dla szumowego sygnału testowego
(dla sin maska –45dB-0
max 33dB)
Kwantyzacja z minimalnymi zniekształceniami Szum kwantyzacji:
Wartości optymalne:
Nierównomierny rozkład gęstości
prawdopodobieństwa, np. eksponencjalny Dla nierównomiernego rozkładu gęstości
prawdop:(ucho czulsze na szum
kwantyzacji, gdy szum dużyw stosunku do
sygnału) transformacja g(x)
Kodeki (koder+dekoder) z kompresją sygnałów wg.zasady i A
Maksymalizacja nie SNR lecz zakresu mocy sygnału w którym SNR jest większe od zadanego
Companding=compression+expanding
Law (amerykański PCM):
A-Law (europejski PCM):
Koder typu -Law PCM)
Kompresuje 13-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej
Algorytm -Law PCM Wartości końca przedziałów {x
i}:
Na koniec inwersja bitów
Koder typu A-Law PCM)
Kompresuje 14-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej
Algorytm A-Law PCM Wartości końca przedziałów
{x
i}:
Na koniec inwersja bitów
Sprawność koderów PCM (-i A-typu)
SNR rozkładu Gausowskiego:
Gdy oczekiwana max moc wtedy nasycenie ch-ki kwantyzacji dla K1 (zwykle K1=4) K1 jest mierzone jako stosunek: pik-pik do rms.
Estymacja szumu kwantyzacji (dla N bitów):
gdzie K2 zależy od kształtu gęstości prawdop.
Dlatego wystarczy N-1 bitów dla takiej samej
mocy szumu kwantyz. gdy moc sygn.zredukować 1/4.Niech {Rxx(k)} autokorelacja {x(n)}
Min wariancji dla a=r
xx(1)
Wtedy
N
1bits
Kodowanie predykcyjne 1-rzędu (do przodu)
Kodowanie różnicowe DPCM (Differential Pulse code Modulation)
Kodowanie adaptacyjne
Ponieważ mowa jest krótkoterminowo (100ms) prawie stacjonarna rxx(1) jest dobrze Zdefiniowany dlatego współczynnik a dobrze śledzi za zmianami statystyki sygnału i może być okeślony z min. błędu {e(n)}co daje dla kodera z otwartą pętlą:
dla kodera z zamkniętą pętlą:
Dla stabilności i uproszczenia algorytmu ADPCM:
Ponieważ {e(n)} nie jest z natury stacjonarne dlatego kwantyzator Q powinien być
adaptacyjny. Posiada on kilka poziomów i gdy sygnał konsekwentnie (kilka razy)
jest zbyt mały jest traktowany jako mały i inaczej skalowany. To samo dotyczy
Powtarzających się „dużych” sygnałów (następuje zmiana kroków wg. optymalnej
decyzji)
Adaptive Differential Pulse Code Modulation (ADPCM) - Encoder
Wykorzystuje on adaptacyjny predyktor dla redukcji liczby bitów z 8- (PCM) do 4.
Filtr rekonstrukcyjny jest typu IIR z 2 biegunami i 6 zerami.
ADPCM
nie używa do transmisji próbek sygnału a różnicę z wartością przewidy- waną. Sam kwantyzator rozdzielono na 2 sekcje: adaptacyjne bitowe kodowanie i adaptacyjne bitowe dekodowanie (w dekoderze tylko jedna sekcja)
{s
1(n)} sygn. liniowy
Adaptacyjny kwantyzator i predyktor
7-,15-,lub 31-poz. nieliniowy (log
2(d(n)) kwantyzator dla sygn. różnicowego {d(n)}, co odpowiada 3,4lub 5 bitom na próbkę. Adaptacje poprzez skalowanie log
2(d(n)) przez mnożnik y(n) przeliczany z każdą próbką. Predyktor estymuje sygnał jako:
Syg.rekonstrukcyjny:
wsp. met. gradientów:
Dla stabilności IIR:
Opis Kodeka ADPCM (ITU-T G.726)
ADPCM - Decoder
Szumy kwantyzacji ADPCM
2-pasmowa (Sub-Band) ADPCM
Używane dla szerokiego pasma np. dla wideokonferncji(50-7000Hz) dzielonego
na 2 podpasma (0-4000 i 4000-8000Hz) do których stosowana jest oddzielnie ADPCM FIR 24-parametrowy z
odpow.impuls.=fun.opóżnienia
Higher and Lower Sub-Band Encoder
Higher and Lower Sub-Band Decoder
Metody kompresji stratnej sygnałów mowy
Kodowanie predykcyjne – wokoder LPC-10 1. Częstotliwość próbkowania fs = 8 kHz
2. Podział na bloki 30 ms, w których zakłada się quasi- stacjonarność
3. Okno o długości 240 próbki przesuwane co 180 próbek
4. Estymacja i przesyłanie współczynników modelu generacyjnego
sygnału mowy Model generacji sygnału
mowy
Filtry adaptacyjne
-Wygładzanienie (smoothing) wg. danych zebranych także po chwili t (dokładniejsze) -Predykcja tj. określenie informacji o procesie, który będzie miał miejsce w przyszłości -filtracja, która oznacza estymację informacji w chwili t na podstawie zebranych danych