PG – Katedra Systemów Mikroelektronicznych ZASTOSOWANIE PROCESORÓW SYGNAŁOWYCH Marek Wroński

(1)

Wykład 8: Kwantyzacja i kompresja PCM, ADPCM, filtry adaptacyjne, kodowanie

sygnałów mowy

PG – Katedra Systemów Mikroelektronicznych

ZASTOSOWANIE PROCESORÓW SYGNAŁOWYCH

Marek Wroński

(2)

Błędy kwantyzacji w przetwornikach A/D

(są też mid-rised)

e(n)=x(n)-x

_Q

(n)

Sym: 

_k

=- 

_-k

oraz 

_k

=- 

_-k

Dla kwabtyzatora liniowego |e|</2 (2M+1) poziomów gdzie M=2

^(B-1)

-1

Punkt krytyczny: 

_M+1

=V oraz =V/ 2

^(B-1)

Dla liniowej gęstości prawdopodobieństwa p

_e

(e)=1/  dla |e|</2

Dla +3dBm0 (max mocy) więc dla X<3:

(3)

SNR rozkładu Gausowskiego

Maska dla szumowego sygnału testowego

(dla sin maska –45dB-0

max 33dB)

(4)

Kwantyzacja z minimalnymi zniekształceniami Szum kwantyzacji:

Wartości optymalne:

(5)

Nierównomierny rozkład gęstości

prawdopodobieństwa, np. eksponencjalny Dla nierównomiernego rozkładu gęstości

prawdop:(ucho czulsze na szum

kwantyzacji, gdy szum dużyw stosunku do

sygnału) transformacja g(x)

(6)

Kodeki (koder+dekoder) z kompresją sygnałów wg.zasady  i A

Maksymalizacja nie SNR lecz zakresu mocy sygnału w którym SNR jest większe od zadanego

Companding=compression+expanding

Law (amerykański PCM):

A-Law (europejski PCM):

(7)

Koder typu -Law PCM)

Kompresuje 13-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej

(8)

Algorytm -Law PCM Wartości końca przedziałów {x

_i

}:

Na koniec inwersja bitów

(9)

Koder typu A-Law PCM)

Kompresuje 14-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej

(10)

Algorytm A-Law PCM Wartości końca przedziałów

{x

_i

}:

Na koniec inwersja bitów

(11)

Sprawność koderów PCM (-i A-typu)

SNR rozkładu Gausowskiego:

(12)

Gdy oczekiwana max moc ^ wtedy nasycenie ch-ki kwantyzacji dla K₁ (zwykle K₁=4) K₁ jest mierzone jako stosunek: pik-pik do rms.

Estymacja szumu kwantyzacji (dla N bitów):

gdzie K₂ zależy od kształtu gęstości prawdop.

Dlatego wystarczy N-1 bitów dla takiej samej

mocy szumu kwantyz. gdy moc sygn.zredukować 1/4.Niech {R_xx(k)} autokorelacja {x(n)}

Min wariancji dla a=r

_xx

(1)

Wtedy

N

₁

bits

Kodowanie predykcyjne 1-rzędu (do przodu)

(13)

Kodowanie różnicowe DPCM (Differential Pulse code Modulation)

(14)

Kodowanie adaptacyjne

Ponieważ mowa jest krótkoterminowo (100ms) prawie stacjonarna r_xx(1) jest dobrze Zdefiniowany dlatego współczynnik a dobrze śledzi za zmianami statystyki sygnału i może być okeślony z min. błędu {e(n)}co daje dla kodera z otwartą pętlą:

dla kodera z zamkniętą pętlą:

Dla stabilności i uproszczenia algorytmu ADPCM:

Ponieważ {e(n)} nie jest z natury stacjonarne dlatego kwantyzator Q powinien być

adaptacyjny. Posiada on kilka poziomów i gdy sygnał konsekwentnie (kilka razy)

jest zbyt mały jest traktowany jako mały i inaczej skalowany. To samo dotyczy

Powtarzających się „dużych” sygnałów (następuje zmiana kroków wg. optymalnej

decyzji)

(15)

Adaptive Differential Pulse Code Modulation (ADPCM) - Encoder



Wykorzystuje on adaptacyjny predyktor dla redukcji liczby bitów z 8- (PCM) do 4.

Filtr rekonstrukcyjny jest typu IIR z 2 biegunami i 6 zerami.

ADPCM

nie używa do transmisji próbek sygnału a różnicę z wartością przewidy- waną. Sam kwantyzator rozdzielono na 2 sekcje: adaptacyjne bitowe kodowanie i adaptacyjne bitowe dekodowanie (w dekoderze tylko jedna sekcja)

{s

₁

(n)} sygn. liniowy

(16)

Adaptacyjny kwantyzator i predyktor

7-,15-,lub 31-poz. nieliniowy (log

₂

(d(n)) kwantyzator dla sygn. różnicowego {d(n)}, co odpowiada 3,4lub 5 bitom na próbkę. Adaptacje poprzez skalowanie log

₂

(d(n)) przez mnożnik y(n) przeliczany z każdą próbką. Predyktor estymuje sygnał jako:

Syg.rekonstrukcyjny:

wsp. met. gradientów:

Dla stabilności IIR:

(17)

Opis Kodeka ADPCM (ITU-T G.726)

(18)

ADPCM - Decoder

(19)

Szumy kwantyzacji ADPCM

(20)

2-pasmowa (Sub-Band) ADPCM

Używane dla szerokiego pasma np. dla wideokonferncji(50-7000Hz) dzielonego

na 2 podpasma (0-4000 i 4000-8000Hz) do których stosowana jest oddzielnie ADPCM FIR 24-parametrowy z

odpow.impuls.=fun.opóżnienia

(21)

Higher and Lower Sub-Band Encoder

(22)

Higher and Lower Sub-Band Decoder

(23)

Metody kompresji stratnej sygnałów mowy

(24)

Kodowanie predykcyjne – wokoder LPC-10 1. Częstotliwość próbkowania fs = 8 kHz

2. Podział na bloki 30 ms, w których zakłada się quasi- stacjonarność

3. Okno o długości 240 próbki przesuwane co 180 próbek

4. Estymacja i przesyłanie współczynników modelu generacyjnego

sygnału mowy Model generacji sygnału

mowy

(25)

Filtry adaptacyjne

-Wygładzanienie (smoothing) wg. danych zebranych także po chwili t (dokładniejsze) -Predykcja tj. określenie informacji o procesie, który będzie miał miejsce w przyszłości -filtracja, która oznacza estymację informacji w chwili t na podstawie zebranych danych

(26)