KOMPRESJA AUDIO - VIDEO

(1)

KOMPRESJA AUDIO - VIDEO

Rozwój technologii wymógł konieczność opracowania sposobu kompresji danych. Obraz składa się średnio z 25 klatek na sekundę. Każda klatka dobrej jakości to około 1 milion pikseli. Kolor każdego z tych punktów opisany jest 24 bitami. Oznacza to, że 90 minutowy film nieskompresowanego obrazu może zająć ponad 1 TB (terabajt)

Większość formatów audio video korzysta z kompresji w celu zmniejszenia rozmiaru pliku poprzez zmniejszenie jakości. Kompresja ma zasadnicze znacznie przy zmniejszaniu rozmiarów filmów, tak aby można je było w wydajny sposób zapisywać, przesyłać i odtwarzać.

Kompresja stratna — metoda zmniejszania liczby danych. Obraz lub dźwięk poddany kompresji stratnej będzie zawsze gorszej jakości niż oryginał.

Kompresja stratna jest możliwa ze względu na sposób działania ludzkich zmysłów. Algorytmy kompresji stratnej zazwyczaj posługują się modelami psychoakustycznymi, psychowizualnymi.

Standard MP3 wykorzystuje model psychoakustyczny w celu osiągnięcia

pożądanego stopnia kompresji stratnej. Polega to na tym, że zostają usunięte te informacje o dźwięku, które są niezauważalne lub mało istotne dla człowieka, w sensie odbioru słuchowego. Z modelu psychoakustycznego wynika, że człowiek najlepiej słyszy dźwięki w okolicach 2-4 kHz. Im częstotliwość dźwięku bardziej odbiega od tego pasma, tym słyszalność jest coraz gorsza. Zatem, jeżeli dźwięk będzie cichszy od dolnej granicy słyszalności, to nie będzie on słyszalny. Z tego wynika, że skrajne częstotliwości mogą zostać zapisane z mniejszą dokładnością lub odrzucone. Dodatkowo głośny dźwięk potrafi zagłuszyć cichsze dźwięki następujące zaraz po nim a cichy dźwięk poprzedzający w krótkim czasie dźwięk głośny nie jest słyszalny.

Model psychowizualny – kompresja video

Często w filmach występują momenty, w których na ekranie ruszają się tylko postacie, a tło pozostaje niezmienione (np. sceny rozmowy). Zamiast podawania w każdej klatce informacji o każdym pikselu, podaje się dane o pikselach, które zmieniły swoje cechy. Kompresja czasowa identyfikuje różnice pomiędzy

klatkami i zapisuje tylko te różnice. Dana klatka opisana jest więc w oparciu o to, czym różni się od klatki ją poprzedzającej. Obszary niezmienione w stosunku do poprzedniej klatki są powtarzane.

(2)

Klatki kluczowe to kompletne klatki (lub obrazy) wideo, które osadzane są w klipie wideo w stałych odstępach czasu. Klatki znajdujące się pomiędzy klatkami kluczowymi zawierają informacje o zmianach, które mają miejsce pomiędzy klatkami kluczowymi.

Dodatkowo kompresja klatek to podzielenie każdego kanału obrazka na większe bloki . Zamiast wartości pikseli mamy teraz średnią wartość wewnątrz bloku oraz częstotliwości zmian wewnątrz bloku. Stosuje się bloki o wymiarach 8x8 pikseli, ale także 16x16 i większe, zależnie od stopnia kompresji. Ta operacja pozwala na ogromną redukcję przesyłanych danych

Kodek –odpowiedzialny za kodowanie i dekodowanie strumienia danych (audio lub wideo). System może odtworzyć tylko takie strumienie, dla których posiada odpowiednie kodeki. Np. bezpłatny i dostępny w sieci pakiet K-Lite Codec Pack to zbiór kodeków, filtrów i narzędzi umożliwiających odtwarzanie większości formatów plików audio i wideo.

RMVB – kontener multimedialny - dzięki zmiennej przepływności można uzyskać lepszą skuteczność kompresji, w porównaniu z popularnym AVI. Film zajmuje około 350 MB ale oprócz komputera większość standardowych sprzętów RTV nie będzie w stanie go odczytać.