KOMPRESJA AUDIO - VIDEO
Ogromne ilości materiałów audio - video są systematycznie przesyłane lub przechowywane w sieci. Nie było by to możliwe bez stosowania kompresji.
Kompresja stratna — jest możliwa ze względu na sposób działania ludzkich zmysłów.
Algorytmy kompresji stratnej zazwyczaj posługują się modelami psychoakustycznymi, psychowizualnymi.
Standard MP3 wykorzystuje model psychoakustyczny. Polega to na tym, że zostają usunięte te informacje o dźwięku, które są mało istotne dla człowieka. Z modelu psychoakustycznego wynika, że człowiek najlepiej słyszy dźwięki w okolicach 2-4 kHz. Im częstotliwość dźwięku bardziej odbiega od tego pasma, tym słyszalność jest coraz gorsza.
Z utworu usuwa się bardzo wysokie i bardzo niskie częstotliwości niesłyszalne lub słabo słyszalne dla człowieka, będące na granicy słyszalności (wysokie ultradźwięki i niskie infradźwięki).
Następnie analizuje się poziom głośności. Usuwa się z danego fragmentu ciche dźwięki, które ze względu na występowanie po głośniejszych dźwiękach i tak pozostają praktycznie
niesłyszalne.
Model psychowizualny – kompresja video
1 sekunda filmu to średnio 25 klatek na sekundę a każda klatka to osobne zdjęcie.
Przeciętnej jakości film bez kompresji mógłby zająć nawet 500 GB.
Często w filmach występują momenty, w których na ekranie ruszają się tylko postacie, a tło pozostaje niezmienione (np. sceny rozmowy). Zamiast podawania w każdej klatce informacji o każdym pikselu, podaje się dane o pikselach, które zmieniły swoje położenie względem poprzedniej. Dzięki temu wyświetla się na kolejnych klatkach tylko różnice (fragmenty
obrazu) pomiędzy tymi klatkami. Dana klatka opisana jest więc w oparciu o to, czym różni się od klatki ją poprzedzającej. Obszary niezmienione w stosunku do poprzedniej klatki są powtarzane.
Klatki kluczowe to kompletne klatki, które osadzane są w klipie wideo w stałych odstępach czasu np. co 1 sekundę.
Kolejny element oszczędności danych to kompresja klatek. Polega na dzieleniu każdego obrazu na małe bloki. Stosuje się bloki o wymiarach 8x8 pikseli, ale także 4x4 i 16x16. Zamiast informacji o pojedynczych pikselach komputer wyświetla uśrednioną wartość kolorów
wewnątrz tego bloku. Ta operacja pozwala na ogromną redukcję przesyłanych danych Kodek –odpowiedzialny za kodowanie i dekodowanie strumienia danych (audio lub wideo).
System może odtworzyć tylko takie strumienie, dla których posiada odpowiednie kodeki.
Np. bezpłatny i dostępny w sieci pakiet K-Lite Codec Pack to zbiór kodeków, filtrów i narzędzi umożliwiających odtwarzanie większości formatów plików audio i wideo.