• Nie Znaleziono Wyników

Komputerowy montaż dźwięku

N/A
N/A
Protected

Academic year: 2021

Share "Komputerowy montaż dźwięku"

Copied!
12
0
0

Pełen tekst

(1)

KATEDRA SYSTEMÓW

MULTIMEDIALNYCH

LABORATORIUM

TECHNIKI REJESTRACJI SYGNAŁÓW

Tytuł:

Komputerowy montaż dźwięku

opracował: dr inż. Piotr Suchomski

1. CEL ĆWICZENIA

Celem ćwiczenia jest zapoznanie z podstawowymi technikami obróbki i montażu nagrań dźwiękowych. Ćwiczenie to jest uzupełnieniem ćwiczenia nr 1, w trakcie którego studenci mieli okazję zapoznać się ze sprzętem i techniką rejestracji dźwięku. W wyniku tego ćwiczenia każda grupa zarejestrowała krótkie nagranie dźwiękowe, które w ramach niniejszego ćwiczenia zostanie przetworzone i zmiksowane. Wynikiem tego ćwiczenia powinno być przetworzone i zmiksowane z podkładem muzycznym nagranie.

Do dyspozycji każdej grupy projektowej jest komputer klasy PC z zainstalowanym oprogramowaniem Adobe Audition 3.0 (dawny Cool Edit) oraz Audacity.

2. REPREZENTACJA CYFROWA DŹWIĘKU

We współczesnych studiach nagraniowych dźwięk cyfrowy rejestrowany jest na ogół w technice PCM. Technika przetwarzania jednobitowego, mimo wielu zalet, stosowana jest właściwie głównie w produkcjach związanych z formatem płyty Super Audio CD (SACD). Podstawowe parametry zapisu dźwięku w technice PCM to przede wszystkim rozdzielczość bitowa próbek dźwiękowych i częstotliwość próbkowania.

Typowe, stosowane rozdzielczości bitowe w technice dźwiękowej to: 8, 16, 20 i 24 bity. Im wyższa rozdzielczość bitowa tym większa dynamika zapisu. Najbardziej typowa rozdzielczość to 16 bitów, która gwarantuje dynamikę zapisu rzędu 90 dB i jest ona stosowana np. w przypadku zapisu dźwięku na płycie CD. Rozdzielczość 8 bitowa stosowana jest głównie tam gdzie ważniejsza jest mała przepływność bitowa niż jakość dźwięku. Zapis 8 bitowy wymaga wielu zabiegów ograniczających dokuczliwy szum kwantyzacji.

(2)

profesjonalnym. Wymienione rozdzielczości związane są z rzeczywistą rozdzielczością bitową dostępnych przetworników analogowych-cyfrowych i cyfrowo-analogowych. Natomiast w programach montażowych można często wybrać 32 bitową rozdzielczość bitową. Stosowanie tak długiego słowa do zapisu wartości próbek dźwiękowych pozwala na wykonywanie wszelkich obliczeń (przetwarzania) ze znaczną precyzją, co ma duży wpływ na jakość tego przetwarzania, chociaż w czasie odtwarzania dźwięku jego rozdzielczość konwertowana jest do długości słowa akceptowanego przez przetworniki karty dźwiękowej.

Drugim ważnym parametrem dźwięku cyfrowego jest jego częstotliwość próbkowania. Wartość częstotliwości próbkowania dobierana jest zgodnie z fundamentalnym twierdzeniem o częstotliwości próbkowania Shannona i Nyquista, które mówi o tym, że aby poprawnie odwzorować sygnał w technice cyfrowej częstotliwość próbkowania powinna być przynajmniej dwa razy większa niż największa częstotliwość w próbkowanym sygnale. Zbyt mała częstotliwość próbkowania prowadzi do tzw. aliasingu.

W technice studyjnej dźwięk zapisywany jest najczęściej z częstotliwością próbkowania 44,1 kHz lub 48 kHz. W przypadku dźwięku wysokiej jakości jak np. DVD Audio spotykane są standardy 96 kHz czy 192 kHz. Generalnie proces przetwarzania powinien odbywać się w częstotliwości próbkowania wyższej bądź równej docelowej częstotliwości próbkowania. W programie Adobe Audition można precyzyjnie określić format dźwięku, a także dokonać jego konwersji (rys. 1)

Rys. 1. Konwersja parametrów dźwięku cyfrowego w programie Adobe Audition

Ponadto dźwięki mogą być zapisywane monofonicznie lub stereofonicznie. W programie Adobe Audition można przetwarzać zarówno próbki monofoniczne jak i stereofoniczne. Program umożliwia przetwarzanie pojedynczych dźwięków jak montaż wielu dźwięków. Do montażu wielu dźwięków służy tryb wielościeżkowy (multitrack)(rys. 2).

(3)

Rys. 2. Wielościeżkowy montaż dźwięku w programie Adobe Audition

3. USUWANIE SZUMU

Rejestracja dźwięku, zwłaszcza w warunkach „niestudyjnych”, często wiąże się z problemem zakłócania dźwięku przez szum np. odgłosy ulicy, dźwięk urządzeń, maszyn itp. Do rozwiązywania tego problemu w programach montażowych dźwięku możemy skorzystać z dwóch, niewykluczających się sposobów eliminowania szumu z nagrania.

Pierwszy, najprostszy sposób, to tzw. bramkowanie szumu. Idea tego zabiegu jest prosta, w nagraniu „blokowane” są wszystkie dźwięki, których poziom jest poniżej zadanego progu. Aby wykorzystać tą metodę trzeba sprawdzić, jaki poziom mają dźwięki zakłócające. W tym celu należy zaznaczyć fragment nagrania, gdzie niepożądane dźwięki występują oraz wybrać opcję z menu Window/Amplitude statistic (rys. 3) i odczytać wartość poziomu Average

Power RMS. Następnie z menu Effects/Amplitude and Compression należy wybrać opcję

(4)

Rys. 3. Analiza poziomu dźwięku

Rys. 4. Przykładowa charakterystyka bramki szumów

„Bramkowanie” szumu ma sens wtedy gdy jego poziom jest znacznie niższy niż poziom dźwięku. Często bramka szumu jest używana jako proces czyszczący nagranie z

(5)

niepotrzebnych dźwięków, powstałych w wyniku innych algorytmów przetwarzania. Należy też pamiętać, że bramka szumu działa dynamicznie. Można w niej ustawiać czas zadziałania i czas zwolnienia. Na ogół czas ataku jest krótszy w stosunku do czasu zwolnienia. Przykładowo dla mowy te czasy mogą wynosić odpowiednio 30 ms i 100 ms.

Druga technika usuwania szumu wykorzystuje metodę odejmowania widmowego. W dużym uproszczeniu metoda ta polega na odejmowaniu widma szumu od widma zaszumionego dźwięku. Metoda ta jest skuteczna przede wszystkim w przypadku gdy szum ma charakter stacjonarny. Przed przystąpieniem do usuwania szumu należy wskazać próbkę tego szumu, aby algorytm redukcji szumu mógł oszacować widmo szumu. Metoda ta odejmuje szum od całego nagrania. Niestety zbyt „głębokie” odjęcie szumu od nagrania dźwiękowego bardzo często powoduje powstawanie nieprzyjemnych artefaktów (w nagraniu usuwany jest szum, ale dźwięk staje się metaliczny, bardzo nienaturalny). Redukcja szumu metodą odejmowania widmowego wymaga podejmowania kompromisu między ilością pozostawionego szumu w nagraniu a zachowaniem jego naturalnego brzmienia.

W programie Adobe Audition redukcja szumu dostępna jest w menu Effects/Restoration. W pierwszym kroku należy zaznaczyć obszar w nagraniu gdzie występuje tylko szum (bez pożądanego dźwięku) i wybrać opcję Capture Noise Reduction Profile. Następnie można przystąpić do właściwej redukcji szumu po przez wybór opcji Noise Reduction (rys. 5).

(6)

Najistotniejszym parametrem usuwania szumu w programie Audition jest Noise Reduction Level. Ponadto można różnicować „głębokość” odejmowania szumu w zależności od pozycji w nagraniu po przez ukształtowanie specjalnej krzywej. Drugim istotnym parametrem jest długość okna FFT. Algorytm FFT jest podstawą wyznaczania widma szumu i dźwięku. Pozostałe parametry precyzują dokładność redukcji szumu, a ich dokładne znaczenie opisane jest w systemie pomocy programu Audition.

4. KOREKCJA DYNAMIKI DŹWIĘKU

W inżynierii dźwięku często istnieje problem korekcji dynamiki dźwięku. Często w czasie realizacji nagrania istnieją takie problemy jak: problem utrzymania właściwej proporcji między dźwiękami cichymi i głośnymi (np. nagrania muzyki symfonicznej), problem zachowania stałej dynamiki głosu lektora lub wokalisty, problem zbyt dużej amplitudy (problem przesterowania), czy problem głosek wybuchowych i syczących (sybilanty). Wszystkie ww. problemy można rozwiązać za pomocą szeroko rozumianego procesora dynamiki dźwięku.

W procesie przetwarzania dynamiki sygnału dźwiękowego można wyróżnić trzy zasadnicze metody przetwarzania dynamiki:

• kompresja; • ekspansja; • bramkowanie;

Kompresor dynamiki dźwięku dokonuje zmniejszania wartości amplitudy według ustalonego współczynnika (ang. compression ratio) powyżej zadanego progu (ang. compression threshold), reprezentującego wartość amplitudy wyrażonej w dB. Współczynnik ten określa, w jakim stopniu przyrost natężenia sygnału wyjściowego zmienia się w stosunku do przyrostu natężenia sygnału wejściowego. Rysunek 6 przedstawia przykładową charakterystykę kompresji.

(7)

Wynikiem działania kompresora dynamiki jest tzw. efekt wyrównywania dynamiki sygnału dźwiękowego. Oznacza to, że różnica między cichymi i głośnymi częściami przetwarzanego sygnału dźwiękowego zmniejsza się. Różnica ta zależy od współczynnika kompresji i progu zadziałania. Proces kompresji dynamiki stosuje się zwykle, gdy chodzi o dopasowanie dynamiki sygnału do możliwości dynamicznych danego kanału transmisji lub w celach estetycznych (np. poprawa zrozumiałości sygnału mowy, poprawa wyrazistości brzmienia instrumentu muzycznego itp.).

Szczególnym przypadkiem kompresora jest ogranicznik (ang. limiter) . Ogranicznik charakteryzuje się stopniem kompresji większym niż 10:1. Ogranicznik stosowany jest przede wszystkim jako element zabezpieczającym sygnał dźwiękowy przed przesterowaniem.

Odwrotnym procesem do procesu kompresji dynamiki jest proces ekspansji dynamiki. Czyli ekspander dynamiki dźwięku powoduje zwiększenie przyrostu natężenia sygnału wyjściowego w stosunku do przyrostu sygnału wejściowego. Stosunek tego przyrostu określa współczynnik ekspansji natomiast proces ekspansji na ogół odbywa się poniżej zadanego progu. Rysunek 7 przedstawia przykładową charakterystykę ekspandera dynamiki.

Ekspansje dynamiki stosuje się przede wszystkim w celach estetycznych np. w sygnale muzycznym w celu wyeksponowania brzmienia cichych instrumentów. Ekspander często działa w parze komplementarnej z kompresorem tworząc tzw. kompander. Kompander może być bardzo użyteczny w sytuacji, gdy zachodzi potrzeba przesłania sygnału dźwiękowego o

20 40 60 80 100 120 SPL dB we 20 40 60 80 100 120 0 SPL dB wy próg stopień SPL dB Rys. 6 Przykłado wa charaktery styka statyczna kompresor a

(8)

się kompresor, natomiast po stronie odbiornika stosowany jest ekspander o charakterystyce odwrotnej do charakterystyki kompresora.

Rys. 7 Przykładowa charakterystyka statyczna ekspandera

Procesor dynamiki można wykorzystać również jako tzw. bramkę szumów (ang. noise gate). W wyniku przetwarzania sygnału za pomocą bramki szumów niezmienione pozostają te części sygnału, których poziom przewyższa zadany próg. Część sygnału, którego poziom jest poniżej zadanego progu zostaje wyciszona. Bramka szumowa jest jednym z najprostszych systemów redukcji szumów.

Procesor dynamiki opisuje nie tylko jego charakterystyka przenoszenia (rys. 6, rys. 7) zwana też w literaturze charakterystyką statyczną. Właściwości dynamiczne procesora dynamiki opisują dwa parametry: czas ataku (ang. attack time) i czas zwolnienia (ang. release time). Czas ataku określany jest jako interwał czasowy pomiędzy pojawieniem się pierwszej próbki przekraczającej zadany próg do momentu gdy poziom wyjściowy osiągnie wartość o 2 dB wyższą od ustabilizowanej odpowiedzi wyjściowej. Natomiast czas zwolnienia określa interwał czasowy pomiędzy gwałtownym spadkiem wartości próbki poniżej zadanego progu do momentu, aż poziom wyjściowy osiągnie wartość o 2 dB niższą niż ustabilizowana odpowiedź wyjściowa. Parametry te określają szybkość działania danego procesora dynamiki. Czas ataku zwykle określany jest w zakresie od 1 do 50 ms zaś czas zwolnienia w zakresie od 0,1 do 0,5 s. Sposób doboru parametrów dynamicznych zależy od rodzaju sygnału i

20 40 60 80 100 120 SPL dB we 20 40 60 80 100 120 0 SPL dB Rys. 6 Przykłado wa charaktery styka statyczna kompresor a wy

(9)

oczekiwanego efektu. Parametry te mogą być stałe w podczas procesu przetwarzania lub mogą być na bieżąco modyfikowane.

Zwykle w zastosowaniach studyjnych stosuje się procesory dynamiki o charakterystyce statycznej jednoprogowej (rys. 6, rys. 7). Jednak zdarza się, że istnieje potrzeba zastosowania charakterystyki wieloprogowej. Taka sytuacja ma miejsce m.in. w przypadku dopasowywania protez słuchu. Zwykle w wyniku badania dynamiki słuchu otrzymuje się charakterystykę wieloprogową, a na jej podstawie można wyznaczyć poszukiwaną charakterystykę wieloprogową protezy słuchu.

Zdarza się, że istnieje potrzeba korekcji dynamiki w określonym paśmie częstotliwości. W tym celu stosuje się tzw. pasmowe procesory dynamiki dźwięku. Tego typu procesor dokonuje najpierw filtracji do określonych pasm częstotliwości, a następnie dokonuje modyfikacji dynamiki, odpowiedniej dla każdego pasma. Przykładowo chcąc zlikwidować nieprzyjemny efekt syczący głosek (sibilanty) w nagraniu lektora można dokonać kompresji sygnału w paśmie wysokich częstotliwości (de-esser). Podobnie redukując dynamikę w zakresie niskich częstotliwości można usunąć problem głosek wybuchowych.

W programie Adobe Audition przetwarzanie dynamiki sygnału dostępne jest w menu Effects/Amplitude and Compression opcja Dynamics Processing (rys. 8). Charaketrystykę dynamiki oraz parametry czasu ataku i zwolnienia dostępne są na zakładkach. Charakterystyka dynamiki może być rysowana za pomocą myszki.

(10)

5. KOREKCJA BARWY DŹWIĘKU

Często zdarza się, że w czasie rejestracji dźwięku nie ma możliwości zapewnienia idealnej, pożądanej charakterystyki częstotliwościowej dźwięku. Ponadto znaczne korygowanie częstotliwości dźwięku w czasie rejestracji raczej nie jest wskazane, bo popełnione wtedy błędy trudno później naprawić. Dlatego korekcję częstotliwości najlepiej wykonać na etapie postprodukcji.

Przed przystąpieniem do korekcji barwy dźwięku najpierw należy nagranie kilka razy odsłuchać. Warto również dokonać analizy widma dźwięku za pomocą analizy FFT. W programie Adobe Audition analizator widma jest dostępny w menu Window, opcja Frequency Analysis. Obie ww. czynności mają na celu określenie jakie pasmo częstotliwości chcemy wzmocnić bądź stłumić.

Korekcję częstotliwości w programie Adobe Audition można zrobić na wiele sposobów. Wszystkie potrzebne opcje znajdują się w menu Effects/Filter and EQ. Najprostszym i najbardziej intuicyjnym sposobem korekcji częstotliwości jest korektor graficzny (rys. 9). Każde pasmo częstotliwości posiada swój suwak reprezentujący wartość wzmocnienia w danym paśmie. Ujemna wartość wzmocnienia oznacza tłumienie danego pasma. W korektorze można określić ilość analizowanych pasm oraz dokładność analizy.

Rys. 9. Korektor graficzny (Graphic Equalizer) w programie Adobe Audition

Dla bardziej ambitnych potrzeb korekcji częstotliwości w programie Adobe Audition zaimplementowano wiele zaawansowanych metod korekcji widma dźwięku takich jak FFT filter czy Scientific Filters.

(11)

6. KREOWANIE PRZESTRZENNOŚCI DŹWIĘKU

Często zarejestrowany dźwięk, zwłaszcza w warunkach studyjnych, nie oddaje przestrzeni, którą chcielibyśmy osiągnąć za pomocą danego nagrania. Przestrzenność dźwięku możemy uzyskać przez odpowiednie rozmieszczenie w panoramie stereofonicznej, przez oddanie właściwości pogłosowych pomieszczenia, przez dodanie takich efektów jak echo, chorus czy flanger.

Jednym z najtrudniejszych etapów nadania przestrzenności dźwięku jest odzwierciedlenie właściwości pogłosowych pomieszczenia. Generalnie programy do montażu dźwięku najczęściej mają wbudowane dwa typy funkcji, które mogą dodać pogłos do nagrania. Pierwsza funkcja wykorzystuje różne algorytmy symulacji pogłosu. W programie Adobe Audition funkcje do kształtowania pogłosu dostępne są z menu Effects/Reverb. Drugi sposób polega na splocie tzw. odpowiedzi impulsowej danego pomieszczenia z nagraniem. Druga metoda daje bardziej wiarygodny efekt pogłosu, ale wymaga posiadania próbki odpowiedzi impulsowej danego pomieszczenia. W programie Adobe Audition funkcję tą realizuje opcja Convolution Reverb.

7. MIKSOWANIE DŹWIĘKU

Gdy zarejestrowane nagrania są już wstępnie przetworzone i każde z osobna brzmi zgodnie z oczekiwaniami twórcy można przystąpić do miksowania dźwięków w jedno nagranie. W programie Adobe Audition do tego celu służy tryb Multitrack (rys. 2). Dźwięki, które mają być ze sobą miksowane należy umieszczać na osobnych ścieżkach. Dla każdej ścieżki można kształtować dowolnie poziom głośności, panoramę, a także, gdy pozwala na to sprzęt, każdej ścieżce można przypisać inne wyjście karty dźwiękowej. Dodatkowo na każdą ścieżkę można zakładać inne efekty dźwiękowe.

W ramach niniejszego ćwiczenia należy zmiksować nagranie głosu z fragmentem muzyki. W tym przypadku należy pamiętać, aby w czasie odtwarzania głosu muzyka była na takim poziomie głośności, aby nie zakłócała percepcji nagranego głosu. Przed pojawieniem się w nagraniu głosu muzyka może grać głośno, a na 1-2 sekundę przed pojawieniem się głosu należy muzykę ściszyć do odpowiedniego poziomu. Proces ściszania powinien przebiegać łagodnie (fade), natomiast gdy głos w nagraniu się skończy poziom głośności muzyki powinien również łagodnie wrócić do pierwotnego poziomu. Innym przydatnym efektem miksowania dźwięków jest tzw. crossfade. Technika ta polega na tym, że jeden dźwięk powoli się ścisza (fade out) gdy w tym samym czasie drugi dźwięk staje się głośniejszy (fade

(12)

gdy dźwięki są na różnych ścieżkach. Przy czym przemiksowywanie na różnych ścieżkach daje więcej możliwości i jest bardziej elastyczne. Warto tylko zadbać o to aby w czasie kształtowania tego efektu obie ścieżki były widoczne, najlepiej blisko siebie.

8. ZADANIA

Zadania do zrealizowania:

 wczytać do programu Adobe Audition zarejestrowane w czasie ćwiczenia nr 1 nagrania,

 dokonać obróbki nagrania (należy zapisać uzyskany efekt każdego kroku przetwarzania),

 zmiksować nagranie z fragmentem muzyki,

 zapisać wynik pracy w postaci pliku WAVE (bez kompresji).

9. OPRACOWANIE

Przygotować sprawozdanie, w którym powinny znaleźć się następujące informacje:

 krótki opis warunków nagrania oraz treść nagrania,

 relacja krok po kroku z procesu przetwarzania nagrania: o uzasadnienia wyboru kolejnych kroków przetwarzania, o parametry przetwarzania,

 technika zmiksowania nagrania,

 wnioski.

Do wydrukowane sprawozdania należy dołączyć płytę CD zawierającą efekty kolejnych kroków przetwarzania włącznie z efektem końcowym.

Cytaty

Powiązane dokumenty

Deze carbiden zullen vooral worden gevormd binnen in de korrels zelf en (vanwege een koolstofarme zone langs de korrelgrenzen) in mindere mate in de buurt

Podstawą teoretyczną omawianej publikacji jest przekonanie wywodzące się z nurtu „psycholo­ gii rozwojowej w ciągu życia”, w świetle którego rozwój człowieka nie

M iało to ważne znaczenie wobec nadszarpnięcia powagi hetm anów w wyniku zdrady, jakiej się dopuścił Lubom irski w m arcu 1704 r., a także podejrzeń, jakie mogli

W późniejszych redakcjach sprecyzowano, że szpital ma się znajdować w Birżach, a dochód na jego utrzym anie ma być z Dubinek — dlatego starostą dubiskim

Ograniczając się do wybranych przykładów epiki dworskiej, jako tego gatunku literackiego, który był szczególnie bliski szerszym kręgom św iec­ kiej części

Profesor Stefan Kieniewicz był redaktorem naczelnym „Przeglądu Historycznego” przez lat czterdzieści.. Prawie połowa więc wszystkich roczników tego czasopisma

istn ieli

z wysp osadzonych w podkowie stawisk, stawiszcz i drzew, został hałas aglomeratów co spływa do wykopu taśmą lat, by drżeć w oczekiwaniu