• Nie Znaleziono Wyników

Badania korpusowe

W dokumencie Audiodeskrypcja (Stron 86-90)

Kierunki badawcze

2.5. Badania korpusowe

Korpus to poka ny i ustrukturyzowany zbiór tekstów, odpowiednio zindeksowanych w celu analizy użytego w nich języka (np. pod względem częstości użycia słów, kolokacji z danym słowem). Ze względu na duży rozmiar korpusów (liczony w tysi cach lub milionach słów), dane statystyczne obliczone na ich podstawie pozwalaj na określenie realnych cech języka używanego w danych kontekstach (typach tekstu, odmianie mówionej lub pisanej). Metoda korpusowa została również wykorzystana w badaniu języka audiodeskrypcji, które pokazało wyra nie, jak specyficzn odmian języka jest AD ze względu na swoj funkcję komunikatywn .

Piety (2004) przeprowadził analizę języka i stylu audiodeskrypcji na podstawie małego korpusu czterech filmów historycznych (23 tys. słów).

Korpus dotycz cy jednego gatunku filmowego może ułatwi głębsz analizę języka danego gatunku. Badanie to było ciekawe, ponieważ stworzyło narzędzia analityczne. Piety (2004: 457) zaproponował typologię strukturalnych i funkcjonalnych elementów AD zawieraj c : wtr cenia (definiowane strukturalnie jako ci gły opis nieprzerywany dialogiem lub innymi efektami d więkowymi), wypowiedzi (jednostki języka mówionego, fragmenty języka opisuj ce konkretne cechy wizualne), reprezentacje (definiowane jako jednostki semantyczne) oraz słowa.

Reprezentacje można dalej podzieli według typu informacji na: wygl d, czynnoś , pozycję, tekst czytany, indeks (identyfikacja mówi cej postaci), punkt widzenia, stan (Piety 2004: 459). Analiza ilościowa na podstawie wybranego korpusu była bardzo ograniczona. W większości przypadków wypowiedzi były liczniejsze niż wtr cenia, nie było natomiast danych o odsetku różnych typów reprezentacji w analizowanych opisach. Niemniej zaproponowana typologia może posłuży jako ciekawe narzędzie analizy treści AD w odniesieniu do danego gatunku filmowego. Czy filmy akcji zawieraj więcej reprezentacji czynności niż komedie romantyczne? Czy dramaty psychologiczne (jako bogatsze w warstwie słownej)

charaktery-zuj się liczniejszymi wypowiedziami w stosunku do wtr ceń niż filmy przygodowe? Analiza korpusowa z wykorzystaniem powyższych narzędzi z pewności mogłaby odpowiedzie na te pytania. Ponadto, jak podkreślił Piety (2004: 467), taka typologia może by też przydatna w badaniach obci żenia kognitywnego w przetwarzaniu informacji podczas ogl dania filmów z AD. Można by sprawdzi , czy skrypt, w którym zastosowano różne typy reprezentacji, jest bardziej wymagaj cy wobec osoby niewidomej niż skrypt z opisami zbudowanymi w raczej jednolity sposób.

Takie wyniki badań można by bezpośrednio zastosowa do tworzenia optymalnego kształtu audiodeskrypcji.

Pierwszy poka ny korpus audiodeskrypcji został stworzony w ramach projektu badawczego TIWO (Salway 2007). Zawiera anglojęzyczne skrypty dziewię dziesięciu jeden filmów reprezentuj cych różne gatunki (między innymi filmy akcji, filmy dla dzieci, komedie, komedie romantyczne) (Salway 2007: 155). Salway zidentyfikował najczęściej pojawiaj ce się słowa w korpusie, które bezpośrednio odzwierciedlaj specyficzny język audiodeskrypcji. Często pojawiaj ce się słowa to określenia postaci i części ciała, czynności, przedmiotów i miejsc. Salway przeprowadził ciekaw analizę porównuj c wykorzystanie danych słów w korpusie specjalnym (czyli języka AD) i korpusie ogólnym (reprezentatywnym dla użycia języka w różnych kontekstach). Okazało się, że czasowniki określaj ce ruch ludzkiego ciała i spojrzenia pojawiaj się w AD znacznie częściej, niż w języku ogólnym, tym samym potwierdzenie znajduje hipoteza Salwaya o specyficznym użyciu języka w audio-deskrypcji (2007: 154). Czasowniki te to zazwyczaj troponimy pod-stawowych czasowników określaj cych ruch, czyli takie wyrazy, które zawieraj w treści sposób wykonania danej czynności (np. czasownik

„przechadza się” określa powolny sposób chodzenia, a „zerka ” – bardzo krótkie spojrzenie). Częste użycie takich czasowników wynika z potrzeby zwięzłego opisywania obrazu w języku audiodeskrypcji.

Salway (2007: 162) zbadał też najczęściej pojawiaj ce się typy kolokacji w korpusie AD. Ponieważ audiodeskrypcja zawiera wiele opisów wygl du postaci, często pojawiaj ce się kolokacje to „kobieta w”

lub „mężczyzna w”, po czym następuje opis ubioru. Czasowniki często modyfikowane s przez przysłówki (okoliczniki sposobu), np. „uśmiecha się uprzejmie” lub „patrzy nerwowo”. Określenia czasu występuj w audiodeskrypcji doś rzadko, ponieważ opis zazwyczaj tworzony jest w czasie tera niejszym, a informacja o porze dnia lub roku wynika

najczęściej kontekstowo z innych elementów audiodeskrypcji (ubiorów, światła, rekwizytów) (Salway 2007: 166). Co ciekawe, informacje dotycz ce czasu podawane s często poprzez czasowniki określaj ce pocz tek lub koniec czynności (np. „zaczyna ” lub „kończy ”).

Ponieważ AD zawiera jako tekst mniej więcej te same informacje, co scenariusz (który oczywiście zawiera również dialogi i średnio trzy razy więcej tekstu niż AD [Salway 2007: 167]), Salway uznał, że scenariusze mog by podstaw do automatycznego generowania pierwszych wersji skryptów AD. Taka automatyzacja mogłaby przyspieszy tworzenie audiodeskrypcji i ułatwi pracę audiodeskryptorom. Lakritz i Salway (2002) przetestowali działanie systemu do półautomatycznego tworzenia AD. System najpierw wybierał z tekstu scenariusza zdania z najważniej-sz treści (na podstawie list słów najczęściej występuj cych w AD określonych dzięki pracom korpusowym), a następnie dostosowywał język scenariusza (bardziej narracyjny) do języka audiodeskrypcji (bardziej opisowego). Największe różnice wykazane na podstawie porównania korpusu scenariuszy z korpusem AD dotyczyły punktu widzenia (w scenariuszach często padaj określenia „widzimy”,

„słyszymy”, których w AD należy się wystrzega ), ruchu kamery (s to informacje kluczowe w scenariuszu, natomiast w AD język filmu oddaje się raczej bez użycia specjalistycznego słownictwa filmowego) i odniesień do efektów d więkowych (licznych w scenariuszu, natomiast raczej nieobecnych w AD, ponieważ ścieżka d więkowa dociera do osób niewidomych bez problemów) (Lakritz i Salway 2002: 7). Aby przetestowa skutecznoś systemu, profesjonalni audiodeskryptorzy tworzyli AD do jednego fragmentu filmu na podstawie wygenerowanego tekstu i do drugiego fragmentu tradycyjn metod . Stworzenie AD na podstawie automatycznie stworzonego tekstu trwało dłużej, system ma zatem jeszcze wiele wad. Jest jednak przyczynkiem do dalszych prac ułatwiaj cych pracę audiodeskryptorów i wykorzystuj cych nowoczesne technologie w dziedzinie AD.

Projekt TRACCE to kolejny sposób wykorzystania metody korpusowej w badaniach nad audiodeskrypcj . Celem projektu realizowanego na Uniwersytecie w Granadzie (Hiszpania) było stworzenie multimodalnego korpusu audiodeskrypcji (Jiménez i Seibel 2012). Korpus multimedialny to

„zbiór materiału dotycz cego języka i komunikacji wykorzystuj cego więcej niż jedn modalnoś zmysłow ” (Allwood 2008: 208 za Jiménez i Seibel 2012: 411). Korpus TRACCE zawiera ponad trzysta filmów

hiszpańsko-języcznych, audiodeskrypcje do nich oraz dodatkowo pię dziesi t filmów anglo-, francusko- i niemieckojęzycznych oraz ich audiodeskrypcje. Filmy zostały podzielone na jednostki znaczeniowe (o maksymalnej długości jednej minuty) z przyporz dkowanymi do nich fragmentami AD. Zakończono proces tagowania (znakowania jednostek odpowiednimi indeksami) na trzech poziomach: narracji filmowej (np. określonego wydarzenia ograni-czonego przestrzennie i czasowo), języka kamery (np. ujęcia, kadru, ostrości) i struktury gramatycznej (Jiménez i Seibel 2012: 413). Oznacza to, że każd jednostkę (fragment filmu z AD) przyporz dkowano do odpowiedniej kategorii oznaczaj cej treś , formę filmow i formę językow . W ten sposób można analizowa korpus na różne sposoby, na przykład wyszuka określony ruch kamery lub dane wydarzenie i sprawdzi , w jaki sposób audiodeskryptorzy odzwierciedlili je w AD. Lub odwrotnie – można wyszuka określon strukturę gramatyczn i zobaczy , do opisu jakich treści i jakiego tworzywa filmowego została ona użyta. To wszystko można analizowa też z podziałem na gatunki filmowe.

Jimenez Hurtado i Soler Gallego (2013) przeanalizowały podkorpus czternastu filmów reprezentuj cych różne gatunki filmowe. Dane korpusowe pokazały, że najczęściej pojawiaj ce się elementy narracyjne to czynnoś odzwierciedlona na płaszczy nie językowej poprzez czasowniki, następnie czas i miejsce akcji, rekwizyty i ich lokalizacja. Kolejne najczęstsze elementy narracyjne to przedstawienie i opis postaci, opis mimiki i języka ciała. Najczęściej odzwierciedlane w AD elementy tworzywa filmowego to plan średni, plan szeroki i zbliżenie (Jimenez Hurtado i Soler Gallego 2013:

585). Autorki doszły do wniosku, że składnia użyta do przełożenia wizualnej narracji filmowej na potrzeby osób z dysfunkcj wzroku jest prosta, ponieważ celem opisu jest przekazanie w krótkim czasie łatwego do zrozumienia i nieskomplikowanego przekazu odzwierciedlaj cego istotne elementy narracyjne (2013: 586).

Jimenez Hurtado i Soler Gallego (2013: 588) wybrały też trzy elementy narracyjne (wygl d, stan emocjonalny i mimikę) i przeanalizowały ich realizację na poziomie tworzywa filmowego i języka audiodeskrypcji.

Zgodnie z przewidywaniami opis wygl du postaci następuje zazwyczaj przy zbliżeniach i planie średnim, a użyte środki językowe to często przydawki. Stan emocjonalny i mimika pokazywane s w filmach zazwyczaj poprzez zbliżenie lub plan-kontrplan (to drugie ujęcie pokazuje posta mówi c , ale kamera ustawiona jest za plecami słuchaj cego, więc w kadrze jest też widoczna głowa i ramię postaci słuchaj cej).

Powyższe przykłady pokazuj , że projekt TRACCE jest bardzo obiecuj cy i tworzy nowe możliwości analizy audiodeskrypcji jako

„nowatorskiego typu tekstu” (Jiménez i Seibel 2012: 424), który współistnieje z tekstem audiowizualnym, czyli filmem. Jak pisz autorki, korpus (wraz z jego narzędziami – interfejsem sieciowym i aplikacjami do analizy danych) może by też przydatny w audiodeskrypcji wspomaganej komputerowo (do sprawdzenia, w jaki sposób opisywane s zazwyczaj dane sekwencje filmowe) i w szkoleniu audiodeskryptorów w formie e-learningu.

W dokumencie Audiodeskrypcja (Stron 86-90)