Metodologiczne podstawy opisu - Index of /rozprawy2/10860

1. WSTĘP

1.5. Metodologiczne podstawy opisu

Praca niniejsza nosi charakter interdyscyplinarny. Korzystając z nowoczesnych narzędzi analizy informatycznej tekstu, jednocześnie obficie czerpie z inspiracji lingwistyki językoznawstwa strukturalnego i formalnego opisu zdania.

W zakresie informatycznym, dla celów budowy systemu tłumaczącego, sięgnięto po następujące narzędzia: główną bazę danych przechowującą słownik gestów języka migowego27, wykonano w systemie bazodanowym SQLite. Użycie technologii SQLite uwalnia użytkownika od konieczności instalowania serwera bazodanowego, baza bowiem dołączona jest do utworzonego oprogramowania jako zwykły plik binarny. Dostęp do rekordów z danymi odbywa się poprzez użycie standardowych zapytań języka SQL, za pośrednictwem funkcji bibliotek łączonych dynamicznie – DLL28. Do przechowywania danych językowych, tj. cech morfologicznych, składniowych i semantycznych wyrazów, użyto serwera danych PostgreSQL. Wybór tego systemu bazodanowego podyktowany był jego szerokimi możliwościami29 oraz faktem, że jest on otwarty i zupełnie darmowy. Dla desktopowej wersji aplikacji, w celu uniknięcia konieczności instalowania serwera baz danych istnieje możliwość serializacji gotowej bazy danych do plików binarnych. Wymaga to drobnej korekty kodu. Jednak czas dostępu do danych zserializowanych jest o wiele dłuższy w porównaniu z czasem dostępu do danych wyciąganych zapytaniami z relacyjnej bazy danych. Przynosi to więc nieuchronne opóźnienie w dostępie do danych językowych.

Algorytmy analizy głębokiej i syntezy tekstu języka polskiego oraz translacji do języka migowego zaimplementowano w języku Prolog. Uznano, że język ten, reprezentujący paradygmat programowania w logice, w którym stosowane jest

27 Na słownik gestów języka migowego składają się gesty w formie animacji 3D, układy dłoni i mimika twarzy awatara oraz opis tekstowy gestów.

28 ang. Dynamic-Link Library.

29 W projekcie wykorzystano między innymi typy tablicowe, które można definiować w systemie bazodanowym PostgreSQL.

przetwarzanie symboliczne, najlepiej nadaje się do kodowania algorytmów cechujących się bardzo dużą złożonością. Zapis symboliczny, odznaczający się zwięzłością kodu oraz dużą elastycznością, jest szczególnie użyteczny do reprezentacji niesymetrycznej struktury danych, którą odznacza się język naturalny, oraz do kodowania reguł obsługujących wyjątki, często pojawiające się w językach naturalnych. Aplikację główną zaimplementowano przy użyciu platformy .NET (framework 3.5) w technologii WPF30. Do wykonania oprogramowania użyto języka C#. Jest on obecnie jednym z najpopularniejszych zorientowanych obiektowo języków programowania. Cechuje go nowoczesność, dynamiczny rozwój, bogactwo bibliotek nadających mu dużą funkcjonalność, a przede wszystkim prostota i przejrzystość składni, która w projektach cechujących się dużą złożonością odgrywa szczególną rolę. W języku C# zaprogramowano również większość aplikacji narzędziowych, wykonanych na potrzeby gromadzenia i obróbki danych dla systemu tłumaczącego. W procesie modelowania awatara pokazującego gesty języka migowego wykorzystano narzędzia do projektowania grafiki i animacji 3D, tj. MilkShape3D i Blender. Przy użyciu aplikacji blender wykonano również kilka skryptów w języku Python, służących do obróbki danych składających się na animację modelu oraz ich importu i eksportu do głównej bazy danych. Do rejestracji gestów języka migowego w przestrzeni wykorzystano system wizyjny SMART-E Motion

Capture System oraz dołączone do niego oprogramowanie.

Jeśli idzie o językoznawcze podstawy opisu, uznano przydatność cieszących się autorytetem opracowań naukowych i akademickich, idzie tu szczególnie o Słownik

syntaktyczno-generatywny czasowników polskich umożliwiający dotarcie do mechanizmów

składni semantycznej i formalnej w budowie polskiego zdania. W szerokim zakresie wykorzystano również opisy syntaktycznego modelu języka i formalnych podstaw budowy zdania autorstwa Renaty Grzegorczykowej (2002). Posłużyło to między innymi ustaleniu repertuaru schematów składniowych, własności konotacyjnych czasownika, walencji, akomodacji i in. W kwestiach szczegółowych skorzystano z doświadczeń autorów akademickich opracowań poświęconych morfologii i składni współczesnej polszczyzny, sięgając do uznanych książek Gramatyka Polska Janusza Strutyńskiego oraz Gramatyki

Współczesnego Języka Polskiego PAN (morfologia i składnia). Oprócz zasobów wiedzy

teoretycznej i wzorców analitycznych w zamierzeniu autora służyć to winno także uprzystępnieniu opisu mechanizmów translacji i ekwiwalencji w zakresie procedur przekładu z języka fonicznego na język migowy i na odwrót. Należy też podkreślić, że było to działanie konieczne, wymuszone niedostatkiem opracowań gramatyki i semantyki Polskiego Języka Migowego. Jedyny obecnie opis autorstwa Bogdana Szczepankowskiego takie wymagania spełnia jedynie częściowo. Dość stwierdzić, że tak podstawowe kwestie jak budowa zdania pojedynczego w języku migowym, szyk elementów, rozczłonkowanie komunikacyjne wypowiedzi – struktura tematyczno-rematyczna, zasady włączania czyli zanurzania struktur upodrzędnionych, składnia grup nominalnych, adjektywnych i adrewerbalnych – nie doczekały się żadnego naukowego komentarza. Informacje na ten temat mają częstokroć charakter przypadkowy i wynikają z uwag native speakerów języka migowego. Jednak jak pokazuje praktyka i doświadczenie badawcze nawet takim informacjom nie można ufać bez zastrzeżeń – niekiedy pozostają ze sobą w sprzeczności, por. np. wskazówki w materiałach ćwiczeń dotyczące szyku

elementów w zdaniu i tworzenia szeregów składników. Sięgając zatem po różnorodne inspiracje starano się w ten sposób skompensować ten niedostatek.

W trakcie przygotowań do pisania pracy przeprowadzono gruntowną ekscerpcję wszelkich dostępnych źródeł leksykograficznych i materiałów dydaktycznych języka migowego por. prace31. Poszukując płaszczyzny ekwiwalencji na poziomie leksykalnym uznano, że ze strony języka fonicznego będzie to zasób słownictwa podstawowego, w znacznej mierze odpowiadający obiegowemu rejestrowi leksyki dominującej w języku osób niesłyszących, na który składa się ok. 5000 jednostek pokrywających podstawowe pola semantyczne związane z codzienną egzystencją człowieka. W tej mierze praca korzysta z Ilustrowanego słownika podstawowego języka polskiego wraz z indeksem

pojęciowym wyrazów i ich znaczeń redakcji Zofii Kurcowej; w pewnym zakresie potrzeby

ustalenia polisemii sięga także do Współczesnego słownika języka polskiego pod redakcją Bogusława Dunaja (Dunaj 2007).

Należy w tym miejscu podkreślić, że lata ostatnie przynoszą liczne świadectwa zbliżania się opisów i kompetencji Polskiego Języka Migowego i Systemu Językowo Migowego32 dawniej dość skrupulatnie rozdzielanych. Idzie tu zwłaszcza o praktykę codziennej komunikacji i kompetencję językową użytkowników najczęściej korzystających z hybrydy obu kodów33. Dodać można, że w toku badań własnych autor niniejszej pracy zbliżył się do sformułowanego niezależnie przez M. Huenerfautha (2004, 2006) poglądu, że w istocie rzeczy komunikacja migowa nawet w odległych kulturowo systemach (np. ASL i PJM) wykazuje znaczne podobieństwo na poziomie formy języka i zasad strukturyzacji komunikatu w podlegającej sygnifikacji przestrzeni sceny i ścieżki implikowania predykatów jądrowych – klasyfikujących. Z wiedzy autora wynika, że głębokie analogie dotyczą np. sposobów wyrażania mowy zależnej – scena z „lalkami” albo opisu artefaktów – scena modelująca przestrzeń użytkowanego pomieszczenia lub mebla. Jest to pouczające i inspirujące doświadczenie naukowe, otwierające perspektywy integrującego opisu.

Ze względu na dostępność narzędzi analizy spełnienie dla tłumaczenia warunku międzyjęzykowej reprezentacji w rozumieniu Huenerfautha34, pozostaje postulatem, który tymczasowo mógł być spełniony na poziomie ekwiwalentnych struktur składniowych – transferu składniowego. Warto jednak nadmienić, że nawet w krajach, gdzie badania kodu komunikacji migowej są rozwijane z udziałem najnowocześniejszych technologii (np. wojskowej w USA) nie przyniosły one jednoznacznie pozytywnych wyników, gdy idzie o szeroki – otwarty repertuar wypowiedzi i tekstów żywego języka fonicznego, nie

31 Na zbiór około 25 wykorzystanych publikacji, złożyły się m.in. wszystkie słowniki i słowniczki leksykograficzne; wykorzystano także dostępne komentarze do rozmaitych materiałów dydaktycznych. W ostatnim czasie ukazało się również nowe cenne źródło – publikacja elektroniczna dostępna pod adresem: http://www.spreadthesign.com/pl/. Ze względu na to, że pojawiła się ona niedawno, tylko w niewielkim stopniu udało się ją wykorzystać. W gwoli naukowej obiektywności należy jednak dodać, że nie jest to publikacja recenzowana, nosząca w związku z tym wiele znamion amatorskiego ujęcia.

32 Zob. uwagi na ten temat w podrozdz. 2.3.2. niniejszej pracy.

33 Zdarza się np. że, osoby niesłyszące rozmawiając z innymi osobami chętniej korzystają z języka PJM, natomiast w kontaktach z osobami słyszącymi lub upośledzonymi słuchowo w mniejszym stopniu korzystają z SJM. Obiektywną trudnością jest tu szybko powiększający się zasób słownictwa, co wymusza zastępcze formy komunikacji (mowa ciała i/lub literowanie). Szersze uwagi na ten temat zawarte są w podrozdz. 2.3.3. niniejszej pracy.

natomiast dobrane tematycznie sytuacje typy: X na poczcie, X w przychodni dla głuchoniemych itp.

Z punktu widzenia samego procesu tłumaczenia, poszukującego adekwatnej płaszczyzny ekwiwalencji treściowo-pojęciowej, jest uzyskanie wyjściowych struktur złożonych – zdań i wypowiedzi35, odpowiadających rzeczywistej językowej aktywności człowieka w różnych sytuacjach życiowych. Przyjęte narzędzia opisu mimo pewnych ograniczeń, jak się zakłada, mogą być przydatne do opisu wszelkich form komunikacji noszących znamiona języka naturalnego. Szczegóły koncepcji zawierają dalsze rozdziały pracy.

W dokumencie Index of /rozprawy2/10860 (Stron 31-35)