• Nie Znaleziono Wyników

FrameNet w systemach automatycznego udzielania odpowiedzi na pytania zadane do treści tekstu

3.2. Pojęcie ontologii – ontologie filozoficzne i informatyczne

3.4.3. FrameNet w systemach automatycznego udzielania odpowiedzi na pytania zadane do treści tekstu

Jak opisano już w rozdziale 1, teoria schematów pamięci, od której wywodzi się semantyka ramowa, znalazła zastosowanie również w modelach rozumienia tekstu (np. ontologia Dahgren za Fridman & Hafner, 1997; model van Dijka, van Dijk 1983, 1988, 1997) w swoich pierwotnych architekturach.

Działają one na zasadzie konstrukcji modelu sytuacyjnego, składającego się ze schematu z typowymi dla niego elementami rozumianymi jako „szuflady” (ang.

slots) i wypełniającymi je instancjami (ang. fillers). W procesie rozumienia dyskursu (w tym tekstu) podane jako pierwsze słowa kluczowe aktywują w naszej pamięci sche-maty (szafy z szufladami), w których szuflady są zdefiniowane, lecz puste. Ponieważ odbiorca wie, co powinno się znaleźć w poszczególnych szufladach, zadaje pytania dotyczące poszczególnych szuflad, stopniowo je wypełniając. Dialog wyczerpuje całkowite uzupełnienie szuflad. Posługując się przykładem podanym przez van Dijka (van Dijk, 1986), tekst dotyczący napadu na obcokrajowca aktywuje schemat NAPA-DU (który możemy nazwać głównym schematem kategoryzacyjnym, definiowanym w rozumieniu dyskursu jako rama interpretacyjna), co sprawia, iż zadawane pytania dotyczyć będą sprawców, czasu, miejsca, powodu napadu itd. Współczesne modele wydobywania danych lub udzielania odpowiedzi na pytania, powstające w oparciu o semantykę ramową, mają podobną strukturę, gdyż definiowane w nich ramy two-rzone są również na bazie schematów. Van Dijk zwracał w modelach rozumienia dyskursu uwagę na ważny aspekt, jakim jest możliwość zdefiniowania, jakiego rodzaju pytania mogą potencjalnie pojawić się do danego tekstu. Oprócz pytań przyczyno-wo-skutkowych, z racji kognitywnej percepcji najpierw głównej idei (np. napad), a dopiero następnie poszczególnych jej elementów (miejsce, czas, uczestnicy itd.), wykazał on kognitywną tendencję do zadawania przez odbiorcę (czy w dyskursie czy podświadomie) pytań o kolejne miejsca schematu (slots) po to, aby wypełnić je danymi (fillers). W ten sposób, opierając system wydobywania danych lub udzielania odpowiedzi na pytania na opisanych w projekcie ramach, możemy spodziewać się

pytań, na które odpowiedzią lub których kategoryzującą szufladą będą poszczególne, zdefiniowane w projekcie, elementy ramy.

Zaletą takiego rozwiązania dla budowanego systemu NLP jest semantyczne zawężenie dziedzinowe, które pozwala zdefiniować, jakie pytania zostaną zadane w danej dziedzinie. Jak zauważają Sinha i Narayanan (Sinha & Narayanan, 2005, s. 1) idealny system udzielania odpowiedzi na pytania czytałby zdania zapisane w forma-cie języka naturalnego, rozumiałby kontekst, w jakim zostało ono wypowiedziane, przeczytałby fachową literaturę powiązaną z jego tematem, wydobyłby informacje ze zróżnicowanych źródeł, rozważyłby, które ze źródeł są bardziej spolegliwe, a następnie podałby odpowiedź łączącą w sobie informacje – wraz z podaniem argumentacji dla wyciągniętych wniosków. Wiadomo jednak, że przy obecnym stanie technologii jest to jeszcze dosyć rzadkie18, stąd architektura poszczególnych systemów jest nieco inna i często zredukowana do konkretnych zadań dla danej dziedziny lub też dla danego typu pytań (Sinha & Narayanan, 2005, s.1).

Jednej z prób skonstruowania takiego systemu udzielającego odpowiedzi podjął się Gerhard Fliedner (2004) z Uniwersytetu w Saarbrücken, gdzie rozwijany jest projekt niemieckiego FrameNetu o nazwie SALSA. Autor podaje we wstępie, iż większość z dotychczasowych rozwiązań opiera się na metodach statystycznych. Polegają one na rozbiorze gramatycznym zdania, następnie wyszczególnieniu głównych haseł w zdaniu, a potem – w oparciu o algorytmy – przeszukiwaniu korpusów w celu znalezienia fragmentów, zawierających elementy odpowiedzi. I choć sposoby te mają dosyć wysoką wydajność, to jednak nie są one zbyt precyzyjne i zwracają zbyt dużą liczbę wyników. Autor proponuje zastosowanie podejścia alternatywnego w oparciu o automatyczną anotację tekstów, proponowaną we FrameNecie, a następnie dzięki tej anotacji – dokonanie przeszukiwania danych w oparciu o kryteria semantyczne (Fliender, 2004, s. 61). Zadawane systemowi pytania również podlegają wpierw ano-tacji zgodnie z zasadami semantyki ramowej (Fliedner, 2004, s. 62). Powodem, dla którego zdaniem Fliednera (Fliender, 2004, s. 61) system QA bazujący na FrameNecie powinien lepiej poradzić sobie z tym zadaniem, jest tzw. głęboka (oparta na semanty-ce), a nie powierzchniowa (oparta na składni) analiza zdań, która – np. dzięki opisowi poszczególnych polisemicznych znaczeń danego słowa – umożliwia znalezienie nie przybliżonego, ale właściwego sformułowania. W takim układzie, pisze dalej autor, niezależnie od tego, czy znaczenie wyrażone jest w formie aktywnej czy pasywnej, rze-czownikiem, czy czasownikiem itd. (np. Vodafone przejął Mannesmanna w 2000 roku, Mannesmann został sprzedany Vodafone lub Zakup Mannesmanna przez Vodafone…

18 Przykładowo system Watson firmy IBM potrafi udzielać w większości poprawnych odpowiedzi na pytania dotyczące wiedzy encyklopedycznej w czasie zbliżonym do czasu odpowiedzi człowieka, czyli około 3 sekund. Źródło: https://www.youtube.com/watch?v=lI-M7O_bRNg.

Fliedner, 2004, s. 62), dzięki przypisaniu słownictwa do danej ramy, system łatwo od-najdzie odpowiedź na pytanie: Kto kupił firmę Mannesmann? Natomiast w przypadku tego samego pytania zadanego systemowi działającemu w oparciu o wyszukiwanie na podstawie hasłowej, czyli bez kontekstu, istniałoby duże prawdopodobieństwo pomyłki dotyczącej sprzedającego i sprzedawanego, czego sam system nie mógłby rozróżnić (Sinha & Narayanan, 2005).

Kolejnym ciekawym modelem odpowiedzi na pytania (a raczej jego zaczątkiem) jest praca Stevena Sinhy i Sriniego Narayanana (Sinha & Narayanan, 2005) dotycząca analizy zbioru danych AQUAINT – bazy dokumentów amerykańskiego Centrum Badań ds. Zapobiegania Rozprzestrzenianiu Broni Masowego Rażenia (James Martin Center for Nonproliferation Studies). W swoim projekcie autorzy połączyli system do wydobywania danych z treści autorstwa naukowców z Uniwersytetu w Dallas, z semantyką ramową i metodą analizy zdań. Składa się on z następujących modułów (Sinha & Narayanan, 2005, s. 2):

• moduł do przetwarzania pytania, który połączy je ze zdefiniowanymi typami odpowiedzi (parser syntaktyczno-semantyczny z oznaczaniem ról semantycz-nych, ang. semantic role labeling);

• moduł do wyszukiwania danych (IR – ang. information retrieval) w celu wydo-bycia istotnych fragmentów tekstów;

• moduł do algorytmicznej oceny najlepszej odpowiedzi wśród znalezionego zbioru pasujących fragmentów.

Wyszli oni z założenia, że poprawa działania aktualnych systemów QA może nastąpić dzięki zbudowaniu schematów dla działań lub wydarzeń (ang. events), zasi-leniu ontologii przykładami tych działań i przełożeniu pytań na formę umożliwiającą wyciąganie wniosków (inferencji, Sinha & Narayanan, 2005, s. 2). Słowa kluczowe wyekstrahowane z pytań są powiązane ze sobą i w takim razie wydobycie ram, w tym podmiotów, orzeczeń i ich dopełnień z pytania powinno zwiększyć skuteczność działania systemu. Przetwarzanie informacji w kontekście, jest zdaniem autorów, ważnym połączeniem między informacją poszukiwaną w pytaniu a informacją zawartą w odpowiedzi (Sinha & Narayanan, 2005, s. 2).

Rysunek 13. Schemat systemu dialogowego powstającego w oparciu o bazę AQUAINT. Źródło:

Sinha & Narayanan, 2005, s. 2

Powyższy model ilustruje następujące prawidłowości:

• możliwe jest zdefiniowanie ogólnego schematu dla wydarzeń, opisującego ich fazy, sposób przebiegania i skalę (por. CONSTRUAL), jak też poruszanie się po kolejnych etapach schematu (CONSTRUCT);

• określenie jego parametrów czasowych, miejscowych, warunkowych itd. (PA-RAMETER);

• zdefiniowanie ramy semantycznej i ról semantycznych w postaci AKTORA (AC-TOR), PATIENSA (PATIENT), INSTRUMENTU (INSTRUMENT), OBIEKTU ODDZIAŁYWANIA (THEME);

• określenie i opisanie relacji pomiędzy poszczególnymi typami wydarzeń (RE-LATION);

• oraz połączenie całości systemu poprzez ontologię relacji JEST (IS-A), MA CE-CHĘ (hasParameter), ODNOSI SIĘ DO RAMY (hasFrame), WYDARZENIE (Event Relation).

Jak widać na powyższym wykresie, opis ramowy jest ważnym, choć jednym z wielu elementów architektury systemu, który pełni funkcję nadawania kontekstu, czyli w rozumieniu NLP – scharakteryzowania powiązań semantycznych i syntak-tycznych między wyrazami w zdaniu. Pamiętając początkowe badania Fillmore’a, prowadzone jeszcze w latach 50. XX wieku nad przypadkami głębokimi, możemy uznać, że kilkadziesiąt lat później jego praca znalazła zastosowanie w automatycznym połączeniu relacji syntaktyczno-semantycznych.

Najczęściej jednak systemy dziedzinowe wymagają jeszcze doprecyzowania pod kątem wyszukiwanych danych i tutaj również autorzy skupiają się na pytaniach

dotyczących przyczyn lub wyników opisywanych działań, stąd duży nacisk na mode-lowe opisanie faz, z jakich składa się proces lub wydarzenie, rozkładając je na czyn-niki pierwsze w sensie kognitywnym (zdarzenie złożone, czyli ang. composite event).

Z innej strony – jak i we wcześniejszym przykładzie BioFrameNetu – dane zostają scalone dzięki językowi opisu ontologii (OWL), który ukazuje zależności pomiędzy poszczególnymi częściami budowy modelu.

Przykładowe działanie systemu składa się więc z następujących etapów (Sinha

& Narayanan, 2005, s. 3):

• pierwszym etapem analizy jest syntaktyczny rozkład zdania z pomocą parsera i semantyczne oznaczenie elementów ramowych, zarówno w zadanym pytaniu, jak i wszystkich zdaniach w korpusie;

• otrzymane w wyniku rozkładu oznaczone orzeczenia wraz z ich dopełnieniami są przenoszone do bazy danych;

• relacje zdefiniowane w obrębie modelu są następnie łączone z otrzymanymi w wy-niku analizy orzeczeniami i ich dopełnieniami w potencjalnych odpowiedziach;

• odpowiedzi są oceniane przez system i podawane w kolejności od najlepiej do najgorzej pasującej.

Przykładowym pytaniem, przytaczanym przez autorów, jest:

Does Pakistan possess the technological infrastructure to produce biological weapons? / Czy Pakistan posiada infrastrukturę technologiczną do produkcji broni biologicznej?

Pytanie to zawiera dwie relacje syntaktyczno-semantyczne:

• possess (Pakistan, technological infrastructure);

• produce (Pakistan, biological weapons).

System będzie więc poszukiwał nie tylko samych haseł typu Pakistan czy weapons, ale też zdań, w których Pakistan będzie podmiotem i AGENTEM, a INSTRUMEN-TEM będzie broń biologiczna. Według autorów badania potwierdziły tezę przede wszystkim dlatego, że system odrzucił odpowiedzi niepowiązane kontekstowo, co stanowi dużą przewagę nad innymi systemami NLP. Jedną z odpowiedzi udzieloną przez system była (Sinha & Narayanan, 2005, s. 3):

While Pakistan is not known to possess biological weapons (BW), it has talented biome-dical and biochemical scientists and well-equipped laboratories, which would allow it to quickly establish a sophisticated BW program, should the government so desire (Pakistan Country Profile, CNS 2004).

Jak widać na powyższym przykładzie, informatyczne zastosowanie semantyki ramowej, sprawdza się tam, gdzie potrzebne jest znalezienie znaczenia nie tylko w sensie odnalezienia danego słowa, ale też w sensie odnalezienia semantycznej relacji ramowej między słowami oraz realizacji leksykalnych elementów ramy.

3.4.4. Ontologie dziedzinowe do wydobywania danych, powstałe na