• Nie Znaleziono Wyników

Inżynieria języka naturalnego na potrzeby języka słów kluczowych

W dokumencie KLUCZOWE SŁOWA (Stron 105-110)

2.4.1. Język słów kluczowych a język naturalny

Nawiązując do swoich wcześniejszych publikacji (Babik 1996b, 2007) i rozważań w rozdziale 1.4.3.3, gdzie stwierdziłem, że języki słów kluczowych stanowią przy-kład wykorzystania słownictwa języków naturalnych do wyszukiwania informacji91, uważam, że nie oznacza to pełnego wykorzystania języków naturalnych jako języków informacyjno-wyszukiwawczych. Ta na pozór błaha różnica między tymi dwoma sformułowaniami, wynikająca z „przeznaczeniowej” defi nicji języka informacyjno--wyszukiwawczego, uwzględniającej ich funkcje w systemie informacyjno-wyszu-kiwawczym, do tej pory często jest przyczyną nieporozumień oraz niepowodzeń w procesie organizacji słownictwa tych języków. Z defi nicji „przeznaczeniowej”

wynika, że w sensie funkcjonalnym język ten służy do przedstawiania istotnych ele-mentów treści dokumentu w celu umożliwienia ich powtórnej identyfi kacji w zbiorze informacyjnym w wyszukiwaniu informacji tylko tych opisów dokumentów, które odpowiadają na pytanie użytkownika, tzn. których charakterystyka wyszukiwawcza pokrywa się z instrukcją wyszukiwawczą.

W celu automatyzacji pewnych reguł użycia języka, musimy przyjąć, że jego użycie polega na operowaniu kształtami wyrażeń, stąd niezbędna jest ich

formaliza-91 W piśmiennictwie dotyczącym języków informacyjno-wyszukiwawczych zwykle opisuje się słownictwo tych języków tylko z perspektywy synchronicznej, jak gdyby nie dostrzegając perspektywy diachronicznej. Trzeba mieć jednak świadomość, że znaczenia wyrazów uznawanych za słowa kluczowe i same słowa kluczowe zmieniają się zarówno w czasie, jak i w przestrzeni. Dotyczy to w równej mierze ich zakresów, jak i treści.

cja, ponieważ w systemie informacyjno-wyszukiwawczym operacje są wykonywane na tekstach języka naturalnego, w którym tworzone są dokumenty oraz używanego w systemie języka informacyjno-wyszukiwawczego. Automatyzacja dotyczy stoso-wania reguł słownikowych, formostoso-wania i jednoznacznego przekształcania wyrażeń bez konieczności rozumienia treści samych wyrażeń. Może ona dokonywać się tylko wtedy, gdy reguły użycia języka są operacjami na kształtach wyrażeń. Dzięki temu takie operacje nie stwarzają trudności interpretacyjnych. W zautomatyzowanym sy-stemie informacyjno-wyszukiwawczym następuje więc rejestracja kształtu wyraże-nia, a nie utrwalanie oznaczeń i porcji wiedzy. Komputer nie rozumie wyrażeń. Jest zdolny tylko rozróżniać ich kształty (ciągi znaków) i operować nimi. Logicy uwa-żają, że języki naturalne, a zwłaszcza język potoczny, nie nadają się do formalizacji, gdyż nie można ściśle opisać ich składni bez odwoływania się do treści, co oznacza, że w tym przypadku nie jest możliwa ścisła odpowiedniość między operacjami na kształtach wyrażeń a operacjami na znaczeniach.

Autorzy języków słów kluczowych nakładają na język naturalny szereg ograni-czeń w celu niezbędnej formalizacji tego języka. Tworzywo, którym jest słownictwo języka naturalnego, daje w języku słów kluczowych wiele możliwości wyrażania treści dokumentów (Bojar 2006). Tak też można postrzegać fakt funkcjonowania w Polsce i na świecie wielu języków słów kluczowych. W obrębie jednego języ-ka słów kluczowych zasady doboru leksyki oraz formułowania słów kluczowych winny stanowić spójny system, natomiast nie musi zachodzić pełna, prosta i łatwa przekładalność między słowami kluczowymi różnych języków słów kluczowych, jeżeli takiej kompatybilności z góry nie założono92. Najistotniejsza różnica między językiem naturalnym a językiem słów kluczowych tkwi w regułach semantycznych, tj. w semantyce tych języków, a więc w ich planie treści. Zgodnie z regułami seman-tycznymi dowolnego języka naturalnego słowa oznaczają przypisane im wycinki rze-czywistości. Słowa kluczowe zaś oznaczają zawsze tylko d o k u m e n t y omawiające dany wycinek rzeczywistości. Różnice występują również w planie wyrażania.

Języki słów kluczowych w semantycznej strukturze nie odwzorowują bezpo-średnio rzeczywistości pozajęzykowej, opisanej w tekstach dokumentów, jak to jest w językach naturalnych, lecz czynią to pośrednio w swoich tekstach (charakterysty-kach i instrukcjach wyszukiwawczych). Tym samym języki te odwzorowując teksty języków naturalnych, odwzorowują określony podzbiór ich leksyki relewantnej dla użytkowników informacji zawartej w tych tekstach. „Tak jak każdy język naturalny nakłada inną siatkę semantyczną na rzeczywistość pozatekstową, tak każdy język informacyjno-wyszukiwawczy nakłada na całe uniwersum dokumentacyjne swoją własną strukturę, zależną przede wszystkim od przewidywanych potrzeb informa-cyjnych użytkowników” (Bojar 2006, s. 7). Mimo wspomnianej redukcji pozostaje jednak podobieństwo języka słów kluczowych do języka naturalnego, dlatego słusz-nie te języki są zaliczane do klasy języków paranaturalnych.

92 Z faktu, że języki słów kluczowych bazują na językach etnicznych wynika dla tych języków wiele specyfi cznych problemów, których źródłem są poszczególne języki etniczne.

Język informacyjno-wyszukiwawczy opisuje nie bezpośrednio obiekty (elementy uniwersum), lecz dokumenty traktujące o tych obiektach, stąd przy projektowaniu słownika tego języka i wprowadzaniu zmian bierze się pod uwagę nie tylko samo istnienie danych terminów, ale także ich występowanie w dokumentach (ang. literary warrant). Terminy mogą istnieć w języku naukowym, technicznym, potocznym, ale mogą nie być używane w dokumentach, gdyż są nazwami obiektów, o których nie pisze się dostatecznie często.

Języki słów kluczowych bazują na języku naturalnym w jego różnych odmianach etnicznych, ale też na językach sztucznych, jak na przykład języku chemii czy ma-tematyki, co stwarza dodatkowe problemy generowane przez języki bazowe, m.in.

dotyczące odpowiedniej dla danego języka naturalnego (na przykład języka angiel-skiego) kategoryzacji rzeczywistości. Każdy z języków naturalnych przeprowadza odmienną kategoryzację rzeczywistości.

Dane wyrażenie staje się jednostką leksykalną języka słów kluczowych, zwaną słowem kluczowym, wtedy, gdy jest wyjęte z tekstu dokumentu i zaczyna repre-zentować cały tekst, a nie tylko jakiś element rzeczywistości w tekście. Koncepcja izolowania z kontekstu słów kluczowych pochodzi od H.P. Luhna, o czym już wspo-minałem w rozdziale 2.1.1.

W języku słów kluczowych unika się używania jako słów kluczowych na ozna-czenie elementów treści dokumentów wyrażeń typu „badanie”, „zastosowanie” czy

„nauczanie”. Są to wyrażenia, które w innych typach języków paranaturalnych peł-nią funkcje wyrażeń aspektowych (pomocniczych), jak na przykład w Języku Haseł Przedmiotowych Biblioteki Narodowej. Próby traktowania tego typu wyrażeń jako słowa kluczowe zwykle generują niepotrzebny szum informacyjny, na przykład in-terpretacja zdania w języku słów kluczowych „Finanse. Badania” ujawnia niejedno-znaczność tej konstrukcji, gdyż nie wiadomo, czy chodzi o badania nad fi nansami, czy o wpływ fi nansów na badania.

Języki słów kluczowych operują słowami kluczowymi o różnym stopniu szcze-gółowości. Ma to swoje konsekwencje w postaci mnożenia jednostek leksykalnych w zdaniach tego języka, na przykład ciąg słów kluczowych stanowiący tekst w ję-zyku słów kluczowych opisujący dokument x, można zastąpić istniejącym w tym języku słowem kluczowym y. Szczegółowość słów kluczowych w języku słów klu-czowych powoduje zwiększenie ich liczby w zdaniu/tekście. Chociaż w niektórych nieklasycznych językach słów kluczowych wprowadza się w roli słów kluczowych wyrażenia opisowe, na przykład: „Białka w żywieniu człowieka”, to w klasycznym języku słów kluczowych słowami kluczowymi mogą być tylko wyrażenia proste typu: „Białko”, „Białko spożywcze”.

Granica między językiem słów kluczowych a językiem naturalnym ujawnia się w momencie tworzenia metainformacyjnych reprezentacji dokumentów, czyli w pro-cesie indeksowania. Jest to ciąg następujących transformacji informacyjnych: anali-za, selekcja i tłumaczenie. Analizowane są dokumenty, a przede wszystkim zawarte w nich informacje. Rezultatem tego procesu jest metainformacja, która stanowi re-prezentację informacji zawartej w tekście dokumentu, wyrażona w języku natural-nym, choć nie zawsze w tym samym języku co dokument oraz informacja o samym

dokumencie. W ostatnim kroku indeksowania, którym jest przekład na język danego systemu, wyselekcjonowane metainformacje są wyrażane za pomocą środków leksy-kalnych i gramatycznych, którymi dysponuje ten język. W naszym przypadku mają postać słów kluczowych.

Zbiór wyrażeń języka naturalnego, który stanowi tworzywo dla języka słów klu-czowych, jest dla potrzeb tych języków poddawany odpowiednim zabiegom języ-kowym, co powoduje, że języki słów kluczowych istnieją w wielu odmianach. Bazę wyjściową dla wszystkich tych języków stanowi język naturalny w odpowiedniej wersji etnicznej, na przykład język polski w jego współczesnej postaci. Języki słów kluczowych stanowią przykład obróbki tworzywa, jakim jest język naturalny i jego słownictwo, na potrzeby języka systemów wyszukiwania informacji o dokumentach.

2.4.2. Koncepcja wielofunkcyjnych słowników otwartych

Jak już sygnalizowałem w pierwszej części rozprawy, w języku słów kluczowych w znacznym stopniu – chociaż nie aż w takim, jak w języku deskryptorowym – wystę-puje zbliżenie systemu leksykalnego tego języka do systemu terminologicznego. Na-stępuje transformacja tego systemu w system/sieć leksykalną języka słów kluczowych.

W przypadku systemów specjalistycznych ważne okazuje się słownictwo języka naturalnego w jego odmianie specjalistycznej, w formie terminologii danej dziedziny wiedzy, nauki lub techniki. Jest faktem, że specjaliści z danej dziedziny, formułując pytania kierowane do systemu, posługują się przede wszystkim terminologią funk-cjonującą w ich dziedzinie. Praktyka ta – zresztą zauważona już wcześniej – znalazła wyraz m.in. w nazwie elementarnych jednostek leksykalnych, na których oznaczenie używa się również nazw „termin”, „termin wyszukiwawczy”.

Skoro użytkownicy specjalistycznych systemów informacyjno-wyszukiwaw-czych posługują się przy formułowaniu pytań informacyjnych, bardziej lub mniej świadomie, terminologią danej dziedziny zawartą w tekstach dokumentów oraz słownikach terminologicznych stanowiących odwzorowanie systemów terminolo-gicznych, powstaje pytanie, czy nie można wykorzystać słowników terminologicz-nych w wyszukiwaniu informacji lub budować słowników terminologiczterminologicz-nych, które pełniłyby jednocześnie funkcje słowników języka informacyjno-wyszukiwawczego.

Takie wielofunkcyjne narzędzia wyeliminowałyby dodatkowe sięganie podczas wy-szukiwania informacji do tradycyjnych słowników terminologicznych.

Ogólną koncepcję budowy takich słowników przedstawiłem w jednej z moich publikacji (Babik 1995). Opiera się ona na wzbogaceniu zakresu wykorzystania tradycyjnych słowników terminologicznych języka naturalnego o funkcje pełnio-ne przez słowniki języków informacyjno-wyszukiwawczych. Jako element języka i składnik systemu takie słowniki pełniłyby następujące funkcje:

– informacyjną (normatywną, wyjaśniającą), związaną ze wspomaganiem procesu tworzenia tekstów dokumentów źródłowych w języku naturalnym;

– przekładową, związaną z wyrażaniem potrzeb informacyjnych w odpowiednim specjalistycznym języku;

– metainformacyjną, związaną z tworzeniem opisów dokumentów dla systemów in-formacji (CHWD);

– wyszukiwawczą, związaną z funkcjonowaniem systemu wyszukiwania informacji, tworzeniem instrukcji wyszukiwawczych (IWZ).

Budowa takich wielofunkcyjnych słowników wymagałaby rozwiązania szere-gu problemów teoretycznych i praktycznych (metodycznych), związanych przede wszystkim z niezbędnymi dla rozszerzonego zestawu funkcji takich słowników środ-kami i metodami defi niowania terminów.

Wynikająca z różnych potrzeb użytkowników koncepcja pełnienia przez jeden słownik funkcji informacyjnej słowników terminologicznych języka naturalnego oraz funkcji metainformacyjnej i funkcji wyszukiwawczej języka słów kluczowych wymaga odpowiednich środków do niezbędnej formalizacji defi niowania terminów, co w konsekwencji prowadzi do postawienia pytania o przedmiot i formę defi nicji słownikowej, wystarczającej do realizacji funkcji tych słowników.

Zaletą wielofunkcyjnych słowników terminologicznych z punktu widzenia po-trzeb języka słów kluczowych byłoby zdjęcie z użytkownika obowiązku szczegó-łowej znajomości systemu, jego zawartości informacyjnej i organizacji. Byłoby to zbieżne z najnowszymi tendencjami w metodologii projektowania systemów in-formacyjno-wyszukiwawczych oraz z możliwością oddzielnego projektowania po-szczególnych modułów systemów informacji. Słowniki te odwzorowywałyby syste-my terminologiczne poszczególnych dziedzin, a więc podawałyby gotowe terminy odpowiednio powiązane z pozostałymi, stanowiąc spójny system terminologiczny.

Stanowiłyby jednocześnie system leksykalny języka słów kluczowych.

Ten typ wielofunkcyjnych słowników stanowi nową, dość precyzyjnie określoną formę organizacji i prezentacji słownictwa języka słów kluczowych, a więc termino-logii w jej funkcji metainformacyjnej (reprezentacji treści dokumentów), informa-cyjnej i wyszukiwawczej, a jednocześnie pomoc w indeksowaniu i wyszukiwaniu informacji.

Wyspecjalizowane funkcje słowników języka słów kluczowych (metainforma-cyjna i wyszukiwawcza) wymuszają wypracowanie bardziej sformalizowanego, niż w tradycyjnych słownikach terminologicznych, aparatu defi nicyjnego jednostek leksykalnych (terminów) tych języków, dostosowanego także do komputerowego przetwarzania informacji. Formalizacja i stosowane środki normalizacji słów kluczo-wych nie ograniczają przydatności tych słowników do pełnienia funkcji informacyj-nej, właściwej tradycyjnym słownikom terminologicznym. Słownik terminologiczny mógłby pełnić funkcje słownika słów kluczowych przy założeniu, że zebrane w nim słownictwo stanowić będzie klasę otwartą, to znaczy, że może być ono ciągle uzu-pełniane o nowe terminy.

Pomysł budowy wielofunkcyjnych słowników terminologicznych, to jest słow-ników pełniących jednocześnie funkcje: informacyjną, metainformacyjną i wyszuki-wawczą, wymaga oparcia aparatu defi nicyjnego tych słowników na konotacyjnej in-terpretacji znaczenia i wykorzystania najnowszych technologii leksykografi cznych.

W dokumencie KLUCZOWE SŁOWA (Stron 105-110)

Outline

Powiązane dokumenty