• Nie Znaleziono Wyników

Charakterystyka pola semantycznego języków słów kluczowych

1.4. Językowe determinanty słów kluczowych

1.4.2. Pole semantyczne języka słów kluczowych a języka naturalnego

1.4.2.2. Charakterystyka pola semantycznego języków słów kluczowych

Języki słów kluczowych, odpowiednio do funkcji i zakresu tych języków, odwzorowują pewien fragment rzeczywistości, zwany rzeczywistością dokumentacyjną.

Wyspecjalizowaną funkcją tych języków jest opis dokumentów, czyli utrwalonych informacji oraz formułowanie pytań użytkowników, co umożliwia wyszukiwanie potrzebnych użytkownikom informacji.

Str. 64

Pole semantyczne języka słów kluczowych możemy określić jako zbiór cech

rzeczywistości dokumentacyjnej relewantnych dla (potencjalnego) użytkownika systemu informacyjno-wyszukiwawczego, którego elementom (dokumentom) można

przyporządkować, zgodnie z regułami semantyki danego języka, słowa kluczowe. Kryteria doboru tych cech są zależne od konkretnego systemu. Wyznaczają je własności treści dokumentów rejestrowanych w danym systemie informacyjno-wyszukiwawczym, czyli atrybuty zawartej w nich informacji oraz potrzeby informacyjne użytkowników.

Pole semantyczne języka słów kluczowych zależy od rodzaju/odmiany tego języka: w języku swobodnych słów kluczowych rozwija się spontanicznie, jak w języku naturalnym, natomiast w sztucznym języku słów kluczowych jest projektowane i budowane zgodnie z przyjętymi regułami, a następnie uzupełniane w sposób zorganizowany, obejmując swoim zakresem ściśle określony obszar. Cel i przeznaczenie języka słów kluczowych określają więc zakres jego pola semantycznego, które jest po prostu sumą zakresów jego wyrażeń wyznaczonych na podstawie ich konotacji. Zakres ten jest mniejszy od zakresu pola semantycznego języka naturalnego – tym mniejszy, im bardziej wyspecjalizowany jest język informacyjny.

Cechą odróżniającą wyrażenia języka słów kluczowych od wyrażeń języka naturalnego jest to, że te ostatnie denotują bezpośrednio elementy rzeczywistości (uniwersum), natomiast jednostki leksykalne języka słów kluczowych denotują zbiory dokumentów, zapisanych informacji o elementach uniwersum, dzielone na odpowiednie podzbiory w procesie wyszukiwania informacji, dlatego relacje semantyczne w tym języku jedynie nawiązują do relacji między zakresami nazw w języku naturalnym. W rzeczywistości są to relacje zachodzące między zbiorami dokumentów zindeksowanych za pomocą słów kluczowych.

Biorąc pod uwagę relacje, jakie zachodzą pomiędzy słowami kluczowymi, trzeba

zaznaczyć, że są one najczęściej przeniesieniem relacji paradygmatycznych językowych i relacji pozajęzykowych w inną rzeczywistość, a mianowicie w rzeczywistość

dokumentacyjną. Zagadnienia te doczekały się precyzyjniejszych rozstrzygnięć na gruncie teorii języków informacyjno-wyszukiwawczych. Akceptowane przez wszystkich podejście do zagadnienia relacji w językach informacyjno-wyszukiwawczych zaproponowała B.

Bojar. Wyszła od stwierdzenia, że języki informacyjno-wyszukiwawcze są przeznaczone do zupełnie innego celu aniżeli języki naturalne. Służą do indeksowania dokumentów i pytań informacyjnych, a desygnatami ich jednostek leksykalnych nie są określone wycinki rzeczywistości, lecz teksty dokumentów. Z tego wynika, że na przykład rozpatrując relacje generyczne, należy interpretować je nie dosłownie jako relacje między zakresami nazw, lecz jako relacje między zbiorami dokumentów zaindeksowanych za pomocą tych nazw.

Tak więc relacje między zakresami nazw są wykorzystywane do oznaczania relacji między zbiorami dokumentów. Ta dokumentacyjna interpretacja relacji w językach informacyjno-wyszukiwawczych jest szczególnie przydatna przy rozpatrywaniu relacji między

podstawowymi przedmiotami zainteresowań poszczególnych dziedzin a tymi dziedzinami (przypis 99 Bojar 2005 ).

Str. 65

Na wspomnianą dokumentacyjną interpretację relacji w językach

informacyjno-wyszukiwawczych powołują się w swoich pracach m.in. Olgierd Ungurian i Eugeniusz Ścibor.

Jak widać, semantyka języka słów kluczowych może się różnić od semantyki języka naturalnego, na którego słownictwie może być oparty słownik słów kluczowych. Nawet w przypadku identyczności zasobów leksykalnych mamy do czynienia z dwoma różnymi językami, gdyż elementom leksykalnym języka słów kluczowych przyporządkowuje się klasy dokumentów, w których charakterystykach wyszukiwawczych wyrazy te występują.

Pomiędzy jednostkami języka słów kluczowych a jednostkami języka naturalnego zachodzą też różnice w planie wyrażania:

1. słowa kluczowe mają tylko jedną formę – jeśli ma postać rzeczownika, to jest podana w mianowniku liczby pojedynczej lub mnogiej i nie jest odmieniana przez przypadki i liczby, co występuje na przykład w wyrazach języka polskiego będących rzeczownikami;

2. wielowyrazowe słowa kluczowe stanowią nierozdzielną całość, nie podlegają podziałowi na wyrazy składowe (na przykład słowo kluczowe „biblioteka główna” nie może być rozbite na wyrazy „biblioteka” i „główna”) i z punktu widzenia reguł gramatycznych języka słów

kluczowych są traktowane tak samo jak każde inne słowo kluczowe. Zasób leksykalny języków słów kluczowych jest znacznie uboższy od zasobu leksykalnego języka naturalnego, z którego dany język czerpie swoje słownictwo, na przykład z języka polskiego; tylko bowiem niektóre wyrażenia występujące w języku naturalnym są

potrzebne do odtwarzania treści i formy dokumentów w danym systemie wyszukiwawczym nawet wtedy, gdy system ten ma zakres uniwersalny, tj. obejmuje wszystkie dziedziny nauki i działalności praktycznej. Słowa kluczowe ograniczają się w zasadzie do informacji jednego rodzaju, a mianowicie metainformacji o treści dokumentu.

Aby język słów kluczowych mógł efektywnie pełnić swoje wyspecjalizowane funkcje, powinien odznaczać się określonymi cechami. W szczególności należy pozbawić go synonimii i homonimii (wieloznaczności), charakterystycznych dla języka naturalnego, a przynajmniej wyeliminować negatywne skutki tych zjawisk.

W języku naturalnym, bazującym na kompetencji semantycznej człowieka, często brak formalnych wykładników wskazujących na rodzaje powiązań pomiędzy poszczególnymi elementami tego języka. Prowadzi to czasami do wieloznaczności w rodzaju wyrażenia:

„starzy mężczyźni i kobiety”, mającego dwie różne możliwości interpretacyjne. Innym rodzajem wieloznaczności możliwej do wyeliminowania w językach słów kluczowych (na przykład poprzez wprowadzenie nawiasów) jest wieloznaczność wynikająca z braku ustalenia preferencji łączenia: na przykład wyrażenie języka naturalnego „sód i potas lub cynk” może mieć w języku słów kluczowych przypisane dwie różne struktury. W języku naturalnym o poprawnym znaczeniu takich struktur wieloznacznych mówi kontekst, akcent lub wiedza pozajęzykowa – komputer (maszyna) takiej kompetencji nie ma (nie zawsze zresztą tę kompetencję ma człowiek). W systemie informacyjno-wyszukiwawczym nie wyszukujemy według znaczeń wyrazów, lecz według ich cech formalnych, tzn. kolejnych znaków tworzących daną jednostkę leksykalną.

Str. 66

Pole semantyczne języków naturalnych nie ma charakteru statycznego, bo tworzy się i rozwija w sposób żywiołowy (naturalny), natomiast pole semantyczne języka słów

kluczowych może być sztuczne, tzn. budowane i modyfikowane (projektowane) w sposób zorganizowany, a jakiekolwiek zmiany w tym języku mogą być wprowadzone tylko przez kompetentny organ. I jeszcze jedna istotna różnica: pole semantyczne języka słów kluczowych jest prezentowane tylko za pomocą rzeczowników i fraz rzeczownikowych, podczas gdy pole semantyczne języka naturalnego jest odwzorowywane przez wyrażenia o różnych kategoriach gramatycznych.

Chociaż różnice pomiędzy polami semantycznymi języka słów kluczowych i języka naturalnego mają swoje konsekwencje w systemach paradygmatycznym i

syntagmatycznym, to jednak pole semantyczne języka słów kluczowych powinno być modelowane na polu semantycznym języka naturalnego w tym sensie, że jego struktura powinna wykorzystywać w możliwie szerokim zakresie strukturę pola semantycznego języka naturalnego. Pozwoliłoby to użytkownikom systemu

informacyjno-wyszukiwawczego, stosującym język słów kluczowych w procesie wyszukiwania, w pewnym stopniu wykorzystywać znajomość systemu języka naturalnego, co dzięki możliwości wyszukiwania asocjacyjnego uczyniłoby te systemy bardziej przyjaznymi dla użytkownika.

1.4.3. Modelowanie języka słów kluczowych na bazie języka naturalnego