Pole semantyczne języka słów kluczowych a języka naturalnego

1.4. Językowe determinanty słów kluczowych

1.4.2. Pole semantyczne języka słów kluczowych a języka naturalnego

Kolejnym elementem deﬁ nicyjnym tożsamości języka słów kluczowych jest pole semantyczne. Celem jego opisu jest określenie podobieństw i różnic pomiędzy po-lem semantycznym wymienionych rodzajów języków, a także wyjaśnienie ich źródeł oraz konsekwencji. W dalszej części rozważań zamierzam wykazać, że istnieje pew-na odpowiedniość między polem semantycznym języka pew-naturalnego a polem seman-tycznym języka słów kluczowych.

1.4.2.1. Charakterystyka pola semantycznego języka naturalnego

W polskim piśmiennictwie na temat pola semantycznego języka informacyjno-wyszu-kiwawczego i języka naturalnego pisały m.in. Elżbieta Artowicz, Barbara Sosińska--Kalata oraz Bożenna Bojar. Zajęcie się tym problemem uważam za ważne, gdyż stano-wi jeden z elementów określających tożsamość języka. Deﬁ nicja pola semantycznego języka określa pole semantyczne danego języka naturalnego jako ustrukturalizowany zbiór cech obiektów realnej rzeczywistości (uniwersum), którego podzbiorom (wiąz-kom) można przyporządkować, zgodnie z regułami semantyki danego języka natural-nego, wyrażenia tego języka. Cechy te są porządkowane według różnych kryteriów, tworząc wielopoziomowe struktury wyrażane w systemie leksykalnym języka natu-ralnego za pomocą różnych typów relacji paradygmatycznych i syntagmatycznych.

Język naturalny odwzorowuje całą rzeczywistość, stosownie do pełnionych przezeń funkcji. Każdy język naturalny odwzorowuje rzeczywistość w sposób wielo-wielo-znaczny. Nie ma więc tu wzajemnie jednoznacznego przyporządkowania pomiędzy elementami języka i elementami odwzorowywanej przezeń rzeczywistości. Znajduje to wyraz w systemie paradygmatycznym danego języka naturalnego.

Język naturalny pełni funkcję klasyﬁ kowania elementów rzeczywistości. Każdy język dzieli tę rzeczywistość według swoich własnych kryteriów i dlatego języki naturalne są właściwie nieporównywalne (na przykład różny podział wyrazu „śnieg”

w języku ﬁ ńskim i w języku polskim). Służy on również do wydzielania tych elemen-tów, dzielenia ich na klasy i nadawania tym klasom nazw. W samej rzeczywistości najczęściej brak wyraźnych granic między tymi klasami. Ich ustalenie jest każdo-razowo wynikiem arbitralnej decyzji klasyﬁ kującego, tj. użytkownika języka, stąd elementy rzeczywistości są grupowane w bardzo różne klasy, zależnie od konkretnej potrzeby. Użytkownik danego języka etnicznego wybiera ze skończonej liczby cech obiektu tylko te cechy istotne lub relewantne tego obiektu, których znajomość wy-starcza mu do użycia danego wyrażenia języka naturalnego (Bojar 2005).

System słownikowy każdego języka naturalnego ma budowę luźną. Oznacza to, że wyrażenia języka naturalnego nie dają się ułożyć w jedno drzewo klasyﬁ kacyjne.

Klasyﬁ kacja ta nie spełnia więc warunków stawianych poprawnej klasyﬁ kacji. Nie przeprowadza bowiem konsekwentnie podziału rozłącznego. W każdym języku natu-ralnym najwięcej jest wyrażeń nazywających konkretne przedmioty. Język naturalny rozbudowuje tę klasyﬁ kację stosunkowo rzadko, gdyż rzadko istnieje potrzeba posłu-giwania się wyrażeniami o wysokim stopniu abstrakcji, a więc niosącymi mało infor-macji. W razie potrzeby klasyﬁ kacja ta może być rozbudowana poprzez łączenie lub dzielenie zakresów, co powoduje tworzenie się rozgałęzionych wielopoziomowych drzew klasyﬁ kacyjnych. Tak jest w języku nauki. Przykładem takiej klasyﬁ kacji może być systematyka roślin i zwierząt. Należy jednak zauważyć, że zakres wyrazów jest w języku naturalnym w pewnej mierze przypadkowy. Wyrazy te, włączone w drzewo klasyﬁ kacyjne języka nauki, nabierają często innej treści, na przykład w języku po-tocznym zakres nazwy „zwierzę” obejmuje tylko ssaki i to z wyjątkiem ludzi (ptaki, ryby, gady, płazy to nie zwierzęta). W języku naukowym natomiast wyraz „zwierzę”

jest jednostką na wyższym poziomie abstrakcji. Przykład ten ilustruje względność zasady poprawnej klasyﬁ kacji, która wymaga, aby klasyﬁ kacja była naturalna, tzn.

aby przedmioty należące do zakresu jednego członu podziału były do siebie bardziej podobne niż przedmioty należące do różnych członów (Bojar 2005).

Jednostki języka naturalnego bardzo często nie wyznaczają zakresu odwzoro-wywanych przez nie zbiorów w sposób ostry i jednoznaczny. Przykładem mogą tu być wyrazy: „rzeka”, „potok”, „strumień” – którym trudno przyporządkować jedno-znaczne zbiory desygnatów. Takie sytuacje są dla języka naturalnego typowe. Do-kładne sprecyzowanie granic zakresu poszczególnych wyrażeń jest możliwe w języ-kach sztucznych.

Istotny postęp w zakresie tej problematyki przyniosło sformułowanie na bazie strukturalizmu teorii pola znaczeniowego, która opiera się na hipotezie, że znaczenia poszczególnych wyrazów są strukturalizowane poprzez wzajemne powiązania we-wnątrz odrębnych sfer, zwanych polami znaczeniowymi, pokrywającymi w całości obszar doświadczenia poznawczego człowieka.

Pole semantyczne języka naturalnego może też być rozpatrywane na różnych poziomach. Jeśli chodzi o jego wewnętrzną strukturę, to nie ma ona mozaikowego charakteru – jak uważali niektórzy teoretycy pola semantycznego języka naturalne-go – polegającenaturalne-go na ścisłym, jednoznacznym odgraniczaniu zakresu jenaturalne-go pól, lecz zachodzą one na siebie wzajemnie, więc ich granice są zmienne. Pole semantyczne języka naturalnego składa się więc z przenikających się wzajemnie i zespalających się pól elementarnych. W wypadku języka naturalnego trzeba też przyjąć równoczes-ność rozwoju planu treści i planu wyrażania, gdyż język naturalny stale się rozwija i w miarę powstawania nowych obiektów tworzy dla nich nowe nazwy.

1.4.2.2. Charakterystyka pola semantycznego języków słów kluczowych

Języki słów kluczowych, odpowiednio do funkcji i zakresu tych języków, odwzo-rowują pewien fragment rzeczywistości, zwany rzeczywistością dokumentacyjną.

Wyspecjalizowaną funkcją tych języków jest opis dokumentów, czyli utrwalonych

informacji oraz formułowanie pytań użytkowników, co umożliwia wyszukiwanie po-trzebnych użytkownikom informacji.

Pole semantyczne języka słów kluczowych możemy określić jako zbiór cech rzeczywistości dokumentacyjnej relewantnych dla (potencjalnego) użytkownika sy-stemu informacyjno-wyszukiwawczego, którego elementom (dokumentom) można przyporządkować, zgodnie z regułami semantyki danego języka, słowa kluczowe.

Kryteria doboru tych cech są zależne od konkretnego systemu. Wyznaczają je włas-ności treści dokumentów rejestrowanych w danym systemie informacyjno-wyszu-kiwawczym, czyli atrybuty zawartej w nich informacji oraz potrzeby informacyjne użytkowników.

Pole semantyczne języka słów kluczowych zależy od rodzaju/odmiany tego języ-ka: w języku swobodnych słów kluczowych rozwija się spontanicznie, jak w języku naturalnym, natomiast w sztucznym języku słów kluczowych jest projektowane i bu-dowane zgodnie z przyjętymi regułami, a następnie uzupełniane w sposób zorgani-zowany, obejmując swoim zakresem ściśle określony obszar. Cel i przeznaczenie języka słów kluczowych określają więc zakres jego pola semantycznego, które jest po prostu sumą zakresów jego wyrażeń wyznaczonych na podstawie ich konotacji.

Zakres ten jest mniejszy od zakresu pola semantycznego języka naturalnego – tym mniejszy, im bardziej wyspecjalizowany jest język informacyjny.

Cechą odróżniającą wyrażenia języka słów kluczowych od wyrażeń języka na-turalnego jest to, że te ostatnie denotują bezpośrednio elementy rzeczywistości (uni-wersum), natomiast jednostki leksykalne języka słów kluczowych denotują zbiory dokumentów, zapisanych informacji o elementach uniwersum, dzielone na odpo-wiednie podzbiory w procesie wyszukiwania informacji, dlatego relacje semantycz-ne w tym języku jedynie nawiązują do relacji między zakresami nazw w języku na-turalnym. W rzeczywistości są to relacje zachodzące między zbiorami dokumentów zindeksowanych za pomocą słów kluczowych.

Biorąc pod uwagę relacje, jakie zachodzą pomiędzy słowami kluczowymi, trzeba zaznaczyć, że są one najczęściej przeniesieniem relacji paradygmatycznych języko-wych i relacji pozajęzykojęzyko-wych w inną rzeczywistość, a mianowicie w rzeczywistość dokumentacyjną. Zagadnienia te doczekały się precyzyjniejszych rozstrzygnięć na gruncie teorii języków informacyjno-wyszukiwawczych. Akceptowane przez wszystkich podejście do zagadnienia relacji w językach wyszukiwaw-czych zaproponowała B. Bojar. Wyszła od stwierdzenia, że języki informacyjno--wyszukiwawcze są przeznaczone do zupełnie innego celu aniżeli języki naturalne.

Służą do indeksowania dokumentów i pytań informacyjnych, a desygnatami ich jed-nostek leksykalnych nie są określone wycinki rzeczywistości, lecz teksty dokumen-tów. Z tego wynika, że na przykład rozpatrując relacje generyczne, należy interpre-tować je nie dosłownie jako relacje między zakresami nazw, lecz jako relacje między zbiorami dokumentów zaindeksowanych za pomocą tych nazw. Tak więc relacje między zakresami nazw są wykorzystywane do oznaczania relacji między zbiora-mi dokumentów. Ta dokumentacyjna interpretacja relacji w językach informacyjno--wyszukiwawczych jest szczególnie przydatna przy rozpatrywaniu relacji między podstawowymi przedmiotami zainteresowań poszczególnych dziedzin a tymi

dzie-dzinami (Bojar 2005). Na wspomnianą dokumentacyjną interpretację relacji w języ-kach informacyjno-wyszukiwawczych powołują się w swoich pracach m.in. Olgierd Ungurian i Eugeniusz Ścibor.

Jak widać, semantyka języka słów kluczowych może się różnić od semantyki języka naturalnego, na którego słownictwie może być oparty słownik słów kluczo-wych. Nawet w przypadku identyczności zasobów leksykalnych mamy do czynienia z dwoma różnymi językami, gdyż elementom leksykalnym języka słów kluczowych przyporządkowuje się klasy dokumentów, w których charakterystykach wyszuki-wawczych wyrazy te występują. Pomiędzy jednostkami języka słów kluczowych a jednostkami języka naturalnego zachodzą też różnice w planie wyrażania:

1. słowa kluczowe mają tylko jedną formę – jeśli ma postać rzeczownika, to jest podana w mianowniku liczby pojedynczej lub mnogiej i nie jest odmieniana przez przypadki i liczby, co występuje na przykład w wyrazach języka polskiego będą-cych rzeczownikami;

2. wielowyrazowe słowa kluczowe stanowią nierozdzielną całość, nie podlegają po-działowi na wyrazy składowe (na przykład słowo kluczowe „biblioteka główna”

nie może być rozbite na wyrazy „biblioteka” i „główna”) i z punktu widzenia reguł gramatycznych języka słów kluczowych są traktowane tak samo jak każde inne słowo kluczowe. Zasób leksykalny języków słów kluczowych jest znacznie uboższy od zasobu leksykalnego języka naturalnego, z którego dany język czerpie swoje słownictwo, na przykład z języka polskiego; tylko bowiem niektóre wyra-żenia występujące w języku naturalnym są potrzebne do odtwarzania treści i for-my dokumentów w danym systemie wyszukiwawczym nawet wtedy, gdy system ten ma zakres uniwersalny, tj. obejmuje wszystkie dziedziny nauki i działalności praktycznej. Słowa kluczowe ograniczają się w zasadzie do informacji jednego rodzaju, a mianowicie metainformacji o treści dokumentu.

Aby język słów kluczowych mógł efektywnie pełnić swoje wyspecjalizowane funkcje, powinien odznaczać się określonymi cechami. W szczególności należy po-zbawić go synonimii i homonimii (wieloznaczności), charakterystycznych dla języka naturalnego, a przynajmniej wyeliminować negatywne skutki tych zjawisk.

W języku naturalnym, bazującym na kompetencji semantycznej człowieka, czę-sto brak formalnych wykładników wskazujących na rodzaje powiązań pomiędzy poszczególnymi elementami tego języka. Prowadzi to czasami do wieloznaczności w rodzaju wyrażenia: „starzy mężczyźni i kobiety”, mającego dwie różne możliwo-ści interpretacyjne. Innym rodzajem wieloznacznomożliwo-ści możliwej do wyeliminowania w językach słów kluczowych (na przykład poprzez wprowadzenie nawiasów) jest wieloznaczność wynikająca z braku ustalenia preferencji łączenia: na przykład wy-rażenie języka naturalnego „sód i potas lub cynk” może mieć w języku słów kluczo-wych przypisane dwie różne struktury. W języku naturalnym o poprawnym znacze-niu takich struktur wieloznacznych mówi kontekst, akcent lub wiedza pozajęzykowa – komputer (maszyna) takiej kompetencji nie ma (nie zawsze zresztą tę kompetencję ma człowiek). W systemie informacyjno-wyszukiwawczym nie wyszukujemy we-dług znaczeń wyrazów, lecz wewe-dług ich cech formalnych, tzn. kolejnych znaków tworzących daną jednostkę leksykalną.

Pole semantyczne języków naturalnych nie ma charakteru statycznego, bo tworzy się i rozwija w sposób żywiołowy (naturalny), natomiast pole semantyczne języka słów kluczowych może być sztuczne, tzn. budowane i modyﬁ kowane (projektowane) w sposób zorganizowany, a jakiekolwiek zmiany w tym języku mogą być wprowa-dzone tylko przez kompetentny organ. I jeszcze jedna istotna różnica: pole seman-tyczne języka słów kluczowych jest prezentowane tylko za pomocą rzeczowników i fraz rzeczownikowych, podczas gdy pole semantyczne języka naturalnego jest od-wzorowywane przez wyrażenia o różnych kategoriach gramatycznych.

Chociaż różnice pomiędzy polami semantycznymi języka słów kluczowych i ję-zyka naturalnego mają swoje konsekwencje w systemach paradygmatycznym i syn-tagmatycznym, to jednak pole semantyczne języka słów kluczowych powinno być modelowane na polu semantycznym języka naturalnego w tym sensie, że jego struk-tura powinna wykorzystywać w możliwie szerokim zakresie strukturę pola seman-tycznego języka naturalnego. Pozwoliłoby to użytkownikom systemu informacyjno--wyszukiwawczego, stosującym język słów kluczowych w procesie wyszukiwania, w pewnym stopniu wykorzystywać znajomość systemu języka naturalnego, co dzięki możliwości wyszukiwania asocjacyjnego uczyniłoby te systemy bardziej przyjazny-mi dla użytkownika.

1.4.3. Modelowanie języka słów kluczowych

W dokumencie KLUCZOWE SŁOWA (Stron 61-65)