2.6. Klasyczny język słów kluczowych a inne języki paranaturalne
2.6.2. Język słów kluczowych a język haseł przedmiotowych
Języki słów kluczowych wykazują wiele podobieństw do języków haseł przedmiotowych.
Również ich słownictwo składa się z paranaturalnych elementarnych jednostek
leksykalnych, a w wykazach (słownikach) słów kluczowych przeważa uporządkowanie alfabetyczne. Języki te jednak różnią się od języków haseł przedmiotowych przede
wszystkim statusem jednostek leksykalnych. Języki słów kluczowych mają tylko jednostki autosyntaktyczne [przypis 95], zaś języki haseł przedmiotowych mają jednostki leksykalne
o zróżnicowanym statusie: tematy jako autosyntaktyczne jednostki leksykalne oraz określniki jako synsyntaktyczne jednostki leksykalne. Zróżnicowany status jednostek leksykalnych związany jest z gramatyką pozycyjną tych języków.
W miarę rozwoju języków słów kluczowych coraz bardziej widoczne są analogie między niektórymi elementami ich struktury. Na przykład istnieją podobieństwa pomiędzy
relacjami w języku słów kluczowych a odsyłaczami w języku haseł przedmiotowych, między tematem a słowem kluczowym, między słownikiem języka haseł przedmiotowych a słownikiem słów kluczowych [przypis 96]. Języki słów kluczowych mają strukturę prostszą od języków haseł przedmiotowych i języków deskryptorowych.
Str. 118
Istotnymi cechami języków słów kluczowych jest współrzędność elementarnych jednostek języka – słów kluczowych w procesie tworzenia zdań i tekstów w tych językach, oraz koordynacja słów kluczowych dopiero w procesie wyszukiwania informacji, a więc
odwrotnie niż w językach haseł przedmiotowych. Języki słów kluczowych różni od języków haseł przedmiotowych przede wszystkim inna „filozofia” [przypis 97] – języki haseł
przedmiotowych odwzorowują tematy dokumentów, ich ważność w dokumencie i sposób ujęcia, a języki słów kluczowych nie mają tych funkcji. Języki słów kluczowych
odwzorowują elementy treści dokumentów bez ich kategoryzacji i wartościowania.
W odróżnieniu od języka deskryptorowego, języki słów kluczowych z definicji nie
prezentują leksyki w postaci pełnego (normatywnego) słownika w odróżnieniu od języków haseł przedmiotowych – nie stosują kwalifikacji jednostek leksykalnych na samodzielne i niesamodzielne, bo nie ma w nich takiego rozróżnienia – wszystkie są autosyntaktyczne.
Na tle zasygnalizowanych tu odmienności języki słów kluczowych jawią się jako najmniej sformalizowane.
3 asteryski
Celem tej części rozprawy było przedstawienie modelu klasycznego języka słów kluczowych, jego leksyki, gramatyki oraz metod przejmowania słownictwa z języka naturalnego. Starałem się wyodrębnić zbiór cech dystynktywnych tego języka,
określających w sumie jego tożsamość. Studium piśmiennictwa dotyczącego języków słów kluczowych pozwoliło mi zauważyć, że w teorii języków informacyjno-wyszukiwawczych w wielu przypadkach nie ma jednoznacznych rozstrzygnięć, akceptowanych przez
wszystkich specjalistów. Świadczy to o tym, że zarówno te języki, jak i ich teoria rozwijają się i stale poszukują nowych rozwiązań. Postęp w tej dziedzinie polega nie tyle na
osiąganiu niekwestionowanych rozstrzygnięć, ile na dostrzeganiu coraz to nowych
uwarunkowań i powiązań, czyli na uświadamianiu sobie coraz bardziej bogactwa i złożoności badanych języków. Właśnie propozycje różnych rozwiązań tych problemów pomagają dokładniej zdać sobie sprawę z funkcji, jakie pełnią słowa kluczowe w procesach indeksowania i wyszukiwania informacji. Wyodrębniony zbiór tzw. cech
konstytutywnych języka słów kluczowych, chociaż z natury rzeczy niekompletny, pozwala jednak na stworzenie spójnego obrazu tego języka, definiując w ten sposób tożsamość i
„granice” klasycznego języka słów kluczowych.
Str. 119
Warto zauważyć, że w klasycznych językach słów kluczowych priorytetowo traktuje się zasób leksykalny, który służy przede wszystkim do identyfikacji elementów treści dokumentów/pytań informacyjnych, z jednoczesnym pomniejszeniem i/lub
nieuwzględnieniem jego roli w odwzorowywaniu relacji semantycznych pomiędzy
obiektami odwzorowywanej rzeczywistości dokumentacyjnej. Języki słów kluczowych w odmianie języków swobodnych słów kluczowych stanowią więc zredukowaną do potrzeb optymalizacji procesów informacyjnych odmianę języka naturalnego. Model struktury wiedzy stosowany w klasycznych językach słów kluczowych odwołuje się do systemu poznawczego człowieka. W języku tym w ogóle nie definiuje się znaczenia słów kluczowych.
Naturalnie w języku kontrolowanych słów kluczowych istnieje pewnego rodzaju umowność znaczeniowa słów kluczowych. Jest ona jednak względna, ale sprawia wrażenie ścisłego podobieństwa słów kluczowych w warstwie semantycznej do wyrażeń języków
naturalnych. Niewątpliwie słowa kluczowe jako jednostki leksykalne klasycznego języka słów kluczowych należy uznać za jednostki leksykalne języka naturalnego. Języki słów kluczowych mogą być też tworem sztucznym ze wszystkimi płynącymi z tego
konsekwencjami. Niemniej nawet jako języki sztuczne mają jednostki leksykalne, które są równokształtne z wyrażeniami języka naturalnego. Specyfika tego języka polega więc na tym, że wprawdzie odwołuje się on – chociaż w różny sposób – do znajomości słów w języku naturalnym, lecz – jak żaden język naturalny – łączy je w teksty tylko na zasadzie konkatenacji. Stąd teksty w języku słów kluczowych odbiegają od wzorców tekstów w języku naturalnym.
Podsumowując rozważania nad tożsamością klasycznego języka słów kluczowych, przyjmuję, że „język słów kluczowych to język informacyjno-wyszukiwawczy o notacji paranaturalnej, bez wyraźnie określonej w słowniku paradygmatyki, w których jednostki słownika nazywane są słowami kluczowymi, a na gramatykę składają się reguły
indeksowania współrzędnego” (przypis 139 Bojar 2002, oprac., s. 111). Najszerzej ujmuje się język słów kluczowych, określając go jako język informacyjny o słownictwie
paranaturalnym i tzw. gramatyce zerowej, równoznacznej z indeksowaniem
współrzędnym, polegającym na charakteryzowaniu złożonej treści dokumentu przez koordynację współrzędnych, dających się swobodnie zestawiać elementarnych jednostek leksykalnych. Słownikiem języka kontrolowanych słów kluczowych jest uporządkowany alfabetycznie wykaz słów kluczowych wybranych z tekstów dokumentów, który nigdy nie jest zamknięty i w zasadzie nie są w nim wyrażane relacje między słowami kluczowymi, które stanowią elementarne jednostki leksykalne języka słów kluczowych. Języki słów kluczowych często wykorzystują słowniki negatywne, tzw. stop-listy, tj. słowniki
wskazujące wyrażenia języka naturalnego, których nie wolno używać przy indeksowaniu, podczas gdy pozostałe wyrazy występujące w indeksowanych tekstach są akceptowane jako słowa kluczowe.
Zapoczątkowane w latach pięćdziesiątych 20 wieku wykorzystanie technologii komputerowej do gromadzenia i przetwarzania informacji tekstowej z jednej strony
doprowadziło do modyfikacji tradycyjnych typów języków informacyjno-wyszukiwawczych (języków haseł przedmiotowych i klasyfikacji biblioteczno-bibliograficznych), z drugiej zaś strony do zbudowania nowych modeli tych języków, czego przykładem są języki słów kluczowych oraz języki deskryptorowe.
Str. 120
Do tej pory nurty te wzajemnie się przenikają, co uwidacznia się w ewolucji m.in.
słowników tych języków. Rozwój języków słów kluczowych, głównie ich słowników,
stosowanie elementów hierarchii, klasyfikacji i kategorii oraz fasetowość spowodowały, że trudno jest nadal opowiadać się za jednolitością tych języków.
W rozdziale tym zajmowałem się językiem słów kluczowych w ogóle, a nie konkretnymi językami słów kluczowych. O tym będzie mowa w następnej, ostatniej części rozprawy.
Zajmę się w niej językami słów kluczowych konkretnych systemów informacyjno-wyszukiwawczych.
Str. 121
Część trzecia. Słowa kluczowe w systemach wyszukiwania informacji
W tej części pracy zamierzam opisać, jak wyglądają praktyczne realizacje (implementacje) języka słów kluczowych, w tym jakie są różnice między rzeczywiście istniejącymi językami
słów kluczowych stosowanymi we współczesnych systemach
informacyjno-wyszukiwawczych a omówionym w poprzedniej części modelem klasycznego języka słów kluczowych. Ma to na celu pokazanie, jak w omawianych językach słów kluczowych, zwłaszcza w ich słownikach, zdefiniowano ich tożsamość, w tym jak określano (i
poszerzano) granice języka, czerpiąc wzory z języka naturalnego oraz z innych języków paranaturalnych. Uczyniłem też szereg odniesień do problemów pragmatycznych w dotychczasowych i nowych obszarach zastosowań języków słów kluczowych, jakimi są systemy WWW.