Język słów kluczowych a język haseł przedmiotowych

2.6. Klasyczny język słów kluczowych a inne języki paranaturalne

2.6.2. Język słów kluczowych a język haseł przedmiotowych

Języki słów kluczowych wykazują wiele podobieństw do języków haseł przedmiotowych.

Również ich słownictwo składa się z paranaturalnych elementarnych jednostek

leksykalnych, a w wykazach (słownikach) słów kluczowych przeważa uporządkowanie alfabetyczne. Języki te jednak różnią się od języków haseł przedmiotowych przede

wszystkim statusem jednostek leksykalnych. Języki słów kluczowych mają tylko jednostki autosyntaktyczne [przypis 95], zaś języki haseł przedmiotowych mają jednostki leksykalne

o zróżnicowanym statusie: tematy jako autosyntaktyczne jednostki leksykalne oraz określniki jako synsyntaktyczne jednostki leksykalne. Zróżnicowany status jednostek leksykalnych związany jest z gramatyką pozycyjną tych języków.

W miarę rozwoju języków słów kluczowych coraz bardziej widoczne są analogie między niektórymi elementami ich struktury. Na przykład istnieją podobieństwa pomiędzy

relacjami w języku słów kluczowych a odsyłaczami w języku haseł przedmiotowych, między tematem a słowem kluczowym, między słownikiem języka haseł przedmiotowych a słownikiem słów kluczowych [przypis 96]. Języki słów kluczowych mają strukturę prostszą od języków haseł przedmiotowych i języków deskryptorowych.

Str. 118

Istotnymi cechami języków słów kluczowych jest współrzędność elementarnych jednostek języka – słów kluczowych w procesie tworzenia zdań i tekstów w tych językach, oraz koordynacja słów kluczowych dopiero w procesie wyszukiwania informacji, a więc

odwrotnie niż w językach haseł przedmiotowych. Języki słów kluczowych różni od języków haseł przedmiotowych przede wszystkim inna „filozofia” [przypis 97] – języki haseł

przedmiotowych odwzorowują tematy dokumentów, ich ważność w dokumencie i sposób ujęcia, a języki słów kluczowych nie mają tych funkcji. Języki słów kluczowych

odwzorowują elementy treści dokumentów bez ich kategoryzacji i wartościowania.

W odróżnieniu od języka deskryptorowego, języki słów kluczowych z definicji nie

prezentują leksyki w postaci pełnego (normatywnego) słownika w odróżnieniu od języków haseł przedmiotowych – nie stosują kwalifikacji jednostek leksykalnych na samodzielne i niesamodzielne, bo nie ma w nich takiego rozróżnienia – wszystkie są autosyntaktyczne.

Na tle zasygnalizowanych tu odmienności języki słów kluczowych jawią się jako najmniej sformalizowane.

3 asteryski

Celem tej części rozprawy było przedstawienie modelu klasycznego języka słów kluczowych, jego leksyki, gramatyki oraz metod przejmowania słownictwa z języka naturalnego. Starałem się wyodrębnić zbiór cech dystynktywnych tego języka,

określających w sumie jego tożsamość. Studium piśmiennictwa dotyczącego języków słów kluczowych pozwoliło mi zauważyć, że w teorii języków informacyjno-wyszukiwawczych w wielu przypadkach nie ma jednoznacznych rozstrzygnięć, akceptowanych przez

wszystkich specjalistów. Świadczy to o tym, że zarówno te języki, jak i ich teoria rozwijają się i stale poszukują nowych rozwiązań. Postęp w tej dziedzinie polega nie tyle na

osiąganiu niekwestionowanych rozstrzygnięć, ile na dostrzeganiu coraz to nowych

uwarunkowań i powiązań, czyli na uświadamianiu sobie coraz bardziej bogactwa i złożoności badanych języków. Właśnie propozycje różnych rozwiązań tych problemów pomagają dokładniej zdać sobie sprawę z funkcji, jakie pełnią słowa kluczowe w procesach indeksowania i wyszukiwania informacji. Wyodrębniony zbiór tzw. cech

konstytutywnych języka słów kluczowych, chociaż z natury rzeczy niekompletny, pozwala jednak na stworzenie spójnego obrazu tego języka, definiując w ten sposób tożsamość i

„granice” klasycznego języka słów kluczowych.

Str. 119

Warto zauważyć, że w klasycznych językach słów kluczowych priorytetowo traktuje się zasób leksykalny, który służy przede wszystkim do identyfikacji elementów treści dokumentów/pytań informacyjnych, z jednoczesnym pomniejszeniem i/lub

nieuwzględnieniem jego roli w odwzorowywaniu relacji semantycznych pomiędzy

obiektami odwzorowywanej rzeczywistości dokumentacyjnej. Języki słów kluczowych w odmianie języków swobodnych słów kluczowych stanowią więc zredukowaną do potrzeb optymalizacji procesów informacyjnych odmianę języka naturalnego. Model struktury wiedzy stosowany w klasycznych językach słów kluczowych odwołuje się do systemu poznawczego człowieka. W języku tym w ogóle nie definiuje się znaczenia słów kluczowych.

Naturalnie w języku kontrolowanych słów kluczowych istnieje pewnego rodzaju umowność znaczeniowa słów kluczowych. Jest ona jednak względna, ale sprawia wrażenie ścisłego podobieństwa słów kluczowych w warstwie semantycznej do wyrażeń języków

naturalnych. Niewątpliwie słowa kluczowe jako jednostki leksykalne klasycznego języka słów kluczowych należy uznać za jednostki leksykalne języka naturalnego. Języki słów kluczowych mogą być też tworem sztucznym ze wszystkimi płynącymi z tego

konsekwencjami. Niemniej nawet jako języki sztuczne mają jednostki leksykalne, które są równokształtne z wyrażeniami języka naturalnego. Specyfika tego języka polega więc na tym, że wprawdzie odwołuje się on – chociaż w różny sposób – do znajomości słów w języku naturalnym, lecz – jak żaden język naturalny – łączy je w teksty tylko na zasadzie konkatenacji. Stąd teksty w języku słów kluczowych odbiegają od wzorców tekstów w języku naturalnym.

Podsumowując rozważania nad tożsamością klasycznego języka słów kluczowych, przyjmuję, że „język słów kluczowych to język informacyjno-wyszukiwawczy o notacji paranaturalnej, bez wyraźnie określonej w słowniku paradygmatyki, w których jednostki słownika nazywane są słowami kluczowymi, a na gramatykę składają się reguły

indeksowania współrzędnego” (przypis 139 Bojar 2002, oprac., s. 111). Najszerzej ujmuje się język słów kluczowych, określając go jako język informacyjny o słownictwie

paranaturalnym i tzw. gramatyce zerowej, równoznacznej z indeksowaniem

współrzędnym, polegającym na charakteryzowaniu złożonej treści dokumentu przez koordynację współrzędnych, dających się swobodnie zestawiać elementarnych jednostek leksykalnych. Słownikiem języka kontrolowanych słów kluczowych jest uporządkowany alfabetycznie wykaz słów kluczowych wybranych z tekstów dokumentów, który nigdy nie jest zamknięty i w zasadzie nie są w nim wyrażane relacje między słowami kluczowymi, które stanowią elementarne jednostki leksykalne języka słów kluczowych. Języki słów kluczowych często wykorzystują słowniki negatywne, tzw. stop-listy, tj. słowniki

wskazujące wyrażenia języka naturalnego, których nie wolno używać przy indeksowaniu, podczas gdy pozostałe wyrazy występujące w indeksowanych tekstach są akceptowane jako słowa kluczowe.

Zapoczątkowane w latach pięćdziesiątych 20 wieku wykorzystanie technologii komputerowej do gromadzenia i przetwarzania informacji tekstowej z jednej strony

doprowadziło do modyfikacji tradycyjnych typów języków informacyjno-wyszukiwawczych (języków haseł przedmiotowych i klasyfikacji biblioteczno-bibliograficznych), z drugiej zaś strony do zbudowania nowych modeli tych języków, czego przykładem są języki słów kluczowych oraz języki deskryptorowe.

Str. 120

Do tej pory nurty te wzajemnie się przenikają, co uwidacznia się w ewolucji m.in.

słowników tych języków. Rozwój języków słów kluczowych, głównie ich słowników,

stosowanie elementów hierarchii, klasyfikacji i kategorii oraz fasetowość spowodowały, że trudno jest nadal opowiadać się za jednolitością tych języków.

W rozdziale tym zajmowałem się językiem słów kluczowych w ogóle, a nie konkretnymi językami słów kluczowych. O tym będzie mowa w następnej, ostatniej części rozprawy.

Zajmę się w niej językami słów kluczowych konkretnych systemów informacyjno-wyszukiwawczych.

Str. 121

Część trzecia. Słowa kluczowe w systemach wyszukiwania informacji

W tej części pracy zamierzam opisać, jak wyglądają praktyczne realizacje (implementacje) języka słów kluczowych, w tym jakie są różnice między rzeczywiście istniejącymi językami

słów kluczowych stosowanymi we współczesnych systemach

informacyjno-wyszukiwawczych a omówionym w poprzedniej części modelem klasycznego języka słów kluczowych. Ma to na celu pokazanie, jak w omawianych językach słów kluczowych, zwłaszcza w ich słownikach, zdefiniowano ich tożsamość, w tym jak określano (i

poszerzano) granice języka, czerpiąc wzory z języka naturalnego oraz z innych języków paranaturalnych. Uczyniłem też szereg odniesień do problemów pragmatycznych w dotychczasowych i nowych obszarach zastosowań języków słów kluczowych, jakimi są systemy WWW.

W dokumencie Za oryginałem zostały pominięte strony (Stron 132-136)