• Nie Znaleziono Wyników

Słowa kluczowe w nauce o informacji

1.1. Pole znaczeniowe, czyli pojemność terminu „słowo kluczowe”

1.1.2. Słowa kluczowe w nauce o informacji

W nauce o informacji na podstawie literatury przedmiotu można wyróżnić trzy odmienne podejścia do słów kluczowych. W pierwszym z nich podkreśla się odrębność w stosunku do wyrażeń języka naturalnego i w tym celu wykorzystuje pojęcie systemu językowego. To system leksykalny sztucznego języka słów kluczowych stanowi kontekst słów kluczowych.

Drugie podejście akcentuje bezpośrednie związki integracyjne z językiem naturalnym.

Uważa się, że to język naturalny nadaje kontekst słowom kluczowym. Można wyróżnić również podejście, w którym to system leksykalny języka słów kluczowych stanowi kontekst poszczególnych słów kluczowych, zaś język naturalny (jego poszczególne podsystemy) uzupełnia deficyty tego kontekstu.

W polskim piśmiennictwie z zakresu nauki o informacji przeglądu definicji słowa

kluczowego jako pierwsza dokonała Jadwiga Choroszuszyna (przypis 53 Choroszuszyna 1970), twierdząc, że istnieje wiele definicji tego terminu oraz że jego zakres znaczeniowy nie jest jednoznacznie ustalony. Są autorzy, którzy ograniczają pojęcie słowa kluczowego do jednego wyrazu głównego, derywowanego z danego tekstu. Tak zdefiniowano słowo kluczowe w Słowniku terminologicznym informacji naukowej (przypis 54 Słownik

terminologiczny informacji naukowej 1979, s. 105 ), gdzie określono je jako „wyraz lub wyrażenie wybrane z tytułu lub tekstu dokumentu, charakteryzujące jego treść”.

Marguerite Fischer (1966), autorka amerykańska, identyfikowała słowo kluczowe z hasłem lub wyrazem głównym, które mogą być wzięte z tytułu, z analizy lub z tekstu i

zastosowane w indeksie. Josef Koblitz (przypis 55 Koblitz 1968 ), badacz niemiecki, określił słowo kluczowe jako „samodzielnie występujący wyraz języka fachowego, który w pierwszej fazie indeksowania, tzn. w fazie odtwarzania zawartości treściowej dokumentu, występuje w języku naturalnym”, utożsamiając słowo kluczowe z jednowyrazowym

terminem fachowym (przypis 56 Koblitz 1968 ), zaś Józef Robowski (1968), specjalista od języków informacyjno-wyszukiwawczych w Polsce, poprzez słowo kluczowe rozumiał terminy fachowe jednowyrazowe lub wielowyrazowe, zmieniając odpowiednio nazwy

„uniterm” i „słowo kluczowe” na „termin kluczowy”. Mikołaj Poletyło (1968) za słowa kluczowe uważał charakterystyczne dla danej dziedziny wyrażenia w postaci nazwy jednowyrazowej lub kilkuwyrazowej, zaś A. I. Czerny (1969) dokonał rozróżnienia na:

słowa kluczowe właściwe, czyli unitermy, oraz grupy wyrazowe lub frazy kluczowe, przy czym za słowa kluczowe przyjmował wyrazy o zwiększonej wartości informacyjnej i nie ograniczał ich do terminów fachowych. To tylko wybrane definicje słowa kluczowego.

Próbę określenia pola znaczeniowego terminu „słowo kluczowe” podjęła Jadwiga

Choroszuszyna na podstawie „Nachrichten für Dokumentation” (przypis 57 Nachrichten für Dokumentation 1968, nr 4, s. 144 ). Ustaleniem zasięgu znaczeniowego terminu „słowo kluczowe” zajmował się też Niemiecki Komitet Terminologii i Zagadnień Językowych przy Deutsche Gesellschaft für Dokumentation, który na podstawie przeprowadzonych badań opublikował w 1967 roku wyniki prac terminologicznych, inicjując jednocześnie w

„Nachrichten für Dokumentation” nr 8 z 1968 roku (s. 143-144) dyskusję na ten temat.

Przy opracowywaniu pola znaczeniowego tego terminu wzięto pod uwagę sformułowania związane ściśle z zakresem terminu „słowo kluczowe”, takie jak hasło, hasło

przedmiotowe oraz wyraz główny. Opracowano odpowiedni schemat graficzny, na którym przedstawiono hierarchię i powiązania funkcjonalne oraz formalne terminu „słowo

kluczowe” z terminami pokrewnymi, m.in. z hasłem przedmiotowym, z wyrazem głównym i z deskryptorem.

Str. 28

Choroszuszyna wykorzystała schemat opracowany przez ten Komitet, pokazując funkcjonalne i formalne powiązania terminu „słowo kluczowe” z terminami pokrewnymi (rys. 1).

Na schemacie zaznaczyła następujące pola znaczeniowe terminu „słowo kluczowe”:

A1. SŁOWO KLUCZOWE – Schlüsselwort – keyword – słowo do oznaczania zawartych w dokumencie pojęć;

B1. HASŁO PRZEDMIOTOWE – Schlagwort – subject heading – słowo kluczowe z funkcją porządkującą;

B.1.1. WYRAZ GŁÓWNY równa się HASŁO – Stichwort – clue word – hasło przedmiotowe wzięte bezpośrednio z dokumentu;

B.1.1.1. WYRAZ GŁÓWNY Z TYTUŁU równa się hasło tytułowe – Titelstichwort – wyraz główny wzięty z tytułu dokumentu;

B.1.1.2. WYRAZ GŁÓWNY Z TEKSTU równa się hasło tekstowe – Textstichwort – wyraz główny wzięty z tekstu;

C.1. HASŁO PRZEDMIOTOWE ZWIĄZANE – Gebundenes Schlagwort – hasło przedmiotowe pochodzące z obowiązującego wykazu haseł;

C.2. HASŁO PRZEDMIOTOWE SWOBODNE – Freies Schlagwort – open-ended term – hasło przedmiotowe niepochodzące z obowiązującego wykazu haseł;

SŁOWO INDEKSOWE – Registerwort – każde słowo zawarte w indeksie;

SŁOWO Z TEZAURUSA – Thesauruswort – każde słowo zawarte w tezaurusie;

D.1. DESKRYPTOR – Deskryptor – Descriptor – przyjęte jako hasło przedmiotowe słowo z tezaurusa z zaznaczeniem powiązań z innymi słowami z tezaurusa;

D.2. NIEDESKRYPTOR – Nicht-Deskryptor – non-descriptor – słowo z tezaurusa, którego użycie jako deskryptora jest zabronione;

D.3. NIESAMODZIELNE SŁOWO Z TEZAURUSA – Unselbständiges Thesauruswort – słowo z tezaurusa, którego użycie dozwolone jest tylko z jednym lub kilkoma słowami z tezaurusa.

Komentując ten schemat, zwracam uwagę, że słowa kluczowe różnią się pod względem formalnym i funkcjonalnym od deskryptorów i tematów w języku haseł przedmiotowych.

Nie są to więc pojęcia równoznaczne, chociaż wyrazy wybrane z tekstu jako słowa kluczowe mogą pełnić zarówno funkcję deskryptorów, jak i tematów. Słowa kluczowe wybiera się dla konkretnego jednostkowego dokumentu, tematy zaś tworzy się dla pewnej grupy dokumentów. Terminu „deskryptor” używa się na określenie wyrazów, które zostały wprowadzone jako obowiązujące do słownika, czyli tezaurusa. Mogą nimi być nie tylko terminy, lecz także wyrażenia naturalnego języka ogólnego. Tworzą zbiór znormalizowany zwany tezaurusem. Tak jak słowo kluczowe jest kwintesencją znaczeń słów w tekście i niesie treść tekstu, tak deskryptor odwzorowuje treść dziedziny o wyznaczonych

granicach. Zatem deskryptor jest słowem kluczowym w dziedzinie, a słowo kluczowe istnieje dzięki tekstowi. Słowa kluczowe, podobnie jak tematy w językach haseł

przedmiotowych, są nazwami wywoławczymi, symbolizującymi i przypominającymi dany dokument. Często jest to wyraz wyjęty z tytułu.

Str. 29

Rys. 1. Pole znaczeniowe terminu „słowo kluczowe” (źródło: „Nachrichten für Dokumentation” 1968, nr 4, s. 144, za: Choroszuszyna J. (1970): Metody i technika

wyboru słów kluczowych stosowane przy opracowywaniu indeksu KWOC do wydawnictwa

„Przegląd Piśmiennictwa Zagadnień Informacji”. [W:] Indeksy słów kluczowych i spisy bibliograficzne sporządzane maszynowo na przykładzie Indeksu KWOC do wydawnictwa

„Przegląd Piśmiennictwa Zagadnień Informacji”. Materiały pokonferencyjne. Warszawa, s.

51).

Str. 30

W indeksach KWIC [przypis 16] słowo kluczowe jest w zasadzie unitermem, a więc jednym wyrazem wziętym bezpośrednio z tytułu z zachowaniem nawet formy

gramatycznej, podczas gdy tematem mogą być wyrazy niewystępujące w danym tekście.

Są to tzw. hasła nadane. Warto zauważyć, że słowami kluczowymi nazywa się także jednostki leksykalne w językach syntagmatycznych, na przykład SYNTOL. Rozważania nad relacją słów kluczowych do innych paranaturalnych jednostek leksykalnych będę kontynuował w rozdziale 2.5.

Zdaniem Jadwigi Ćwiekowej można przyjąć, że: „Słowo kluczowe jest to zazwyczaj

wyrażenie rzeczownikowe, najczęściej jednowyrazowe, zaczerpnięte z tytułu lub z analizy dokumentacyjnej, charakteryzujące treść danego dokumentu w postaci nazwy tematu”

(przypis 58 Ćwiekowa 1988, s. 50 ). Wyrażanie treści dokumentu za pomocą tematów sugeruje pewien związek z językiem haseł przedmiotowych. Obecnie słowa kluczowe służą do wyrażania w różny sposób dowolnych, najczęściej najważniejszych elementów treści dokumentów relewantnych dla autora lub użytkownika, nie ograniczając się do ich prezentacji w postaci tematów. Słowa kluczowe są wykładnikami tych elementów treści dokumentu, które są relewantne dla autora lub użytkownika systemu.

Termin „słowo kluczowe” oznacza przede wszystkim słowo znaczące, czyli „wyraz języka

naturalnego o dużej wartości znaczeniowej dla określonej dziedziny wiedzy, pełniący funkcję semantyczną” (przypis 59 Słownik terminologiczny informacji naukowej 1979, s.

106), mający jeszcze tę wagę, że może być wykorzystywany do sporządzania indeksów.

Według cytowanego słownika słowo znaczące (ang. significant word) to termin szerszy od słowa kluczowego (ang. key word, keyword, keyterm, catchword). To ostatnie jest

zdefiniowane jako „wyraz lub wyrażenie wybrane z tytułu lub tekstu dokumentu

charakteryzujące jego treść” (przypis 60 Słownik terminologiczny informacji naukowej 1979, s. 106), bądź „treść zapytania informacyjnego”, jak dodaje Słownik encyklopedyczny terminologii języków i systemów informacyjno-wyszukiwawczych (przypis 61 Bojar , red.

1993, s. 138), i zarazem wyróżnia dodatkowe znaczenie, definiując słowo kluczowe jako

„elementarną jednostkę leksykalną języka słów kluczowych”.

Użycie terminu „słowo kluczowe” w kontekście wyszukiwania informacji (w roku 1948) przypisuje się amerykańskiemu matematykowi Calvinowi N. Mooersowi. Słowa kluczowe zostały też wykorzystane przez Mortimera Taubego w 1952 roku w systemie UNITERM.

Nadał on formalne reguły systemom leksykalnym przeznaczonym do wyszukiwania

dokumentów. Taube uważał, że zarówno treść dokumentu, jak i treść pytania użytkownika mogą z pełną dokładnością, zależnie od celów wyszukiwania, być przenoszone przez słowa kluczowe złożone jedynie z leksykalnych komponentów języka naturalnego (przypis 62

Frants, Shapiro, Voiskunskii 1997 ). Taube nazwał te słowa uniterms (unit; term), czyli jednostkami mającymi znaczenie terminologiczne, najlepiej odpowiadającymi zarówno treści dokumentu, jak i pytaniu użytkownika. Trochę później termin ten został zastąpiony przez wyrazy keywords i descriptor, określane jako słowa lub kombinacje słów zawarte w dokumencie, ekwiwalentne do pytania użytkownika.

Str. 31

Opracowany i udoskonalony przez Taubego i jego współpracowników system UNITERM był początkowo przeznaczony do selekcji ręcznej, potem maszynowej. W systemie tym opis dokumentu składał się z szeregu unitermów, które jako elementarne jednostki leksykalne nie ujawniały relacji między pojęciami.

Za cenną i wartą przytoczenia uważam definicję słowa kluczowego zamieszczoną w słowniku języka angielskiego The Oxford English Dictionary. Jedno ze znaczeń słowa kluczowego (ang. keyword) to: „wyraz lub przedmiot mające wielką wagę i znaczenie;

spec. w systemach wyszukiwania informacji (ang. information retrieval), zawierający informacyjne znaczenie, wyraz w tytule lub tekście dokumentu etc., wybierany jako

wskazujący główną zawartość dokumentu” (przypis 63 Simpson, Weiner 1989, ed . s. 406 ).

Niewątpliwą zaletą tego słownika są odsyłacze do źródeł informujących o tym, gdzie dany termin został po raz pierwszy zastosowany. I tak, w odniesieniu do słowa kluczowego – w znaczeniu terminu wyszukiwawczego słownik oksfordzki przytacza artykuł E.W.F. Tomlina, który ukazał się w czasopiśmie „The New Outline of Modern Knowledge” w 1956 roku.

Kolejnym źródłem jest artykuł N.S.M. Coxa i Michaela Grose’a zamieszczony w

„Organization in Bibliography Record by Computer” z 1967 roku. W 1971 roku, w czasopiśmie „New Scientist and Science Journal”, w artykule George’a Smitha i Jima Lyncha pt. Information by the yard słowo kluczowe zostało zdefiniowane jako termin przeznaczony do opisywania zawartości dokumentu tak ściśle i dokładnie, jak to tylko możliwe [przypis 17]. Potwierdza to moje wcześniejsze spostrzeżenie, że słowa kluczowe służą w zasadzie do wyrażania dowolnej treści (nie tylko dokumentu) relewantnej dla użytkownika w sposób zależny od jego potrzeb.

Uważam, że warto jeszcze odnotować definicję słowa kluczowego podaną w Le Grande dictionnaire terminologique de l’Office de la langue français, gdzie zdefiniowano je jako słowo lub grupę słów, wybrane z tytułu lub z tekstu dokumentu, charakteryzujące zawartość i pozwalające na wyszukanie tego dokumentu w systemie informacyjno-wyszukiwawczym i w bazach danych. Definicja ta lokuje słowo kluczowe w kontekście systemu wyszukiwania informacji.

Analizując różne definicje słowa kluczowego, odniosę się jeszcze do definicji

zamieszczonej w słynącym z dobrego poziomu ODLIS: Online Dictionary for Library and Information Science (http://lu.com/odlis/odlis_k.cfm), w którym słowo kluczowe

zdefiniowano jako słowo znaczące lub frazę (i tu wymienia się źródła słów kluczowych) użyte jako termin wyszukiwawczy w wyszukiwaniu pełnotekstowym, w celu wyszukania wszystkich rekordów zawierających to słowo [przypis 18]. Jest to wyrażenie (języka naturalnego) użyte w specjalnej funkcji, a mianowicie w funkcji metainformacyjnej (język indeksowania) lub w funkcji wyszukiwawczej (język wyszukiwawczy).

Str. 32

W piśmiennictwie polskim termin „słowo kluczowe” najpełniej zdefiniował Olgierd

Ungurian, podając, że jest to „wyraz lub wyrażenie (występujące w tekście lub nie), które zdaniem indeksatora w sposób najbardziej precyzyjny określa zawartość tekstu

dokumentu (jego treść, przedmioty, o których mowa), a także często cechy formalne dokumentu. Słowa kluczowe stanowią zazwyczaj zasób nazw języka naturalnego, które mogą być przydatne w procesach opracowania i wyszukiwania informacji, a zebrane w procesie indeksowania dokumentów” (przypis 64 Ungurian 1976, s. 186 ).

Przegląd definicji terminu „słowo kluczowe” kończę definicją opublikowaną w 1985 roku w normie ISO 5963, gdzie słowo kluczowe to „wyraz lub grupa wyrazów, możliwie

leksykograficznie ujednoliconych, wybranych z tytułu lub tekstu dokumentu

charakteryzujących jego zawartość i służących do jego wyszukiwania” [przypis 19]. Z definicje tej wynika, że za słowo kluczowe może być uznane każde wyrażenie (wyraz), wybrane z tytułu lub z tekstu dokumentu, wykorzystane do reprezentowania treści, lub dowolne wyrażenie z pytania informacyjnego.

We wszystkich poddanych analizie węższych lub szerszych definicjach terminu „słowo kluczowe”, powtarzają się pewne elementy, które są istotne dla tego pojęcia. Omawiam je w kolejności występowania:

1. Słowo kluczowe to wyraz lub połączenie wyrazowe, czyli wyrażenie języka.

2. Słowo kluczowe to wyraz lub grupa wyrazów o ustalonym konwencjonalnie znaczeniu, odpowiadającym pojęciu, z czego powinna wynikać ostrość granicy semantycznej, a więc jednoznaczność słowa kluczowego.

3. Słowo kluczowe należy do określonej dziedziny wiedzy lub działalności praktycznej.

Najczęściej wymienia się naukę i technikę.

4. Niektóre definicje podkreślają fakt nadawania wyrazom języka ogólnego specjalnych znaczeń. Nie precyzuje się jednak konstrukcji stanowiących połączenia wyrazowe, które są wyjątkowo częstym sposobem wzbogacania zasobu słów kluczowych.

5. W poszczególnych definicjach wymienia się zwykle takie funkcje słów kluczowych, jak funkcja etykietyzacji dokumentu/tekstu, funkcja imperatywna oraz funkcja klucza

wyszukiwawczego. Dzięki tym funkcjom stają się one środkiem dostępu do treści/zawartości dokumentu.

Analiza leksykalna przytoczonych definicji słowa kluczowego ujawniła, że w jednych opisuje się, jak „powstaje” słowo kluczowe, w innych określa się, jakie powinno ono być, a tylko w nielicznych autorzy próbują ustalić, czym jest słowo kluczowe i jakie są jego cechy.

Zazwyczaj wymienia się te same cechy, które powinien posiadać termin, co prowadzi do wniosku, że w przeważającej części słowo kluczowe to termin pełniący określoną rolę.

Str. 33

Słowami kluczowymi najczęściej są więc terminy, czyli wyrażenia o ściśle ustalonym znaczeniu w danej dziedzinie nauki lub techniki. Terminom stawia się przede wszystkim wymaganie dokładnego określania znaczenia oraz stałość. W zasadzie terminy nie powinny mieć synonimów, jednak w wyniku oddziaływania różnych czynników

zewnętrznych na język nauki, na wyrażenie tego samego przedmiotu lub pojęcia używa

się nieraz wielu terminów. W ten sposób synonimia staje się zjawiskiem właściwym także w stosunku do języków specjalistycznych, w tym specjalistycznej terminologii naukowej i technicznej. Z tego wynika, że słowo kluczowe jest terminem, ale termin nie musi być słowem kluczowym. W literaturze przedmiotu bardzo często utożsamia się słowa kluczowe z niekontrolowaną leksyką języków informacyjno-wyszukiwawczych.

Przytoczone definicje słowa kluczowego wskazują też, że termin ten występuje w dwóch znaczeniach, często niezbyt wyraźnie uświadamianych. W pierwszym znaczeniu – co jest widoczne w przeważającej liczbie definicji – za słowo kluczowe uważa się każde

wyrażenie (wyraz), wybrane z tytułu lub z tekstu dokumentu, wykorzystywane do odtwarzania (kodowania) treści, lub dowolne słowo z zapytania informacyjnego. W tym znaczeniu słowa kluczowe to wyrażenia języka naturalnego. W drugim znaczeniu, na co zwracają uwagę tylko nieliczne definicje, słowo kluczowe rozumiane jest jako jednostka leksykalna języka słów kluczowych, czyli języka sztucznego, rozumianego jako język, którego słownictwo tworzą wyrażenia zwane słowami kluczowymi, wybierane z tekstu dokumentu lub z treści pytania informacyjnego, ale przynajmniej w części lub w pełni kontrolowane, zaś gramatykę stanowią reguły indeksowania współrzędnego.

Słowo kluczowe, jako jednostka leksykalna języka słów kluczowych, powinno być z informacyjnego punktu widzenia słowem znaczącym, posiadać zdolność selekcyjną i spełniać przyjęte wymogi formalne. W języku polskim warunek ten spełniają rzeczowniki i przymiotniki w mianowniku liczby pojedynczej lub tzw. pluralia tantum, a nie spełniają go spójniki, zaimki oraz przyimki. Określenie, że są to słowa szczególnie ważne, może oznaczać zarówno ważność wewnętrzną, wyznaczoną przez miejsce, jakie pełni dane pojęcie w całokształcie aparatury pojęciowej tekstu, jak i ważność zewnętrzną – z punktu widzenia określonego odbiorcy tekstu. Zdarza się, że pewne zagadnienie uznane za drugoplanowe jest istotne (bardzo ważne) dla jakiegoś odbiorcy informacji. We współcześnie stosowanych językach słów kluczowych funkcję jednostki leksykalnej, zwanej słowem kluczowym, może pełnić zarówno pojedynczy rzeczownik, jak i fraza rzeczownikowa (na przykład „systemy o kontrolowanej jakości”).

Niezależnie od dziedziny i zakresu użycia w dalszej części niniejszego opracowania przyjąłem, że słowa kluczowe są rezultatem analizy treści dokumentu, stając się swoistego rodzaju reprezentantem treści dokumentu oraz jego etykietą. W stosowanej obecnie w Polsce terminologii języków informacyjno-wyszukiwawczych – jakkolwiek zauważa się to podwójne znaczenie – słowo kluczowe najczęściej jest definiowane wąsko, zgodnie z tradycyjnym ujęciem dokumentacyjnym, wywodzącym się jeszcze z początku lat pięćdziesiątych 20 wieku i z terminologii, która powstawała na użytek języków

unitermowych.

Str. 34

Słowa kluczowe definiuje się zwykle jako terminy jednowyrazowe lub wielowyrazowe, wybrane swobodnie, tj. bez posługiwania się jakimkolwiek normatywnym wykazem

terminów z tytułu lub z tekstu charakteryzowanego dokumentu. W istocie są to swobodne (niekontrolowane) słowa kluczowe. Są to więc wyrazy lub wyrażenia przejęte z języka naturalnego.