• Nie Znaleziono Wyników

Słowa kluczowe w nauce o informacji

W dokumencie KLUCZOWE SŁOWA (Stron 26-33)

1.1. Pole znaczeniowe, czyli pojemność terminu „słowo kluczowe”

1.1.2. Słowa kluczowe w nauce o informacji

W nauce o informacji na podstawie literatury przedmiotu można wyróżnić trzy od-mienne podejścia do słów kluczowych. W pierwszym z nich podkreśla się odrębność w stosunku do wyrażeń języka naturalnego i w tym celu wykorzystuje pojęcie systemu językowego. To system leksykalny sztucznego języka słów kluczowych stanowi kon-tekst słów kluczowych. Drugie podejście akcentuje bezpośrednie związki integracyjne z językiem naturalnym. Uważa się, że to język naturalny nadaje kontekst słowom klu-czowym. Można wyróżnić również podejście, w którym to system leksykalny języka słów kluczowych stanowi kontekst poszczególnych słów kluczowych, zaś język natu-ralny (jego poszczególne podsystemy) uzupełnia defi cyty tego kontekstu.

W polskim piśmiennictwie z zakresu nauki o informacji przeglądu defi nicji słowa kluczowego jako pierwsza dokonała Jadwiga Choroszuszyna (Choroszuszyna 1970), twierdząc, że istnieje wiele defi nicji tego terminu oraz że jego zakres znaczeniowy nie jest jednoznacznie ustalony. Są autorzy, którzy ograniczają pojęcie słowa kluczowe-go do jednekluczowe-go wyrazu głównekluczowe-go, derywowanekluczowe-go z danekluczowe-go tekstu. Tak zdefi niowano słowo kluczowe w Słowniku terminologicznym informacji naukowej (1979. s. 105), gdzie określono je jako „wyraz lub wyrażenie wybrane z tytułu lub tekstu dokumen-tu, charakteryzujące jego treść”. Marguerite Fischer (1966), autorka amerykańska, identyfi kowała słowo kluczowe z hasłem lub wyrazem głównym, które mogą być wzięte z tytułu, z analizy lub z tekstu i zastosowane w indeksie. Josef Koblitz (1968), badacz niemiecki, określił słowo kluczowe jako „samodzielnie występujący wyraz języka fachowego, który w pierwszej fazie indeksowania, tzn. w fazie odtwarzania zawartości treściowej dokumentu, występuje w języku naturalnym”, utożsamiając słowo kluczowe z jednowyrazowym terminem fachowym (Koblitz 1968), zaś Józef Robowski (1968), specjalista od języków informacyjno-wyszukiwawczych w Pol-sce, poprzez słowo kluczowe rozumiał terminy fachowe jedno- lub wielowyrazowe, zmieniając odpowiednio nazwy „uniterm” i „słowo kluczowe” na „termin kluczo-wy”. Mikołaj Poletyło (1968) za słowa kluczowe uważał charakterystyczne dla danej dziedziny wyrażenia w postaci nazwy jedno- lub kilkuwyrazowej, zaś A. I. Czerny (1969) dokonał rozróżnienia na: słowa kluczowe właściwe, czyli unitermy, oraz gru-py wyrazowe lub frazy kluczowe, przy czym za słowa kluczowe przyjmował wyrazy o zwiększonej wartości informacyjnej i nie ograniczał ich do terminów fachowych.

To tylko wybrane defi nicje słowa kluczowego.

Próbę określenia pola znaczeniowego terminu „słowo kluczowe” podjęła Jadwiga Choroszuszyna na podstawie „Nachrichten für Dokumentation” (1968, nr 4, s. 144).

Ustaleniem zasięgu znaczeniowego terminu „słowo kluczowe” zajmował się też Nie-miecki Komitet Terminologii i Zagadnień Językowych przy Deutsche Gesellschaft für Dokumentation, który na podstawie przeprowadzonych badań opublikował w 1967 roku wyniki prac terminologicznych, inicjując jednocześnie w „Nachrich-ten für Dokumentation” nr 8 z 1968 roku (s. 143–144) dyskusję na „Nachrich-ten temat. Przy opracowywaniu pola znaczeniowego tego terminu wzięto pod uwagę sformułowania związane ściśle z zakresem terminu „słowo kluczowe”, takie jak hasło, hasło przed-miotowe oraz wyraz główny. Opracowano odpowiedni schemat grafi czny, na którym

przedstawiono hierarchię i powiązania funkcjonalne oraz formalne terminu „słowo kluczowe” z terminami pokrewnymi, m.in. z hasłem przedmiotowym, z wyrazem głównym i z deskryptorem. Choroszuszyna wykorzystała schemat opracowany przez ten Komitet, pokazując funkcjonalne i formalne powiązania terminu „słowo kluczo-we” z terminami pokrewnymi (rys. 1).

Na schemacie zaznaczyła następujące pola znaczeniowe terminu „słowo kluczowe”:

A1. SŁOWO KLUCZOWE – Schlüsselwort – keyword – słowo do oznaczania za-wartych w dokumencie pojęć;

B1. HASŁO PRZEDMIOTOWE – Schlagwort – subject heading – słowo kluczowe z funkcją porządkującą;

B.1.1. WYRAZ GŁÓWNY = HASŁO – Stichwort – clue word – hasło przedmiotowe wzięte bezpośrednio z dokumentu;

B.1.1.1. WYRAZ GŁÓWNY Z TYTUŁU = hasło tytułowe – Titelstichwort – wyraz główny wzięty z tytułu dokumentu;

B.1.1.2. WYRAZ GŁÓWNY Z TEKSTU = hasło tekstowe – Textstichwort – wyraz główny wzięty z tekstu;

C.1. HASŁO PRZEDMIOTOWE ZWIĄZANE – Gebundenes Schlagwort – hasło przedmiotowe pochodzące z obowiązującego wykazu haseł;

C.2. HASŁO PRZEDMIOTOWE SWOBODNE – Freies Schlagwort – open ended term – hasło przedmiotowe niepochodzące z obowiązującego wykazu haseł;

SŁOWO INDEKSOWE – Registerwort – każde słowo zawarte w indeksie;

SŁOWO Z TEZAURUSA – Thesauruswort – każde słowo zawarte w tezaurusie;

D.1. DESKRYPTOR – Deskryptor – Descriptor – przyjęte jako hasło przedmiotowe słowo z tezaurusa z zaznaczeniem powiązań z innymi słowami z tezaurusa;

D.2. NIEDESKRYPTOR – Nicht-Deskryptor – non descriptor – słowo z tezaurusa, którego użycie jako deskryptora jest zabronione;

D.3. NIESAMODZIELNE SŁOWO Z TEZAURUSA – Unselbständiges Thesau-ruswort – słowo z tezaurusa, którego użycie dozwolone jest tylko z jednym lub kil-koma słowami z tezaurusa.

Komentując ten schemat, zwracam uwagę, że słowa kluczowe różnią się pod względem formalnym i funkcjonalnym od deskryptorów i tematów w języku haseł przedmiotowych. Nie są to więc pojęcia równoznaczne, chociaż wyrazy wybrane z tekstu jako słowa kluczowe mogą pełnić zarówno funkcję deskryptorów, jak i matów. Słowa kluczowe wybiera się dla konkretnego jednostkowego dokumentu, te-maty zaś tworzy się dla pewnej grupy dokumentów. Terminu „deskryptor” używa się na określenie wyrazów, które zostały wprowadzone jako obowiązujące do słownika, czyli tezaurusa. Mogą nimi być nie tylko terminy, lecz także wyrażenia naturalnego języka ogólnego. Tworzą zbiór znormalizowany zwany tezaurusem. Tak jak słowo kluczowe jest kwintesencją znaczeń słów w tekście i niesie treść tekstu, tak deskryp-tor odwzorowuje treść dziedziny o wyznaczonych granicach. Zatem deskrypdeskryp-tor jest słowem kluczowym w dziedzinie, a słowo kluczowe istnieje dzięki tekstowi. Słowa kluczowe, podobnie jak tematy w językach haseł przedmiotowych, są nazwami wy-woławczymi, symbolizującymi i przypominającymi dany dokument. Często jest to wyraz wyjęty z tytułu.

Rys. 1. Pole znaczeniowe terminu „słowo kluczowe” (źródło: „Nachrichten für Dokumentation” 1968, nr 4, s. 144). Za: Choroszuszyna 1970, s. 51.

W indeksach KWIC16 słowo kluczowe jest w zasadzie unitermem, a więc jednym wyrazem wziętym bezpośrednio z tytułu z zachowaniem nawet formy gramatycznej, podczas gdy tematem mogą być wyrazy niewystępujące w danym tekście. Są to tzw.

hasła nadane. Warto zauważyć, że słowami kluczowymi nazywa się także jednostki leksykalne w językach syntagmatycznych, na przykład SYNTOL. Rozważania nad re-lacją słów kluczowych do innych paranaturalnych jednostek leksykalnych będę konty-nuował w rozdziale 2.5.

Zdaniem Jadwigi Ćwiekowej można przyjąć, że: „S ł o w o k l u c z o w e jest to za-zwyczaj wyrażenie rzeczownikowe, najczęściej jednowyrazowe, zaczerpnięte z tytu-łu lub z analizy dokumentacyjnej, charakteryzujące treść danego dokumentu w posta-ci nazwy tematu” (Ćwiekowa 1988, s. 50). Wyrażanie treśposta-ci dokumentu za pomocą tematów sugeruje pewien związek z językiem haseł przedmiotowych. Obecnie słowa kluczowe służą do wyrażania w różny sposób dowolnych, najczęściej najważniej-szych elementów treści dokumentów relewantnych dla autora lub użytkownika, nie ograniczając się do ich prezentacji w postaci tematów. Słowa kluczowe są wykładni-kami tych elementów treści dokumentu, które są relewantne dla autora lub użytkow-nika systemu.

Termin „słowo kluczowe” oznacza przede wszystkim słowo znaczące, czyli „wy-raz języka naturalnego o dużej wartości znaczeniowej dla określonej dziedziny wie-dzy, pełniący funkcję semantyczną” (Słownik terminologiczny informacji naukowej 1979, s. 106), mający jeszcze tę wagę, że może być wykorzystywany do sporządzania indeksów. Według cytowanego słownika słowo znaczące (ang. signifi cant word) to termin szerszy od słowa kluczowego (ang. key word, keyword, keyterm, catchword).

To ostatnie jest zdefi niowane jako „wyraz lub wyrażenie wybrane z tytułu lub tekstu dokumentu charakteryzujące jego treść”(tamże), bądź „treść zapytania informacyj-nego”, jak dodaje Słownik encyklopedyczny terminologii języków i systemów infor-macyjno-wyszukiwawczych (Bojar, red. 1993, s. 138), i zarazem wyróżnia dodatkowe znaczenie, defi niując słowo kluczowe jako „elementarną jednostkę leksykalną języka słów kluczowych”.

Użycie terminu „słowo kluczowe” w kontekście wyszukiwania informacji (w roku 1948) przypisuje się amerykańskiemu matematykowi Calvinowi N. Mooersowi.

Słowa kluczowe zostały też wykorzystane przez Mortimera Taubego w 1952 roku w systemie UNITERM. Nadał on formalne reguły systemom leksykalnym przezna-czonym do wyszukiwania dokumentów. Taube uważał, że zarówno treść dokumentu, jak i treść pytania użytkownika mogą z pełną dokładnością, zależnie od celów wy-szukiwania, być przenoszone przez słowa kluczowe złożone jedynie z leksykalnych komponentów języka naturalnego (Frants, Shapiro, Voiskunskii 1997). Taube nazwał te słowa uniterms (unit; term), czyli jednostkami mającymi znaczenie terminologicz-ne, najlepiej odpowiadającymi zarówno treści dokumentu, jak i pytaniu użytkowni-ka. Trochę później termin ten został zastąpiony przez wyrazy keywords i descriptor, określane jako słowa lub kombinacje słów zawarte w dokumencie, ekwiwalentne do

16 Indeks KWIC (ang. Key Words in Context) to indeks, w którym wyrażenie pełniące funkcję hasła jest umieszczane w stałym miejscu w kontekście innych wyrażeń, opatrzone adresem dokumentu.

pytania użytkownika. Opracowany i udoskonalony przez Taubego i jego współpra-cowników system UNITERM był początkowo przeznaczony do selekcji ręcznej, po-tem maszynowej. W syspo-temie tym opis dokumentu składał się z szeregu unitermów, które jako elementarne jednostki leksykalne nie ujawniały relacji między pojęciami.

Za cenną i wartą przytoczenia uważam defi nicję słowa kluczowego zamieszczoną w słowniku języka angielskiego The Oxford English Dictionary. Jedno ze znaczeń słowa kluczowego (ang. keyword) to: „wyraz lub przedmiot mające wielką wagę i znaczenie; spec. w systemach wyszukiwania informacji (ang. information retrieval), zawierający informacyjne znaczenie, wyraz w tytule lub tekście dokumentu etc., wy-bierany jako wskazujący główną zawartość dokumentu” (Simpson, Weiner 1989, ed., s. 406). Niewątpliwą zaletą tego słownika są odsyłacze do źródeł informujących o tym, gdzie dany termin został po raz pierwszy zastosowany. I tak, w odniesieniu do słowa kluczowego – w znaczeniu terminu wyszukiwawczego słownik oksfordzki przytacza artykuł E.W.F. Tomlina, który ukazał się w czasopiśmie „The New Outline of Modern Knowledge” w 1956 roku. Kolejnym źródłem jest artykuł N.S.M. Coxa i Michaela Grose’a zamieszczony w „Organization in Bibliography Record by Computer” z 1967 roku. W 1971 roku, w czasopiśmie „New Scientist and Science Journal”, w artykule George’a Smitha i Jima Lyncha pt. Information by the yard słowo kluczowe zostało zdefi niowane jako termin przeznaczony do opisywania zawartości dokumentu tak ści-śle i dokładnie, jak to tylko możliwe17. Potwierdza to moje wcześniejsze spostrzeżenie, że słowa kluczowe służą w zasadzie do wyrażania dowolnej treści (nie tylko dokumen-tu) relewantnej dla użytkownika w sposób zależny od jego potrzeb.

Uważam, że warto jeszcze odnotować defi nicję słowa kluczowego podaną w Le Grande dictionnaire terminologique de l’Offi ce de la langue français, gdzie zdefi -niowano je jako słowo lub grupę słów, wybrane z tytułu lub z tekstu dokumentu, charakteryzujące zawartość i pozwalające na wyszukanie tego dokumentu w syste-mie informacyjno-wyszukiwawczym i w bazach danych. Defi nicja ta lokuje słowo kluczowe w kontekście systemu wyszukiwania informacji.

Analizując różne defi nicje słowa kluczowego, odniosę się jeszcze do defi nicji za-mieszczonej w słynącym z dobrego poziomu ODLIS: Online Dictionary for Library and Information Science (http://lu.com/odlis/odlis_k.cfm), w którym słowo kluczowe zdefi niowano jako słowo znaczące lub frazę (i tu wymienia się źródła słów kluczo-wych) użyte jako termin wyszukiwawczy w wyszukiwaniu pełnotekstowym, w celu wyszukania wszystkich rekordów zawierających to słowo18. Jest to wyrażenie

(języ-17 W artykule tym opisany został jeden z pierwszych eksperymentów nad zastosowaniem słów klu-czowych, który odbył się w latach 1967–1969, a przeprowadzony został przy pomocy systemu Chemical Titles (CT). Dziedzina, dla której zestawiono słownictwo, to zastosowanie mikroskopów elektronowych.

W tym czasie była to stosunkowo wąska specjalność i zarazem dobrze opracowana. Początkowo uzyskano rezultaty niezadowalające z powodu zbyt wielu odrzuconych terminów. Po wprowadzeniu zmian udało się jednak osiągnąć dziewięćdziesięcioprocentową relewancję, co uznano za wielki sukces, ponieważ większość wyników innych badań sytuowała się w przedziale od 40 do 60% relewancji. Jako przykład podobnego projektu autorzy podają eksperyment przeprowadzony w laboratorium komputerowym Uni-wersytetu w Newcastle, który dotyczył systemu MEDLARS Data i zawierał próbkę 40 tysięcy artykułów.

18 Komputerowy słownik ODLIS: Online Dictionary for Library and Information Science podaje następującą defi nicję: “A signifi cant word or phrase in the title, subject headings (descriptors), contents note,

ka naturalnego) użyte w specjalnej funkcji, a mianowicie w funkcji metainformacyj-nej (język indeksowania) lub w funkcji wyszukiwawczej (język wyszukiwawczy).

W piśmiennictwie polskim termin „słowo kluczowe” najpełniej zdefi niował Ol-gierd Ungurian, podając, że jest to „wyraz lub wyrażenie (występujące w tekście lub nie), które zdaniem indeksatora w sposób najbardziej precyzyjny określa zawartość tekstu dokumentu (jego treść, przedmioty, o których mowa), a także często cechy formalne dokumentu. Słowa kluczowe stanowią zazwyczaj zasób nazw języka natu-ralnego, które mogą być przydatne w procesach opracowania i wyszukiwania infor-macji, a zebrane w procesie indeksowania dokumentów” (Ungurian 1976, s. 186).

Przegląd defi nicji terminu „słowo kluczowe” kończę defi nicją opublikowaną w 1985 roku w normie ISO 5963, gdzie słowo kluczowe to „wyraz lub grupa wy-razów, możliwie leksykografi cznie ujednoliconych, wybranych z tytułu lub tekstu dokumentu charakteryzujących jego zawartość i służących do jego wyszukiwania”19. Z defi nicje tej wynika, że za słowo kluczowe może być uznane każde wyrażenie (wyraz), wybrane z tytułu lub z tekstu dokumentu, wykorzystane do reprezentowania treści, lub dowolne wyrażenie z pytania informacyjnego.

We wszystkich poddanych analizie węższych lub szerszych defi nicjach terminu

„słowo kluczowe”, powtarzają się pewne elementy, które są istotne dla tego pojęcia.

Omawiam je w kolejności występowania:

1. Słowo kluczowe to w y r a z lub p o ł ą c z e n i e w y r a z o w e, czyli wyrażenie języka.

2. Słowo kluczowe to wyraz lub grupa wyrazów o u s t a l o n y m konwencjonalnie znaczeniu, odpowiadającym pojęciu, z czego powinna wynikać ostrość granicy semantycznej, a więc jednoznaczność słowa kluczowego.

3. Słowo kluczowe należy do o k r e ś l o n e j dziedziny wiedzy lub działalności prak-tycznej. Najczęściej wymienia się naukę i technikę.

4. Niektóre defi nicje podkreślają fakt nadawania wyrazom języka ogólnego specjalnych znaczeń. Nie precyzuje się jednak konstrukcji stanowiących połączenia wyrazowe, które są wyjątkowo częstym sposobem wzbogacania zasobu słów kluczowych.

5. W poszczególnych defi nicjach wymienia się zwykle takie funkcje słów kluczo-wych, jak funkcja etykietyzacji dokumentu/tekstu, funkcja imperatywna oraz funkcja klucza wyszukiwawczego. Dzięki tym funkcjom stają się one środkiem dostępu do treści/zawartości dokumentu.

Analiza leksykalna przytoczonych defi nicji słowa kluczowego ujawniła, że w jed-nych opisuje się, jak „powstaje” słowo kluczowe, w injed-nych określa się, jakie powin-no opowin-no być, a tylko w nielicznych autorzy próbują ustalić, czym jest słowo kluczowe i jakie są jego cechy. Zazwyczaj wymienia się te same cechy, które powinien

posia-abstract, or text of a record in an online catalog or bibliographic database that can be used as a search term in a free-text search to retrieve all the records containing it. See also: stopword”. Lista słów kluczowych (keyword index) to: “A type of subject index in which signifi cant words, usually from the titles of the works indexed, are used as headings. When a string of keywords is rotated, such an index is said to be permuted.

See also: KWAC, KWIC and KWOC” (http://lu.com/odlis/odlis_k.cfm).

19 A keyword(s) is “a word or group of words, possibly in lexicographically standardized form, taken out of a title or of the text of a document characterizing its content and enabling its retrieval” (ISO 5963:

1985).

dać termin, co prowadzi do wniosku, że w przeważającej części słowo kluczowe to termin pełniący określoną rolę. Słowami kluczowymi najczęściej są więc terminy, czyli wyrażenia o ściśle ustalonym znaczeniu w danej dziedzinie nauki lub techniki.

Terminom stawia się przede wszystkim wymaganie dokładnego określania znaczenia oraz stałość. W zasadzie terminy nie powinny mieć synonimów, jednak w wyniku oddziaływania różnych czynników zewnętrznych na język nauki, na wyrażenie tego samego przedmiotu lub pojęcia używa się nieraz wielu terminów. W ten sposób sy-nonimia staje się zjawiskiem właściwym także w stosunku do języków specjalistycz-nych, w tym specjalistycznej terminologii naukowej i technicznej. Z tego wynika, że słowo kluczowe jest terminem, ale termin nie musi być słowem kluczowym. W lite-raturze przedmiotu bardzo często utożsamia się słowa kluczowe z niekontrolowaną leksyką języków informacyjno-wyszukiwawczych.

Przytoczone defi nicje słowa kluczowego wskazują też, że termin ten występu-je w dwóch znaczeniach, często niezbyt wyraźnie uświadamianych. W pierwszym znaczeniu – co jest widoczne w przeważającej liczbie defi nicji – za słowo kluczowe uważa się każde wyrażenie (wyraz), wybrane z tytułu lub z tekstu dokumentu, wy-korzystywane do odtwarzania (kodowania) treści, lub dowolne słowo z zapytania informacyjnego. W tym znaczeniu słowa kluczowe to wyrażenia języka naturalnego.

W drugim znaczeniu, na co zwracają uwagę tylko nieliczne defi nicje, słowo kluczo-we rozumiane jest jako jednostka leksykalna języka słów kluczowych, czyli języka sztucznego, rozumianego jako język, którego słownictwo tworzą wyrażenia zwane słowami kluczowymi, wybierane z tekstu dokumentu lub z treści pytania informacyj-nego, ale przynajmniej w części lub w pełni kontrolowane, zaś gramatykę stanowią reguły indeksowania współrzędnego.

Słowo kluczowe, jako jednostka leksykalna języka słów kluczowych, powinno być z informacyjnego punktu widzenia słowem znaczącym, posiadać zdolność se-lekcyjną i spełniać przyjęte wymogi formalne. W języku polskim warunek ten speł-niają rzeczowniki i przymiotniki w mianowniku liczby pojedynczej lub tzw. pluralia tantum, a nie spełniają go spójniki, zaimki oraz przyimki. Określenie, że są to sło-wa szczególnie sło-ważne, może oznaczać zarówno sło-ważność wewnętrzną, wyznaczoną przez miejsce, jakie pełni dane pojęcie w całokształcie aparatury pojęciowej tekstu, jak i ważność zewnętrzną – z punktu widzenia określonego odbiorcy tekstu. Zdarza się, że pewne zagadnienie uznane za drugoplanowe jest istotne (bardzo ważne) dla jakiegoś odbiorcy informacji. We współcześnie stosowanych językach słów kluczo-wych funkcję jednostki leksykalnej, zwanej słowem kluczowym, może pełnić za-równo pojedynczy rzeczownik, jak i fraza rzeczownikowa (na przykład „systemy o kontrolowanej jakości”).

Niezależnie od dziedziny i zakresu użycia w dalszej części niniejszego opraco-wania przyjąłem, że słowa kluczowe są rezultatem analizy treści dokumentu, stając się swoistego rodzaju reprezentantem treści dokumentu oraz jego etykietą. W sto-sowanej obecnie w Polsce terminologii języków informacyjno-wyszukiwawczych – jakkolwiek zauważa się to podwójne znaczenie – słowo kluczowe najczęściej jest defi niowane wąsko, zgodnie z tradycyjnym ujęciem dokumentacyjnym,

wywodzą-cym się jeszcze z początku lat pięćdziesiątych XX wieku i z terminologii, która po-wstawała na użytek języków unitermowych.

Słowa kluczowe defi niuje się zwykle jako terminy jedno- lub wielowyrazowe, wybrane swobodnie, tj. bez posługiwania się jakimkolwiek normatywnym wykazem terminów z tytułu lub z tekstu charakteryzowanego dokumentu. W istocie są to swo-bodne (niekontrolowane) słowa kluczowe. Są to więc wyrazy lub wyrażenia przejęte z języka naturalnego.

W dokumencie KLUCZOWE SŁOWA (Stron 26-33)

Outline

Powiązane dokumenty