• Nie Znaleziono Wyników

Klasyczny język słów kluczowych a słowa kluczowe w systemie WWW

W dokumencie Za oryginałem zostały pominięte strony (Stron 183-186)

DIALEKTY POLSKIE Dialekty polskie

B. PREPARATION AND PROCESSING chemical synthesis

3.1.3.2. Klasyczny język słów kluczowych a słowa kluczowe w systemie WWW

Wykorzystanie języka słów kluczowych w Internecie polega na generowaniu za pomocą tego języka struktur ahierarchicznych, w których słowa kluczowe stanowią źródło leksyki bezpośrednio dla indeksowania obiektów informacyjnych, a pośrednio dla tworzenia nazw punktów dostępu. Język słów kluczowych zastosowany do odwzorowania treści obiektów informacyjnych w systemie wyznacza formę jego wyrażeń. Wynika to ze względów

praktycznych, to jest możliwości wykorzystania jednostek leksykalnych tego języka w formie równokształtnej z wyrażeniami języka naturalnego do bezpośredniego oznaczania zakresu nazwy punktu dostępu/klucza wyszukiwawczego. Język ten jest przydatny tylko w generowaniu narzędzi dostępu z wykorzystaniem płaskiej (ahierarchicznej) organizacji punktów dostępu. Są to zbiory jednostek leksykalnych tworzących indeks alfabetyczny, którego elementy stanowią wejścia do zbioru wyszukiwawczego. Każde z nich jest węzłem dla odesłania hipertekstowego – jego aktywacja powoduje wyświetlenie listy

charakterystyk wyszukiwawczych obiektów informacyjnych, w których użyto ich do zindeksowania tych dokumentów. Ahierarchiczna budowa tego typu narzędzi charakteryzuje organizację wyrażeń, w której nie wykorzystuje się żadnej relacji

hierarchicznej, a pojęcia reprezentowane przez jednostki leksykalne są traktowane jako współrzędne.

W Internecie język słów kluczowych funkcjonuje przeważnie jako klasyczny język słów kluczowych, tzn. w wersji swobodnych słów kluczowych. Pełni on funkcję zasobu

leksykalnego. Tego typu indukcyjne podejście w językach informacyjno-wyszukiwawczych

powoduje, że jest ono dopasowane do stopnia rozproszenia elementów treści w polu tematycznym systemu. Wadą tego typu podejścia jest mała spójność całego układu, gdyż operuje on wyłącznie słowami kluczowymi wyodrębnionymi na podstawie zasady literary warrant. Tego typu struktury nie spełniają wymogów stawianych podziałowi logicznemu (rozłączności i adekwatności), a jedyną relacją organizującą jest relacja

współwystępowania, która dostarcza bardzo szerokich ram interpretacyjnych.

Wyszukiwanie w Internecie odbywa się przeważnie za pomocą swobodnych wyrażeń derywowanych z tekstu języka naturalnego (ang. free-text searching). W cyberprzestrzeni model języka słów kluczowych jako języka sztucznego, o którym wspomniałem w drugiej części rozprawy, nie bardzo przystaje do tej (nie)rzeczywistości. Tu słowa kluczowe jako narzędzie indeksująco-wyszukujące to jednostki leksykalne języka naturalnego w funkcji metainformacyjnej, przystosowane do potrzeb zautomatyzowanego wyszukiwania informacji. Cały aparat indeksowania i wyszukiwania nie należy do języka, lecz do systemu i został tu rozbudowany o wiele dodatkowych opcji, zależnych od aktualnych możliwości technologii komputerowej, a nie od samego języka.

Str. 158

Szczególnie odnosi się to do zastosowania języka słów kluczowych jako narzędzia wyszukiwawczego, gdyż w Internecie samo indeksowanie polega raczej na „zbieraniu”

słownictwa, niż na dokonywaniu zmian w jego pisowni czy łączeniu poszczególnych słów kluczowych w zdania.

Dostęp do informacji w systemie WWW za pomocą słów kluczowych polega na grupowaniu charakterystyk wyszukiwawczych w odpowiednie kategorie treści, zagnieżdżone w strukturze hipertekstu. Układ kategorii jest ahierarchiczny,

uporządkowany alfabetycznie. Uruchomienie powiązania hipertekstowego dla określonego węzła w takiej strukturze powoduje wyświetlenie jedynie listy CHWD przyporządkowanych do danej kategorii, bez powiązanych kategorii treściowych, bo takie w tej strukturze nie istnieją. Istnieją tylko w strukturach hierarchicznych i hybrydowych.

Słowa kluczowe przyjmują w systemach internetowych najczęściej postać jednowyrazowych lub dwuwyrazowych jednostek leksykalnych. W przypadku wielowyrazowych nazw własnych lub nazw przedmiotów wykorzystuje się formę najbardziej rozpowszechnioną. Wykorzystanie tego języka w odwzorowywaniu treści elementów zbioru informacyjnego polega na zbudowaniu komunikatu za pomocą słów kluczowych, które pozostają względem siebie równoważne i które bezpośrednio identyfikują elementy treści dokumentów internetowych. Charakterystyczną regułą

tworzenia tekstów w języku słów kluczowych jest szyk swobodny.

W Internecie wykorzystuje się, choć rzadko, również kontrolowane słowa kluczowe.

Przykładem takiego języka jest język słów kluczowych International Bibliography of the Social Science (IBSS) systemu INTUTE (nauki społeczne).

Zdecydowana większość narzędzi wyszukiwawczych (wyszukiwarek) w Internecie w trybie prostym wyszukiwania informacji, oprócz możliwości wprowadzania pytania

informacyjnego w postaci ciągu swobodnych słów kluczowych, nie udostępnia użytkownikowi żadnych dodatkowych opcji jego uszczegóławiania. Efektywność wyszukiwania zależy wówczas zarówno od poprawnego sformułowania pytania, jak i wiedzy użytkownika o systemie. Tylko w niewielu systemach występuje sprzężenie słownika słów kluczowych (lub słownika innego języka) z mechanizmem

wyszukiwawczym, co pozwala użytkownikowi pobierać wyrażenia z takiego zasobu do budowy pytania informacyjnego. Jest to zależne od stosowanego w danym systemie interfejsu użytkownika dla modułów wyszukiwania informacji w trybie prostym i trybie zaawansowanym. Takie rozwiązanie wprowadzono na przykład w EBSCO HOST 2 i Google’ach, gdzie zapewniono użytkownikowi możliwość formułowania pytania w postaci ciągu niekontrolowanych słów kluczowych lub pobierania jednostek leksykalnych w takiej formie, w jakiej występują w słowniku stosowanego języka słów kluczowych. Zwracam uwagę na możliwość wystąpienia tu tzw. fałszywej koordynacji, która polega z jednej strony na rozdzielaniu elementów składowych terminu wielowyrazowego, zaś z drugiej strony na odszukaniu wystąpień terminów w całej strukturze CHWD, nie zaś w polach przeznaczonych do prezentacji tego rodzaju informacji.

Analiza sposobów wykorzystywania języka słów kluczowych w organizacji zasobów informacji, w tym w Internecie, pozwoliła na identyfikację sposobów wykorzystania tego typu języka do porządkowania i organizacji dostępu do dokumentów w systemie WWW poprzez jego adaptację do środowiska hipertekstowego, nastawionego na szersze uwzględnianie relacji kojarzeniowych w sieciowej strukturze.

Str. 159

Języki te stanowią niezbyt zróżnicowaną klasę języków informacyjno-wyszukiwawczych.

Opierają się na nieco innym postrzeganiu rzeczywistości niż pozostałe typy języków, w tym języki klasyfikacyjne, które – jak już zauważono [przypis 119] – wywodzą się jeszcze z 19 wieku i są reprezentowane przez największe i jednocześnie najczęściej stosowane klasyfikacje, jak: Klasyfikacja Dziesiętna Deweya, Uniwersalna Klasyfikacja Dziesiętna i Klasyfikacja Biblioteki Kongresu USA, a ich postrzeganie rzeczywistości nie przystaje do

potrzeb współczesnego człowieka. Duża popularność języka słów kluczowych w organizacji zasobów Internetu wynika, jak już sygnalizowałem, z większej jego

elastyczności, a więc łatwości w asymilacji terminologii nowych obszarów wiedzy, braku sztywnych zasad podziału logicznego oraz mniejszego stopnia skomplikowania niż w przypadku innych języków informacyjno-wyszukiwawczych.

W dziedzinowych językach słów kluczowych można dostrzec wyraźną tendencję opierania tych języków wyłącznie na systemach terminologicznych poszczególnych dziedzin, co przejawia się w traktowaniu systemu terminologicznego jako podstawy systemu leksykalnego danego języka słów kluczowych.

Języki swobodnych słów kluczowych, zwane też autorskimi lub odautorskimi słowami kluczowymi, charakteryzują się niekonsekwencją w wyborze słownictwa. Tłumaczy się to silnym dążeniem do wybierania tylko tych słów kluczowych, które są w tytułach

dokumentów. Odbywa się to jednak kosztem spójności systemu leksykalnego. Sądzę, że spowodowane jest to nie ułomnością samego narzędzia, lecz nieefektywnym jego

wykorzystaniem w wielu systemach i serwisach internetowych.

Ważnym problemem języków słów kluczowych w Internecie jest zagadnienie prezentacji tego języka. Obecnie technologie komputerowe pozwalają na prezentację leksyki w każdej formie, stosownie do wymagań użytkownika oraz umożliwiają stałą aktualizację danych, co przy użyciu metod konwencjonalnych było trudne do realizacji z uwagi na wzajemne uzależnienie poszczególnych danych od siebie. Słowniki słów kluczowych zawierają tylko te jednostki leksykalne, które są niezbędne do opisu i wyszukiwania informacji w systemie, dlatego występuje dążenie do ich redukcji.

W dokumencie Za oryginałem zostały pominięte strony (Stron 183-186)