• Nie Znaleziono Wyników

ORGANIZACJA WIEDZY W BIBLIOTEKACH

6.1. Katalogi elektroniczne

MODELOWANIE SIECIOWYCH DOKUMENTÓW ELEKTRONICZNYCH

Jak już wspomniano w poprzednich rozdziałach, Ontologie zawierają zestaw pojęć, aksjomatów i relacji, opisujących daną dziedzinę wiedzy lub praktyki. Ontologie mają wielepodobieństwze słownikamijęzyków informacyjno-wyszukiwawczych,jednak są bardziej szczegółowe, lepiej ustrukturyzowane oraz wyrażone w sposób bardziej sfor­

malizowany, pozwalający na komputeroweprzetwarzanie ich treści, co upodobnia je do modelikonceptualnych.

6.1. Katalogi elektroniczne

Przejście od katalogów kartkowych do katalogów online, mimo że trwa już około 30 lat, wciąż pozostaje w stadium początkowym. Tak powolne zmiany są po części spowodowane trudnością w zrozumieniu funkcji rekordu bibliograficznego w środowi­

sku elektronicznym. Wtym czasie dokonano, oczywiście,pewnych postępów.Rekordy bibliograficznezostały przeniesionezkart katalogowych doformatuMARC, w którym koduje się poszczególne elementymetadanych. Jednocześnie jednak utracona została struktura bibliograficzna. W wielu katalogach online nie wprowadzono struktury syn­

tetycznej, która służyjako przewodnik od języka znanego użytkownikowi do języka zastosowanegow organizacji informacji.

Niejasna jest rola, jaką pełni rekord bibliograficzny w środowisku cyfrowym, szczególnie w zakresie tego, co powinien on opisywać. Rekord bibliograficznyjest zarówno surogatem dokumentu fizycznego, jak i opisem Materializacji Dzieła. Ma on zatem jednocześnie służyć funkcjom inwentaryzacyjnej ikonceptualnej,czyli informa­

cyjnej. Wzrost liczbymediów w nowych formatach prowadzi do rozbieżności w reali­ zacji obu funkcji, w efekcie czego rekordy zaprojektowane do realizacji jednej funkcji niespełniająodpowiednio drugiej.

Eksplozja ilości zasobów dostępnych w Interneciepowoduje, że stawiane są pytania o przydatność stosowania rekordów bibliograficznych do opracowania zasobów sieci rozległych.Zastanawiano się, czywarto tworzyć rekord katalogowy dlazasobów, które w sposób nieprzewidywalny mogą co jakiśczas zmieniaćtreść i/lub lokalizację,szcze­

gólnie gdy zasoby te istnieją w niekontrolowanym środowisku Web. Podnoszą się głosy, że natura opisu bibliograficznego, zaprojektowana do tworzenia niezmiennych

120 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji

struktur, pozostaje w sprzeczności z amorficznymi i zmiennymi zasobami Intemetu.

Jak piszę Lynne Howarth, w ISBD (ER) pominięto strefę opisu fizycznego dla zaso­ bów elektronicznych dostępnych zdalnie, gdyż stwierdzono u nich brak „fizyczności”

[Howarth 1997]. Podobne dyskusje, dotyczące np. czasopism elektronicznych, nie omijają takżeśrodowiska bibliotekarzy polskich [Kołodzińska 2005].

Nancy Olsen we wstępie do Cataloging Internet Resources [Olsen 2002] podaję trzy powody, dla którychzasoby Intemetu powinny być katalogowane:

1. W Internecie dostępna jest wielka ilość wartościowych informacji.

2. Dla zwiększenia dostępnościtych zasobów niezbędna jest ich właściwa organizacja.

3. Najbardziej efektywną metodą zapewnieniadostępu do tych zasobów jest wykorzy­

stanie istniejących technik i procedur stosowanych w bibliotekach oraz tworzenie rekordówsłużącychwyszukiwaniu poprzez istniejącekatalogi online.

Różni autorzy w rozmaitysposób widzą cele realizowane przez rekordybibliogra­

ficzne. Patrick Wilson twierdzi, że ponieważ grupowanie podobnej informacji jest najważniejszymz celów bibliograficznych, toDziełapowinny być obiektami opisywa­ nymi w rekordach bibliograficznych [Wilson 1989]. Podobnego zdania jest Michael Heaney, który twierdzi, że dostęp do informacji odbywa sięgłównie poprzezabstrak­

cyjne Dzieło. Jego propozycje idąnawet dalej,w kierunkutworzenia odrębnych rekor­ dów dla Materializacji i Egzemplarza jako uzupełnienie rekordu Dzieła [Heaney

1995].

Dyskusję nad celami rekordów bibliograficznych komplikuje fakt, że rewolucja technologiczna spowodowała dodanie do poprzednich funkcji: inwentaryzacyjnej i konceptualnej, dwóch kolejnych: komunikowania informacji bibliograficznej w śro­ dowisku globalnym oraz dostarczania danych dla wewnętrznych działań komputera, niezbędnych do tworzenia i utrzymania katalogów online. Rekordy bibliograficzne w formieczytelnej maszynowo, przygotowane z myślą o komunikacjiglobalnej mogą powodować problemy podczas ich adaptacji do potrzeb lokalnej biblioteki. Podobny problem dotyczy relacji bibliograficznych reprezentowanych w globalnych rekordach bibliograficznych.

Powstanie nowych narzędzi opracowania zasobów elektronicznych (metadanych) spowodowało postawienie pytania, czy biblioteczneprzepisy katalogowania mogą być z powodzeniem stosowane do tych zasobów i środowiska sieci rozległych. Na począt­ ku lat dziewięćdziesiątych ubiegłego stulecia OCLC w jednym z projektów badaw­

czych odpowiedziało na to pytanie twierdząco [Jul 1995]. W nowy serwis OCLC o nazwie Connexion (http://connexion.oclc.org) włączony został wcześniej powstały system CORC, służący do katalogowania zasobów internetowych w różnych forma­ tach,w tym Dublin Core. W serwisie tym funkcjonuje m.in. WorldCat - baza danych zawierająca ok. 61 min opisów, w tym ponad 235 tys. rekordów dokumentówelektro­

nicznych (dane z sierpnia 2005 r.). Wymienia się dwa powody wskazujące na możli­ wość zastosowania przepisów katalogowania do zasobów internetowych: katalogowa­ nie dostosowane do możliwości katalogu bibliotecznego oraz naturę zasobów sieci rozproszonych.

Początkowo, gdy selekcja zasobów Intemetu była stopniowo włączana do biblio­

tecznej polityki gromadzenia zbiorów, biblioteki tworzyły i przedstawiałyofertę udo­

stępniania zasobów internetowych w postaci specjalnych wykazów odnośników lub menu. Później zaczęto stosować bibliograficzny dostęp do wybranych zasobów inter­

netowych poprzez katalogi biblioteczne. Tego typu katalogowanie realizowane było

Modelowanie sieciowych dokumentów elektronicznych 121 w kontekście zasobów bibliotecznych i ich katalogów, a nie w znacznie większym i zróżnicowanym uniwersum wszystkich zasobów dostępnych w Internecie. Na przy­ kład, tworzenie haseł osobowych odbywa sięw ramach budowy narodowych (na ogół) kartotek autorytatywnych, a nie dla wszystkich nazw wyszukiwanych przez wyszuki­ warki internetowe. Założenie, że granice zasobów bibliotecznych są również granicami stosowania zasad katalogowania, będzie podlegać szybkiej weryfikacji z powodu gwałtownego różnicowania i wzrostu ilości źródeł opisanych i dostępnych poprzez katalogbiblioteczny.

Drugim czynnikiem jest natura zasobów Intemetu katalogowanychprzez biblioteki współpracujące. Pomijając przypadkowo opracowane strony Web, znaczna większość z nich najpierw była wyselekcjonowana do zasobów biblioteki na podstawie określo­ nych kryteriów, stosowanych wcześniej do dokumentów tradycyjnych. W szczególno­

ści czasopisma elektroniczne mają na ogół ściśle określoną formę i budowę (stronę tytułowąitp.), któreupodobniają je do dokumentów drukowanych, pozwalając na sto­

sowanie istniejących wcześniej zasad i norm. Zgodnie z tymi kryteriami nie katalogo­ wano dokumentów graficznych występujących bez towarzyszącego opisu tekstowego, za to z wieloma wersjami tytułu, źródeł o wielu częściach składowych czy obrazów bez określonego tytułu i autora.

Wątpliwość co do możliwości identyfikowania Dziel wynika z faktu, że wiele obiektów elektronicznych nie posiada rozpoznawalnych tytułów. Po pewnym czasie tytuły mogąbyć uzupełnione, lecz większym problemem jest połączenie dzieł skon- wertowanych do formy elektronicznej, nieposiadających tytułu z opisami ich tradycyj­

nych form, np. powiązanie opisu dokumentu w formie drukowanej z plikiem ASCII lub obrazem cyfrowym, w przypadku, gdy te trzy formaty są niezależnie utworzone izarządzane [Mandel,Wolven 1996].

Biblioteki gromadzą i katalogują wybrane zasoby Intemetu. Wykazanie, że można stosować zasady katalogowania utworzone dla katalogów bibliotecznych do zasobów w formatach zbliżonych do tradycyjnych(głównie dokumentów tekstowych), jest kro­ kiem w kierunku określenia sposobu organizacji i udostępniania przez biblioteki in­

nych rodzajów zasobów cyfrowych dostępnych w Internecie.

Anna Sitarska wyróżniła dwaczynniki wpływające na zmiany wjęzyku opisudo­

kumentów [Sitarska 2005, s. 120-121]. Pierwszym czynnikiem jest potrzeba tworzenia zapisów czytelnych maszynowo. Powoduje to postrzeganie opisu bibliograficznego nie tylkojako struktury danych o dokumencie, ale także jako składnika wielu działań bi­

bliotecznych, realizowanych w sposób zautomatyzowany. Drugim czynnikiem jest bardziejanalityczne charakteryzowanietekstów tworzących dokumenty. Dokumentyte niesą jużtraktowane jako niepodzielne całości.

Lokalne systemyonline pozwoliły na integrację dostępu do danych bibliograficz­

nych iusług udostępniania, atworzenie rekordu egzemplarza dla każdej części fizycz­

nej stało się podstawą modułowego podejścia do opisu i dostępu. W wyniku łączenia opisów wielu części dla jednego tytułu, do jednego rekordu bibliograficznego można przyłączyć tysiącerekordów egzemplarza. Rekordyegzemplarza, chociaż początkowo miały być przeznaczone dla określonej pozycji bibliograficznej i Materializacji, szyb­

ko stały się narzędziem służącym zapisywaniu i kontroli Realizacji utworzonych wróżnych formatach, np. mikroform, fotokopii, plików elektronicznych. Naprzykład AACR pozwala na to, aby dane dotyczące formatu były umieszczanewrekordzieeg­

zemplarza, jednakzazwyczaj informację tę zamieszczano w strefie uwag rekordu bi­

122 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji

bliograficznego w systemie lokalnym. Taki sposób dawał możliwość ekonomicznego

„katalogowania” nowych wersji, pozwalając uniknąć wyświetlania długich wykazów rekordów, różniących się jedynie datą wydania.

Najnowsze modyfikacje oraz istotnezmianyzawarte w nowych propozycjach zapi­

su danych w rekordach bibliograficznych wskazują na stały postęp w tym zakresie.

Katalog biblioteczny, aby realizować funkcję głównego narzędzia dostępu do zasobów biblioteki, musi realizować nowe cele. Do dotychczasowej praktyki katalogowania zaadaptowano również tworzenie dostępu bibliograficznego do źródełw nowych for­

matach, takich jak pliki komputerowe.Efekty połączenia bibliografii onlinez rekordami katalogu spowodujązmianę możliwości wyszukiwawczych katalogów, która nie ma­ rzyła się autorom obecnych przepisów katalogowania. Udostępnianie zasobów Inter­ netu poprzez katalog biblioteczny - zamiast przy użyciu wyszukiwarek internetowych - pozwala na wyszukiwanie informacji ustrukturyzowanej, wykorzystanie wyników analizy rzeczowej, danych autorytatywnych i innych elementów katalogu, pozwalają­

cych na wydobycie wartości dodanej, stworzonej podczas katalogowania zasobów internetowych. Jeżeli dodamy do tego łatwość udostępniania danych (przez kliknięcie myszą)charakterystyczną dlaIntemetu,uzyskamy model katalogu mogący zsukcesem udostępniaćtezasoby [Nahotko 200lb].

Lokalne katalogi biblioteczne, podobnie jak wyszukiwarki internetowe, wykorzy­ stują klienta WWW do udostępniania katalogu, pozwalają na realizację wyszukiwania i przedstawiają wyniki użytkownikowi, który zainicjował wyszukiwanie za pomocą używanej przezsiebie wyszukiwarki. W trakcie pracy klient takiego typu, jakiużywa­

ny jest w Connexion, na bieżąco konwertuje rekordy utworzone w MARC na format Dublin Core iodwrotnie,wyświetlającwyniki w formieżądanej przezużytkownika.

Katalog nowego typu powinien wsposóbhierarchiczny opisywać Dzieła, ich Reali­ zacje i Materializacje, części i Dziełazwiązane relacjami. Wielubibliotekarzy dostrze­

ga tę potrzebę i uważa, że możliwości takie możedać tylko format innyniż MARC. To jest przyczyną powstawania setek nowych formatów metadanych. Szczęśliwie, kon­

wersja danych pomiędzy najczęściej stosowanymi formatami danych nie stanowi obecnieproblemu.

Na rysunku 17 przedstawiono rozproszony proces opisu zasobów elektronicznych, angażujący wielu uczestników zarówno w bibliotece,jak i poza nią [Calhoun 2000].

Linie ciągłe oznaczają przepływ danych w systemie, linie przerywane - przepływy zapytań i odpowiedzi, wymienianych pomiędzy wieloma uczestnikami procesu. Głów­ nymproduktem tegosystemu są metadane, czyliopisy zasobów.

W proponowanym systemie wszystkie grupy funkcjonalne mogą w zadowalający sposób brać udział w opisywaniu źródeł. Opisy te mogą pochodzić od dostawców, wydawców lub autorów. Dane będątakżedostarczanez baz danych, baz wiedzy i sa­

mych zasobów internetowych. Proces kończysię wraz z utworzeniem metadanych iich integracją w bibliotecznym systemie wyszukiwania informacji. Biorąc jednak pod uwagę,że tworzenie opisów zasobów sieciowych może być procesem dynamicznym, początkowy opis zasobów może mieć niski poziom szczegółowości, który później będzie modyfikowany i wzbogacany.

Taki model tworzenia i wyszukiwania informacji posiada kilka wymogówfunkcjo­ nalnych:

• dostarczane opisy zasobów mają być przydatne dla użytkowników, należy więc badać użyteczność opisów z ichpunktu widzenia,

Modelowanie sieciowych dokumentów elektronicznych 123

Rys. 17. Proces opisu zasobów elektronicznych [wg: Calhoun 2000]

• należy umożliwić wyszukiwanie zasobów na dowolnympoziomie szczegółowości, nie tylko całości dzieła wieloskładnikowego, ale także poszczególnych składników (np. ilustracji graficznych, dźwięku, rozdziałów w książce i artykułów w czasopi­ śmie, wstępu,opracowania krytycznego itp.),

• należy utworzyć infrastrukturę, która wprowadzi porządek w chaos typowy dla nieustrukturyzowanego zbiorudanych pochodzących zróżnych źródeł;infrastruktu­

rę tęSherry Vellucci nazwała „metakatalogiem”[Vellucci 1997b].

Nowe technologie wymuszają porównania starych i powstających obecnie zasad opracowania zbiorów, aby na tej podstawie doskonalić istniejące metody opisuzaso­

bów. Dyskusje w środowisku bibliotekarzy dotyczą zasadniczych problemów: celów katalogowania i wymogów dla tworzonych surogatów treści, orientacji wieloobiekto-wej w rekordach bibliograficznych, dostosowania przepisów i zasad katalogowania do zasobów cyfrowych oraz alternatywnych struktur rekordu dla katalogów lokalnych, spełniającychcele udostępniania. Często dyskutanci wychodzą z założenia, że katalogi biblioteczne pasują wprost do rozproszonego systemu opisywania i wyszukiwania zasobów, co nieuchronniepowodujepotrzebę badaniaproblemów dotyczących pozycji zajmowanej przez katalog irodzaju systemu prezentowanegoużytkownikowi.

Niektórzyspecjaliści twierdzą, że rozwój technologii informatycznej spowodował, iż skuteczniejsze od metajęzyków okazały się hurtownie danych przetwarzanych we­

dług metodstatystycznych, a Googleudowodniłmożliwość poprawnego wyszukiwania bez systematycznie tworzonych metadanych, chociażidea jego działania bardzo przy­

pomina analizę cytowań [Radwański 2004]. Globalnasiećprzyczyniłasię dodeprecja­ cji tak podstawowych pojęć, jak: dystrybucja, dokument, autorstwo, publikacja itp.

Z drugiej strony, jak twierdzi David Levy, zasoby elektroniczne będąmusiały zostać zorganizowane i zarządzane,jeżeli mają być stabilne i użyteczne [Levy 1995]. Jedno­ cześnie twierdzi on, że działania tego typu wymagają intensywnej, systematycznej działalności ludzkiej. Nie uważa, aby możliwe było zastąpienie katalogów przez na­

rzędzia indeksujące, wyszukujące i inteligentnych agentów, a katalogi będą tworzone

124 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji

również w środowisku sieci rozległych, nawet jeżeli słowo to nabierze nowego zna­

czenia. Jeśli natomiast założymy istnienie katalogów wprzyszłości, to powstają nowe pytania, wśródktórych jednym z ważniejszych i podstawowychjest zpewnością kwe­

stia ontologicznego modelu takiegokatalogu.