ORGANIZACJA WIEDZY W BIBLIOTEKACH
6.1. Katalogi elektroniczne
MODELOWANIE SIECIOWYCH DOKUMENTÓW ELEKTRONICZNYCH
Jak już wspomniano w poprzednich rozdziałach, Ontologie zawierają zestaw pojęć, aksjomatów i relacji, opisujących daną dziedzinę wiedzy lub praktyki. Ontologie mają wielepodobieństwze słownikamijęzyków informacyjno-wyszukiwawczych,jednak są bardziej szczegółowe, lepiej ustrukturyzowane oraz wyrażone w sposób bardziej sfor
malizowany, pozwalający na komputeroweprzetwarzanie ich treści, co upodobnia je do modelikonceptualnych.
6.1. Katalogi elektroniczne
Przejście od katalogów kartkowych do katalogów online, mimo że trwa już około 30 lat, wciąż pozostaje w stadium początkowym. Tak powolne zmiany są po części spowodowane trudnością w zrozumieniu funkcji rekordu bibliograficznego w środowi
sku elektronicznym. Wtym czasie dokonano, oczywiście,pewnych postępów.Rekordy bibliograficznezostały przeniesionezkart katalogowych doformatuMARC, w którym koduje się poszczególne elementymetadanych. Jednocześnie jednak utracona została struktura bibliograficzna. W wielu katalogach online nie wprowadzono struktury syn
tetycznej, która służyjako przewodnik od języka znanego użytkownikowi do języka zastosowanegow organizacji informacji.
Niejasna jest rola, jaką pełni rekord bibliograficzny w środowisku cyfrowym, szczególnie w zakresie tego, co powinien on opisywać. Rekord bibliograficznyjest zarówno surogatem dokumentu fizycznego, jak i opisem Materializacji Dzieła. Ma on zatem jednocześnie służyć funkcjom inwentaryzacyjnej ikonceptualnej,czyli informa
cyjnej. Wzrost liczbymediów w nowych formatach prowadzi do rozbieżności w reali zacji obu funkcji, w efekcie czego rekordy zaprojektowane do realizacji jednej funkcji niespełniająodpowiednio drugiej.
Eksplozja ilości zasobów dostępnych w Interneciepowoduje, że stawiane są pytania o przydatność stosowania rekordów bibliograficznych do opracowania zasobów sieci rozległych.Zastanawiano się, czywarto tworzyć rekord katalogowy dlazasobów, które w sposób nieprzewidywalny mogą co jakiśczas zmieniaćtreść i/lub lokalizację,szcze
gólnie gdy zasoby te istnieją w niekontrolowanym środowisku Web. Podnoszą się głosy, że natura opisu bibliograficznego, zaprojektowana do tworzenia niezmiennych
120 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji
struktur, pozostaje w sprzeczności z amorficznymi i zmiennymi zasobami Intemetu.
Jak piszę Lynne Howarth, w ISBD (ER) pominięto strefę opisu fizycznego dla zaso bów elektronicznych dostępnych zdalnie, gdyż stwierdzono u nich brak „fizyczności”
[Howarth 1997]. Podobne dyskusje, dotyczące np. czasopism elektronicznych, nie omijają takżeśrodowiska bibliotekarzy polskich [Kołodzińska 2005].
Nancy Olsen we wstępie do Cataloging Internet Resources [Olsen 2002] podaję trzy powody, dla którychzasoby Intemetu powinny być katalogowane:
1. W Internecie dostępna jest wielka ilość wartościowych informacji.
2. Dla zwiększenia dostępnościtych zasobów niezbędna jest ich właściwa organizacja.
3. Najbardziej efektywną metodą zapewnieniadostępu do tych zasobów jest wykorzy
stanie istniejących technik i procedur stosowanych w bibliotekach oraz tworzenie rekordówsłużącychwyszukiwaniu poprzez istniejącekatalogi online.
Różni autorzy w rozmaitysposób widzą cele realizowane przez rekordybibliogra
ficzne. Patrick Wilson twierdzi, że ponieważ grupowanie podobnej informacji jest najważniejszymz celów bibliograficznych, toDziełapowinny być obiektami opisywa nymi w rekordach bibliograficznych [Wilson 1989]. Podobnego zdania jest Michael Heaney, który twierdzi, że dostęp do informacji odbywa sięgłównie poprzezabstrak
cyjne Dzieło. Jego propozycje idąnawet dalej,w kierunkutworzenia odrębnych rekor dów dla Materializacji i Egzemplarza jako uzupełnienie rekordu Dzieła [Heaney
1995].
Dyskusję nad celami rekordów bibliograficznych komplikuje fakt, że rewolucja technologiczna spowodowała dodanie do poprzednich funkcji: inwentaryzacyjnej i konceptualnej, dwóch kolejnych: komunikowania informacji bibliograficznej w śro dowisku globalnym oraz dostarczania danych dla wewnętrznych działań komputera, niezbędnych do tworzenia i utrzymania katalogów online. Rekordy bibliograficzne w formieczytelnej maszynowo, przygotowane z myślą o komunikacjiglobalnej mogą powodować problemy podczas ich adaptacji do potrzeb lokalnej biblioteki. Podobny problem dotyczy relacji bibliograficznych reprezentowanych w globalnych rekordach bibliograficznych.
Powstanie nowych narzędzi opracowania zasobów elektronicznych (metadanych) spowodowało postawienie pytania, czy biblioteczneprzepisy katalogowania mogą być z powodzeniem stosowane do tych zasobów i środowiska sieci rozległych. Na począt ku lat dziewięćdziesiątych ubiegłego stulecia OCLC w jednym z projektów badaw
czych odpowiedziało na to pytanie twierdząco [Jul 1995]. W nowy serwis OCLC o nazwie Connexion (http://connexion.oclc.org) włączony został wcześniej powstały system CORC, służący do katalogowania zasobów internetowych w różnych forma tach,w tym Dublin Core. W serwisie tym funkcjonuje m.in. WorldCat - baza danych zawierająca ok. 61 min opisów, w tym ponad 235 tys. rekordów dokumentówelektro
nicznych (dane z sierpnia 2005 r.). Wymienia się dwa powody wskazujące na możli wość zastosowania przepisów katalogowania do zasobów internetowych: katalogowa nie dostosowane do możliwości katalogu bibliotecznego oraz naturę zasobów sieci rozproszonych.
Początkowo, gdy selekcja zasobów Intemetu była stopniowo włączana do biblio
tecznej polityki gromadzenia zbiorów, biblioteki tworzyły i przedstawiałyofertę udo
stępniania zasobów internetowych w postaci specjalnych wykazów odnośników lub menu. Później zaczęto stosować bibliograficzny dostęp do wybranych zasobów inter
netowych poprzez katalogi biblioteczne. Tego typu katalogowanie realizowane było
Modelowanie sieciowych dokumentów elektronicznych 121 w kontekście zasobów bibliotecznych i ich katalogów, a nie w znacznie większym i zróżnicowanym uniwersum wszystkich zasobów dostępnych w Internecie. Na przy kład, tworzenie haseł osobowych odbywa sięw ramach budowy narodowych (na ogół) kartotek autorytatywnych, a nie dla wszystkich nazw wyszukiwanych przez wyszuki warki internetowe. Założenie, że granice zasobów bibliotecznych są również granicami stosowania zasad katalogowania, będzie podlegać szybkiej weryfikacji z powodu gwałtownego różnicowania i wzrostu ilości źródeł opisanych i dostępnych poprzez katalogbiblioteczny.
Drugim czynnikiem jest natura zasobów Intemetu katalogowanychprzez biblioteki współpracujące. Pomijając przypadkowo opracowane strony Web, znaczna większość z nich najpierw była wyselekcjonowana do zasobów biblioteki na podstawie określo nych kryteriów, stosowanych wcześniej do dokumentów tradycyjnych. W szczególno
ści czasopisma elektroniczne mają na ogół ściśle określoną formę i budowę (stronę tytułowąitp.), któreupodobniają je do dokumentów drukowanych, pozwalając na sto
sowanie istniejących wcześniej zasad i norm. Zgodnie z tymi kryteriami nie katalogo wano dokumentów graficznych występujących bez towarzyszącego opisu tekstowego, za to z wieloma wersjami tytułu, źródeł o wielu częściach składowych czy obrazów bez określonego tytułu i autora.
Wątpliwość co do możliwości identyfikowania Dziel wynika z faktu, że wiele obiektów elektronicznych nie posiada rozpoznawalnych tytułów. Po pewnym czasie tytuły mogąbyć uzupełnione, lecz większym problemem jest połączenie dzieł skon- wertowanych do formy elektronicznej, nieposiadających tytułu z opisami ich tradycyj
nych form, np. powiązanie opisu dokumentu w formie drukowanej z plikiem ASCII lub obrazem cyfrowym, w przypadku, gdy te trzy formaty są niezależnie utworzone izarządzane [Mandel,Wolven 1996].
Biblioteki gromadzą i katalogują wybrane zasoby Intemetu. Wykazanie, że można stosować zasady katalogowania utworzone dla katalogów bibliotecznych do zasobów w formatach zbliżonych do tradycyjnych(głównie dokumentów tekstowych), jest kro kiem w kierunku określenia sposobu organizacji i udostępniania przez biblioteki in
nych rodzajów zasobów cyfrowych dostępnych w Internecie.
Anna Sitarska wyróżniła dwaczynniki wpływające na zmiany wjęzyku opisudo
kumentów [Sitarska 2005, s. 120-121]. Pierwszym czynnikiem jest potrzeba tworzenia zapisów czytelnych maszynowo. Powoduje to postrzeganie opisu bibliograficznego nie tylkojako struktury danych o dokumencie, ale także jako składnika wielu działań bi
bliotecznych, realizowanych w sposób zautomatyzowany. Drugim czynnikiem jest bardziejanalityczne charakteryzowanietekstów tworzących dokumenty. Dokumentyte niesą jużtraktowane jako niepodzielne całości.
Lokalne systemyonline pozwoliły na integrację dostępu do danych bibliograficz
nych iusług udostępniania, atworzenie rekordu egzemplarza dla każdej części fizycz
nej stało się podstawą modułowego podejścia do opisu i dostępu. W wyniku łączenia opisów wielu części dla jednego tytułu, do jednego rekordu bibliograficznego można przyłączyć tysiącerekordów egzemplarza. Rekordyegzemplarza, chociaż początkowo miały być przeznaczone dla określonej pozycji bibliograficznej i Materializacji, szyb
ko stały się narzędziem służącym zapisywaniu i kontroli Realizacji utworzonych wróżnych formatach, np. mikroform, fotokopii, plików elektronicznych. Naprzykład AACR pozwala na to, aby dane dotyczące formatu były umieszczanewrekordzieeg
zemplarza, jednakzazwyczaj informację tę zamieszczano w strefie uwag rekordu bi
122 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji
bliograficznego w systemie lokalnym. Taki sposób dawał możliwość ekonomicznego
„katalogowania” nowych wersji, pozwalając uniknąć wyświetlania długich wykazów rekordów, różniących się jedynie datą wydania.
Najnowsze modyfikacje oraz istotnezmianyzawarte w nowych propozycjach zapi
su danych w rekordach bibliograficznych wskazują na stały postęp w tym zakresie.
Katalog biblioteczny, aby realizować funkcję głównego narzędzia dostępu do zasobów biblioteki, musi realizować nowe cele. Do dotychczasowej praktyki katalogowania zaadaptowano również tworzenie dostępu bibliograficznego do źródełw nowych for
matach, takich jak pliki komputerowe.Efekty połączenia bibliografii onlinez rekordami katalogu spowodujązmianę możliwości wyszukiwawczych katalogów, która nie ma rzyła się autorom obecnych przepisów katalogowania. Udostępnianie zasobów Inter netu poprzez katalog biblioteczny - zamiast przy użyciu wyszukiwarek internetowych - pozwala na wyszukiwanie informacji ustrukturyzowanej, wykorzystanie wyników analizy rzeczowej, danych autorytatywnych i innych elementów katalogu, pozwalają
cych na wydobycie wartości dodanej, stworzonej podczas katalogowania zasobów internetowych. Jeżeli dodamy do tego łatwość udostępniania danych (przez kliknięcie myszą)charakterystyczną dlaIntemetu,uzyskamy model katalogu mogący zsukcesem udostępniaćtezasoby [Nahotko 200lb].
Lokalne katalogi biblioteczne, podobnie jak wyszukiwarki internetowe, wykorzy stują klienta WWW do udostępniania katalogu, pozwalają na realizację wyszukiwania i przedstawiają wyniki użytkownikowi, który zainicjował wyszukiwanie za pomocą używanej przezsiebie wyszukiwarki. W trakcie pracy klient takiego typu, jakiużywa
ny jest w Connexion, na bieżąco konwertuje rekordy utworzone w MARC na format Dublin Core iodwrotnie,wyświetlającwyniki w formieżądanej przezużytkownika.
Katalog nowego typu powinien wsposóbhierarchiczny opisywać Dzieła, ich Reali zacje i Materializacje, części i Dziełazwiązane relacjami. Wielubibliotekarzy dostrze
ga tę potrzebę i uważa, że możliwości takie możedać tylko format innyniż MARC. To jest przyczyną powstawania setek nowych formatów metadanych. Szczęśliwie, kon
wersja danych pomiędzy najczęściej stosowanymi formatami danych nie stanowi obecnieproblemu.
Na rysunku 17 przedstawiono rozproszony proces opisu zasobów elektronicznych, angażujący wielu uczestników zarówno w bibliotece,jak i poza nią [Calhoun 2000].
Linie ciągłe oznaczają przepływ danych w systemie, linie przerywane - przepływy zapytań i odpowiedzi, wymienianych pomiędzy wieloma uczestnikami procesu. Głów nymproduktem tegosystemu są metadane, czyliopisy zasobów.
W proponowanym systemie wszystkie grupy funkcjonalne mogą w zadowalający sposób brać udział w opisywaniu źródeł. Opisy te mogą pochodzić od dostawców, wydawców lub autorów. Dane będątakżedostarczanez baz danych, baz wiedzy i sa
mych zasobów internetowych. Proces kończysię wraz z utworzeniem metadanych iich integracją w bibliotecznym systemie wyszukiwania informacji. Biorąc jednak pod uwagę,że tworzenie opisów zasobów sieciowych może być procesem dynamicznym, początkowy opis zasobów może mieć niski poziom szczegółowości, który później będzie modyfikowany i wzbogacany.
Taki model tworzenia i wyszukiwania informacji posiada kilka wymogówfunkcjo nalnych:
• dostarczane opisy zasobów mają być przydatne dla użytkowników, należy więc badać użyteczność opisów z ichpunktu widzenia,
Modelowanie sieciowych dokumentów elektronicznych 123
Rys. 17. Proces opisu zasobów elektronicznych [wg: Calhoun 2000]
• należy umożliwić wyszukiwanie zasobów na dowolnympoziomie szczegółowości, nie tylko całości dzieła wieloskładnikowego, ale także poszczególnych składników (np. ilustracji graficznych, dźwięku, rozdziałów w książce i artykułów w czasopi śmie, wstępu,opracowania krytycznego itp.),
• należy utworzyć infrastrukturę, która wprowadzi porządek w chaos typowy dla nieustrukturyzowanego zbiorudanych pochodzących zróżnych źródeł;infrastruktu
rę tęSherry Vellucci nazwała „metakatalogiem”[Vellucci 1997b].
Nowe technologie wymuszają porównania starych i powstających obecnie zasad opracowania zbiorów, aby na tej podstawie doskonalić istniejące metody opisuzaso
bów. Dyskusje w środowisku bibliotekarzy dotyczą zasadniczych problemów: celów katalogowania i wymogów dla tworzonych surogatów treści, orientacji wieloobiekto-wej w rekordach bibliograficznych, dostosowania przepisów i zasad katalogowania do zasobów cyfrowych oraz alternatywnych struktur rekordu dla katalogów lokalnych, spełniającychcele udostępniania. Często dyskutanci wychodzą z założenia, że katalogi biblioteczne pasują wprost do rozproszonego systemu opisywania i wyszukiwania zasobów, co nieuchronniepowodujepotrzebę badaniaproblemów dotyczących pozycji zajmowanej przez katalog irodzaju systemu prezentowanegoużytkownikowi.
Niektórzyspecjaliści twierdzą, że rozwój technologii informatycznej spowodował, iż skuteczniejsze od metajęzyków okazały się hurtownie danych przetwarzanych we
dług metodstatystycznych, a Googleudowodniłmożliwość poprawnego wyszukiwania bez systematycznie tworzonych metadanych, chociażidea jego działania bardzo przy
pomina analizę cytowań [Radwański 2004]. Globalnasiećprzyczyniłasię dodeprecja cji tak podstawowych pojęć, jak: dystrybucja, dokument, autorstwo, publikacja itp.
Z drugiej strony, jak twierdzi David Levy, zasoby elektroniczne będąmusiały zostać zorganizowane i zarządzane,jeżeli mają być stabilne i użyteczne [Levy 1995]. Jedno cześnie twierdzi on, że działania tego typu wymagają intensywnej, systematycznej działalności ludzkiej. Nie uważa, aby możliwe było zastąpienie katalogów przez na
rzędzia indeksujące, wyszukujące i inteligentnych agentów, a katalogi będą tworzone
124 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji
również w środowisku sieci rozległych, nawet jeżeli słowo to nabierze nowego zna
czenia. Jeśli natomiast założymy istnienie katalogów wprzyszłości, to powstają nowe pytania, wśródktórych jednym z ważniejszych i podstawowychjest zpewnością kwe
stia ontologicznego modelu takiegokatalogu.