• Nie Znaleziono Wyników

ORGANIZACJA WIEDZY W BIBLIOTEKACH

6.3. Ontologią sieciowych dokumentów elektronicznych

6.3.2. Jednostki modelu trójpoziomowego

Już Ranganathanuważał, że dokumentymożnapostrzegać w trzechaspektach:

• duszy, czyliidei imyśli, które zawierają,

• subtelnego ciała, czyli sposobu wyrażania (język, forma wyrażania, organizacja treści,ilustracje, stylitp.),

Modelowanie sieciowych dokumentów elektronicznych 137

• prostego ciała, czyli nośnika lub medium służących zapisowi i dystrybucji91 [Ra-ghavan,Neelameghan2002].

91 Interesujące wydaje się, że w porównaniu z czteropoziomowym modelem FRBR, brakującym po­

ziomem jest Materializacja,czyliwydanie, a więc poziom, który bibliotekarzezawszeuważali zanajważ­ niejszy z punktu widzenia tworzenia rekordów bibliograficznych.

92 Dzieło w FRBR definiowanejestjakoodrębny wytwór intelektualny lub artystyczny [FRBR 1998, s. 12]. Jest to jednostkaabstrakcyjna(por. rozdz. 5.1.1).

Ten punkt widzenia może być stosowany zarówno do dokumentów tradycyjnych, jak i elektronicznych. Pomimo że większość użytkowników poszukuje raczej idei za­ wartych w dokumentach, sposób wyrażania i nośnik wpływają na środki i sposoby dostępu i efektywność wykorzystania treści informacji. Dotyczy to szczególnie doku­

mentów elektronicznych.

W pracach OCLC przedstawiono sześć rodzajów materiałów, które określone zo­ stały jako Dzieła złożone,czyliposiadające wieleRealizacjiiMaterializacji'.

Dzieła wieloskładnikowe: ich zawartość intelektualna lub artystyczna jest uzupeł­ niana materiałami dodatkowymi, np. ilustracjami, wstępami itp.;

Dzieła poprawione: ich zawartość intelektualna lub artystyczna jest zmodyfikowa­

na: naogół aktualna wersja zastępuje poprzednią;

Dzieła zebrane/wybrane: dowolne połączenie wielu Dzieł tego samego autora;

Dzieła takie nazywanesą także zagregowanymi;

• tłumaczenia: zawartość intelektualna lub artystyczna pozostaje niezmieniona, ale jest reprezentowana zapomocą różnych konwencji intelektualnych i instrumentów (np. języków);

• różnorodne formy Realizacji: zawartość artystyczna lub intelektualnajest wyrażana zapomocą różnych formRealizacji(np. tekst,obraz, dźwiękitp.);

• wielokrotne tłumaczenia, różnorodne formy Realizacji: Dzieło zawiera zarówno tłumaczenia, jak i różne formy Realizacji [Bennett, Lavoie, O’Neill 2003].

Dzieła złożoneprzysparzają szczególnie wieleproblemów katalogującym. Z drugiej strony, zastosowanie w stosunkudo nich FRBR daje szczególnie wiele korzyści. Stro­ ny Web posiadają wszystkiewymienione cechy jednocześnie, stąd wynikają problemy z ich opracowaniem. Charakterystyki te muszą być uwzględnione w ontologii tych dokumentów. Jednocześnie wszystkie zasygnalizowane problemy dotyczą poziomu Realizacji, z czegowynika potrzeba przyznaniapriorytetu tejwłaśnie jednostce.

Dla celów modelowania opracowania dokumentów sieciowych zaadaptowany zo­

stał trójpoziomowy model Shoichi Taniguchiego [Taniguchi 2002, 2003b], Przewiduje on konceptualizację dokumentu w trójpoziomowej strukturze: Dzieło, Realizacja (tekst) i Nośnik. Można więcstwierdzić, że dokument cyfrowy dostępny wsiecimoże być przedstawiony na tych trzechpoziomach. Poziom Dzieładefiniowany jest podob­ nie jak w FRBR92. Poziom Realizacji dotyczy tekstów zdefiniowanych na początku rozdziału. Ze względu na multimedialny charakter Intemetuw środowisku sieci rozle­ głych przyjęło sięjednak mówić o Obiektach', termin ten będziemy tu rozumieć jako cyfrową Realizację Dzieła. Stosowanie terminu „tekst” do obiektów cyfrowych mo­

głoby sugerować, żegłównym elementem ich treści jest tekst, co nie jestprawdą. Po­ ziom obiektu cyfrowego nie zawiera Dzieła, jest z nimjednak związanyrelacją (zob.

rys. 19). Poziom Nośnika dotyczy Zapisu i Reprezentacji realizacji Obiektu, a więc fizycznej Materializacji. Oznacza to, że wszystkie poziomy tego modelu są skonstru­

138 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji

owane w taki sposób, aby mogły byćwzajemnie rozłączne, czyli wsposób równoległy.

Każdy poziom tego modelu może być traktowany również jako jednostka modelu ER, chociaż model nie stosuje żadnego określonego formalnego języka modelowania kon­

ceptualnego. Dzięki temu możliwe jest przedstawienie modelu w postaci diagramu, reprezentującego jednostki i relacjemiędzynimi.

Rys. 19. Podstawowejednostki modelu (diagram UML,oprać, własne)

Model ten może być łatwo zastosowany do zasobów Intemetu. Nadrzędność jed­ nostki Obiektu(umieszczonej napoziomie Realizacji) pozwalana uzupełnienie modelu o zagadnienia związane z metadanymi, gdyż w przypadku tych zasobów nośnik fi­

zyczny odgrywa znacznie mniejszą rolę, więc niewłaściwe jest tworzenie rekordów bibliograficznychi metadanych w oparciu o atrybutyjednostkipoziomu Materializacji.

Poziom ten należypodzielić najednostki Zapisu i Reprezentacji. Zapisdotyczy same­

gonośnika fizycznego, tego, conazywane jest także formatem fizycznymzależnym od nośnika. Można go określić jako dane zorganizowane w postaci pliku, posiadające cechy wspólne, istotne z punktu widzenia SIW. Reprezentacja natomiast oznacza for­

matowanie obiektu, w tym zagadnienia typograficzne i układ strony wyświetlanej użytkownikowi. Jest ona określana także jako format logiczny, odrębny od nośnika fizycznego, w którym obiektjest utrwalony i przechowywany. Jest to zbiór danych, służący właściwemu odtworzeniu treści reprezentowanych przez jednostki wyższego poziomu (głównie Obiektu). Jednostka ta ma charakter bardziej abstrakcyjny i efeme­ ryczny,z czego wynikają problemy, np. z przydzieleniemjej odpowiednich atrybutów, a więc z jej opisem. Zastosowanie tych dwóch jednostek zamiast jednostki poziomu Materializacji pozwala odpowiednio modelować dokumenty elektroniczne, dzięki odróżnieniu bitów i bajtów - zapisanych na nośniku elektronicznym - od obrazu przedstawionego naekraniemonitora użytkownika.

Charakter sieciowych zasobów elektronicznych powoduje, żemożnapominąć opis na poziomie jednostki Egzemplarza - ich aspekt fizyczny jest minimalizowany. Nie istniejefizyczny egzemplarz, który można wziąć do ręki. Cechy Egzemplarza posiada Materializacja. W środowisku online nie ma rzeczywistej różnicy pomiędzy Egzem­ plarzem a Materializacją, gdyż każdy pojedynczy Egzemplarz jest Materializacją (pomijając tzw. kopie lustrzane). Użytkowniknie wypożycza egzemplarza w tradycyj­

nym sensie: po ściągnięciu na dany komputer dokument staje się nowym egzempla­

Modelowanie sieciowych dokumentów elektronicznych 139

rzem, który może (choć nie musi) być dostępny tylko dla tego jednego użytkownika i tylko w tym określonym czasie. W efekcie zanikają różnice pomiędzy katalogiem stron internetowychabibliografią. Dlatego teżFRBR, inaczej niż funkcjonujące wcze­ śniejprzepisykatalogowania,dotyczyrekordówbibliograficznych,anie katalogów.

Należy powiązać rozwiązania dotyczące katalogowania dokumentów elektronicz­

nych z metadanymi, co spowoduje, że będzie możnaprzejść odfizycznych Materiali­ zacji do Obiektów cyfrowych. Możliwe jest także osiągnięcie pewnego poziomu współdziałania pomiędzy danymi bibliograficznymi tworzonymi na podstawie tej on- tologii a metadanymi tworzonymi zgodnie z wybranym schematem, w naszym przy­ padku- Dublin Core.

Jedną z charakterystycznych cech modelujest zamiar tworzenia opisów bibliogra­

ficznych dokumentów dających pierwszeństwo jednostce Obiekt, przez zastosowanie struktury trójpoziomowej. Takie rozwiązanie przyjęto z kilku powodów. Po pierw­

sze, pewne atrybuty jednostek, takie jak ‘Tytuł’, ‘Oznaczenie odpowiedzialności’,

‘Dane wydawnicze’, dotyczące Egzemplarza, ale niepowiązane tylko z fizycznym nośnikiem Obiektu, związanesąz poziomemObiektu, anie z poziomem Nośnika.Po drugie, każdy poziom,w tym poziomobiektu, posiada własne wystąpienie w każdym dokumencie. W związku z tym poziom Obiektu jest obowiązkowy, podobnie jak poziom Nośnika.

Ucieleśnienie Obiektu polega na umieszczeniu obiektu w sieci i udostępnieniu go użytkownikom. Na podstawie Zapisu indywidualnie dla poszczególnych aplikacji przygotowywana jest Reprezentacja. Nośnik(jako jednostka złożonaz Zapisu iRepre­

zentacji) odgrywajednocześnierolę jednostki niższegopoziomu.

Jednostka wyróżnionana trzecim poziomie - Nośnik - ma charakterzłożony. Skła­ dasię zarówno zabstrakcyjnej, cyfrowej warstwyZapisu,jaki warstwyReprezentacji, określającej sposób przedstawienia użytkownikowi Obiektu na ekranie. Jednostka ta ma więc jednocześnie charakter Materializacji z modelu FRBR (Zapis), jak i jednostki Egzemplarza (Reprezentacja). Wynika to z faktu, że dla obiektów elektronicznych trudno jest jednoznacznie rozdzielić obie te warstwy, stanowiące odrębne jednostki wFRBR.

Zapis jest nazwaną i uporządkowaną sekwencją bajtów, rozpoznawanych przez system operacyjny. Zapis może mieć rozmiar zero lubwięcej bajtów oraz takie atry­ buty, jak ‘Format pliku’, ‘Ograniczenia dostępu’, ‘Statystyki pliku’. Zapis jako jed­ nostka wmodelu może być porównanydo powszechnie znanej idei pliku komputero­

wego. Zapismoże być odczytywany,zapisywany i kopiowany.

Reprezentacjajest zestawem Zapisów niezbędnych do skompletowania i sensow­

nego udostępnienia jednostek poprzednichpoziomów (Dzieła i Obiektu). Na przykład, artykuł w czasopiśmie elektronicznym może składać się z jednego Zapisu w formacie PDF; jest to jego Reprezentacja. Inny artykuł może składać się z jednego Zapisu w formacie SGML i trzech obrazów: te cztery pliki (zwane w dalszej części składni­

kami)łącznietworzą Reprezentację. Należy także zauważyć, że zgodnie zwcześniej­

szymi uwagami, w modelu nie przewidziano jednostki poniżej poziomu nośnika, od­

powiadającegopojedynczemu Egzemplarzowi.

Na rysunku 20 przedstawiono porównanie dwóch modeli: trójpoziomowego i FRBR. Jednostki powinny być konstruowanemetodą połączoną, hierarchiczno-rów-noległą, dzięki czemu można jetraktować wieloaspektowo (tzn. w aspekcie struktural­

nym i indywidualnych wystąpień), w zależnościodpotrzeb.

140 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji

Definiowanie jednostek metodą hierarchiczną prowadzi do powstania czterech pod­

stawowych jednostek bibliograficznych, identycznych z funkcjonującymi w modelu FRBR: są one utworzone zgodnie z procesem uszczegółowiania jednostek od abstrak­ cyjnegoDzieła do Egzemplarza (dokumentu chwilowego), wyświetlonego na ekranie monitora. Przedstawiono jepoprawej stronie rysunku.

Jednocześniejednostkidefiniowane w sposób równoległy sąrówne tym, które wy­ różnione zostały wmodelu trój poziomowym: Dzieło, Obiekt, Nośnik. W tym zestawie jednostek można odnaleźć element odpowiadający Egzemplarzowi w poprzednim

schemacie (związanymz FRBR), który pozwala na zapewnienie reprezentacji cech na poziomie pojedynczegodokumentucyfrowego.Dodatkowajednostkanazywanajest tu Reprezentacją, chociaż- mówiąc ściśle - chodzi tu o dane dokumentu chwilowego.

Jednostki tezostały utworzone jako wynik podziału jednostek w takisposób,aby stały sięwzajemnierozłączne. Jest to zobrazowane po lewej stronie rysunku 20.

Rys. 20. Jednostki bibliograficzne zdefiniowane w obu omawianychmodelach (oprać,własne) Jednostki modelu trójpoziomowego JednostkiFRBR

Dzieło -> Dzieło

Obiekt (dokument dynamiczny) -> Realizacja

Nośnik: Materializacja/Egzemplarz

Zapis -> Materializacja

Reprezentacja (chwilowa reprezentacja dokumentu)

-> Egzemplarz

Warto zastanowić się nad konsekwencjami, jakie niesie przyjęciezaproponowanej struktury na poziomiekonceptualnym, a także- w pewnychprzypadkach - na pozio­ mie wdrożeń.

Należy tworzyć wystąpienie jednostki poziomu realizacji - Obiekt- dla każdego opisywanego dokumentu; dotyczy to także przypadków, gdy wystąpienie Obiektu odnosisię do więcej niż jednego dokumentu. Jeżeli podejdziemydo tego zagadnienia rygorystycznie, okaże się, żema ono związek zlicznością występowania relacji do­

tyczących jednostki poziomu Realizacji', minimalna liczność relacji po stronie Obiektu wynosi 1 (nie zero), zarówno pomiędzy nimaDziełem, jak i pomiędzy nim aNośnikiem. Jest to dość oczywisty wniosek, wynikający z założenia, że jednostka poziomu Realizacji wybrana została jako jednostka nadrzędna. Kolejnym krokiem jest przydzielenie niezbędnych atrybutów, umożliwiających identyfikację i opis do­

kumentu na poziomie Obiektu', zajmiemy się tym później. Należy także utworzyć wystąpienia jednostek bibliograficznych poniżej poziomu Realizacji (tzn. Nośnika) dla każdegodokumentu.

Potrzebne sąszczegółowebadania w celu określeniakryteriów wyróżniania granic jednostki Obiektu. Kryteria te sąniezbędnedo tworzenia opisów irekordów w oparciu o tę jednostkę. Jest to równoważne z utworzeniem kryteriów identyfikacji jednostki poziomu Realizacji (a nawet samego obiektu), gdyż ta jednostka konsoliduje pewną ilość obiektów, posiadających wspólne cechy, z jednym obiektem na poziomie kon­

ceptualnym.

Modelowanie sieciowych dokumentów elektronicznych 141 Na podstawie konceptualnej definicji Obiektu jako jednostki poziomu Realizacji można zauważyć, żeaspekty związane z formatem fizycznym, takiejak czcionka czy układ strony, jednostki tej nie dotycząinie są dla niej relewantne. W efekcieweryfika­

cja podobieństwa (identyczności) obiektów powinna być dokonana na podstawiepo­

równania bajt po bajcie. Mimo żeczasem mało praktyczne, takie porównywanie tek­ stów elektronicznychjestmożliwe, szczególnie dla dokumentów tekstowych i innych DLO. Innym problemem jest to, że jeżeli przyjmiemy powyższe kryteria, to najpraw­ dopodobniej dla każdego pojedynczego Nośnika można będzie znaleźć jego własny, unikalny Obiekt, różnyod wszystkich innych. Obiektidentyczny, ale stanowiącyróżną Materializację fizyczną rzadko występuje w praktyce, z wyjątkiem pewnych rodzajów reprodukcji. Raczej mamy doczynieniaz dużą liczbą Obiektów bardzo podobnych,ale zawierających drobne różnice, które są mało istotne dla większości użytkowników, poza bibliografami i naukowcami, badającymi Obiekty.

W związku z tym praktyczne i odpowiednie wydaje się założenie, że Obiekty są identyczne, o ile nie istnieją dane zewnętrzne, ale związane z Obiektami, które wska­

zują na istnienie różnic między nimi. Należy wypracować właściwe kryteria identyfi­ kacji jednostki Obiektu, biorąc pod uwagę równowagę między wymaganą szczegóło­

wością identyfikacji a praktyczną przydatnością kryteriów. Nie jest to jednak problem z zakresumodelowaniakonceptualnego [Taniguchi 2003a].

6.3.3. Relacje bibliograficzne

Relacje bibliograficzne pomiędzy dokumentami są modelowane jako relacje po­

między wystąpieniami tej samej jednostki bibliograficznej na poziomie konceptual­

nym. Każda relacja pomiędzy danymi dokumentami jest dla nich specyficzna.

W związku z tym istotne jest zbadanie możliwości ich kategoryzacji i wyróżnienia logicznych typów relacji, które mogą występować pomiędzy wystąpieniamijednostek tej samej klasy, w tym jednostkipoziomu Realizacji.

Model FRBR wyróżnia następującerelacjepomiędzy wystąpieniamijednostki Re­

alizacja:

• Streszczenie, rewizja,tłumaczenie pomiędzy wystąpieniami Realizacji tego samego wystąpienia Dzieła',

• Następca, suplement, dodatek, streszczenie, adaptacja, transformacja i imitacja pomiędzy wystąpieniami Realizacji różnych wystąpieńDzieła',

• Relacja część-całość.

Każdy typ relacji może być dalej dzielonyna podtypy.

Należy, oczywiście, opracować właściwy układ typów relacji logicznych wystę­ pujących pomiędzywystąpieniami jednostkipoziomu Realizacji, dążącdo uzyskania modelu dającego pierwszeństwo tej jednostce. Ponieważ układ stosowany w FRBR wydaje się odpowiedni, można zapożyczyć to rozwiązanie (typy relacji) i zastoso­

waćje do jednostki Obiektwmodelu dającym nadrzędność jednostce poziomu Re­

alizacji.

Każde Dzieło może być powiązane relacją z innymi Dziełami, co jest przedsta­

wionena rys. 19i 22jakorelacja Dzieła z samymsobą. Oznacza to, żeróżneobiekty klasy Dzieło mogą być połączone różnego rodzajurelacjami. Najczęściej występują­

cerelacje to:

142 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji

Dziełopowstało zelementów innego Dzieła',

Dzieło rekomenduje inne Dzieło przez odesłaniedo niego;

Dzieło jest opracowaniem krytycznym innego Dzieła',

Dzieło powstało pod wpływeminnego Dzieła.

Relacje te prowadzą do powstania rodzinybibliograficznej Dzieł (superdzieła),po­

zwalającna grupowanieDzieł pokrewnych.

Relacjena poziomie metadanych wyrażane są za pomocą atrybutu ‘Relacja’. Podobnie wyróżnić można wiele relacji pomiędzy różnymi agentami, czyli - ina­ czej mówiąc - pomiędzy różnymi wystąpieniami jednostki Agent (rys. 21). Można tu wyróżnić następujące relacje:

Agent związany jest z nazwąstosowaną przezinnychAgentów(pseudonimem);

Agent związany jest z innym Agentem relacjami rodzinnymi, partnerskimi lub przyjacielskimi;

Agentjest pod wpływem innego Agenta.

Relacje pomiędzyAgentami nie są reprezentowanew ontologii na poziomie meta­

danych, oprócz relacji typu ‘Twórca’-‘Współtwórca’.

Wyróżnione relacjemiędzy Dziełami i Agentami dotyczą obiektów świata rzeczy­ wistego, więc należyzaliczyćje do relacji paradygmatycznych. Dokumenty interneto­ we przechowywane są wraz z dotyczącymi ich metadanymi. Istnieje możliwość wy­ szukiwania obu za pomocą podobnych narzędzi, w szczególności wyszukiwania peł-notekstowego, a użytkownicy uzyskują dostęp do nich poprzez ten sam interfejs.

Jednakże metadane i elementy świata rzeczywistego należą do dwóch różnych pozio­

mów modelowania, przez co dotycząich relacje różnego rodzaju (metadane - relacje syntagmatyczne; elementy świata rzeczywistego - relacje paradygmatyczne). Oba poziomy sąrealizowane przez system komputerowy,jednak dokument elektroniczny może być zapisany w pliku komputerowym, natomiastautor, miejsce lub wydarzenie - nie może. Dla Agenta możnastworzyć rekord metadanych w oparciu o jego atrybuty, informacje pochodzącez zewnątrz lub kombinację obu źródeł. Oczywiste jest jednak, że manipulacje dokonywanena rekordziemetadanych nie wpływająani naAgenta, ani na jego relacje z innymi elementami rzeczywistości pozajęzykowej, np. dokumentami elektronicznymi.

Opis dokumentu możebyć powiązany z opisem autora. Jednak dokonanie podob­ nego powiązania z treściądokumentu jako elementem świata rzeczywistego i opisem autora spowoduje błędy w modelu; treść dokumentu musi być powiązana z autorami jako elementami świata rzeczywistego. Aby uwypuklić różnicę, zauważmy, że mody­

fikacja opisu autora,np. jego usunięcie, nie wpłynie wżaden sposób na autora w świe­ cie rzeczywistym.

Minimalna liczność relacji od strony Dzieła pomiędzytą jednostką a Obiektem po­

winna być określona jako zero lub jeden. Oznacza to, że zgodnie z modelem należy także pozwolić na tworzenie wystąpienia Dzieła dla każdego dokumentu lub alterna­ tywniena tworzenie Dzieław określonychprzypadkach. Innymisłowy,proponuje się, aby wystąpienie Dzieła tworzonebyło w sposób elastyczny.

W przypadkach gdy minimalna liczność wynosi 1, dla każdego dokumentu musi być tworzone przynajmniej jedno wystąpienie Dzieła. Nie kłóci się to z faktem, że Dzieło nie jest jednostką dominującą. Pozwala zaś na dostarczenie użytkownikom pewnej informacjioDziele, ale bez podstawowej informacjiidentyfikującej i opisują­ cej Nośnik. Dzieło możeposiadać pewne atrybuty, takiejak ‘Hasła autorskie’,dotyczą­

Modelowanie sieciowych dokumentów elektronicznych 143 ce ‘Twórców’ Dziełaczy ‘Tytuł ujednolicony’ Dzieła. Zgadzasię to z postulatem czę­

ści badaczy, aby tworzyć i stosować tytuły ujednolicone dla wszystkich Dzieł, co zwiększa rolę tytułów ujednoliconych w przyszłych katalogach OPAC [Ridley 1997;

Vellucci 1998].

Minimalna liczność wynosząca zero oznacza, że należy tworzyć Dzieło tylko w niektórych przypadkach. Zgodnie z przepisami katalogowaniarekordy autorytatyw­

ne dla tytułów ujednoliconych stosowane są w ograniczonych przypadkach lub dla określonych rodzajów dokumentów, więc również wystąpienie Dzieła tworzone jest w ten sam sposób.