ORGANIZACJA WIEDZY W BIBLIOTEKACH
6.3. Ontologią sieciowych dokumentów elektronicznych
6.3.4. Wydarzenia i zintegrowane dokumenty elektroniczne
Wszystkie opisane wcześniej jednostki bibliograficzne istnieją w czasie [Heaney 1997], katalogowanie dotyczy więc obiektów/jednostek fizycznie istniejących w ja
kimś okresie czasu. Możliwe jest ciągłe opisywanie ich istnienia lubteż dokonywanie
„zdjęć migawkowych” ich stanów w danym momencie. Czas trwania niektórych obiektówjest krótki. Często dotyczy tozasobówonline,z czego wynika potrzeba two rzenia projektów mających na celu ich archiwizację. Odpowiedzią na potrzeby uwzględnienia zmian jednostek bibliograficznych w czasie jest wyróżnieniejednostki Wydarzenia, modelującej działanie lub zdarzenie. Wydarzenia zawierają informacje orzeczach, które miały miejsce; mogą izazwyczaj mają związek zokreślonymkontek
stem: datą lub zakresem dat oraz miejscem. Modelowanie Wydarzeń związane jest także z określeniemczynnika działającego - Agenta. Może nim być osoba, organizacja lub instrument (urządzenie, sprzęt komputerowy, oprogramowanie itp.). Z Wydarze niami związane sądane wejściowei wyjściowe. Wydarzenia dotyczą jednej lub więcej jednosteki sątakże jednostkąmodelu.
Dodanie jednostki Wydarzenia umożliwia umieszczenie informacji o działaniach, które prowadządo tworzonego źródła informacji. Jednostka Wydarzenia posiada atry
buty,które zjednej strony opisują Wydarzenie,a z drugiej stanowią łączniki pomiędzy Wydarzeniami a innymi jednostkami i ich atrybutami. Można, przykładowo, dla Dzieła wyróżnić atrybut posiadania ‘Tematu’, natomiast dla Wydarzenia tworzenia Dzieła -
‘Miejsce i czas’jego utworzenia(chociażjako atrybuty jednostki abstrakcyjnej są one zazwyczaj nieznane), i powiązać relacją z jednostką Twórcy(Agent). Być możeprzy
datne byłoby tworzenie relacji pomiędzy jednostkami różnych wydarzeń. Można tego dokonać przez potraktowanie Wydarzenia jako obiektu pierwszej klasy (FCO), a nie jednostki opisanej zestawem atrybutów. Wyróżnienie Wydarzeń podnosi je do rangi obiektów pierwszej klasy, umożliwiając przydzielenie im cech opisowych. Wszystkim Agentomzwiązanymz Wydarzeniami równieżprzyznaję się status obiektów pierwszej klasy. W ten sposób możliwe jest reprezentowanie złożonych relacji pomiędzy jed nostkami Wydarzenie i Agent.
Dokumenty elektroniczne podlegają transformacjom, dokonywanym przez Agentów: autorów, tłumaczy, ilustratorów, wydawców, webmasterów itp. Określenie
‘transformacje’jest więc bardzo ogólne: obejmuje różnego rodzaju Wydarzeniazacho
dzące wcyklu życia dokumentu elektronicznego, od powstaniajego idei przez utwo rzenie, umieszczenie w sieci, modyfikacje (a także: tłumaczenia, ilustrowania itp.), użycie w celu tworzenia innego Dzieła, ażpo jegousunięcie.
144 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji
Dzięki takiemu zastosowaniu w ontologii jednostki Wydarzeń możliwe jest także odrębne przedstawienie elektronicznych wersji Dzieł jako pełnoprawnych jednostek, a jednocześnie ukazanie ich relacji z oryginalnymi wydaniami tradycyjnymi (drukowa nymi). Podczas „cyklu życia” obiektu cyfrowego występująwydarzenia powodujące jego transformacje od oryginalnego druku czy innego obiektu niecyfrowego do repre zentacji cyfrowej oraz wydarzenia podrzędne,dające transformacje związane z edycją lub migracją obiektu cyfrowego [Jantz, Giarlo 2005]. Na rysunku 21 przedstawiono trzy głównetransformacje wpływające na formę fizycznąi dające pewność, że Repre
zentacja Obiektu widoczna na ekraniekomputera jest wiernym przedstawieniem orygi
nalnegoartefaktu.Transformacja Tl oznacza proces digitalizacji, któregoefektem jest Wydarzenie tworzenia Obiektu cyfrowego. Transformacja T2 oznacza transformację Obiektucyfrowego dlaurządzeń wyjściowych, takichjak drukarka lub ekranmonitora.
Jestonazależna od oprogramowania stosowanego doprzesłania bajtów z pamięci dys
kowych (jednostka Zapis) do urządzenia wyjściowego. Transformacja T3 przedstawia wieleróżnych transformacji spowodowanych wydarzeniami edycji obiektu, co zazwy
czaj powoduje modyfikację treści obiektu, a więc jest wydarzeniem skutkującym po
wstaniemnowego Obiektulub jego migracją.
Dokument tradycyjny
Obiekty transformowane
Oryginalny obiekt cyfrowy Urządzenie wyjściowe
Rys. 21. TransformacjeObiektu cyfrowego (oprać,własne)
Obiekt cyfrowy może być powiązanyz rekordem transformacji, w którym zapisy
wane są przemiany związanez Obiektem. Transformacje te opisywane sąza pomocą wystąpień jednostki Wydarzenie. Rekord ten może zawierać opis wydarzeń dotyczą
cychObiektu wraz z ich atrybutami.
Można wyróżnićnastępujące Wydarzenia'.
• Ostatnia aktualizacja;
• Ostatnia wizyta;
• Tworzenie Dzieła',
• WyrażanieDzieła przez Obiekt',
Modelowanie sieciowych dokumentów elektronicznych 145
• Ucieleśnianie Obiektu przez Nośnik',
• EgzemplifikacjaNośnika w dokumencie chwilowym(Reprezentacja)',
• Modyfikacja:
- tłumaczenie, -ekstrakcja, -kompilacja, - reformatowanie, - wyprowadzanie, -edycja.
Rys. 22. Jednostkimodeluuzupełnione o jednostkęWydarzeń (diagram UML,oprać, własne)
Wśród Wydarzeń związanych z powstawaniem kolejnych jednostek modelu znaj
dują się Wydarzenia podporządkowane, takiejak ‘tłumaczenie’, ‘publikowanie’, ‘adap
tacja’, ‘ilustrowanie’, ‘kodowanie’, ‘formatowanie’ itp. Wydarzenia te powinny być traktowane jako odrębna jednostka, posiadająca swoje atrybuty, takie jak ‘Czas’,
‘Miejsce’, ‘Wejścia’ i ‘Wyjścia’. Część Wydarzeń będzie miała swoje atrybuty wej
ściowei wyjściowe. Naprzykład Wydarzenietłumaczenia następuje pomiędzy dwiema Realizacjami Dzieła. Inne wydarzenia będą miały tylko atrybuty wyjściowe, np. two
rzenie Dzieła niepowstałegona podstawie innego Dzieła.
146 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji
Dzięki takiemu uzupełnieniu ontologii o opis Wydarzeń możliwe jestprzedstawie
nie złożonych relacjipomiędzy jednostkami bibliograficznymi. Pozwoli to na realiza
cję nowych możliwości wyszukiwawczych, dzięki eliminacji ograniczeń charaktery stycznych dla dyskretnych rekordów opisu bibliograficznego związanych z niezmien
nymi obiektami informacyjnymi. Zastosowanie jednostki Wydarzeń zmusza do przy znaniawszystkim Wydarzeniom związanym z Dziełem, Obiektem i Nośnikiem statusu jednostki pierwszej klasy, dzięki czemu uzyskuje się możliwości znacznego wzboga
cenia opisu. Zastosowanietej cechy ontologii w systemach informacyjnych umożliwi współdziałanie między serwisami i ich harmonijny rozwój, dostosowany do potrzeb przyszłego wzrostu ilości danych i treściintelektualnych.
Rys. 23. Tworzenie nowego dokumentu (oprać,własne)
Coraz częściej zdarza się, że dokumenty elektroniczne dzielone są na części, po
wtórnie wykorzystywane do tworzenia nowych dokumentów. Taka sytuacja zilustro wana jest na rysunku 23. Przedstawiono tu poszczególne jednostki modelu (reprezen towane symbolami w kółkach i elipsach), które powstają w wyniku oddziaływania kolejnych Wydarzeń (reprezentowanych symbolami w kwadratach). Każdej jednostce bibliograficznej i jednostce Wydarzeń odpowiadająodpowiednie atrybutyi ich wystą
pienia,czyli metadane. Zostało to zaznaczone tylko dlaDzieła D1 i związanych znim kolejnych jednostek. Sposób tworzenia i przydzielania metadanych poszczególnym jednostkom ontologii przedstawiony został na rysunku 27. Wydarzenie W1 może być
Modelowanie sieciowych dokumentów elektronicznych 147
naprzykładwydarzeniem tworzenia, w któregoefekcie powstaje Dzieło Dl. Następnie realizowane jest Wydarzenie W2, powodujące transformację Dzieła w Obiekt Ol. To samo Wydarzenie W2 może jednakdoprowadzić do powstania innego Obiektu -02, który pojawił się w wyniku kolejnego Wydarzenia - W3, które może być, na przy kład,tłumaczeniem tekstu dokumentu elektronicznego. Wydarzenie W4 prowadzi do powstania Nośnika N1, składającego się z Zapisu Z1 i z Realizacji Rl. Zapisy Z1 i Z2 obu Nośników - N1 i N2, mogą stać się podstawą powstania nowego Obiektu 04, stanowiącego realizację nowego Dzieła D3. Zauważmy, że Wydarzenia podob nego rodzaju oznaczonezostały tym samym numerem,np. Wl, Wl’ i Wl”.Wszyst
kim jednostkom towarzyszą, oczywiście, odpowiednie atrybuty i ich wystąpienia, czyli metadane.
Rys.24.Składniki i agregatydzieła (diagram UML,oprać, własne)
W wyniku realizacji wydarzeń Wl, Wl’ i Wl” powstają strony Web, stanowiące zazwyczaj zestaw różnego rodzaju składników. Omawianyrysunek przedstawia model tworzenia multimedialnej strony WWW: wiele różnych obiektów (teksty, grafika, dźwięk itp.), stanowiących składniki Dzieła (Zapisy), łączonych jestwcałość, po czym przedstawiane są one użytkownikowi (Reprezentacja). Składniki te mogąpochodzić z innych Dzieł lub być tworzone specjalnie na potrzeby powstającego Dzieła. Składniki ulegają częstym i różnorodnym modyfikacjom. Można wyróżnić następujące rodzaje zależnościmiędzyskładnikami:
• całość: wszystkie składniki prezentowane jednocześnie, w uporządkowany spo
sób;
• wariant: prezentacja tylko części składników;
• synchronizacja: równoległa prezentacja w czasie rzeczywistym;
• aktualizacja: starszy składnik jest zastępowany nowszym;
• rozszerzenie: nowe składnikisą dodawane do wcześniej istniejących;
• tworzenie na podstawie: jeden składnik jest wynikiem modyfikacji jednego lub więcej innych składników;
• część: jedenskładnik jest częścią innego składnika.
W wyniku łączenia wieloskładnikowych Dzieł w większe Dzieła powstaje Dzieło zagregowane. Z tego punktu widzenia strony Web sązasadniczo obiektami zagrego
wanymi; są to zwyklestruktury hierarchicznie uporządkowanych podstron.
Relacja agregacji może byćzdefiniowana z punktu widzenia treściinformacyjnych lubopisufizycznego.W zakresie treści informacyjnych agregacja występuje zazwyczaj
148 Opis dokumentów elektronicznych. Teoretyczny model i możliwości jego aplikacji
pomiędzy Dziełami,gdy jednoDzieło jest częściądrugiego. Może jednak występować pomiędzy Nośnikami lub ich częściami składowymi, np. w przypadku tekstu lub ilu stracjiwyświetlanej dla jednegoużytkownika, a niewyświetlanej dla innego. Agregacja z punktu widzenia opisu fizycznegowystępujeraczej pomiędzy Obiektaminiż Dziełami.
Rys. 25. Agregacje(oprać, własne)
Obiekty zagregowane powstają przez łączenie w większą całość w miarę równo rzędnych Dzieł,np. poszczególne strony Web stanowią podstrony strony głównej (do mowej). Agregacja Dzieł w tych dokumentach wynika więc z zastosowania struktury hipertekstu. Zależności między składnikami Dzieła i jego agregatami przedstawione są na rysunku 24. Na kolejnej rycinie (rys. 25) przedstawiono model agregacji Dzieł na poziomie Nośnika, a nie Dzieła. Jak widać, Obiekty ucieleśniane są dwutorowo: po pierwsze, każdy Obiekt otrzymuje swój Nośnik, a oprócz tego wszystkie Obiekty są agregowane w Nośniku zagregowanym. Agregacja umieszczona w tym miejscu mo
delupowoduje, że agregaty traktowane sąjakojednostki fizyczne, a nie abstrakcyjne.
Jednostka poziomu Realizacji (Obiekt) utrzymuje swój związek z jednostką poziomu Materializacji (Nośnikami)', możliwa jest również identyfikacja poszczególnych Dzieł.
Nie uległa natomiast ograniczeniu możliwość odróżnienia Dzieła od Obiektu. Narys.
19 i 22 przedstawiono dozwoloną liczność relacji między Obiektem i Nośnikiem jako
„wiele do wielu”; taka sytuacja oznacza, że Nośnikposiada wiele Obiektów, a więc Dziełojest zagregowane. Agregat Dzieł powinien funkcjonować na zasadzie „czarnej skrzynki”: można w nim umieszczać jednostki bez potrzeby dokonywania w nich zmian ani ograniczania wartości ich atrybutów. Dzięki uznaniu agregatów zaelementy strukturalnesą one widoczne dla użytkownika. Ułatwiatoich efektywną implementację.
Jednym z największych problemów dotyczących dokumentów elektronicznych udostępnianych wsiecijest konieczność uwzględnienia ich ciągłychmodyfikacji. Sy
tuacja ta przedstawiona została na rysunku 26. Modyfikacja dokumentu (Wydarzenie W4 i W6) powoduje powstanie nowego Obiektu i jego materializacji, czyli nowego Nośnika. W efekcie pojawia się konieczność tworzenia kolejnych opisów najnowszej wersji dokumentu elektronicznego. Powstaje sytuacja nazywana czasem „tworzeniem
Modelowanie sieciowych dokumentów elektronicznych 149
zdjęćmigawkowych” -opisuje się bieżący stan Obiektu, z góry zakładając, że stan ten będzie ulegał szybkim zmianom. Modyfikacje dokumentów elektronicznych często sprawiają, że wiele atrybutów (szczególnie ‘Tytuł pierwotny’) całkowicie zanika.
W związku z tym jedynym praktycznym wyjściem jest stosowanie aktualnych atrybu tów, tzn. atrybutów jednostek dostępnych w czasie katalogowania. Zmiany mogą być odnotowywanew strefie uwag. Sytuacje przedstawione na rysunkach 23 i 26 można łatwo połączyć, co jeszcze lepiej zobrazuje płynność i niestabilność dokumentów w środowiskuelektronicznym,szczególnie w sieciach rozległych.
Atrybuty
Rys.26. Kolejne aktualizacje dokumentu elektronicznego (oprać,własne)