• Nie Znaleziono Wyników

1.4. Modele bibliotek cyfrowych

1.4.1. Model OAIS

1.4.1.2. Standard PAIS

PAIS (ang. Producer-Archive Interface Specification) to standard opracowany w roku 2014, rozwijający początkowe elementy modelu OAIS – Producenta oraz przygotowanie pakietu SIP (Submission Information Package). Bazą standardu PAIS jest wyżej opisana metodologia współpracy między Producentem a Archiwum PAIMAS, opisująca fazę formalizacji (formal definition phase), przesyłania (transfer phase) oraz walidacji (validation phase) informacji.

W fazie formalizacji Producent i Archiwum wypracowują model obiektu transferowego – MOT (ang. Model of Object for Transfer) stanowiący zestaw deskryptorów dla tego konkret-nego projektu, a także specyfikacje zawartości SIP i ich ograniczenia (constraints). Opisuje on strukturę przesyłanych do Archiwum obiektów, ich organizację w kolekcje, sekwencje, ograniczenia oraz relacje między nimi. Obiekty dla Archiwum, umieszczane są w tak zdefi-niowanej strukturze, wyrażonej poprzez plik tekstowy XML. Skomponowany w ten sposób pakiet SIP przesyłany jest do Archiwum, gdzie jest odbierany i poddawany weryfikacji. Pakiet SIP stanowi kontener kolejno kapsułowanych zestawów informacji, począwszy od danych poprzez ich ustrukturyzowane grupy. Powstawanie SIP ilustruje Rysunek 9:

Źródło: Producer-Archive Interface Specification (PAIS): recommended standard. CCSDS, 2014, s. 5-9. [Dostęp 18 maja 2020]. Dostępny w Internecie: https://public.ccsds.org/Pubs/651x1b1.pdf

Rysunek 9: Struktura pakietu SIP

W pierwszej fazie formowania powstaje pakiet Danych (Data Object) złożony ze strumienia bitów oraz identyfikatora (deskryptora) obiektu. Pakiet Danych jest częścią Grupy Obiektów (Transfer Object Group) zaopatrzonych w odpowiedni identyfikator. W skład jej struktury mogą wchodzić zarówno Dane, jak i inne Grupy obiektów. Ta zaś wchodzi w skład Obiektu Transferowego (Transfer Object), także z właściwym identyfikatorem, Obiekty Transferowe składają się na kontener SIP, zaopatrzony w odpowiedni nagłówek (SIP Global Information).

Zawiera on takie dane, jak: identyfikator SIP jednoznacznie oznaczający pakiet SIP, identyfi-kator projektu, w ramach którego jest dostarczany, identyfiidentyfi-kator Producenta, identyfiidentyfi-kator typów obiektów dozwolonych w SIP (SIP Constraints) w konkretnym projekcie, numer kolejny pakietu SIP i dowolne inne identyfikatory, o ile zostaną zdefiniowane.

Specyfikacja PAIS pozwala na zmianę zawartości Archiwum przez Producenta. W tym celu Producent przesyła w ramach SIP informacje wskazujące Obiekty Transferowe wcześniej przesłane do Archiwum, które Archiwum musi usunąć (Transfer Objects to Delete). Chociaż kłóci się to nieco z potocznym rozumieniem długoterminowego zachowania jako swoistej

„wieczystości” zawartości Archiwum, mechanizm ten uprzystępnia ścieżkę rafinacji przecho-wywanego tam zasobu. W praktyce tworzenia BC zachodzi potrzeba korekty i wymiany obiektów Archiwum, chociażby ze względu na dostrzeżone błędy w przygotowaniu zasobu, konieczność uzupełnienia obiektów lub zastąpienia nowszymi wersjami (np. lepsze rozpozna-nie tekstów).

Standard PAIS przewiduje adaptację (specialization) jego reguł na potrzeby konkretnych implementacji, np. wypracowania tzw. dziedzinowego modelu SIP (Domain SIP Model) lub projektowego modelu tego pakietu. Jednakże adaptacja może polegać jedynie na:

• dodaniu atrybutów definiowanych przez użytkownika, o ile są one przewidziane w modelu bazowym SIP,

• usunięciu atrybutów opcjonalnych lub

• modyfikacji istniejących atrybutów, poprzez ograniczenie ich występowania, zmianie ich statusu („opcjonalnego” na „obowiązkowy”) lub ograniczeniu swobody wartości poprzez przyjęcie ich zamkniętej listy.

Dokumentacja PAIS ilustruje implementację standardu z zastosowaniem schematu XFDU (ang. XML Formatted Data Unit)158, wyrażanego za pomocą języka znaczników XML. Sam XFDU jest także uznany za normę ISO (20652:2006), lecz standard PAIS dopuszcza inne schematy opisu pakietów SIP, w tym standard METS159.

Uzupełnieniem powyższych standardów jest kolejny dokument wydany w 2016 roku przez CCSDS pt. „Producer-Archive Interface Specification (PAIS) – tutorial”160, gdzie zawarto wskazówki do implementacji PAIS, poparte przykładowymi wdrożeniami. Jednym z nich jest wypracowane wraz z CCSDS wdrożenie elementów PAIS w Narodowej Bibliotece Francji (BnF), wykorzystujące w miejsce XFDU – stosowany w dziedzinie zachowania cyfrowych reprezentacji dziedzictwa kulturowego w świecie instytucji kultury schemat – METS. Reali-zacja w BnF ma charakter testowy i nie jest użytkowana operacyjnie. Przyjęto, że zawartością jednego SIP jest jeden numer czasopisma, reprezentowany przez zbiór plików archiwalnych TIFF oraz pliki tekstowe z rozpoznanym tekstem gazety. MOT jest bardzo prosty – obejmuje nazwę kolekcji, jej trwały, unikalny identyfikator typu ARK (Archival Resource Key161) oraz właściwy obiekt – pliki pojedynczego wydania gazety. Fizyczna struktura każdego Obiektu Transferowego (czasopismo, numer, strona, plik) jest przyporządkowana do poszczególnych poziomów Obiektu w sposób jak na rysunku 10:

Źródło: Producer-Archive Interface Specification (PAIS) – tutorial: informational report. CCSDS, 2016, s. 6-40.

[Dostęp 18 maja 2020]. Dostępny w Internecie: https://public.ccsds.org/Pubs/651x2g1.pdf

158XML Formatted Data Unit (XFDU). Structure and construction rules. Recommended standard. CCSDS, 2008.

[Dostęp 18 maja 2020]. Dostępny w Internecie: https://public.ccsds.org/Pubs/661x0b1.pdf

159Metadata Encoding & Transmission Standard. [Dostęp 18 maja 2020]. Dostępny w Internecie: http://

www.loc.gov/standards/mets.

160Producer-Archive Interface Specification (PAIS) – tutorial: informational report. CCSDS, 2016. [Dostęp 18 maja 2020]. Dostępny w Internecie: https://public.ccsds.org/Pubs/651x2g1.pdf

161Archival Resource Key (ARK) Identifiers. [Dostęp 18 maja 2020]. Dostępny w Internecie: https://n2t.net/e/

ark_ids.html

Rysunek 10: Obiekt Transferowy (Narodowa Biblioteka Francji)

Pakietowi najniższego poziomu – Danym (Data Object) odpowiada plik tekstowy z rozpozna-nym tekstem (text) oraz bitmapa zawierająca obraz strony dokumentu (image). Oba typy Danych są pogrupowane w Obiekty Grupowe – odpowiednio master i ocr, czyli zbiory (foldery) plików składające się łącznie na Obiekt Transferowy (Transfer Object) – odpowia-dający wydaniu (issue), tu: numerowi gazety. Dodatkowo wskazane są identyfikator obiektu (ark) oraz nazwa kolekcji, do której przynależy obiekt.

Powyższa struktura obiektowa jest wyrażana w hierarchicznej strukturze znaczników METS w sposób jak na Rysunku 11:

Źródło: Producer-Archive Interface Specification (PAIS) – tutorial: informational report. CCSDS, 2016, s. 6-42.

[Dostęp 18 maja 2020]. Dostępny w Internecie: https://public.ccsds.org/Pubs/651x2g1.pdf

Jest ona zinterpretowana na odpowiednich poziomach i elementach pakietu SIP jak na rysunku 12:

Źródło: Producer-Archive Interface Specification (PAIS) – tutorial: informational report. CCSDS, 2016, s. 6-42.

[Dostęp 18 maja 2020]. Dostępny w Internecie: https://public.ccsds.org/Pubs/651x2g1.pdf

1.4.2. 5S – formalny model biblioteki cyfrowej

Koncepcja modeli 5S (Stream, Structures, Spaces, Scenarios, Societies) powstała w roku 1999 w ramach prac grupy badawczej BC funkcjonującej przy Virginia Polytechnic Institute

Rysunek 11: Odwzorowanie struktury Obiektu Transferowego w schemacie METS

Rysunek 12: Powiązanie schematu METS ze strukturą pakietu SIP

w USA. Jest ona oparta na nieformalnej definicji BC, określającej obszary jej działania. W jej myśl BC to złożony system162, który:

a. Pomaga zaspokajać informacyjne potrzeby użytkowników. Stanowią ją wszyscy uczestnicy interakcji z biblioteką, zarówno ludzie, jak i komponenty programowe i sprzętowe. Można tu wymienić czytelników, producentów treści, menadżerów, projektantów, nauczycieli i studentów oraz wszelkie pomoce informatyczne systemu.

Kontekstem tego obszaru biblioteki są istotne dla społeczności regulacje, tj. polityki, strategie, regulaminy, prawa dostępu i użycia, zasady bezpieczeństwa i prywatności.

b. Dostarcza usługi informacyjne użytkownikom (scenariusze). Należą do nich wszelkie

„sposoby użycia” elementów systemu, opisywane z punktu widzenia użytkownika różnych funkcjonalności. Scenariusze opisują i modelują usługi, aktywności i zadania wykonywane w systemie.

c. Organizuje informację w użyteczny sposób (struktury). Struktury określają sposoby i środki, jakimi organizowane są elementy biblioteki. Zalicza się do nich hipertekst, taksonomie, połączenia systemowe, relacje między użytkownikami etc. Tu także przynależą logiczne struktury dokumentów, jak podział na rozdziały, sekcje, podtytuły, paragrafy itp. Stanowią one „ramy” dla informacji.

d. Prezentuje informację w użyteczny sposób (przestrzenie). Przestrzenie to zestawy elementów z towarzyszącymi im procedurami.

e. Komunikuje informację użytkownikom (strumienie). Strumienie to sekwencje elemen-tów określonego typu (bity, znaki, obrazy), statycznej lub dynamicznej natury (tekst, wideo lub dane geolokalizacyjne). Strumień może także obrazować przepływ informa-cji w obrębie systemu komunikacyjnego, jakim jest BC, kodowanej przez nadawcę i dekodowanej po stronie odbiorcy.

Poszczególne obszary biblioteki zostały zwizualizowane za pomocą „mapy definicji”, zawie-rającej wszystkie elementy biblioteki połączone grafami. Wskazują one zależności między elementami w powiązaniu z elementami wcześniej określonymi. Fundamentalną koncepcją 5S jest tzw. minimalna biblioteka cyfrowa. Określa ona konieczne i wystarczające elementy oraz relacje konstytuujące bibliotekę, bez których nie można byłoby jej za bibliotekę uznać.

Zgodnie z nią BC to repozytorium kolekcji złożonych z obiektów cyfrowych i

skatalogowa-162M. A. Gonçalves: Streams, Structures, Spaces, Scenarios, and Societies (5S): A Formal Digital Library Framework and Its Applications. 2004, s. 6-9. [Dostęp 19 maja 2020]. Dostępny w Internecie: https://

theses.lib.vt.edu/theses/available/etd-12052004-135923/unrestricted/MarcosDissertation.pdf

nych metadanych, które zapewniają użytkownikom przynajmniej usługi przeglądania, indek-sowania i wyszukiwania. Tak skonstruowaną mapę modelu 5S przedstawia Rysunek nr 13:

Źródło: Gonçalves M.A.: Streams, Structures, Spaces, Scenarios, and Societies (5S): A Formal Digital Library Framework and Its Applications. 2004, s. 16. [Dostęp 19 maja 2020]. Dostępny w Internecie: https://

theses.lib.vt.edu/theses/available/etd-12052004-135923/unrestricted/MarcosDissertation.pdf

Metodologicznym celem koncepcji 5S jest precyzyjne projektowanie BC za pomocą genera-tora przetwarzającego formalnie opisane składowe biblioteki, determinujące jej architekturę i pożądane funkcje.