• Nie Znaleziono Wyników

Rozdział 2. Uwarunkowania regionalnych bibliotek cyfrowych

2.2. Właściwości obiektów cyfrowych

2.2.1. Numeryczna reprezentacja

Podstawową cechą technologii cyfrowych jest to, że ich obiekty niezależnie od tego, czy były utworzone na komputerze, czy zostały pozyskane w drodze digitalizacji, są liczbami zapisa-nymi w postaci cyfrowej309. Dzięki temu posiadają dwie zasadnicze właściwości:

• obiekt ten może być opisany matematycznie – w postaci funkcji,

• obiekt cyfrowy może zostać poddany obróbce algorytmicznej, tj. stać się przedmiotem działania programu komputerowego. Jest więc obiektem programowalnym.

308L. Manovich: Język nowych mediów. Warszawa: Wydawnictwa Akademickie i Profesjonalne, 2006, s. 81-83.

309Tamże, s. 92.

W przypadku obiektów pozyskanych w drodze konwersji z obiektów analogowych (ciągłych), konwersja ta dokonuje się w drodze dwóch operacji: próbkowania i kwantyzacji. Pierwszy proces polega na skokowym odczycie ciągłej wielkości analogowej, najczęściej w regular-nych odstępach, a częstotliwość próbkowania definiuje rozdzielczość obiektu cyfrowego.

Następnie próbki są kwantyzowane, tj. zostaje im przypisana wartość liczbowa z określonej przestrzeni liczb (przykładowo od 0 do 255 – dla obrazów w skali szarości) zapisywanej w przypadku współczesnych technologii komputerowych w systemie dwójkowym. O ile próbkowanie jest techniką właściwą niektórym mediom tradycyjnym (ciąg klatek filmu próbkuje kontinuum czasowe, zrastrowany półtonowy wydruk ilustracji jest zbiorem próbek, jednakże o różnych wielkościach), to numeryczna reprezentacja stanowi o istocie cyfrowych obiektów.

2.2.2. Modularność

Modularność stanowi tę cechę obiektów cyfrowych, która umożliwia składanie całości z mniejszych elementów, które zachowują swoją strukturę oraz własności310. Umożliwia to łączenie wielu drobnych cyfrowych całostek w struktury, a te z kolei mogą stać się składni-kami obiektów wyższego rzędu. Ta cecha stanowi też podstawę technik wytwarzania oprogra-mowania oraz cyfrowych obiektów, zwaną programowaniem obiektowym. Pozwala ono na wykorzystywanie wcześniej wytworzonych cyfrowych „klocków” do budowy funkcjonalnie różnych programów i obiektów złożonych. Odrębnym przykładem modularności jest techno-logia OLE (obiektów osadzonych) stosowana np. przez firmę Microsoft, dzięki której twórca dokumentu może włączać doń zewnętrzne składniki, z zachowaną możliwością edycji we właściwej im aplikacji. Prostą ilustracją modularności jest także zwykła strona WWW, która w istocie jest interpretowanym przez przeglądarkę plikiem tekstowym zawierającym odnośniki do różnego rodzaju cyfrowych obiektów (obrazów, dźwięków, filmów), przecho-wywanych przez komputery znajdujące się w różnych fizycznych lokalizacjach. Interpreter przeglądarki „składa” szereg odrębnych elementów w postać zwartego wizualnie dokumentu i wyświetla go użytkownikowi. Bardziej złożone techniki pozwalają na łączenie rozmaitych składników, np. zapisu filmowego z tekstem, obrazu z linkami WWW, ekstrahowania warstw tekstowych i graficznych obiektów cyfrowych, możliwości oddzielnej obróbki i prezentacji ich w rozmaitych kombinacjach „złożeń”.

310Tamże, s. 95.

Globalnym przykładem modularności jest sam Internet. Wykazuje ją w zakresie tzw. logicz-nego stosu protokołów składających się na warstwy realizujące różnorakie funkcje, komuni-kujące się za pomocą zestawu funkcji udostępnianych programistom warstwy wyższej.

Standaryzacja protokołów transportowo-kontrolnych Internetu umożliwia jego szybką rozbu-dowę poprzez ustanawianie kolejnych węzłów trasowania. Separacja z kolei od warstw niższych zapewnia możliwość dołączanie nowych usług (jak WWW) do już istniejących oraz łatwą do przeprowadzenia rozbudowę użytkowego oprogramowania klienckiego, poprzez instalację niezależnie wytworzonych „wtyczek” (ang. plug-in).

Podobnie modularność jest istotną właściwością polskiego systemu bibliotek cyfrowych, wśród których każda instalacja jest kolejnym węzłem sieci zasobu i wymiany danych, dzięki właściwościom protokołu OAI-PMH. Zastosowanie zestandaryzowanego mechanizmu wymiany metadanych otrzymanych z innych węzłów systemu BC umożliwia przykładowo prezentację listingu odpowiedzi, złożonego z odnośników do zasobu przechowywanego lokal-nie oraz zdallokal-nie. Interfejsy bibliotek cyfrowych opartych o system dLibra umożliwiają także płynną zmianę wersji językowej interfejsu, natomiast cyfrowe publikacje, w zależności od formatu plików mogą być prezentowane w rozmaitych perspektywach wizualnych, co związane jest z ich wewnętrzną organizacją.

Każdy obiekt cyfrowy jest zatem złożony z obiektów niższego rzędu, przy czym cyfrowym

„atomem” jest, w zależności od rodzaju obiektu: piksel, znak tekstowy, ostatecznie zaś – pojedynczy bit. Przykładem ilustrującym modularność obiektów cyfrowych są pliki formatu DjVu lub PDF, powszechnie stosowane w polskim systemie bibliotek cyfrowych. Plik graficzny w trakcie przetwarzania do tego formatu za pomocą programu – „kompresora” jest dzielony na „warstwy”, posiadające różne parametry jakościowe (rozdzielczość, stopień kompresji). Dodatkową możliwością jest wykonanie rozpoznania tekstu z obrazu, który zapisywany jest w kolejnej warstwie pliku. Są one następnie „sklejane” programowo w jeden plik wynikowy, a każda tych warstw może zostać wyświetlona z pominięciem innych (w DjVu), tekst zaś – przeszukany.

Wariantem modularności jest także komputerowa baza danych, której konstrukcja oddziela strukturę danych (tablice, rekordy, relacje) od przechowywanych w niej danych. Umożliwia ona elastyczne prezentowanie danych w różnych bazodanowych perspektywach,

umieszcza-nie ich w rozmaitych interfejsach, które mogą być zmieniane w trakcie korzystania z systemu informatycznego.

2.2.3. Automatyzacja

W dziedzinie mediów cyfrowych automatyzacja, czyli możliwość wykonywania zaprogramo-wanych czynności bez udziału człowieka311, możliwa jest dzięki ich numerycznej postaci oraz modularności. Szereg operacji, takich jak wstępna obróbka graficzna obrazów, rozpoznawanie tekstu (ang. optical character recognition – OCR), wsadowe przetwarzanie obrazów, indekso-wanie bazodanowe i sieciowe (indeksy wyszukiwarek) oraz sama prezentacja zasobu, który jest serwowany na żądanie programu-klienta jest w istocie wytwarzaniem nowych obiektów lub ich konwersją za pomocą algorytmów, z których początkowy może przekazywać wyniki swojego działania następnemu. Niektóre programy użytkowe (Photoshop, Word) oprócz funkcji „gotowych” do użytkowania, mają funkcję rejestracji sekwencji czynności wykony-wanych przez użytkownika. W wyniku tego powstają nowe ciągi algorytmów, które mogą zostać zapisane i ponownie uruchomione. Inne przykłady to kreatory instalacji oprogramowa-nia i sprzętu, oprogramowanie serwerów WWW, formatujące i wysyłające do przeglądarki w czasie rzeczywistym stronę HTML, wytworzoną według szablonów oraz oprogramowanie stosujące sztuczną inteligencję, takie jak systemy eksperckie, prognostyczne czy sieci seman-tyczne.

Podstawą sprawnego działania sieci rozległej jest automatyzacja działania jej protokołów wszystkich poziomów, począwszy od protokołu dostępu do łącza wraz z obsługą kolizji, protokołów trasowania pakietów w sieci, kontroli kompletności transmisji wraz z korektą błędów, kapsułowania pakietów przy przejściach przez sieci, w których obowiązują różne protokoły transmisji lub też obsługi nazw domen. Wysoki stopień automatyzacji sprawia, że użytkownik korzystający z sieci nie ma i nie musi mieć świadomości jej faktycznych operacji, związanych z podtrzymywaniem skutecznej komunikacji i może ograniczyć się do użytkowej obsługi aplikacji wysokiego poziomu.

Drugim polem automatyzacji, po gromadzeniu i przetwarzaniu danych jest ich porządkowanie i udostępnianie. Potężne ilości informacji powstające w środowisku cyfrowym stworzyły potrzebę stosowania narzędzi przeszukujących i filtrujących teksty, dokonujących automa-tycznej indeksacji. Wyszukanie informacji w Internecie stało się możliwe dzięki

wyszukiwar-311Tamże, s. 97.

kom, których crawlery – programy wędrujące po sieci hipertekstu – tworzą indeksy wielomi-liardowych kolekcji stron. Są one następnie gromadzone w bazach danych, indeksowane oraz w wyniku zapytań użytkowników szeregowane zgodnie z algorytmem ustalającym ich ranking. Automatyzacja dotyczy także archiwizacji zawartości sieci, którą podjęto w ramach projektu Internet Archive – nadając sieci rozległej oś czasu.

Zgodnie z zamierzeniami twórcy WWW Tima Bernersa-Lee kolejnym etapem rozwoju sieci opartej na protokole HTTP będzie Semantic Web312 (semantyczne WWW, zwane też Web 3.0), którego struktura odpowiadać będzie przyjętej i strukturyzującej informację ontologii.

Cechą charakterystyczną tej sieci ma być to, że jej obsługą będą zajmować się moduły progra-mowe (agenci), którym użytkownik będzie zlecał różnorakie zadania. Agent połączy się z siecią, wykona powierzone czynności (wyszukiwanie informacji, zakupy, zaplanowanie czasu wolnego), a po jego wykonaniu przedstawi raport z ich wykonania.

2.2.4. Wariacyjność

Kolejną właściwością obiektów cyfrowych jest to, iż mogą one zostać przedstawione w wielu wersjach. Zatem obraz może zostać zaprezentowany w odmiennych formatach plików graficznych, podobnie tekst albo dźwięk. Liczba tych wersji może być teoretycznie nieskoń-czona313, powstają nowe formaty plików, inne przestają być użytkowane. Kolejne wersje obiektu cyfrowego mogą być (i często są) wytwarzane automatycznie przez oprogramowanie komputera. Wariacyjność jest pochodną cech opisanych wyżej. Cyfrowa postać, w przeci-wieństwie do mediów tradycyjnych, wymagających trwałego nośnika, nie wiąże składowych tekstowych czy obrazowych z materiałem, który je „usztywnia” i trwale zestala. Wariacyjno-ści sprzyja też automatyzacja, która umożliwia zaprogramowanie wytwarzania wielu wersji obiektu o znaczeniowo identycznej zawartości. Wariacyjność pozwala na zastosowanie wielo-formatowej prezentacji obiektów w BC. Ten sam dokument zarejestrowany archiwalnie w formacie TIFF, może być równolegle prezentowany w formatach „lżejszych”, jak PDF, DjVu, JPEG lub MOBI – do wyboru przez użytkownika.

312T. Berners-Lee, J. Hendler, O. Lassila. The Semantic Web. 2001. [Dostęp 24 maja 2020]. Dostępny w Interne-cie: https://kask.eti.pg.gda.pl/redmine/projects/sova/repository/revisions/master/entry/doc/Master%20Thesis

%20(In%20Polish)/materials/10.1.1.115.9584.pdf

313Tamże, s. 102.

2.2.5. Transkodowanie

Transkodowanie to zjawisko na styku technicznej i kulturowej warstwy obiektu cyfrowego, wskazujące na nowe możliwości operowania ucyfrowionymi symbolami kultury w porówna-niu z ich analogowym utrwaleniem. Każdy utrwalony obiekt kultury składa się z dwóch

„warstw”: kulturowej oraz technicznej. Domeną pierwszej są znaczenia, do których odnoszą znaki oraz odpowiadające im pojęcia i symbole. W tym obszarze funkcjonują takie określenia jak: tekst, artykuł, grafika, kolaż, komedia, muzyka, biblioteka. Warstwa druga to techniczny artefakt – fizyczna podstawa znaków. W sferze komputerowej opisują takie pojęcia jak: plik, głębia bitowa, kod programowy, pakiet danych, struktura danych, węzeł sieci314.

Symbole warstwy kulturowej dokumentów bibliotecznych (zapis tekstowy, obrazy), wcześniej trwale ustalone w formie wydawniczej papierowego dokumentu, po digitalizacji i rozpoznaniu tekstu mogą być przetwarzane, indeksowane, przeszukiwane oraz zestawiane, a także porównywane z tekstami innych dokumentów, zlokalizowanymi w różnych serwisach sieci globalnej. Stają się więc nowymi, autonomicznymi obiektami cyfrowymi. Można w nich zapisać metadane opisujące zawartość samego obiektu i jego kontekst kulturowy, a je same także można indeksować i przeszukiwać. Stają się tym samym swoistymi, autonomicznymi

„pakietami kulturowymi”. Obiekty cyfrowe mogą być łatwo kopiowane na odległość, zapre-zentowane na różnych urządzeniach wyświetlających, bądź ponownie wydrukowane. Zatem techniczne właściwości nośnika symboli określają możliwości operowania warstwą kulturową dokumentu (wyszukiwaniem, prezentacją, porównywaniem symboli). Możliwości te posze-rzyły się zdecydowanie wraz z cyfryzacją tekstów, zarówno dokonywaną w drodze digitaliza-cji, jak i bezpośredniego wytwarzania tekstów jako cyfrowych.

Zjawisko transkodowania można dostrzec nie tylko na poziomie obiektów cyfrowych, lecz obejmuje ono także całą bibliotekę jako system komunikacyjny. W bibliotece tradycyjnej dostęp do zbiorów był wyznaczony ścieżką ściśle określoną przez bibliotekarza i był przez niego reglamentowany na różnych poziomach. Dokument po opracowaniu i oznaczeniu sygnaturą trafiał do magazynu, jego opis zaś umieszczony na karcie katalogowej – do katalogu. Elektronizacja katalogów zmieniła tu niewiele – dopiero wyszukanie konkretnego katalogowego rekordu z opisem dokumentu i jego fizyczne dostarczenie do użytkownika pozwala na zapoznanie się z nim. W bibliotece cyfrowej zasób tekstowych dokumentów, po

314Tamże, s. 114-118.

ich rozpoznaniu i zindeksowaniu, przestaje być zbiorem obiektów opatrzonych metadanymi, a staje się korpusem tekstów i fraz, które można całościowo przeszukiwać i zestawiać w dynamiczne, wirtualne kolekcje, czy też całościowo lub częściowo agregować w innych systemach.