• Nie Znaleziono Wyników

Rozdział 2. Uwarunkowania regionalnych bibliotek cyfrowych

2.3. Postęp techniczny w informatyce

Praktyka tworzenia i utrzymywania BC uwzględnia specyficzną dynamikę rozwoju cyfro-wych rozwiązań technicznych, które mają istotny wpływ na oferowane przez bibliotekę możliwości. Klasycznym i wspominanym już przykładem jest dostępność urządzeń umożli-wiających masowe przechowywanie danych. Stanowiły one ostatni, niezbędny element BC i ich upowszechnienie w pierwszej dekadzie XXI w. umożliwiło im realizację długotermino-wej archiwizacji danych. Progres infrastruktury oraz stałe obniżanie jej kosztów przyczyniły się do swoistej „mody” na tworzenie BC. Nawet niewielki ośrodek biblioteczny, np. miejska biblioteka publiczna może z powodzeniem utworzyć BC. Istnieje także możliwość korzysta-nia z rosnącego rynku usług zewnętrznych w tym zakresie (w Polsce np. Krajowy Magazyn Danych318, centra obliczeniowe politechnik, oferty komercyjne) i praktycznie bez problemu można założyć i utrzymywać BC bez posiadania własnej infrastruktury. Obowiązywalność prawa G. Moore’a w wielu aspektach informatyki (pojemność dysków, moc obliczeniowa procesorów, przepustowość sieci etc.) sprawia, że z każdym rokiem do dyspozycji twórców BC trafiają nowe rozwiązania o lepszych parametrach technicznych.

316Narodowe Archiwum Cyfrowe. Wizja, projekt, ludzie. Warszawa: Narodowe Archiwum Cyfrowe, 2010, s. 119.

[Dostęp 24 maja 2020]. Dostępny w Internecie: https://www.sbc.org.pl/dlibra/publication/27457/edition/

24530/content

317Y. Benkler: Bogactwo sieci…, s. 53-54.

318M. Brzeźniak: Usługa Powszechnej Archiwizacji ...

Biblioteki cyfrowe pierwszej generacji miały cele informacyjne – przed erą dostępnych skanerów zasoby cyfrowe były tworzone w drodze ręcznego przepisywania tekstów, potem tworzono graficzne reprezentacje dokumentów w „lekkich” formatach, stosując stratną kompresję. Uwzględnienie archiwizacji długoterminowej, zakładającej bogatą informacyjnie, wierną rejestrację dokumentów oryginalnych, wymagało znacznie bardziej pojemnych pamięci masowych. Podstawową techniką zachowania długoterminowego jest redundancja zasobów. W istocie jest to zabezpieczające powielenie cyfrowej zawartości, osiągane dzięki technikom typu RAID319 (ang. Redundant Array of Independent Disks) różnych poziomów, ustanowieniu zapasowych serwerowni lub równoległemu zapisowi dwóch kopii zasobu na różnych nośnikach, np. na macierzy i bibliotece taśmowej. Wymaga to niekiedy podwojonej objętości pamięci masowej potrzebnej do bezpiecznego przechowywania danych. W innych obszarach digitalizacji wystąpiły podobne problemy: mocy obliczeniowej procesorów i pamięci operacyjnej, niezbędnych do przetwarzania bitmap dużych rozmiarów, sieciowego przesyłu danych czy prezentacji obiektów w sieci, wymagającej wytwarzania prezentacyjnych obiektów niższej jakości.

Jednakże technika cyfrowa zachowuje specyficzną dynamikę rozwoju, jaką jest wykładniczy wzrost jej możliwości w równych odcinkach czasu. Prawidłowość tę nazywa się prawem Moore’a od nazwiska inżyniera firmy Intel Gordona Moore’a, który sformułował ją w roku 1965320. W oryginale dotyczy ona gęstości upakowania tranzystorów w układach scalonych i brzmi ona:

„Złożoność komponentów o minimalnych kosztach będzie się podwajała co roku. Z pew-nością w krótkim okresie, spodziewać się można, że ta częstotliwość będzie się utrzymy-wała, lub się zwiększy. W dłuższym okresie częstotliwość zwiększania jest mniej pewna, jednak nie ma powodu, aby sądzić, że nie utrzyma się przez co najmniej 10 lat. To ozna-cza, że w 1975 roku liczba tranzystorów w jednym układzie scalonym dostępnym po mi-nimalnych kosztach wyniesie 65 000.321

Później brzmienie prawa zmodyfikowano i ostatecznie przyjmuje się, że wykładniczy wzrost gęstości układów dokonuje się w okresie 18-24 miesięcy. Wzrost ten ilustruje Rysunek 23:

319RAID. W: Wikipedia. 2020, 30 marca. [Dostęp 24 maja 2020]. Dostępny w Internecie: https://

pl.wikipedia.org/wiki/RAID

320G.E. Moore: Cramming more components onto integrated circuits. „Electronics Magazine” 1965, vol. 38, no 8, s. 114-117. [Dostęp 24 maja 2020]. Dostępny w Internecie: http://svmoore.pbworks.com/w/file/fetch/

59055901/Gordon_Moore_1965_Article.pdf

321M. Domańska, B. Maruszak: Prawo Moore'a. W: Encyklopedia zarządzania. 2020, 21 maja. [Dostęp 24 maja 2020]. Dostępny w Internecie: https://mfiles.pl/pl/index.php/Prawo_Moore%27a

Źródło: Prawo Gordona Moore’a. W: Wikipedia. 2019, 26 lipca. [Dostęp 24 maja 2020]. Dostępny w Internecie https://pl.wikipedia.org/wiki/Prawo_Moore%E2%80%99a

Prawo Moore’a posiada szereg ekstrapolacji na inne obszary informatyki: wzrostu mocy obliczeniowej, jej kosztów nabycia, rozmiaru pamięci RAM czy pojemności dysków twardych. Tę ostatnią zależność w wymiarze finansowym prezentuje wykres Rysunku 24, ilustrujący, że w analizowanym okresie cena 1 GB dysku twardego obniżała się dwukrotnie w ciągu 14 miesięcy:

Rysunek 23: Wzrost liczby tranzystorów w jednostce scalonej w latach 1971-2011

Źródło: M. Komorowski: A history of storage cost (update). 2014. [Dostęp 24 maja 2020]. Dostępny w Interne-cie: https://mkomo.com/cost-per-gigabyte-update

Przykładową ilustracją obecnych możliwości produkcji pamięci nieulotnych może być pamięć do użytku osobistego typu pendrive o rozmiarach 75,18 x 27 x 21,02 mm firmy Kingston322. Posiada on pojemność 1 lub 2 TB, przy prędkościach zapisu 200 MB/s i odczytu 300MB/s, co pozwala na swobodne przechowywanie i użytkowanie np. do 70 godzin materiałów wideo wysokiej rozdzielczości standardu 4K323.

Ustanawianie własnej infrastruktury do zaawansowanej prezentacji danych w sieci stało się bardziej przystępne także dzięki narzędziom programowym otwartego kodu, określonym w roku 1998 przez Michaela Kunze skrótem LAMP324 – Linux (system operacyjny), Apache (oprogramowanie serwera WWW), MySQL (oprogramowanie bazy danych), Perl (lub PHP, Python – języki skryptowe zdolne wiązać różne dane i struktury). Pozyskanie i używanie powyższego oprogramowania było nieodpłatne, dzięki czemu, przy dysponowaniu

kompeten-322Pamięć USB Flash DataTraveler Ultimate GT o pojemności 1 TB i 2 TB z przesuwaną zatyczką . [Dostęp 24 maja 2020]. Dostępny w Internecie: https://www.kingston.com/pl/usb-flash-drives/datatraveler-ultimate-gt-usb-flash-drive?Capacity=2TB

3234K. W: Wikipedia. 2020, 12 marca. [Dostęp 24 maja 2020]. Dostępny w Internecie: https://pl.wikipedia.org/

wiki/4K

324Beal V.: LAMP. W: Webopedia. [Dostęp 24 maja 2020]. Dostępny w Internecie: http://www.webopedia.com/

TERM/L/LAMP.html

Rysunek 24: Koszt 1 GB danych pamięci masowych w latach 1980-2015

cjami programistycznymi, można było je zestawić w alternatywną dla rozwiązań komercyj-nych platformę – serwer dynamiczkomercyj-nych stron WWW, pobierający dane z bazy dakomercyj-nych.

Rozpowszechnienie oprogramowania wolnych licencji miało także znaczny wpływ na tempo automatyzacji bibliotek. Niezależnie od powstałego, lecz rzadko używanego w Polsce oprogramowania bibliotecznego (zintegrowany system biblioteczny KOHA, oprogramowanie do bibliotek cyfrowych Greenstone, dSpace) pozwoliło na zastąpienie komercyjnych syste-mów operacyjnych oraz zarządzania bazami danych, rozwiązaniami opartymi na wolnych licencjach (system operacyjny Linux325, systemy baz danych MySQL326, PostgreSQL327), które stosowane są nawet w krytycznych instalacjach związanych z produkcją i bezpieczeństwem.

Oprogramowanie otwartego kodu pozwalało także na unikanie pułapki vendor lock-in328, polegającej na uzależnieniu organizacji od dostawcy i właściciela kodu oprogramowania, który może wówczas dyktować wysokość kosztów jego modyfikacji i serwisu.

BC w Polsce, a szczególnie RBC, są ustanawiane jako instalacje współdzielące techniczne zasoby ośrodków inicjujących digitalizację. Rozbudowa zaplecza BC, szczególnie w począt-kowej fazie działalności, może opierać się na już istniejących zasobach sprzętowych: prostych skanerach i zwykłych komputerach do przetwarzania plików i opracowania, serwerze, sieci lokalnej i łączu internetowym. Program digitalizacyjny takich bibliotek obejmie wówczas dokumenty o stosunkowo prostej fizycznej formie, lecz ich cyfryzacja może stanowić zaczą-tek szerszej kolekcji, rozwijanej środkami bieżącymi lub w ramach projektów.

Współcześnie, wraz z rozwojem rynku usług zewnętrznych, związanych z tworzeniem i utrzy-mywaniem cyfrowych zasobów, bez problemu można utworzyć publiczny, biblioteczny zasób cyfrowy bez posiadania komponentów sprzętowo-programowych, a nawet bez posiadania własnych zbiorów do digitalizacji. W tym przypadku dostęp do dokumentów przeznaczonych do skanowania (lub plików do publikacji) zapewniają umowy z właścicielami praw i egzem-plarzy dokumentów, które mogą być skanowane i przetwarzane, przy braku własnej pracowni, przez wynajętego usługodawcę. Można także skorzystać (jeśli nie ma zaplecza serwerowego)

325Linux. W: Wikipedia. 2020, 25 maja. [Dostęp 24 maja 2020]. Dostępny w Internecie: https://pl.wikipedia.org/

wiki/Linux

326MySQL. W: Wikipedia. 2020, 11 kwietnia. [Dostęp 24 maja 2020]. Dostępny w Internecie: https://pl.wikipedia-.org/wiki/MySQL

327PostgreSQL. W: Wikipedia. 2020, 14 lutego. [Dostęp 24 maja 2020]. Dostępny w Internecie: https://pl.wikipe-dia.org/wiki/PostgreSQL

328Vendor lock-in. W: Wikipedia. 2020, 24 czerwca. [Dostęp 24 maja 2020]. Dostępny w Internecie: https://en.wi-kipedia.org/wiki/Vendor_lock-in

z istniejących, otwartych na współpracę, platform BC, takich jak polskie RBC, Polona, usługa LoCloud prowadzona przez PCSS, które zapewnią prezentację zasobów w sieci. Z kolei archiwizację cyfrowego zasobu zapewnia np. Krajowy Magazyn Danych.

W zakresie informatycznej infrastruktury widoczny jest trend względnej minimalizacji kosztów i znaczenia materialnych komponentów systemów przechowujących i udostępniają-cych zasoby informacyjne lub (inaczej rzecz ujmując) względnej maksymalizacji parametrów sprzętu komputerowego za tę samą cenę. Potrzeby ośrodków digitalizacyjnych, które cechują się nawet mocnym, lecz ostatecznie liniowym przyrostem zasobów, mogą zostać zaspokojone z naddatkiem dzięki tempu technicznego postępu informatyki i dostępnym rozwiązaniom, przy wydatkowaniu takich samych środków na infrastrukturę. Jednocześnie mecenasi digitali-zacji (fundusze europejskie, krajowe i samorządowe) chętniej i śmielej finansują duże zamie-rzenia cyfryzacji dóbr kultury. Obie okoliczności sprawiają, że techniczne kwestie infrastruk-tury informatycznej BC przestają mieć krytyczne znaczenie dla tworzenia i utrzymywania tych systemów. Dlatego też niniejsza praca nie podejmuje kwestii technicznych podsystemów RBC, które ze względu na zmiany technologiczne, są nieustannie ulepszane.