• Nie Znaleziono Wyników

Problematyka zarządzania informacją w procesie archiwizacji zasobów Internetu

N/A
N/A
Protected

Academic year: 2021

Share "Problematyka zarządzania informacją w procesie archiwizacji zasobów Internetu"

Copied!
17
0
0

Pełen tekst

(1)

Maria Nowina Konopka

Problematyka zarządzania

informacją w procesie archiwizacji

zasobów Internetu

Media – Kultura – Komunikacja Społeczna 10/1, 28-43

2014

(2)

Problematyka zarządzania informacją

w procesie archiwizacji zasobów Internetu

S łow a kluczow e: archiw izacja, za rząd zan ie inform acją, Internet K ey words: w eb archiving, info rm atio n m an ag em en t, Internet

The Internet is the media of our time. Participation has never been so widespread in the elaboration of any media before. Size and variety of content exposed has never been so large. For this reason, the Internet is becoming the most important source of information on our society and will be a key resource with which to think about it,

now and in the future. Internet Memory Foundation

Wstęp

J e d n ą z g łó w n y c h c ech c h a r a k te r y z u ją c y c h i n t e r n a u t ó w ze w z g lę d u n a sp o só b z a s p o k a ja n ia p rz e z n ic h sw o ich p o trz e b in fo rm a c y jn y c h j e s t tr a k t o w a ­ n ie g lo b a ln e j S ie c i ja k o n ie m a l n ie o g ra n ic z o n e g o z b io ru in fo rm a c ji. U ż y tk o w ­ n ic y S iec i p r a g n ą je d n a k być n ie ty lk o b ie r n y m i o d b io rc a m i d o s tę p n y c h tre ś c i, lecz ta k ż e , a o b e c n ie m oże p rz e d e w s z y s tk im , c h c ą m ie ć a k ty w n y w p ły w n a z a m ie s z c z a n e w n ie j in fo rm a c je . S tą d te ż w tre ś c io w y c h z a s o b a c h te g o m e ­ d iu m d o s tę p n e s ą g ig a d a n e k o n ie c z n e do r e a liz a c ji w s p o m n ia n y c h p o trz e b o ra z p o z w a la ją c e n a p o s z e rz e n ie z a k r e s u w ie d z y w k a ż d y m n ie m a l o b sz a rz e . D a n e te , w sp o só b c z ę sto n ie z a u w a ż a ln y , s ta n o w ią ró w n ie ż w ie r n y z a p is n a ­ szego ży c ia. N ic w ięc d ziw n e g o , że co ra z częściej p o d n o sz o n e s ą g ło sy w z y w a ­ ją c e do o c h ro n y te g o d z ie d z ic tw a k u ltu ro w e g o , do a r c h iw iz o w a n ia św ia d e c tw ż y c ia sp o łe c z n o -p o lity c zn e g o . U c h w y c e n ie i z a tr z y m a n ie n a n o ś n ik a c h d a n y c h w a ż k ic h d z iś in fo rm a c ji p o zw o li w p rz y s z ło ś c i n a z d y s ta n s o w a n ą o cen ę z a c h o ­ d z ą c y c h z ja w is k o ra z s z e ro k ie b a d a n i a re tr o s p e k ty w n e . B ę d ą o n e je d n a k m o ż ­ liw e je d y n ie w s y tu a c ji d o k o n a n ia p e łn e g o z a p is u , b ez u s z c z e r b k u d la cało ści m a ją c y c h o b e c n ie m ie jsc e w y d a rz e ń , z ja w is k i p ro cesó w . T y m c z a s e m z b a d a ń p ro w a d z o n y c h p rz e z J u n g h o o C h o i H e c to r a G a rc ia -M o lin ę w y n ik a , że p r z e ­ c ię tn ie „życie” s tr o n y in te r n e to w e j t r w a około 50 d n i 1, a w e d łu g sz a c u n k ó w

1 J. Cho, H. Garcia-Molina, The Evolution of the Web and Implications for an Incre­

mental Crawler, s. 4, [online] <http://ilpubs.stanford.edu:8090/376/1/1999-22.pdf>, dostęp:

(3)

B r itis h L ib r a r y - 75 d n i2. M a r ia A. J a n k o w s k a u z n a je , że 44% w itr y n i n t e r ­ n e to w y c h z n ik a w c ią g u p ie rw sz e g o r o k u fu n k c jo n o w a n ia , co w p e w n y m ty lk o s e n s ie p o tw ie r d z a z e s p ó ł b a d a w c z y D a n ie la G o m e s a , tw ie r d z ą c , ż e o d s e te k te n s ię g a n a w e t 80% 3 .

P rz y c z y n k r ó tk o tr w a ło ś c i w ir tu a ln e g o k o n t e n t u w y m ie n ić m o ż n a w iele, w ś ró d n a jis to tn ie js z y c h z n ic h w s k a z u je się n a z a n ik z a in te r e s o w a n ia sa m e g o tw ó rc y s tw o rz o n y m d z ie łe m , n a s t ę p s t w a a ta k ó w s k u tk u ją c y c h p rz e c ią ż e n ie m s e r w e r a , b r a k z a in te r e s o w a n ia o d b io rcó w lu b , p a r a d o k s a ln ie , n a g ły w z r o s t ic h z a in te r e s o w a n ia , p o w o d u ją c y sz y b k ie w y c z e r p a n ie się t r a n s f e r u d o s tę p ­ n e g o n a w y k u p io n y m p rz e z w ła ś c ic ie la k o n c ie h o s tin g o w y m 4. O z n a c z a to, że j e ś l i d a n e d o s tę p n e w S ie c i n ie p o s ia d a ją sw ojego o d p o w ie d n ik a w w e r ­ s ji p a p ie ro w e j lu b n ie z o s ta ły u p r z e d n io z a p is a n e , u le g a ją n a z a w s z e z a p r z e ­ p a s z c z e n iu . U p o r a n ie się z p ro b le m e m z a p is u d a n y c h n ie ro z w ią z u je z r e s z tą k ło p o tu , p o n ie w a ż p o s tę p te c h n o lo g ic z n y p o w o d u je t a k sz y b k ie z m ia n y fo rm i s ta n d a r d ó w z a p is u , że in fo rm a c je d o s tę p n e n ie g d y ś n a ta k ic h n o ś n ik a c h , j a k d y s k ie tk a 5- czy 3 ,5 -c a lo w a p o w o li p r z e s ta ją być d o s tę p n e . W ło d z im ie rz Go- g o łe k p o w o łu je w ty m k o n te k ś c ie p r z y k ła d B r itis h B r o a d c a s tin g C o rp o ra tio n (B B C ). J u ż w 19 8 6 r o k u B B C , m a ją c św ia d o m o ść z a c h o d z ą c y c h n a r y n k u m e- d io w y m z m ia n , d o k o n a ła n a la s e ro w y c h d y s k a c h z a p is u w ie lu w a rto śc io w y c h d a n y c h n a t e m a t W ie lk ie j B r y ta n ii ( ta k ic h j a k te k s ty , m a p y , z a p is y video). T e c h n o lo g ia u z n a w a n a p o d ó w cz as z a n o w o c z e sn ą m ia ła z a g w a r a n to w a ć cy fro ­ w y m d a n y m p r a w d z iw ą n ie ś m ie rte ln o ś ć . N ie s te ty , ju ż n a p o c z ą tk u b ie żąc eg o m ille n n iu m d a n e te s ta ły się d e fa c to n ie do o d c z y ta n ia . W efe k c ie n ie z b ę d n e s ta ły się k o le jn e p ra c e - re a rc h iw iz a c y jn e , trw a ją c e p rz e s z ło d w a i p ó ł r o k u 5 .

Z a d a n ie a rc h iw iz a c ji zaso b ó w , w p r z y p a d k u m e d ió w tra d y c y jn y c h n ie n a - s trę c z a ją c e z b y t w ie lu k ło p o tó w , w o d n ie s ie n iu do I n t e r n e t u w y d a je się n ie ­ m a l n ie m o ż liw e do re a liz a c ji. P r z y o k a z ji p ro c e s u a r c h iw iz a c ji p o w s ta je w ie ­ le p y ta ń d o ty c z ą c y ch k w e s tii z a r z ą d z a n ia z b ie r a n y m i in fo rm a c ja m i, sp o so b u u d o s tę p n ia n ia i g r o m a d z e n ia d a n y c h o ra z sa m e g o d o b o ru s tr o n , k tó r e te m u p ro c e so w i m a ją p o d le g a ć . W p o lsk ie j l i t e r a t u r z e p r z e d m io tu , j a k m o ż n a są d zić po w s tę p n y m re k o n e s a n s ie , t e m a t y k a a rc h iw iz a c ji I n t e r n e t u j e s t p o r u s z a n a je d y n ie m a r g in a ln ie , a s a m t e m a t n ie j e s t p o w sz e c h n ie z n a n y , p o n a d to P o l­ s k a n ie p o d ję ła je s z c z e in s ty tu c jo n a ln ie u s a n k c jo n o w a n y c h , s y s te m a ty c z n y c h p r a c n a d a r c h iw iz a c ją z a so b ó w siecio w y c h . Z a ró w n o w E u ro p ie , j a k i w in ­ n y c h c z ę śc ia c h ś w ia ta w y p ra c o w a n o n a t o m i a s t n a r z ę d z ia o ra z m ię d z y n a ro d o ­ w e s t a n d a r d y w z a k r e s ie a r c h iw iz o w a n ia w ir tu a ln e g o k o n t e n t u i z a r z ą d z a n ia z g ro m a d z o n y m i d a n y m i. C e le m z b a d a n ia ty c h z a g a d n ie ń d o k o n a n o k w e re n d y

2 The British Library, [online] <http://www.bl.uk>, dostęp: 1.10.2013.

3 L. Derfert-Wolf, Archiwizacja Internetu - wprowadzenie i przegląd wybranych inicja­

tyw, „Biuletyn EBIB” 2012, nr 1(128), [online] <http://eprints.relis.org/17048/1/derfert_Web_

archiving.pdf>, dostęp: 10.09.2013.

4 B. Mrożewski, Archiwa internetu, „PC Format” 2012, nr 38, [online] <http://www.pcfor- mat.pl/Archiwa-internetu,a,2374>, dostęp: 7.12.2013.

5 Por. [online] <http://www.domesday1986.com>, za: W. Gogołek, Komunikacja sieciowa.

(4)

l i t e r a t u r y p r z e d m io tu o ra z p r z e g lą d u m ię d z y n a ro d o w y c h i k ra jo w y c h in ic ja ­ ty w m a ją c y c h w sw y m s p e c tr u m d z ia ła n ia w s p o m n ia n y o b s z a r b a d a w c z y 6 . P o d ję c ie r e f le k s ji z a ró w n o n a d z a s a d n o ś c ią p r o c e s u a r c h iw iz a c ji z a so b ó w I n t e r n e t u , j a k i k o n s e k w e n c ja m i b r a k u n a le ż y te g o n a d z o r u n a d p rz e b ie g ie m te g o p r o c e s u w y d a je się n ie o d z o w n e . W y w o ła n ie sz e ro k o z a k ro jo n e j d y s k u ­ s ji j e s t o b e c n ie p o trz e b n e , p o n ie w a ż w s p o m n ia n e k w e s tie tr z e b a b ę d z ie n ie ­ b a w e m w P o lsc e om ów ić, z a ś sto so w n e decy zje w a r to w y p ra c o w a ć w o p a rc iu o w ie lo ść m ię d z y n a ro d o w y c h p rz y k ła d ó w i d o ś w ia d c z e ń 7. Z te g o te ż w z g lę d u c e le m n in ie js z e g o a r t y k u ł u j e s t p r z e g lą d n a jw a ż n ie js z y c h d y le m a tó w z w ią ­ z a n y c h z p r o b le m a ty k ą z a r z ą d z a n i a in f o r m a c ją w p ro c e s ie a r c h iw iz o w a n ia z a so b ó w I n t e r n e t u . Ic h k la s y fik a c ji ( a s p e k ty te c h n ic z n e , e ty c z n e , e k o n o m ic z ­ n e i p ra w n e ) d o k o n a n o w o p a rc iu o d o ś w ia d c z e n ia i w n io s k i w y n ik a ją c e z ju ż is tn ie ją c y c h p ro je k tó w o ra z w o d n ie s ie n iu do a n a liz y k ry ty c z n e j p r e z e n to w a ­ n ej w l i t e r a t u r z e p rz e d m io tu .

Archiwizacja Internetu

P ro c e s a r c h iw iz a c ji in f o r m a c ji d o s tę p n e j w I n te r n e c ie p o le g a , z d a n ie m M. J a n k o w s k ie j, n a „ p o s z u k iw a n iu , g r o m a d z e n iu i o rg a n iz a c ji ź ró d e ł in f o r m a ­ cji w c e lu z a b e z p ie c z e n ia ic h p r z e d z n ik n ię c ie m z W W W ”8. J e s t to w ięc p ro ces w ie lo e ta p o w y i b a rd z o złożony, p o n ie w a ż w je g o r a m a c h m ie ś c i się o d p o w ie ­ d z ia ln o ść z a d o b ó r s tr o n do a rc h iw iz o w a n ia , u z y s k a n ie zg o d y n a ic h p rz e c h o ­ w y w a n ie , p ro w a d z e n ie z a p is u w u s ta lo n y c h , r a c jo n a ln ie p rz y ję ty c h o d s tę p a c h c z a s u o ra z ta k ie z a r z ą d z a n ie z g ro m a d z o n y m i d a n y m i, a b y b y ły o n e d o s tę p n e w ła ś c iw y m osobom , w d o g o d n ej fo rm ie i s z y b k im c z a sie. C z y n n o ść t a n ie j e s t w ięc je d y n ie k w e s t i ą u m ie ję tn o ś c i w y k o r z y s ta n ia te c h n o lo g ii, lecz w y m a g a p r o fe s jo n a ln e g o p r z y g o to w a n ia w z a k r e s ie k a te g o r y z o w a n ia z d o b y ty c h d a ­ n y c h , z a p e w n ie n ia im fizy czn eg o b e z p ie c z e ń s tw a o ra z s p ra w n o ś c i w s tw o rz e ­ n i u d la re a liz o w a n e g o p r o je k tu o d p o w ie d n ie g o ś ro d o w is k a p ra w n e g o . O g ro m d z ia ła ń i c ią ż ą c e j n a p o m y s ło d a w c a c h o d p o w ie d z ia ln o ś c i s p o w o d o w a ł, że w p o c z ą tk o w e j fa z ie p ro c e s u a r c h iw iz o w a n ia I n t e r n e t u in ic ja to r a m i p r o je k ­ tó w b y ły je d n o s tk i p ro fe s jo n a ln e , cz y li b ib lio te k i n a ro d o w e . W ic h d z ia ła ln o ś c i od p o c z ą tk ó w n o w eg o ty s ią c le c ia z a u w a ż a ln a s t a ł a się t e n d e n c ja o d c h o d z e ­ n i a od k s ią ż e k p a p ie ro w y c h n a rze cz u d o s tę p n ia n ia p u b lik a to ró w n a u k o w y c h w tr y b ie on-line:

6 Warto w nocie metodologicznej dodać, że obok przeglądu literatury przedmiotu dokona­ no także krytycznej analizy źródeł internetowych, będących w chwili obecnej ważnym (choć często trudnym do weryfikacji) źródłem materiału badawczego.

7 Do analizy zastosowano metodę doboru próby zupełnej, co oznacza analizę wszystkich dotychczas (koniec 2013 roku) istniejących organizacji i stowarzyszeń (krajowych i o zasięgu międzynarodowym) zajmujących się archiwizacją stron WWW.

8 M. Jankowska, Biblioteki akademickie - trendy dotyczące zasobów elektronicznych, w: Informacja dla nauki a świat zasobów cyfrowych, red. H. Ganińska, Poznań 2008, s. 168, [online] <http://www.library.put.poznan.pl/konf_idn/art/4_3.pdf>, dostęp: 1.12.2013.

(5)

popularność elektronicznych środków inform acji w ynika z faktu, że pracow ni­ cy naukow i oraz studenci zdecydowanie preferują elektroniczne źródła infor­ macji, coraz rzadziej korzystają z drukow anych. Dowiodły tego w yniki badań przeprow adzone w 155 bibliotekach akadem ickich n a świecie przez Publishers Com m unication Group, Inc. Potw ierdziły one wzrost elektronicznych źródeł in ­ formacji w kolekcjach bibliotek aż o 91% oraz wykazały, że 84% bibliotek nie grom adzi już drukow anych odpowiedników elektronicznych czasopism 9 .

B ib lio te k i s ą i n s ty tu c ja m i p o s ia d a ją c y m i n ie z b ę d n e w p ro c e s ie a r c h iw i­ z a c ji k o m p e te n c je , n a r z ę d z ia i z a s o b y lu d z k ie . C y fry z a c ja p u b lik a to r ó w n a ­ u k o w y c h , k tó ry c h licz b a, choć o lb rz y m ia , d a je się j e d n a k ro z u m o w o o g a rn ą ć , b ę d ą c w sw ej m a s ie p o lic z a ln a , s ta n o w i z a le d w ie m a ł ą c z ą s tk ę b e z k r e s u w ir tu a ln e g o k o n t e n t u . D la te g o te ż o d p o c z ą tk u p r o c e s u a r c h iw iz a c ji S ie c i b ib lio te k i m o g ły liczyć n a w s p a r c ie o rg a n iz a c ji n o n -p ro fit, je d n o s te k p r y w a t­ n y c h , c z ę sto w y w o d z ą c y c h się z e ś ro d o w is k a p r o g r a m is tó w k o m p u te ro w y c h , i w k o ń c u rz e s z y z w y k ły c h in te r n a u tó w , z a a n g a ż o w a n y c h w m o zo ln y , w ręcz m ró w c z y p ro c e s k o p io w a n ia m ilio n ó w s tr o n W W W . P ie r w s z ą i n a js z e r z e j z a k r o jo n ą te g o r o d z a ju in ic ja ty w ą n a św ie c ie było z a ło ż o n e w 19 9 6 r o k u cyfrow e a r c h iw u m W a y b a c k M a c h in e , n a le ż ą c e do n ie ­ k o m e rc y jn e j o rg a n iz a c ji I n t e r n e t A rc h iv e . I s t o t ą te g o a m e r y k a ń s k ie g o p ro ­ j e k t u j e s t s k a n o w a n ie p o n a d 2 0 0 m ilio n ó w w y b ra n y c h s tr o n w 40 ję z y k a c h ś w i a t a 10, co łą c z n ie d a je liczb ę 3 6 8 b ilio n ó w s t r o n 11. W ty m s a m y m r o k u p o ­ w s ta ły je s z c z e tr z y te g o r o d z a ju in ic ja ty w y : A u s t r a l i a ’s W eb A rc h iv e , T a s m a ­ n i a n W eb A rc h iv e i S w e d e n ( K u ltu r a r w 3 ) , c h o ciaż z a s ię g ic h d z ia ła n ia j e s t w z g lę d e m a m e r y k a ń s k ie g o p rz e d s ię w z ię c ia z n a c z n ie s k ro m n ie js z y . D o 20 1 3 r o k u łą c z n ie n a św ie c ie p o w s ta ło n ie s p e łn a 70 in ic ja ty w p o w o ła n y c h do a r ­ c h iw iz a c ji d a n y c h cy fro w y ch (n ie s te ty , w ś ró d n ic h n ie z n a jd u je się ż a d e n p o l­ s k i p r o je k t) 12. W e fe k c ie p ro w a d z o n y c h od l a t p r a c S c o tt G. A in s w o rth w ra z z z e s p o łe m d o w ied li, ż e 3 5 -9 0 % s tr o n W W W p o ch o d z ą c y ch s p rz e d 2 0 0 8 ro k u m a co n a jm n ie j j e d n ą k o p ię a r c h iw a ln ą , 1 7 -4 9 % - od d w óch do p ię c iu k o p ii, 1 -8 % - od s z e ś c iu do d z ie s ię c iu k o p ii, a 8 -6 3 % - m in im u m d z ie s ię ć k o p ii. J e d n o c z e ś n ie ty lk o 1 4 ,6 -3 1 ,3 % s t r o n j e s t a r c h iw iz o w a n y c h c z ęściej n iż ra z w m ie s ią c u 13. P r z y g lą d a ją c się d a n y m w in n y m u ję c iu , w a r to z a u w a ż y ć w a rto ś ć z a ję te j p r z e s tr z e n i d y sk o w ej, k t ó r a p o m im o is to tn y c h b ra k ó w d a n y c h w b a z ie

9 Publishers Communication Group, INC, Global Electronic Collection Trends in Academic

Libraries, 2004, [online] <http://www.pcgplus.com/Resources/GlobalElTr.pdf>, za: M. Jankowska,

dz. cyt.

10 Zob. [online] <http://archive.org/projects>, dostęp: 7.04.2013.

11 Dane na listopad 2013 roku, [online] <http://archive.org/web>, dostęp: 29.11.2013. 12 Pełna lista inicjatyw i instytucji dostępna pod adresem: <http://en.wikipedia.org/wiki/ List_of_Web_Archiving_Initiatives>, dostęp: 10.04.2013.

13 Badania prowadzono w 2010 i 2011 roku na zasobach Internet Archive Wayback Ma­ chine, pamięciach podręcznych trzech wyszukiwarek (Google, Bing, Yahoo!) oraz w Diigo, Ar- chive-It, UK National Archives i WebCite. Wyniki pokazały, że najwięcej kopii witryn znaj­ duje się w Internet Archive Wayback Machine. Korzystanie z wielu różnych wyszukiwarek wyjaśnia także duże rozbieżności pomiędzy danymi. Zob. S.G. Ainsworth, A. AlSum, H. Salah- Eldeen, M.C. Weigle, M.L. Nelson, How Much o f the Web Is Archived?, s. 5, [online] <http:// arxiv.org/pdf/1212.6177v2.pdf>, dostęp: 1.12.2013.

(6)

W ik ip e d ii o sc y lu je n a k o n ie c 2 0 1 3 r o k u w o k ó ł 8 6 9 2 ,6 T B , z czego 5,5 T B z a j­ m u je I n t e r n e t A rc h iv e (W a y b a c k M a c h in e ). J a k o c ie k a w o s tk ę m o ż n a p r z y o k a z ji d odać, że T B ( te r a b a jt) j e s t ró w n y b ilio n o w i b a jtó w (1 0 12 b a jtó w ), t a k w ięc g d y b y w je d n y m k in ie z g ro m a d z ić p ły ty z f ilm a m i, n a k tó r y c h łą c z n ie z n a jd o w a ło b y się ty le te r a b a jtó w , ile z a rc h iw iz o w a n o d a n y c h , to s e a n s t a k i tr w a łb y n ie p r z e r w a n ie około 4 3 0 la t. L iczb y te , choć i t a k d u ż e , w n ie w ie lk ie j ty lk o m ie rz e o d d a ją m n o g o ść cyfrow ej in fo rm a c ji. G łó w n ą b o w ie m w a d ą p r o ­ je k tó w a rc h iw iz a c y jn y c h j e s t fa k t, ż e p rz e c z e s y w a n iu i r e je s tr o w a n iu p o d le g a je d y n ie in te r n e to w y su rfa c e , b ez u w z g lę d n ie n ia z a so b ó w S ie c i g łęb o k iej (z a ­ g a d n ie n ie to z o s ta n ie p o ru s z o n e w d a lsz e j cz ęści te k s tu ) , co z r e s z t ą s ta n o w i is to tn y a r g u m e n t w d y s k u s ji osób b ę d ą c y c h p r z e c iw n ik a m i a rc h iw iz o w a n ia „ w sz y stk ie g o ”14 .

W ró ciw szy r a z je s z c z e do h is to r ii p ro je k tó w a rc h iw iz a c ji k o le k c ji zaso b ó w d o s tę p n y c h o n -lin e , w a r to w s k a z a ć n a tr u d n o ś c i w re a liz a c ji p a r ty k u la r n y c h p ro je k tó w . I n t e r n e t b o w ie m ty lk o te o r e ty c z n ie n ie z n a g ra n ic , w s y tu a c ji z a ś w y m o g u p ra w n e g o u n o r m o w a n ia k w e s t i i p o b i e r a n i a i z a p is y w a n ia s tr o n W W W is tn ie je k o n ie c z n o ść p r o w a d z e n ia w s p ó łp ra c y m ię d z y n a ro d o w e j, k tó r a z a p e w n ia b e z p ie c z e ń s tw o p r a w n e re a liz o w a n y m p ro je k to m . P ie rw s z y m m ię ­ d z y n a ro d o w y m k o n s o rc ju m , s k u p ia ją c y m o b e c n ie 4 4 członków , j e s t z a ło ż o n e w lip c u 2 0 0 3 r o k u I n t e r n a t i o n a l I n t e r n e t P r e s e r v a tio n C o n s o r tiu m (IIP C )15 . O rg a n iz a c ja t a k o o rd y n u je d z ia ła n ia m a ją c e n a c e lu w y p ra c o w a n ie :

sprawnych narzędzi, standardów i najlepszych praktyk sieciowej archiwizacji, przy jed­ noczesnym wspieraniu współpracy międzynarodowej i propagowaniu szerokiego dostępu oraz możliwości korzystania z archiwów internetowych w dziedzinie badań i dziedzictwa kulturowego16. C z ło n k o w ie k o n s o r c ju m r e g u la r n ie p u b lik u ją r a p o r ty , o r g a n iz u ją sz k o le ­ n i a i w a r s z ta ty , u d o s tę p n ia ją p r e z e n ta c je o ra z m a te r ia ły . D z ia ła n ia te p r z y ­ c z y n ia ją się do w s p ó łp ra c y w z a k r e s ie w y p r a c o w a n ia n a jle p s z y c h p r a k ty k , o b n iż e n ia k o sz tó w d z ia ła n ia o ra z p o p ra w y w d o s tę p ie do p o s ia d a n y c h p rz e z p o d m io t a rc h iw ó w , t a k a b y u n ik n ą ć t a k z w a n e j p u ła p k i s p ir a li a rc h iw iz a c ji (p o le g a ją c e j n a p e r m a n e n t n y m p r z e n o s z e n iu d a n y c h z n o ś n ik a n a n o ś n ik ). I d e i te j s łu ż y ró w n ie ż I n t e r n e t M e m o ry F o u n d a tio n , o r g a n iz a c ja n o n -p ro fit s k u p ia ją c a od 2 0 0 4 r o k u p a ń s tw a e u r o p e js k ie 17 .

N ie s te ty , m im o że I n t e r n e t b e z w ą tp ie n ia s t a ł się w io d ą c y m m e d iu m n a ­ sz y ch czasó w , a je g o p o w sz e c h n o ść u ż y c ia n ie b u d z i ju ż ż a d n y c h w ą tp liw o śc i,

14 Szerzej na ten temat zob. M. Wilkowski, Trzy argumenty przeciwko archiwizowaniu

Internetu, „Historia i Media”, [online] <http://historiaimedia.org/2011/10/04/trzy-argumenty-

-przeciwko-archiwizowaniu-internetu>, dostęp: 10.04.2013.

15 Zob. International Internet Preservation Consortium, [online] <http://netpreserve.org>, dostęp: 19.09.2013. Rozmieszczenie członków IIPC zob. [online] <http://viewshare.org/views/ abpo/iipc-member-archives-2>, dostęp: 1.12.2013. Reprezentantem Polski w IIPC jest Biblio­ teka Narodowa w Warszawie; dane na wrzesień 2013 roku.

16 About IIPC, [online] <http://netpreserve.org/about-us>, dostęp: 1.12.2013.

17 Rozmieszczenie uczestników projektu Internet Memory Foundation w Europie zob. [on­ line] <http://internetmemory.org/images/uploads/Carte_partenaires.pdf>, dostęp: 1.12.2013.

(7)

P o ls k a u c z e s tn ic z y w m ię d z y n a ro d o w y c h p r o je k ta c h w b a rd z o o g ra n ic z o n y m z a k r e s ie . O b o k B ib lio te k i N a ro d o w e j w W a rs z a w ie , z a jm u ją c e j się d ig ita liz a ­ c ją d o ro b k u n a u k o w e g o 18, 1 k w ie tn ia 2 0 0 9 r o k u do ż y c ia p o w o ła n o N a ro d o w e A rc h iw u m C y fro w e (N A C ). I n s t y t u c j a ta , j a k p o d a n o n a je j s tr o n ie i n t e r n e ­ to w e j, „ a b y z a b e z p ie c z y ć in fo rm a c je o h is to r y c z n y m z n a c z e n iu d la p a ń s tw a p o lsk ieg o , a rc h iw iz u je s tr o n y in te r n e to w e n a jw a ż n ie js z y c h u rz ę d ó w p a ń s tw o ­ w y c h ”19. Ś c iśle rze cz u jm u ją c , N A C a rc h iw iz o w a ła w s p o m n ia n e s tr o n y je d y ­ n ie w l a t a c h 2 0 0 9 - 2 0 1 1 , d o k o n u ją c p r z e g lą d u 4 6 in s t y t u c j i i z a p is u ją c ich k o p ie od k ilk u do k i l k u n a s t u ra z y . A z a te m p rz y ją ć m o ż n a , że p ro c e s a r c h i­ w iz a c ji z a so b ó w I n t e r n e t u to w P o lsc e k w e s tia p rz y sz ło śc i. W a r to w ięc, b io rą c p o d u w a g ę w ie lo le tn ie d o ś w ia d c z e n ia p a r u d z ie s ię c iu k ra jó w i p ro je k tó w , z a ­ s ta n o w ić się n a d k lu c z o w y m i k w e s tia m i z w ią z a n y m i z p ro b le m a m i z a r z ą d z a ­ n i a in fo rm a c ją w p ro c e sie a rc h iw iz a c ji z a so b ó w I n t e r n e t u , t a k a b y w ch o d z ą c k ie d y ś w m ię d z y n a ro d o w e s t r u k t u r y i p o r o z u m ie n ia o ra z p o d e jm u ją c w y s i­ łe k d ig ita liz a c ji p o lsk ie g o d z ie d z ic tw a o n -lin e , w y k o rz y s ta ć n a jle p s z e w zo rce i ro z w ią z a n ia .

Zarządzanie informacjami zarchiwizowanymi

Z a r z ą d z a n ie in fo rm a c ją ro z u m ie ć m o ż n a ja k o z e sp ó ł d z ia ła ń p o d e jm o w a ­ n y c h w c e lu k o n tr o lo w a n ia p rz e p ły w u in fo rm a c ji. D o k o n y w a n e j e s t ono b ą d ź to z c h ę c i o p ty m a liz a c ji p rz e b ie g u p ro c e só w in fo rm a c y jn y c h , p o le g a ją c y c h n a p o z y s k iw a n iu , g r o m a d z e n iu , g e n e ro w a n iu , p rz e c h o w y w a n iu , p r z e tw a r z a n iu i d y s try b u c ji in fo rm a c ji, b ą d ź te ż w c e lu k o n tr o li p rz e p ły w u s tr u m ie n i in fo r­ m a c ji. W ty m te ż s e n s ie p ro c e s z a r z ą d z a n ia in f o r m a c ja m i a rc h iw iz o w a n y m i p o le g a n a w ie lo śc i i w ie lo p ła sz c z y z n o w o śc i d z ia ła ń , ta k ic h ja k : w y b ó r s tr o n W W W , u s ta le n ie c z ę sto tliw o śc i i g łę b o k o ści d o k o n y w a n y c h z a p isó w , p rz y ję c ie m e to d g r o m a d z e n ia in fo rm a c ji z g o d n y c h z o b o w ią z u ją c y m s ta n e m p ra w n y m , g w a r a n tu ją c y m ró w n o c z e śn ie b e z p ie c z e ń s tw o p r z e c h o w y w a n ia i sp ó jn o ść z a ­ p is u d a n y c h , tw o rz e n ie p r z e jr z y s ty c h s y s te m ó w k la s y f ik a c ji z g ro m a d z o n e g o m a t e r i a ł u , o k r e ś le n ie z a s a d d o s tę p u do d a n y c h o ra z p o z y s k iw a n ie śro d k ó w n a d z ia ła ln o ś ć n ie w p ły w a ją c y c h n a o b ie k ty w iz m w re a liz a c ji p o szczeg ó ln y ch e le m e n tó w w s p o m n ia n e g o p r o c e s u . N a k a ż d y m j e d n a k e ta p ie p o d e jm o w a ­ n e d e c y z je m o g ą b u d z ić z a s t r z e ż e n i a , co u z a s a d n io n e j e s t u z n a n io w o ś c ią

18 W kwestii działalności Biblioteki Narodowej w Warszawie należy dodać, że „od stycz­ nia 2007 roku Biblioteka Narodowa jest partnerem projektu Biblioteka Europejska, w którym prezentowane są zasoby katalogowe i cyfrowe europejskich bibliotek narodowych. Biblioteka Europejska od 2006 roku przygotowywała się do zbudowania portalu obejmującego dokumen­ ty cyfrowe z różnego rodzaju instytucji kultury i dającego możliwość jednoczesnego przeszu­ kiwania zasobów europejskiego dziedzictwa kulturowego, dostępnego w językach krajów Unii Europejskiej. Portal ten nazwany został Europeana” (Europeana - pomyśl o kulturze, [online] <http://www.bn.org.pl/zasoby-cyfrowe-i-linki/europeana>, dostęp: 1.12.2013).

19 Archiwum Internetu Narodowego Archiwum Cyfrowego, [online] <http://www.archiwum- internetu.nac.gov.pl>, dostęp: 1.12.2013.

(8)

w z a k r e s ie ic h p o d e jm o w a n ia . W d a ls z e j c z ę śc i p r a c y p o s ta r a n o się z e b ra ć i om ów ić p ro b le m y te c h n ic z n e , p ra w n e , e ty c z n e i e k o n o m ic z n e m a ją c e , z d a ­ n ie m a u to r k i, is to tn y w p ły w n a o s ta te c z n y k s z t a ł t p ro c e s u a r c h iw iz a c ji z a s o ­ bów I n t e r n e t u o ra z z a r z ą d z a n ie z g ro m a d z o n y m i d a n y m i.

Aspekty techniczne

Z te c h n ic z n e g o p u n k t u w id z e n ia , a rc h iw iz o w a n ie z a so b ó w I n t e r n e t u (an g . h a r v e s tin g ) je s t:

zautom atyzow anym procesem grom adzenia zbiorów i m etadanych, k tóre są następnie indeksow ane i składow ane w archiw um cyfrowym w edług ściśle określonych param etrów . Służą do tego specjalne oprogram ow ania bazujące n a pracy robotów (ang. web crawlers) „przeczesujących” w ybrane obszary Sieci zgodnie z zadanym i w ym aganiam i danego archiw um 20 .

W y d a w a ć b y się w ięc m ogło, że s a m p ro c e s z b ie r a n ia m a t e r i a ł u ź ró d ło w eg o j e s t p r o s ty i w p e łn i z a u to m a ty z o w a n y 21, p o z w a la ją c y n a p rz e c z e s a n ie z a d a ­

n y c h ro b o to m o b sz a ró w . N ie s te ty , p o m im o z a a w a n s o w a n ia te c h n o lo g ic z n eg o w ciąż p o ja w ia ją się p ro b le m y z a rc h iw iz o w a n ie m s tr o n z b u d o w a n y c h w o p a r ­ c iu o i n s t r u m e n t a r i u m F la s h , co s ta n o w i is to tn y h a m u le c w p o z y s k iw a n iu c ało śc i m a t e r i a ł u ze s tro n y . F r a g m e n ta r y z a c ji p o d le g a n ie ty lk o z a p is s tro n , lecz ta k ż e I n t e r n e t u ro z u m ia n e g o ja k o cało ść, je g o z a s o b y p o d z ie lić m o ż n a b o ­ w ie m n a te z n a jd u ją c e się n a je g o p o w ie rz c h n i (a n g . su rfa c e w eb) o ra z w t a k z w a n e j S ie c i g łęb o k ie j (a n g . d eep w eb). M o żliw o ści tra d y c y jn y c h w y s z u k iw a ­ r e k s ą o g ra n ic z o n e je d y n ie do S ieci p o w ie rz c h n io w e j, a z a s o b y S ieci g łęb o k ie j, b ę d ą c e j z a s o b e m około 5 0 0 r a z y b o g a ts z y m , p o z o s ta ją p o z a z a s ię g ie m m o ż li­ w o śc i r e je s tr a c ji i p o b ie r a n ia z n ic h d a n y c h 22. P o d a n e w ięc w a r to ś c i liczb o ­ w e, u k a z u ją c e t r u d n e w p r o s t do ro z u m o w e g o o g a rn ię c ia w a r to ś c i p a m ię c i, s ą w ś w ie tle p rz y to c z o n y c h d a n y c h je d y n ie w ie rz c h o łk ie m g ó ry lodow ej.

P ro b le m ó w n a s t r ę c z a ta k ż e z a p is y w a n ie tr e ś c i d o s tę p n y c h n a p o r ta la c h sp o łe c z n o śc io w y c h i p o r ta la c h b lo g o w y c h . W p ie r w s z y m ze w s p o m n ia n y c h

20 L. Derfert-Wolf, dz. cyt. Głównie wykorzystuje się narzędzia stworzone przez IIPC, na przykład robota Heritix.

21 Jak słusznie zauważa Julien Masanes, rozwój wirtualnego kontentu stwarza użyt­ kownikom Internetu wiele nowych możliwości, równocześnie powodując znaczne utrudnienia w pracy związanej z archiwizowaniem zasobów sieciowych. W literaturze przedmiotu opisa­ no wielość podejść do procesu archiwizacji. Lekturę artykułu Web Archiving Methods and

Approaches: A Comparative Study, w którym autor proponuje podejście porównawcze i zin­

tegrowane, polecam czytelnikom zainteresowanym systematycznymi studiami nad meto­ dologią procesu archiwizacji zasobów sieciowych. Zob. J. Masanes, Web Archiving Methods

and Approaches: A Comparative Study, [online] <https://www.ideals.illinois.edu/bitstream/

handle/2142/2452/Masanes.pdf?sequence=2>, dostęp: 1.03.2014. Zob. również: tenże, Web

Archiving, Berlin - Heidelberg 2006, [online] <http://stevejones.me/pubs/2006/WebUseWeb-

Studies.pdf>, dostęp: 7.03.2014.

22 E. Sweeney, K. Curran, E. Xie, Automating Information Discovery within the Invisible

(9)

p r z y p a d k ó w p o w s ta je p y ta n ie , j a k ą p r z y ją ć m e to d ę g r o m a d z e n ia d a n y c h , p o n ie w a ż s ta t y c z n a m e to d a s k a n o w a n ia d a n y c h z je d n e g o p ro filu n ie u k a ­ z u je w ż a d n e j m ie rz e sp o łe c z n o śc io w e g o c h a r a k t e r u z a m ie s z c z a n y c h tr e ś c i, p o w ią z a n ie z a ś w p isó w n a w ie lu k o n ta c h ró ż n y c h u ż y tk o w n ik ó w n ie z a w s z e j e s t p r a w n ie m o żliw e (o c zy m w d a lsz e j części t e k s t u ) 23. D o k o n y w a n ie z a te m z a p is u d a n e g o k o n t a b ez s z e rsz e g o o d n ie s ie n ia do p o z o s ta ły c h to j a k r e j e s t r a ­ c ja słów ty lk o je d n e j oso b y u c z e s tn ic z ą c e j w g ru p o w e j p o lem ice. W ty m w ięc p r z y p a d k u i s e n s , i p o ż y te k z ta k ie g o m a t e r i a ł u w y d a je się być is to tn ie o g r a ­ niczo n y .

K o le jn ą k w e s tią n ie p o d le g a ją c ą a u to m a ty z m o w i j e s t p r a c a k o n c e p c y jn a , w y tw ó r p r a c y i n t e l e k t u a l n e j c z ło w ie k a o d p o w ie d z ia ln e g o z a d e c y d o w a n ie w s p ra w ie d o b o ru s tr o n do a r c h iw iz o w a n ia o ra z c z ę sto tliw o śc i r o b ie n ia k o p i24 . T a z p o z o ru p r o s t a c z y n n o ść d o ty czy m ilia rd ó w s tro n , co w z n a c z n y m s to p n iu k o m p lik u je i w y d łu ż a p ro c e s d e c y z y jn y i k w a lifik a c y jn y . D o d a tk o w o n a le ż y m ie ć św ia d o m o ść , że p u s z c z o n a w r u c h m a s z y n a m u s i by ć p o d d a w a n a p e r ­ m a n e n tn e j k o n tr o li c z ło w ie k a . P o p ie r w s z e d la te g o , ż e n a r z ę d z i a i m e to d y z a w s z e m o g ą b yć z a w o d n e , a w ięc is tn ie je k o n ie c z n o ść p o p r a w ia n a ja k o ś c i fil­ t r a a rc h iw iz u ją c e g o , po d ru g ie , że n a p o tk a w s z y n a z ło śliw e o p ro g ra m o w a n ie ro b o t n ie p o s u w a się d a le j, i w k o ń c u po trz e c ie , że w w ir tu a ln e j p r z e s tr z e n i p u b lic z n e j n ie k tó r e s tr o n y , p o c z ą tk o w o b e z w ię k s z e j w a r to ś c i b a d a w c z e j, w w y n ik u z m ia n y sp o łe c z n e j n a b ie r a ją o g ro m n e j w a g i. Z d a r z a się ró w n ie ż , że w z w ią z k u z w a ż k im i w y d a r z e n ia m i n ie m a lż e w c ią g u d o b y p o w s ta ją n o w e se rw isy , s ta n o w ią c e b o g a te ź ró d ło d a n y c h o d z ie ją c y m się w d a n y m m o m e n ­ cie h is to ry c z n y m w y d a r z e n iu 25. B r a k n a le ż y te j e la s ty c z n o ś c i w d z ia ła n iu o ra z o p ie sz a ło ść w re a g o w a n iu n a z m ie n ia ją c ą się s y tu a c ję p o w o d u je w ięc w y p a r ­ cie z S ie c i in fo rm a c ji w a ż n y c h p rz e z p o to k n ic n ie w a r ty c h n e w s ó w 26 .

T r z e b a te ż b r a ć p o d u w a g ę k w e s tię ty le o c z y w istą , co t r u d n ą do r e a liz a ­ cji, a o d n o s z ą c ą się do k o n ie c z n o ś c i z a p e w n ie n ia z g ro m a d z o n y m d a n y m o d ­ p o w ie d n ie g o p o z io m u b e z p ie c z e ń s tw a : o to p r z e k a z a n ie b a z d a n y c h w n ie o d ­ p o w ie d n ie rę c e m o ż e s k u tk o w a ć n ie n a le ż y ty m ic h w y k o r z y s ta n ie m . W ty m k o n te k ś c ie w sp o m n ie ć m o ż n a c h o c ia ż b y o o so b ie E d w a r d a S n o w d e n a , byłego

23 W 2010 roku Biblioteka Kongresu Stanów Zjednoczonych ogłosiła rozpoczęcie działań archiwizacyjnych nad portalem Twittera. Zapisowi miały podlegać wszystkie publiczne wpi­ sy począwszy od 2006 roku. Zob. M. Wilkowski, Archiwum Twittera w Bibliotece Kongresu, „Historia i Media”, [online] <http://historiaimedia.org/2011/06/14/archiwum-twittera-w-biblio- tece-kongresu>, dostęp: 2.12.2013.

24 Więcej na ten temat zob. S. Abiteboul, Issues in Monitoring Web Data, w: Database

and Expert Systems Applications, red. A. Hameurlain, R. Cicchetti, R. Traunmuller, Berlin

- Heidelberg 2002, [online] <http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.95.4562 &rep=rep1&type=pdf>, s. 5, dostęp: 1.03.2014.

25 Jako przykład można podać stronę poświęconą wydarzeniom związanym z przejściem nad USA w 2005 roku huraganów Katrina i Rita. Zob. [online] <http://www.hurricanearchive. org>, dostęp: 30.11.2013.

26 British Library jako argument za archiwizowaniem zasobów w Sieci podaje fakt, że wiele cennych danych na temat zamachu terrorystycznego w Londynie w 2005 roku zniknęło z Sieci bezpowrotnie. Zob. British Library chce zarchiwizować internet, [online] <http://www. tvn24.pl/british-library-chce-zarchiwizowac-internet,316939,s.html>, dostęp: 1.12.2013.

(10)

p r a c o w n ik a C e n t r a l I n te llig e n c e A g e n c y (C IA ) i N a tio n a l S e c u r ity A g en cy (N SA ), k tó r y n a ła m a c h p r a s y u ja w n ił in fo rm a c ję o p ro g ra m ie in w ig ila c ji p r o ­ w a d z o n y m p rz e z N S A 27, p o le g a ją c y m n a m o n ito ro w a n iu n a m ię d z y n a ro d o w ą s k a lę s k r z y n e k m a ilo w y c h , se rw isó w sp o łeczn o ścio w y ch o ra z p o łą c z e ń te le fo ­ n ic z n y c h z w y k ły c h o b y w a te li i w p ły w o w y ch e u r o p e js k ic h d y g n ita rz y . D a n e te, p rz e c h o w y w a n e w b a z ie d a n y c h , z o s ta ły p rz e z S n o w d e n a u p u b lic z n io n e , d y s ­ k r e d y tu ją c d y p lo m a c ję S ta n ó w Z jed n o czo n y ch . P r o b le m a ty k a b e z p ie c z e ń s tw a w ią ż e się z r e s z t ą n ie ty lk o z k w e s tią z a s a d n e g o u d o s tę p n ia n ia d a n y c h , lecz ta k ż e , o c zy m w a r to n a m a r g in e s ie w sp o m n ie ć , z z a r z ą d z a n ie m s tr u m ie n ia m i in fo rm a c ji, p o n ie w a ż w łaściw y , lo g icz n y i sp ó jn y p o d z ia ł n a o d p o w ie d n ie k a t e ­ g o rie m o d e lu je sz e ro k o ść d o s tę p u do z g ro m a d z o n y c h tre ś c i. T a k w ięc i w ty m p r z y p a d k u c z y n n ik lu d z k i m a n a jw ię k s z e z n a c z e n ie .

Aspekty etyczne

P o p o d ję c iu t e m a t u a r c h iw iz a c ji z a so b ó w I n t e r n e t u w a s p e k c ie k w e s tii te c h n ic z n y c h n ie m a l a u to m a ty c z n ie n a s u w a się p y ta n ie o to, czy ch cąc w p e w ­ n y m s e n s ie z a tr z y m a ć c z as, p rz e c h o w y w a ć b ę d z ie m y w sz y stk o , a w ięc i to, co n a jb a r d z ie j n ie lu d z k ie , c z a rn e , k r w ią sp ły w a ją c e i w u lg a r n e . C zy m oże je d n a k czy n ić b ę d z ie m y s t a r a n i a , a b y w o c zach p rz y s z ły c h p o k o le ń w y b ie lić k a r t y h i ­ s to r ii i a rc h iw iz a c ji p o d d a w a ć ty lk o rz e c z y p ię k n e , w z n io słe i w a rto śc io w e ?

W y b ó r n ie j e s t o czy w isty , a o c e n a je d n o z n a c z n a , a lb o w ie m p rz y ją w s z y , że c h ro n im y d z ie d z ic tw o k u ltu r o w e , s p r a w a w y d a je się b e z d y s k u s y jn a , j e ś li z a ś d la p rz y s z ły c h p o k o le ń c h c e m y z a c h o w a ć z a p is n a s z e g o ż y c ia sp o łeczn eg o , to w a r to d y s k u to w a ć n a d ty m , co z a p is y w a ć i j a k t e d a n e p o te m u d o s tę p n ia ć . W a rto ró w n ie ż z a u w a ż y ć , że d o k o n y w a n ie oceny, a r b i t r a l n e p rz y p o rz ą d k o w y ­ w a n ie o ra z k w a lifik a c ja s tr o n do p r o je k tu d o k o n u je się ja k o p ro c e s m y ślo w y je d n o s tk i p o s ia d a ją c e j p e w n e p r z e k o n a n ia i s y s te m w a rto ś c i. Z te g o te ż w z g lę ­

d u p o z o s ta w ie n ie t a k w a ż n y c h d e c y z ji w r ę k a c h w ą s k ie j g r u p y osób m oże b u d z ić z a s tr z e ż e n ia co do te n d e n c y jn o ś c i w z a k r e s ie s to s o w a n y c h k r y te r ió w oceny. W y c h o d z ą c n a jp ra w d o p o d o b n ie j z p o d o b n eg o z a ło ż e n ia , tw ó rc y a n g ie l­ sk ieg o p r o je k tu U K W eb A rc h iv e (U K W A ) n a sw ojej s tr o n ie in te r n e to w e j z a ­ m ie ś c ili in fo rm a c je o sto s o w a n y c h , w z w ią z k u ze w s p o m n ia n y m i p ro b le m a m i, k r y t e r i a c h . Z g o d n ie z z a m ie s z c z o n ą in fo r m a c ją , do a r c h iw iz a c ji k ie r u je się m a te r ia ły , k tó r e p o w in n y być p r z y d a tn e do b a d a ń n a u k o w y c h p rz e z d łu ż sz y o k re s i o d z w ie rc ie d la ć ró ż n o ro d n o ść z a in te r e s o w a ń , d z ia ła ń o ra z o g ó ln ie ż y ­ c ia w Z je d n o c z o n y m K ró le s tw ie , a ta k ż e p o w in n y u k a z y w a ć in n o w a c y jn o ść s tr o n in te r n e to w y c h 28. W p r a k ty c e je d n a k , j a k z a u w a ż a K a ta r z y n a G m e re k ,

27 Anglojęzyczna strona Wikipedii udostępnia bardzo dokładny biogram E. Snowdena oraz opis informacji będących w jego posiadaniu. Zob. [online] <http://en.wikipedia.org/wiki/ Edward_Snowden>, dostęp: 1.12.2013.

28 K. Gmerek, Archiwa internetowe po obu stronach Atlantyku - Internet Archive, Way-

back Machine oraz UK Web Archive, „Biuletyn EBIB” 2012, nr 1(128), s. 7, [online] <http://

(11)

U K W A z a rc h iw iz o w a ło b a rd z o n ie w ie le s tr o n ir la n d z k ic h , choć w rz e c z y w i­ s to ś c i n a s e r w e r a c h p o sa d o w io n y c h n ie ty lk o w R e p u b lic e , lecz ta k ż e w U S A z n a jd u je się d u żo s tr o n W W W d o ty c z ą c y ch I r l a n d i i P ó łn o c n e j. U z n a n io w o ść t a j e s t m o żliw a, p o n ie w a ż s ta n o w i p o k ło sie p rz y ję te j - a u to r y ta r n e j - m e to d y z a r z ą d z a n ia p ro c e s e m a rc h iw iz o w a n ia z a so b ó w Sieci. W p rz e c iw ie ń s tw ie do n ie g o w s k a z a ć m o ż n a n a m o d e l d e m o k ra ty c z n y fu n k c jo n u ją c y w s t r u k t u r a c h I n t e r n e t A rc h iv e (IA ), z a s a d z a ją c y się n a w s p ó łp ra c y s p e c ja lis tó w z r z e s z ą w o lo n ta riu s z y . D z ię k i p rz y ję c iu ta k ie g o r o z w ią z a n ia , j a k p isz e d a le j K. G m e- re k , „ lic z b a s a m y c h z d ig ita liz o w a n y c h te k s tó w s ię g n ę ła w e w r z e ś n iu 20 1 1 r o k u tr z e c h m ilio n ó w , z czego d w a w p ro w a d z ili p ra c o w n ic y IA, z a ś p o z o sta ły m ilio n s to w a r z y s z e n i o c h o tn ic y z całe g o ś w ia ta , k tó r y m u d o s tę p n io n o o d p o ­ w ie d n ie o p ro g ra m o w a n ie i m ie jsc e n a s e r w e r a c h w U S A ”29

W y b ó r m e to d y , n a le ż y p o d k re ś lić z c a łą m ocą, m a o g ro m n y w p ły w n a p r o ­ ces a rc h iw iz a c ji w w ie lu je g o a s p e k ta c h , to b o w ie m lu d z ie p o d e jm u ją d ecy ­ zje o ty m , co b ę d z ie z a p is a n e , j a k d o k ła d n ie z a p is t e n z o s ta n ie z re a liz o w a n y i w k o ń c u ile z z a so b ó w S iec i u d a się z a rc h iw iz o w a ć . K o le jn ą i s t o t n ą w ty m k o n te k ś c ie k w e s t i ą j e s t s p r a w a s z a c u n k u i o c h ro n y g o d n o ś c i osób. W śró d p o to k u z a m ie s z c z a n y c h w S ie c i d a n y c h d o s tę p n e s t a j ą się t a k ż e w iz e r u n k i osób p r y w a tn y c h , ic h d a n e osobow e, in fo rm a c je g o d zące w ic h d o b re im ię czy w k o ń c u tr e ś c i p o w sz e c h n ie u z n a w a n e z a w u lg a r n e . W p ro c e sie a rc h iw iz a c ji d o k o n y w a n e j p rz e z ro b o ty z a p is y w a n e j e s t w sz y stk o , b ez d o k o n y w a n ia w s tę p ­ n ej o c en y ak sjo lo g ic z n e j. O so b a p o m ó w io n a , p o m im o u z y s k a n ia po l a ta c h s a ­ ty s fa k c jo n u ją c e g o j ą w y r o k u s ą d u , n ie j e s t w ięc w s ta n ie ta k ż e w w ir tu a ln y m św ie c ie oczyścić się z p o s ta w io n e g o je j z a r z u tu . S p o łeczn o ść s ie c io w a w y ro k w y d a je b ez r o z p o z n a n ia s p ra w y , a p rz e b ie g sp o łe c z n e g o o s ą d u je s z c z e la ta m i j e s t d o s tę p n y w a r c h iw u m Sieci.

N a k o n ie c je s z c z e je d e n is to tn y , z a s y g n a liz o w a n y p rz e z G m e re k fa k t. A u ­ t o r k a t a w s k a z u je n a n ie p o k o ją c e z ja w is k o m a n ip u la c ji w p ro c e sie a rc h iw iz a ­ cji. P o le g a ono n a p ró b a c h w y w ie r a n ia w p ły w u n a p rz y s z ły k s z t a ł t i z a w a r ­ to ść in te r n e to w y c h m a te r ia łó w źró d ło w y c h . D la p r z y k ła d u :

IA usunęło n a żądanie scjentologów stronę poświęconą polemice z nim i, choć n ik t nie usuw ał stron propagujących tę religię. O statnio wiele kontrow ersji wzbudza wzmożona aktyw ność radykalnych użytkowników islam skich, um iesz­ czających w In te rn e t Archive ta k dużo m ateriałów , ja k to tylko możliwe. Doty­ czy to w szelkich dokum entów - audiow izualnych i tekstów oraz stron www30 . C z y sz c z e n ie k a r t h is to r ii, a ta k ż e w p ły w a n ie n a n a d r e p r e z e n to w a n ie n ie ­ k tó r y c h t r e ś c i s ta n o w ią c y c h w p r z y s z ło ś c i o b ra z c z a só w , w is t o t n y sp o só b m o że w p ły n ą ć n a r z e te ln ą o cen ę czasó w n a m w sp ó łc z e sn y c h .

29 Tamże. 30 Tamże, s. 5.

(12)

Aspekty ekonomiczne

O b o k r e f le k s ji n a d z a s a d n o ś c ią re a liz a c ji p ro c e s u a r c h iw iz a c ji n a le ż y ró w ­ n o c z e ś n ie p o d ją ć n a m y s ł n a d e k o n o m ic z n ie r o z u m ia n ą o p ła c a ln o ś c ią p r z e d ­ się w z ię c ia . P o s tę p te c h n o lo g ic z n y w sp o só b o c z y w isty w y m u s z a d ig ita liz a c ję tre ś c i, a le to, co d la odb io rcó w w y d a je się n a t u r a l n e , d la in s ty tu c ji w ią ż e się z d u ż y m i n a k ła d a m i fin a n so w y m i. T y m c z a s e m z b a d a n i a „ in ic ja ty w e u ro p e j­ s k ic h p ro w a d z o n y c h p rz e z I n t e r n e t M e m o ry F o u n d a tio n w y n ik a , że 52,7% p ro je k tó w n ie d y s p o n u je s p e c ja ln y m b u d ż e te m , 5,5% p o s ia d a b u d ż e t m n ie js z y n iż 10 ty s . e u ro , a 16,4% m a do d y sp o zy cji p o n a d 2 0 0 ty s . e u r o ”31. O k a z u je się w ięc, że b ez p o s ia d a n ia is to tn y c h n a k ła d ó w f in a n s o w y c h m o ż n a , choć w o g r a ­ n ic z o n y m s to p n iu , re a liz o w a ć p la n d ig ita liz a c ji p o s ia d a n y c h z aso b ó w . M ożli­ w ość t a is tn ie je w z w ią z k u z fa k te m , że choć a r c h iw iz a c ja m a te r ia łó w cy fro ­ w y c h j e s t p ro c e s e m k o sz to w n y m , to ich p rz e c h o w y w a n ie j e s t z n a c z n ie ta ń s z e . P o k a z u je to p r z y k ła d b a d a ń w y b ra n y c h św ia to w y c h b ib lio te k , w k tó ry c h z e ­ s ta w io n o ze s o b ą w y d a tk i p o n ie s io n e w l a ta c h 2 0 0 7 -2 0 1 1 n a u tr z y m a n ie ź ró ­ d e ł e le k tro n ic z n y c h w c a ło śc i p o n ie sio n y c h k o sz tó w . S to s u n e k w s p o m n ia n y c h w y d a tk ó w z d e c y d o w a n ie p o tw ie r d z a p r z e k o n a n ie o n is k ic h k o s z ta c h p rz e c h o ­ w y w a n ia z a so b ó w w p o s ta c i e le k tr o n ic z n e j32

K o n ie c z n o ść p o n ie s ie n ia w y so k ic h n a k ła d ó w f in a n s o w y c h w p ro c e sie p o ­ z y s k iw a n ia m a t e r i a ł u j e s t z w ią z a n a w efe k c ie fin a ln y m z lo g ik ą u d o s tę p n ia ­ n i a d a n y c h o d b io rc y k o ń c o w e m u . Z a r z ą d z a n ie z g ro m a d z o n y m i z a s o b a m i o d ­ b y w a ć się z a t e m m o że n a w a r u n k a c h k o m e rc y jn y c h , czy li o d p ła tn ie , lu b te ż d o s tę p do z a so b ó w m oże m ie ć c h a r a k t e r c a łk ie m w o ln y . P a r a d o k s a ln ie je d n a k ż a d n e z ty c h d w ó ch r o z w ią z a ń n ie j e s t m o żliw e do w p ro w a d z e n ia w całości. C a łk o w ite s k o m e rc ja liz o w a n ie d o s tę p u do a r c h iw a ln y c h z a so b ó w I n t e r n e t u s ta n ę ło b y w s p rz e c z n o ś c i z p r a w e m w z a k r e s ie ch oćby U s ta w y o d o s tę p ie do in fo rm a c ji p u b lic z n e j33, g o d z iło b y w in te r e s y n ie k tó r y c h in s ty tu c ji i o r g a n i­ z a c ji ( p a r t i i p o lity c z n y c h czy o r g a n iz a c ji p o ż y tk u p u b lic z n e g o ), j a k ró w n ie ż w z n a c z n y m s to p n iu m o g ło b y w p ły n ą ć n a o b n iż e n ie m o ty w a c ji cy b erw o lo n - ta r i u s z y do tw o r z e n ia cyfrow ego k o n te n tu . A c o n tra rio , z n ie s ie n ie o d p ła tn o ­ ści z a d o s tę p do w s z y s tk ic h z a rc h iw iz o w a n y c h d a n y c h po zw o liło b y n a s w o iste ob e jście k o n ie c z n o ś c i p o n ie s ie n ia o p ła ty z a d o s tę p do w y b ra n y c h tre ś c i, ta k ic h j a k n a p r z y k ła d a r c h iw a g a z e t, d o d a tk i te m a ty c z n e , p e łn e w e r s je ra p o r tó w i a n a liz f irm b a d a w c z y c h czy ch o ćb y d o s tę p do w y b ra n y c h b a z d a n y c h . Iśc ie s a lo m o n o w y m ro z w ią z a n ie m j e s t p o w ią z a n ie o b u m e to d , je d n a k ż e s to s o w a n ie

31 Web Archiving in Europe. A Survey Provided by the Internet Memory, [online] <http:// internetmemory.org/images/uploads/Web_Archiving_Survey.pdf>, za: L. Derfert-Wolf, dz. cyt.

32 Wydatki na zasoby elektroniczne versus ogół wydatków w latach 2007-2011 w wybra­ nych bibliotekach świata zob. Y. Sung, The Rapid Growth of Electronic Resources in East

Asian Library Collections, [online] <http://www.arl.org/storage/documents/publications/lcdp-

-2012-poster-sung-yunah.pdf>, dostęp: 1.12.2013.

33 Ustawa z dnia 6 września 2001 roku o dostępie do informacji publicznej (Dz.U. 2001, nr 112, poz. 1198).

(13)

d o s tę p ó w m ie s z a n y c h g e n e r u je d o d a tk o w e k o s z ty i tr u d n o ś c i w z a k r e s i e ściśle jsz e g o n a d z o r u n a d p ro c e s e m z a r z ą d z a n ia d a n y m i z a rc h iw iz o w a n y m i.

Aspekty prawne

P r o b le m a ty k a p ra w n y c h za w iło śc i S ieci j e s t ju ż dość d o b rze o p is a n a w lite ­ r a t u r z e p r z e d m io tu . N ieco g o rz e j w y g lą d a n a t o m i a s t s a m a i n f r a s t r u k t u r a p r a w n a . W o p isie do k s ią ż k i P i o t r a W a g lo w sk ie g o P ra w o w sieci. Z a r y s r e g u ­

la c ji in te r n e tu m o ż n a p rz e c z y tać :

Dynam iczny rozwój in te rn e tu spraw ił, że organy ustaw odaw cze w ielu państw nie n adążały z przygotowywaniem regulacji praw nych dotyczących korzystania z niego. Początkowy okres rozwoju sieci przypom inał kolonizację nowego lądu - pełna bezkarność, chaos i b ra k jakichkolw iek ograniczeń. Ten sta n rzeczy doprowadził do sytuacji, w której naw et najgorętsi orędownicy wolności w sieci zaczęli się zastanaw iać, ja k uniknąć płynących z niej zagrożeń. Zaczęto więc tworzyć praw a, regulacje i przepisy, które je d n a k nie zawsze spełniają swoją rolę. N a całym świecie toczy się dyskusja n ad k ształtem regulacji praw nych społeczeństwa inform acyjnego34 .

B r a k j a s n y c h i sp ó jn y c h p rz e p is ó w p r a w a re g u lu ją c y c h sp o só b fu n k c jo ­ n o w a n ia w r a m a c h S ie c i g e n e r u je z a t e m tr u d n o ś c i z w ią z a n e z a rc h iw iz a c ją in te r n e to w y c h z a so b ó w ju ż u s a m y c h je j p o c z ą tk ó w . F u n d a m e n t a l n ą k w e s tią j e s t b o w ie m p ro b le m sa m e g o p r a w a do z a p is u s tr o n y W W W . P rz y c z y n teg o d o s z u k iw a ć się m o ż n a w s y tu a c ji, w k tó r e j w r a m a c h je d n e j s tr o n y s ą z a ­ m ie s z c z a n e u tw o ry (te k s ty , o b ra z y , m u z y k a ) p o d le g a ją c e p r a w u a u to r s k ie m u - i ta k ie , k tó r e sp o d te g o p r a w a z o s ta ły „ w y ję te ”, n ie z a p o m n ia w s z y o fak cie, że s a m p r o je k t s tr o n y in te r n e to w e j m o że ta k ż e b yć c h ro n io n y p rz y w o ła n y m p r z e p is e m 35. W r e a liz a c ji p r o je k tu U K W A p rz y ję to z a s a d ę , że a r c h iw iz a c ji n ie p o d le g a ją z a so b y , k tó r y c h w ła ś c ic ie le n ie w y r a z ili n a t e n p ro c e s z g o d y (p o ­ p rz e z n a p r z y k ła d z a m ie s z c z e n ie in fo rm a c ji o lic e n c ji C r e a tiv e C o m m o n s lu b in n e j d e k la r a c ji zgody), alb o te ż n ie z o s ta ły o n e u s ta w o w o w y o d rę b n io n e ( ta k j a k p rz y k ła d o w o s tr o n y p u b lic z n e ). O d m ie n n ą lo g ik ą k ie r u je się k ie ro w n ic tw o IA , k tó r e a rc h iw iz u je w s z y s tk o , a n a p ro ś b ę z a in te r e s o w a n e j s tr o n y u s u w a z p o s ia d a n y c h z a so b ó w s tr o n y i tr e ś c i, k tó r y c h w ła ś c ic ie le te g o so b ie z a ż y ­ czą. P rz y ję c ie te j, w g r u n c ie rz e c z y n a jp ro s ts z e j, m e to d y m a ta k ż e sw oje sła b e s tr o n y . O tóż W a y b a c k M a c h in e m ia ła w ie le s p r a w są d o w y c h , w k tó ry c h p o ­ w o d o w ie d o m a g a li się z a p r z e s t a n i a a r c h iw iz o w a n ia ich s tr o n o ra z lik w id a c ji d a n y c h ju ż z a p is a n y c h 36 .

34 [Online] <http://prawo.vagla.pl/prawo_w_sieci>, dostęp: 1.12.2013.

35 Dodatkowo sama strona może być utworem, stanowiąc przejaw czyjejś unikatowej dzia­ łalności artystycznej, czyli „o ile istotnie jest przejawem działalności twórczej i ma charak­ ter indywidualny, ustalony w jakiejkolwiek postaci, niezależnie od wartości, przeznaczenia i sposobu wyrażania” (P. Waglowski, Prawo w sieci. Zarys regulacji internetu, Gliwice 2005, s. 123).

(14)

N a g ru n c ie p o lsk ic h p rz e p isó w p r a w a fu n k c jo n u je w ie le z a p isó w , k tó r e p o ­ m im o d u ż ej łą c z n ie liczb y n a d a l n ie w y ja ś n ia ją sp ra w y . Z g o d n ie b o w ie m z Z a ­ le c e n ia m i K o m isji E u r o p e js k ie j z d n ia 27 p a ź d z ie r n ik a 20 1 1 r o k u w s p ra w ie d ig ita liz a c ji i u d o s tę p n ia n ia w I n te r n e c ie d o ro b k u k u ltu ro w e g o o ra z w s p ra w ie o c h ro n y z a so b ó w cyfro w y ch (2 0 0 1 /7 1 1 /U E )37 w p ro w a d z o n o n o w e liz a c ję U s t a ­ w y o o b o w ią zk o w y ch e g z e m p la rz a c h b ib lio te c z n y c h 38. U s ta w a t a m ia ła u p o ­ rz ą d k o w a ć k w e s tię p r a w a do z a p is u o ra z d o p recy zo w ać z a p is y U s ta w y o p r a ­ w ie a u to r s k im i p r a w a c h p o k re w n y c h z d n ia 4 lu te g o 1994 r o k u 39. Z d ru g ie g o z p rz y w o ła n y c h z a p is ó w w y n ik a , że „ e g z e m p la rz o w i o b o w ią z k o w e m u p o d le ­ g a ją n ie ty lk o u tw o r y ro z p o w s z e c h n ia n e d r u k ie m , lecz ró w n ie ż e g z e m p la rz e u tw o ró w ro z p o w s z e c h n ia n y c h z a p o ś re d n ic tw e m sieci”40. A z a te m u p ro sz c z e ­ n ie p ro c e d u ry a rc h iw iz a c ji p o leg a ło w in te n c ja c h le g is la to ró w n a s tw o rz e n iu p r a w a do z a p is u i a rc h iw iz o w a n ia u tw o ró w , k tó r e p o d le g a ły b y p rz e c h o w a n iu n ie ty lk o w fo rm ie m a te r ia ln e j, a le ró w n ie ż cyfrow ej. U s ta w a t a b y ła d o b ry m k r o k ie m w k i e r u n k u u p o r z ą d k o w a n ia z a p is ó w , a le d o ty c z y je d y n ie k w e s tii utw o ró w .

W p o w y ż sz y m k o n te k ś c ie w a r to w sp o m n ie ć o je s z c z e je d n y m z a p is ie p r a w ­ n y m - U s ta w ie o o c h ro n ie d a n y c h o so b o w y ch 41. W ą tp liw o ś c i b u d z i a rc h iw iz o ­ w a n ie s tr o n p o c h o d z ą c y ch z p o r ta li sp o łeczn o ścio w y ch , n a ła m a c h k tó r y c h p o ­ j a w ia ją się in fo rm a c je o d a n y c h o sobow ych d o s tę p n y c h w fo rm ie p o z w a la ją ce j

n a z id e n ty fik o w a n ie o soby fizy czn ej ( a r t. 6 u s t. 1), p rz y czym :

osobą możliwą do zidentyfikow ania je st osoba, której tożsam ość można określić bezpośrednio lub pośrednio, w szczególności poprzez powołanie się na num er identyfikacyjny albo jeden lub kilka specyficznych czynników określających jej cechy fizyczne, fizjologiczne, umysłowe, ekonomiczne, kulturow e lub spo- łeczne42 .

W a r to zw ró c ić u w a g ę , że te w y m ie n io n e p o w y żej d a n e dość s t a n d a r d o ­ w o z a m ie s z c z a się n a p o r ta la c h sp o łe c z n o ścio w y c h , ta k ic h j a k N a s z a K la s a (N K .p l) czy F a c e b o o k . F ir m y b ę d ą c e w ła ś c ic ie la m i ty c h p o r ta li p rz e c h o w u ją

37 Commission Recommendation of 27 October 2011 on the Digitization and Online

Accessibility of Cultural Material and Digital Preservation (2001/711/EU), [online] <http://

eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=0J:L:2011:283:0039:0045:EN:PDF>, dostęp: 7.12.2013.

38 Ustawa z dnia 7 listopada 1996 roku o obowiązkowych egzemplarzach bibliotecznych, [online] <http://www.bn.org.pl/zbiory/egzemplarz-obowiazkowy/ustawa-o-obowiazkowych-egzem- plarzach-bibliotecznych>, dostęp: 7.12.2013.

39 Ustawa z dnia 4 lutego 1994 roku o prawie autorskim i prawach pokrewnych (Dz.U. 1994, nr 24, poz. 83).

40 K. Ślaska, A. Wasilewska, Archiwizacja internetu - sytuacja w polskim prawie z punk­

tu widzenia bibliotekarzy, „Biuletyn EBIB” 2012, nr 1(128), s. 3, [online] <http://www.ebib.

pl/images/stories/numery/128/128_slaska.pdf>, dostęp: 19.09.2013.

41 Ustawa z dnia 29 sierpnia 1997 roku o ochronie danych osobowych (Dz.U. 1997, nr 133, poz. 883), [online] <http://isip.sejm.gov.pl/DetailsServlet?id=WDU19971330883>, dostęp: 9.12.2013.

(15)

i p r z e tw a r z a ją d a n e o sobow e osób fiz y c z n y c h 43, a w p r z y p a d k u a rc h iw iz o w a ­ n i a ic h z a so b ó w d a n e t e z o s ta n ą p r z e k a z a n e do p o d m io tu trz e c ie g o , co spow o­ d u je s y tu a c ję u t r u d n i a j ą c ą je d n o s tc e w g lą d , z m ia n ę , a k tu a liz a c ję o ra z p ra w o ż ą d a n i a u s u n ię c ia sw o ich d a n y c h z r e je s tr u .

Z a g a r n ia n ie czy d e fa c to p r y w a ty z a c ja w ła s n o ś c i je d n o s te k s k ła d a ją c y c h się w sw ej m a s ie n a z a s ó b d z ie d z ic tw a n a ro d o w e g o s ta ło s ię g ło ś n ą i k o n ­ t r o w e r s y jn ą k w e s tią z a s p r a w ą k o n c e r n u G oogle. O tó ż od 2 0 0 5 r o k u f ir m a ta , u d o s tę p n ia ją c u s łu g ę G oogle B o o k s (p ie rw o tn ie G oogle P r in t) , p o z w a la n a w y s z u k iw a n ie k s ią ż e k z n a jd u ją c y c h się w n a jw ię k s z y c h św ia to w y c h k s ię g a r ­ n ia c h o ra z b ib lio te k a c h . C zęść z p o zy cji d o s tę p n y c h z p o z io m u w y s z u k iw a r k i m o ż n a p rz e c z y ta ć w całości, część z n ic h je d y n ie p r z e g lą d n ą ć (z a p o m o c ą sło w a k lu czo w eg o ). W te n sp o só b k o n c e rn m a ją c y w P o lsce pozycję m o n o p o lis ty n a r y n k u w y s z u k iw a r e k 44 w o d p o w ie d z i n a z a p o trz e b o w a n ie k lie n tó w p o sz e rz y ł sw o ją o fe rtę w sp o só b le g a ln y ( s ta ją c się je d y n ie p o ś r e d n ik ie m d o s tę p n y c h w S ie c i za so b ó w ), choć b a rd z o k o n tr o w e r s y jn y (n ie w s z y s tk ie z a m ie s z c z o n e w S ieci k s ią ż k i z o s ta ły u d o s tę p n io n e z a z g o d ą a u t o r a lu b /i w y d a w n ic tw a ).

Zakończenie

P ro c e s a rc h iw iz a c ji z a so b ó w g lo b a ln e j S ie c i t r w a n ie p r z e r w a n ie od 1996 ro k u . W ró ż n y c h c z ę ś c ia c h ś w i a t a p ro c e s t e n p r z y b i e r a o d m ie n n e fo rm y i n a tę ż e n ie . K w e s tia k o n ie c z n o śc i o c h ro n y w ir tu a ln e g o k o n t e n t u r o z u m ia n e ­ go ja k o d z ie d z ic tw o k u ltu r o w e o ra z m a t e r i a ł h is to ry c z n y n ie p o d le g a ju ż d z i­ s ia j d y sk u sji. S p o r n a n a t o m i a s t w y d a je się k w e s tia w y b o ru m o d e lu re a liz a c ji te g o p ro c e s u . Ze w z g lę d ó w m e to d o lo g ic z n y c h i w z a k r e s ie o c e n y m a t e r i a ł u źró d ło w e g o le p s z y j e s t m o d e l a u to k r a ty c z n y . Z n a ją c je d n a k r e a l i a p o lsk ie g o b u d ż e tu , m o ż n a p rz e w id y w a ć , że f u n d u s z e p r z e z n a c z a n e n a n a u k ę n ie p o ­ z w o lą n a d z ia ła ln o ś ć te g o ty p u . N ie o d z o w n e s t a n i e się z a t e m p o s iłk o w a n ie się g r u p ą w o lo n ta r iu s z y . K ro k te n s p o w o d u je z w ię k s z e n ie t e m p a p r z y r o s tu tr e ś c i z d ig ita liz o w a n y c h , z m n ie js z a ją c ró w n o c z e ś n ie k o n tr o lę n a d cy fro w y m z a so b e m . P o ja w ia ją c e się w ty m k o n te k ś c ie , a o p is a n e w a r ty k u le p ro b le m y s ą im m a n e n t n ą c e c h ą p ro c e su . W a ż n e j e s t w ięc, a b y o d p o w ie d z i n a n e w ra lg ic z n e p y t a n i a u d z ie lić so b ie z a w c z a s u , z a n im p ro c e s te n w y m k n ie się sp o d k o n tro li, i z a n im z a r z ą d z a n ie z a rc h iw iz o w a n y m i in f o r m a c ja m i r o z u m ia n e b ę d z ie n ie ja k o p ro c e s p o r z ą d k o w a n ia u tr w a lo n y c h zaso b ó w , lecz ja k o w a lk a o p rz e ję c ie k o n tr o li n a d in fo rm a c ja m i.

43 Warto przywołać głośną sprawę sporu o prawo portalu Nasza Klasa do przetwarzania danych osobowych osób posiadających na portalu profile prywatne. Zob. P. Waglowski, GIO-

DO: imię, nazwisko, zdjęcie, szkoła, klasa i rocznik - łącznie - nie są danymi osobowymi...,

[online] <http://prawo.vagla.pl/node/8090>, dostęp: 1.12.2013.

44 Z silnika Googla korzysta w Polsce 97,5% internautów. Zob. Ł. Szewczyk, Wyszukiwar­

ki i katalogi, [online] <http://media2.pl/badania/100174-Megapanel-grudzien-2012-kategorie-

(16)

B i b l i o g r a f i a

Abiteboul S., Issues in Monitoring Web Data, w: Database and Expert Systems Applications, red. A. Hameurlain, R. Cicchetti, R. Traunmuller, Berlin - Heidelberg 2002, [online] <http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.95.4562&rep=rep1&type=pdf>, dostęp: 1.03.2014.

Ainsworth S.G., AlSum A., SalahEldeen H., Weigle M.C., Nelson M.L., How Much of the Web Is

Archived?, [online] <http://arxiv.org/pdf/1212.6177v2.pdf>, dostęp: 1.12.2013.

British Library chce zarchiwizować internet, [online] <http://www.tvn24.pl/british-library-chce-

-zarchiwizowac-internet,316939,html>, dostęp: 1.12.2013.

Cho J., Garcia-Molina H., The Evolution of the Web and Implications for an Incremental Craw­

ler, [online] <http://ilpubs.stanford.edu:8090/376/1/1999-22.pdf>, dostęp: 10.12.2013. Commission Recommendation of 27 October 2011 on the Digitization and Online Accessibility of

Cultural Material and Digital Preservation (2001/711/EU), [online] <http://eur-lex.europa.

eu/LexUriServ/LexUriServ.do?uri=OJ:L:2011:283:0039:0045:EN:PDF>, dostęp: 7.12.2013. Derfert-Wolf L., Archiwizacja Internetu - wprowadzenie i przegląd wybranych inicjatyw, „Biule­

tyn EBIB” 2012, nr 1(128), [online] <http://eprints.relis.org/17048/1/derfert_Web_archiving. pdf>, dostęp: 10.09.2013.

Europeana - pomyśl o kulturze, [online] <http://www.bn.org.pl/zasoby-cyfrowe-i-linki/europea-

na>, dostęp: 1.03.2014.

Gmerek K., Archiwa internetowe po obu stronach Atlantyku - Internet Archive, Wayback Ma­

chine oraz UK Web Archive, „Biuletyn EBIB” 2012, nr 1(128), [online] <http://www.ebib.

pl/images/stories/numery/128/128_gmerek.pdf>, dostęp: 10.09.2013.

Gogołek W., Komunikacja sieciowa. Uwarunkowania, kategorie, paradoksy, Warszawa 2010. Jankowska M., Biblioteki akademickie - trendy dotyczące zasobów elektronicznych, w: Informa­

cja dla nauki a świat zasobów cyfrowych, red. H. Ganińska, Poznań 2008.

Masanes J. , Web Archiving, Berlin - Heidelberg 2006, [online] <http://stevejones.me/pubs/2006/ WebUseWebStudies.pdf>, dostęp: 1.03.2014.

Masanes J . , Web Archiving Methods and Approaches: A Comparative Study, [online] <https://www. ideals.illinois.edu/bitstream/handle/2142/2452/Masanes.pdf?sequence=2>, dostęp: 1.03.2014. Mrożewski B., Archiwa internetu, „PC Format” 2012, nr 4, [online] <http://www.pcformat.pl/Ar-

chiwa-internetu,a,2374>, dostęp: 7.12.2013.

Sung Y., The Rapid Growth of Electronic Resources in East Asian Library Collections, [on­ line] <http://www.arl.org/storage/documents/publications/lcdp-2012-poster-sung-yunah.pdf>, dostęp: 1.12.2013.

Sweeney E., Curran K., Xie E., Automating Information Discovery within the Invisible Web, w:

Web-Based Support System, red. JingTao Yao, London 2010.

Szewczyk Ł., Wyszukiwarki i katalogi, [online] <http://media2.pl/badania/100174-Megapanel- -grudzien-2012-kategorie-tematyczne/20.html>, dostęp: 12.10.2013.

Ślaska K., Wasilewska A., Archiwizacja internetu - sytuacja w polskim prawie z punktu widze­

nia bibliotekarzy, „Biuletyn EBIB” 2012, nr 1(128), [online] <http://www.ebib.pl/images/sto-

ries/numery/128/128_slaska.pdf>, dostęp: 19.09.2013.

Waglowski P., GIODO: imię, nazwisko, zdjęcie, szkoła, klasa i rocznik - łącznie - nie są danymi

osobowymi..., [online] <http://prawo.vagla.pl/node/8090>, dostęp: 1.12.2013.

Waglowski P., Prawo w sieci. Zarys regulacji internetu, Gliwice 2005.

Wilkowski M., Archiwum Twittera w Bibliotece Kongresu, „Historia i Media”, [online] <http://hi- storiaimedia.org/2011/06/14/archiwum-twittera-w-bibliotece-kongresu>, dostęp: 2.12.2013. Wilkowski M., Trzy argumenty przeciwko archiwizowaniu Internetu, „Historia i Media”, [online]

<http://historiaimedia.org/2011/10/04/trzy-argumenty-przeciwko-archiwizowaniu-interne- tu>, dostęp: 10.04.2013.

Dokumenty prawne

Ustawa z dnia 4 lutego 1994 roku o prawie autorskim i prawach pokrewnych (Dz.U. 1994, nr 24, poz. 83).

(17)

Ustawa z dnia 7 listopada 1996 roku o obowiązkowych egzemplarzach bibliotecznych, [online] <http://www.bn.org.pl/zbiory/egzemplarz-obowiazkowy/ustawa-o-obowiazkowych-egzempla- rzach-bibliotecznych>, dostęp: 7.12.2013.

Ustawa z dnia 29 sierpnia 1997 roku o ochronie danych osobowych (Dz.U. 1997, nr 133, poz. 883). Ustawa z dnia 6 września 2001 roku o dostępie do informacji publicznej (Dz.U. 2001, nr 112,

poz. 1198).

S t r e s z c z e n i e

Zadanie archiwizacji zasobów, które w przypadku mediów tradycyjnych nie n a s trę ­ cza zbyt w ielu kłopotów, w odniesieniu do In te rn e tu wydaje się niem al niemożliwe do realizacji. Przy okazji procesu archiwizacji powstaje wiele p y tań dotyczących kw estii zarządzania zbieranym i inform acjam i, sposobu udostępniania i grom adzenia danych oraz samego doboru stron, które tem u procesowi m ają podlegać. W arto więc badać w spom niany obszar, ponieważ w polskiej lite ra tu rz e przedm iotu tem aty k a archiw i­ zacji In te rn e tu je st poruszana jedynie m arginalnie, a sam te m a t nie je st powszech­ nie znany, ponadto Polska nie podjęła jeszcze instytucjonalnie usankcjonowanych, system atycznych prac nad archiw izacją zasobów sieciowych. W ydaje się przy tym , że zarówno w Europie, ja k i w innych częściach św iata wypracowano już narzędzia oraz międzynarodowe sta n d ard y w zakresie archiw izow ania w irtualnego k o n ten tu i zarządzania zgromadzonymi danym i. Z tego też względu celem niniejszego arty k u łu je st przegląd głównych kw estii związanych z problem atyką zarządzania inform acją w procesie archiw izow ania zasobów In te rn e tu . Ich klasyfikacji (aspekty techniczne, etyczne, ekonomiczne i praw ne) dokonano w oparciu o dośw iadczenia z już istn ieją­ cych projektów oraz w odniesieniu do analizy krytycznej prezentow anej w literatu rze przedm iotu.

S u m m a r y

I n fo r m a t io n m a n a g e m e n t in t h e p r o c e s s o f w e b a r c h iv in g

In th e case of tra d itio n a l m edia, th e archiving of contents does not cause m any problem s. However, w hen it comes to th e In te rn e t it seem s alm ost im possible to pro­ ceed. W hile th e process of web archiving a nu m b er of questions concerning th e infor­ m ation m anagem ent occur, such as how to select and sh are d a ta and which th e sites should be chosen to archive. Therefore, it is quite im p o rtan t to explore th e area.

Moreover, in th e Polish lite ra tu re , th e issue of web archiving is m entioned very little an d th is problem is not well known. In addition, Poland h a s not yet enforced system atic w ork on th e archiving of netw ork resources. It seem s th a t in Europe and in th e o th er p a rts of th e world, th e tools and in te rn a tio n a l sta n d a rd s regarding web archiving an d collected inform ation m anagem ent have been alread y developed. T here­ fore, th e aim of th is article is to review th e m ain dilem m as related to th e issu es of inform ation m anagem ent in th e process of web archiving. The presented classification is based on th e experience of existing projects and th e critical analysis presented in professional lite ratu re .

Cytaty

Powiązane dokumenty

Należy podkreślić, że projekt pojawił się nagle i nie był ze środowiskiem konsultowany, widać to po jego zapisach, punktach odniesienia, nazwie, wszystko wskazuje na to,

Grzywacz, Dysfunkcjonalność rodziny a rozwój osobowości dzieci i młodzieży, Koszalin 1998, s... pie wysokiego ryzyka uzależnienia

Obecnie trwają prace nad wdrożeniem Zintegrowanego Wieloszczeblowego Systemu Informatycznego Logistyki, Finansów i Kadr oraz systemów dowodzenia i kierowania

Jeśli chodzi o historyczność wydarzenia to znane są trzy rodzaje wyjaśnienia, czym było rozmnożenie chle­ ba. Szkoła liberalna próbowała wyjaśnić wydarzenie

To być może wyjaśnia fakt ich bardziej krytycznego nastawienia do oceny relacji między ewolucjonizmem a kreacjonizmem, niż nauczycieli o wy­ łącznie

Omawiając hipertekstualność organizacji, a co się z tym wiąże – wielowarstwo- wość public relations (związaną z rozwojem nowych mediów oraz powstaniem nowych nowych

jak można się zorientować, licencje składają się z czterech elementów, które nazywa się warunkami: By (uznanie autorstwa), nc (użycie niekomercyjne), nd (Bez

Oznacza to wprowadzenie nowego, integratywnego stylu kierowania, w którym pracownik staje się bardziej partnerem niż podwładnym i w którym rozkazodawstwo za- stępowane