• Nie Znaleziono Wyników

WWW źródłem zmian w paradygmacie bibliometrii. Początki webometrii

N/A
N/A
Protected

Academic year: 2021

Share "WWW źródłem zmian w paradygmacie bibliometrii. Początki webometrii"

Copied!
22
0
0

Pełen tekst

(1)

Piotr Nowak

WWW źródłem zmian w

paradygmacie bibliometrii. Początki

webometrii

Biblioteka 9 (18), 55-74

2005

(2)

N R 9 (18) B IB L IO T E K A 2005

P IO T R NOW AK

W W W źródłem zmian

w paradygm acie bibliometrii.

Początki webometrii

U w a g i w s t ę p n e

K iedy w nauce po raz pierwszy pojaw iła się dojrzalsza, refleksja teoretyczna n ad ilościowymi aspektam i produkcji wydawniczej, a fakt ten zwykliśmy sytuow ać w XX wieku pom iędzy w ojnam i światowymi, niewiele zjawisk zapow iadało pojaw ienie się elektronicznych nośników informacji. G dy w latach 70 ubiegłego wieku zaczęto realizować pierwsze, szerzej zakro­ jone program y digitalizacji, nikt nie przew idyw ał, że ich dynam iczny rozwój realnie zagrozi źródłom tradycyjnym . B iblioinetria zareagow ała n a zjawisko digitalizacji, w łączając źród ła elektroniczne do podstaw y w łasnych badań.

Nie m a wątpliwości, że przez operow anie zbioram i dokum entów elek­ tronicznych procedura, badawcza zdecydowanie zo stała uproszczona, ła­ twiej też stosować poszczególne, typowe dla pracy badawczej, schem aty i techniki. Pierw sze stu d ia nie m ogły bazować jeszcze na dokum entach z sieci. O pierały się n a bibliograficznych bazach danych dostarczanych off- -line. W iększość dokum entów elektronicznych, udostępniana, w łaśnie w taki sposób, spełn ia w istocie funkcję analogiczną do funkcji dokum entu tr a ­ dycyjnego (rozum ianego jako jed n o stk a zasobu drukowanego). D latego też nie m a chyba specjalnego u zasadnienia traktow anie źródeł, które przyjęły p o stać elektroniczną przez digitalizację (tzn. zostały zapisane n a nośniku cyfrowym z prym arnej postaci analogowej), jako odrębnej jakości w b a d a ­ niach bibliom etrycznych. N ikt z badaczy nic tw ierdził, że w ym agają one wyjątkowej procedury m etodologicznej, choć, z pewnością, pod względem technicznym prowadzi się je nieco inaczej.

(3)

Ten ty p studiów , rozw ijających się jeszcze dzisiaj, traktow ać należy jako przejściowy etap w iodący od typow ych analiz bibliom etrycznych do s tu ­ diów stricte w ebom etrycznych.

Mechanizmy rządzące światem dokumentów elektronicznych różnią się od me­ chanizmów funkcjonowania dokumentów tradycyjnych dopiero wówczas, gdy zmieni się model ich dostarczania. Model ten faktycznie zaczął się zmieniać szybciej, niż przypuszczano. W momencie upowszechnienia się nośnika cyfrowego nastąpiła druga rewolucja w dziedzinie źródeł informacji. Jej zasadniczym elementem było wykładnicze rozprzestrzenianie się systemów sieciowego dostarczania dokumentów. W odpowiedzi na to zjawisko pojawiła się webometria (cybermetria, netometria)1.

Najważniejsze pytanie metodologiczne, jakie nasuwa się w związku z tym faktem, brzmi: czy obecny dorobek teoretyczny bibliometrii może być - bez podda­ wania go poważniejszym modyfikacjom - wykorzystywany do analizy korpusu pu­ blikacji elektronicznych dostarczanych sieciowo, czy należy raczej mówić o innym niż paradygmat bibliometrii, paradygmacie uprawiania webometrii? Spróbujmy na nie odpowiedzieć po skrótowym przedstawieniu podstaw webometrii.

P o d s ta w o w e p o ję c ia . G łó w n i p r z e d s ta w ic ie le

Powszechnie przyjm uje się, że term in weborrietrics po raz pierwszy użyty został przez T .C . A lm inda i P. Ingw ersena w 19972. W tym sam ym roku w ty tu le czasopism a elektronicznego pojaw ił się term in cyberrnetrics3. P rzed rokiem 1997 sporadycznie używano term in u bibliometria W W W 4. W tej sy­

1 W Polsce pierw sze opracow anie w prow adzające w p o d staw y w ebom etrii przygotow ała M. Skalska-Zlat. Przedstaw iono w nim rozwój tej su b dycypliny od chwili po jaw ien ia się do poł. 2004 roku. Ten bard zo d o b ry te k st trafn ie w skazuje n a najw ażniejsze zm iany w p o d s ta ­ wach teoretycznych b ibliom etrii w yw ołane (’oraz szerszym w kraczaniem In te re n c tu w różne obszary kom unikacji, w ty m tak że oczywiście w nauce. Por. M. Skalska-Zlat, Cyberm etria, n e ­

tom etria, webom etria nowe pojęcia i zadania inform etrii. w: P rzestrzeń inform acji i ko m u ­ nikacji społecznej, K raków 2004, s. 159-168. Jednocześnie opublikow ano tak że dw a s tu d ia we-

b om ctrycznc o ch arak terze em pirycznym : D. K otyrasa, M ożliw ości badań w ebom etrycznych

w odniesieniu do serwisów internetow ych szkół wyższych, ibidem , s. 145-148 oraz R. Sapy, Proste badania bibliom etryczne: zagraniczne odnośniki do polskich bibliotek uniw ersyteckich,

ibidem , s. 154-158. To pierwsze tego ty p u prace w k ra ju , dlatego nieco uwagi pośw ięcim y im niżej w kontekście głów nych kierunków b a d a ń w ebom etrycznych.

2 T .C . A lm ind. P. Ingw ersen. In fo rm e tric analyses on the World, W ide Web: m ethodologi­

cal approaches to ‘W ebom etrics’ „Jo u rn al of D o cu m e n ta tio n ”, vol. 53, n r 4, s. 404-426.

3 Cyberrnetrics. In te rn a tio n a l Journal o f S cien to m e trics, Iiifo rm etrics and B iblionietrics, < h ttp ://w w w .c in d o c .c 8 ic .c s/c y b c rm c tric s.h tm l> , [dostęp: 13.03.2005].

4 R. R. L arson, B ibliom etrics o f the World W ide Web: A n E xploratory A n a lysis o f the I n ­

tellectual S tru ctu re o f Cyberspace, 1996, < h ttp ://s h e rlo d c .b e rk e le y .e d u /a sis 9 6 /a sis9 6 .h tm l> ,

(4)

W W W źródłem zm ia n w paradygm acie bibliom etrii 5 7

tu acji m echanizm pow staw ania term in u w ebom etria przypom inałby nieco m echanizm po w stania term inu bibliometria (zgodnie z istniejącą w języku ten d en cją do holofrazy):

bibliografia statystyczna - bibliom etria - bibliom etria W W W - webometria (cyberm etria/netom etria etc.)

A u to r nie znalazł w literatu rze wcześniejszego użycia term inu webome­

tria. Virgil D iodato w swym Słow niku bibliometrii w ydanym w 1994 roku

nie um ieścił go n a liście haseł ’.

Oczywiście, webometrię definiuje się analogicznie do bibliometrii. W zasadzie mieści się ona nawet w najpopularniejszej definicji bibliom etrii A. Pritcharda: „the application of m athem atics and sta tistic a l m ethods to books and a th e r

m e d ia o f c o m u m u n ic a tio ii”6.

W najbardziej lakoniczny sposób term in w ebom etria definiowany jest chyba przez L.D. Fugi - „W ebometrics is th e stu d y of q u a n tita tiv e aspects of webpages or nodes”7.

M. Skalska-Zlat dokonała przeglądu definicji w ebom etrii w w ybranych en­ cyklopediach ogólnych oraz specjalnych. W Wikipedii zn alazła n a stęp u jącą definicję: „The science of w ebom etrics (also cyberm etrics, web m etrics) tries to m easure th e In te rn et to get knowledge ab o u t num ber and types of hyperlinks of th e W orld W ide W eb an d usage patern s. Sim ilar sciences are Inform etrics, Bibliom etrics, Scientom etrics and W eb M ining”6. P odob­ nie w ebom etrię definiuje Encyklopedia o f Inform ation and Library Science (2003), a tak że au to rzy bibliografii rejestrujących piśm iennictw o z tego za­ kresu9.

Za najw ybitniejszych przedstaw icieli w ebom etrii uzn aje się Leo Egghe, R onalda R ousseau, L oeta Leydesdorffa i P e tera Ingwersena. Sąd nasz opie­ ram y n a przesłance, ja k ą jest uhonorow anie tych osób M edalem im. Dereka J. de Solla P ric e ’a (Derek J. de Solla Price M edal). Leo Egghe i Ronald Rousseau otrzym ali go w roku 2001, Loet Leydesdorff w 2003, a P eter Ingwersen i Howard D. W h ite w 200510.

" D ictio n a ry o f bibliom etrics, New York: T h e H aw o rth P ress 1994, s. 185.

b A. P ritc h a rd , S ta tistica l bibliography or bibliom etrics?, „Jo u rn al of D o cu m e n ta tio n ”, n r 25. s. 349.

7 F undam ental metodologi.es and tools fo r the em p lo ym en t o f w ebom etrics analyses, < h t t p : / / d list.sir.a riz o u a .e d u /archive/00000287> , s. 10, [dostęp: 25.02.2005|.

s Wikipedia, < h ttp ://e n .w ik ip c d ia .o rg /w ik i/W c b o m e tric s> , |dostęp: 25.02.20051; M. Skal- ska-Zlat, C yberm etria..., op. c it., s. 161.

3 Ibidem .

10 A wardees o f the. D erek J. de Solla P rice m edal, < h t t p : / /u s e rs .p a n d o r a .b e / ro n a ld .ro u s s e a u /k tm l/p ric e _ a w a rd e e s .h tm l> ) [dostęp: 02.02.2005].

(5)

O b sza r b a d a ń

Nie będziem y dalecy od prawdy, gdy stwierdzimy, że przedm iot w ebom etrii w zasadzie jest analogiczny do p rzedm iotu klasycznej bibliom etrii. Różnica polega przede w szystkim n a nośniku oraz sposobie d ostarczania dokum en­ tu (system ie inform acyjnym , w ram ach którego funkcjonuje). Teza ta , rzecz jasn a, wcale nie oznacza, że dochodzim y na ty m polu do analogicznych wy­ ników czy form ułujem y identyczne wskaźniki.

Z em pirycznego p u n k tu w idzenia bibliom etria skoncentrow ana b yła n a u sta la n iu wielkości produkcji oraz charakteryzujących ją wskaźników. G. Heimeriks i P. van den Besselaar proponują pewien schem at m odelu jej podstawowej m eto d y em pirycznej11. O pierając się n a nim główne w ym iary m etodologii bibliom etrii przedstaw ić m ożna w tak i oto sposób:

W ydaje się, że w warstw ie em pirycznej webometria, będzie miała, podob­ n ą s tru k tu rę zadań.

Do podstaw ow ych zadań, bez których nie u d a się u stalać wskaźników, należeć będzie ustalenie wielkości produkcji.

R o z m ia r I n te r n e tu

W arunkiem prow adzenia studiów kw antytatyw nych n ad piśm iennictw em było istnienie odpowiedniej liczby dokum entów stanow iących ich p o d sta ­ wę. Bez dynam icznego rozw oju ruchu wydawniczego nie byłoby biblio­ grafii statystycznej i w szystkich późniejszych m etod bibliom etrycznych, jakie pow stały w ubiegłym wieku. D latego bardziej zaawansowane b ad an ia

11 G. H eim eriks. P. van den B esselaar, S ta te o f A rt. In B ibliom etrics and W ebometrics.

(6)

W W W źródłem zm ia n w paradygm acie bibliom etrii 5 9

kw antytatyw ne n a d piśm iennictw em poprzedzone m usiały zostać odtw orze­ niem rozm iarów ruchu wydawniczego. To sam o dotyczy wszelkich studiów i b ad a ń w ebom etrycznych.

Jed n ak w odróżnieniu od stosunkowo dokładnych sta ty sty k książek 1 prasy, ustalenie rozm iarów In te rn e tu spraw ia ogrom ne kłopoty.

Analitycy, którzy podejm ow ali te próby, zgadzają się z sobą tylko w jednym punkcie: n astęp u je szybki w zrost In tern etu , gdy przychodzi jed n a k do konkretnych liczb są bardzo ostrożni, a dane, jakie p rzy ta cz a ją nie zawsze są sp ó jn e12.

S. Law rance i C .L . Giles w grudniu 1997 roku indeksow any W eb szaco­ wali n a 320 m in s tro n 13. W rok później ci sam i a u to rzy przeprowadzili ko­ lejną analizę, jed n a k wredług nieco innej m etodyki. P rzyjęto, że w sumie istn iało wówczas 16 m in serwerów. N a każdym z nich było 289 stron, co łącznie d aje ok. 800 m in stro n (oczywiście również bez tzw. stro n głębo­ kich14, które są poza zasięgiem zwykłych w yszukiw arek15). W idać zatem , że w zależności od przyjętego sposobu obliczenia - w praktyce prawie za ten sam okres — dane różnią się diam etralnie, bo dokładnie dw uipółkrotnie.

Inkom i C ooperation i N E T R esearch In stitu t szacował rozm iar In tern e­ tu n a p o czątku 2000 roku n a 1 bilion dokum entów (również bez stro n głę­ bo k ich )16. M. Skalska-Zlat za J. B ar-Ilan cytuje jeszcze inne dane: „Szacuje się, że w 1995 roku było jedenaście milionów stro n WTW W , a w 2000 roku już dw a m iliardy dwieście milionów. Miesięczny przyrost wynosi ok. 7 mi­ lionów stron, a liczba t a stale rośnie w zaw rotnym tem pie”17. Podobne wiel­ kości p o d a je I.F . Aąuillo, k tó ry przyjm uje, że w połowie 2000 roku istniało 2 m iliardy stro n W7e b 18. P rzy czym, w ty m sam ym 2000 roku szacowano 12 Por. np. L.D . Fugi, F undam ental metodologies and tools fo r the em p lo ym en t o f webo-

m etrics analyses. T h e R oyal School of L ib rary & In fo rm atio n Science, D en m ark . M ay 2001,

< h ttp ://d lis t.s ir.a riz o n a .e d u / archive/ 00000287> , [dostęp: 05.02.200-5]. 1.1 Searching the Worl W ide Web, „Science”, vol. 280. s. 98-100.

11 Deep web lub invisible web, czyli tzw . sieć u k ry ta : w odró żn ien iu od surface web, a więc sieci w idocznej. To najczęściej stosow ana w lite ra tu rz e term inologia. Zob. np. M .K . B erg­ m an, The Deep web: surfacing hiddenvalue. „Journal of E lectronic Publishing”, A ugust 2001, volum e 7, issue 1, < h t t p :/ / w w w .p ress.u m ich .ed u /jep / 07-01/ b e rg m a n .h tm l> [dostęp: 05.02.200-5].

1.1 T erm in z pewmością nieostry, niem niej używ any w piśm iennictw ie p rzed m io tu ( ordina­

ry web engines). Zob. np. L.D. F u g t, F undam ental..., op. c it., s. 150.

16 Ibidem , s. 50.

17 M. Skalska-Zlat, C yberm etria ..., op. cit., s. 159.

'■ I .F . A ąuillo, Indicadores hacia una evaluacion no objectw a (cu a n tita tw a ) de sedes

web, w: V II Jornadas Espanolas de D ocum entacion. Bilbao: Servicio E d ito ria l de la LTniver-

siad del P ais Vasco, 2000, s. 233-248. (C yt. za: C. F aba-P crcz, V .P. G ucrrcro-B otc, F. Moya- A ncgon, S ita tio n distributions and B ra d fo rd ’s law in a closed Web space, „Jo u rn al of D ocu­ m e n ta tio n ”, vol. 59, n r 5, 2003, s. 558-580.

(7)

- B ergm an - że stro n głębokich jest 500 razy więcej niż indeksow anych19. Obecnie - najostrożniej szacując — m am y ponad trz y m iliardy indeksowa­ nych stron.

Bez w ątpienia, w m iarę dokładne dane na te m a t liczby stro n w In ter­ necie pozwoliłyby przede w szystkim na w iarygodne b ad an ia efektywności w yszukiw ania w sieci, efektywności funkcjonow ania wyszukiw arek interne­ towych. Bez danych n a te m a t poszczególnych dom en nie m ożna, nawet w przybliżeniu, określić takiego wskaźnika ja k kom pletność wyszukiwania.

Pom im o tego rola In te rn etu w kom unikacji globalnej rośnie nieustannie. Interesującego porów nania dokonał np. M .K . Bergm an. Obliczył bowiem dynam ikę p rzy ro stu inform acji w dwóch rodzajach źródeł: źródłach druko­ wanych oraz w Internecie (z zastosow aniem p o d ziału n a tzw. stro ny głębo­ kie i strony w idoczne)20:

W 2002 roku ogólne zasoby In te rn e tu w te ra b a jta c h z podziałem na ka­ tegorie kształto w ały się n astępu jąco 21:

R o d z a j p r z e k a z u R o z m i a r w t e r a b a j t a c h

Indeksowany web 167

Głęboki web 918-50

19 M .K . B ergm an, The Deep Web: Surfacing H idden Value, USA: B rig h t P la n e t, th e In ­ te r n e t co n ten t com pany, 2000, < h ttp ://128.121.227.57/dow noad/dccpw cbw hitcpapcr.pdf> , [dostęp: 06.03.2005].

20 P rz e d ru k M .K . B ergm an, The Deep w eb... op. cit., [brak pag.].

21 P. L y m an i in. How M uch In fo rm a tio n ? , < h ttp ://w w w .sim s.b e rk e le y .e d u /re se a rc h / projects/h o w -m u ch -in fo -2 0 0 3 > [dostęp: 18.03.2005].

(8)

W W W źródłem zm ia n w paradygm acie b ibliom etni 61

E-mail 440 606

Pozostałe 274

Ogółem: 532,89

W arto przyjrzeć się także topografii użytkowników In tern etu . W świetle tych danych, z p u n k tu w idzenia naszego ąuasi-podw ójnego s ta tu s u obywa­ telskiego (w znaczeniu obyw atelskim jesteśm y zarów no Polakam i, ja k i oby­ w atelam i Europy) nie w yglądam y źle22:

Obszar Liczba użytkowników

Afryka 6,31 min

Azja (Pacyfik) 187,24 min

Europa 190,91 min

Bliski Wschód 5,12 min K anada i USA 182.67 min Ameryka Łacińska 33,35 min

Bez w ątpienia, ustalenie rozm iaru In te rn etu było jednym z warunków pow stan ia w ebom etrii. Ciągle jed n a k pow ażną przeszkodą w jej rozwoju jest b rak narzędzi, które pozwoliłyby precyzyjnie oszacować ilość funkcjo­ nujących w Internecie dokum entów . W tradycyjnej bibliom etrii ustalenie danych na te m a t skali rozw oju ruchu wydawniczego pozwoliło n a bardzo precyzyjne b ad an ia nad jego stru k tu rą . Umożliwiło także zdefiniowanie szeregu istotnych wskaźników bibliom etrycznych. B rak takich możliwości w w ebom etrii w pływ a także n a słabszy rozwój jej p od staw teoretycznych.

K łopoty z ustaleniem rozm iaru Internetu nie w yczerpują listy problemów, z jakim i borykają się jego badacze, sporo ograniczeń w badaniach kw antyta- tywnych wynika też ze specyfiki dokum entów pojaw iających się w sieci, mowa tu o takich ich właściwościach, jak sem istrukturalność i heterogeniczność.

D a n e sem istru k tu ra ln e w h etero g en iczn y m m o d e lu ź r ó d ła

W literatu rze dane sem istru k tu raln e definiuje się jako „(...) dane, które

m a ją n ieregularną stru k tu rę , są heterogeniczne (niejednorodne) i globalnie rozproszone. Podstaw ow ym m iejscem w ystępow ania danych sem istru ktu- ralnych są zasoby inform acji w Internecie oraz zintegrow ane repozytoria danych pochodzących z różnorodnych źródeł (zarówno stru k tu raln y ch , jak i sem istru k tu raln y ch )”23.

22 Ibidem .

23 T. Pankow ski, Modele i ję z y k i danych sem istrukturalnych w integracji heterogenicznych

źródeł inform acji, w: In telig en tn e m etody kom puterow e dla nauki, technologii i gospodarki,

(9)

Problem , jak i związany jest z danym i sem istru k turalny m i, jest przede w szystkim zagadnieniem czysto inform atycznym , łączącym w sobie ele­ m enty baz danych, wyszukiwanie inform acji oraz sztuczną inteligencję24. Niemniej nie jest on bez znaczenia także z p u n k tu w idzenia b ad a ń we- bom etrycznych. Rzecz sprow adza się do możliwości dokładnej oceny skali i stru k tu ry w ym iany inform acji w w ym iarze globalnym pom iędzy różnym i system am i. Jeśli problem ten nie zostanie rozwiązany, to w zasadzie nigdy nie będziem y otrzym yw ać w pełni w iarygodnych liczb z In tern etu . Jak bowiem słusznie zauważa, cytow any wcześniej, T. Pankowski:

(...) n a s z a w ie d z a o z a s o b a c h in f o r m a c y jn y cli tw o rz o n y c h ja k o d a n e se- m i s t r u k t u r a l n e . c z ę s to b a r d z o d u ż e i r o z p r o s z o n e , j e s t b o w ie m zaw sz e n ie p e łn a , ta k ż e z a p y ta n i a fo r m u ło w a n e s ą w s p o s ó b p rz y b liż o n y , z a te m i o d p o w ie d z i w p e w ie n s p o s ó b „ p r z y b liż a ją ” o d p o w ie d ź d o k ła d n ą 2’.

Nie sądzimy, aby ktoś zaryzykował tw ierdzenie, że w spółczesna teoria języków inform acyjno-wyszukiwawczych radzi sobie z każdym problem em zw iązanym z wyszukiwaniem dokum entów nieporów nanie mniej heteroge­ nicznych (a w zasadzie w olbrzymiej większości pod względem form alnym hom ogenicznych) przechowywanych w postaci skończonego zasobu druko­ wanego w bibliotekach. J a k w tej sytuacji uzyskiwać w m iarę p e łn ą kom­ pletność i dokładność w yszukiw ania w Internecie?

Problem te n nie doczekał się jeszcze bardziej jednoznacznych rozstrzy­ gnięć i n a gruncie rysującego się obszaru w ebom etrii nie był chyba d o tąd szerzej przez nikogo dyskutow any. D latego, rzecz jasn a, nie będziem y for­ m ułować n a siłę w łasnych konkluzji. Jedno w ydaje się jed n a k pewne: we wszelkich kw antytatyw nych bad an iach dokum entów dostarczanych poprzez sieć należy p am iętać o ograniczeniach, które rodzi w yraźna sem istruktural- ność i heterogeniczność analizow anych źródeł.

D o k u m e n t d y n a m ic z n y ja k o je d n o s tk a o b lic z e n io w a w w e b o m e tr ii

P oza w spom nianą sem istru k tu ralno ścią oraz heterogenicznością źródeł w ir­ tualnych w literatu rze pojaw iło się pojęcie dokum entu dynam icznego26. W związku z coraz większym zakresem operacji wykonywanych przez

24 Ibidem , s. 181. 2’ Ibidem , s. 182.

26 Z. K icrzkow ski, A. K ołopicńczyk, D o ku m en ty d yn a m icn e w budowie kooperacyjnych

(10)

W W W źródłem zm ia n w paradygm acie bibliom etrii 6 3

współczesne system y inform acyjne, dość istotnie zm ienia się i zm ieniał się będzie n adal m odel arc h ite k tu ry system u inform acyjnego27, którego p od­ staw ą s ta n ą się dokum enty m ające zdolność głębokiej ewolucji s tru k tu ry w zależności od funkcji, ja k ą w danym m om encie będą pełnić. W bardzo krótkim czasie zm ieniać się będzie także język opisu tak ich dokum entów oraz - siłą rzeczy - ich liczba. O sta tn i z w ym ienionych punktów z pew­ nością w płynie n a parad y g m at w ebom etrii, gdyż w sposób ciągły zm ianie w czasie ulegać będzie liczba dokum entów stanow iących podstaw ę analiz.

W tej sytuacji pojaw ienie się d o kum entu dynam icznego może poważnie skomplikować definiowanie podstawowej jednostki obliczeniowej. Operować będziem y nie, ja k dotychczas, d okum entam i czy źródłam i, lecz pojęciem bliższym jednostkowej inform acji. Będzie to jakaś h ip otety czn a faseta in­ form acji. W chwili obecnej w zasadzie nie znajdujem y w prow adzonych b a­ daniach w ebom etrycznych ujęć, w których szeroko dyskutow ano by pojęcie do kum entu dynam icznego. Problem te n sygnalizuje M. Skalska-Zlat, powo­ łując się na stu d ia L. Egghe28.

R o z w ó j te o r ii. B a d a n ia rela cji

Interesujące stu d ia n a d m eto d y k ą prow adzenia b a d ań m etrycznych nad cyberprzestrzenią wyszły spod pióra T .C . A lm inda, k tó ry w 1997 roku w spólnie z P. Ingwersenem opublikował, cytow any już wcześniej, arty k u ł

In fo rm etric analyses on the world wide web: methodological approaches to ‘W ebom etrics20.

J. K im przyjrzał się niektórym m etodom oceny w artości m ateriałów na­ ukowych publikow anych w sieci. Efektem tych b a d ań był m .in. arty k u ł

M otivations fo r hyperlinking in scholarly electronic arücels: a quantitaive stu d y 30. Poza ty m w kład w rozwój b a d ań w ebom etrycznych wnieśli tac y ba­

dacze, ja k S. Law rance oraz C.L. Giles31. A ktyw nym analitykiem w dziedzi­ nie w ebom etrii jest M. Thelw all32.

27 Ibidem , s. 131.

* M. Skalska-Zlat, C yberm etria..., op. cit., s. 163; L. Egghe, N ew in fo rm etric aspects o f

the In tern et: som e reflections - m a n y problems, „Journal of In fo rm atio n S cicn ce’. vol. 26,

n r 5, s. 329-335.

29 „Jo u rn al of D o cu m e n ta tio n ”, vol. 53, n r 4. s. 404-426. 30 „JA SIS”, vol. 5, n r 10, s. 887-899.

3 Searching the Word W ide Web, „Science”, vol. 280, s. 98-100; idem . A ccessibility o f in ­

fo r m a tio n on the web, „N atu re”, vol. 400, s. 107-109.

32 W hat is this link doing here? B eginning a, fine-grained process o f id en tifyin g reasons

fo r academ ic hyperlink creation, < h ttp ://in f o r m a tio n r .n c t/ir /8 - 3 /p a p c r l5 1 .h tm l> [dostęp:

(11)

Przeglądowe stu d ia p o d staw m etodologicznych w ebom etrii w yszły spod pióra L. D. Fugi (w spom niane już dzieło Fundam ental metodologies and tools

fo r the ernploryment o f webometries analyses) oraz G. H eim eriksa i P. van

den B esselaara (State o f the A rt. In B ibliom etrics and Webometries)'1’'1’.

Inni znani przedstaw iciele w ebom etrii to A. W oodruff, k tó ry jako jeden z pierwszych zajm ow ał się s tru k tu rą dokum entów publikow anych w ram ach W W W 34, R. Larson tw orzący m apy nauki w oparciu o analizę W W W 35 czy A.G. Sm ith, skupiony m .in. n a em pirycznym w ykorzystyw aniu wskaźników cytow ań w cyberprzestrzeni oraz definiowaniu różnic w zasadach cytow ań pom iędzy W orl W ide W eb a zasobem drukow anym 36.

Nieco szerzej omówić w y pada pierwsze polskie em piryczne dokonania n a polu w ebom etrii37. D. K otyras przeprow adził pilotażowe b a d a n ia nad pow iązaniam i pom iędzy stronam i W eb polskich uniw ersytetów . Wcześniej podobne analizy wykonali w spom niani już M. Thew all i A. Sm ith. Ten o sta tn i sam zresztą też prow adził tak ie badania, analizując w ystąpienia różnych typów domen; m .in. geograficznych, np. as, nz, czy sektorowych, np. as.com 38.

Celem studiów D. K oty rasa było obliczenie dla stro n 17 polskich uczelni liczby w zajem nych odesłań. U stalił on, że najwięcej wychodzących linków m a ją U niw ersytety: W arszawski (131), Szczeciński (80), UAM (73) oraz W rocław ski (62). Z kolei p o d względem odesłań p rzo d u ją U W (62), U ni­ w ersytet G dański (50), UAM (47) oraz Jagielloński i Śląski (po 46)39.

R. S apa poszukiw ał n atom iast zagranicznych odnośników do stron W W W czterech dużych polskich bibliotek akademickich:

;i:i U n iv ersiteit van A m sterd am , J a n u a ry 2002.

:tl Por. A. W oodruff c t all.. A n investigation o f docum ents fr o m the World W ide Web.

Proceedings o f the F ifth In tern a tio n a l World W ide Web Conferens. M ay 6-10, 1996. P aris,

F ranco 1996, < h ttp ://w w w 5 c o n f.in ria .f r/f id i k tm l/ p a p c r s / P 7 /O v c rv ic w .h tm l> [dostęp: 06.03.2005].

B ibliom etric o f the World W ide Web: an exploratory analysts o f the intelectual structure o f cyberspaces, 1996, < h ttp ://s h e rlo c k .b e rk e le y .e d u /a s is 9 6 /a s is /9 6 .h tm l> , [dostęp:

06.03.2005].

38 M .in. Web links as analogues o f citation. „Inform ation R esearch”, vol. 9, no 4. Ju ly 2004, < h ttp ://in f o r m a tio n r .n c t/ir /9 - 4 /p a p c r l8 8 h tm l > [dostęp: 2005-03-06].

17 P rz y okazji w arto zaznaczyć, że o d chwili użycia w św iatow ej lite ra tu rz e te rm in u webo- m e tria do m o m en tu jego p o jaw ien ia się w polskim piśm iennictw ie m inęło 7 la t (1977-2004). O d użycia w 1969 roku przez A. P ritc h a rd a te rm in u b ib lio m etria do m o m en tu pierwszego p o jaw ien ia się go w polskiej m onografii K rzy szto fa M igonia w 1984 roku m in ęło lS lat. Może to św iadczyć o szybszym , niż w przeszłości o d ra b ia n iu przez polską n au k ę d y sta n su do n au k i św iatow ej.

:,s A. Sm ith, A N Z A C webometries: exploring Australasian Web structures, 1999, < h ttp : w w w .c su .e d u .a u /sp e c ia l/o n lin e 9 9 /p ro c e e d in g s9 9 /2 0 3 b .h tm > , [dostęp: 11.02.2005].

(12)

W W W źródłem zm ia n w paradygm acie b ibliom etni 6 5

- B iblioteki U niw ersytetu W arszawskiego, - B iblioteki U niw ersytetu Jagiellońskiego,

- B iblioteki U niw ersytetu im. A. Mickiewicza w Poznaniu, - Bibloteki U niw ersytetu W rocławskiego.

Okazuje się, że najw iększa liczba linków do wym ienionych bibliotek bie­ gnie z niemieckiego W eb (32), a następnie: am erykańskiego (27), włoskiego (13), organizacji m iędzynarodow ych (9), kanadyjskiego (6), rosyjskiego (6) oraz brytyjskiego (6)4I).

WT interp retacji wyników tych analiz obaj au to rzy ograniczeni zostali typow ym i dla obecnych b a d ań w ebom etrycznych problem am i heurystycz­ nymi. Po pierwsze, przy niewielkich różnicach wyników (a liczby linków bie­ gnących do polskich bibliotek uniwersyteckich w badaniach R. Sapy różnią się nieznacznie), analizy przeprow adzone w innym czasie m ogą przynieść isto tn ie różniące się rezultaty. W w yniku zreindeksow ania m ate ria łu nawet przez tę sam ą wyszukiw arkę otrzym am y odm ienne dane.

Po drugie, kontrow ersje budzi przyjm ow anie liczby odnośników do strony W eb jako m iary w artości tej strony. A zatem , nawret gdyby ud ało się otrzy­ m ać niezm ienne w czasie wyniki, to i ta k n a obecnym etapie refleksji teore­ tycznej w ebom etrii ich in te rp re ta c ja może nasuw ać wątpliwości. Problem y te oczywiście m a ją c h arak ter uniw ersalny dla w szystkich b ad a ń tego typu, a nie tylko w spom nianych dwóch polskich analiz.

W e b I m p a c t F a cto r

— p r z y k ła d w sk a źn ik a w e b o m e tr y c z n e g o

B adania środowiska W eb zaowocowały oryginalnym , typow ym dla webome­ trii wskaźnikiem. Jest nim tzw. W eb Im pact Factor. W tej chwili relacje w cyberprzestrzeni nie m a ją jeszcze takiej wagi, ja k w przypadku źródeł drukowanych, głównie dlatego, że w ystępujące ta m dokum enty odgryw ają nieco inną rolę w komunikacji w nauce. W kategoriach w artościujących m ają zdecydowanie mniejsze znaczenie. Problem w dużym stopniu sprowa­ dza się do nieokreślonego jeszcze dokładnie m iejsca w kom unikacji naukowej czasopism elektronicznych. Słaby rozwój czasopism elektronicznych, które (jak niektórzy sądzili) m iały szybko wyeliminować czasopism a drukowane, z pew nością zaskoczył analityków i rozczarow ał użytkowników. W prawdzie w drugiej połowie lat 90 notow ano dość szybki w zrost ty tu łó w czasopism dostępnych w sieci, niemniej najczęściej były to odpow iedniki wersji d ru ­ kowanych. M. i M. N ahotko przedstaw ili stru k tu rę elektronicznego zasobu

(13)

czasopism w Bibliotece Uniwersyteckiej w R egensburgu. Ja k się okazuje, w 2003 roku tylko 1 ty tu ł n a 10 był tzw. rzeczywistym czasopism em elek­ tronicznym (nie m iał odpow iednika drukow anego)41 D latego obecny zasób akadem ickich czasopism tego typu, jeśli nie mówimy o odpow iednikach ty ­ tułów drukowanych, nie sp ełn ia funkcji, jakim i obarczam y najlepsze cza­ sopism a trady cy jn e. Poza tym , w źródłach w sieci cytow any jest także zasób drukow any (oraz odw rotnie), a opracow ywane na potrzeby webome- trii wskaźniki dotyczą w yłącznie relacji pom iędzy dokum entam i sieciowy­ mi, bowiem są obliczane n a podstaw ie linków hipertekstow ych.

W założeniu W eb Im pact Factor jest wskaźnikiem, k tó ry m a spełniać p o d o b n ą rolę do wskaźnika w pływ u stosowanego przez In sty tu t Inform acji Naukowej w Filadelfii42. W IF zaproponow ał Ingwersen i nie m a kontro­ wersji w m etodyce jego obliczania, niektórzy badacze stosują go w yłącznie do oceny czasopism naukowych, inni oceniają przy jego pom ocy również stro ny nie m ające nic wspólnego z p rasą elektroniczną.

W IF jako wskaźnik w yraźnie inspirowany wskaźnikiem w pływ u m a od­ zwierciedlać m iarę zainteresow ania d a n ą stron ą. Ściślej: jest on stosunkiem liczby odnośników (linków) do określonego czasopism a elektronicznego (lub innego dokum entu w sieci) do liczby stron W W W tego czasopisma (lub innego dokum entu w sieci). Czas nie odgryw a w m etodyce jego obliczania żadnej roli. P rzy czym obie wielkości pow inny być generowane za pom ocą tej samej wyszukiwarki.

W tej sytuacji, jeśli liczbę linków do określonego czasopism a oznaczym y

sym bolem L, n ato m iast liczbę stro n W W W tego czasopism a jako W , otrzy­ m am y p ro stą form ułę obliczania W eb Im pact Factor:

WIF W

B ad an ia em piryczne z w ykorzystaniem W IF nie są prow adzone do tego sto p n ia celowo, ja k obliczanie IF czasopism indeksowanych przez ISI, co w praktyce oznacza, że zaledwie eksperym entalnie ustalono W IF dla nie­ których w ybranych ty tu łó w czasopism elektronicznych. U p odstaw tych

11 M. i M. N ahotko, P ow stanie i rozwój czasopism elektronicznych, w: P rzestrzeń in ­

fo r m a c ji i ko m u n ika cji społecznej, p o d red. M. Kocójowej, 2004, s. 127. W zw iązku z szyb­

kim tem p em p rz y ro stu elektronicznych odpow iedników wersji drukow anych, przy niewielkiej progresji czasopism elektronicznych nie będących tak im i odpow iednikam i ju ż w 1994 roku Ci. van M ark; sugerow ał nazyw anie ty ch o sta tn ic h real electronic journal. Zob. tegoż Elec­

tronic Serial Publishing a nd its effect on the traditional in fo rm a tio n chain, „Serials”, vol. 7,

n r 1 (M arch), s. 17-28.

12 O bliczanie w skaźnika w pływ u (Im p a c t Factor) przed staw io n o n a stronic: The

Tmpacl Factor-, < h tt p :/ / w w w .isinct.com / e ss a y s /jo u rn a lc ita tio n rc p o rl8 /7 .h tin l> , [dostęp:

(14)

W W W źródłem zm ia n w paradygm acie bib lio m etn i 6 7

p rac leży oczywiście analogiczna idea postępow ania, ale tworzenie linków do stron, czyli owe cyberprzestrzenne cytow ania zwykło określać się m ianem sytow ań (sita tio n ).

A listar G. S m ith43 porów nał cytow ania obliczane przez ISI do sytow ań w ebom etrycznych uzyskiwanych przez następ ujące czasopisma:

- „A riadne”, - „C yberm etrics”, - „D-Lib M agazine”, - „First M onday”,

- „Inform ation R esearch”,

- „Journal of D igital In form ation”, - „Journal of Electronic Publishing”,

- „Journal of Inform ation, Low and Technology”,

- „Libres: Library and Inform ation Science Research Electronic Journal”, - „PACS-R: Public Access C o m p u ter System s Review”.

Uzyskane przez wym ienione czasopism a cytow ania ISI oraz sytow ania (A lta V ista) przedstaw ione zostały n a poniższym wykresie:

(15)

Powyższe dane zachęcają do kilku, co najm niej, uwag. Po pierwsze, gołym okiem widać niewielką korelację pom iędzy wskaźnikami, jakim i są cytowa­ nia i sytowania. Potw ierdza to oczywiście Sm ith, który przeprowadza następ­ nie porównanie W eb Im pact Factor z notowanymi dla tych czasopism przez ISI cytowaniami. W tym w ypadku korelacja jest nieco większa, jed nak w dal­ szym ciągu daleko jej do istotności. W tej sytuacji należy postawić pytanie, co w zasadzie odzwierciedla W IF ? M. Skalska-Zlat sugeruje, że W IF mógłby być użytecznym uzupełnieniem b adań prowadzonych za pom ocą tradycyjne­ go IF - porów nania wskazywałyby sta tu s stron W W W . Może także pełnić rolę wskaźnika atrakcyjności krajów, badań naukowych i instytucji44.

Problem należy jed n a k do bardziej złożonych, jeśli bowiem, choćby czę­ ściowo, trakto w ać W IF w kategoriach IF, to powinien on wyraźniej oscy­ lować ku mierze w artości. Nie będziem y chyba dalecy od prawdy, jeśli stwierdzimy, że W IF w istocie jest tylko pró b ą poszukiw ań sposobów oceny stro n W W W . D odatkow o jest m ało w yrazisty, ponieważ mówi się o jego trzech - istotn ie się różniących - kategoriach:

1. t h e s e lf-lin k s W I F , odpow iadający pojęciu sam ocytow ania (biorący

p o d uwTagę linki znajd u jące się w danym dokum encie do innych stron tego samego dokum entu);

2. t h e e x te r n a l W I F , biorący p o d uwagę linki do danej strony Web od stro n zewnętrznych;

3. t h e o v e r a ll W I F , obliczany na podstaw ie w szystkich linków do danej strony (zarówno w ew nętrznych, ja k i zewTnętrznych)4>.

Ja k powiedzieliśmy ju ż wyżej, wielu autorów stosuje W eb Im pact Factor nie tylko w odniesieniu do czasopism, ale tak że do dom en, in sty tu cji (np. uczelni wyższych) i innych stron, które nie są czasopism am i ty p u „e”. Sm ith n a p rzykład obliczył W IF dla dom en krajów Połuniow o-W schodniej Azji, stro n www w szystkich uniw ersytetów A ustralii i Nowej Zelandii, czasopism elektronicznych ukazujących się w tych dwóch k rajach i stro n dwóch biblio­ tek Narodowych: A ustralii i Nowej Zelandii46.

Podsum ow ując dotychczasow ą dyskusję nad W eb Im pact Factor, widzi­ my w yraźnie, że rola, ja k ą m a pełnić nie zo stała jeszcze precyzyjnie określo­ na, s tą d też wyniki wszelkich b ad a ń em pirycznych prow adzonych z użyciem tego wskaźnika nie pozw alają jeszcze n a budow anie poważniejszych uogól­ nień. Przede w szystkim nie widać w literatu rze wspólnego stanow iska do­ tyczącego motywów tw orzenia linków do stro n W W W . P róby stw orzenia z W IF analogicznego narzędzia do klasycznego Im pact Factor, czy dopasowy­

11 M. Skalska-Zlat, C yberm elria..., op. cit., s. 164.

T .C . A lm ind, P. Ingw crscn, In fo rm e tric analyses..., op. cit. A .G . S m ith , C itations and ... op. cit., [brak pag.].

(16)

W W W źródłem zm ia n w paradygm acie bibliornetrii 6 9

wanie do, tworzonych w Internecie linków tych wskaźników, które z powo­ dzeniem stosuje się w procesie oceny czasopism drukowanych bardziej chyba przeszkadza, niż pom aga rozwojowi oryginalnej myśli teoretycznej nowej dzie­ dziny wiedzy, jak ą jest webom etria. Mechanizmy publikowania w Internecie (poza czasopismami „e”) różnią się ta k istotnie od tradycyjnych zasad publi­ kowania, że adaptow anie bibliometrycznych narzędzi opisu do opisu i oceny Intern etu nie zawsze jest drogą właściwą. Jednak praw dopodobnie jesteśm y skazani na pewien okres przejściowy, w którym takie adaptacje będą m iały miejsce. Skończy się to, gdy rola Intern etu w komunikacji w nauce stanie się równie ważna, jak obecna rola systemów tradycyjnych. W arunkiem tych zmian będzie rozbudowa kontrolowanego Internetu, np. subject gateways. Pod tym pojęciem kryje się uporządkowany tem atycznie obszar Internetu, który zawiera wyselekcjonowane pod względem poziomu merytorycznego, przejrza­ ne przez specjalistów i dość precyzyjnie skatalogowane dokumenty, najczęściej o charakterze naukowym lub fachowym. Serwisy tego ty p u zamieszczają linki do dokumentów zapisanych zwykle w formacie HTML. Liczą od ok. 2 tys. do ]0 tys. każdy. „Subject gateways” stanow ią obecnie m argines zasobów siecio­ wych. Wiele wskazuje jednak na to, że serwisy tego typu będą się rozwijać47.

S y s t e m p raw w w e b o m e tr ii:

s t a t u s quo c z y k o n ie c z n o ść r e w izji

To zagadnienie trak to w ać m usim y jako jed en z najistotniejszych problem ów dyskusji n ad ewolucją p a ra d y g m atu bibliornetrii w związku z rozległym ob­ szarem nowych analiz o p artych n a zbiorach elektronicznych.

Przyjm ując, że jądrem teorii danej dyscypliny jest system sądów, zwa­ nych najczęściej praw am i nauki (w bibliornetrii funkcjonują tzw. statystyczne praw a nauki48), należy przede wszystkim przyjrzeć się ewentualnej ewolucji tych praw n a gruncie webom etrii. Będziemy mieć w tym miejscu do czynienia z ze wszech m iar interesującym i zagadnieniam i. Skrótowo m ożna je zawrzeć w pytaniu: czy w dyscyplinie, w której podstaw ą badań są system y dokum en­ tów elektronicznych, dojdzie do modyfikacji istniejących praw, albo - p oja­ wienia się nowych praw, uwzględniających specyfikę zjawisk w Internecie.

Dotychczasowe prawa bibliometryczne, zarówno te najbardziej znane (Brad- forda, Lotki oraz Zipfa)49, jak i mniej znane (Bootha, Brooksa, E stroupa,

11 Szerzej zob.: L. D crfcrt-W olf, Serw isy tem a tyc zn e o kontrolow anej ja ko ści w In ternecie - subject gatewys, ..Ebib”, n r 6 /2004 (ta m o bszerna lite ra tu ra ).

W . K rajew ski, Praw a nauki. Przegląd zagadnień m etodologicznych i filozoficznych, W arszaw a: K siążka i W iedza, 1998.

(17)

Leim kuhlersa, P ric e ’a czy W illisa)-’", dotyczą albo m echanizm ów rozkładu pew nych cech piśm iennictw a (przede w szystkim prawo rozproszenia B rad- forda i praw o produktyw ności naukowej Lotki), albo pewnych cech tek stu (jak w iadom o niektóre asp ek ty językoznaw stw a statystycznego trakto w ane są również jako część obszaru bibliom etrii).

Zacznijm y od przedyskutow ania drugiej grupy praw , ponieważ tu sy tu ­ acja w ydaje się n ajpro stsza. O tóż dokum enty elektroniczne o p ierają się n a przekazach tekstow ych bez względu n a form ę ich d o starczania i nie w ydaje się, aby przekazy tekstow e nowego typu, czyli dokum enty elektroniczne - obojętnie, czy b ęd ą to zdigitalizow ane zasoby drukowane czy prym arne dokum enty sieciowe - różniły się od te k stu archiwizowanego n a nośniku analogowym. Nowy obszar b a d ań pojaw i się w m omencie analizy np. aspek­ tów efektywności d o starczan ia dokum entów w kontekście językowych kon­ strukcji ich w yszukiw ania (choćby w ykryw ania relacji np. pom iędzy m eto d ą konstruow ania zap y ta n ia w języku n atu raln y m a skutecznością wyszu­ kania dokum entu). Skądinąd w obszarze b ad a ń m ieszczących się nawet w szerokich ram ach nauki o inform acji sporadycznie prowadzono stu d ia em piryczne n ad tekstem . Pom im o dość intensyw nego rozw oju teorii języ­ ków inform acyjno-wyszukiwawczych, zw łaszcza w drugiej połowie ubiegłe­ go wieku, praw o Zipfa rzadko pojaw iało się w orbicie zainteresow ań nauki o inform acji. W przy pad k u w ebom etrii próbę jego w ykorzystania do anali­ zy popularności stro n p o d jął tylko N ielsen'1.

Nieco inaczej rzecz m a się z praw am i dotyczącym i rozkładów cech pi­ śm iennictw a. B ad an ia tak ie były podejm ow ane, ale bazowano w nich na ist­ niejącej teorii. M ożna by zatem twierdzić, że obecnie jesteśm y n a etapie testow ania praw bibliom etrycznych n a danych, które d o starcza webome- tria. Nie będziem y chyba dalecy od prawdy, przyjm ując, że czym więcej takich b adań, tym bliżej odkrycia nowych praw i prawidłowości odnoszą­ cych się tym razem do środow iska Web. J a k powiedzieliśmy wcześniej, nurt tego ty p u studiów nie jest jeszcze zbyt szeroki, dlatego bez większego tru d u m ożna przedstaw ić najw ażniejsze dokonania n a tym polu.

W 1997 roku J. B ar-Ilan opublikował w „Scientometrics” artykuł, w którym przedstaw ił rozkład publikacji w sieci poświęconych tzw. chorobie wściekłych krów (B S E )’2. Jed n ak analiza t a nie wykazała, że istniejący roz­ k ład przypom ina rozkład B radforda53.

Ibidem , passim .

11 Za: M. S kalską-Z lat, Ceberm etria..., op. c it., s. 167.

”2 J. B ar-Ilan , The m ad cow disease, U senet newsgroups and bibliom etric laws, „Sciento­ m etrics”, vol. 39 no 1, s. 29-55.

oi J a k wiemy, praw o pierw otnie sform ułow ane przez S.C. B ra d fo rd a dotyczyło p ro d u k ­ tyw ności czasopism , a k o n k retn ie ro zk ład u a rty k u łó w n a d an y te m a t w określonej grupie

(18)

W W W źródłem zm ia n w paradygm acie bibliom etrii 71

W dwa la ta później (1999) L. Cui przeprow adziła b a d a n ia rozkładu linków wychodzących od stro n najw iększych szkół m edycznych w USA, także poszukując korelacji z rozkładem B radforda. T ym razem udało się dowieść tzw . strefy ją d ra oraz charakterystycznie p rzy rastający ch pod względem wielkości pozostałych stre f (zgodnie z praw em B radforda wzrost te n opisywany jest form ułą l:n :n 2...) ’4.

N atom iast w 1997 roku R. R ousseau b a d a ł rozkłady sytow ań w In tern e­ cie. T ym razem za p u n k t w yjścia przyjął praw o Lotki, ekstrapolu jąc roz­ k ład produktyw ności autorskiej n a rozkład sytow ań do strony. P rz y ję ta h ipo teza zak ład ała, że będziem y mieć do czynienia z zasadą odw rotności k w ad ratu P ric e ’a (inverse square la,w). A u to r tych b a d ań u znał ostatecz­ nie, że praw dopodobieństw o, iż dokum ent w sieci otrzy m a „i” sytow ań, s ta ­ tystycznie wynosi:

1

¥

Przy czym X > ]. Form ułę tę próbow ał weryfikować B roder i in., u sta la ­ jąc, że X = 2 ,l ’5. W ynik te n przybliża nas do obliczeń Lotki, k tó ry X sza­ cował n a 1,888 (dla chemii) oraz 2,02 (dla fizyki). J a k wiemy, Price nieco zmodyfikował to prawo, tw ierdząc, że:

[...] liczba autorów n prac jest proporcjonalna do l / n 2, czyli, że pro­ duktywność jest odwrotnie proporcjonalna do kw adratu liczby tych prac. Na każdych 100 autorów jednej rozprawy przypada 25 autorów 2 prac, 11 autorów 3 pozycji itp .56

Zgodnie zatem z h ip o tezą zespołu kierowanego przez B rod era n a każ­ dych 100 dokum entów w Internecie, które o trzy m ały jedno sytow anie, przy­ padać będzie 25 dokum entów z dw om a sytow aniam i, 11 z trz e m a itd.

In teresu jącą i stosunkowo szeroką analizę, której celem było poszuki­ wanie korelacji tym razem z obom a rozkładam i naraz, Lotki i B radforda, przeprow adził zespół trzech autorów: C. Faba-Perez, V. P. G uerrero-B ote czasopism . W b ad an ia ch w ebom etryeznych często e k strap o lu je się je n a linki pośw ięcone określonem u tem ato w i, stro n y m ające ta k ą . a nie in n ą dom enę etc. Szerzej n t. praw a roz­ p roszenia B radforda. zob. R.M . Lossc, The science o f in fo rm a tio n , San Diego 1990, a. także c h t t p : / /w w w .lis.u iu c.cd u ./~ jd o w n ic /b ib lio /b ra d fo rd .h tm > , [dostęp: 02.04.2004].

54 L. Cui, R athing health web sites using the principles o f cita tio n analysis: a, biblio-

m etric approach, ..Journal of M edical R esearch”, vol. 1, n r e4, < w w w .jm ir.o r g /1 9 9 9 /l/e h /

in d e x .h tm l> , |dostęp: 31.03.2005|.

5,J A. B ro d er i in., Graph structure in the Web, „C om puters N etw orks an d ISD N System s”, vol. 33, n r 1-6, s. 309-320.

(19)

oraz F. M oya-A ugenon'7. Ich b ad an ia m ieszczą się w typow ym case studies i dotyczą rozkładów hiperlinków otrzym yw anych przez stro ny poświęcone regionowi E k stre m ad u ra położonem u w zachodniej części Hiszpanii. W za­ leżności od ro d za ju strony p a ra m e tr X w ahał się od 2,8 do 1,5. D latego tru d n o w tym w ypadku mówić o potw ierdzeniu rozkładów Lotki. W rozkła­ dzie hiperlinków do tych stro n nie potw ierdzono także praw a B radforda.

N a r z ę d z ia b ib lio m e tr ii W eb

T radycyjna bibliom etria nie może się już rozwijać bez olbrzymiego w tej chwili instrum entarium , często nazywanego przem ysłem bibliom etrycznym ,s. Rozwój b adań webom etrycznych, rzecz jasna, jeszcze bardziej zależeć będzie od narzędzi technicznych pozostających w jej dyspozycji. Dalszy rozwój In­ tern e tu oraz pogłębianie się sem istrukturalności i heterogeniczności doku­ m entów spowoduje konieczność przeznaczania olbrzymich sum na ten cel. N ajbardziej rozbudowany obecnie sektor przem ysłu bibliometrycznego, jakim z pewnością są indeksujące bazy danych, przypuszczalnie zmieni się dia­ m etralnie, bowiem w sensie technicznym nie d a się zasad dotychczasowego indeksowania czasopism stosować w odniesieniu do czasopism typu „e”, obo­ jętnie, czy wykorzystywać będziemy Web Im pact Factor czy inny wskaźnik.

Jed n ak w chwili obecnej nie istnieją jeszcze żadne, stw orzone w yłącznie do celów w ebom etrycznych, techniczne narzędzia analiz. W praktyce b a­ dawczej w ykorzystuje się zwykłe wyszukiw arki internetow e. P rzy czym praw ie wszyscy po d k reślają ich niedoskonałość w p rzy padku prób jakich­ kolwiek precyzyjniejszych badań.

Z nakom ita większość studiów w ebom etrycznych przeprow adzona zosta­ ła za pom ocą w yszukiwarki A lta V ista, albowiem tylko ona pozw ala n a sto ­ sowanie w odniesieniu do całego In te rn etu algebry B oole’a59. R ekonstrukcja zap y tań prowadzi, niestety, do zm ian wyników wyszukiwania. Aby np. zna­ leźć zew nętrzne linki do stron y czasopism a elektronicznego, które p osiada URL x x x , operuje się p ro stą kom endą: link: x x x a n d n o t h o st: x x x . Przestaw ienie szyku kom endy względem o p e ra to ra logicznego może dać od­ m ienny wynik.

N iektórzy au to rzy sugerują korzystanie z kilku wyszukiw arek jedno­ cześnie, jed n a k w prak ty ce rzadko jest to możliwe, bowiem - ja k powie­

C. F ab a-P erez, V .P. G uerrero-B ote, F. M oya-A ugenon, Sita tio n distributions..., op. cit. -’8 I. M arszakow a-Szajkicw icz, [bez ty t.j. <:h t t p : / / w w w .fo ru m a k a d .p l/a rc h iw u in /2 0 0 0 / 0 6 /a rty k u ły /1 2 -p o lc m ik i.h tm > , [dostęp: 31.03.2005].

(20)

W W W źródłem zm ia n w paradygm acie bibliom etrii 7 3

dzieliśmy wyżej - tylko A lta V ista pozw ala n a globalne przeszukiw anie In teren etu z w ykorzystaniem algebry B oole’a. Niewiele tak że nasze bad an ia zyskają n a wiarygodności, gdy będziem y je pow tarzać kilkakrotnie w s ta ­ łych o dstępach czasu, ponieważ praw dopodobieństw o um ocnienia błędu jest w przy p ad ku takiego zabiegu mniej więcej tak ie samo, ja k jego n e u tra ­ lizacja. (W ielu badaczy intuicyjnie sugeruje ta k ą operację, aby zm inim ali­ zować fałszywe wyniki).

S em istrukturalność i heterogeniczność In te rn etu , a zwłaszcza w spom ina­ ne już zjawisko dynam iki dokum entów internetow ych rodzi także problem y w relacjach z czasem. Szczególną uwagę zw raca n a to M. Skalska-Zlat:

Różnie jest [...] rozum iana d ata strony (gdy chcemy zastosować ogra­ niczenie czasowe). Np. A lta Vista przez czas rozumie datę ostatniej aktualizacji, Northern Light w ogóle nic wyjaśnia, co rozumie przez datę. Zdarzają się przypadki podawania daty utworzenia strony lub jej modyfikacji albo nawet ostatniego wyszukiwania. Jest też problem z ok. 10% dokumentów nie zawierających w ogóle daty lub oznaczo­ nych d atą fałszywą, np. taką, która jeszcze nic w ystąpiła [...]60.

D a ls z y r o z w ó j te o r ii

Dalszy rozwój w irtualnych system ów inform acyjnych w praw dzie w dużym stop n iu zależy od tru d n o przew idyw alnych zachowań kom ercyjnego sek­ to ra dostawców poszczególnych składników arc h ite k tu ry tych system ów, jed n a k nie w ydaje się możliwe, aby stracił on sw oją dotychczasow a dy­ nam ikę. M ożna przew idyw ać raczej przyspieszenie tego procesu. W tej sytuacji pojaw i się n a tu ra ln a cezura zam ykająca obecny okres teorii biblio­ m etrii trw ający w zależności od definiowania kryteriów tej m etod y od ok. 80-120 lat. Jeśli faktycznie n a stą p i n a tu ra ln e niejako odejście od dotychcza­ sowej teorii, to z pew nością nie będzie to rewolucja, bowiem nie w ydaje się, aby pewne jej elementy, przede w szystkim praw a, nie m iały zastosow a­ nia w odniesieniu do zbiorów dokum entów w irtualnych (wprawdzie o dość specyficznych a try b u tac h , jakim i są sem istruk turalno ść i heterogeniczność), niem niej w sensie funkcjonalnym w dużym stopn iu analogicznych do obec­ nych źródeł. Rew olucja może nastąp ić w m om encie szerszego pojaw ienia się w spom nianego dokum entu dynam icznego, albowiem wówczas zm ianie — i to z pew nością istotnej - ulegną jego funkcje. B ędą to dokum enty za­ rządzające wiedzą, a nie tylko dostarczające dane. WTówczas może nastąpić

(21)

druga, w łaściw a w znaczeniu m etodologicznym , faza rozw oju w ebom etrii, jeśli trak to w ać będziem y ją wąsko, tzn. jako m etodę. W te d y także wielu dotychczasow ych zjawisk na tym gruncie nie będzie m ożna już w yjaśnić istniejącym i praw am i. G dyby ten scenariusz się spraw dził, to obecną fazę rozw oju bibliom etrii m ożna traktow ać jako fazę przejściową pom iędzy p a­ rad yg m atem dw udziestow iecznym a now ą teo rią w ebom etrii61. Trudno, co oczywiste, wyrokować, kiedy to n astąp i, ale osiągnięcia fazy przejściowej, w jakiej uczestniczym y w chwili obecnej, m ogą ją n a tu ra ln ie przyspieszyć. To pierwszy z czynników k ształtu jący ch te n proces. D rugim b ędą z pewnością zm iany w Internecie.

61 D ok ład n ie rzecz u jm u jąc, faza ta rozpoczęła się ju ż w ubiegłym wieku. Por. np. R .R L arson, B ib lio m e tn c s o f the World W ide Web: A n E xploratory A n a lysis o f the In tellec­

tual S tru ctu re o f Cyberspace, 1996, < h ttp ://s h c rlo c k .b c rk c lc y .c d u /a sis 9 6 .h tm l> czy D. T u rn ­

bull, B ibliom etm cs and the World W ide Web, < h ttp ://w w w .is c h o o l.u tc x a s .e d u /~ d o n tu r n / re s e a rc h /a u g m e n tis.h tm l> .

(22)

8 A bstrakty - A bstracts

P iotr Nowak

W W W as a source o f changes in the bibliom etric paradigm . The beginnings o f w ebom etry

Changes in the bibliometric paradigm triggered by document delivery services via the Internet are presented in the article. P articular emphasis is put to the presenta­ tion of the basis for the new m ethod of the quantitative analysis of the Internet, the so-called webometry. The article also presents the au th o r’s standing towards a pos­ sible reappraisal and reassessment of the current notional apparatus in bibliometry within webometric research. Future applications of bibliometric rules in relation to sources furnished by networked sources are discussed and new areas of theoretical considerations of webometry are outlined.

M ariusz Nowak

Lean m an agem en t - m odern approach to m anagem ent in libraries

Lean m anagem ent is a strategy of m anagem ent worked out in Japan and suc­ cessfully implemented for the first tim e in Toyota company. In general, it is such an organization of work th a t imposes on all employees of a company a duty of constant and particular attention to costs diminishing process and perm anent improvement of the quality of offered products. Due to its flexible structure, com­ panies th a t employ this strategy can, without much shake-up, adjust themselves sm oothly to th e changeable conditions they have to operate in. In the au th o r’s opinion, these rules should also be considered by managers of libraries and their introduction would help better adjust m odern libraries to react to changing and varied expectations of their users.

Artur Jazdon

The place o f the library in the in trodu ction o f m edia technology (m ed ialization ) o f science

Medialization of science is understood by the author as the functional and con­ ceptual reinterpretation of the achievements of science and its problems through media and the use of technology. We live in the times characterized by increasingly more im portant role of media, and, according to experts, this development will go on. We are heading towards a medial society and the fact should not be ignored. However, the image of science th a t has appeared in the media so far creates many reservations - there is too much chase for cheap sensation, serious problems are presented too superficially and in a shallow way. This is where th e library may step in and change the disadvantageous phenomena. Libraries can, for their own benefit and the benefit of their users, become reliable interm ediary between the world of science and the world of media and furnish their patrons w ith informa­ tion th a t is verified, credible and reliable. All this can be done w ith the help of up-to-date technology and the most sophisticated hi-tech inform ation carriers. In strategy projects for the near future, libraries should take the fact into account as the presence of media will become something ever-present in every-day library practice.

Cytaty

Powiązane dokumenty

Przede wszystkim samo zawarcie antykonkurencyjnego porozumienia w związku z publicznym prze- targiem (nawet zawarte w celu osiągnięcia korzyści majątkowej i uwzględniające

w sprawie sposobu i miejsca przechowywania, zabezpieczenia i kontroli ksiąg stanu cywilnego oraz określenia organów uprawnionych do przechowywania odpisów akt

Z kolei należałoby zająć się term inem „naturalizm ”, k tó ry znany był od dawna jako nazwa kierunku filozoficznego i k tó ry wyłącznie w tej funkcji

Przez kolejne 4 dni temperatura spadała: pierwszego dnia o 1°C, drugiego o 3°C, a w następnych dniach o 2°C i o 1°C. Kieruj się

Chorzy, których dotyczyły analizowane przez nas opinie częściej zatem dopuszczali się czyn- nej agresji wobec innych osób (porównywane grupy nie różniły się przy tym

Za swoje zasługi otrzymał liczne odznaczenia - mię- dzy innymi: Krzyż Armii Krajowej nadany przez władze RP w Londynie, Krzyż za Zasługi dla ZHP, Rozetę - Miecze do Krzyża

W przypadku negatywnego wyniku weryfikacji prac w protokole weryfikacji zbiorów danych oraz innych materiałów przekazywanych do państwowego zasobu geodezyjnego

W celu wprowadzenia do systemu PUMA do modułu OPJ( Podatki od osób prawnych) deklaracji na podatek leśny na podstawie dokumentu elektronicznego należy z poziomu modułu