James A. Evans
Publikacje elektroniczne a zwężenie
obszaru poszukiwań nauki i wiedzy
Biblioteka 12 (21), 165-179JA M ES A. EVANS*
Publikacje elektroniczne a zawężenie
obszaru poszukiwań nauki i wiedzy1
Dostęp do czasopism online niesie ze sobą obietnicę dostarczenia większej liczby inform acji bardziej rozproszonym użytkow nikom , pozw ala także w sposób bardziej efektywny poszukiw ać i przyw oływ ać znaleziony m ateriał. Z uwagi n a fakt, że w ykorzystyw any je s t jed n a k odm iennie niż m ateriał drukowany - naukowcy i uczeni m a ją tendencje raczej do wyko nyw ania poszukiw ań elektronicznie i kierow ania się odw ołaniam i do innych dokum entów pow iązanych tem atycznie (przez hiperłącza) niż do studiow a nia p rac w wersji drukowanej - w ykorzystanie czasopism elektronicznych może, paradoksalnie, zwiastować isto tn ą zm ianę w nauce. W ykorzystując bazę danych złożoną z 34 milionów artykułów , ich cytow ań (od 1945 do 2005 roku) oraz b a d ając ich dostępność online (1998-2005), wykazuję w ni niejszej pracy, że w sytuacji, gdy coraz więcej w ydań czasopism do stęp nych jest w wersji elektronicznej, a rty k u ły op atrzon e odnośnikam i do dzieł cytow anych obejm ow ały pozycje niedaw ne, z m niejszej liczby czasopism i artykułów , a większość z tych cytow ań dotyczyła niniejszej liczby ty tu łów czasopism i artykułów . Dawniej dokładniejsze przeglądanie m ate ria łu drukowanego w ym uszało wśród badaczy i naukowców pew ne zakotwicze nie głęboko w przeszłości i współczesności nauki. Przeszukiw anie online jest w ydajniejsze, a w ykorzystanie hiperłączy szybko zapo znaje naukowców
* Począwszy od tego roku, redakcja pragnie w każdym roczniku zam ieszczać przekład ja kiegoś ważnego dla szeroko rozumianego bibliotekoznawstwa tekstu, który ukazał w nauko wej prasie zagranicznej. A rtykuł Jam esa A. Evansa otwiera nasz nowy dział.
1 6 6 Jam es A. Evans
z ak tualn y m i poglądam i i opiniam i, ale w rezultacie może przyspieszyć for m owanie się naukowego konsensusu i zawęzić zasięg poszukiw ań i prezento w anych myśli.
O dnosząc się do „bibliotek cyfrowych” i „technologii inform acyjnej”, nauka sk u p iła się n a podkreśleniu korzyści i zalet, jak ie oferuje elektronicz n a możliwość w spom agania p rac badawczych. O publikow any o statn io przez U.S. P re sid e n t’s Info rm ation Technology A dvisory C om m ittee (PITAC, K o m itet D oradczy Technologii Inform acyjnych przy Prezydencie Stanów Zjednoczonych) ra p o rt panelow y zaty tu łow any Biblioteki cyfrowe: uniw er
salny dostęp do wiedzy dobrze o d d a je te n ton: „Wszyscy obywatele bez
względu n a to, gdzie i w jakim m om encie się zn ajd u ją, m a ją praw o do uży w ania wszelkich cyfrowych u rządzeń posiad ających połączenie z Internetem w celu zapew nienia sobie do stęp u do wiedzy i zdobyczy ludzkości [...]. Za kreślona w izja przew iduje, że ż a d n a izba klasowa, g ru p a ludzi czy jed n o st ka nie będzie pozbaw iona d o stęp u do zasobów światowej wiedzy i nauki”2. Takie stanow isko p om ija specyficzny c h a ra k te r interfejsu pom iędzy użyt kownikiem a d o sta rc za n ą inform acją3. Do tej p o ry nie p o d jęto szerokiej dyskusji n a te m a t technologii p rzeg ląd ania m ateriałó w dostępnych online, m eto d i technik wyszukiwawczych czy, wreszcie, ich potencjalnego w pływ u n a nau kę i wiedzę.
W spółczesne b a d a n ia bibliom etryczne, zajm ujące się p rak ty k ą wykorzy sta n ia m a te ria łu bibliotecznego, p o słu g u ją się przy pom iarze w ykorzystania zasobów drukow anych i elektronicznych badaniam i ankietow ym i, pom ia rem logowań do baz danych, zapisem liczby w ypożyczeń czy liczby po b rań z półek. Pom im o istniejących różnic w m etodologii przeprow adzający takie b a d a n ia z g ad zają się co do jednego - w skaźnik w ykorzystania m ateriału drukow anego m a ten d en cję spadkow ą, podczas gdy w ykorzystania źródeł elektronicznych w z ra sta4 - przeciętny użytkow nik woli pracow ać z m ate riałem d ostępnym online niż ty m w wersji drukow anej5. Przeprow adzone s tu d ia p o tw ierd z ają istnienie trzech najczęściej w ykorzystyw anych m etod (p rak ty k ) stosow anych przez autorów p rac naukow ych i badaczy publiku jący ch swoje prace. Pierw sza ze stosow anych p rak ty k zakłada, że autorzy, pow ołując się n a lite ra tu rę p rzedm iotu, p rzeg ląd ają pobieżnie online lub
2 R. Reddy et. al., D igital Libraries: U niversal Access to H u m a n K nowledge (P resi
d e n t’s In fo rm a tio n Technology A d viso ry C om m ittee, P anel on D igital Libraries, 2001),
w w w .n itrd .gov/p u b s/p itac/p itac-d l-9feb 01.p d f. Sprawozdanie to precyzuje wizję uniwersal nego dostępu, ale przyznaje jednocześnie, że warunkiem koniecznym jest udostępnienie „większej dostępności wysokojakościowej treści cyfrowej” przy zapewnieniu lepszej infra struktury IT.
3 M. McLuhan, U nderstanding M edia, New York 1964, cliap. 1. 4 S. Black, „Libr. Resour. Tech. Serv.” 49, 19 (2005).
k artk ują pew ną liczbę podstaw ow ych ty tu łó w w ażnych dla danego przed m iotu, aby zorientow ać się w bieżącym stan ie wiedzy n a dany te m a t6. G dy odpow iednie a rty k u ły zo stan ą odnalezione w źródłach elektronicznych, są następnie często drukow ane i studiow ane w wersji papierow ej7. W edług d ru giego sposobu najpierw dokonuje się w yszukiw ań (tem atycznych) w bazach danych dostępnych online. W o sta tn ic h latach procentow y udział czaso pism czytanych po uprzednim p rzeglądaniu m a te ria łu drukow anego zm alał i zastąpiony został analogicznym i wynikam i poszukiw ań online, szczegól nie w przyp ad k u badaczy n ajbardziej p ło d ny ch8. W reszcie, aby przeglądać inne a rty k u ły cytow ane w p racach bądź z nim i związane, au to rzy prac naukowych w ykorzystują hiperłącza, które um ieszczone są w elektronicz nych w ydaniach artykułów . Istn ieją różnice pom iędzy dyscyplinam i nauk, na przykład biolodzy wolą przeglądać m ate ria ł online, podczas gdy m edycy wysoko cenią zapoznaw anie się z m ateriałem drukow anym . G eneralnie rzecz biorąc, naukowcy i uczeni stu d iu ją m ate ria ł drukowany, p rzeg ląd ają d ru kowany i w wersji elektronicznej, a dokonują poszukiw ań i za p o zn a ją się z cytow aniam i online9. W ynika to z dostępności czasopism drukow anych i elektronicznych. Zbiory czasopism drukow anych przechowyw ane są albo w jakim ś fizycznym m iejscu, posegregowane w edług ty tu łu czasopism a i tem a tu , w edług d a ty publikacji, albo w m iejscu, gdzie z n a jd u ją się n a j nowsze publikacje. W p rzy p adk u czasopism drukow anych spis treści - lista tytułów artykułów i icli autorów - tw orzy indeks podstaw owy. Archiw a online z kolei pozw alają czytelnikowi szybko przeglądać odpow iedni m a teriał jednocześnie w wielu czasopism ach, u ła tw ia ją także przeszukiw ania w całym zasobie dostępnych tytu łó w . W interfejsach użytkow ników baz online, które oferują opcje przeszukiw ania i d o stęp u do pełnego tekstu , takich ja k n a przy k ład 3 P ro Q u est, Ovid, EB SC O , JS T O R itp ., o p cja prze szukiw ania zawsze um ieszczona jest w w idocznym m iejscu w interfejsie, ponieważ liczba logowań wskazuje n a jej częstsze użycie. Podczas dokony wania przeszukiw ań ogólnego nietem atycznego archiw um zaw ierającego re feraty, ty tuły, abstrak ty , a czasam i dokum enty pełnotekstow e, lite ra tu ra do zadanego problem u może być w yszukiw ana w edług zgodności z tem a te m i według daty. Z uwagi n a to, że elektroniczne indeksow anie je s t bogatsze,
6 C. Tenopir, B. Hitchcock, S. A. Pillow, Use and Users o f E lectronic Library. Źródło:
A n Overview and A n a lysis o f R ecent Research Studies, W ashington 2003.
7 A. Friedlander, D im en sio n s and Use o f the Scholarly In fo rm a tio n E n viro n m en t: In tro
duction to a D ata S e t A ssem bled by the D igital Library Federation and O utsell, Inc., Wa
shington 2002, w w w .clir.org/p u b s/rep orts/p u b llO /con ten ts.h tm l.
8 P. Boyce, D. W. King, C. Montgomery, C. Tenopir, „Ser. Libr.” 46, 121 (2004). 9 C. Tenopir, D. W. King, A. Bush, „J. Med. Libr. A ssoc.” 92, 233 (2004).
1 6 8 Jam es A. Evans
autorzy, k tórzy n ad al m ogą przeglądać a rty k u ły w ich wersji drukowanej, dokonują poszukiw ań online10.
Jak i jest efekt dostępności elektronicznych w ydań czasopism online? M ożna by przypuszczać, że przez um ożliwienie przeprow adzenia większej liczby przeszukiw ań, poszukiw ania dokonyw ane online m ogłyby poszerzyć pracę o p a trz o n ą cytow aniam i w stosow ne odnośniki do lite ra tu ry i oddalić nieco badaczy, jako grupę kolektyw ną, od tzw. „core jo urn als”, tj. grupy ty tu łó w czasopism podstaw ow ych w danej dziedzinie w ich odpowiednich polach zainteresow ań, a doprow adzić do rozrzuconych w różnych źródłach, ale indyw idualnie relew antnych prac. Zam ierzam w niniejszym artykule udow odnić, że naw et w sytuacji, gdy coraz starsze w ydania archiwalne cza sopism s ta ją się dostępne online, naukowcy i uczeni c y tu ją tylko artykuły, k tó re ukazały się o sta tn io - innym i słowy, choć ogólna liczba tytu łów do stępnych online rośnie, cytow ania zw iązane są z coraz m niejszą ich liczbą.
D ane dotyczące cytow ań zaczerp nięte z o stały z indeksów cytow ań za m ieszczonych w w ydaw anym przez T h o m p so n Scientific indeksie cytow ań
Science, Social Science and A r ts and H u m a n ities C itation In dexes, n a j
bardziej k o m p letn ym źródle cytow ań d o stęp n y m n a rynku. D ane z C ita tio n Ind ex (CI) a k tu a ln ie o b e jm u ją a rty k u ły i pow iązane z nim i cytow ania z 6000 najczęściej cytow anych ty tu łó w czasopism reprezen tu jący ch nauki ścisłe, n au k i społeczne i h u m anisty czne od 1945 roku, d la ogólnej liczby p o n a d 50 m ilionów arty k u łó w . CI oznakow uje (ety k ietu je) p o n a d 98% za m ieszczonych ta m ty tu łó w czasopism , od jed nego do trzech, specjalnym i kodam i o k reślający m i tre ść opisyw anego a rty k u łu , któ ry ch je s t 300. E ty k iety te to , n a p rz y k ła d , „fizyka m ate rii skondensow anej”, „ornitologia” czy „chem ia n ieo rg an iczn a i n u k le a rn a ”. S chem aty cytow ań z o sta ły n a stę p n ie polinkow ane z d an y m i śledzącym i d ostęp n o ść czasopism online w edług Fullest Sources O nline (FSO ) sp o rz ą d z a n y m przez In fo rm a tio n Today, Inc.
FSO je s t n a js ta rs z ą i najobszerniejszą publikacją dotyczącą dostępno ści czasopism elektronicznych. Info rm ation Today rozpoczęło publikowanie FSO , ukazującego się dw a razy w roku, w 1998 roku. P u blikacja obejm uje listę czasopism dostępnych w kom ercyjnie udostępnianych bazach danych (takich ja k Lexis-Nexis, EB SC O czy O vid) oraz tych, które dostępne są b e z p ła tn ie n a stro n ach internetow ych wydawców lub czasopism. FSO in form uje również, jakie la ta o bejm u ją num ery archiw alne danego ty tu łu . W pow iązaniu z danym i, któ ry ch d o starcza num er ISSN (M iędzynarodowy
10 C. Shirky, O ntology is O verrated: Categories, L in k s and Tags (Clay Shirky’s Writings A bout the Internet: Econom ics & Culture, M edia & Community, Open Source, 2005), w w w .shirky.com /w ritings / ontology_overrated.htm l.
Znormalizowany N um er W ydaw nictw a C iągłego), dane z CI i FSO pozwoli ły mi uchwycić, w jak i sposób dostępność online a rty k u łu zm ienia w ykorzy stanie opublikowanego m a te ria łu w kolejnych poszukiw aniach. Rozróżnienie źród ła w FSO pozw ala następnie n a porów nanie d o stęp u do m a te ria łu d ru kowanego z różnym i k anałam i elektronicznym i, przez które au to rzy prac naukowych d o cierają do artykułów - czy to p ry w atn ie adm inistrow any ko m ercyjny p o rta l czy też internetow y p o rta l rozw ijany w środow isku „open access”. Połączone dane z C I-FSO d a ją razem liczbę 26 002 796 artykułów z czasopism dostępny cli online do roku 2004 i o d ręb n ą grupę 8 090 813 po zycji (dodatkow o do liczby 26 m ilionów), k tó re je cytow ały i um ieszczały w listach dzieł cytowanych. R ysunek 1 pokazuje tem po, z jak im n a stą p iło przesunięcie w kierunku kom ercyjnych i b e z p ła tn y cli p latform zap ew n iają cych dostęp do artykułów i w jak i sposób archiw izacja m a te ria łu uczyniła wcześniejszą lite ra tu rę p rzedm iotu d o stęp n ą w o sta tn ic h latach.
Aby zbadać relacje pom iędzy dostępnością artykułów online a pozio mem aktyw ności cytow ań przeciętnym poziom em głębokości cytow ań, liczbą indyw idualnych artykułów i ty tu łó w czasopism , k tóre były cyto wane - oraz w spółczynnik koncentracji H erfindalila-H irschm ana cytow ań w stosunku do indyw idualnych arty k u łó w i czasopism w zdefiniowanej prze strzeni czasowej, w ykorzystano panelowe m odele regresji (szczegóły za stosowanej m eto dy w Supporting O nline M ateriał n a internetow ej stronie
najwcześniejsze numery czasopism dostępne online najwcześniejsze numery dostępne bezpłatnie online
Rysunek 1. Rozkład dostępności czasopism online, sporządzony na podstaw ie połączonych danych z ISI-FSO, poprzez ( A ) komercyjne subskrypcje oraz ( B ) bezpłatny dostęp ze strony internetowej czasopisma. Obszary „gorące” na wykresie odpow iadają wydaniom cza sopisma publikowanym zaledwie kilka lat przed udostępnieniem ich online, np. w roku 2003 więcej czasopism było dostępnych (w bazach komercyjnych i bezpłatnie) - od roku 1999 od powiednio około 1000 i 500 - niż z jakiegokolwiek innego roku. Wykres uwypukla tendencję wzrostową elektronicznych wydań czasopism od lat czterdziestych, pięćdziesiątych i sześć dziesiątych w latach 2004 i 2005
170 Jam es A. Evans
czasopism a „Science”)*. Poniew aż badanie wykazuje znaczne różnice w od czycie i sch em atach badaw czych stosow anych wobec danego obszaru, za stosow ałem m etodę sta ty sty c z n ą, z a k ła d a ją c ą jednorodność analizowanych wyników, ta k aby m ożna było porów nyw ać czasopism a i p o dpo la wyłącznie wobec siebie w danym czasie, w sytuacji, gdy ich dostępność online zmie n ia ła się. W te n sposób schem at cytow ań w sto sun k u do danego ty tu łu czasopism a lub p o d p o la był porów nyw any tylko, kiedy jego dostępność do ty czy ła w y dania drukow anego lub drukow anego i elektronicznego przez a r chiw um kom ercyjne (bazę danych) oraz online z dostępem bezpłatnym .
Pierw sze p y tan ie dotyczyło problem u, czy poziom głębokości cytow ania - to je s t la t m iędzy p ublikacją pracy a p racą, w której b yła cytow ana - może być przew idyw alny n a p odstaw ie zasięgu czasowego archiw alnych num erów online czasopism a, to jest ile la t wstecz obejm ow ał dostęp do num erów ar chiw alnych dostępnych elektronicznie w ciągu poprzedniego roku, kiedy - ja k m ożna było założyć - a u to rz y przenosili i dołączali dzieła cytow ane do swoich artykułów . W przy p ad k u p o d p ól obliczane to było jako la ta od mo m en tu pierwszej dostępności czasopism a. D ane zostały zebrane w tablicy publikacji, obejm ującej okres 2 0 lat, a więc b rano p o d uwagę jedynie dane od roku 1965, tj. 20 la t od pierwszego roku obejm ującego zbiór danych. Dla całego zbioru danych cytow ania wskazyw ały n a a rty k u ły publikow ane prze ciętnie około 5-6 la t wcześniej (ta b e la S I). P rzeciętn a liczba lat dostęp ności online arty k ułó w z czasopism to zaledwie 1,85 (dane obejm ują la ta od 1945), ale przy stan d ard o w y m odchyleniu w ynoszącym 5 lat i m aksy m alnym w yniku w ynoszącym p o n ad 60 lat. A nalizy dokonano przez rok cytow ania i w ram ach ty tu łu czasopism a oraz podpola. P rzy generowaniu w szystkich wyników p odlegających ew aluacji i w yznaczaniu linii tre n d u użyto m eto d y najm niejszych kw adratów (tj. m eto dy m inim um sum y kwa d rató w błędów) d la staty sty cznej estym acji regresji linearnej.
W szystkie m odele regresji zaw ierały zm ienne w ykorzystane następnie do statystycznej kontroli i uzasadnień, dlaczego cytow ania m ogą odnosić się do o statn io publikow anych artykułów . Ciąg liczb całkow itych od 1 do 40, odpow iadający lato m cytow ań od 1965 do 2005 rbku, w ykorzystany został do w yjaśnienia ogólnej tendencji w zrostu liniowej funkcji tre n d u cytowań w czasie (szacunkowe dane d la tej zmiennej były zawsze d o d atnie i sta ty stycznie istotne, P < 0,001). W celu uzasadnienia przypuszczenia o dom inu jącym udziale w cytow aniach stosunkow o niedawnego m ateriału w analizie uwzględniono zarów no średnią liczbę stron, ja k i średnią liczbę odw ołań do dzieł w cytow anych artyk u łach . O stosunkowo niedawnej publikacji
świad-Objaśnienie m etody badań oraz tabele S1-S4 zob. h ttp ://w w w .scien eem ag.org/cgi/ c o n te n t/fu ll/3 2 1 /5 8 8 7 /3 9 5 /D C l.
czą długość a rty k u łu (nowsze są krótsze) oraz liczba podanych źródeł. P rzy czym liczba źródeł podaw anych w n ajstarszy ch m ate ria ła c h jest często ograniczana przez wydawców i w takich p rzypadkach estym acje dla stro n były dodatnie, ale nie zawsze znaczące; podczas gdy te d la dzieł cytow a nych były zawsze d o d atn ie i znaczne, P < 0,001: dłuższe a rty k u ły z większą ilością podanej lite ra tu ry odw oływ ały się do wcześniejszych prac. W mo delach uwzględniono również wskaźnik średniego w ieku słów tytułow ych, aby rozważyć z a k ład an ą możliwość, czy w o sta tn ic h lata ch nauka i zwią zane z nią b ad an ia nie skoncentrow ały się n a najnow szych (współcze snych) ideach lub zjawiskach odk ryty ch (bądź w ynalezionych) niedawno. W ty m celu w yznaczono wiek każdego słowa tytułow ego w ram ach odp o wiedniej tablicy publikacji, np. poprzednich 2 0 lat, a n astęp nie pom nożo
no go przez w artość wagową każdego słowa i w ty tu le j odpow iadającem u
k / n \
1 ( 1 + l n ( t f ^) x J , gdzie tf.. rów na się częstotliwości w ystępow ania
term inu i w ty tu le j, a dft rów na się liczbie artykułów w danym roku, które zaw ierają term in i z ogólnej (całościowej) liczby artyku łów danego roku N 11. Takie podejście uprzyw ilejow uje w yróżniające pojęcia dystynk- tyw ne (słowa kluczowe) (np. fullereny, m ikroR N A ), n a to m ia st znacznie niżej staw ia term iny szersze znaczeniowo (np. gen, ocean) oraz p raktycz nie ignoruje tzw. stopw ords, tj. słowa o uniw ersalnym znaczeniu (np. and, the). W spółczynniki regresji dla wskaźników wieku ty tu łó w były zawsze do datn ie i znaczne, P < 0,0001. W ynika z tego, że ty tu ły zaw ierające sta rszą term inologię zam ieszczały odnośniki do artyk u łów wcześniejszych. K ażdy m odel regresji zaw ierał także s ta łą o znacznej ocenie ujem nej (spadek w ar tości zmiennej w czasie).
W ykresy przedstaw ione n a rysu nk u 2 p rez e n tu ją przebieg w pływ u dostę pu online, oszacowanego n a p odstaw ie całej próbki arty kułów i zobrazow a nego dla czasopism i p o dp ó l ze śred n ią liczbą cytow ań, n a liczbę cytow ań. Rysunek 2A ukazuje jednoczesny efekt kom ercyjnej i b ezp łatnej dostępno ści online n a przeciętny wiek cytow ań. Rozważm y p rzy padek czasopism a, którego a rty k u ły p o d a ją w cytow anej litera tu rz e wcześniejsze prace obej m ujące przeciętnie 5, 6 lat wstecz - śred n ia próbki. Jeśli w ydan ia tego cza sopism a udostępnione z o sta ją elektronicznie n a dodatkow e 15 lat, zarów no w bazach kom ercyjnych, ja k i w bazach bezpłatn ych , przeciętny wiek dzieł cytow anych zmniejszy się do nieco poniżej 4,5 roku, ze spadkiem o 0,088 roku dla każdego nowego roku dostępności online. W ram ach m odeli podpól po w tarzał się ten sam schem at, choć p rzedziały ufności były szersze (tabele S2-S4).
<У с 'S о
1 111
f 2 f 2 -D й о Й •7 ? 'n " O ’n Ï 73 .n ? С 4> ф Ф ■Г5 N a N r > U Й S-. о Ü a <« û с D ^ ^ сЗЯ $ 1 I •§
л § ^ s ^ *5 й 'S Й ‘S 'S £ 'S 2 'S £ Ю £ Ю Ç P 0 5 ? 0 5 f!I l l l i
0) Й isоs
CO ‘Ł О 9 N U 'C 'CO О Й a. a>* -w CO 0 "О сб'S
1
-м >> О 'О 'СО о х Ч У о tpÄtremo^o >}этл\ Au^pazjj ф .3 й оа
со a о 8 N О 'CJ 'СО О Й a ф со 0 ' V сб Ф§
1
£ о сб S со ' ао 9 N О 3 +г8н С uiftjdosBzo /лю{п>{Агв 1рЛдгалю^Аэ «qzDiq и 'Bireuiips.iij4-^|i{'Bpuy.i0H uuMCfyfo ib^Jłuaouosj s^apiij иL ic zb a cy tow any ch po zy cj i u n ik a ln y c h Arty k uł y w ram ac h tytułu czas op ism a Arty kuły w ra m ac h p o d p ó l C za so pi sm a w ra m ac h p o d p o la ДЗ 0
%
«б1
4-> >> О N 0 а 'S сеa
«3 in pf1
I
£
u _cö 'с? cô и 'S <v о Д о W dui|uo psoud&jsop\\y\oi wA/Mw^pop mAzsM.iaid Azad
u m o ^ 3 XqzDi| mreiuiz «Mo^uaoo.ij
1 1 1 S I I ^ ^ О й ю M ^ O j -I § -Q&
1 ”S 1 §■$•.§ Ц л
'm ä ° - 8 ‘3 ~ ä ^ ✓«■“v сб ТЗ Сб ‘2 Q»^ï m
; h * t
*
î l i i
4! l ï h
iЯl a i t P ^ U J
_ — Я 53 ^ ЯЗ-N Й cß ^ £ ' Ö' T^' ^N+^^O' - r t f c i g % -% ‘g* w " д § i д ą ^I
й °'2 У ^
I l-j i - Ł l l f Ц ё
3 l ' i N s ï Ü l l
N +-' Ö .w ■ & ■ l—1 U с “ f l & : Ą Ë й N ' ( ? ^i I f i i j r l ŁP
■f I ^ o |
° I § s
^ o N p « 2 OflI & £ Sfs « -3 * I ^
'§ V I S S ^ N g . b о и T3I
§ 2'ä
bl ^ ^ s “ s i ! ° i
1 1 s " I ^ $ 1 § I « I I S U ' l l l S- l | â I I J g * g £ | | g■a-i
. H 3 g? § J f I a** & ï I f I f -a s i I I I ; I 1 \ -g 1 1 s 1 1 ! 1 1 I ]3 чв S.1 'S Д** ь- я ä "a 2
s о f
ê
o s §
^
s s » 1 S g ■*f ■ £ s - s « a r - s g j f sI l t f
*
iß Г £ § а > 2 £ £ £ ° § Ё ? >> о Ê 'S ш g Л iï * | ■ï й ^ о 5 s ^ й I ^ 1 . 2 о я л _ ' й ' . О ** К Я g I s ü ! ^ ¥ , ^ S м 5 fr 8 ü > o S °* % g § ^ : 2 -g 3 ,н S ^ 0^b>y-v>> ^ S T O f e ^ + ^ N C / i k S £» g N 5 -g >> .y о P a Р ч ^ О С О Р о Л -N ' Aaui|uo psoud^^sop uj|oj u i^ M o ^ p o p ui/iu|0iYi0p Azid yreMo^iCo
ipmnuaouo^ mreiuiz '«AYO^uaoo.ij
174 Jam es A. Evans
W celu określenia w pływ u dostępności Online n a wielkość cytowań uni kalnych p rac przebadałem zależność pom iędzy liczbą unikalnych artykułów a czasopism am i cytowanych w danym roku cytow ań względem głębokości dostępności online. Liczba indyw idualnych artykułów i czasopism została obliczona n a przestrzeni 2 0-letniego okresu, identycznie jak w poprzedniej analizie. D la przeciętnego czasopism a liczba cytowanych artykułów wynosiła 632 arty k u ły rocznie, ale różnice były znaczne. Ponieważ wartości cytowań są dyskretne, a wysokie w artości koncentrują się wokół zbioru najważniej szych czasopism podstaw owych, natom iast są bardzo zróżnicowane w przy padku pozostałych czasopism, relację tę dla dostępności online zmodelowano ujem nym i m odelam i dw um ianow ym i12. M odel dw um ianow y ujem ny (ujemny rozkład dw um ianow y - rozkład Pascala) jest uogólnieniem m odelu Poisso- nowskiego i pozwala, w p rzypadku dodatkowego źródła wariancji ponad od powiedni, n a oczyszczenie błędu próbki. Jednorodność analizowanych danych dla tego m odelu nie dotyczy oceny w spółczynnika kierunkowego liniowej funkcji tren d u , lecz „param etru dyspersji”, k tó ry wym usza na oszacowanej wariancji cytow ań niezmienność w ram ach czasopism czy podpól, pozwala jąc jednocześnie przyjm ować jej każdą w artość w ram ach tych grup. Modele zostały wyznaczone za pom ocą m etody m aksym alnego praw dopodobieństw a i w ich w yniku pow stały oceny współczynników regresji, które, gdy ważone wykładniczo, m ożna zinterpretow ać jako stosunek (i) liczby unikalnych ar tykułów cytow anych po jednorocznym wzroście elektronicznego dostępu do czasopism do (ii) liczby artykułów cytow anych bez w zrostu dostępu online. Kiedy od tych relacji odejm iem y 1 i pom nożym y przez 100, to otrzym am y procentow ą zm ianę jednorocznego w zrostu w dostępności online n a liczbę od rębnych pozycji cytowanych. W szystkie m odele zawierały wskaźniki kontro lujące statystycznie rok, liczbę stro n i liczbę dzieł cytowanych w artykułach zaopatrzonych w cytow aną literatu rę przedm iotu.
W każdym kolejnym roku od 1965 do 2005 coraz więcej unikalnych a rty kułów było cytow anych z czasopism i podpól. O gólna p u la opublikowanego m a te ria łu naukowego cały czas rośnie i coraz więcej danych archiwizowa nych je s t corocznie w CI. Jed n ak że większa dostępność online nie potw ier dza jednocześnie tej tendencji. R ysunek 2B ilu stru je jednoczesny wpływ dostępności b ezp łatn ej i online n a liczbę unikalnych (indyw idualnych) a rty kułów cytow anych w czasopism ach oraz liczbę unikalnych artykułów i cza sopism cytow anych w podpolach. P anele p rzed staw iają te zależności dla przykładow ego (hipotetycznego) czasopism a i p o d p o la ze średnią próbki cytow ań. P rzy pięciu dodatkow ych lata ch bezp łatnego i kom ercyjnego do stę p u online liczba unikalnych cytow anych artykułów w ram ach jednego
ty tu łu czasopism a spad łab y z 600 do 2 0 0; liczba arty kułów cytow anych w ram ach p o d po la zm alałaby z 25000 do 15000; a liczba czasopism cyto wanych w ram ach p o d p ó l zm alałaby z 19 do 16. Powyższe wyniki sugerują, że dostępność online może mieć w pływ ograniczający n a liczbę unikalnych artykułów i czasopism cytow anych, doprow adzając go naw et do poziom u niższego od poziom u, k tóry w ystąpiłby, gdy czasopism a nie zostały by udo stępnione elektronicznie. Z apew nieniu bezpłatn eg o d o stęp u do wersji elek tronicznej num erów czasopism a przez jed en dodatkow y rok tow arzyszy jednocześnie 14-procentow y spadek cytow ań unikalnych artykułów .
Mniej indywidualnych artykułów i czasopism doczekało się cytow ań zaraz po tym, gdy zostały udostępnione w wersji elektronicznej. Choć wpłynęło to na ogólną koncentrację cytow ań artykułów w nauce, to niecałkowicie i nie w pełni zdeterm inow ało proces. C ytow ania może ro zk ład ają się bardziej równomiernie n a m niejszą liczbę artykułów , n a które powołuje się szersze grono autorów publikacji naukowych. Aby oszacować stopień, w jakim dostęp online w pływ a n a koncentrację cytow ań i ogranicza je do zaledwie niewielu artykułów (i czasopism ), posłużyłem się indeksem koncentracji
n
H erfindahla-H irschm ana, gdzie E ( s 2) oznacza procentow y udział cytow ań s i
każdego a rty k u łu j, podniesiony do k w a d ra tu i zsum ow any w ram ach czaso pism a lub p o d p o la i w ciągu przebadanego okresu (20 lat). K o n centracja 1 wskazuje n a to, że każde cytow anie do czasopism a i w d anym roku je s t do indyw idualnego (unikalnego) arty k u łu ; koncentracja nieco poniżej 1 suge
ruje wysoki o dsetek cytow ań wskazujących n a zaledwie kilka artykułów ; a koncentracja zbliżająca się do zera sugeruje, że cytow ania ro zk ła d ają się równom iernie, aktyw izując d u żą liczbę artykułów . W tej próbce koncentra cje H erfindahla-H irschm ana artykułów cytow anych w czasopism ach m iały zasięg od 0,0000933 do 1, przy średniej 0,088 i dużym odchyleniu s ta n dardow ym wynoszącym 0,195. Tam , gdzie a rty k u ły nie były cytow ane, nie m ożna było obliczyć koncentracji. W celu spraw dzenia, czy koncentrację cytow ań artykułów z o sta tn ic h 2 0 la t m ożna przypisać głębokości d ostępno ści online, użyto m odeli regresji liniowej. P odobnie ja k poprzednio, m odele zostały oszacowane dla artykułów w ram ach ty tu łó w czasopism oraz dla a r tykułów i czasopism w ram acli podpól, przy założeniu d o stępu zarów no do kom ercyjny cli, ja k i do niekom ercyjnych elektronicznych baz danych. K on centracje cytow ań m a ją w przybliżeniu rozkład norm alny (rozkład G aussa), a użyte m odele były p o d d an e analizie za pom o cą m etody najm niejszych kw adratów .
Rysunek 2C przedstaw ia zbieżny w czasie w pływ d o stęp u do elektronicz nych w ydań czasopism , zarów no kom ercyjnych, ja k i bezpłatny ch , n a kon centrację cytow ań do indyw idualnych artykułów i czasopism . Pan el lewy,
176 James A. Evans
z lewej stro n y wykresu, wskazuje, że liczba la t kom ercyjnej dostępności cytow ań zd aje się znacząco zwiększać koncentrację cytow ań do mniejszej liczby artyk u łó w w ram ach jednego czasopism a. Jeśli dodatkow e 10 lat wy daw ania czasopism a m iałyby zostać um ieszczone w dostępie online poprzez którekolw iek ze źródeł kom ercyjnych, m odel te n przew iduje, że jego kon c en trac ja cytow ań p o d n io słab y się z 0,088 do 0,105, a więc praw ie o 20%. B e z p ła tn a dostępność do w ydań elektronicznych m ia ła nieco negatyw ny w pływ n a koncentrację cytow anych arty kułó w w ram ach grupy czasopism, ale m arginalnie d o d a tn i n a koncentrację cytow anych artykułów w ram ach p o d p ó l (panel środkow y) i zd aw ała się powodować znaczny w zrost kon centracji cytow ań do zestaw u najw ażniejszych czasopism w ram ach podpól (panel praw y). D ostęp kom ercyjny m iał s ta ły pozytyw ny w pływ n a koncen tra c ję cytow ań zarów no artykułów , ja k i czasopism . Ogólne, zbiorcze po dobieństw o pom iędzy dostęp em kom ercyjnym i b e zp łatn y m dla wszystkich om aw ianych m odeli sugeruje, że dostęp online - bez względu n a ch arak ter ź ró d ła - n a d a je nowy k sz ta łt procesowi odkryw ania wiedzy (ang. knowledge
discovery) i jej w ykorzystania w identyczny sposób. D la w szystkich modeli
o trzy m an o po do b n e wyniki, kiedy obecność czasopism w w ieloskładniko wych archiw ach kom ercyjnych (np. jednym , drugim , trzecim lub więcej) b y ła b ra n a p o d uwagę i m odelow ana jednocześnie.
Chociaż okres 20 la t jest, zdaw ałoby się, w ystarczającym okresem , aby rzetelnie przebad ać w pływ dostępności online n a cytow ania, nie odd aje on je d n a k tendencji charakteryzującej te n w pływ. N a przykład, m ożna w yobrazić sobie, że dostęp online pow oduje w zrost unikalnej liczby a rty kułów cytow anych a zm niejsza koncentrację cytow ań dla artykułów n a j nowszych, u łatw ia ją c jednocześnie konwergencję do kanonicznych klasyków z bardziej odległej przeszłości. A by prześledzić ta k ą możliwość, przeprow a dziłem identyczne analizy, ale obliczyłem zm ienne z w zrastającego okresu sięgające od o statn ieg o roku obliczeniowego do o sta tn ic h 30 lat. Aby próbki były porów nyw alne, dokonałem szacunkowej oceny w szystkich m odeli obej m ujących d an e od roku 1975 (1945 plus 30-letni okres) do roku 2005, ta k więc w spółczynniki 20-letniego okresu nie o d p o w iad ają idealnie efektom zi lustrow anym wcześniej. Szacunkowe procentow e zmiany, dotyczące liczby artyk u łó w i czasopism cytow anych, i koncentracja cytow ań wg indeksu kon centracji H erfindahła-H irschm ana, w ram ach tych cytow ań obliczone zo s ta ły jako skojarzone z jednorocznym przedłużeniem dostępności online. Powyższe estym acje oraz tow arzyszące im 95-procentow e przedziały uf ności przedstaw ione są n a w ykresach n a rysunkach 2D i 2E. Zwiększony d o stęp do archiwów online w roku poprzednim zw iązany był ze spadkiem liczby cytow anych odrębnych arty k ułó w w ram ach czasopism oraz a rty kułów i czasopism w ram ach p o d pó l n ajb ard ziej w ciągu o statn ich lat
(rysunek 2D). Jednoro czn a zm iana w dostępności online odpow iada 9-pro centowemu spadkowi liczby artykułów cytow anych w o sta tn im roku, ale tylko 7-procentow em u w cytow anych a rty k u łac h w o sta tn ic h 20 i 30 latach. Schem at był identyczny dla artykułów i czasopism w ram ach podpól (tabele S2-S4). W pływ tab eli cytow ań n a koncentracje cytow ań nie był już ta k sta ły i konsekw entny (rysunek 2E). Niemniej jed n ak , w p rzy p ad k u kon centracji artykułów w ram ach podpól, w zrost indeksu koncentracji Herfin- dahla-H irschm ana był najw yższy - 1,5% rocznie przy dostępności online i to obliczony dla lite ra tu ry (dzieł cytow anych) w yłącznie do artykułów z ostatniego roku.
Zaprezentow ane m odele m a ją jed n a k wiele ograniczeń. N a p rzy k ład czasopism a tak ie ja k „Science” w ykorzystują S u pporting O nline M ateriał for „M ateriał an d M ethods” (M ateriały pom ocnicze do działu „M ateriały i M etody” dostępne w Internecie), k tó re często zaw ierają odnośniki do prac cytowanych, lecz nieindeksow anych przez CI. Teoretycznie jest zatem możliwe, choć m ało praw dopodobne, że te odw ołania do lite ra tu ry doty czą wcześniejszych lub bardziej różnorodnych artykułów . Co więcej, p o d d ając b adan iu jedynie standardow e ty tu ły czasopism , b a d a n ia nasze nie są w stanie oddać pełnego o brazu współczesnych mediów oddanych do dyspo zycji badaczom , takich ja k naukowe błogi, serw isy o p a rte n a m echanizm ie wiki czy wreszcie inne internetow e serwisy ko rzystające z m odeli a lte rn a tywnych form recenzji naukowej. Te nowe m edia praw ie bez w ątpienia lin- kują do absolutnie najnow szych osiągnięć w nauce - często w łaśnie przez linki internetow e13 - ale m ogą również wskazywać n a bardziej zróżnicowany źródłowo m ateriał.
Ogólnie rzecz biorąc, przedstaw ione m odele w ykazują, że gdy archiw al ne num ery czasopism a z o sta ją udostępnione online, albo przez dostaw cę komercyjnego, albo z dostępem b ezp łatn y m , następ u je zm iana we wzorze (modelu) cytow ań. G dy coraz starsze archiw alne num ery z o sta ją udostęp nione w try bie online, dzieła cytow ane obejm ują nowsze arty k uły; gdy coraz więcej artykułów udostępnionych zo staje online, m niej tych a rty kułów jest cytowanych, a cytow ania s ta ją się bardziej skoncentrow ane, obejm ując m niejszą liczbę artykułów . Zm iany te najpraw dopodobniej ozna czają, że przesunięcie p u n k tu ciężkości z przeglądania m ate ria łu druko wanego n a poszukiw ania dokonywane online sp rzy ja pom ijaniu starszej i mniej relew antnej lite ra tu ry przedm iotu. Co więcej, h ip erłącza um iesz czone w archiwach dostępnych online k o n ta k tu ją autorów publikacji n a ukowych z naukowym konsensusem co do tego, co je s t najistotniejsze w pracach wcześniejszych - k tó ra p rac a jest szeroko dy skutow ana i często
178 Jam es A. Evans
cytow ana. P rzy obu zastosow anych stra te g iac h naukowcy korzystający z m a te ria łu online o m ijają wiele z artykułów m niej związanych z tem atem , do który ch ci dokonujący przeszukiw ań n a m ateriale drukow anym jednak z n a jd u ją dojście. Jeśli dokonujący przeszukiw ań online łatwiej m ogą do trzeć do ak tu a ln ie obow iązujących i przew ażających opinii, jest też bar dziej praw dopodobne że zaak cep tu ją je i, p o d ą ż ają c w yznaczoną ju ż drogą, sam i um ieszczać b ęd ą w swoich p racach cytow ania odnoszące się do m niej szej liczby artykułów . B ad an ia n a d sk rajn y m nierów noupraw nieniem inter netow ych łiip erłącz14, naukow ych cyto w ań15 oraz innych form m echanizm u przyciągania preferencyjnego (ang. preferrential attachm ent) 16 sugerują, że niejednorodne różnice jakościowe u leg ają jeszcze dodatkow em u wzmocnie niu, kiedy agenci rep rezen tujący p latform y cyfrowe udostępniające bazy danych s ta ją się św iadom i tych wyborów. Agenci przyjm ują w ybór profe sjonalistów jak o inform ację, k tó ra w konsekwencji d eterm inuje ich w ybór - jako znak jakości - i w kalkulow ują je w swoje w łasne selekcje litera tu ry i cy tow ań. U m ożliw iając naukowcom szybkie dotarcie i konwergencję z przew a ża ją c ą opinią, czasopism a elektroniczne przysp ieszają naukowy konsensus. Ale pośpiech może kosztować więcej niż su b sk ry p cja elektronicznego archi w um online: o dkrycia i idee, k tó re nie z n a jd u ją szybkiego i szerokiego po p arcia i naukowego konsensusu, szybko też byw ają zapom niane.
P rzedstaw ione w yniki b a d a ń w yraźnie sugerują, że, paradoksalnie, jed n ą z głównych w artości poszukiw ań o p arty ch n a m ateriale drukow anym jest ich słab e indeksowanie. Słab e indeksow anie (i pozycjonow anie), tj. indek sowanie jedynie przez ty tu ł i nazwisko au to ra, przede w szystkim w obrębie zestaw u czasopism podstaw ow ych, praw dopodobnie m iało, niezam ierzone zresztą, konsekwencje, które w spom agały integrację nauki i wiedzy. Prze prow adzanie naukowców przez niebezpośrednio pow iązane artykuły, prze glądanie i studiow anie m a te ria łu m ogło u łatw iać szersze porów nanie i pozw alało zapoznać się z wcześniejszym i ideam i. W spółczesne praktyki obow iązujące n a wyższych uczelniach z n a jd u ją paralelę w zaistniały m prze sunięciu w publikacjach - krótszych w lata ch odw ołań, bardziej w yspecja lizowanych w swoim zakresie, doprow adzających ostatecznie do pow stania ju ż m niej praw dziw ych dysertacji, lecz raczej album u artyku łów 17.
Przejście do wiedzy i nauki opartych n a źródłacłi internetowych, wydaje się odzwierciedlać jeszcze jeden krok na drodze zainicjowanej o wiele wcześniej
14 A. L. Barabasi, R. A lbert, „Science” 286, 509 (1999).
15 R. K. Merton, „Science” 159, 56 (1968); D. J. de Solla Price, „Science” 149, 510 (1965). 16 H .A . Simon, „Biometrika” 42, 425 (1955); M.J. Salganik, P. S. D odds, D. J. W atts, „Science” 311, 854 (2006).
17 J. Berger, E xploring ways to sh o rten the ascent to a P h .D ., „New York Tim es”, 3 Octo ber 2007; w w w .n y tim es.co m /2 0 0 7 /1 0 /0 3 /ed u ca tio n /0 3 ed u ca tio n .h tm l.
szym przejściem z monografii ujętych w szerszym kontekście tem atycznym , takich jak Philosophiae naturalis principia m athem atica N ew tona18 czy O po
chodzeniu gatunków D arw ina19, n a w spółczesny arty k u ł naukowy. Przyw ołane
dzieła pow staw ały w okresie przekraczającym dziesięciolecie, nie tylko były mocno zaangażowane w naukowe deb aty swego okresu, ale ich autorzy rów nież wprowadzali swoje propozycje w dyskurs z astronom am i, geom etram i czy przyrodnikam i z wieków poprzednich. Naukowcy i uczeni XXI wieku w ykorzystują przeszukiw ania online oraz hiperlinkowanie, aby formułować i publikować swoje argum entacje w sposób bardziej efektywny, w p la ta ją je w bardziej zogniskowane - ale i tym sam ym bardziej zawężone - przeszłość i teraźniejszość.
C hciałbym wyrazić wdzięczność za pom oc w badan iach uzyskaną z g ran tu nr 0242971 NSF, d an e z Science C itatio n Index uzyskane od Thom pson Scientific, Inc. oraz dane z Fulltext Sources Online od Inform a tion Today, Inc. C hciałbym również podziękow ać p. J. R eim er za pom ocne uwagi i spostrzeżenia.
Przeł. Tom asz Olszewski
18 I. Newton, P rincipia, wyd. 4, New York 1883 (pierwszy raz opublikowane w 1687). 19 C. Darwin, The O rigin o f Species, New York 1867 (data pierwszej publikacji - 1859).
A bstrakty - A bstracts 11
originated in big industry, has now ceased to be just a theory in libraries. It has been used successfully in German university, academic and public libraries. W ith the example of three university libraries - the Konstanz University Library, Munich University of Technology Library and Dortmund University Library, the author presents the main features of the new organizational model and the stages of its implementation in the said libraries. In a word, teamwork means a change in the organizational structure of a library, cuts in the middle managerial staff, introduces a completely different management system and, additionally, a change in the men tality of the staff. Rewording the above, all this can simply correspond to a great change in the organizational culture of the library.
M ałgorzata Dąbrowicz
Preparation and im plem entation process in th e periodic staff review evaluation sy stem at P oznań U n iversity Library
The article outlines the current work on the model framework for designing a local staff evaluation system (SES) and its subsequent implementation at Poznań Uni versity Library. The starting point for the preliminary work on the project was setting up objectives of the evaluation, defining the scope, rules and assumptions to be applied in the system. The next stage was to work out and adopt evaluation and assessment criteria and then the choice of methods and tools preparation - evaluation sheets. The planned procedure to be employed by the SES was codified in the written rules to be followed during the implementation. Each stage of the preliminary work involved meetings with staff members of the library where the advances in the system were discussed. Training courses in the system were also provided for would-be evaluators and evaluatees. Further steps in implementing the system are briefly outlined and discussed.
Jam es A. Evans
E lectronic p u b lication and th e narrow ing o f scien ce and scholarship
Online journals promise to serve more information to more dispersed audiences and are more efficiently searched and recalled. But because they are used differently than print - scientists and scholars tend to search electronically and follow hyper links rather than browse or peruse - electronically available journals may portend an ironic change for science. Using a database of 34 million articles, their cita tions (1945 to 2005), and online availability (1998 to 2005), I show that as more journal issues came online, the articles referenced tended to be more recent, fewer journals and articles were cited, and more of those citations were to fewer journals and articles. The forced browsing of print archives may have stretched scientists and scholars to anchor findings deeply into past and present scholarship. Searching online is more efficient and following hyperlinks quickly puts researchers in touch with prevailing opinion, but this may accelerate consensus and narrow the range of findings and ideas built upon.