Analiza cytowań (citation) - Autor 2 Autor 3 Autor 4 SUMA

Autor 1 Autor 2 Autor 3 Autor 4 SUMA

8.7. Analiza cytowań (citation)

Analiza cytowań (ang. citation analysis) odwołuje się do związków merytorycznych pomiędzy publikacjami lub patentami. Fakt cytowania innej publikacji można interpretować jako oparcie się na jej treści czy pośredni transfer wiedzy. Tego typu analizy są szczególnie często podejmowane przez autorów tekstów naukowych z obszaru bibliometrii – znajdują jednak tylko ograniczone zastosowania w odniesieniu do analizy rozwoju nauki i technologii.

Podstawowym celem analizy cytowań jest identyfikacja najważniejszych pozycji literaturowych, ich autorów lub zatrudniających ich instytucji. W języku polskim pojęcie

„cytowanie” można stosować zamiennie z „odsyłaczem”, a określenie „liczba cytowań”

można wyrazić też jako „liczba odsyłaczy”.

Podstawy metodologiczne dla analizy cytowań literatury naukowej stworzył w latach 60-tych XX wieku Eugene Garfield, założyciel Institute for Scientific Information (ISI, obecnie Thomson Reuters) i twórca Science Citation Index, który później przekształcony został w bazę Web of Science, a następnie - Web of Knowledge. Analizy te opierają się na założeniu, że większa liczba cytowań jest powiązana z „jakością” czy naukową doniosłością. Niestety, to założenie nie zawsze jest prawdziwe. Współcześnie dominuje przekonanie, że analiza cytowań pozwala uzyskać informacje na temat wpływu badań, a nie ich jakości (Moed 2005:

37; 81).

Cytowania odzwierciedlają tendencje w zakresie czytania i przywoływania literatury naukowej oraz zwyczaje, panujące w środowiskach akademickich poszczególnych krajów.

Socjolog Robert Merton sugerował istnienie tzw. efektu Mateusza w nauce:

samonapędzającej się pętli cytowań, w której najczęściej cytowani autorzy będą też najchętniej czytani przez kolejnych badaczy, a reprezentanci mniej istotnych ośrodków naukowych na zawsze pozostawać będą na peryferiach światowej nauki (Merton 1968).

Czasami „wypada” cytować określonego autora lub ośrodek badawczy ze względów pragmatycznych, warunkujących publikację tekstu naukowego. Z wymienianych powodów ograniczenie się do cytowań w przypadku analiz szczegółowych obszarów badawczych prowadzi do przeoczenia wielu istotnych kierunków badań, które nie należą do głównego nurtu dyscypliny. Analiza cytowań nie nadaje się też do identyfikacji nowych tendencji technologicznych (ang. emerging technologies) – nowe zjawiska w nauce i technologii w wielu przypadkach nie stały się nawet jeszcze przedmiotem publikacji w czasopismach recenzowanych, a nieistniejące publikacje nie mogą być cytowane. Dodatkowo, istotne teksty naukowe dostrzegane są jako przełomowe dopiero po pewnym czasie, a długi cykl publikacji odsuwa w czasie moment pojawienia się pierwszych cytowań – dlatego analiza cytowań wydaje się bezużyteczna w odniesieniu do nowych, dynamicznie rozwijających się obszarów badań. Z drugiej strony, właśnie cytowania pozwalają zidentyfikować najważniejsze, najczęściej przywoływane pozycje, stanowiące kanon danej dyscypliny naukowej (ang.

research fronts).

Cytowanie nie musi jednak oznaczać uznania dla tekstu naukowego lub badacza. Niektóre cytowania mają na celu krytykę tekstu i wykazanie błędów, czego przykładem było częste powoływanie się fizyków na tekst, opisujący prawdopodobnie nieprawdziwe odkrycie tzw.

zimnej fuzji (Nowak 2006: 103-104). Analizy empiryczne wskazują jednak, że cytowania negatywne stanowią niewielki odsetek wszystkich cytowań (Moed 2005: 84). Zasady oceny naukowców, pracujących w wielu ośrodkach badawczych i rywalizujących o środki na finansowanie swoich projektów często odwołują się do wskaźników, opartych o liczbę cytowań publikacji danej osoby. Taka sytuacja skłania do podejmowania działań, mających w aktywny sposób wpływać na podnoszenie liczby cytowań własnych tekstów. Ujawniają się one zwłaszcza wtedy, gdy występuje silna zawodowa lub finansowa motywacja. Może wtedy dochodzić do „skłaniania” innych do cytowania własnych prac i budowy „koleżeńskich układów”, których uczestnicy dodają nazwiska współautorów, którzy nie wnosili rzeczywistego wkładu w opracowanie badań i publikacji, lub wzajemnie cytują prace znajomych (Nowak 2006: 104). W niektórych kulturach i instytucjach można zaobserwować niepisany obowiązek cytowania prac zwierzchników akademickich lub dopisywania przełożonych jako współautorów tekstów akademickich. Zhou i Leydesdorff (2006) pokazali, że chińskim badaczom z obszaru chemii udało się awansować w światowych rankingach cytowań dzięki intensyfikacji wzajemnych, “grzecznościowych” cytatów (Zhou, Leydesdorff 2006: 89-91), co może świadczyć nie tyle o naukowej doniosłości ich prac badawczych, co o występowaniu planowanych działań, mających doprowadzić do wzrostu prestiżu chińskich ośrodków naukowych. Dostępne techniki bibliometryczne nie oferują sposobów łatwego

„oczyszczenia” danych z cytatów publikacji pracowników tego samego ośrodka naukowego (cytowania publikacji własnych nie są zwykle uwzględniane w bazach), choć bywa, że właśnie one stanowią znacząca część cytatów. Kolejnym problemem jest nieetyczne (jednak prawdopodobnie relatywnie częste) zjawisko kopiowania referencji z innych prac do swojego tekstu bez zapoznawania się z treścią w ten sposób „cytowanych” publikacji (Nowak 2006:

104). Analizy empiryczne wskazują dodatkowo na częste przypadki przytaczania w artykułach wiedzy, możliwej do zdobycia wyłącznie w wyniku lektury określonej publikacji, bez jej jednoczesnego cytowania. Skala tego zjawiska w niektórych obszarach naukowych pozwala niestety na kwestionowanie podstawowych założeń, przyświecających analizie cytowań (MacRoberts, MacRoberts 2010: 5).

Warto pamiętać, że analiza cytowań oferuje jedynie pośrednie dowody współzależności między obszarami badawczymi, a prowadzone w jej ramach prace analityczne abstrahują od specyfiki poddanych analizie badań i ograniczają się do niewielkiego podzbioru dostępnych

 tendencje do cytowania określonych autorów przy jednoczesnej rezygnacji z cytowania innych,

 unikanie cytowania nieformalnych źródeł wpływu (zwłaszcza informacji zdobytych w drodze komunikacji między naukowcami),

 skłonność do auto-cytowania, zaburzająca wyniki analiz (choć współcześnie bazy eliminują auto-cytowania z zestawień),

 zróżnicowanie cytowań na pozytywne i negatywne,

 istotne różnice we wzorcach cytowania pomiędzy dyscyplinami naukowymi i rodzajami tekstów (np. prace dotyczące metod badawczych cytowane częściej niż prace, dotyczące rozwoju teorii), co uniemożliwia porównania,

 problemy interpretacyjne wynikające z błędnego rozróżnienia lub utożsamienia nazwisk i imion autorów.

Potencjał zastosowań analizy cytowań ogranicza też dostępność odpowiednich baz danych.

Spośród znanych baz publikacji naukowych i streszczeń, cytowania gromadzą bazy Web of Science oraz Scopus. Ściągnięcie cytowań dla większej liczby publikacji na lokalny dysk komputera stwarza dodatkowe problemy techniczne, podobnie jak ich dalsze przetwarzanie.

Relatywnie łatwa jest identyfikacja cytowań dotyczących pojedynczego artykułu naukowego (por. Rysunek 23), w przeciwieństwie do przetwarzania większej liczby danych o cytowaniach. Należy pamiętać, że liczba cytowań wykazywana przez daną bazę bibliometryczną jest zależna od zakresu publikacji, jakie obejmuje dana baza (ang. coverage) (Bar-Ilan, Levene, Lin 2007: 26).

Przykładowo, zgodnie z analizami empirycznymi (Moed 2005: 3; 138), baza Web of Science zawiera bardzo dobrą reprezentację cytowań w obszarach fizyki, chemii, biologii molekularnej i biochemii, nauk o człowieku i medycyny klinicznej, dobrą w obszarach nauk stosowanych i inżynieryjnych, nauk biologicznych o zwierzętach i roślinach, nauk o ziemi, matematyki, psychologii i nauk społecznych związanych z medycyną i zdrowiem, a jedynie umiarkowaną w innych naukach społecznych, politycznych, pedagogicznych i humanistycznych, co oznacza zróżnicowany potencjał prowadzenia analizy cytowań w zależności od badanego obszaru.

Rysunek 23: Lista publikacji cytujących wybrany artykuł naukowy. Źródło: Web of Science.

Szczególnie trudny problem analityczny stwarza zaobserwowane zjawisko częstego wskazywania w cytacie tylko pierwszego wymienionego autora zamiast wszystkich autorów tekstu - poprawne prowadzenie analizy cytowań wymagałoby weryfikacji danych metryczkowych cytowanych publikacji (Hicks i in. 2002: 44), co jest niezwykle czasochłonne.

Dodatkowym problemem przy porównywaniu danych dotyczących cytowań są nieproporcjonalne zmiany liczby odwołań do danej publikacji wraz z upływem czasu.

Długość okresu, jaki minął od momentu publikacji tekstu naukowego do momentu gromadzenia danych do analiz bibliometrycznych powinna być brana pod uwagę w przypadku analiz - starsze teksty mają większe szanse być dostrzeżone niż teksty niedawne.

Uwzględnienie tego wymogu znacznie utrudnia agregację danych o cytowaniach dla większej liczby tekstów tego samego autora, pochodzących z tej samej instytucji, kraju lub obszaru badawczego. Poprawne analizy wymagałyby ujednolicenia danych poprzez przekształcenia, które byłyby różne w odniesieniu do pojedynczych analizowanych obiektów. Najprostszym sposobem na ujednolicenie danych o cytowaniach jest podział liczby cytowań w danym roku przez liczbę lat, które upłynęły od momentu publikacji (Guo, Huang, Porter 2010: 201), co w praktyce okazuje się niezwykle czasochłonnym zadaniem w odniesieniu do dużych zbiorów danych.

Sposobem na udoskonalenie analizy cytowań może być też uszczegółowienie jednostki analizy - zamiast śledzenia cytowań całych artykułów, można skoncentrować się na fragmentach tekstu, które są cytowane, co pozwala na ustalenie kontekstu cytowania i odzwierciedlenie "siły" cytowania (Callan, Hockema, Eysenbach 2010: 1130). Tego typu analizy są niestety bardzo pracochłonne i nie dają się w łatwy sposób zautomatyzować.

Kostoff (2002: 68) zauważa też, że "wbrew większości popularnych poglądów, wiedza i doświadczenia techniczne osoby analizującej cytowania mogą mieć znaczący wpływ na jakość rezultatów", wskazując m.in. na subiektywny charakter decyzji o przypisaniu obiektów do obszarów tematycznych.

Większe możliwości wykorzystania w analizach rozwoju nauki i technologii oferuje analiza cytowań patentów. Zgłoszenia patentowe zawierają odwołania do stanu techniki (ang. prior art) czyli wcześniejszych wynalazków i publikacji naukowych z pokrewnych obszarów. Jeśli zgłaszający przeoczy lub przemilczy fakt istnienia pokrewnego wynalazku i nie wykaże oryginalności swojej propozycji, jego zgłoszenie może zostać odrzucone przez urząd patentowy. Silna ekonomiczna motywacja do starannego przygotowania kompletnego wniosku sprawia, że cytaty w bazach patentowych stały się wartościowym źródłem informacji. Analizy cytowań patentów pozwalają na wyodrębnienie tzw. nisz innowacyjnych (Podolny, Stuart 1995: 1229) z kluczowymi wynalazkami, stanowiącymi punkt odniesienia dla pokrewnych zgłoszeń patentowych. Dokumenty patentowe udostępniane przez USPTO i serwis Google Patents zawierają informacje o cytowaniach. Analogiczne informacji nie są niestety łatwe do identyfikacji w europejskich dokumentach patentowych, udostępnianych nieodpłatnie przez EPO. Istnieją istotne różnice w wykorzystaniu cytowań w zgłoszeniach patentowych do USPTO i EPO. USPTO wymaga podania w zgłoszeniu wszystkich istotnych odwołań do stanu techniki, motywując zgłaszających do opracowywania długich list cytowań, obejmujących niekoniecznie adekwatne patenty i publikacje, podczas gdy w przypadku

zgłoszeń do EPO, odwołania do wcześniejszych patentów wprowadzają pracownicy Urzędu, ograniczając się wyłącznie do niewielkiej liczby bezpośrednio powiązanych i zbliżonych wynalazków (Breschi, Lissoni 2004: 618). Analizy porównawcze wykazały, że zgłoszenia patentowe w USPTO cytują średnio 13 wcześniejszych patentów oraz 3 źródła nie będące patentami (w tym publikacje naukowe), podczas gdy zgłoszenia w EPO odwołują się przeciętnie do 4 patentów i 1 innego źródła (Breschi, Lissoni 2004: 618). Patenty w USPTO zawierają bardziej starannie dobrane cytowania niż w przypadku dokumentów w EPO m.in.

ze względu na rygorystyczne wymogi prawne, obowiązujące w Stanach Zjednoczonych (Hsieh 2011: 386). Szczegółową dyskusję różnic w cytowaniach zawartych w dokumentach patentowych USPTO i EPO oferuje Meyer (2000).

Rysunek 25: Sieć cytowań patentów z USPTO, dotyczących laserów półprzewodnikowych opartych na azotku galu. Źródło: Klincewicz (2010: 148).

Dodatkowym obszarem do możliwych eksploracji, nadal rzadko wykorzystywanym przez

26). Analiza przygotowana przez rząd Australii w 2002 roku była podstawą do publicznej debaty na temat sposobów stymulowania innowacyjności (Hicks i in. 2002: 140-141).

Rysunek 26: Sieć cytowań patentów pomiędzy grupami organizacji australijskich. Źródło: Hicks (2002: 141).

W dokumencie Bibliometria w zarządzaniu technologiami i badaniami naukowymi (Stron 86-92)