Rozkład bogactwa - Dzielenie się Kultura i gospodarka epoki internetu

Bibliotekarze najprawdopodobniej od wieków prowaǳą badania nad względnym po-pytem na książki i inne materiały tekstowe. Już w średniowieczu były one podstawą do organizowania procesów produkcji, zakupu i przechowywania książek i innych treści. Można więc przypuszczać, że starożytni bibliotekarze sporząǳali wykazy książek i in-nych przedmiotów, sortując je w zależności od popytu, na początku umieszczając pozycje, o które najczęściej pytano. Niektóre z takich rejestrów mogły przetrwać w bibliotecznych archiwach do ǳiś. Jeśli tak, byłyby one pierwszymi znanymi przypadkami badań nad roz-kładem zainteresowania. Wydaje się jednak, że modelowanie matematyczne podobnych rozkładów pojawiło się w innych ǳieǳinach. Pod koniec XIX wieku włoski ekonomista Viledo Pareto sformułował zasadę nazwaną od jego nazwiska, w myśl której liczba luǳi, którzy maja więcej bogactwa (posiadają większy areał, zarabiają wyższe sumy) niż podana wartość jest odwrotnie proporcjonalna do podniesionego do charakterystycznej potęgi o stałym wykładniku. Odpowiedni rozkład popularności można opisać następująco:

P [X > x]∝ [^m x^]

gǳie to bogactwo przedmiotowej osoby, zaś to poziom bogactwa najbiedniejszej oso-by. W tym dodatku, po którym następuje wyrażenie w nawiasach kwadratowych, oznacza „prawdopodobieństwo, że [wyrażenie w nawiasach] jest prawǳiwe”, zaś symbol∝ ozna-cza „wprost proporcjonalny do”. Gdy współczynnikkwynosi nieco mniej niż1, to20% populacji jest w posiadaniu80% bogactwa, co znane jest pod nazwą zasady Pareto. Jak to często bywa, ta ogólna zasada stała się dobrze znana, lecz niezbyt znane jest odpowia-dające jej prawo, a luǳie dodatkowo zapominają, że w tym prawie występuje parametr. Rysunek A. pokazuje, że jeśli k przybiera wartości od0.5 do1,5, uǳiał ogółu dóbr w posiadaniu20% najbogatszych jednostek waha się od99% do55%. Pełna zasada Pa-reto tak naprawdę mówi dwie rzeczy: że rozkład majętności odpowiada prawu PaPa-reto i że

²²⁴prawo Zipfa — patrzen.wikipedia.org/wiki/Zipf%27s_law.

w niektórych zaobserwowanych przypadkach współczynnik zawarty w prawie jest bliski

Rysunek A. — uǳiał ogółu dóbr w posiadaniu % najbogatszych obywateli, w zależności od parametru prawa Pareto. Jeśli rozkład majętności określonej grupy jest

opisany prawem Pareto z parametrem, wykres pokazuje część ogółu zasobów w posiadaniu % najbogatszych obywateli, zależnie od wartości.

Prawo Pareto opisuje roǳinę funkcji będących przykładem szerszej klasy rozkładów potęgowych. Ich nazwa pochoǳi od faktu, że ich funkcje gęstości prawdopodobień-stwa²²⁵ odpowiadają prawom potęgowym, czyli wykazują proporcjonalne zachowanie do ujemnej potęgi zmiennej. W przypadku prawa Pareto funkcja gęstości prawdopodobień-stwa wygląda następująco:

f (x) = ^km

xx+1

Prawo Pareto jest więc rozkładem potęgowym o indeksiek + 1Rozkłady potęgowe są w naturze barǳo rozpowszechnione, wyrastając z procesów niemających preferowanej skali. Często pojawiają się też, co jest istotne z punktu wiǳenia tej książki, w badaniach nad rozkładami zmiennych rangowanych, czyli nad rozkładami wyników ułożonych ma-lejąco według wartości.

Gwóźdź programu

Dla wygody dalszych rozważań dobrze byłoby scharakteryzować stopień zróżnicowa-nia uwagi skupionej na ǳiełach kultury za pomocą jednej wartości. Najlepszym rozwią-zaniem jest zbudowanie modelu rozkładu rangowanego, pokazującego ile razy pojawił się dostęp do danego ǳieła, z wykorzystaniem prawa Zipfa, które — jak się okazuje — często odpowiada rangowanym rozkładom popularności ǳieł kultury w świecie rzeczy-wistym.

²²⁵Funkcja gęstości prawdopodobieństwa to funkcja matematyczna, którą całkuje się w określonym prze-ǳiale, uzyskując przez to prawdopodobieństwo, z którym określona część ogółu zainteresowania zawiera się w owym przeǳiale:P [a ¬ \textlessb] = ∫_b

af (x)dx. Całkowanie w przeǳiale od zadanej wartości do a nieskończoności pozwala wyliczyć prawdopodobieństwo, z którym dana część ogółu zainteresowania prze-kracza graniczną wartość, co znane jest jako dystrybuanta:P [X\textgreaterx] =∫_∞

x f (x0_)dx0_{. Można}

tez wykonać ǳiałanie odwrotne i X różniczkując dystrybuantę otrzymać funkcję gęstości prawdopodobieństwa.

George Kinsgsley Zipf był lingwistą na uniwersytecie Harvarda, studiującym częstość występowania poszczególnych słów w różnych językach. Prawo nazwane od jego nazwi-ska sformułował w roku , choć same prawidłowości zauważono już o wiele wcześniej, najprawdopodobniej w roku , czego dokonał ancuski stenograf Jean-Baptiste Esto-up (Petruszewycz, ). EstoEsto-up napisał podręcznik stenograﬁi, wielokrotnie wznawiany, wykorzystując swoją analizę częstości występowania słów do opracowania własnej meto-dy, nie kształtując jej jednak tak systematycznie, jak zrobił to Zipf.

Zipf wyszedł od tego, że jeśli nadać rangę ilości występowania poszczególnych słów w obszernym tekście, zaczynając od słów najczęściej występujących i przechoǳąc do rza-ǳiej spotykanych, to liczba wystąpień każdego słowaO jest odwrotnie proporcjonalna do jej rangikpodniesionej do potęgiαo stałym wykładniku:

O(k)∝ ¹ kα

Zipf zauważył też, że parametrαtej funkcji (to jest wykładnik potęgi) zbliżony był do1, więc setny najpopularniejszy wyraz jest około100razy rzadszy niż słowo najczęściej spotykane. Podobnie jak w przypadku prawa Pareto, do powszechnego użytku wszedł ten wariant prawa, zaś komentatorzy często zapominają o tym, że parametr funkcji może przyjmować rozmaite wartości.

Rysunek A. — liczba wystąpień poszczególnych słów we ancuskim tekście zawierającym około  tysięcy wyrazów, dane za Estoupem, podane przez

Petruszewycza, .

Wykorzystywanie „prawa Zipfa z parametrem bliskim ” stało się wręcz częścią folk-loru kilku ǳieǳin nauki — oczywiście językoznawstwa i bibliotekoznawstwa, lecz nie-dawno również badań nad internetem (Shirky, b) i kulturą. W tej ostatniej ǳieǳi-nie prawo Zipfa wykorzystywano do badań nad rozkładem dostępu do poszczególnych ǳieł w bibliotekach, w systemach sprzedaży i w internecie. Jak zostanie pokazane niżej, rozkład popularności ǳieł nie oǳwierciedla dokładnie prawa Zipfa w ujęciu statystycz-nym. Można jednak dostosować parametr funkcji tak, by jak najściślej odpowiadała ona

rzeczywistemu rozkładowi. Końcowe dopasowanie wykresu jest czasami tak dokładne, że wartość parametruαdająca taki właśnie wykres może zostać w praktyce użyta jako wyłączna wartość liczbowa charakteryzująca stopień zróżnicowania uwagi poświęconej ǳiełom. W innych sytuacjach należy wykazać ostrożność, gdyż aproksymacja wykresu wykorzystująca prawo Zipfa staje się zbyt rozbieżna z rzeczywistymi danymi.

Gdy zróżnicowanie uwagi modelowane jest za pomocą prawa Zipfa, zmiany w jego parametrze prowaǳą do znacznych zmian stopnia, w którym uwaga odbiorców koncen-truje się na ograniczonym repertuarze ǳieł, czy w którym sprzedaż obejmuje ograniczo-ny katalog tytułów. Dla przykładu rozważmy populację tysiąca ǳieł. Jeśli dostęp do nich da się opisać prawem Zipfa z parametrem równym0.5, to5% najpopularniejszych ǳieł skupia na sobie20% uwagi ogółu odbiorców. Jeśli ten sam parametr wynosić bęǳie1,5, to te same5% ǳieł skupi na sobie92% ogółu dostępu. Może to się wydawać zaskaku-jące, ale tak silne rozbieżności da się zauważyć w odniesieniu do różnych form dostępu do dóbr kultury.

W dokumencie Dzielenie się Kultura i gospodarka epoki internetu (Stron 146-149)