• Nie Znaleziono Wyników

Przeciętne pozycyjne

W dokumencie Podstawy statystyki (Stron 51-62)

3.1. Miary położenia

3.1.4. Przeciętne pozycyjne

P rzeciętne pozycyjne są m iaram i wyznaczanymi z szeregu statystycznego. W od­ różnieniu od średniej arytm etycznej i geom etrycznej i harm onicznej są to wartości konkretnych jed n o stek statystycznych, a m ianowicie tych, k tóre w szeregu zajm ują szczególną pozycję. Je d n ą z takich m iar jest m odalna.

M odalna (m oda, dom inanta, w artość najczęstsza, typowa) jest to wartość zm ien­

nej, k tó ra w danej zbiorow ości występuje najczęściej. W yznaczenie jej z szeregu szcze­ gółowego nie nastręcza większych trudności. W ystarczy tylko sprawdzić, która w ar­ tość zm iennej pow tarza się największą ilość razy. T ę właśnie w artość wskazujemy jak o m odalną.

W przykładowych danych zawartych w tablicy 3.1 zauważamy, że były 3 rejsy, w czasie których na pokładzie sam olotu podróżow ało 128 pasażerów . Jest to zatem liczba, k tó ra pojawia się najczęściej w analizow anej zbiorowości. Jest to w artość m o­ dalna. Najczęściej na trasie K raków -L ondyn podróżow ało 128 pasażerów.

W yznaczanie m odalnej z szeregu rozdzielczego z przedziałam i klasowymi przed­ stawimy najpierw w wersji graficznej (rys. 3.1). W ykorzystam y w tym celu histogram przedstaw iający rozkład liczebności gospodarstw dom owych według wysokości do­ chodów rozważany w przykładzie 2.2. Jest on podany w tablicy 2.7 i przedstawiony na rysunku 2.1.

t

fi 16 10 -14 12 -8 6 -4 2 0 --- i --- ---1,00-1,24 1,24-1,48 1,48-1,72 1 ,72-1,96 1 ,96-2,20 2,2 0 -2 ,44 2 ,44-2,68

Rys. 3.1. Graficzne wyznaczanie modalnej

Aby wyznaczyć m odalną, rozpatrujem y trzy przedziały klasowe: przedział po sia­ dający największą liczebność, gdyż tutaj znajduje się m od alna oraz przedziały z nim sąsiadujące (poprzedni i następny). Łączymy odcinkiem w ierzchołek odpow iadający górnej granicy klasy poprzedzającej przedział z m odaln ą z w ierzchołkiem odpow ia­ dającym górnej granicy klasy z m odalną. D rugi odcinek prow adzim y od dolnej grani­ cy przedziału z m odalną do dolnej granicy przedziału następnego. O dcinki te p rzeci­ nają się w punkcie, k tó reg o rzut na oś odciętych w skazuje przybliżoną w arto ść modalnej. T ę przybliżoną w artość m ożem y określić liczbowo za pom ocą n astęp u ją­ cego wzoru interpolacyjnego:

/m - dolna granica klasy, w której znajduje się m odalna,

im - długość przedziału, w którym znajduje się m odalna, f l m - liczebność klasy, w której znajduje się m odalna,

/ m_] - liczebność klasy poprzedzającej klasę, w której znajduje się m odalna,

f myt - liczebność klasy następującej po klasie z m odalną.

Przykład 3.4

W Wydziale A dm inistracyjnym U rzęd u M iasta przeprow adzono bad an ia czasu obsługi petentów . W sposób losowy w ybrano pró b ę liczącą 53 osoby, którym zm ie­ rzono czas, w jakim zostali obsłużeni. Uzyskane d ane zaw arto w tablicy 3.5. In te re su ­ je nas najczęstszy czas obsługi petentów .

AJo- Im + im' f m f m-\ (3 .9 )

Tablica 3.5. Czas obsługi petentów

Ilość czasu w m inutach

lxf,x?) Liczba petentów f 5-10 5 10-15 13 15-20 24 20-25 11

Źródło: dane umowne.

Zauw ażam y, że w przedziale 15-20 m inut obsłużono najwięcej petentów (24), a zatem w tym przedziale znajdzie się m odalna.

/ — 15 m inut, i = 5 m inut, f , = 13 osób, f ^ , = 11 osób.m ’ m 7*/ m - l 7 ^ m + 1 Podstaw iając do w zoru (3.4), otrzym ujem y:

O A 1 *5 11

A /0 = 1 5 + 5 --- = 15 + 5 — —— = 15 + 2 ,2 9 = 17,29 [minut].

(2 4- 13) + (2 4- 11) 11 + 13

W W ydziale A dm inistracyjnym U rzędu M iasta najczęstszy czas obsługi petentów wynosi 17,29 m inut, to jest 17 m inut i 17 sekund. M inuta liczy 60 sekund, a zatem 0,29 • 60 sekund = 17,4 [sekund].

Przykład 3.5

Powrócim y do przykładu z rozdziału 2, w którym rozpatrywaliśm y rozkład liczeb­ ności gospodarstw dom owych w edług wysokości dochodu podany w postaci szeregu szczegółowego, n a podstaw ie którego skonstruow aliśm y szereg rozdzielczy zapisany w tablicy 2.8. B iorąc pod uwagę szereg szczegółowy, stwierdzam y, że dom inujący dochód wynosi 1,5 tysiąca złotych. T eraz dla tej sam ej zbiorow ości gospodarstw wy­ znaczymy m odalną z danych pogrupow anych i posłużym y się wzorem interpolacyj­ nym. D la przypom nienia szereg rozdzielczy p o d an o w tablicy 3.6.

O trzym ujem y następującą w artość m odalnej:

M =1,48 + 0 ,2 4--- ?--- = 1,48 + 0,2 4- 6 (1 5 - 9 ) + ( 1 5 - 9 ) 6 + 6

= 1.48 + 6 ' 0,24 = 1.48 + 0,12 = 1,6 [tys.zl],

12

W yznaczony za pom ocą w zoru interpolacyjnego najczęstszy (typowy, dom inują­ cy) dochód gospodarstw domowych jest równy 1600 złotych.

Tablica 3.6. Rozkład liczebności gospodarstw domowych według wysokości dochodu Xi cum f 1,00-1,24 4 4 1,24-1,48 9 13 1,48-1,72 15 28 1,72-1,96 9 37 1,96-2,20 6 43 2,20-2,44 5 45 2,44-2,68 2 50 Suma 50 X Źródło: tablica 2.8 i 2.9.

W tym miejscu należy zwrócić uwagę na to, że zawsze musimy się liczyć z występo­ waniem różnic pomiędzy rezultatam i uzyskanymi na podstawie szeregu szczegółowego i rozdzielczego. K onstruując szeregi rozdzielcze, zawsze tracimy pew ne inform acje. Przyjmujemy na przykład, że wszystkie wartości zmiennej jedn ostek statystycznych za­ liczonych do danego przedziału klasowego są równe środkowi tego przedziału. D late­ go grupowanie danych jest ważnym etapem badań statystycznych. M usimy zatem do ło ­ żyć wszelkich starań, aby tak go przeprow adzić, by otrzym ane wyniki jak najlepiej odzwierciedlały rozważaną rzeczywistość.

C harakterystykę rozkładu liczebności m ożem y wzbogacić, wyznaczając w artości m iar opisowych określanych m ianem w artości ćwiartkowych, nazywanych również kwartylami.

W a rto śc i ćw ia rtk o w e (k w a rty le) dzielą b ad an ą zbiorow ość n a ćwiartki. W cen­ trum znajduje się m ediana, czyli w artość środkow a. Jest o n a przeciętn ą pozycyjną, która dzieli uporządkow any szereg statystyczny na dwie części w taki sposób, że p o ­ łowa jednostek zbiorowości m a w artość zm iennej nie w iększą (m niejszą lub rów ną) od mediany, a połowa nie m niejszą od niej (większą lub rów ną). Z szeregu szczegóło­ wego m edianę wyznaczamy w następujący sposób:

- gdy liczebność zbiorow ości n jest nieparzysta, to:

(3 .1 0 )

Przykład 3.6

Powrócim y do przykładu dotyczącego linii lotniczej. Poniższe liczby przedsta­ w iają liczbę pasażerów w poszczególnych rejsach. Chcem y wyznaczyć m edianę dla tej zbiorowości.

124, 130, 128, 115, 128, 121,140, 141, 130,128, 112, 135

W pierwszej kolejności uporządkujem y jednostki statystyczne (rejsy) według w ar­ tości zm iennej (liczba pasażerów ) i otrzym ujem y następujący szereg:

112, 115,121, 124, 128, 128, 128, 130, 130,135, 140, 141

Zbiorow ość liczy 12 obserwacji (n = 12), a więc n jest parzyste. Szukamy jed n o ­ stek zbiorowości, których w artości zm iennej podstawim y do wzoru (3.11):

X»=*12 =*6>

2 2

D o w zoru podstaw im y w artości szóstej i siódm ej jednostki w uporządkowanym szeregu. O dliczając od początku zbiorowości, odczytujem y = 128 oraz x-, - 128 [osób]. W artości te podstaw iam y do w zoru (3.11) i otrzym ujem y:

128 + 128 . , .

M e = --- --- = 128 [pasażerów].

W pięćdziesięciu procentach rejsów na pokładzie sam olotów podróżow ało nie więcej niż 128 pasażerów i w pięćdziesięciu procentach rejsów leciało nie mniej niż 128 pasażerów . Sposób wyznaczania m ediany w przypadku szeregu rozdzielczego zaprezentujem y najpierw graficznie. W ykorzystam y w tym celu diagram szeregu sku­ m ulow anego gospodarstw domowych przedstaw iony na rysunku 2.4. Na rysunku 3.2 przedstaw iono odpow iedni wykres skum ulowanej liczebności gospodarstw domowych w edług wysokości dochodu rozważany w przykładzie 2.2.

Yl

N a osi rzędnych odnajdujem y pun k t odpow iadający — = 25 jednostkom . P rostą

prostopad łą do tej osi prow adzim y aż do przecięcia z krzywą wykresu. R zut pu nktu przecięcia n a oś odciętych wyznacza w artość środkow ą (M e).

W artość m ediany uzyskamy, korzystając z następującego wzoru interpolacyjnego: / - me- 1 ^ , f = , A l e l me ~ j . n me V 2 9 /=1 yZ / ' (3 .1 2 ) gdzie:

lme - dolna granica klasy, w której znajduje się m ediana, ime - długość przedziału, w którym znajduje się m ediana,

f m, - liczebność klasy, w której znajduje się m ediana,

me- 1

Z f i - sum a liczebności od klasy pierwszej do klasy poprzedzającej przedział, w którym znajduje się m ediana.

/=]

P rz y k ła d 3.7

Obliczenie m ediany dla szeregu rozdzielczego zilustrujem y na przykładzie, w k tó ­ rym interesujem y się czasem obsługi petentów urzędu m iejskiego. O dpow iednie dane zawiera tablica 3.7 (patrz: przykład 3.4, s. 55).

Tablica 3.7. Czas obsługi petentów oraz obliczenia pomocnicze

Czas

w m inutach

Liczba petentów

f

Liczebność kum ulacyjna

cum f 5-10 5 5 10-15 13 18 15-20 24 42 20-25 11 53 Suma 53 X

Źródło: dane umowne.

Najpierw określimy, w którym przedziale znajduje się m ediana. Dzielim y liczeb­ ność zbiorowości n przez 2 i otrzym ujem y:

— = — = 26.5.

2 2

N astępnie sprawdzam y, w którym przedziale zaw iera się 26 i 27 jed n o stk a zbio­ rowości. Pom iędzy nim i znajduje się m ediana. W tym celu m usimy utworzyć liczeb­ ność kum ulacyjną (cum f ) , dodając liczebności poszczególnych klas, poczynając od

klasy pierw szej (patrz tablica 3.7). Szukana w artość znajduje się w przedziale 15-20. Jest to przedział z m edianą. Podstaw iając do w zoru (3.12) odpow iednie wartości, otrzym ujem y:

'5 3 N - - 1 8

2 ,

= 15 + 0,21-8.5 = 15 +1,78 -1 6 ,7 8 [minut].

Z a te m połow a peten tó w była obsługiw ana nie dłużej niż 16 m inut i 47 sekund, a połow a nie krócej niż 16 m inut i 47 sekund.

P rz y k ła d 3.8

N a podstaw ie danych z przykładu 3.6 m ożem y wyznaczyć m edianę dochodów 50 gospodarstw dom owych zarów no z szeregu szczegółowego, jak i z rozdzielczego. W tym przypadku rów nież liczba obserwacji jest rów nież parzysta n = 50. M edianą jest zatem dochód gospodarstw a wyznaczony jako:

= x ,fl = x.

- + i 2

M = *25 + Xy’ = 1?65 + 1,7° = — = 1.675 [zł].

2 2 2

Z ate m 50% gospodarstw domowych posiada dochody nie większe od 1645 zl, a dochody 50% gospodarstw są nie m niejsze niż 1675 zł. Posługując się wzorem in ter­ polacyjnym i danym i w postaci szeregu rozdzielczego, otrzym ujem y następujący d o ­ chód środkow y (zob. tablica 3.6):

M e = 1,48 + • (25 - 1 3 ) = 1,48 + ° ’.2 4 ' 12 = i j g + 0,192 = 1,672 [zl].

R óżnice w otrzym anych wynikach są rezultatem grupow ania danych.

P rz y k ła d 3.9

W m agazynie „B usinessW eek” 19 zam ieszczono artykuł na tem at płac inform aty­ ków w niektórych krajach europejskich. D ane zilustrow ano wykresem, który zamiesz­ czamy n a rysunku 3.3.

M ed ian a p łac d y rektora we Francji wynosząca 24 207 złotych oznacza, że połowa dyrektorów ds. inform atyki w tym kraju zarabia nie więcej niż 24 207 złotych, a p o ło ­ w a nie m niej niż 24 207 złotych20.

M ed ian a jest jednym z trzech kwartyli. Z ap rezen tow an o ją w pierwszej kolejno­ ści, poniew aż należy do m iar tendencji centralnej i wraz ze średnią arytm etyczną

19 „BusinessWeek” nr 10 (2003).

20 Interpretację pozostałych wyników oraz porównania międzynarodowe pozostawiamy czytel­ nikowi.

i m odalną jest najczęściej wykorzystywana d o szacow ania w artości przeciętnej w p o ­ pulacji generalnej.

Rys. 3.3. Mediana miesięcznych wynagrodzeń netto* dyrektora ds. informatyki w wybranych krajach europejskich w 2002 roku

*wg średniego kursu NBP z 31 października 2002 r.

Źródło: „BusinessWeek” nr 10 (2003), s. 81, AWR „Wprost”.

K w artyle są to wartości zm iennej tych jed n o stek statystycznych, k tó re dzielą u p o ­ rządkow aną zbiorowość na ćwiartki, odpow iednio:

• kwartyl pierwszy (dolny) dzieli zbiorow ość na dwie części w taki sposób, że 25% jed n o stek zbiorowości m a w artości zm iennej nie większe od wartości kwartyla, a 75% m a w artości nie m niejsze niż w artość kwartyla,

• kwartyl drugi (m ediana) został już przedstaw iony,

• kwartyl trzeci (górny) dzieli zbiorow ość n a dwie części w taki sposób, że 75% jedn ostek zbiorowości m a w artości zm iennej nie większe od w artości kw ar­

tyla, a 25% m a w artości nie m niejsze niż w artość kwartyla.

Z szeregu szczegółowego kwartyle wyznaczamy w podobny sposób jak m edianę. Dla liczebności parzystej w pierwszej kolejności wyznaczamy m edianę zgodnie ze w zorem (3.11). N astępnie dla każdej z w yodrębnionych części wyznaczamy wartości środkowe, które będą rów ne odpow iednio dla pierwszej części - kwartylowi pierw ­ szemu, a dla drugiej części - kwartylowi trzeciem u.

Przykład 3.10

W yznaczymy kwartyle rozkładu liczebności pasażerów linii lotniczej K raków - Londyn. M ediana (kwartyl drugi) jest rów na 128 pasażerów i znajduje się między 6 a 7 jed n o stk ą uporządkow anej zbiorowości. Dzielim y więc zbiorowość rejsów na tra­ sie K raków -L ondyn na dwie rów ne części:

c z ę śc i: 112, 115, 121, 124, 128, 128, cześć II: 128, 130, 130, 135, 140, 141. W yznaczam y m edianę dla każdej z nich:

W artość środkow a dla części I, będąca kwartylem pierwszym, jest równa: - 121 + 124 , „ . r

Qx = --- --- = 12 2..") [pasażera | .

W artość środkow a dla części II, będąca kwartylem trzecim , jest równa: ^ 130 + 135 , , , er . ,

= --- --- = 133.5 [pasażera].

Z in terp retu jem y teraz otrzym ane wyniki.

W 25% rejsów na trasie K raków -L ondyn podróżow ało nie więcej niż 122,5 pasa­ żerów, a w 75% rejsów latało nie mniej niż 122,5 pasażerów . W 75% rejsów na pokła­ dzie sam olotów znajdow ało się nie więcej niż 133,5 pasażerów , a w 25% rejsów latało nie mniej niż 133,5 pasażerów .

W przypadku liczebności nieparzystej najpierw wyznaczamy m edianę (wzór (3.10)), a n astępnie w yodrębniam y dwie podzbiorow ości w taki sposób, że jednostkę zbioro­ wości, dla k tórej w artość jest m edianą, zaliczamy do obydwu części. Kolejnym kro­ kiem jest wyznaczenie m ediany dla każdej z tak w yodrębnionych części.

Przykład 3.11

Tym razem rozpatrujem y wyniki uzyskane przez studentów na testowym egzam i­ nie z ekonom ii. Studenci otrzym ali p o d an ą niżej liczbę punktów.

34, 35, 42, 44, 45, 46, 51, 55, 66, 77, 80 Poszukujem y w artości wszystkich przedstaw ionych kwartyli.

1. W yznaczam y m edianę dla n = 11.

Me = ,vf)+1=.V6 = 46 [punktów], T "

2. Dzielimy zbiorowość na dwie części i dla każdej z nich wyznaczamy mediany: część I: 34, 35, 42, 44, 45, 46

42 + 44 _ r t .

Q\ = — -— = 43 [punkty].

_ 55 + 66 , ,

Qi = — - — = 60,5 [punkt}'].

Kwartyl pierwszy wskazuje, że 25% studentów otrzym ało nie więcej niż 43 p u n k ­ ty, a 75% studentów nie m niej niż 43 punkty. N a podstaw ie kwartyla trzeciego stw ier­ dzany, że 75% studentów otrzym ało nie więcej niż 60,5 punktu, a 25% studentów nie mniej niż 60,5 punktu.

D la szeregu rozdzielczego idea wyznaczania kwartyli jest p od ob na do wyznacza­ nia mediany. W pierwszej kolejności sprawdzam y, w którym przedziale znajduje się dany kwartyl, określając przedział, na który przypada odpow iednio:

fl

dla kwartyla pierwszego: —jednostek, 4

3-n

dla kwartyla trz e c ie g o :--- jednostek. 4

Wzory interpolacyjne m ają następującą postać:

:/* + / * n ‘J.-1 „ ~ r l f < (3 .1 3 ) Q l = M e ' 3 - n «>-i ' - r - 2 f i v M (3 .1 4 ) Przykład 3.12

W celu zilustrow ania sposobu wyznaczania kwartyli Q x oraz Q 3 posłużm y się d a­ nymi z przykładu 3.4. dotyczącego czasu obsługi peten tó w w urzędzie m iejskim . O b ­ liczenia pom ocnicze zam ieszczono w tablicy 3.8.

Tablica 3.8. Czas obsługi petentów oraz obliczenia pomocnicze

Przedział Czas obsługi Liczba petentów Liczebność kumulacyjna kwartyla w m inutach fi cum f

5-10 5 5

e , 10-15 13 18

03 15-20 24 42

20-25 11 53

Suma 53 X

1. N ajpierw obliczamy w artość — (dla O,) i (dla <23):

53

a : — = 13,25, 4

2. N astępnie, korzystając z liczebności skum ulow anej, sprawdzamy, w których przedziałach znajdują się otrzym ane wartości.

3. K orzystając ze wzorów (3.13) i (3.14), wyznaczamy odpow iednie kwartyle.

In terp retacja:

• 25% petentów było obsługiwanych nie dłużej niż 13,14 minuty, a 75% p e te n ­ tów było obsługiwanych nie krócej niż 13,14 minuty.

• 75% petentów było obsługiwanych nie dłużej niż 19,57 minuty, a 25% p eten ­ tów było obsługiwanych nie krócej niż 19,57 minuty.

W celu wyznaczenia kwartyli ograniczam y się do środkowych 50% obserwacji. W artości tych m iar nie zależą więc od w artości krańcowych. W związku z tym nie są one, w przeciw ieństw ie do średniej arytm etycznej, wrażliwe n a nietypowe dla danej zbiorow ości wyniki.

Z ilustrujem y to przykładem dotyczącym notow ań giełdowych.

P rz y k ła d 3.13

U szeregow ane rosnąco ceny akcji (w złotych) z jed n eg o tygodnia (pięć notow ań) wynosiły:

M ediana dla tej zbiorowości wynosi 2,54 złotych, a średnia arytmetyczna jest równa 2,56 złote. N aw et jeśli w miejsce wyniku 2,65 złotych pojawiłaby się cena akcji równa 7 złotych, to m ediana nadal wynosiłaby 2,54 złotych. W artość średniej wzrosłaby n a­ tom iast do 3,43 złotych.

Kwartyle stanow ią szczególny przypadek większej grupy m iar określanej jako k w a n ty le. Są one w artościam i jed n o stek zbiorowości, które dzielą ją na określone części p od w zględem liczby jed n o stek tej zbiorowości. N a przykład, kwantyl rzędu 0,6 dzieli zbiorow ość w taki sposób, że 60% jed n o stek zbiorowości jest nie większa niż w artość tego kwantyla, a 40% jest nie m niejsza od jego wartości.

0 t = 10 + v

(?3 = 15 + — • ^ - ^ - 1 8 = 15 + 0,21-21.75 = 15 + 4.57 = 19.57 [minut]. 24 v 4

Jeśli dzielimy zbiorow ość na 10 części, to otrzym ujem y m iary nazywane d e c y la ­ m i. D la podziału populacji n a 100 części posługujem y się centylam i. Z kolei p e rc e n - ty le dzielą zbiorowość na 1000 części.

W dokumencie Podstawy statystyki (Stron 51-62)