3.1. Miary położenia
3.1.1. Średnia arytmetyczna
Spośród charakterystyk opisowych należących do średnich klasycznych najwięcej uwagi poświęcimy średniej a ry tm e ty c z n e j, k tó ra jest m iarą najbardziej znaną i naj częściej używaną, naw et w życiu codziennym .
N a przykład gdy kupujem y sam ochód, interesujem y się, jakie jest jego zużycie paliwa. Stw ierdzenie, że wynosi ono 7 litrów na 100 kilom etrów rozum iem y jako zu życie śre d n ie . S ied ząc rozgryw ki ligowe piłki n o żn ej, otrzym ujem y inform ację o liczbie bram ek przypadających na jed en m ecz w danej rundzie rozgrywek. Jest to rów nież w artość średnia. Po każdej sesji egzam inacyjnej studenci obliczają śred nią ocen, a jeśli jest ona odpow iednio wysoka, to m ają praw o do otrzym ania stypen dium .
W e wszystkich podanych przykładach w artość średniej arytm etycznej uzyskuje my w ten sam sposób. Średnia ta je st bow iem sum ą w szy stk ich w artości zm iennej
p od zielon ą przez liczbę obserwacji. W podanych wyżej przykładach dzielimy odpo
wiednio:
• całkow itą ilość paliw a zużytego na danej trasie przez liczbę przebytych kilo m etrów ,
• sum ę wszystkich b ram ek strzelonych w poszczególnych m eczach przez licz bę meczów w danej kolejce ligowej,
Postępow anie prow adzące do uzyskania w artości średniej arytm etycznej m oże my przedstaw ić w postaci następującego w zoru definicyjnego:
n Hxj
- _ M _ xi + x2 + --- + xn (3 J)
n n
gdzie:
Xj - w artość zm iennej X zaobserw ow ana dla;'-tej jedn o stk i statystycznej, n - liczba jed n o stek danej zbiorowości.
W tym miejscu należy zwrócić uwagę na n iek tó re w ażne własności średniej wy różniające ją spośród innych m iar przeciętnych, a mianowicie:
1. Ś rednia arytm etyczna stałej jest rów na tej stałej. Jeśli bo w iem Xj = c = con stans (j = 1, 2, ..., n), to:
_ c + c + ... + c n - c ■ = c.
n n
O znacza to, że gdyby wszystkie jednostki posiadały jednakow ą w artość zm ien nej, to każda z nich m iałaby w artość rów ną średniej arytm etycznej.
2. Jeśli rozpatrujem y zm ienną Z , k tó ra pow stała przez pom nożenie zm iennej
X przez stałą c, to wówczas średnią arytm etyczną zm iennej Z m ożna uzy
skać, m nożąc średnią zm iennej A' przez stałą c:
Xc - x c - Z X j
Ix
n j=i j=i j=i
--- = — ---= c --- = C - X .
W podobny sposób m ożna wykazać, że jeśli zm ienna Z pow stała przez p o dzielenie zm iennej X przez stałą c, to średnią arytm etyczną zm iennej Z m oż n a uzyskać, dzieląc średnią zm iennej X przez stalą c.
3. Jeśli rozpatrujem y zm ienną Y, k tóra jest sum ą dwóch innych zm iennych ozna czonych ja k o X , oraz X 2, to wówczas:
n n n n
T y j X ( Xi j+x2j) I x 1; Z x 2]
— j =1 7=1 j = \ i= l
V = --- = ---= --- + --- = X, + x2.
n n n n
W podobny sposób m ożna wykazać, że jeśli zm ienna Y jest różnicą zm ien nych X \ oraz X 2, to wówczas średnia arytm etyczna zm iennej Y jest różnicą średnich zm iennych X , oraz X 2.
4. Sum a odchyleń zaobserwow anych w artości zm iennej od ich średniej arytm e tycznej jest rów na zeru:
n n n
£ ( x - x ) = ZXj - Z x = n - x - n - x = 0.
5. Sum a kw adratów odchyleń zaobserw ow anych w artości zm iennej od ich śred niej arytm etycznej je st najm niejsza:
n _
~Z(Xj - x ) = m in .
;=i
D la wykazania tej własności należy udow odnić, że p o d an a funkcja osiąga m inim um w punkcie x. W tym celu znajdujemy pierwszą pochodną ze względu
n a x i przyrównujem y ją do zera. Z ( x j - x ) 2 ;=i - 2 -Xj -x + x 2) = 2- Y.Xj - 2 - n - x - 0 . 7=1 Y.Xj - n - x = 0. Z X j =n >=> Z Xj
6. Średnia arytmetyczna nie jest przypisana żadnej jednostce statystycznej. Cha rakteryzuje całą populację. D latego w przypadku zmiennej typu skokowego śred nia arytmetyczna może przyjmować wartość, która w rzeczywistości nie może wystąpić. Na przykład średnia liczba osób w rodzinie może być równa 3,7. 7. Ś rednia podaje w sposób sum aryczny inform acje o wszystkich jednostkach
zbiorowości:
_ n nx = ZXj.
U w zględnione są w niej wszystkie inform acje zaw arte w zbiorze danych. W ła sność ta m a niestety niekorzystne konsekw encje, gdy pojawiają się obserw a cje nietypowe, to znaczy takie, k tó re w znacznym stopniu odbiegają od w ar tości, jakie przyjm ują pozostałe jednostki zbiorowości. Średnia arytm etyczna pozostaje pod silnym wpływem w artości krańcowych. W ówczas traktow anie jej jak o wielkości ujm ującej sum arycznie inform ację o całej zbiorowości może okazać się nieadekw atne do rzeczywistości.
Na przykład obserwujem y zbiorowość m ałżeństw ze względu na liczbę posia danych dzieci. D la sześciu p a r otrzym ano następujące liczby dzieci: 2 ,1 ,3 ,2 ,3 , 1. D la tej zbiorowości średnia arytm etyczna jest równa 2 dzieci przypadają cych na jedno m ałżeństwo. Jeżeli jed n ak do badanej zbiorowości dołączyłoby dodatkow e małżeństwo z 9 dzieci, to średnia przyjęłaby wówczas wartość równą 3 dzieci. Jak z tego wynika, pojawienie się jednej nietypowej wartości zm ien nej w znacznym stopniu wpływa na wnioskowanie o całej zbiorowości.
8. Każdy rozkład liczebności m a tylko je d n ą średnią arytm etyczną.
W obliczeniach wzór (3.1) m oże przyjąć różną postać w zależności od tego, ja k i mi danymi posługujem y się w analizie. R ozróżnim y trzy następu jące sytuacje:
1) posiadam y indywidualne dane o każdej jedno stce statystycznej, a więc roz ważamy szereg szczegółowy,
2) badaniu poddaliśm y dużą zbiorow ość i pogrupow aliśm y dane, otrzym ując szereg rozdzielczy,
3) mamy dostęp tylko do danych pogrupow anych w postaci szeregu rozdziel czego.
Sytuacja (1) występuje w przykładzie dotyczącym liczby pasażerów w poszczegól nych lotach sam olotów na trasie K raków -L ondyn. Z nam y bow iem liczbę pasażerów w każdym rejsie, a więc dysponujem y szeregiem szczegółowym. Ś rednią liczbę p asa żerów podróżujących tą linią obliczamy, podstaw iając do w zoru (3.1) odpow iednie wartości z tablicy 3.1 i uzyskujemy:
124 + 130 + 128 + 115 + 128 + 121 + 140 + 141 + 130 + 128 + 112 + 135 x --- , 12 a zatem : 1532 x = = 127.66 «128 [pasażerów].
R ozw ażana tutaj zm ienna typu skokowego przyjm uje w artości wyłącznie ze zbio ru liczb całkowitych, a średnia arytm etyczna jak o wynik dzielenia przyjm uje w artości ze zbioru liczb rzeczywistych i dlatego nie należy się dziwić, że n a jed en rejs n a trasie K raków -Londyn przypadało 127,66 pasażerów (w przybliżeniu 128 osób). In te rp re tacja ta będzie łatwiejsza do zaakceptow ania, jeśli p am iętać będziem y o tym, że śre d nia charakteryzuje populację rejsów, a nie wykonany w rzeczywistości rejs.
Sytuacje wym ienione w punkcie (2) i (3) omówimy rów nocześnie, poniew aż nie jest tutaj istotne, czy szereg rozdzielczy zbudow aliśm y sami, czy pochodzi on n a przy kład z rocznika statystycznego. W ażne jest, że posługujem y się wówczas tzw. średnią arytm etyczną w ażoną, gdzie wagam i są liczebności w poszczególnych przedziałach klasowych. W tym przypadku m usimy jed n ak wziąć po d uwagę, jaki jest typ zm ien nej, a mianowicie, czy jest ona skokowa, czy ciągła (por. p u n k t 2.1.2).
W przypadku szeregu rozdzielczego ze zm ienną skokow ą (punktow ego szeregu rozdzielczego) średnią arytm etyczną obliczymy jako:
i f r *
* = --- , (3 -2 )
Z f ,
gdzie:
x t - i-ta w artość zm iennej X w szeregu rozdzielczym zm iennej skokowej, fi - liczba jednostek, k tó re przyjęły /-tą w artość zm iennej,
k - liczba w artości zm iennej występujących w szeregu rozdzielczym.
Jeśli ro zpatru jem y zm ienną typu ciągłego, to posługujem y się następującym wzorem:
i f i - x ' i
x = ^ - k---, (3 .3 )
T f i
1=1
gdzie:
x] - środek przedziału klasowego (środkow a w artość klasy),
f - liczebność /-tego przedziału klasowego, k - liczba przedziałów klasowych.
Przykład 3.1
P rzeprow adzono bad an ia jakości wyrobów produkow anych przez firm ę Z. Po b ra n o w tym celu 60 p róbek liczących po 5 wyrobów, które sklasyfikowano ze wzglę du n a przyjęte norm y jakości. Z m ienną X jest liczba wyrobów uznanych za w ybrako w ane w poszczególnych próbkach. Jest to zm ienna typu skokowego. W tablicy 3.2 p o d an o rozkład liczby braków w poszczególnych próbach.
Tablica 3.2. Rozkład liczebności wyrobów uznanych za wybrakowane w poszczególnych próbkach i X/ / Xi fi 1 0 7 0 2 1 10 10 3 2 19 38 4 3 11 33 5 4 9 36 6 5 4 20 Razem 60 137
Posługując się w zorem (3.2), otrzymujem y: 137
x = --- = 2,28[szt.].
60
Ś rednia liczba wyrobów wybrakowanych w poszczególnych próbkach jest rów na 2,28 [szt.].
Przykład 3.2
Właściciel sklepu „Z drow a Żywność” jest zainteresow any tym, ile przeciętnie wydają klienci robiący u niego zakupy. N a podstaw ie wydruków z kasy fiskalnej otrzy ma! d ane dotyczące 30 osób. Przedstaw ił je w postaci szeregu rozdzielczego, który został podany w tablicy 3.3.
Tablica 3.3. Wydatki klientów sklepu „Zdrowa Żywność”
I Wydatkowana kwota W,*?) Liczba klientów fi x; f x; 1 10-15 4 12,5 50 2 15-20 8 17,5 140 3 20-25 12 22,5 270 4 25-30 6 27,5 165 Razem 30 X 625
Źródło: dane umowne.
W tym przypadku m am y do czynienia ze zm ienną typu ciągłego. Ś rednie wydatki 30 klientów obliczamy zgodne ze w zorem (3.3) i uzyskujemy:
5r= — = 20.83 [zll.