2.1. Grupowanie statystyczne
2.1.2. Grupowanie według cech ilościowych (zmiennych)
W przypadku cech ilościowych zamiast określonych słownie kategorii występują wyrażone liczbowo warianty zmiennej. W tym przypadku zadanie jest bardziej skompli kowane. Najczęściej sami musimy zadecydować, jakie warianty zmiennej wyróżnimy.
Przedstawimy procedurę konstruow ania szeregu statystycznego dla zm iennych typu skokowego i ciągłego. Zilustrujem y to odpow iednim i przykładam i.
P rz y k ła d 2.1
Z m ie n n a ty p u sk okow ego
P rzeprow adzono analizę wielkości gospodarstw dom owych w populacji Z w 2003 roku. W ylosowano w tym celu 50 gospodarstw i zebran o inform acje o liczbie osób. Po uporządkow aniu ich rosnąco uzyskano podany niżej szereg statystyczny, zaw iera jący indywidualne d ane o każdej jednostce, k tó rą jest gospodarstw o dom ow e. S zereg ta k i nazyw am y szereg iem szczegółow ym .
G ospodarstw a dom ow e w edług liczby osób w rodzinie (*:■): 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 8 8 9 12
Źródło: dane umowne.
Przyjm ujem y następujące oznaczenia:
X - obserw ow ana zm ienna, k tó rą w danym przypadku jest liczba osób w rodzinie, Xj - w artość zm iennej przyporządkow anay-tej jednostce statystycznej.
T utaj jest to liczba osób w y-tym gospodarstw ie domowym. Na przy k ład ,; = 3 oznacza trzecie w kolejności gospodarstw o o liczbie o só b x 3 = 1; n - liczebność popu lacji; n = 50, a z a te m ; = 1, 2, ..., 50.
W szeregu szczegółowym p o dane są w praw dzie indywidualne inform acje, ale na ich podstaw ie tru d n o jest sform ułow ać syntetyczną charakterystykę badanej zbio rowości. O braz byłby jeszcze mniej wyraźny, gdyby liczba obserwacji była jeszcze więk sza, a tym bardziej gdybyśmy chcieli porów nać wielkość gospodarstw domowych na przykład w m ieście i na wsi. Przeprow adzim y więc grupow anie gospodarstw we dług liczby osób. O trzym ujem y wówczas sze reg ro zd zielczy p u n k to w y lub p rz e d ziałow y, który składa się z dwóch kolum n. W jednej wyróżniono w arianty zm ien nej, a w drugiej przyporządkow ane im liczebności. Punktow y szereg rozdzielczy gospodarstw domowych w edług liczby osób pod an o w tablicy 2.6.
Tabela 2.6. Gospodarstwa domowe według liczby osób w populacji Z - szereg rozdzielczy punktowy
Xj - liczba osób fi - liczba
w gospodarstwie gospodarstw domowym domowych 1 13 2 12 3 10 4 9 5 i więcej 6 k Z / , 50
Jeśli uwzględnimy wszystkie w artości zm iennej, to uzyskamy szereg, w którym dla jc6, jc7, jc10, jc,, otrzym ujem y liczebności ( f ) równe zeru. Przyjm ujem y klasę zbiorczą (jc5) określoną jak o „5 i więcej osób w rodzinie”. k
O gólną liczebność populacji n = 50 uzyskujemy jak o H f , , gdzie k oznacza liczbę wariantów zm iennej.
W przypadku szeregu, w którym uw zględniono wszystkie w artości zm iennej, jest ich k = 12, a w szeregu z klasą zbiorczą jest ich k = 5.
Przykład 2.2
Z m ien na typu ciągłego
W przeprow adzonej analizie oprócz wielkości gospodarstw dom owych w p o p u la cji Z w 2003 roku w zięto również pod uwagę wysokość docho du przypadającego na jed n ą osobę (zm ienna
O trzym ano następujące d ane statystyczne:
1,65 1,50 2,10 1,25 2,32 1,78 1,90 1,15 1,45 1,70 1,65 1,50 2,15 1,30 2,36 1,80 1,94 1,15 1,45 1,76 1,70 1,50 2,18 1,35 2,40 1,80 1,98 1,20 1,46 1,60 1,70 1,50 2,20 1,40 2,50 1,84 2,00 1,20 1,48 1,62 1,72 1,51 2,30 1,40 2,55 1,84 2,10 1,24 1,48 1,64
Po uporządkow aniu pow stał następujący szereg szczegółowy gospodarstw d o m o wych w edług wysokości dochodu przypadającego n a je d n ą osobę (jc;):
1,15 1,45 1,60 1,78 2,10 1,15 1,45 1,62 1,80 2,15 1,20 1,46 1,64 1,80 2,18 1,20 1,48 1,65 1,84 2,20 1,24 1,48 1,65 1,84 2,30 1,25 1,50 1,70 1,90 2,32 1,30 1,50 1,70 1,94 2,36 1,35 1,50 1,70 1,98 2,40 1,40 1,50 1,72 2,00 2,50 1,40 1,51 1,76 2,10 2,55
W celu lepszego ukazania prawidłowości występujących w rozkładzie liczebności gospodarstw ze względu n a wysokość dochodów skonstruujem y szereg rozdzielczy. W przypadku zm iennej typu ciągłego, k tó ra m oże przyjąć każdą w artość z danego przedziału liczbowego, obszar jej zm ienności m usi być podzielony na odcinki, k tó re nazywać będziem y przedziałam i klasowymi lub klasam i.
M usimy podjąć decyzję, ile będzie tych przedziałów lub, co jest rów noznaczne, ja k a b ędzie długość przed ziału . W ygodnie je st, jeśli długości te są jed n ak o w e. W literaturze podaw ane są procedury, w edług których m ożna ustalić liczbę
przedzia-(2 .4 ) tów klasowych lub określić ich długość. A. Iwasiewicz i Z. P aszek17 proponują nastę pujące postępow anie:
1. liczbę przedziałów klasowych k ustalam y w edług wzoru:
k' = 1 -t- 3,3 * lg/7 (2 .2 )
0,5 • yfn < k < J n (2 .3 ) W arto ść k uzyskujemy, zaokrąglając k' do najbliższej liczby całkowitej.
2. ustalam y długość przedziału jako:
_ R l ~ k
gdzie:
x mi„ - m inim alna w artość zm iennej X
*maks - m aksym alna w artość zm iennej X
W przykładzie 2.2, odnoszącym się do rozkładu liczebności gospodarstw dom o wych, otrzym ujem y:
k' = 1 -t- 3,3 • lg 50 = 1+3^3 -1,699= 6,61,
V50 = 7,07, 0,5-750 = 0,5-7,07 = 3,54.
L iczba przed ziałó w klasow ych pow inna m ieścić się w p rzedziale liczbowym 3,54 < k < 7,07. B iorąc p o d uwagę w artość k! = 6,61, powinniśm y przyjąć k = 7 prze działów klasowych o długości obliczonej zgodnie ze w zorem (2.4) jako:
i = 2 ^ = ] A 1 7
Przedziały klasowe zapiszem y w sposób podany w tablicy 2.7. D olną granicę pierw szego p rzedziału przyjm iem y jak o x*mi = 1,0 [tys. zł]. G ranice przedziałów klasowych ustalam y tak, że górna granica klasy poprzedniej jest rów na dolnej granicy klasy n a stępnej. Aby uniknąć problem ów przy zaliczaniu jed n o stek do klas, musimy przyjąć jednoznaczne kryterium . D o danego przedziału zaliczać będziem y jednostki, dla któ
rych zaobserw ow ane w artości zm iennej spełniają w arunek:
x f < x t < x f (2 .5 ) gdzie:
x f - d o ln a granica /-tego przedziału klasowego, x f - górn a granica /-tego przedziału klasowego.
Przyjęte przedziały są lew ostronnie dom knięte i praw ostronnie otw arte.
W kolum nie (1) tablicy 2.7 podano przedziały, których długość i = 0,2 [tys. zł]. Z godnie z przyjętą p ro c e d u rą szereg pow inien sk ład ać się z 7 przedziałów , ale w rozważanym przykładzie klasyfikacja nie będzie zupełna. O statni przedział [2,2-2,4) nie pozwala bowiem uwzględnić 3 gospodarstw o najwyższych dochodach. D latego ponownie ustalam y liczbę przedziałów klasowych, przyjm ując x ^ m = 1,0 [tys. zł], a *maks = 2,6 [tys. zł].
Wówczas k - ^ = 0,24 [tys. zł]. W kolum nie (2) po d an o nowe p rze działy klasowe. W kolum nie (4) w artości zm iennej przyporządkow ane poszczegól nym przedziałom . K olum na (5) zaw iera ich liczebności.
Tablica 2.7. Empiryczny rozkład liczebności gospodarstw domowych według wysokości dochodu przypadającego na jedną osobę w województwie Z w 2003 roku
X, Przedziały Xj - zaobserwowane wartości zmiennej X f
(1) (2) (3) (4) (5) 1,0-1,2 1,00-1,24 1,00 <*,<1,24 1,15 1,15 1,20 1,20 4 1,2-1,4 1,24-1,48 1,24 <jc, <1,48 1,24 1,25 1,30 1,35; 1,40; 1,40; 1,45; 1,45; 1,46 9 1,4-1,6 1,48-1,72 1,48 <x, <1,72 1,48 1,64 1,48 1,65 1,50 1,65 1,50; 1,50; 1,50; 1,51; 1,60; 1,62; 1,70; 1,70; 1,70 15 1,6-1,8 1,72-1,96 1,72 <Xi <1,96 1,72 1,76 1,78 1,80; 1,80; 1,84; 1,84; 1,90; 1,94; 9 1,8-2,0 1,96-2,20 1,96 <xt <2,20 1,98 2,00 2,10 2,10; 2,15; 2,18 6 2,0-2,2 2,20-2,44 2,20 <x, <2,44 2,20 2,30 2,32 2,36; 2,43 5 2,2-2,4 2,44-2,68 2,44 <Xj <2,68 2,50 2,55 2 Suma: 50 Źródło: dane umowne.
W szereg u rozdzielczym przedziało w ym wartości zm iennej podane są jak o prze działy. O pisując prawidłowości w ystępujące w rozkładzie liczebności za pom ocą róż nych charakterystyk nazywanych dalej m iaram i, będziem y m usieli posłużyć się jed n ą tylko liczbą, która rep rezen tu je d an ą klasę. R ep re zen tan te m przedziału klasowego jest jego środek. Obliczam y go jak o średnią arytm etyczną dolnej i górnej granicy.
Skonstruow any szereg rozdzielczy gospodarstw dom owych w edług wysokości dochodu w raz ze środkam i przedziałów pod an o w tablicy 2.8. Z am ieszczono tam
rów nież liczebności w postaci bezwzględnej ( / ) , jak o częstości względne ( f ‘) zdefi niow ane w zorem (2.1) oraz w w yrażaniu procentow ym ( f- -100% ).
Tablica 2.8. Rozkład liczebności (szereg rozdzielczy) gospodarstw domowych według wysokości dochodu
*/ f f i f l 100% 1,00-1,24 4 1,12 0,08 8,0 1,24-1,48 9 1,36 0,18 18,0 1,48-1,72 15 1,60 0,30 30,0 1,72-1,96 9 1,84 0,18 18,0 1,96-2,20 6 2,08 0,12 12,0 2,20-2,44 5 2,32 0,10 10,0 2,44-2,68 2 2,56 0,04 4,0 Suma 50 X 1,00 100
Źródło: dane umowne.
M ożem y zastanaw iać się, ile gospodarstw domowych posiada dochody niższe od górnej granicy przedziału klasowego. W celu uzyskania odpow iedzi musimy skum u lować przedziały klasowe i zsum ow ać liczebności odpow iednich przedziałów klaso wych. Sumy te są przyporządkow ane górnym granicom klas.
Skum ulow ane liczebności oznaczam y jak o c u m /. Symbole / oraz c u m / ozna czają odpow iednio liczebności bezw zględne, a sym bole / / oraz c u m /' liczebności w zględne (częstości). Skum ulow any szereg gospodarstw domowych według wysoko ści d o chodu przedstaw iono w tablicy 2.9.
Tablica 2.9. Skumulowane liczebności gospodarstw domowych według wysokości dochodu
x f cum / c u m /' / ' • 100% 1,24] 4 0,08 8 (-<»; 1,48] 13 0,26 26 (-°°; 1,72] 28 0,56 56 H ° ; 1,96] 37 0,74 74 (—°°; 2,20] 43 0,86 86 (-<»; 2,44] 48 0,96 96 (-« ; 2,68] 50 1,00 100