• Nie Znaleziono Wyników

Grupowanie według cech ilościowych (zmiennych)

W dokumencie Podstawy statystyki (Stron 28-34)

2.1. Grupowanie statystyczne

2.1.2. Grupowanie według cech ilościowych (zmiennych)

W przypadku cech ilościowych zamiast określonych słownie kategorii występują wyrażone liczbowo warianty zmiennej. W tym przypadku zadanie jest bardziej skompli­ kowane. Najczęściej sami musimy zadecydować, jakie warianty zmiennej wyróżnimy.

Przedstawimy procedurę konstruow ania szeregu statystycznego dla zm iennych typu skokowego i ciągłego. Zilustrujem y to odpow iednim i przykładam i.

P rz y k ła d 2.1

Z m ie n n a ty p u sk okow ego

P rzeprow adzono analizę wielkości gospodarstw dom owych w populacji Z w 2003 roku. W ylosowano w tym celu 50 gospodarstw i zebran o inform acje o liczbie osób. Po uporządkow aniu ich rosnąco uzyskano podany niżej szereg statystyczny, zaw iera­ jący indywidualne d ane o każdej jednostce, k tó rą jest gospodarstw o dom ow e. S zereg ta k i nazyw am y szereg iem szczegółow ym .

G ospodarstw a dom ow e w edług liczby osób w rodzinie (*:■): 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 8 8 9 12

Źródło: dane umowne.

Przyjm ujem y następujące oznaczenia:

X - obserw ow ana zm ienna, k tó rą w danym przypadku jest liczba osób w rodzinie, Xj - w artość zm iennej przyporządkow anay-tej jednostce statystycznej.

T utaj jest to liczba osób w y-tym gospodarstw ie domowym. Na przy k ład ,; = 3 oznacza trzecie w kolejności gospodarstw o o liczbie o só b x 3 = 1; n - liczebność popu ­ lacji; n = 50, a z a te m ; = 1, 2, ..., 50.

W szeregu szczegółowym p o dane są w praw dzie indywidualne inform acje, ale na ich podstaw ie tru d n o jest sform ułow ać syntetyczną charakterystykę badanej zbio­ rowości. O braz byłby jeszcze mniej wyraźny, gdyby liczba obserwacji była jeszcze więk­ sza, a tym bardziej gdybyśmy chcieli porów nać wielkość gospodarstw domowych na przykład w m ieście i na wsi. Przeprow adzim y więc grupow anie gospodarstw we­ dług liczby osób. O trzym ujem y wówczas sze reg ro zd zielczy p u n k to w y lub p rz e ­ d ziałow y, który składa się z dwóch kolum n. W jednej wyróżniono w arianty zm ien­ nej, a w drugiej przyporządkow ane im liczebności. Punktow y szereg rozdzielczy gospodarstw domowych w edług liczby osób pod an o w tablicy 2.6.

Tabela 2.6. Gospodarstwa domowe według liczby osób w populacji Z - szereg rozdzielczy punktowy

Xj - liczba osób fi - liczba

w gospodarstwie gospodarstw domowym domowych 1 13 2 12 3 10 4 9 5 i więcej 6 k Z / , 50

Jeśli uwzględnimy wszystkie w artości zm iennej, to uzyskamy szereg, w którym dla jc6, jc7, jc10, jc,, otrzym ujem y liczebności ( f ) równe zeru. Przyjm ujem y klasę zbiorczą (jc5) określoną jak o „5 i więcej osób w rodzinie”. k

O gólną liczebność populacji n = 50 uzyskujemy jak o H f , , gdzie k oznacza liczbę wariantów zm iennej.

W przypadku szeregu, w którym uw zględniono wszystkie w artości zm iennej, jest ich k = 12, a w szeregu z klasą zbiorczą jest ich k = 5.

Przykład 2.2

Z m ien na typu ciągłego

W przeprow adzonej analizie oprócz wielkości gospodarstw dom owych w p o p u la­ cji Z w 2003 roku w zięto również pod uwagę wysokość docho du przypadającego na jed n ą osobę (zm ienna

O trzym ano następujące d ane statystyczne:

1,65 1,50 2,10 1,25 2,32 1,78 1,90 1,15 1,45 1,70 1,65 1,50 2,15 1,30 2,36 1,80 1,94 1,15 1,45 1,76 1,70 1,50 2,18 1,35 2,40 1,80 1,98 1,20 1,46 1,60 1,70 1,50 2,20 1,40 2,50 1,84 2,00 1,20 1,48 1,62 1,72 1,51 2,30 1,40 2,55 1,84 2,10 1,24 1,48 1,64

Po uporządkow aniu pow stał następujący szereg szczegółowy gospodarstw d o m o ­ wych w edług wysokości dochodu przypadającego n a je d n ą osobę (jc;):

1,15 1,45 1,60 1,78 2,10 1,15 1,45 1,62 1,80 2,15 1,20 1,46 1,64 1,80 2,18 1,20 1,48 1,65 1,84 2,20 1,24 1,48 1,65 1,84 2,30 1,25 1,50 1,70 1,90 2,32 1,30 1,50 1,70 1,94 2,36 1,35 1,50 1,70 1,98 2,40 1,40 1,50 1,72 2,00 2,50 1,40 1,51 1,76 2,10 2,55

W celu lepszego ukazania prawidłowości występujących w rozkładzie liczebności gospodarstw ze względu n a wysokość dochodów skonstruujem y szereg rozdzielczy. W przypadku zm iennej typu ciągłego, k tó ra m oże przyjąć każdą w artość z danego przedziału liczbowego, obszar jej zm ienności m usi być podzielony na odcinki, k tó re nazywać będziem y przedziałam i klasowymi lub klasam i.

M usimy podjąć decyzję, ile będzie tych przedziałów lub, co jest rów noznaczne, ja k a b ędzie długość przed ziału . W ygodnie je st, jeśli długości te są jed n ak o w e. W literaturze podaw ane są procedury, w edług których m ożna ustalić liczbę

przedzia-(2 .4 ) tów klasowych lub określić ich długość. A. Iwasiewicz i Z. P aszek17 proponują nastę­ pujące postępow anie:

1. liczbę przedziałów klasowych k ustalam y w edług wzoru:

k' = 1 -t- 3,3 * lg/7 (2 .2 )

0,5 • yfn < k < J n (2 .3 ) W arto ść k uzyskujemy, zaokrąglając k' do najbliższej liczby całkowitej.

2. ustalam y długość przedziału jako:

_ R l ~ k

gdzie:

x mi„ - m inim alna w artość zm iennej X

*maks - m aksym alna w artość zm iennej X

W przykładzie 2.2, odnoszącym się do rozkładu liczebności gospodarstw dom o­ wych, otrzym ujem y:

k' = 1 -t- 3,3 • lg 50 = 1+3^3 -1,699= 6,61,

V50 = 7,07, 0,5-750 = 0,5-7,07 = 3,54.

L iczba przed ziałó w klasow ych pow inna m ieścić się w p rzedziale liczbowym 3,54 < k < 7,07. B iorąc p o d uwagę w artość k! = 6,61, powinniśm y przyjąć k = 7 prze­ działów klasowych o długości obliczonej zgodnie ze w zorem (2.4) jako:

i = 2 ^ = ] A 1 7

Przedziały klasowe zapiszem y w sposób podany w tablicy 2.7. D olną granicę pierw­ szego p rzedziału przyjm iem y jak o x*mi = 1,0 [tys. zł]. G ranice przedziałów klasowych ustalam y tak, że górna granica klasy poprzedniej jest rów na dolnej granicy klasy n a­ stępnej. Aby uniknąć problem ów przy zaliczaniu jed n o stek do klas, musimy przyjąć jednoznaczne kryterium . D o danego przedziału zaliczać będziem y jednostki, dla któ­

rych zaobserw ow ane w artości zm iennej spełniają w arunek:

x f < x t < x f (2 .5 ) gdzie:

x f - d o ln a granica /-tego przedziału klasowego, x f - górn a granica /-tego przedziału klasowego.

Przyjęte przedziały są lew ostronnie dom knięte i praw ostronnie otw arte.

W kolum nie (1) tablicy 2.7 podano przedziały, których długość i = 0,2 [tys. zł]. Z godnie z przyjętą p ro c e d u rą szereg pow inien sk ład ać się z 7 przedziałów , ale w rozważanym przykładzie klasyfikacja nie będzie zupełna. O statni przedział [2,2-2,4) nie pozwala bowiem uwzględnić 3 gospodarstw o najwyższych dochodach. D latego ponownie ustalam y liczbę przedziałów klasowych, przyjm ując x ^ m = 1,0 [tys. zł], a *maks = 2,6 [tys. zł].

Wówczas k - ^ = 0,24 [tys. zł]. W kolum nie (2) po d an o nowe p rze­ działy klasowe. W kolum nie (4) w artości zm iennej przyporządkow ane poszczegól­ nym przedziałom . K olum na (5) zaw iera ich liczebności.

Tablica 2.7. Empiryczny rozkład liczebności gospodarstw domowych według wysokości dochodu przypadającego na jedną osobę w województwie Z w 2003 roku

X, Przedziały Xj - zaobserwowane wartości zmiennej X f

(1) (2) (3) (4) (5) 1,0-1,2 1,00-1,24 1,00 <*,<1,24 1,15 1,15 1,20 1,20 4 1,2-1,4 1,24-1,48 1,24 <jc, <1,48 1,24 1,25 1,30 1,35; 1,40; 1,40; 1,45; 1,45; 1,46 9 1,4-1,6 1,48-1,72 1,48 <x, <1,72 1,48 1,64 1,48 1,65 1,50 1,65 1,50; 1,50; 1,50; 1,51; 1,60; 1,62; 1,70; 1,70; 1,70 15 1,6-1,8 1,72-1,96 1,72 <Xi <1,96 1,72 1,76 1,78 1,80; 1,80; 1,84; 1,84; 1,90; 1,94; 9 1,8-2,0 1,96-2,20 1,96 <xt <2,20 1,98 2,00 2,10 2,10; 2,15; 2,18 6 2,0-2,2 2,20-2,44 2,20 <x, <2,44 2,20 2,30 2,32 2,36; 2,43 5 2,2-2,4 2,44-2,68 2,44 <Xj <2,68 2,50 2,55 2 Suma: 50 Źródło: dane umowne.

W szereg u rozdzielczym przedziało w ym wartości zm iennej podane są jak o prze­ działy. O pisując prawidłowości w ystępujące w rozkładzie liczebności za pom ocą róż­ nych charakterystyk nazywanych dalej m iaram i, będziem y m usieli posłużyć się jed n ą tylko liczbą, która rep rezen tu je d an ą klasę. R ep re zen tan te m przedziału klasowego jest jego środek. Obliczam y go jak o średnią arytm etyczną dolnej i górnej granicy.

Skonstruow any szereg rozdzielczy gospodarstw dom owych w edług wysokości dochodu w raz ze środkam i przedziałów pod an o w tablicy 2.8. Z am ieszczono tam

rów nież liczebności w postaci bezwzględnej ( / ) , jak o częstości względne ( f ‘) zdefi­ niow ane w zorem (2.1) oraz w w yrażaniu procentow ym ( f- -100% ).

Tablica 2.8. Rozkład liczebności (szereg rozdzielczy) gospodarstw domowych według wysokości dochodu

*/ f f i f l 100% 1,00-1,24 4 1,12 0,08 8,0 1,24-1,48 9 1,36 0,18 18,0 1,48-1,72 15 1,60 0,30 30,0 1,72-1,96 9 1,84 0,18 18,0 1,96-2,20 6 2,08 0,12 12,0 2,20-2,44 5 2,32 0,10 10,0 2,44-2,68 2 2,56 0,04 4,0 Suma 50 X 1,00 100

Źródło: dane umowne.

M ożem y zastanaw iać się, ile gospodarstw domowych posiada dochody niższe od górnej granicy przedziału klasowego. W celu uzyskania odpow iedzi musimy skum u­ lować przedziały klasowe i zsum ow ać liczebności odpow iednich przedziałów klaso­ wych. Sumy te są przyporządkow ane górnym granicom klas.

Skum ulow ane liczebności oznaczam y jak o c u m /. Symbole / oraz c u m / ozna­ czają odpow iednio liczebności bezw zględne, a sym bole / / oraz c u m /' liczebności w zględne (częstości). Skum ulow any szereg gospodarstw domowych według wysoko­ ści d o chodu przedstaw iono w tablicy 2.9.

Tablica 2.9. Skumulowane liczebności gospodarstw domowych według wysokości dochodu

x f cum / c u m /' / ' • 100% 1,24] 4 0,08 8 (-<»; 1,48] 13 0,26 26 (-°°; 1,72] 28 0,56 56 H ° ; 1,96] 37 0,74 74 (—°°; 2,20] 43 0,86 86 (-<»; 2,44] 48 0,96 96 (-« ; 2,68] 50 1,00 100

W dokumencie Podstawy statystyki (Stron 28-34)