• Nie Znaleziono Wyników

Podstawy statystyki

N/A
N/A
Protected

Academic year: 2021

Share "Podstawy statystyki"

Copied!
208
0
0

Pełen tekst

(1)

im. Andrzeja Frycza Modrzewskiego

Jolanta Kurkiewicz, Marcin Stonawski

Podstawy statystyki

(2)

Klemens Budzowski, Andrzej Kapiszewski, Jacek Majchrowski, Zbigniew Maciąg

Recenzja:

Prof, dr hab. Andrzej Iwasiewicz

Redaktor prowadzący: Halina Baszak Jaroń

Adiustacja i korekta: Mariusz Warchol

Copyright© by Krakowska Szkoła Wyższa im. Andrzeja Frycza Modrzewskiego Kraków 2005

ISBN 83-89823-95-0

Żadna część tej publikacji nie może być powielana ani magazynowana w sposób

umożliwiający ponowne wykorzystanie, ani też rozpowszechniana w jakiejkolwiek formie za pomocą środków elektronicznych, mechanicznych, kopiujących, nagrywających i innych, bez uprzedniej pisemnej zgody właściciela praw autorskich

Na zlecenie:

Krakowskiej Szkoły Wyższej im. Andrzeja Frycza Modrzewskiego www.ksw.edu.pl

Wydawca:

Krakowskie Towarzystwo Edukacyjne sp. z o.o., Oficyna Wydawnicza AFM, Kraków 2005

Skład i łamanie: Wojciech Prażuch

(3)

W stęp...7

Jolanta Kurkiewicz Rozdział 1. Podstawowe pojęcia i problemy...11

1.1. Statystyka jako nauka...11

1.2. Zbiorowości, jednostki, cecha statystyczna... 15

1.3. Typy prawidłowości... 21

Jolanta Kurkiewicz Rozdział 2. Opracowanie materiału statystycznego... 27

2.1. Grupowanie statystyczne... 27

2.1.1. Grupowanie jednostek według cech jakościowych... 27

2.1.2. Grupowanie według cech ilościowych (zmiennych)... 31

2.1.3. Grupowanie wielocechowe... 37

2.2. Prezentacja graficzna szeregów statystycznych... 39

Marcin Stonawski Rozdział 3. Charakterystyki opisowe rozkładu liczebności... 45

3.1. Miary położenia...46

3.1.1. Średnia arytmetyczna...46

3.1.2. Średnia geometryczna... 51

3.1.3. Średnia harmoniczna...53

3.1.4. Przeciętne pozycyjne...54

3.2. Miary zmienności (rozproszenia)...65

3.2.1. Rozstęp...66

3.2.2. Odchylenie przeciętne...68

3.2.3. Wariancja i odchylenie standardowe... 71

3.2.4. Współczynnik zmienności...75

3.3. Miary asymetrii...76

3.4. Miary koncentracji...80

Marcin Stonawski Rozdział 4. Analiza współzależności zjawisk...85

4.1. Wprowadzenie...85

4.2. Współczynnik korelacji liniowej Pearsona...89

(4)

4.4. Współczynnik korelacji wielorakiej...98

4.5. Współczynnik korelacji rang S pearm ana...100

4.6. Analiza regresji...104

4.7. Miary dobroci dopasowania funkcji regresji do danych empirycznych... 110

4.8. Uproszczona metoda najmniejszych kwadratów...114

4.9. Uwagi o regresji wielu zmiennych... 116

Marcin Slonawski Rozdział 5. Analiza szeregów czasowych...119

5.1. Szereg czasowy i jego składniki... 119

5.2. Indywidualne miary dynamiki... 121

5.2.1. Przyrosty... 121

5.2.2. Indywidualne indeksy dynamiki... 124

5.2.3. Indeksy agregatowe... ... 126

5.3. Metody wyodrębniania tren d u ... 132

5.3.1 Mechaniczne metody wyodrębniania tren d u ...132

5.3.2 Analityczne metody wyodrębniania trendu...137

5.4. Analiza wahań okresowych... 143

Jolanta Kurkiewicz Rozdział 6. Podstawy rachunku prawdopodobieństwa... 149

6.1. Zmienna losow a... 149

6.2. Parametry rozkładu prawdopodobieństwa zmiennej losowej... 155

6.3. Wybrane rozkłady prawdopodobieństwa zmiennej losowej... 158

6.3.1. Podstawowe rozkłady prawdopodobieństwa zmiennej typu skokowego... 158

6.3.2. Wybrane rozkłady zmiennej losowej typu ciągłego... 160

Jolanta Kurkiewicz Rozdział 7. Podstawy wnioskowania statystycznego... 169

7.1. Podstawowe statystyki z próby i ich rozkłady...169

7.2. Estymacja jako metoda indukcyjnego wnioskowania statystycznego... 174

7.2.1. Estymatory i ich własności...174

7.2.2. Estymacja punktowa...177

7.2.3. Estymacja przedziałowa...179

7.3. Weryfikacja hipotez jako metoda indukcyjnego wnioskowania statystycznego....190

7.3.2. Weryfikacja hipotez o wartości przeciętnej w populacji generalnej... 192

7.3.2. Weryfikacja hipotezy o wariancji w populacji generalnej...199

7.3.4. Weryfikacja hipotez w zakresie badania związków między zjawiskami...203

L iteratura...207

Spis tab el... 208

(5)

Studenci, podejm ując studia n a w ybranym kierunku i zapoznając się z ich p ro ­ gram em , często zastanaw iają się, w jakich sytuacjach będzie im przydatna wiedza z zakresu dyscyplin naukowych w ystępujących w planie studiów. Przem yślenia te o d ­ noszą się również d o statystyki. W podręczniku przedstaw im y wzorcowe przykłady odnoszące się do sytuacji, w których posiadanie w iadom ości z tego zakresu m oże okazać się użyteczne.

W ybierając kierunek studiów , zastanaw iam y się, ja k a jest szansa znalezienia d o ­ brej pracy oraz jakich zarobków m ożem y oczekiwać po zdobyciu wyższego wykształ­ cenia. Kierownictwo telewizji w celu pozyskania jak najszerszej widowni obserw uje oglądalność em itowanych program ów . B adania opinii publicznej dostarczają infor­ macji między innymi o tym, ilu widzów ogląda program y inform acyjne, sportow e, publicystyczne, jaka jest oglądalność filmów akcji, kom edii, dram atów , w jakich go­ dzinach widownia jest największa, jak ie są preferencje widzów w zależności od w ie­ ku, wykształcenia, aktywności zawodowej, m iejsca zam ieszkania. P rojek tan ci dom u mody pracują nad nową kolekcją, k tó rą b ęd ą chcieli w prow adzić na rynek w n ad ch o ­ dzącym sezonie. D ział m arketingu przeprow adza więc b ad an ia m ające n a celu u sta ­ lenie zapotrzebow ania, biorąc p o d uwagę, iż na wydatki n a odzież, oprócz gustów, preferencji i mody, m ają wpływ takie czynniki jak: poziom dochodów , wiek, płeć, wykształcenie przyszłych nabywców. K lient banku zw raca się d o swojego doradcy o inform ację, jak najlepiej zainw estow ać p o siadane środki finansow e. D o ra d ca m usi wziąć pod uwagę obecny i przewidywany poziom inflacji, okres, na jaki klient decy­ duje się zainwestować swoje środki. P lanujem y zakup m ieszkania i decydujem y się zaciągnąć kredyt. R ozpatrując w niosek o jego przyznanie, b an k w ym aga d ostarcze­ nia inform acji o poziom ie dochodów , stanie zadłużenia, udzielonych i spłaconych dotychczas kredytach, w ieku oraz stanie rodzinnym klienta. D a n e te są n iezbędne do ustalenia zdolności kredytowej k lien ta o raz w łasnego ryzyka kredytow ego.

W podanych przykładach zaprezento w ano różne obszary rzeczywistości. S tud en t interesuje się przyszłą sytuacją na rynku pracy. B ank grom adzi d an e o swoich klien­ tach, aby na tej podstaw ie podejm ow ać decyzje w celu zaspokojenia ich po trzeb oraz

(6)

zapew nić sobie niezakłócone funkcjonow anie. D ział m arketingu prowadzi badania rynku, aby zapew nić zbyt produkow anych wyrobów.

W e wszystkich tych przypadkach, chcąc uzyskać odpow iedź na postaw ione pyta­ nia, m usim y zebrać odpow iednie inform acje. B ędą to obszerne zbiory danych w p o ­ staci liczb. Liczby te odzw ierciedlają istotne cechy obserwowanej rzeczywistości. Z gro­ m adzone dane m uszą być p od d an e analizie. W tym właśnie zakresie pom ocne będą m etody statystyczne.

Podręcznik zatytułow any „Podstaw y statystyki” jest przeznaczony dla studentów, którzy w przyszłej pracy b ędą podejm ow ać tego rodzaju decyzje. Problem atykę ujęto w siedm iu rozdziałach.

W rozdziale 1 zaprezentow ano statystykę jak o naukę. Z definiow ano podstaw o­ we pojęcia, takie jak: zjawiska i procesy masowe, zespół przyczyn głównych i przy­ padkow ych oraz generow any przez nic systematyczny i przypadkowy składnik b ad a­ nych procesów . P rzedstaw iono podstaw ow e typy praw idłow ości, na które należy zw racać uwagę, obserw ując zjawiska masowe.

R ozdział 2 pośw ięcono praktycznym zagadnieniom opracowywania m ateriału statystycznego. P rzedstaw iono zasady grupow ania oraz otrzym ywane jako rezultat szeregi statystyczne. O m ów iono m etody prezentacji danych w form ie tabelarycznej i graficznej. Z w rócono uwagę na znaczenie tych prac w kontekście adekwatności uzy­ skanych wyników do badanej rzeczywistości.

K olejne trzy rozdziały są pośw ięcone statystycznym m etod om opisu prawidłow o­ ści występujących odpow iednio w rozkładach liczebności, we współzależności zja­ wisk oraz w dynam ice.

W rozdziale 3 om ów iono charakterystyki opisowe rozkładu liczebności mierzące przeciętny poziom cech ujm ujących b ad an e zjawiska oraz stopień ich zróżnicowania. U kazano, w jakich w arunkach w skazane jest zastosow anie om awianych charaktery­ styk oraz sposób praw idłow ego interpretow an ia otrzym anych wyników.

P rzed m iot rozdziału 4 stanow ią m etody b ad an ia związków pom iędzy zjawiskami. P rzedstaw iono zasady analizy korelacji i regresji. O graniczono się do najprostszej ich postaci a m ianow icie do pow iązań liniowych. Najwięcej uwagi poświęcono m etodom bad an ia w spółzależności między dw iem a zm iennym i. W celu zwrócenia uwagi na to, że rzeczywistość jest bardziej złożona przedstaw iono przykładow e m etody ustalania siły i kierunku pow iązań m iędzy w ielom a zm iennym i. W ykład zilustrow ano przykła­ dam i, k tó re ukazują zastosow ania om awianych p ro ced u r oraz interpretację wyników. W rozdziale 5 om ówiono m etody wykrywania prawidłowości występujących w dy­ nam ice zjawisk, czyli w ich rozwoju w czasie. R ozpoczęto od p ro ced u r o najprostszej konstrukcji, a m ianowicie od indeksów indywidualnych, a następnie wprow adzono indeksy agregatow e. Przedstaw iono m echaniczne i analityczne m etody w yodrębnia­ nia tren du. W skazano zakres praktycznego wykorzystania wiedzy o tendencji rozwo­ jowej badanych zjawisk.

P rzedstaw iony wyżej zakres podręcznika (rozdziały 2 -5 ) poświęcony jest wnio­ skow aniu m eto d ą dedukcyjną. Gdybyśmy zatrzym ali prezentację m etod statystycz­

(7)

nych na tym etapie, podręcznik m iałby postać zbioru przepisów prezentujących, jakie czynności należy wykonać, aby ustalić na przykład przew idyw ane śred nie zarobki absolwentów uczelni ekonom icznej. D latego w rozdziale 6 wyłożono podstaw y ra ­ chunku praw dopodobieństw a. B adanie statystyczne m usi opierać się n a rachunku praw dopodobieństw a, poniew aż jeśli form ułujem y sądy o praw idłow ości w yprow a­ dzone z niepełnej inform acji pochodzącej z próby statystycznej, to prawdziwość tych sądów jest obciążona niepew nością. N iezbędne są zatem takie reguły postępow ania, które pozwolą przyjąć odpow iednio wysokie praw dopodobieństw o prawdziwości na­ szych wniosków lub niskie praw dopodobieństw o wniosków fałszywych. W wykładzie ograniczono się tylko do zm iennych losowych, przyjm ując, że ra ch u n ek p raw d o p o ­ dobieństw a zdarzeń losowych studenci poznali już w szkole średniej.

R ozdział 7 jest w stępem do wnioskow ania statystycznego. I na tym w stępie pozo­ stajemy. Najpierw przedstaw iono zasady estym acji param etró w a n astęp n ie weryfi­ kację hipotez statystycznych. O graniczono się tylko do dwóch podstawowych p a ra ­ m etrów, a mianowicie do w artości przeciętnej i wariancji.

***

Podręcznik „Podstawy statystyki” został opracow any z myślą o stud entach przy­ gotowujących się do prow adzenia b adań em pirycznych w zakresie nauk sp ołecz­ nych, do których należą również nauki ekonom iczne. Jest adresow any do stud iują­ cych na takich kierunkach, jak na przykład: zarządzanie, ekonom ia, nauki polityczne, stosunki m iędzynarodow e. Z ostał on przygotow any w taki sposób, aby m ógł stanow ić pom oc zarów no do wykładów, jak i ćwiczeń ze statystyki. A utorzy pom yśleli rów nież o tych, którzy sam odzielnie chcieliby poznać zasady b ad ań zjawisk ekonom iczno- społecznych z zastosow aniem m etod statystycznych. Z myślą o nich p o d an e zostały liczne przykłady ukazujące zastosow anie om awianych procedur.

(8)

pojęcia i problemy

l

1.1. Statystyka jako nauka

W prow adzenie pojęcia statystyki jako nauki rozpoczniem y od przykładu z z a k re­ su dem ografii'. Przedm iotem b adań dem ograficznych są m iędzy innym i zachow ania m atrym onialne. Zachow ania te są rezultatem podjęcia życiowych decyzji p o p rz ed zo ­ nych przem yśleniam i. Człowiek, najczęściej m łody, będący w stanie wolnym m oże stawiać sobie następujące pytania:

• czy kiedykolwiek w życiu chcę zawrzeć związek m ałżeński? • jeśli tak, to w jakim okresie życia chciałbym to uczynić?

• jakie warunki powinny być spełnione, aby zdecydować się na zaw arcie m

ał-Poszczególne osoby udzielają sobie różnych odpow iedzi i podejm ują indyw idual­ ne decyzje. W podanym przykładzie istotne jest to, że m ałżeństw o jest zdarzeniem , którego realizacja jest w znacznym zakresie wynikiem indywidualnych przem yśleń i decyzji. Zajście tego zdarzenia je st udokum entow ane odpow iednim aktem , a zatem m oże podlegać rejestracji. R ozpatryw ać będziem y tylko pierw sze m ałżeństw a kobiet, czyli te związki, k tóre m ogą zawrzeć tylko panny. Jeśli będziem y rozpatryw ać w yod­ rębnioną w ten sposób zbiorow ość kobiet, to powiemy, że interesujem y się zjawi­ skiem, którym jest zaw ieranie pierwszych m ałżeństw . O kazuje się bowiem , że indy­ widualne zachowania posiadają w spólne cechy możliwe do wykrycia tylko na poziom ie populacji. Podejm iem y zatem bad an ia w celu poznania cech charakteryzujących za­ w ieranie pierwszych m ałżeństw w w yodrębnionej zbiorowości kobiet.

Przystępując do badań, posiadam y już pew ne wiadom ości pochodzące albo z o b ­ serwacji zachowań ludzkich w tej m aterii, albo z nagrom adzonej wcześniej wiedzy. W iadom o na przykład, że nie wszystkie kobiety w stępują w związki m ałżeńskie oraz

żeństwa?

(9)

że związki te zaw ierane są w znacznej większości w ustalonym okresie życia zwanym w dem ografii w iekiem m atrym onialnym . M ożem y zapytać:

1) ja k a w danej populacji jest częstość zaw ierania m ałżeństw przynajm niej raz w życiu,

2) jak zm ienia się częstość zaw ierania m ałżeństw w zależności od wieku, 3) jakie uw arunkow ania i w jaki sposób wpływają na zachow ania w zakresie

zaw ierania m ałżeństw i ich zróżnicowanie.

Jako przykładow e odpow iedzi m ożem y podać następujące charakterystyki, które należy traktow ać jak o um ow ne, poniew aż nie odnoszą się do żadnej istniejącej zbio­ rowości:

(1) C zęstość zaw ierania m ałżeństw w pewnej zbiorow ości kobiet wynosi 0,9. O znacza to, że 90% spo śró d nich zaw iera m ałżeństw o przynajm niej raz w życiu.

(2) Pierwsze związki m ałżeńskie są najczęściej zaw ierane przez kobiety w wieku 23 lat.

(3) Decyzja o zawarciu m ałżeństw a jest o d kład ana aż do osiągnięcia wykształce­ nia przynajm niej średniego, uzyskania stałej pracy, pozwalającej zapewnić rodzinie w arunki życia na odpow iednim poziom ie.

O dpow iedzi (1) i (2) m ają p ostać liczbową, b ędą przez wszystkich jednakow o rozum iane. O dpow iedź (3) m a ch a rak ter werbalny. M oże być zatem różnie in terp re­ tow ana. N ajbardziej jednoznaczna je st odpow iedź „uzyskanie przynajm niej średnie­ go w ykształcenia”. M niej jednoznaczne m oże być rozum ienie pojęcia „stała p raca”. N ajbardziej zróżnicow anie będzie pojm ow ane „zapew nienie rodzinie odpow iednie­ go poziom u życia”. W celu uzyskania bardziej obiektywnej interp retacji będziem y się starać przypisać tym pojęciom charakterystyki liczbowe.

In teresu jem y się zjaw iskiem (zaw ieranie m ałżeństw ) obserw ow anym w zbio­ rowości (w populacji) kobiet i staram y się wykryć jego istotne cechy. Jeśli p otrafi­ my rozw ażane zjawisko scharakteryzow ać za pom ocą liczb, to m ożem y posłużyć się m etodam i określanym i m ianem statystycznych. M etody te stanow ią przedm iot sta­ tystyki.

Statystyka jest nau k ą o ilościow ych m e to d a c h b a d a n ia praw id ło w o ści w ystę­ p u ją c y c h w zjaw isk a ch m aso w y c h sc h a ra k te ry z o w a n y c h za p o m o c ą liczb2.

N iektóre pojęcia w ystępujące w sform ułow anej wyżej definicji wymagają wyja­ śnienia. Przedstaw im y je teraz kolejno.

M e to d a jest to sposób postępow ania prowadzący do osiągnięcia wyznaczonego celu. P rzeprow adzając bad an ia naukow e, musimy zdawać sobie sprawę, że nie każde postępow anie jest dopuszczalne. Istnieją kryteria, k tóre umożliwiają ocenę, czy dane

(10)

postępow anie m ożna określić m ianem m etody naukow ej. U stalanie tych kryteriów wchodzi między innymi w zakres filozofii, a dokładniej m ieści się w ram ach ontologii (filozofia bytu) oraz epistem ologii, czyli teorii poznania.

Jako prawidłow ość rozum ieć będziem y względnie trw ałe relacje charakteryzu ją­ ce badane zjawisko. Gdyby relacje te miały ch a rak ter trwały, to mówilibyśmy o p ra ­ wach. T ak jest na przykład w przypadku praw a pow szechnego ciążenia lub praw a Archim edesa. R ozróżnienie praw a i prawidłow ości łączy się przede wszystkim z m oż­ liwością kontrolow ania czynników wpływających na kształtow anie się b adan ego zja­ wiska. Możliwość tej kontroli jest znacznie w iększa w naukach przyrodniczych niż w społecznych. W naukach społecznych najczęściej rozpatrujem y praw idłow ości3.

Wcześniej podaliśmy przykład mówiący, jakim i prawidłowościami charakteryzuje się zawieranie pierwszych małżeństw. T eraz wyjaśnimy, na czym polega w zględna trw a­ łość badanego zjawiska. N a rysunku 1.1 przedstaw iono liczbę pierwszych m ałżeństw według wieku zawartych przez kobiety w Polsce w roku 1976 i 2002 przeliczonych na

1000 kobiet w danej grupie wieku.

Rys. 1.1. Zawieranie pierwszych małżeństw wśród kobiet w Polsce w roku 1976 i 2002 Źródło: opracowanie własne na podstawie danych pochodzących z www.stat.gov.pl

Na uwagę zasługują następujące cechy:

• krzywe ilustrujące zaw ieranie związków m ałżeńskich w zależności od wieku kobiet m ają charakterystyczny kształt; m ożna wskazać wiek, k tó rem u przy­ pisana jest najwyższa częstość w stępow ania w związek m ałżeński (20-24 lata),

(11)

• krzywe te m ają podobny kształt w obydwu porównywanych latach kalenda­ rzowych,

• w 2002 roku obniżyła się częstotliwość związków zawieranych przed 30 ro­ kiem życia, a wzrosła po przekroczeniu tego wieku w porów naniu do 1976 roku.

N iek tó re charakterystyki w stępow ania w związki m ałżeńskie nie zm ieniły się (kształt krzywej), a inne uległy przem ianom i dlatego mówimy tylko o względnej trwa­ łości zachow ań m atrym onialnych.

D la ujaw nienia przedstaw ionych prawidłow ości konieczne jest posiadanie dużej liczby obserwacji. Tylko w takiej sytuacji mogliśmy wykreślić krzywe ilustrujące za­ w ieranie pierwszych m ałżeństw w edług wieku kobiet przedstaw ione na rysunku 1.1. Zjaw iska takie określam y m ianem masowych.

Prawidłowości obserwowane w zjawiskach masowych kształtują się w efekcie od­ działywania dwóch grup przyczyn. Jed n ą stanowią przyczyny główne, a drugą uboczne. P rzyczy n y g łó w n e oddziałują w sposób jednokierunkow y i spraw iają ujawnienie się prawidłow ości. K ształtują tak zwany składnik sy stem aty cz n y zjaw iska m asow e­ go. Jest to charakterystyczna dla niego prawidłowość.

D ążąc do określenia zespołu przyczyn głównych w przypadku zaw ierania m ał­ żeństw, należy wziąć pod uwagę uw arunkow ania biologiczne, społeczne oraz trady­ cję. Ł ączenie się ludzi w pary dla stw orzenia w arunków do wydania na świat i wycho­ w ania potom stw a pojawiło się na pew nym etap ie rozwoju ludzkości. Później nadano tem u związkowi c h a ra k te r form alno-praw ny. O k res życia, w którym m ałżeństw a są zaw ierane pozostaje w związku ze zdolnością rozrodczą gatunku ludzkiego. N aj­ wyższa częstość związków p rzypada na ten wiek, w którym zdolność ta jest naj­ wyższa. C zęstość zaw ierania m ałżeństw kształtuje się w znacznej m ierze pod wpły­ w em społecznej oceny przypisywanej stanow i w olnem u (szczególnie kawalerskiem u i panieńskiem u). Jeśli ocena ta jest niska, to częstość m ałżeństw jest wysoka i na odw rót.

P rzy czy n y u b o c z n e występują w dużej ilości i działają różnokierunkow o. T rak­ tujem y je jak o szeroko rozum iane uw arunkow ania środowiskowe. W obserwowanej zbiorow ości wywołują one odchylenia od prawidłowości. O dchylenia te ujawniają się w indywidualnych przypadkach. R ezu ltatem oddziaływania przyczyn ubocznych jest p rz y p a d k o w y s k ła d n ik zjaw isk a m asow ego.

W odniesieniu do zaw ierania m ałżeństw , jak o rezultat oddziaływania przyczyn ubocznych m ożna na przykład in terp retow ać odchylenie wieku, w jakim była dana osoba w m om encie pierw szego m ałżeństw a od wieku, w którym związki te są zawie­ ran e najczęściej. O dchylenie to jest rezultatem oddziaływania wielu czynników czę­ sto trudnych do określenia.

Z ad an iem statystyki jest dostarczenie odpow iednich m etod, które prowadzą do liczbowego oszacow ania zarów no składnika system atycznego, jak i przypadkowego rozpatryw anego zjawiska masowego.

(12)

1.2. Zbiorowości, jednostki, cecha statystyczna

Zjawiska masowe są obserw ow ane w zbiorow ościach nazywanych również p o p u ­ lacjami. Jednym z w arunków popraw ności wniosków sform ułow anych w rezultacie przeprow adzonych badań, to znaczy ich adekw atności do b adanej rzeczywistości, jest między innymi: dokładne zdefiniow anie populacji, w której realizuje się zjawisko, jednoznaczne przyporządkow anie jej jed n o stek oraz ustalenie cech kwalifikujących.

W badaniach statystycznych istotne znaczenie m a w yodrębnienie zbiorowości (populacji) generalnej. „Z b io ro w o ść g e n e ra ln a albo p o p u la c ja g e n e ra ln a jest to zbiór obiektów m aterialnych lub potencjalnych pow tórzeń zjawiska, który jest p rz ed ­ m iotem zainteresow ań badacza. P o d d an a badaniu zbiorow ość musi być jed n o ro d n a ze względu na cechy k w a lifik u ją c e ”4.

Chcemy określić wiek kobiet w chwili pierwszego m ałżeństwa zaw artego w Polsce w 2002 roku. Spośród ogółu mieszkańców Polski interesują nas zatem tylko osoby płci żeńskiej, które pierwszy raz wstąpiły w związek m ałżeński w 2002 roku. D o populacji generalnej zaliczymy więc osoby posiadające następujące cechy kwalifikujące5:

• miejsce zam ieszkania w Polsce, • pleć żeńska,

• zawarcie pierw szego m ałżeństw a w 2002 roku.

W tak wyróżnionej zbiorow ości m ożem y przeprow adzać różne badania. N a p o ­ czątku musimy więc określić cel przedsięwzięcia. W rozważanym przypadku m oże nim być ustalenie wieku, w którym pierwsze m ałżeństw a są zaw ierane najczęściej. Wiek kobiet w chwili zawarcia pierw szego m ałżeństw a jest wówczas c e c h ą b a d a n ą . Jeśli p onad to przypuszczamy, że wiek ten jest zróżnicowany w zależności od zam iesz­ kania w mieście lub na wsi, od poziom u wykształcenia, od aktywności zawodowej itp., i chcemy sprawdzić słuszność tej hipotezy, to musimy odpow iednio rozszerzyć zbiór cech badanych. Pozwoli nam to zbadać uw arunkow ania zachow ań m atrym o­ nialnych panien zam ieszkałych w Polsce w 2002 roku.

Jeśli interesuje nas stru k tu ra wydatków gospodarstw dom owych uzyskujących dochody z pracy w województwie m ałopolskim w 2003 roku, to do populacji g en eral­ nej zaliczamy gospodarstw a dom ow e spełniające następujące w arunki (posiadające cechy kwalifikujące):

• istnieją w 2003 roku na terenie województwa m ałopolskiego, • uzyskują dochody z pracy.

C echą badaną są wydatki ponoszone w celu nabycia d ó b r i usług. Jeśli chcem y określić związek wydatków z poziom em dochodów , to dochody rów nież w ejdą do zbioru cech badanych.

4 A. Iwasiewicz, Z. Paszek, Statystyka z elementami statystycznych metod sterowania jakością, Kraków 2004.

(13)

Zbiorow ość (populacja) gen eraln a jest więc zbiorem jed n o stek nieidentycznych ze względu na b ad a n ą cechę6. Z biorow ość taką stanow ią na przykład gospodarstwa dom ow e różniące się, a więc nieidentyczne pod względem wysokości dochodów i wy­ datków.

Z b io ro w o ść (p o p u la c ja ) gen eraln a składa się z je d n o s te k staty sty czn y ch . Je d ­ nostka jest jej podstawowym elem entem . W przykładzie dotyczącym zawierania m ał­ żeństw jed n o stk ą jest kobieta. W przypadku b adania struktury wydatków jednostką jest gospodarstw o dom owe. M ożem y zatem m ieć do czynienia z jednostkam i, b ędą­ cymi zespołam i elem entów , k tóre w trakcie przeprow adzanego badania nie są trak ­ tow ane indywidualnie. G ospodarstw o składa się z osób ujmowanych w badaniach jak o jedność.

Rozważając strukturę wydatków gospodarstw domowych, możemy brać pod uwagę m iędzy innymi następujące cechy badane:

1) wydatki na w yróżnione dobra i usługi, 2) wysokość dochodów ,

3) ilość dzieci,

4) ilość pracujących osób,

5) w iek głowy gospodarstw a dom owego, 6) płeć głowy gospodarstw a dom owego,

7) w ykształcenie głowy gospodarstw a dom owego, 8) obecność osób starszych.

Cechy: wydatki na w yróżnione do b ra i usługi, wysokość dochodów , wiek głowy gospodarstw a dom ow ego, liczba dzieci i liczba pracujących osób w gospodarstwie domowym m ożna bezpośrednio wyrazić za pom ocą liczb. O kreślam y je więc m ianem c e c h ilościow ych. Nazywamy je rów nież zmiennym i. Zm ienne: liczba dzieci i liczba pracujących osób w gospodarstw ie domowym m ogą przyjąć tylko niektóre wartości z danego przedziału liczbowego. Z b ió r tych w artości jest skończony lub przeliczalny. T akie zm ienne nazywamy zm iennym i typu skokowego lub zmiennymi skokowymi (dyskretnym i).

W ydatki, dochody, w iek głowy gospodarstw a dom ow ego m ogą przyjąć każdą w artość z przedziału (0, oo). Nazywamy je z m ie n n y m i ty p u ciągłego lub zmiennymi ciągłymi. O gólnie zm ienne ciągle m ogą przyjm ować w artości z przedziału (-co, oo). W tedy zbiór ich w artości jest równoliczny ze zbiorem liczb rzeczywistych. Jest więc mocy continuum .

Inna grupę stanow ią cechy: płeć, wykształcenie głowy gospodarstw a domowego, obecność osób w starszym wieku. Nazywamy je c e c h a m i jak o ścio w y m i. Kategorie ich zostały określone w erbalnie. Z am iast opisu słownego m ożna wyróżnionym k ate­ goriom przyporządkow ać um ow ne wartości. Najłatwiej jest to uczynić w przypadku

6 Por. np.: S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Elementy teorii i zadania, Wro­ claw 1999.

(14)

wykształcenia. Poziom owi wykształcenie: podstaw ow e, średnie, wyższe m ożna o d p o ­ w iednio przyporządkow ać liczbę lat nauki. Płeć występuje w dwóch przeciwnych sta­ nach, którym m ożna um ownie przypisać w artości: 0 - m ężczyzna, 1 - k ob ieta (lub na odw rót). O becności osób w starszym wieku m ożna przyporządkow ać 1, a nieo b ec­ ność zakodow ać jako 0. M am y wówczas do czynienia ze zm ienną zerojedynkow ą.

Cechy statystyczne rozpatrujem y jak o rezultat p om iaru 7. W ykształcenie (p o d sta­ wowe, wyższe, średnie), pleć głowy gospodarstw a dom ow ego, obecność osób w s ta r­ szym wieku m ogą stanowić podstaw ę klasyfikacji gospodarstw domowych. Klasyfika­ cja jest podstaw ow ą operacją w nauce. Jest o n a p om iarem n a najniższym poziom ie. Dzielimy wówczas jednostki zbiorowości ze względu n a posiadanie cechy. Dążymy przy tym do uzyskania takiej klasyfikacji, aby w obrębie w yróżnionych kategorii zn a­ lazły się elem enty bardziej do siebie p o d obn e niż elem enty zaliczone do różnych kategorii.

Dzielimy zbiorowość gospodarstw domowych na takie, w których głową je st m ęż­ czyzna i na te, w których jest nią kobieta. Klasyfikując gospodarstw a w edług wyróż­ nionych poziom ów wykształcenia głowy gospodarstw a, wyróżnimy n a przykład trzy grupy określone przez wykształcenie podstaw ow e, śred nie i wyższe. Nazwy wyróż­ nionych kategorii są przyjm owane arbitralnie. M ogą być określone w erbalnie lub um ownie za pom ocą liczb.

S kalę najniższego p o zio m u p o m ia ru nazyw am y sk alą n o m in a ln ą . Należy zw ró­ cić uwagę na to, że na tym poziom ie pom iaru podział n a kategorie nie stanow i p o d ­ stawy do ich porządkow ania. Jeśli naw et słowne określenie kategorii zastąpim y licz­ bam i, to nadal nie upow ażnia nas to do wykonywania na nich jakichkolw iek działań arytmetycznych.

W arunkiem stosow ania p ro ced u r statystycznych jest uzyskanie klasyfikacji wy­ czerpującej oznaczającej, że każdy elem ent został zaliczony do odpow iedniej k ateg o ­ rii oraz rozłącznej, a więc takiej, w wyniku której każdy elem ent należy tylko do je d ­ nej kategorii.

Skala nom inalna jest sym etryczna i przechodnia. Symetryczność oznacza, że jeśli relacja zachodzi między A i B, to zachodzi również między B i A. N a przykład, jeśli syn jest podobny do ojca, to ojciec jest podobny do syna. P rzechodniość w ystępuje, jeśli A = B i B = C, to A = C. Jeśli Jan jest absolw entem tego sam ego uniw ersytetu, co M aria, a M aria tego sam ego, co A nna, to Ja n ukończył ten sam uniw ersytet co Anna.

W yższym p o zio m em p o m ia ru niż s k a la n o m in a ln a je s t s k a la p o rz ą d k o w a . O prócz klasyfikacji umożliwia o n a porządkow anie kategorii pod w zględem stopnia natężenia danej cechy, ale bez możliwości określenia odległości. Skala ta m oże u sta ­ lać porządek slaby lub mocny. Słabe uporządkow anie uzyskujemy, gdy dopuszczam y kryterium „mniejszy lub równy”, „większy lub równy”. T aka skala charakteryzuje się

(15)

sym etrycznością oraz przechodniością. W wypadku porządku m ocnego, wyznaczo­ nego przez nierów ność „większy niż”, „mniejszy niż” pojawia się asymetria. N a przy­ kład, jeśli Paw eł jest wyższy od P iotra, to nie m oże być na odw rót. Jeśli natom iast Jan jest wyższy od P iotra, a P io tr jest wyższy od Pawła, to Jan jest wyższy od Pawła. Skala porządkow a zawsze jest przechodnia. W skali tej m ożna elem enty porządkować, ale nie m ożna porównyw ać różnic między nimi. O znacza to, że naw et jeśli pom iar na skali porządkow ej jest wyrażony liczbowo, to podobnie jak w przypadku skali nom i­ nalnej na liczbach tych nie m ożemy wykonywać żadnych działań arytmetycznych. Skala porządkow a posiada wszystkie własności skali nom inalnej, a pon ad to możliwość po­ rządkow ania. O d skali porządkow ej m ożna przejść do nom inalnej, ale nie na odwrót. S k a la n o m in a ln a i p o rz ą d k o w a są p o m ia re m w szerszy m sen sie, k tó ry p o ­ zw ala k lasy fik o w a ć i ra n g o w a ć o b iek ty . P o m ia r w sen sie w ąsk im um ożliw ia: k la ­ sy fik o w a n ie , ra n g o w a n ie o ra z o k re śla n ie o d leg ło ści m iędzy o b iek tam i. W a ru n k i te s p e łn ia s k a la in te rw a ło w a . J e śli p o n a d to m ożliw e je s t n ie a rb itra ln e u sta le n ie p u n k tu zero w eg o , to ta k ą s k a lę n azyw am y ilo razo w ą lu b sto su n k o w ą. W tym przypadku m ożna bow iem porównywać stosunki. Przykładem skali interwałowej jest dochód gospodarstw a dom owego. R ozpatrujem y na przykład cztery gospodarstwa do­ m owe posiadające m iesięczne dochody w przeliczeniu na jed n ą osobę równe: 500 zl, 750 zł, 1500 zł i 1750 zł. M ożem y je klasyfikować i porządkow ać w edług wysokości dochodu. M ożem y porów nać różnice bezw zględne wynoszące odpow iednio: 250 zl, 750 zl, 250 zł. Mówimy, że różnica pom iędzy dochodam i pierwszego i drugiego oraz trzeciego i czw artego jest jednakow a i wynosi 250 zl. Skala, w jakiej jest m ierzony dochód, posiada n iearb itraln e zero. M ożemy więc obliczać stosunki. Powiemy wów­ czas, że dochó d trzeciego gospodarstw a jest dwa razy większy od dochodu gospodar­ stwa drugiego.

W y ró ż n io n e p o zio m y p o m ia ró w tw o rz ą sk a lę k u m u la ty w n ą . Najwyższy p o ­ ziom pom iaru posiada wszystkie własności skal poziom ów niższych. Możliwe jest scho­ dzenie z góry w dół; od najwyższego do najniższego poziom u, ale nie na odwrót. D ochody w yrażone w skali interw ałow ej (ilorazow ej) m ożem y zastąpić rangam i o d ­ pow iednio: 500 zł - 1; 750 zł - 2; 1500 zł - 3; 1750 zl - 4 (skala porządkow a) albo kategoriam i: 500 zł - dochód niski; 750 zł - dochód średni; 1500 zl - dochód wysoki; 1750 zł - dochód bardzo wysoki (skala nom inalna).

R ozw ażane dotychczas określenia i definicje (jednostka, cecha) odnosiliśmy do populacji generalnej. Jeśli jed n ak chcemy zbadać prawidłow ość charakteryzującą in­ teresujące nas zjawisko, to nie m usimy obserwować wszystkich jednostek. Możemy uzyskać zadow alające rezultaty, ograniczając się do b ad an ia w yodrębnionego w o d ­ pow iedni sposób podzbioru populacji generalnej. T e n p o d z b ió r nazyw am y zb io ro ­ w ością (p o p u la c ją ) p ró b n ą lu b k ró tk o - p ró b ą . W tym m iejscu należy zwrócić uwa­ gę na to, że przedm iotem zainteresow ania jest prawidłowość w zbiorowości generalnej i to o n a podlega obserwacji. P róba musi być więc w ybrana w odpow iedni sposób. Najogólniej rozróżniam y dobór celowy i losowy. W przypadku d o b o ru celow ego prze­ prow adzający bad an ia decyduje, k tó ra jed n o stk a wejdzie w skład próby. D o b ó r je s t

(16)

losowy, jeśli to przypadek decyduje o tym, który elem ent d o stan ie się do próby. T aką próbę nazywamy pró b ą losową lub p ró b ą statystyczną8. P róbę tę poddajem y bad aniu statystycznemu, a na podstaw ie uzyskanych rezultatów w nioskujem y o praw idłow o­ ści w populacji generalnej.

W nioskowanie o prawidłow ości w populacji generalnej na podstaw ie próby sta­ tystycznej jest uzasadnione tylko wówczas, gdy stru k tu ra próby jest p o d o b n a do stru k ­ tury populacji generalnej. J e s t to p ró b a re p re z e n ta ty w n a . D la zapew nienia re p re ­ zentatywności staram y się wybrać próbę, posługując się odpow iednim i technikam i. Techniki te określam y m ianem sc h e m a tó w losow ania. Schem aty losow ania są szcze­ gółowo rozpatryw ane w ram ach w yodrębnionego działu statystyki, którym jest m eto ­ da reprezentacyjna9. Jednym z prostszych schem atów jest losow anie indywidualne. D o próby wybierane są jednostki statystyczne. M ożemy przy tym zastosow ać lo so w a­ n ie ze zw raca n iem , zgodnie z którym wylosowany elem en t w raca do zbiorowości generalnej przed następnym wyborem. Otrzym ujem y w ten sposób p ró b ę p ro stą , n ie ­ zależną. Jest to próba z p o w tó rz e n ia m i. Jeśli po wylosowaniu elem en t w ybrany nie w raca do populacji generalnej, a więc nie m oże ponow nie wejść do próby, to schem at taki jest schem atem losow ania bez zw racania. W rezultacie otrzym ujem y za le żn ą, która jest p ró b ą bez p o w tó rz eń .

Innym schem atem jest losow anie zespołow e. N a przykład, jeśli chcem y zbadać w arunki m ieszkaniow e w dużym mieście, zam iast losować indyw idualnie poszczegól­ ne mieszkania, m ożem y wylosować n atu ra ln e ich zespoły, jakim i są bloki m ieszkal­ ne. W przypadku losow ania indyw idualnego jed n o stk a losow ania pokryw a się z je d ­ n o stk ą b ad a n ia . W losow aniu zespołow ym je d n o s tk a lo so w an ia je s t z e sp o łe m jednostek badania.

Losow y d o b ó r p ró b y zw ięk sza p ra w d o p o d o b ie ń s tw o u z y s k a n ia p ró b y r e p r e ­ z e n ta ty w n ej. P raw d o p o d o b ie ń stw o to w z ra sta , gdy p ró b a j e s t d o s ta te c z n ie licz­ n a. Jeśli z a te m p ró b a je s t lo so w a i d o s ta te c z n ie liczn a, to j e s t w ysoce p ra w d o p o ­ d o b n e, że je s t o n a re p re z e n ta ty w n a .

B adania statystyczne m ogą przyjąć ch arak ter badań całkowitych, wyczerpujących, jeśli obserwacji podlega cala populacja generalna. G dy ograniczam y się do p rz ep ro ­ w adzenia badań na podstaw ie próby, to b adania te określam y m ianem częściowych, niewyczerpujących. Rezygnujemy z badań całkowitych, ponieważ wymagają one znacz­ nych nakładów finansowych. D ługi jest rów nież okres oczekiw ania na rezultaty. B a­ dania wyczerpujące przew ażnie są kosztow ne i czasochłonne. Innym pow odem p rze­

8 Formalną definicję próby losowej można znaleźć na przykład M. Fisz, Rachunek prawdopo­

dobieństwa i statystyka matematyczna, Warszawa 1965.

9 Różne schematy losowania są rozpatrywane na przykład w pracach: C. Bracha, Teoretyczne

podstawy metody reprezentacyjnej, Warszawa 1996, J. Steczkowskiego, Metoda reprezentacyj­ na w poglądach jej twórców, PN 1990, nr 513; idem, Metoda reprezentacyjna w badaniach zjawisk ekonomiczno-społecznych, Warszawa-Kraków 1995, R. Zasępa, Zaiys metody repre­ zentacyjnej, „Biblioteka Wiadomości Statystycznych”, t. 30, Warszawa 1991.

(17)

prow adzania b ad a ń m eto d ą reprezentacyjną jest konieczność zniszczenia obiektu w trakcie badania. Sytuacja taka w ystępuje n a przykład w badaniu wytrzymałości elem en tu konstrukcyjnego w ram ach statystycznej kontroli jakości. Jeśli rozpatruje­ my populacje nieskończone, to wyniki b ad a ń również m ogą być traktow ane jak o nie- w yczerpujące. Posłużymy się tutaj innym przykładem z zakresu dem ografii. U m ieral­ ność populacji m ożna przedstaw ić za pom ocą tablicy trwania życia10. Jedn ą z zawartych w niej charakterystyk jest praw dopodobieństw o zgonu osoby, która dożyła do o k re­ ślonego w ieku (n a przykład ukończyła 45 lat). W artości praw dopodobieństw a obli­ czono n a podstaw ie danych odnoszących się do dokładnie w yodrębnionej ze względu na czas i miejsce populacji. Praw dopodobieństw o to m ożem y również odnieść do zbiorow ości, której życie przebiega w podobnych w arunkach do tej zbiorowości, dla której skonstruow ano tablicę.

Na rysunku 1.2 przedstaw iono schem at postępow ania badawczego w przypadku wnioskow ania o praw idłow ości w populacji generalnej na podstaw ie wyników zaob­ serwowanych w próbie statystycznej.

Rachunek prawdopodobieństwa

Rys. 1.2. Schemat badania statystycznego Źródło: opracowanie wtasne.

B adania statystyczne rozpoczynam y od wyznaczenia celu. D la rozważanych tutaj jak o przykładow e bad an ia z zakresu dem ografii oraz z analizy budżetów domowych

cel m ożna ująć jako:

• określenie uw arunkow ań zaw ierania pierwszych związków małżeńskich przez kobiety w Polsce w okresie transform acji ekonom iczno-społecznej,

• poznanie czynników kształtujących stru k tu rę wydatków gospodarstw dom o­ wych województwa m ałopolskiego w 2003 roku.

10 Tablice trwania życia są dokładnie przedstawione w każdym podręczniku do demografii, jak np.: J. Z. Holzer, Demografia, Warszawa 2003, J. Kurkiewicz, Podstawowe metody analizy

(18)

D obrze wyznaczony cel pozwoli:

1) sform ułow ać odpow iednie hipotezy,

2) popraw nie w yodrębnić populację generalną,

3) ustalić listę zm iennych odzw ierciedlających bad an ą prawidłowość.

Jeśli zdecydujem y się na bad an ia częściowe (niew yczerpujące), m usim y wyloso­ wać p ró b ę '1. P róbę tę poddajem y bezpośred niem u badaniu. O pisujem y ją za pom ocą odpow iednich charakterystyk. Inform acje o każdej jednostce statystycznej zastęp u je­ my wówczas odpow iednim i m iaram i, takim i ja k n a przykład w artości p rzeciętne. P o ­ stępow anie badawcze opiera się tutaj na rozum ow aniu dedukcyjnym . T en dział sta­ tystyki nazywamy staty sty k ą opisow ą. M ając jed n ak na uwadze, że cały czas interesuje nas prawidłowość w populacji generalnej, nie m ożem y pozostać n a poziom ie próby. Uzyskane wyniki stanow ią podstaw ę do w nioskow ania o tej praw idłow ości w zb io ro ­ wości generalnej. M etody tego rodzaju wnioskow ania stanow ią przedm iot sta ty sty k i m atem aty cz n ej, określanej rów nież m ianem s ta ty s ty k i in d u k c y jn e j. O d rozum o­ wania dedukcyjnego przechodzim y do rozum ow ania indukcyjnego. W bad an iach m e­ todam i statystycznymi opiera się ono na rachunku praw dopodobieństw a12.

B adanie statystyczne musi op ierać się n a rachunku praw dopodobieństw a, p o n ie­ waż w rezultacie wnioskow ania form ułujem y sądy o praw idłow ości w populacji ge­ neralnej wyprow adzone z niepełnej inform acji. Pochodzi ona z próby statystycznej. W tych w arunkach prawdziwość naszych sądów nie jest pew na. N iezbędne są zatem takie reguły postępow ania, k tóre pozw olą nam przyjąć odpow iednio wysokie praw ­ dopodobieństw o prawdziwości naszych wniosków lub niskie praw dopodobieństw o wniosków fałszywych.

Konieczność uw zględniania praw dopodobieństw a łączy się nie tylko z samym wnioskowaniem na podstaw ie próby. Praw dopodobieństw o pojaw ia się rów nież przy­ padku badania całkow itego (w yczerpującego). W rzeczywistości m am y bow iem do czynienia wyłącznie ze zdarzeniam i losowymi, którym p rzyp isan a je st - zgodnie z regułam i rachunku praw dopodobieństw a - szansa realizacji.

1.3. Typy prawidłowości

Prawidłowości, jakim i charakteryzują się zjawiska masowe, m ożem y rozpatryw ać jako prawidłowości, k tóre występują:

1) w rozkładzie liczebności populacji w edług w artości zm iennej, 2) w związkach m iędzy zjawiskami,

3) w dynamice, czyli w rozwoju zjawiska w czasie.

11 Szczegółowe omówienie postępowania w przypadku losowania próby można znaleźć w pra­ cy R. Zasępa, Zarys metody reprezentacyjnej, op. cit.

(19)

A by wyjaśnić prawidłowości w ystępujące w rozkładach liczebności, rozważymy wyniki, jak ie uzyskali po zaliczeniu pierw szego roku studenci dwóch wydziałów pew­ nej uczelni. Poniew aż nie m ożem y porównyw ać wszystkich studentów , posłużymy się pew nym i charakterystykam i liczbowymi. Poziom nauczania na wydziałach możemy porów nać, posługując się średnią ocen, zakładając że studentom staw iane są je d n a ­ kowe wym agania. Sytuację tę zilustrow ano na rysunku 1.3a.

W tym przypadku mówimy, że rozkłady liczebności m ają różne położenie w ukła­ dzie w spółrzędnych. R ozkład przesunięty w praw o (w stro nę plus nieskończoności) charakteryzuje się wyższą w artością przeciętną. Jed n ą z nich jest średnia arytm etycz­ na. W a rto ś c i p rz e c ię tn e n az y w am y m ia ra m i p o ło ż e n ia 13.

Średnia ocen nie jest jedyną charakterystyką różnicującą wyniki nauczania stu­ d en tó w porów nyw anych wydziałów. O ceny m ogą być m niej lub bardziej zróżni­ cow ane w porów naniu z w artością przeciętną. W tym przypadku mówimy, że roz­ kłady m ogą m ieć różną zm ienność, a charakterystyki stosow ane do jej pom iaru na­ zywamy m ia ra m i zm ien n o śc i. T ę cechę rozkładów liczebności przedstaw iono na rysunku 1.3b.

R ozkład nakreślony linią przeryw aną charakteryzuje się m niejszą zm iennością od rozkładu narysow anego linią ciągłą.

M ożem y zapytać, czy na porównywanych wydziałach przew ażają studenci osią­ gający oceny wyższe od średniej, czy też więcej jest osób z ocenam i poniżej średniej charakteryzującej dany wydział. M ówimy wówczas o asym etrii rozkładu liczebności. T ę właściwość przedstaw iono na rysunkach 1.3c-1.3e. Jeśli liczba studentów , którzy uzyskali oceny niższe od średniej, je st równa liczbie studentów z ocenam i wyższymi

(20)

niż średnia, to m am y do czynienia z rozkładem symetrycznym. Jeśli w danej zb ioro­ wości przew ażają jednostki o w artościach zm iennej większych od średniej, to m ówi­ my o asymetrii lew ostronnej.

Rys. 1.3c. Symetryczny rozkład liczebności

(21)

Jeśli natom iast częściej w ystępują jedn o stk i o w artościach zm iennej mniejszych o d średniej, to m am y d o czynienia z asym etrią praw ostronną.

N a rysunku 1.4 przedstaw iono prawidłow ości przejaw iające się w związkach m ię­ dzy zjaw iskam i14. W zięto pod uwagę wiek mężczyzn i kobiet w chwili zawarcia m ał­ żeństw a.

Źródło: opracowanie własne na podstawie danych GUS.

14 Problemy badania współzależności i różne typy związków między zjawiskami stanowią przed­ miot rozdziału 4.

(22)

U kład punktów świadczy o tym, że istnieje związek między porównywanymi zm ien­ nymi. Podwyższeniu w ieku kobiet odpow iada podwyższenie wieku mężczyzn w chwi­ li zawarcia m ałżeństwa.

Rysunek 1.5 jako przykład prawidłow ości przejaw iającej się w rozwoju zjawisk w czasie przedstaw ia dynam ikę P rod ukt K rajow ego B ru tto w Polsce w latach 1995-

2000.

Rys. 1.5. Produkt Krajowy Brutto w Polsce w latach 1995-2000 (w min zl) Źródło: opracowanie własne na podstawie danych GUS.

P rodukt Krajowy B rutto w Polsce w latach 1995-2000 charakteryzow ał się ro ­ snącą tendencją rozwojową. W rozpatryw anym przykładzie jed n o stk ę obserw acji sta­ nowi rok. N iektóre zjawiska podlegają w ahaniom okresowym (n a przykład sezono­ wym). O bserw ujem y je w okresach krótszych (na przykład w dniach, tygodniach, kw artałach, m iesiącach, półroczach).

Siedząc zm iany liczby urodzeń, stwierdzam y, że w rozważanym okresie cyklicz­ nie pow tarzają się dni tygodnia, w których liczba urod zeń żywych jest wysoka (począ­ tek tygodnia: w torek, środa) oraz takie, w których jest o na niska (koniec tygodnia: sobota, niedziela).

Po dokładnym określeniu celu badania, sform ułow aniu hipotez, w yodrębnieniu populacji generalnej wraz z tworzącymi ją jedno stkam i oraz po ustaleniu cech istot­ nych z punktu widzenia celu badania, przystępujem y do zgrom adzenia niezbędnych danych statystycznych. G rom adzenie danych nazywamy obserw acją statystyczną. Jest to pierwszy etap badania statystycznego. P rzystępując do g rom adzenia danych, n ale­ ży najpierw zorientow ać się, czy istnieją już źródła zaw ierające interesujące nas dane, naw et jeśli zostały one zgrom adzone w innym celu niż ten, który chcem y osiągnąć w rezultacie naszych badań. W sytuacji gdy żadne znane nam i do stęp n e źródło nie zawiera takich danych, zdecydujem y się na sam odzielne ich zbieranie.

(23)

R ysunek 1.6 przedstaw ia liczbę urodzeń żywych w edług dni tygodnia w poszcze­ gólnych m iesiącach w 2002 ro k u 15.

Rys. 1.6. Liczba urodzeń żywych według dni tygodnia w miesiącach w 2002 roku Źródło: opracowanie własne na podstawie danych GUS.

S pośród istniejących źródeł danych najczęściej wykorzystujemy zasoby G łów ne­ go U rzęd u Statystycznego (G U S). Takim źródłem jest N arodow y Spis Powszechny (N SP) oraz bieżąca rejestracja danych o zdarzeniach, takich jak: urodzenia, m ałżeń­ stwa i zgony, k tóre są zapisywane w specjalnych księgach. Główny U rząd Statystycz­ ny grom adzi również d ane o procesach gospodarczych i społecznych. N a szczególne zwrócenie uwagi zasługują systematycznie prow adzone badania budżetów gospodarstw dom owych. O ile inform acje uzyskane w rezultacie Spisu Powszechnego i rejestracji bieżącej o dnoszą się do całej populacji w yodrębnionej pod w zględem czasowym i przestrzennym , to b adania budżetów rodzinnych są przykładem badań re p rez en ta­ cyjnych, którym i o bjęta jest wybrana w sposób losowy subpopulacja nazywana próbą statystyczną.

15 Na osi odciętych nie mogły być zaznaczone wszystkie dni tygodnia ze względu na ograniczo­ ny rozmiar rysunku.

(24)

materiału statystycznego

2.1. Grupowanie statystyczne

Zebrany m ateriał statystyczny, sprawdzony pod względem kom pletności i popraw ­ ności poddajem y grupow aniu. G ru p o w an ie, czyli klasyfikacja je d n o s te k w edług kategorii rozpatrywanych cech, jest pierwszym etap em opracow ania m ateria łu sta­ tystycznego. W rezultacie otrzym ujem y szeregi statystyczne. S zereg sta ty s ty c z n y jest to zbiór uporządkow anych (rosnąco lub m alejąco) w artości zm iennej. Jest to empiryczny (zaobserw owany) rozkład ogólnej liczebności populacji pom iędzy wy­ różnione wartości zm iennej. O dzw ierciedla on stru k tu rę populacji w edług rozw aża­ nej cechy.

2.1.1. Grupowanie jednostek według cech jakościowych

Problem grupow ania jest m niej skomplikowany, jeśli jak o kryterium przyjm iem y cechę jakościową (pom iar w skali nom inalnej) niż wówczas, gdy grupujem y je w edług cech ilościowych. Szereg składa się z dwóch kolum n. W pierwszej w ym ienione są wyróżnione kategorie, a w drugiej - przyporządkow ana im liczba jed n o stek (liczeb­ ność).

K ategorie cech m ogą być określone w erbalnie lub m ożna im przyporządkow ać um owne wartości liczbowe. R ezultaty grupow ania zestaw iam y w tablicach.

W tablicy 2.1 podano jako przykład klasyfikację (stru k tu rę ) ludności Polski ze względu na stan cywilny w 2002 roku. Każdej kategorii stanu cywilnego przyporząd­ kowano zaobserw ow aną liczbę osób. Są to liczebności bezwzględne. Liczebności te zależą od ogólnej liczebności populacji, a więc są nieporów nyw alne. Jeśli chcemy porów nać na przykład rozkłady liczebności w edług stanu cywilnego dla Polski ogó­ łem oraz dla zbiorowości mężczyzn i kobiet, lepiej jest posłużyć się liczebnościam i względnymi. M ogą one przybierać postać częstości względnej. Uzyskamy ją, dzieląc liczbę jedno stek przyporządkow anych poszczególnym kategoriom przez liczebność ogólną zgodnie z podanym niżej wzorem :

(25)

f i f ,

( 2 1 )

/=i gdzie:

fi - liczba jed n o stek przyporządkow anych wyróżnionej (/-tej) kategorii

cechy statystycznej,

k - liczba wyróżnionych kategorii cechy,

k

' Z f i = n - ogólna liczebność populacji.

1=1

Tablica 2.1. Ludność w wieku przynajmniej 15 lat według pici i stanu cywilnego faktycznego w Polsce w 2002 roku* (I)

Lp. Stan cywilny Ogółem Mężczyźni Kobiety w liczbach bezwzględnych (fi) 1. kawalerowie/panny 8 732 027 4 862 997 3 869 030 2. żonaci/zamężne 18 099 824 9 021417 9 078 407 3. pozostający w związku małżeńskim 17 703 770 8 823 388 8 880 382 4. pozostający w związku partnerskim 396 054 198 029 198 025 5. wdowcy/wdowy 2 871 010 424 696 2 446 314 6. rozwiedzeni/rozwiedzione 1 030 031 394 202 635 829 7. separowani/separowane 309 154 133 961 175 193 8. nieustalony 246 382 124 833 121 549 OGÓŁEM 31 288 428 14 962 106 16 326 322 * Uwaga: Pozycje (3) i (4) dają w sumie pozycję (2).

Źródło: Tablice wynikowe Narodowego Spisu Ludności i Mieszkań 2002, www.stat.gov.pl

W tablicy 2.2 pod an o rozważany szereg statystyczny, w którym liczebności są po ­ d an e jak o częstości względne uzyskane zgodnie ze w zorem (2.1).

In terp retac ja częstości względnych m oże nastręczać tru dn ości16. N a przykład czę­ stość kaw alerów oznacza, że na jed n eg o mężczyznę przypada 0,325 kawalerów. D la­ tego wygodniej jest częstość tę odnieść do um ownej liczebności populacji np.: 100 (procenty), 1000 (prom ile) itd. W tablicy 2.3 pod ano procenty, a więc liczebności w zględne w przeliczeniu na 100. (odpow iednio: ogółem , mężczyzn, kobiet). Kawale­ rowie stanowili więc 32,5% ogółu mężczyzn w Polsce w 2002 roku.

16 Częstości względne są wykorzystywane do szacowania prawdopodobieństwa wystąpienia zda­ rzenia losowego.

(26)

Tablica 2.2. Ludność w wieku przynajmniej 15 lat według płci i stanu cywilnego faktycznego w Polsce w 2002 roku* (II)

Lp. Stan cywilny Ogółem Mężczyźni Kobiety częstości względne (/■’) 1. kawalerowie/panny 0,279 0,325 0,237 2. żonaci/zamężne 0,579 0,603 0,556 3. pozostający w związku małżeńskim 0,566 0,590 0,544 4. pozostający w związku partnerskim 0,013 0,013 0,012 5. wdowcy/wdowy 0,092 0,028 0,150 6. rozwiedzeni/rozwiedzione 0,033 0,026 0,039 7. separowani/separowane 0,010 0,009 0,011 8. nieustalony 0,008 0,008 0,007

OGÓŁEM 1,000 1,000 1,000

* Uwaga: Pozycje (3) i (4) dają w sumie pozycję (2).

Źródło: Tablice wynikowe Narodowego Spisu Ludności i Mieszkań 2002, www.stat.gov.pl

Tablica 2.3. Ludność w wieku przynajmniej 15 lat według płci i stanu cywilnego faktycznego w Polsce w 2002 roku* (w %)

Lp. Stan cywilny Ogółem Mężczyźni Kobiety w procentach

1. kawalerowie/panny 27,9 32,5 23,7 2. żonaci/zamężne 57,9 60,3 55,6 3. pozostający w związku małżeńskim 56,6 59,0 54,4 4. pozostający w związku partnerskim 1,3 1,3 1,2

5. wdowcy/wdowy 9,2 2,8 15,0

6. rozwiedzeni/rozwiedzione 3,3 2,6 3,9 7. separowani/separowane 1,0 0,9 1,1

8. nieustalony 0,8 0,8 0,7

OGÓŁEM 1,000 1,000 1,000

* Uwaga: Pozycje (3) i (4) dają w sumie pozycję (2).

(27)

Innym przykładem grupow ania je st klasyfikacja według jedn ostek terytorialnych (regiony geograficzne, jednostki adm inistracyjne) lub czasowych (lata, kwartały, m ie­ siące, dni). P rzykładem klasyfikacji w edług je d n o ste k terytorialnych jest podany w tablicy 2.4 rozkład liczby ludności w Polsce w edług województw w 2002 roku.

Tablica 2.4. Liczba ludności Polski według województw w 2002 roku

Województwo Ogółem M iasta Wieś Ogółem Miasta Wieś w liczbach bezwzględnych w procentach Dolnośląskie 2 907 212 2 076 121 831 091 7,60 8,79 5,68 Kujawsko-pomorskie 2 069 321 1 288 519 780 802 5,41 5,46 5,34 Lubelskie 2 199 054 1 025 566 1 173 488 5,75 4,34 8,03 Lubuskie 1 008 954 651 045 357 909 2,64 2,76 2,45 Łódzkie 2 612 890 1 697 745 915 145 6,83 7,19 6,26 Małopolskie 3 232 408 1 626 865 1 605 543 8,46 6,89 10,98 Mazowieckie 5 124 018 3 312 618 1811400 13,40 14,03 12,39 Opolskie 1 065 043 560 064 504 979 2,79 2,37 3,45 Podkarpackie 2 103 837 853 053 1 250 784 5,50 3,61 8,56 Podlaskie 1 208 606 711572 497 034 3,16 3,01 3,40 Pomorskie 2 179 900 1 484 838 695 062 5,70 6,29 4,75 Śląskie 4 742 874 3 751 393 991 481 12,41 15,89 6,78 Świętokrzyskie 1 297 477 595 388 702 089 3,39 2,52 4,80 Warmińsko-mazurskie 1 428 357 860 229 568 128 3,74 3,64 3,89 Wielkopolskie 3 351 915 1 934 790 1417 125 8,77 8,19 9,69 Zachodniopomorskie 1 698 214 1 180 559 517 655 4,44 5,00 3,54 Ogółem 38 230 080 23 610 365 14 619 715 100 100 100 Źródto: Tablice wynikowe Narodowego Spisu Ludności i Mieszkań 2002, www.stat.gov.pl

W tablicy 2.5 zamieszczono szereg czasowy przedstawiający liczbę urodzeń żywych, liczbę zgonów i przyrost natu ralny w przeliczeniu na 1000 m ieszkańców w Polsce w latach 1990-2002.

(28)

Tablica 2.5. Liczba urodzeń żywych, liczba zgonów i przyrost naturalny w Polsce w latach 1990-2002

Rok Urodzenia żywe Zgony Przyrost naturalny na 1000 mieszkańców 1990 14,3 10,2 4,1 1991 14,3 10,6 3,7 1992 13,5 10,3 3,2 1993 12,8 10,2 2,6 1994 12,5 10,0 2,5 1995 11,2 10,0 1,2 1996 11,1 10,0 1,1 1997 10,7 9,8 0,9 1998 10,2 9,7 0,5 1999 9,9 9,9 0,0 2000 9,8 9,5 0,3 2001 9,5 9,4 0,1 2002 9,3 9,4 -o ,i Źródło: www.stat.gov.pl

2.1.2. Grupowanie według cech ilościowych (zmiennych)

W przypadku cech ilościowych zamiast określonych słownie kategorii występują wyrażone liczbowo warianty zmiennej. W tym przypadku zadanie jest bardziej skompli­ kowane. Najczęściej sami musimy zadecydować, jakie warianty zmiennej wyróżnimy.

Przedstawimy procedurę konstruow ania szeregu statystycznego dla zm iennych typu skokowego i ciągłego. Zilustrujem y to odpow iednim i przykładam i.

P rz y k ła d 2.1

Z m ie n n a ty p u sk okow ego

P rzeprow adzono analizę wielkości gospodarstw dom owych w populacji Z w 2003 roku. W ylosowano w tym celu 50 gospodarstw i zebran o inform acje o liczbie osób. Po uporządkow aniu ich rosnąco uzyskano podany niżej szereg statystyczny, zaw iera­ jący indywidualne d ane o każdej jednostce, k tó rą jest gospodarstw o dom ow e. S zereg ta k i nazyw am y szereg iem szczegółow ym .

(29)

G ospodarstw a dom ow e w edług liczby osób w rodzinie (*:■): 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 8 8 9 12

Źródło: dane umowne.

Przyjm ujem y następujące oznaczenia:

X - obserw ow ana zm ienna, k tó rą w danym przypadku jest liczba osób w rodzinie, Xj - w artość zm iennej przyporządkow anay-tej jednostce statystycznej.

T utaj jest to liczba osób w y-tym gospodarstw ie domowym. Na przy k ład ,; = 3 oznacza trzecie w kolejności gospodarstw o o liczbie o só b x 3 = 1; n - liczebność popu ­ lacji; n = 50, a z a te m ; = 1, 2, ..., 50.

W szeregu szczegółowym p o dane są w praw dzie indywidualne inform acje, ale na ich podstaw ie tru d n o jest sform ułow ać syntetyczną charakterystykę badanej zbio­ rowości. O braz byłby jeszcze mniej wyraźny, gdyby liczba obserwacji była jeszcze więk­ sza, a tym bardziej gdybyśmy chcieli porów nać wielkość gospodarstw domowych na przykład w m ieście i na wsi. Przeprow adzim y więc grupow anie gospodarstw we­ dług liczby osób. O trzym ujem y wówczas sze reg ro zd zielczy p u n k to w y lub p rz e ­ d ziałow y, który składa się z dwóch kolum n. W jednej wyróżniono w arianty zm ien­ nej, a w drugiej przyporządkow ane im liczebności. Punktow y szereg rozdzielczy gospodarstw domowych w edług liczby osób pod an o w tablicy 2.6.

Tabela 2.6. Gospodarstwa domowe według liczby osób w populacji Z - szereg rozdzielczy punktowy

Xj - liczba osób fi - liczba

w gospodarstwie gospodarstw domowym domowych 1 13 2 12 3 10 4 9 5 i więcej 6 k Z / , 50

(30)

Jeśli uwzględnimy wszystkie w artości zm iennej, to uzyskamy szereg, w którym dla jc6, jc7, jc10, jc,, otrzym ujem y liczebności ( f ) równe zeru. Przyjm ujem y klasę zbiorczą (jc5) określoną jak o „5 i więcej osób w rodzinie”. k

O gólną liczebność populacji n = 50 uzyskujemy jak o H f , , gdzie k oznacza liczbę wariantów zm iennej.

W przypadku szeregu, w którym uw zględniono wszystkie w artości zm iennej, jest ich k = 12, a w szeregu z klasą zbiorczą jest ich k = 5.

Przykład 2.2

Z m ien na typu ciągłego

W przeprow adzonej analizie oprócz wielkości gospodarstw dom owych w p o p u la­ cji Z w 2003 roku w zięto również pod uwagę wysokość docho du przypadającego na jed n ą osobę (zm ienna

O trzym ano następujące d ane statystyczne:

1,65 1,50 2,10 1,25 2,32 1,78 1,90 1,15 1,45 1,70 1,65 1,50 2,15 1,30 2,36 1,80 1,94 1,15 1,45 1,76 1,70 1,50 2,18 1,35 2,40 1,80 1,98 1,20 1,46 1,60 1,70 1,50 2,20 1,40 2,50 1,84 2,00 1,20 1,48 1,62 1,72 1,51 2,30 1,40 2,55 1,84 2,10 1,24 1,48 1,64

Po uporządkow aniu pow stał następujący szereg szczegółowy gospodarstw d o m o ­ wych w edług wysokości dochodu przypadającego n a je d n ą osobę (jc;):

1,15 1,45 1,60 1,78 2,10 1,15 1,45 1,62 1,80 2,15 1,20 1,46 1,64 1,80 2,18 1,20 1,48 1,65 1,84 2,20 1,24 1,48 1,65 1,84 2,30 1,25 1,50 1,70 1,90 2,32 1,30 1,50 1,70 1,94 2,36 1,35 1,50 1,70 1,98 2,40 1,40 1,50 1,72 2,00 2,50 1,40 1,51 1,76 2,10 2,55

W celu lepszego ukazania prawidłowości występujących w rozkładzie liczebności gospodarstw ze względu n a wysokość dochodów skonstruujem y szereg rozdzielczy. W przypadku zm iennej typu ciągłego, k tó ra m oże przyjąć każdą w artość z danego przedziału liczbowego, obszar jej zm ienności m usi być podzielony na odcinki, k tó re nazywać będziem y przedziałam i klasowymi lub klasam i.

M usimy podjąć decyzję, ile będzie tych przedziałów lub, co jest rów noznaczne, ja k a b ędzie długość przed ziału . W ygodnie je st, jeśli długości te są jed n ak o w e. W literaturze podaw ane są procedury, w edług których m ożna ustalić liczbę

(31)

przedzia-(2 .4 ) tów klasowych lub określić ich długość. A. Iwasiewicz i Z. P aszek17 proponują nastę­ pujące postępow anie:

1. liczbę przedziałów klasowych k ustalam y w edług wzoru:

k' = 1 -t- 3,3 * lg/7 (2 .2 )

0,5 • yfn < k < J n (2 .3 ) W arto ść k uzyskujemy, zaokrąglając k' do najbliższej liczby całkowitej.

2. ustalam y długość przedziału jako:

_ R l ~ k

gdzie:

x mi„ - m inim alna w artość zm iennej X

*maks - m aksym alna w artość zm iennej X

W przykładzie 2.2, odnoszącym się do rozkładu liczebności gospodarstw dom o­ wych, otrzym ujem y:

k' = 1 -t- 3,3 • lg 50 = 1+3^3 -1,699= 6,61,

V50 = 7,07, 0,5-750 = 0,5-7,07 = 3,54.

L iczba przed ziałó w klasow ych pow inna m ieścić się w p rzedziale liczbowym 3,54 < k < 7,07. B iorąc p o d uwagę w artość k! = 6,61, powinniśm y przyjąć k = 7 prze­ działów klasowych o długości obliczonej zgodnie ze w zorem (2.4) jako:

i = 2 ^ = ] A 1 7

Przedziały klasowe zapiszem y w sposób podany w tablicy 2.7. D olną granicę pierw­ szego p rzedziału przyjm iem y jak o x*mi = 1,0 [tys. zł]. G ranice przedziałów klasowych ustalam y tak, że górna granica klasy poprzedniej jest rów na dolnej granicy klasy n a­ stępnej. Aby uniknąć problem ów przy zaliczaniu jed n o stek do klas, musimy przyjąć jednoznaczne kryterium . D o danego przedziału zaliczać będziem y jednostki, dla któ­

rych zaobserw ow ane w artości zm iennej spełniają w arunek:

x f < x t < x f (2 .5 ) gdzie:

x f - d o ln a granica /-tego przedziału klasowego, x f - górn a granica /-tego przedziału klasowego.

(32)

Przyjęte przedziały są lew ostronnie dom knięte i praw ostronnie otw arte.

W kolum nie (1) tablicy 2.7 podano przedziały, których długość i = 0,2 [tys. zł]. Z godnie z przyjętą p ro c e d u rą szereg pow inien sk ład ać się z 7 przedziałów , ale w rozważanym przykładzie klasyfikacja nie będzie zupełna. O statni przedział [2,2-2,4) nie pozwala bowiem uwzględnić 3 gospodarstw o najwyższych dochodach. D latego ponownie ustalam y liczbę przedziałów klasowych, przyjm ując x ^ m = 1,0 [tys. zł], a *maks = 2,6 [tys. zł].

Wówczas k - ^ = 0,24 [tys. zł]. W kolum nie (2) po d an o nowe p rze­ działy klasowe. W kolum nie (4) w artości zm iennej przyporządkow ane poszczegól­ nym przedziałom . K olum na (5) zaw iera ich liczebności.

Tablica 2.7. Empiryczny rozkład liczebności gospodarstw domowych według wysokości dochodu przypadającego na jedną osobę w województwie Z w 2003 roku

X, Przedziały Xj - zaobserwowane wartości zmiennej X f

(1) (2) (3) (4) (5) 1,0-1,2 1,00-1,24 1,00 <*,<1,24 1,15 1,15 1,20 1,20 4 1,2-1,4 1,24-1,48 1,24 <jc, <1,48 1,24 1,25 1,30 1,35; 1,40; 1,40; 1,45; 1,45; 1,46 9 1,4-1,6 1,48-1,72 1,48 <x, <1,72 1,48 1,64 1,48 1,65 1,50 1,65 1,50; 1,50; 1,50; 1,51; 1,60; 1,62; 1,70; 1,70; 1,70 15 1,6-1,8 1,72-1,96 1,72 <Xi <1,96 1,72 1,76 1,78 1,80; 1,80; 1,84; 1,84; 1,90; 1,94; 9 1,8-2,0 1,96-2,20 1,96 <xt <2,20 1,98 2,00 2,10 2,10; 2,15; 2,18 6 2,0-2,2 2,20-2,44 2,20 <x, <2,44 2,20 2,30 2,32 2,36; 2,43 5 2,2-2,4 2,44-2,68 2,44 <Xj <2,68 2,50 2,55 2 Suma: 50 Źródło: dane umowne.

W szereg u rozdzielczym przedziało w ym wartości zm iennej podane są jak o prze­ działy. O pisując prawidłowości w ystępujące w rozkładzie liczebności za pom ocą róż­ nych charakterystyk nazywanych dalej m iaram i, będziem y m usieli posłużyć się jed n ą tylko liczbą, która rep rezen tu je d an ą klasę. R ep re zen tan te m przedziału klasowego jest jego środek. Obliczam y go jak o średnią arytm etyczną dolnej i górnej granicy.

Skonstruow any szereg rozdzielczy gospodarstw dom owych w edług wysokości dochodu w raz ze środkam i przedziałów pod an o w tablicy 2.8. Z am ieszczono tam

(33)

rów nież liczebności w postaci bezwzględnej ( / ) , jak o częstości względne ( f ‘) zdefi­ niow ane w zorem (2.1) oraz w w yrażaniu procentow ym ( f- -100% ).

Tablica 2.8. Rozkład liczebności (szereg rozdzielczy) gospodarstw domowych według wysokości dochodu

*/ f f i f l 100% 1,00-1,24 4 1,12 0,08 8,0 1,24-1,48 9 1,36 0,18 18,0 1,48-1,72 15 1,60 0,30 30,0 1,72-1,96 9 1,84 0,18 18,0 1,96-2,20 6 2,08 0,12 12,0 2,20-2,44 5 2,32 0,10 10,0 2,44-2,68 2 2,56 0,04 4,0 Suma 50 X 1,00 100

Źródło: dane umowne.

M ożem y zastanaw iać się, ile gospodarstw domowych posiada dochody niższe od górnej granicy przedziału klasowego. W celu uzyskania odpow iedzi musimy skum u­ lować przedziały klasowe i zsum ow ać liczebności odpow iednich przedziałów klaso­ wych. Sumy te są przyporządkow ane górnym granicom klas.

Skum ulow ane liczebności oznaczam y jak o c u m /. Symbole / oraz c u m / ozna­ czają odpow iednio liczebności bezw zględne, a sym bole / / oraz c u m /' liczebności w zględne (częstości). Skum ulow any szereg gospodarstw domowych według wysoko­ ści d o chodu przedstaw iono w tablicy 2.9.

Tablica 2.9. Skumulowane liczebności gospodarstw domowych według wysokości dochodu

x f cum / c u m /' / ' • 100% 1,24] 4 0,08 8 (-<»; 1,48] 13 0,26 26 (-°°; 1,72] 28 0,56 56 H ° ; 1,96] 37 0,74 74 (—°°; 2,20] 43 0,86 86 (-<»; 2,44] 48 0,96 96 (-« ; 2,68] 50 1,00 100

(34)

2.1.3. Grupowanie wielocechowe

Dotychczas rozpatrywaliśm y rozkłady liczebności (szeregi statystyczne) je d n o ­ stek charakteryzow anych za pom ocą jednej cechy (zm iennej). G rupow anie w ieloce­ chowe występuje wtedy, gdy każdej jednostce przyporządkow ane są przynajm niej dwie cechy. Poniżej podajem y odpow iednie przykłady.

Obserwujemy wydatki na usługi w ich związku z liczbą pracujących kobiet w rodzi­ nie. Oznaczamy jako Y - wydatki na usługi, zaś jako X - liczbę pracujących kobiet w ro ­ dzinie. Otrzym ane wyniki dotyczące 6 gospodarstw domowych po dan o w tablicy 2.10.

Tablica 2.10.Wydatki na usługi względem liczby kobiet w rodzinie

Nr y, 1 5 0 2 20 1 3 15 2 4 37 3 5 27 4 6 45 5

Źródło: dane umowne.

W przypadku gdy liczba obserwacji jest duża, konstruujem y dwuwymiarowy sze­ reg rozdzielczy. W tablicy 2.11 p o d an o rezultat grupow ania w ielocechow ego gospo­ darstw domowych sklasyfikowanych w edług typów rodzin i liczby dzieci w Polsce

Tablica 2.11. Rodziny z dziećmi w gospodarstwach domowych według typów rodzin i liczby dzieci w 2002 roku

Liczba dzieci Typ rodziny Ogółem Małżeństwa z dziećmi Partnerzy z dziećmi Matki z dziećmi Ojcowie z dziećmi 1 2 063 078 53 683 661 589 73 972 2 852 322 2 1 886 387 27 978 264 504 24 203 2 203 072 3 634 283 10 795 66 512 5 836 717 426 z 4 i więcej 271 055 6 626 26 681 2 244 306 606 Ogółem 5 860 264 110 687 1 798 331 231 808 8 001 090 Źródło: Tablice wynikowe Narodowego Spisu Ludności i Mieszkań 2002, www.stat.gov.pl

(35)

w 2002 roku. Z estaw iono tutaj cechę jakościową: typ rodziny (m ałżeństw a z dziećmi, p artn erzy z dziećm i, m atki z dziećmi, ojcowie z dziećm i) oraz zm ienną typu skoko­ w ego - liczba dzieci w rodzinie.

W tablicy 2.12 pod an o łączny rozkład liczebności mężczyzn i kobiet według wie­ ku w chwili zaw arcia m ałżeństw a. Z estaw iono tutaj dwa szeregi rozdzielcze ze zm ien­ nymi typu ciągłego.

Tablica 2.12. Rozkład liczby mężczyzn i kobiet według wieku w chwili zawarcia małżeństwa w Polsce w 2000 roku

Wiek mężczyzn

W iek kobiet (Y)

*/ 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 yl 17,5 22,5 27,5 32,5 37,5 42,5 47,5 52,5 15-19 17,5 3498 1848 79 11 1 0 0 0 20-24 22,5 16714 60412 8335 444 70 7 2 7 25-29 27,5 4577 41370 25630 2265 354 83 27 12 30-34 32,5 653 5813 8108 3529 804 265 75 15 35-39 37,5 142 1311 2452 2043 1273 572 211 57 40-49 45 73 470 1114 1412 1682 2028 1449 646 50-59 55 11 51 133 200 398 851 1684 5879 Źródło: „Rocznik Demograficzny”, GUS, Warszawa 2001.

2.2. Prezentacja graficzna szeregów

statystycznych

O trzym ane w rezultacie grupow ania rozkłady liczebności podawaliśmy dotych­ czas w postaci tabelarycznej. C harakterystyczne dla nich prawidłowości będą łatwiej­ sze do spostrzeżenia, jeśli rozkłady te zaprezentujem y graficznie. D la przedstaw ienia prawidłowości istotne znaczenie ma d obór odpow iedniego typu wykresu. Szeregi roz­ dzielcze z cecham i ilościowymi przedstaw iam y najczęściej w postaci histogram u i wie- loboku liczebności. Rysunki 2.1 i 2.2 p rezen tu ją odpow iednio histogram i wielobok liczebności szeregu rozdzielczego gospodarstw domowych ze względu na wysokość dochodów . N a rysunkach 2.3 i 2.4 zaprezentow ano szeregi skum ulowanych liczebno­ ści. Jeśli wyobrazim y sobie, że m ożem y dow olnie zwiększać dokładność pom iaru a wówczas długość przedziału i -> 0, to w ielobok liczebności przekształci się w wykres w postaci krzywej liczebności. T en typ wykresu przedstaw iono na rysunkach 2.5 i 2.6.

(36)

16 i ---14 ' 12 - 10 - 8 ' 6 ' ---4 ---2 - ---0 -I--- --- ---1 ,0 0 ---1 ,2 4 ---1 ,2 4 ---1 ,4 8 ---1 ,4 8 ---1 ,7 2 ---1 ,7 2 ---1 ,9 6 ---1 ,9 6 -2 ,2 0 2 ,2 0 -2 ,4 4 2 ,4 4 -2 ,6 8

Rys. 2.1. Histogram liczebności gospodarstw domowych według wysokości dochodów

Rys. 2.2. Wielobok liczebności gospodarstw domowych według wysokości dochodów

60 -|---50 - 40 -30 - ---20 - 10 - ________________ 0 --- ---1,4 1,8 2,2 2,6

Dochód (granice górne)

Rys. 2.3. Histogram skumulowanego szeregu gospodarstw domowych według wysokości dochodów

Cytaty

Powiązane dokumenty

Jan Paweł II, utwierdzając braci w wierze w prawdę, utwierdza ich w miłości Prawda bowiem jest dobra, a dobru należy się miłość.. W miłości prawdy tkwi

Najlepiej jest wtedy stosować się do pewnego schematu i po uważnym przeczytaniu treści pokonywać kolejne etapy rozwiązywania zadania:.. Ustal niewiadomą w zadaniu, oznacz

Wskazani uczniowie, gdy wykonają zadania, muszą niezwłocznie przesłać wyniki przez komunikator na e-dzienniku, lub mailem na adres:.. matematyka2LOpm@gmail.com skan

Wskazani uczniowi, gdy wykonają zadania, muszą niezwłocznie przesłać wyniki przez komunikator na e-dzienniku, lub mailem na adres:!. matematyka2LOpm@gmail.com skan

Jeśli jednak nie jest prawdą, że logika jest jedna, to może istnieć logika prawnicza jako odmienny rodzaj logiki.. Zatem albo logika jest jedna, albo nie jest prawdą, że nie

Gdy w pożywce brakuje laktozy represor wiąże się w promotorem operonu laktozowego i blokuje transkrypcję genów, kodujących enzymy niezbędne w rozkładzie tego dwucukru.

Pokaż, jak używając raz tej maszynerii Oskar może jednak odszyfrować c podając do odszyfrowania losowy

trójkącie? Długość przekątnej... Jej długość wynosi. Jest to tak s iln e sterowanie, że utrudnia ono obserwatorowi ocenę tego, w ja k ie j mierze uczniowie są