PODSTAWOWE POJĘCIA STATYSTYKI OPISOWEJ
1.Populacja generalna (zbiorowość statystyczna) – ogół obiektów (faktów, zdarzeń) będący przedmiotem badania statystycznego.
2. Jednostka statystyczna (jednostka badana) – poszczególny obiekt (fakt, zdarzenie) będący przedmiotem badania, jako element składowy całej badanej zbiorowości statystycznej.
3. Cecha statystyczna – właściwość jednostki statystycznej podlegająca bezpośredniemu badaniu statystycznemu.
Podział cech statystycznych:
cecha statystyczna
mierzalna niemierzalna
(kolor oczu, wykształcenie)
skokowa (liczba dzieci)
ciągła
(wzrost, waga)
OPRACOWANIE WYNIKÓW DOŚWIADCZEŃ.
Dane uzyskane w wyniku badania statystycznego cechy mierzalnej są przedstawiane w postaci szeregów statystycznych.
Wyróżniamy następujące szeregi statystyczne.
Szereg szczegółowy: materiał statystyczny uporządkowany wyłącznie według wartości badanej cechy.
Przykład:
wysokości 7 najwyższych wzniesień w Polsce (w m) : 2499 2438 2301 2064 1987 1894 1723.
Szereg rozdzielczy punktowy: dane statystyczne podzielone na grupy według wartości (wariantów) badanej cechy, przy czym poszczególnym wariantom zmiennej przyporządkowane są odpowiadające im liczebności. Szereg rozdzielczy punktowy budujemy tylko dla cechy skokowej.
Przykład. Struktura rodzin według liczby członków w miejscowości X:
liczba członków rodziny
liczba rodzin
2 15
3 30
4 20
5 15
6 10
7 6
8 4
Szereg rozdzielczy przedziałowy: dane statystyczne podzielone na grupy według wielkości, przy czym grupy są przedziałami liczbowymi, zw. przedziałami klasowymi obejmującymi cały zakres otrzymanych wartości badanej cechy. Szeregi rozdzielcze przedziałowe budujemy dla cechy ciągłej oraz dla cechy skokowej przyjmującej dużą liczbę różnych wartości.
Przykład:
Procentowa zawartość tłuszczu w jogurcie produkowanym w zakładzie Z:
% tłuszczu Liczba pudełek 1.0 – 1.6 5 1.6 – 2.2 20 2.2 – 2.8 50 2.8 – 3.4 25 3.4 – 4.0 8
Tworzenie szeregu rozdzielczego przedziałowego.
Dane:
Rozstęp: miara rozproszenia wartości cechy w próbie:
) min(
)
max(xi xi
R= −
Przedziały klasowe: przedziały liczbowe, o których zakładamy, że są – jednakowej długości,
– prawostronnie otwarte.
Liczba przedziałów klasowych k zależy od liczebności próby n (nie jest to zależność ścisła).
Liczbę przedziałów klasowych k i wspólną długość h tych przedziałów określa się tak, by były spełnione następujące warunki:
1) liczbę k ustalamy w zależności od liczby danych n , tak aby 30
5≤ k<
w oparciu o jedno z następujących kryteriów:
n k ≤5ln
n k =1+3.322ln
n k =
lub korzystając z tabeli:
n 40 - 60 60 - 100 100 - 200 200 -500
k 5 -7 6 - 9 8 - 12 11 -17
2) h powinno być liczbą prostą, np. 0.01, 0.3, 5, 20, itp. w zależności od wielkości danych.
3) iloczyn liczb k i h powinien być równy (lub równy w przybliżeniu z nadmiarem) rozstępowi, czyli
h k R= ⋅ .
Szereg rozdzielczy przedziałowy przedstawia się graficznie w postaci histogramu zw. też wielobokiem częstotliwości lub w postaci diagramu zw. krzywą liczebności. Diagram lub histogram jest geometrycznym obrazem rozkładu badanej cechy w populacji.
Wprowadzamy następujące oznaczenia:
n – liczba danych,
k – liczba przedziałów klasowych,
((((
a ,i bi]]]]
– i-ty przedział klasowy, i=1,Kk, n – liczebność i-tego przedziału klasowego, in
fi = ni – częstości względne,
∑
=
=
i
j j
i n
s
1
– liczebności skumulowane,
∑
==
i
j j
i f
F
1
– częstości skumulowane, wartości dystrybuanty empirycznej