1 STATYSTYKA dla ZOM II
dr in˙z Krzysztof Bry´s Wyk lad 2
Statystyka - poj¸ecia wst¸epne populacja - ca ly zbi´or badanych przedmiot´ow lub warto´sci.
pr´oba - sko´nczony podzbi´or populacji podlegaj¸acy badaniu.
pr´oba losowa - pr´oba losowana (najcz¸e´sciej) zgodnie z rozk ladem r´ownomiernym, tzn. wylosowanie ka˙zdej pr´oby jest jednakowo prawdopodobne.
cechy: mierzalne, niemierzalne badana cecha = zmienna losowa X
Poszukiwany: rozk lad cechy w populacji = rozk lad zmiennej losowej X
pr´oba n-elementowa = ci¸ag n niezale˙znych zmiennych losowych (X1, . . . , Xn) o jednakowym rozk ladzie (takim jak poszukiwany rozk lad zmiennej losowej X).
Etapy badania statystycznego
1) Przygotowanie (formatowanie) badania (okre´slenie celu, rodzaju, potrzebnych parametr´ow wej´sciowych badania).
2) Przeprowadzenie badania (wylosowanie pr´oby i okre´slenie warto´sci badanych cech w pr´obie).
3) Zebranie uzyskanych podczas badania danych.
4) Opis i wnioskowanie statystyczne (obliczenie parametr´ow, estymacja, weryfikacja hipotez).
5) Przedstawienie wynik´ow.
Szeregi statystyczne 1) Szereg wyliczaj¸acy uporz¸adkowany: (x1, x2, . . . , xn) przy czym x1 ≤ x2 ≤ . . . ≤ xn.
2) Szereg rozdzielczy punktowy: (x1, x2, . . . , xk), (n1, n2, . . . , nk),
gdzie x1 < x2 < . . . < xk oraz dla ka˙zdego i = 1, 2, . . . , k: ni-liczba realizacji (obserwacji) warto´sci xi,
Pk
i=1ni = n.
3) Szereg rozdzielczy przedzia lowy: (y0; y1 >, (y1; y2 >, . . . , (yk−1; yk), (n1, n2, . . . , nk),
gdzie y0 < y1 < y2 < . . . < yk−1 < yk oraz dla ka˙zdego i = 1, 2, . . . , k: ni-liczba realizacji (obserwacji) warto´sci nale˙z¸acej do przedzia lu (yi−1; yi), Pki=1ni = n.
Wszystkie warto´sci nale˙z¸ace do przedzia lu (yi−1; yi >, i = 1, 2, . . . , k uto˙zsamia si¸e z jego ´srodkiem xi. Regu ly wyznaczania liczby przedzia l´ow (klas): k ≈ √
n, k ≤ 5 log n.
Parametry empiryczne Miary po lo˙zenia rozk ladu
1) ´Srednia z pr´oby x - dla szeregu wyliczaj¸acego:
x = 1 n
Xn i=1
xi - dla szeregu rozdzielczego:
x = 1 n
Xk i=1
ni· xi
2) Dominanta (moda, warto´s´c modalna) D = punkt, w kt´orym funkcja prawdopodobie´nstwa osi¸aga najwi¸eksz¸a warto´s´c
- dla szeregu wyliczaj¸acego: najcz¸e´sciej wyst¸epuj¸aca warto´s´c,
- dla szeregu rozdzielczego punktowego: punkt, dla kt´orego liczebno´s´c (cz¸esto´s´c) osi¸aga najwi¸eksz¸a
2 warto´s´c, - dla szeregu rozdzielczego przedzia lowego (wz´or interpolacyjny):
D = x0d+ nd− nd−1
(nd− nd−1) + (nd− nd+1)· hd, gdzie
x0d - pocz¸atek przedzia lu zawieraj¸acego dominant¸e (przedzia lu o najwiekszej liczebno´sci), hd - szeroko´s´c przedzia lu zawieraj¸acego dominant¸e (przedzia lu o najwiekszej liczebno´sci), nd - liczebno´s´c przedzia lu zawieraj¸acego dominant¸e (najwieksza liczebno´s´c),
nd−1 - liczebno´s´c przedzia lu poprzedzaj¸acego przedzia l zawieraj¸acy dominant¸e, nd+1 - liczebno´s´c przedzia lu nast¸epnego po przedziale zawieraj¸acym dominant¸e.
3) Dystrybuanta empiryczna (cz¸esto´s´c skumulowana Fn(x) - dla szeregu wyliczaj¸acego:
Fn(x) = 1
n|{i : xi < x, i = 1, . . . , n}|
- dla szeregu rozdzielczego:
Fn(x) = X
i:xi<x
ni
n 4) Kwantyl empiryczny rz¸edu p xp,n:
(punkt w kt´orym dystrybuanta empiryczna po raz pierwszy osi¸aga warto´s´c niemniejsz¸a ni˙z p) - dla szeregu wyliczaj¸acego:
xp,n= xdnpe
- dla szeregu rozdzielczego punktowego:
xp,n= xq gdzie q = min{r : p ≤
Xr i=1
ni n}
- dla szeregu rozdzielczego przedzia lowego (wz´or interpolacyjny):
xp,n= x0p+ (np − X
xi<x0p
ni) ·hp
np, gdzie
x0p - pocz¸atek przedzia lu zawieraj¸acego xp,n (przedzia lu w kt´orym dystrybuanta empiryczna po raz pierwszy osi¸aga warto´s´c niemniejsz¸a ni˙z p),
hp -szeroko´s´c przedzia lu zawieraj¸acego xp,n, np -liczebno´s´c przedzia lu zawieraj¸acego xp,n,
P
xi<x0pni - liczebno´s´c skumulowana dla przedzia lu poprzedzaj¸acego przedzia l zawieraj¸acy xp,n (suma liczebno´sci przedzia l´ow poprzedzaj¸acych)
Mediana: Me = kwantyl rz¸edu 12 Kwartyl dolny: Q1 = kwantyl rz¸edu 14 Kwartyl g´orny: Q3 = kwantyl rz¸edu 34.
Miary rozproszenia rozk ladu 5) Wariancja z pr´oby s2 - dla szeregu wyliczaj¸acego:
s2 = 1 n
Xn i=1
(xi− x)2 - dla szeregu rozdzielczego:
s2 = 1 n
Xk i=1
ni· (xi− x)2 6) Odchylenie standardowe z pr´oby s =√
s2.
3 7) Wsp´o lczynnik zmienno´sci V = xs · 100%.
8) Rozst¸ep R = r´o˙znica mi¸edzy najwi¸eksz¸a i najmniejsz¸a warto´sci¸a w pr´obie.
9) Wsp´o lczynnik asymetrii As: - dla szeregu wyliczaj¸acego:
As= 1 s3 · (1
n
Xn i=1
(xi− x)3) - dla szeregu rozdzielczego:
As = 1 s3 · (1
n
Xk i=1
ni· (xi− x)3) 10) Kurtoza (wsp´o lczynnik skupienia) As:
- dla szeregu wyliczaj¸acego:
K = 1
s4 · (1 n
Xn i=1
(xi− x)4) - dla szeregu rozdzielczego:
K = 1
s4 · (1 n
Xk i=1
ni· (xi− x)4) 11) Wsp´o lczynnik sko´sno´sci A1:
A1 = x − D s