1 STATYSTYKA OPISOWA - wzory
dr in˙z Krzysztof Bry´s
Szeregi statystyczne 1) Szereg wyliczaj¸acy uporz¸adkowany: (x1, x2, . . . , xn) przy czym x1 ≤ x2 ≤ . . . ≤ xn.
2) Szereg rozdzielczy punktowy: (x1, x2, . . . , xk), (n1, n2, . . . , nk), gdzie x1 < x2 < . . . < xk
oraz dla ka˙zdego i = 1, 2, . . . , k:
ni-liczba realizacji (obserwacji) warto´sci xi (Pki=1ni = n).
3) Szereg rozdzielczy przedzia lowy: (y0; y1 >, (y1; y2 >, . . . , (yk−1; yk), (n1, n2, . . . , nk), gdzie y0 < y1 < y2 < . . . < yk−1< yk
oraz dla ka˙zdego i = 1, 2, . . . , k:
ni-liczba realizacji (obserwacji) warto´sci nale˙z¸acej do przedzia lu (yi−1; yi) (Pki=1ni = n).
Wszystkie warto´sci nale˙z¸ace do przedzia lu (yi−1; yi >, i = 1, 2, . . . , k uto˙zsamia si¸e z jego ´srodkiem xi. Regu ly wyznaczania liczby przedzia l´ow (klas): k ≈√
n, k ≤ 5 log n.
Parametry empiryczne Miary po lo˙zenia rozk ladu
1) ´Srednia z pr´oby x - dla szeregu wyliczaj¸acego:
x = 1 n
Xn i=1
xi - dla szeregu rozdzielczego:
x = 1 n
Xk i=1
ni· xi
2) Dominanta (moda, warto´s´c modalna) D = punkt, w kt´orym funkcja prawdopodobie´nstwa osi¸aga najwi¸eksz¸a warto´s´c
- dla szeregu wyliczaj¸acego: najcz¸e´sciej wyst¸epuj¸aca warto´s´c,
- dla szeregu rozdzielczego punktowego: punkt, dla kt´orego liczebno´s´c (cz¸esto´s´c) osi¸aga najwi¸eksz¸a warto´s´c, - dla szeregu rozdzielczego przedzia lowego (wz´or interpolacyjny):
D = x0d+ nd− nd−1
(nd− nd−1) + (nd− nd+1) · hd, gdzie
x0d - pocz¸atek przedzia lu zawieraj¸acego dominant¸e (przedzia lu o najwiekszej liczebno´sci), hd - szeroko´s´c przedzia lu zawieraj¸acego dominant¸e (przedzia lu o najwiekszej liczebno´sci), nd - liczebno´s´c przedzia lu zawieraj¸acego dominant¸e (najwieksza liczebno´s´c),
nd−1 - liczebno´s´c przedzia lu poprzedzaj¸acego przedzia l zawieraj¸acy dominant¸e, nd+1 - liczebno´s´c przedzia lu nast¸epnego po przedziale zawieraj¸acym dominant¸e.
3) Dystrybuanta empiryczna (cz¸esto´s´c skumulowana Fn(x) - dla szeregu wyliczaj¸acego:
Fn(x) = 1
n|{i : xi < x, i = 1, . . . , n}|
- dla szeregu rozdzielczego:
Fn(x) = X
i:xi<x
ni n 4) Kwantyl empiryczny rz¸edu p xp,n:
(punkt w kt´orym dystrybuanta empiryczna po raz pierwszy osi¸aga warto´s´c niemniejsz¸a ni˙z p) - dla szeregu wyliczaj¸acego:
xp,n= xdnpe
2 - dla szeregu rozdzielczego punktowego:
xp,n = xq gdzie q = min{r : p ≤
Xr i=1
ni n} - dla szeregu rozdzielczego przedzia lowego (wz´or interpolacyjny):
xp,n = x0p+ (np − X
xi<x0p
ni) · hp np, gdzie
x0p - pocz¸atek przedzia lu zawieraj¸acego xp,n (przedzia lu w kt´orym dystrybuanta empiryczna po raz pierwszy osi¸aga warto´s´c niemniejsz¸a ni˙z p),
hp -szeroko´s´c przedzia lu zawieraj¸acego xp,n, np -liczebno´s´c przedzia lu zawieraj¸acego xp,n,
P
xi<x0pni - liczebno´s´c skumulowana dla przedzia lu poprzedzaj¸acego przedzia l zawieraj¸acy xp,n (suma liczebno´sci przedzia l´ow poprzedzaj¸acych)
Mediana: Me = kwantyl rz¸edu 12 Kwartyl dolny: Q1 = kwantyl rz¸edu 14 Kwartyl g´orny: Q3 = kwantyl rz¸edu 34.
Miary rozproszenia rozk ladu 5) Wariancja z pr´oby s2 - dla szeregu wyliczaj¸acego:
s2 = 1 n
Xn i=1
(xi− x)2 - dla szeregu rozdzielczego:
s2 = 1 n
Xk i=1
ni· (xi− x)2 6) Odchylenie standardowe z pr´oby s =√
s2. 7) Wsp´o lczynnik zmienno´sci V = xs · 100%.
8) Rozst¸ep R = r´o˙znica mi¸edzy najwi¸eksz¸a i najmniejsz¸a warto´sci¸a w pr´obie.
9) Wsp´o lczynnik asymetrii As: - dla szeregu wyliczaj¸acego:
As = 1 s3 · (1
n
Xn i=1
(xi− x)3) - dla szeregu rozdzielczego:
As = 1 s3 · (1
n
Xk i=1
ni · (xi− x)3) 10) Kurtoza (wsp´o lczynnik skupienia) K:
- dla szeregu wyliczaj¸acego:
K = 1
s4 · (1 n
Xn i=1
(xi− x)4) - dla szeregu rozdzielczego:
K = 1
s4 · (1 n
Xk i=1
ni· (xi− x)4) 11) Wsp´o lczynnik sko´sno´sci A1:
A1 = x − D s