• Nie Znaleziono Wyników

Je»eli próba X1

N/A
N/A
Protected

Academic year: 2021

Share "Je»eli próba X1"

Copied!
3
0
0

Pełen tekst

(1)

Empiryczne rozkªady prawdopodobie«stwa

Rozkªad empiryczny to uzyskany na podstawie badania statystycznego opis warto±ci przyj- mowanych przez cech¦ statystyczn¡ przy pomocy cz¦sto±ci ich wyst¦powania. Rozkªad empiryczny z reguªy jest prezentowany jako szereg rozdzielczy (punktowy lub prze- dziaªowy). Informacje o próbce daje nam równie» histogram, wykres koªowy, sªupkowy, pudeªkowy itp.

Def. Niech X1, . . . , Xn b¦dzie prób¡ z rozkªadu o dystrybuancie F . Wówczas dy- strybuant¡ empiryczn¡ nazywamy funkcj¦

n(x) = 1 n

n

X

i=1

1[Xi,∞)(x).

Tw. Gliwienki-Cantellego (Podstawowe Twierdzenie Statystyki Matematycznej) Niech

Dn= sup

−∞<x<∞

| ˆFn(x) − F (x)|.

Je»eli próba X1, . . . , Xn pochodzi z rozkªadu o dystrybuancie F , to Dnn→∞−→ 0

z prawdopodobie«stwem 1.

Def. Niech X1, . . . , Xn b¦dzie prób¡ z nieznanego rozkªadu zmiennej X, za± A ⊂ R.

Wówczas przybli»eniem nieznanej liczby pA = P (X ∈ A) jest prawdopodobie«stwo empiryczne

ˆ pA=

n

P

i=1

1A(Xi)

n .

Def. Niech X1, . . . , Xn b¦dzie prób¡ losow¡. Niech X1:n ≤ X2:n ≤ . . . ≤ Xn:n b¦dzie ci¡giem liczb X1(ω), . . . , Xn(ω) uporz¡dkowanym w kolejno±ci niemalej¡cej. Wówczas Xi:n, i = 1, . . . , n, nazywamy i-t¡ statystyk¡ pozycyjn¡ (porz¡dkow¡).

Próbkowe odpowiedniki wielko±ci populacyjnych Oznaczenia:

x1, . . . , xn  warto±ci obserwacji (realizacje próby X1(ω), . . . , Xn(ω)), n  liczba obserwacji (wielko±¢ próby),

x1:1, . . . , xn:n  statystyki pozycyjne z próby.

‘rednia arytmetyczna z próbki:

¯ x = 1

n

n

X

i=1

xi,

1

(2)

jest warto±ci¡ oczekiwan¡ rozkªadu empirycznego.

Wariancja próbkowa dana jest wzorem:

ˆ s2 = 1

n

n

X

i=1

(xi− ¯x)2 = 1 n

n

X

i=1

x2i − ¯x2, jest wariancj¡ rozkªadu empirycznego.

Odchylenie standardowe z próbki (ˆs) to pierwiastek z wariancji próbkowej, jest ono odchyleniem standardowym rozkªadu empirycznego.

Ogólnie, wyró»niamy nast¦puj¡ce typy momentów z próbki:

• zwykªe ˆak = 1 n

n

P

i=1

xki, s¡ odpowiednikiem momentów ak= EXk,

• centralne ˆmk = 1 n

n

P

i=1

(xi− ¯x)k,s¡ odpowiednikiem momentów mk= E(X − EX)k,

• absolutne ˆAk= 1 n

n

P

i=1

|xi|k, s¡ odpowiednikiem momentów Ak = E|X|k,

• centralne momenty absolutne ˆMk = 1 n

n

P

i=1

|xi− ¯x|k, s¡ odpowiednikiem momentów Mk = E|X − EX|k.

Kwantylem rz¦du p, gdzie 0 ≤ p ≤ 1, rozkªadu zmiennej losowej X nazywamy warto±¢ xp, dla której speªnione s¡ nierówno±ci

P (X ≤ xp) ≥ p i P (X ≥ xp) ≥ 1 − p, lub równowa»nie:

P (X < xp) = F (xp−) ≤ p ≤ F (xp) = P (X ≤ xp).

Taka liczba xp zawsze istnieje, ale nie musi by¢ wyznaczona jednoznacznie. Je»eli istnieje dokªadnie jedna liczba xp taka, »e P (X ≤ xp) = F (xp) = p, to xp jest p-tym kwantylem.

Podobnie jest w przypadku, gdy F (xp−) < p < F (xp). Je»eli jednak F (a) = F (b) = p, to ka»da z liczb z przedziaªu [a, b] jest p-tym kwantylem. W przypadku rozkªadów absolutnie ci¡gªych (gdzie F (xp−) = F (xp)) denicja kwantyla si¦ upraszcza:

P (X ≤ xp) = F (xp) = p, czyli xp = F−1(p).

Liczb¦ ˆxp nazywamy kwantylem empirycznym rz¦du p, je»eli Fˆn(ˆxp−) ≤ p ≤ ˆFn(ˆxp)

W przypadku rozkªadów dyskretnych sytuacja nie jest jednoznaczna, a rozkªad empi- ryczny zawsze jest dyskretny. Oczywi±cie, statystyka pozycyjna Xdnpe:n jest kwantylem

2

(3)

empirycznym rz¦du p, ale nie jedynym. Najlepiej wida¢ to na przykªadzie mediany próbkowej (kwantyla rz¦du 1/2), któr¡ przyj¦ªo si¦ deniowa¢ nast¦puj¡co:

med =ˆ

 xn+1

2 :n, n − nieparzyste,

1 2 xn

2:n+ xn

2+1:n , n − parzyste.

Formalnie, je±li rozmiar próbki n jest liczb¡ nieparzyst¡, to median¡ z próbki jest staty- styka pozycyjna o numerze (n + 1)/2. Je»eli jednak rozmiar próbki n jest liczb¡ parzyst¡, to median¡ próbkow¡ jest ka»da z liczb z przedziaªu [Xn2:n, Xn

2+1:n]. ‘rodek przedziaªu podaje si¦ po to, aby unikn¡¢ niejednoznaczno±ci.

Kwantyle rz¦du 1/4, 1/2, 3/4 s¡ inaczej nazywane kwartylami. Przy pewnym uprosz- czeniu mo»na powiedzie¢, »e kwartyle dziel¡ uporz¡dkowane dane statystyczne na cztery równe cz¦±ci. Drugi kwartyl pokrywa si¦ z median¡. Mediana dzieli uporz¡dkowane dane na dwie cz¦±ci. Mediana pierwszej z nich to dolny kwartyl (pierwszy kwartyl), a dru- giej to górny kwartyl (trzeci kwartyl). Ró»nica mi¦dzy górnym i dolnym kwartylem to rozst¦p mi¦dzykwartylowy.

Kwantyle rz¦du 1/10, 2/10,..., 9/10 to inaczej decyle. Kwantyle rz¦du 1/100, 2/100,..., 99/100 to inaczej percentyle.

Dominanta (moda) to warto±¢, która w danych wyst¦puje najcz¦±ciej i nie jest war- to±ci¡ skrajn¡ (tzn. minimaln¡ lub maksymaln¡). Je»eli w zestawie danych wyst¦puje kilka warto±ci z t¡ sam¡, najwy»sz¡ cz¦stotliwo±ci¡, to ka»da z tych warto±ci jest mod¡;

w zestawie danych mo»e równie» moda nie wyst¦powa¢.

3

Cytaty

Powiązane dokumenty

jednostek zbiorowości ma wartości nie wyższe niż kwartyl pierwszy, a 75% jednostek zbiorowości ma wartości nie niższe niż kwartyl pierwszy Kwartyl drugi (mediana,

Suma dwóch zbiorów przeliczalnych jest zbiorem przeliczalnym. Je eli który z nich jest zbiorem pustym, to twierdzenie jest oczywiste. Wnioski.. 1) Suma ka dej sko czonej ilo

[r]

[r]

— w tym celu napisać funkcję parametry.opisowe, która dla dowolnej zmiennej wyznaczy parametry opisowe: średnia, kwartyl.1, mediana, kwartyl.3, min, max, rozstęp empiryczny, roz-

b¦dzie ci¡giem nie- zale»nych zmiennych losowych o

• Pami¦tajmy, dªugo±¢ stringu to jest ilo±¢ jego znaków, a rozmiar stringu (jako tablicy) jest zawsze o 1 wi¦kszy.... • Je»eli string inicjalizujemy od razu w momencie

[r]