Rachunek prawdopodobieństwa i statystyka
1 Współczynnik zmienności
Klasycznym współczynnikiem (wskaźnikiem) zmienności zmiennej losowej X nazywamy wyra- żenie
vkz(X) = D(X) E(X), gdzie E(X) 6= 0.
Klasyczny współczynnik zmienności jest miarą rozproszenia, rozrzutu, dyspersji rozkładu wzglę- dem wartości oczekiwanej. Oczywiście 0 ¬ vkz(X) ¬ 1. Często podaje się klasyczny współczyn- nik zmienności w ujęciu procentowym. Wtedy 0 ¬ vkz(X) ¬ 100%. Im wartość tego współczyn- nika jest mniejsza tym rozproszenie (rozrzut, zmienność) jest mniejsze. Można też powiedzieć, że wtedy wartości zmiennej są bardziej skupione wokół wartości oczekiwanej.
Przykład Rozkład zmiennej losowej X jest następujący xk 1 2 3 4 5 6 pk 16 16 16 16 16 16
Ponieważ E(X) = 3, 5, D(X) = 1, 71, więc vzk(X) = 1, 71
3, 5 ≈ 0, 49 = 49%, co oznacza średnią (przeciętną) zmienność.
Przykład Zmienna losowa X ma rozkład jednostajny o gęstości
f (x) =
0 dla x < 1,
1
6 dla 1 ¬ x ¬ 7, 0 dla x > 7.
Ponieważ E(X) = 4, D(X) = √
3, więc vzk(X) =
√3
4 ≈ 0, 43 = 43%,
co oznacza również średnią (przeciętną) zmienność, ale słabszą niż w poprzednim przykładzie.
Pozycyjnym współczynnikiem (wskaźnikiem) zmienności zmiennej losowej X nazywamy wyra- żenie
vzp(X) = Q(X) M e(X),
gdzie M e(X) 6= 0, Q(X) = 12[Q3(X) − Q1(X)] - odchylenie ćwiartkowe.
Pozycyjny współczynnik zmienności jest miarą rozproszenia, rozrzutu, dyspersji rozkładu wzglę- dem mediany. Oczywiście 0 ¬ vpz(X) ¬ 1. Często podaje się pozycyjny współczynnik zmienności w ujęciu procentowym. Wtedy 0 ¬ vzp(X) ¬ 100%.
Przykład Rozkład zmiennej losowej X jest następujący
xk 2 5 7 10
pk 0, 1 0, 2 0, 5 0, 2
Ponieważ M e(X) = 7, Q3(X) = 7, Q1(x) = 5, Q(X) = 12[7 − 5] = 1, więc vzp(X) = 1
7 ≈ 0, 14 = 14%,
co oznacza dość słabą zmienność, czyli wartości są mocno skupione wokół mediany.
Dla porównania E(X) = 6, 7, D(X) = 2, 24, skąd vzk(X) ≈ 0, 33 = 33%, czyli zmienność wokół wartości oczekiwanej jest słaba.
Przykład Zmienna losowa X ma rozkład wykładniczy o gęstości
f (x) =
0 dla x < 0, 2e−2x dla x 0.
Ponieważ M e(X) = 12 ln 2, Q3(X) = 12ln 4, Q1(x) = 12ln43, Q(X) = 12h12ln 4 − 12ln43i = 14ln 3, więc
vpz(X) =
1 4 ln 3
1
2 ln 2 ≈ 0, 79 = 79%,
co oznacza silną zmienność, czyli wartości są słabo skupione wokół mediany.
Dla porównania E(X) = 12, D(X) = 12, skąd vkz(X) = 1 = 100%, czyli zmienność wokół wartości oczekiwanej jest bardzo silna.
2 Współczynnik asymetrii
Mówimy, że zmienna losowa ma rozkład symetryczny względem prostej x = a, jeżeli
1. w przypadku zmiennej losowej skokowej o punktach skokowych xk dla każdego punktu xi ¬ a istnieje taki punkt xj a, że
P (X = xi) = P (X = xj) oraz a − xi = xj − a,
2. w przypadku zmiennej losowej ciągłej o gęstości f (x) zachodzi f (a − x) = f (a + x)
dla każdego x w punktach ciągłości funkcji f .
Prostą o równaniu x = a nazywamy osią symetrii rozkładu. Jeżeli takie a nie istnieje, to mówimy o asymetrii rozkładu. W statystyce bada głównie się asymetrię względem wartości oczekiwanej.
Słowo asymetria zastępuje się czasem słowem skośność.
Współczynnikiem asymetrii rozkładu zmiennej losowej X nazywamy wyrażenie wa(X) = µ3
D3(X),
gdzie µ3 - moment centralny trzeciego rzędu, który można obliczyć według wzoru µ3 = m3− 3m1m2+ 2m31,
gdzie mk= E(Xk) - momenty zwykłe k-tego rzędu, k = 1, 2, 3 oraz D(X) = √
µ2, µ2 = m2− m21.
Jeżeli wa(X) > 0, to mówimy, że rozkład ma asymetrię prawostronną (dodatnią). Jeżeli wa(X) <
0, to mówimy, że rozkład ma asymetrię lewostronną (ujemną). Jeżeli wa(X) = 0, to mówimy, że rozkład jest symetryczny. Współczynnik asymetrii mierzy zatem kierunek asymetrii oraz jej siłę: im |wa(X)| jest większe tym asymetria jest silniejsza.
Przykład Rozkład zmiennej losowej X jest następujący
xk 2 5 7 10
pk 0, 1 0, 2 0, 5 0, 2
Wiemy już, że m1 = E(X) = 6, 7. Analogicznie można obliczyć m2 = E(X2) = 49, 9, m3 = E(X3) = 397, 3, skąd µ3 = −4, 164. Ponadto µ2 = 5, 01, D(X) = 2, 238, więc ostatecznie
wa(X) = −4, 164
(2, 238)3 ≈ −0, 37 = −37%, czyli mamy słabą asymetrię lewostronną tego rozkładu.
Przykład Zmienna losowa X ma rozkład wykładniczy o gęstości
f (x) =
0 dla x < 0, 2e−2x dla x 0.
Ponieważ teraz mamy wzory mk=
Z +∞
−∞ xkf (x) dx = 2
Z +∞
0
xke−2x dx, k = 1, 2, 3,
z których obliczamy kolejno m1 = 12, m2 = 12, m3 = 34, skąd µ3 = 14. Ponadto µ2 = 14, czyli D(X) = 12, więc ostatecznie
wa(X) =
1 4
1
2
3 = 2 = 200%, czyli mamy bardzo silną asymetrię prawostronną tego rozkładu.
W wielu przypadkach korzysta się klasycznego współczynnika asymetrii postaci vka(X) = E(X) − Do(X)
D(X) ,
który jest interpolacyjnym przybliżeniem współczynnika wa(X).
Przykład Rozkład zmiennej losowej X jest następujący
xk 2 5 7 10
pk 0, 1 0, 2 0, 5 0, 2 Mamy tutaj E(X) = 6, 7, D(X) = 2, 238, Do(X) = 7, zatem
vak(X) = 6, 7 − 7
2, 238 ≈ −0, 13 = −13%, co oznacza, że mamy dość słabą asymetrię lewostronną rozkładu.
Przykład Zmienna losowa X ma rozkład wykładniczy o gęstości
f (x) =
0 dla x < 0, 2e−2x dla x 0.
Mamy tutaj E(X) = 12, ale Do(X) nie możemy wyznaczyć, gdyż funkcja f nie ma maksimum lokalnego. Posłużymy się wzorem Pearsona. Ponieważ M e(X) = 12ln 2, więc
Do(X) ≈ E(X) − 3[E(X) − M e(X)] = −1 + 3
2ln 2 ≈ 0, 04.
Wobec powyższego mamy
vak(X) =
1
2 −−1 + 32ln 2
1 2
≈ 0, 92 = 92%,
co oznacza, że mamy silną asymetrię prawostronną rozkładu.
Określa się także pozycyjny współczynnik asymetrii według wzoru vap(X) = [Q3(x) − M e(X)] − [M e(x) − Q1(X)]
2Q(X) .
Przykład Rozkład zmiennej losowej X jest następujący
xk 2 5 7 10 pk 0, 1 0, 2 0, 5 0, 2
Mamy tutaj M e(X) = 7, Q1(X) = 5, Q3(X) = 7, Q(X) = 1, zatem vpa(X) = [7 − 7] − [7 − 5]
2 · 1 = −1 = −100%, co oznacza, że mamy silną asymetrię lewostronną rozkładu.
Przykład Zmienna losowa X ma rozkład wykładniczy o gęstości
f (x) =
0 dla x < 0, 2e−2x dla x 0.
Mamy tutaj M e(X) = 12ln 2, Q3(X) = 12 ln 4, Q1(x) = 12ln43, Q(X) = 14ln 3, zatem
vpa(X) =
h1
2ln 4 − 12ln 2i−h12ln 2 − 12ln43i
2 · 14ln 3 = ln43
ln 3 ≈ 0, 26 = 26%, co oznacza, że mamy słabą asymetrię prawostronn¸a rozkładu.