Rachunek prawdopodobieństwa i statystyka

(1)

Rachunek prawdopodobieństwa i statystyka

1 Współczynnik zmienności

Klasycznym współczynnikiem (wskaźnikiem) zmienności zmiennej losowej X nazywamy wyra- żenie

v^k_z(X) = D(X) E(X), gdzie E(X) 6= 0.

Klasyczny współczynnik zmienności jest miarą rozproszenia, rozrzutu, dyspersji rozkładu wzglę- dem wartości oczekiwanej. Oczywiście 0 ¬ v^k_z(X) ¬ 1. Często podaje się klasyczny współczyn- nik zmienności w ujęciu procentowym. Wtedy 0 ¬ v^k_z(X) ¬ 100%. Im wartość tego współczyn- nika jest mniejsza tym rozproszenie (rozrzut, zmienność) jest mniejsze. Można też powiedzieć, że wtedy wartości zmiennej są bardziej skupione wokół wartości oczekiwanej.

Przykład Rozkład zmiennej losowej X jest następujący x_k 1 2 3 4 5 6 p_k ¹₆ ¹₆ ¹₆ ¹₆ ¹₆ ¹₆

Ponieważ E(X) = 3, 5, D(X) = 1, 71, więc v_z^k(X) = 1, 71

3, 5 ≈ 0, 49 = 49%, co oznacza średnią (przeciętną) zmienność.

Przykład Zmienna losowa X ma rozkład jednostajny o gęstości

f (x) =











0 dla x < 1,

1

6 dla 1 ¬ x ¬ 7, 0 dla x > 7.

Ponieważ E(X) = 4, D(X) = √

3, więc v_z^k(X) =

√3

4 ≈ 0, 43 = 43%,

co oznacza również średnią (przeciętną) zmienność, ale słabszą niż w poprzednim przykładzie.

(2)

Pozycyjnym współczynnikiem (wskaźnikiem) zmienności zmiennej losowej X nazywamy wyra- żenie

v_z^p(X) = Q(X) M e(X),

gdzie M e(X) 6= 0, Q(X) = ¹₂[Q₃(X) − Q₁(X)] - odchylenie ćwiartkowe.

Pozycyjny współczynnik zmienności jest miarą rozproszenia, rozrzutu, dyspersji rozkładu wzglę- dem mediany. Oczywiście 0 ¬ v^p_z(X) ¬ 1. Często podaje się pozycyjny współczynnik zmienności w ujęciu procentowym. Wtedy 0 ¬ v_z^p(X) ¬ 100%.

Przykład Rozkład zmiennej losowej X jest następujący

x_k 2 5 7 10

p_k 0, 1 0, 2 0, 5 0, 2

Ponieważ M e(X) = 7, Q₃(X) = 7, Q₁(x) = 5, Q(X) = ¹₂[7 − 5] = 1, więc v_z^p(X) = 1

7 ≈ 0, 14 = 14%,

co oznacza dość słabą zmienność, czyli wartości są mocno skupione wokół mediany.

Dla porównania E(X) = 6, 7, D(X) = 2, 24, skąd v_z^k(X) ≈ 0, 33 = 33%, czyli zmienność wokół wartości oczekiwanej jest słaba.

Przykład Zmienna losowa X ma rozkład wykładniczy o gęstości

f (x) =







0 dla x < 0, 2e^−2x dla x 0.

Ponieważ M e(X) = ¹₂ ln 2, Q₃(X) = ¹₂ln 4, Q₁(x) = ¹₂ln⁴₃, Q(X) = ¹₂^h¹₂ln 4 − ¹₂ln⁴₃ⁱ = ¹₄ln 3, więc

v^p_z(X) =

1 4 ln 3

1

2 ln 2 ≈ 0, 79 = 79%,

co oznacza silną zmienność, czyli wartości są słabo skupione wokół mediany.

Dla porównania E(X) = ¹₂, D(X) = ¹₂, skąd v^k_z(X) = 1 = 100%, czyli zmienność wokół wartości oczekiwanej jest bardzo silna.

2 Współczynnik asymetrii

Mówimy, że zmienna losowa ma rozkład symetryczny względem prostej x = a, jeżeli

1. w przypadku zmiennej losowej skokowej o punktach skokowych x_k dla każdego punktu x_i ¬ a istnieje taki punkt x_j  a, że

P (X = x_i) = P (X = x_j) oraz a − x_i = x_j − a,

(3)

2. w przypadku zmiennej losowej ciągłej o gęstości f (x) zachodzi f (a − x) = f (a + x)

dla każdego x w punktach ciągłości funkcji f .

Prostą o równaniu x = a nazywamy osią symetrii rozkładu. Jeżeli takie a nie istnieje, to mówimy o asymetrii rozkładu. W statystyce bada głównie się asymetrię względem wartości oczekiwanej.

Słowo asymetria zastępuje się czasem słowem skośność.

Współczynnikiem asymetrii rozkładu zmiennej losowej X nazywamy wyrażenie wa(X) = µ3

D³(X),

gdzie µ3 - moment centralny trzeciego rzędu, który można obliczyć według wzoru µ₃ = m₃− 3m₁m₂+ 2m³₁,

gdzie m_k= E(X^k) - momenty zwykłe k-tego rzędu, k = 1, 2, 3 oraz D(X) = √

µ₂, µ₂ = m₂− m²₁.

Jeżeli w_a(X) > 0, to mówimy, że rozkład ma asymetrię prawostronną (dodatnią). Jeżeli w_a(X) <

0, to mówimy, że rozkład ma asymetrię lewostronną (ujemną). Jeżeli w_a(X) = 0, to mówimy, że rozkład jest symetryczny. Współczynnik asymetrii mierzy zatem kierunek asymetrii oraz jej siłę: im |wa(X)| jest większe tym asymetria jest silniejsza.

x_k 2 5 7 10

p_k 0, 1 0, 2 0, 5 0, 2

Wiemy już, że m₁ = E(X) = 6, 7. Analogicznie można obliczyć m₂ = E(X²) = 49, 9, m₃ = E(X³) = 397, 3, skąd µ₃ = −4, 164. Ponadto µ₂ = 5, 01, D(X) = 2, 238, więc ostatecznie

w_a(X) = −4, 164

(2, 238)³ ≈ −0, 37 = −37%, czyli mamy słabą asymetrię lewostronną tego rozkładu.

f (x) =







0 dla x < 0, 2e^−2x dla x 0.

Ponieważ teraz mamy wzory mk=

Z +∞

−∞ x^kf (x) dx = 2

Z +∞

0

x^ke^−2x dx, k = 1, 2, 3,

(4)

z których obliczamy kolejno m₁ = ¹₂, m₂ = ¹₂, m₃ = ³₄, skąd µ₃ = ¹₄. Ponadto µ₂ = ¹₄, czyli D(X) = ¹₂, więc ostatecznie

wa(X) =

1 4

₁

2

3 = 2 = 200%, czyli mamy bardzo silną asymetrię prawostronną tego rozkładu.

W wielu przypadkach korzysta się klasycznego współczynnika asymetrii postaci v^k_a(X) = E(X) − Do(X)

D(X) ,

który jest interpolacyjnym przybliżeniem współczynnika w_a(X).

x_k 2 5 7 10

p_k 0, 1 0, 2 0, 5 0, 2 Mamy tutaj E(X) = 6, 7, D(X) = 2, 238, Do(X) = 7, zatem

v_a^k(X) = 6, 7 − 7

2, 238 ≈ −0, 13 = −13%, co oznacza, że mamy dość słabą asymetrię lewostronną rozkładu.

f (x) =







0 dla x < 0, 2e^−2x dla x 0.

Mamy tutaj E(X) = ¹₂, ale Do(X) nie możemy wyznaczyć, gdyż funkcja f nie ma maksimum lokalnego. Posłużymy się wzorem Pearsona. Ponieważ M e(X) = ¹₂ln 2, więc

Do(X) ≈ E(X) − 3[E(X) − M e(X)] = −1 + 3

2ln 2 ≈ 0, 04.

Wobec powyższego mamy

v_a^k(X) =

1

2 −−1 + ³₂ln 2

1 2

≈ 0, 92 = 92%,

co oznacza, że mamy silną asymetrię prawostronną rozkładu.

Określa się także pozycyjny współczynnik asymetrii według wzoru v_a^p(X) = [Q₃(x) − M e(X)] − [M e(x) − Q₁(X)]

2Q(X) .

(5)

x_k 2 5 7 10 p_k 0, 1 0, 2 0, 5 0, 2

Mamy tutaj M e(X) = 7, Q₁(X) = 5, Q₃(X) = 7, Q(X) = 1, zatem v^p_a(X) = [7 − 7] − [7 − 5]

2 · 1 = −1 = −100%, co oznacza, że mamy silną asymetrię lewostronną rozkładu.

f (x) =







0 dla x < 0, 2e^−2x dla x 0.

Mamy tutaj M e(X) = ¹₂ln 2, Q₃(X) = ¹₂ ln 4, Q₁(x) = ¹₂ln⁴₃, Q(X) = ¹₄ln 3, zatem

v^p_a(X) =

h1

2ln 4 − ¹₂ln 2ⁱ−^h¹₂ln 2 − ¹₂ln⁴₃ⁱ

2 · ¹₄ln 3 = ln⁴₃

ln 3 ≈ 0, 26 = 26%, co oznacza, że mamy słabą asymetrię prawostronn¸a rozkładu.