Rachunek prawdopodobieństwa i statystyka
1 Momenty
Zmienna losowa jest wystarczająco dokładnie opisana przez jej rozkład prawdopodobieństwa.
Względy praktyczne dyktują jednak potrzebę znalezienia charakterystyk liczbowych rozkładu, ponieważ są to opisy krótkie i umożliwiające szybkie porównanie rozkładów.
Momentem zwykłym rzędu r (r = 1, 2, . . .) zmiennej losowej X nazywamy mr =X
k
xrkpk
w przypadku zmiennej losowej skokowej oraz mr =
Z +∞
−∞ xrf (x) dx w przypadku zmiennej losowej ciągłej.
Moment zwykły rzędu pierwszego nazywamy wartością przeciętną lub wartością oczekiwaną i oznaczamy symbolem E(X), tj.
E(X) =X
k
xkpk
w przypadku zmiennej losowej skokowej oraz E(X) =
Z +∞
−∞ xf (x) dx w przypadku zmiennej losowej ciągłej.
Momentem centralnym rzędu r (r = 1, 2, . . .) zmiennej losowej X nazywamy µr=X
k
(xk− m1)rpk
w przypadku zmiennej losowej skokowej oraz µr =
Z +∞
−∞ (x − m1)rf (x) dx w przypadku zmiennej losowej ciągłej.
Moment centralny rzędu drugiego nazywamy wariancją i oznaczamy symbolem D2(X), tj.
D2(X) = X
k
[xk− E(X)]2pk w przypadku zmiennej losowej skokowej oraz
D2(X) =
Z +∞
−∞ [x − E(X)]2f (x) dx w przypadku zmiennej losowej ciągłej.
Pierwiastek kwadratowy z wariancji nazywamy odchyleniem standardowym i oznaczamy sym- bolem D(X).
Przykład Rzut kostką do gry. Rozkład zmiennej losowej X jest następujący xk 1 2 3 4 5 6
pk 16 16 16 16 16 16 Obliczamy wartość oczekiwaną
E(X) =
6
X
k=1
kpk= 1
6(1 + 2 + 3 + 4 + 5 + 6) = 3, 5 oraz wariancję
D2(X) =
6
X
k=1
[k − E(X)]2pk = 1
6[(1 − 3, 5)2+ (2 − 3, 5)2+
+(3 − 3, 5)2+ (4 − 3, 5)2+ (5 − 3, 5)2+ (6 − 3, 5)2] = 2, 92, skąd odchylenie standardowe D(X) = 1, 71.
Przykład Zmienna losowa X ma rozkład jednostajny o gęstości
f (x) =
0 dla x < a,
1
b−a dla a ¬ x ¬ b, 0 dla x > b.
Wartość oczekiwana tego rozkładu jest równa E(X) = 1
b − a
Z b a
x dx = a + b 2 , a wariancja
D2(X) = 1 b − a
Z b a
x − a + b 2
!2
dx = 1
12(b − a)2, skąd odchylenie standardowe D(X) =
√ 3
6 (b − a).
Przykład Zmienna losowa X podlega rozkładowi Bernoulliego. Funkcja prawdopodobień- stwa tej zmiennej dana jest wzorem
P (X = k) =
n k
pkqn−k, q = 1 − p, 0 < p < 1, k = 0, 1, . . . , n.
Obliczymy wartość oczekiwaną tej zmiennej E(X) =
n
X
k=0
k · P (X = k) =
n
X
k=0
k · n!
k!(n − k)!pkqn−k =
n
X
k=1
k · n!
k!(n − k)!pkqn−k =
= np
n
X
k=1
(n − 1)!
(k − 1)!(n − k)!pk−1qn−k = np
n−1
X
j=0
(n − 1)!
j!(n − 1 − j)!pjqn−1−j = np(p + q)n−1= np.
Analogicznie można obliczyć wariancję i odchylenie standardowe tej zmiennej i otrzymać kolejno D2(X) = npq, D(X) =√
npq.
Przykład Zmienna losowa X ma rozkład normalny o parametrach m i σ, σ > 0 o gęstości f (x) = 1
σ√
2πexp
"
−(x − m)2 2σ2
#
, −∞ < x < +∞.
Obliczymy wartość oczekiwaną tej zmiennej E(X) =
Z +∞
−∞
x σ√
2πexp
"
−(x − m)2 2σ2
#
dx.
Stosując podstawienie x−mσ = z otrzymujemy E(X) = 1
√2π
Z +∞
−∞ (m+σz) exp
"
−z2 2
#
dz = m
√2π
Z +∞
−∞ exp
"
−z2 2
#
dz+ σ
√2π
Z +∞
−∞ z exp
"
−z2 2
#
dz.
Ponieważ
√1 2π
Z +∞
−∞
exp
"
−z2 2
#
dz = 1 oraz
Z +∞
−∞ z exp
"
−z2 2
#
dz = 0,
więc ostatecznie otrzymujemy E(X) = m. Analogicznie można obliczyć wariancję D2(X) = σ2. Moment zwykły rzędu drugiego m2 może być traktowany jako wartość oczekiwana zmiennej losowej Y = X2, czyli m2 = E(X2). Korzystając z tego możemy otrzymać relację
D2(X) = E(X2) − E2(X).
Przykład Rzut kostką do gry. Rozkład zmiennej losowej X2 jest następujący x2k 1 4 9 16 25 36
pk 16 16 16 16 16 16
Obliczamy wartość oczekiwaną E(X2) =
6
X
k=1
k2pk= 1
6(1 + 4 + 9 + 16 + 25 + 36) = 15, 17, skąd mamy
D2(X) = 15, 17 − (3, 5)2 = 15, 17 − 12, 25 = 2, 92.
Przykład Zmienna losowa X ma rozkład jednostajny o gęstości
f (x) =
0 dla x < a,
1
b−a dla a ¬ x ¬ b, 0 dla x > b.
Wartość oczekiwana
E(X2) = 1 b − a
Z b a
x2 dx = a2+ ab + b2
3 ,
skąd
D2(X) = a2+ ab + b2
3 − (a + b)2
4 = (b − a)2 12 .
2 Mediana
Medianą M e(X) zmiennej losowej typu skokowego X nazywa się liczbę x spełniającą związki P (X ¬ x) 1
2 oraz P (X x) 1 2. Przykład Rozkład zmiennej losowej X jest następujący
xk 2 5 7 10
pk 0, 1 0, 2 0, 5 0, 2 Mediana M e(X) = 7, ponieważ
P (X ¬ 7) = 0, 8 > 0, 5 oraz P (X 7) = 0, 7 > 0, 5.
Medianą M e(X) zmiennej losowej typu ciągłego X o gęstości f i dystrybuancie F nazywa się liczbę x spełniającą równość
F (x) = 1 2 lub
Z x
−∞f (t) dt = 1 2.
Przykład Zmienna losowa X ma rozkład wykładniczy o gęstości
f (x) =
0 dla x < 0, λe−λx dla x 0.
Mamy
Z x
−∞f (t) dt = λ
Z x 0
e−λt dt = −e−λx+ 1 = 1 2, skąd otrzymujemy
x = M e(X) = 1 λln 2.
Dystrybuanta rozkładu wykładniczego jest dana wzorem
F (x) =
0 dla x ¬ 0,
1 − e−λx dla x > 0.
Zatem warunek F (x) = 12 prowadzi do równości 1 − e−λx = 1
2, skąd
x = M e(X) = 1 λln 2.
3 Kwartyle
Kwartylem pierwszym (dolnym) Q1(X) = Qd(X) zmiennej losowej typu skokowego X nazywa się liczbę x spełniającą związki
P (X ¬ x) 1
4 oraz P (X x) 3 4.
Kwartylem trzecim (górnym) Q3(X) = Qg(X) zmiennej losowej typu skokowego X nazywa się liczbę x spełniającą związki
P (X ¬ x) 3
4 oraz P (X x) 1 4. Z powyższych definicji wynika, że Q2(X) = M e(X).
Przykład Rozkład zmiennej losowej X jest następujący
xk 2 5 7 10
pk 0, 1 0, 2 0, 5 0, 2 Kwartyl pierwszy Q1(X) = 5, ponieważ
P (X ¬ 5) = 0, 3 > 0, 25 oraz P (X 5) = 0, 9 > 0, 75.
Kwartyl trzeci Q3(X) = 7, ponieważ
P (X ¬ 7) = 0, 8 > 0, 75 oraz P (X 7) = 0, 7 > 0, 25.
Kwartylem pierwszym (dolnym) Q1(X) = Qd(X) zmiennej losowej typu ciągłego X o gęstości f i dystrybuancie F nazywa się liczbę x spełniającą równość
F (x) = 1 4 lub
Z x
−∞
f (t) dt = 1 4.
Kwartylem trzecim (górnym) Q3(X) = Qg(X) zmiennej losowej typu ciągłego X o gęstości f i dystrybuancie F nazywa się liczbę x spełniającą równość
F (x) = 3 4 lub
Z x
−∞f (t) dt = 3 4. Z powyższych definicji wynika, że Q2(X) = M e(X).
Przykład Zmienna losowa X ma rozkład wykładniczy o gęstości
f (x) =
0 dla x < 0, λe−λx dla x 0.
Mamy
Z x
−∞
f (t) dt = λ
Z x 0
e−λt dt = −e−λx+ 1 = 1 4, skąd otrzymujemy
x = Q1(X) = 1 λln4
3. Dystrybuanta rozkładu wykładniczego jest dana wzorem
F (x) =
0 dla x ¬ 0,
1 − e−λx dla x > 0.
Zatem warunek F (x) = 14 prowadzi do równości 1 − e−λx = 1
4, skąd
x = Q1(X) = 1 λln4
3. Analogicznie
Z x
−∞f (t) dt = λ
Z x 0
e−λt dt = −e−λx+ 1 = 3 4, skąd otrzymujemy
x = Q3(X) = 1 λln 4.
Dystrybuanta rozkładu wykładniczego jest dana wzorem F (x) =
0 dla x ¬ 0,
1 − e−λx dla x > 0.
Zatem warunek F (x) = 34 prowadzi do równości 1 − e−λx = 3
4, skąd
x = Q3(X) = 1 λln 4.
4 Dominanta (Moda)
Dominantą Do(X) zmiennej losowej typu skokowego X nazywa się wartość zmiennej losowej, której odpowiada największe prawdopodobieństwo.
Przykład Rozkład zmiennej losowej X jest następujący
xk 2 5 7 10
pk 0, 1 0, 2 0, 5 0, 2 Z rozkładu zmiennej loswej wynika bezpośrednio, że Do(X) = 7.
Dominantą Do(X) zmiennej losowej typu ciągłego X nazywa się wartość zmiennej losowej X, dla której gęstość przyjmuje maksimumu lokalne.
Przykład Zmienna losowa X ma rozkład o gęstości
f (x) =
0 dla x < 0, 6(x − x2) dla 0 ¬ x ¬ 1, 0 dla x > 1.
Ponieważ
f0(x) =
0 dla x < 0, 6(1 − 2x) dla 0 < x < 1, 0 dla x > 1.
co oznacza, że Do(X) = 12.
Uwaga Zachodzi wzór przybliżony (zwany wzorem Pearsona) E(X) − Do(X) ≈ 3 [E(X) − M e(X)] . Przykład Zmienna losowa X ma rozkład o gęstości
f (x) =
0 dla x < 0, 6(x − x2) dla 0 ¬ x ¬ 1, 0 dla x > 1.
Wiemy, że Do(X) = 12. Obliczymy E(X) E(X) =
Z +∞
−∞
xf (x) dx =
Z 1 0
(6x2− 6x3) dx =
2x3−3 2x4
1 0
= 1 2. Z wzoru Pearsona wynika, że M e(X) ≈ 12.
Wyznaczenie mediany z definicji prowadzi do równania
Z x 0
(6t − 6t2) dt = 3x2− 2x3 = 1 2, którego jednym z rozwiązań jest x = 12, czyli M e(X) = 12. Przykład Rozkład zmiennej losowej X jest następujący
xk 2 5 7 10
pk 0, 1 0, 2 0, 5 0, 2 Wiemy, że M e(X) = Do(X) = 7.
Z wzoru Pearsona wynika więc, że E(X) ≈ 7.
Wyznaczenie wartości oczekiwanej z definicji prowadzi do
E(X) = 2 · 0, 1 + 5 · 0, 2 + 7 · 0, 5 + 10 · 0, 2 = 6, 7.