Rachunek prawdopodobieństwa i statystyka

(1)

Rachunek prawdopodobieństwa i statystyka

1 Momenty

Zmienna losowa jest wystarczająco dokładnie opisana przez jej rozkład prawdopodobieństwa.

Względy praktyczne dyktują jednak potrzebę znalezienia charakterystyk liczbowych rozkładu, ponieważ są to opisy krótkie i umożliwiające szybkie porównanie rozkładów.

Momentem zwykłym rzędu r (r = 1, 2, . . .) zmiennej losowej X nazywamy m_r =^X

k

x^r_kp_k

w przypadku zmiennej losowej skokowej oraz m_r =

Z _+∞

−∞ x^rf (x) dx w przypadku zmiennej losowej ciągłej.

Moment zwykły rzędu pierwszego nazywamy wartością przeciętną lub wartością oczekiwaną i oznaczamy symbolem E(X), tj.

E(X) =^X

k

x_kp_k

w przypadku zmiennej losowej skokowej oraz E(X) =

Z +∞

−∞ xf (x) dx w przypadku zmiennej losowej ciągłej.

Momentem centralnym rzędu r (r = 1, 2, . . .) zmiennej losowej X nazywamy µ_r=^X

k

(x_k− m₁)^rp_k

w przypadku zmiennej losowej skokowej oraz µ_r =

Z +∞

−∞ (x − m₁)^rf (x) dx w przypadku zmiennej losowej ciągłej.

(2)

Moment centralny rzędu drugiego nazywamy wariancją i oznaczamy symbolem D²(X), tj.

D²(X) = ^X

k

[x_k− E(X)]²p_k w przypadku zmiennej losowej skokowej oraz

D²(X) =

Z +∞

−∞ [x − E(X)]²f (x) dx w przypadku zmiennej losowej ciągłej.

Pierwiastek kwadratowy z wariancji nazywamy odchyleniem standardowym i oznaczamy sym- bolem D(X).

Przykład Rzut kostką do gry. Rozkład zmiennej losowej X jest następujący x_k 1 2 3 4 5 6

p_k ¹₆ ¹₆ ¹₆ ¹₆ ¹₆ ¹₆ Obliczamy wartość oczekiwaną

E(X) =

6

X

k=1

kp_k= 1

6(1 + 2 + 3 + 4 + 5 + 6) = 3, 5 oraz wariancję

D²(X) =

6

X

k=1

[k − E(X)]²pk = 1

6[(1 − 3, 5)²+ (2 − 3, 5)²+

+(3 − 3, 5)²+ (4 − 3, 5)²+ (5 − 3, 5)²+ (6 − 3, 5)²] = 2, 92, skąd odchylenie standardowe D(X) = 1, 71.

Przykład Zmienna losowa X ma rozkład jednostajny o gęstości

f (x) =











0 dla x < a,

1

b−a dla a ¬ x ¬ b, 0 dla x > b.

Wartość oczekiwana tego rozkładu jest równa E(X) = 1

b − a

Z b a

x dx = a + b 2 , a wariancja

D²(X) = 1 b − a

Z b a

x − a + b 2

!2

dx = 1

12(b − a)², skąd odchylenie standardowe D(X) =

√ 3

6 (b − a).

(3)

Przykład Zmienna losowa X podlega rozkładowi Bernoulliego. Funkcja prawdopodobień- stwa tej zmiennej dana jest wzorem

P (X = k) =

n k

p^kq^n−k, q = 1 − p, 0 < p < 1, k = 0, 1, . . . , n.

Obliczymy wartość oczekiwaną tej zmiennej E(X) =

n

X

k=0

k · P (X = k) =

n

X

k=0

k · n!

k!(n − k)!p^kq^n−k =

n

X

k=1

k · n!

k!(n − k)!p^kq^n−k =

= np

n

X

k=1

(n − 1)!

(k − 1)!(n − k)!p^k−1q^n−k = np

n−1

X

j=0

(n − 1)!

j!(n − 1 − j)!p^jq^n−1−j = np(p + q)ⁿ⁻¹= np.

Analogicznie można obliczyć wariancję i odchylenie standardowe tej zmiennej i otrzymać kolejno D²(X) = npq, D(X) =√

npq.

Przykład Zmienna losowa X ma rozkład normalny o parametrach m i σ, σ > 0 o gęstości f (x) = 1

σ√

2πexp

"

−(x − m)² 2σ²

#

, −∞ < x < +∞.

Obliczymy wartość oczekiwaną tej zmiennej E(X) =

Z +∞

−∞

x σ√

2πexp

"

−(x − m)² 2σ²

#

dx.

Stosując podstawienie ^x−m_σ = z otrzymujemy E(X) = 1

√2π

Z +∞

−∞ (m+σz) exp

"

−z² 2

#

dz = m

√2π

Z +∞

−∞ exp

"

−z² 2

#

dz+ σ

√2π

Z +∞

−∞ z exp

"

−z² 2

#

dz.

Ponieważ

√1 2π

Z +∞

−∞

exp

"

−z² 2

#

dz = 1 oraz

Z +∞

−∞ z exp

"

−z² 2

#

dz = 0,

więc ostatecznie otrzymujemy E(X) = m. Analogicznie można obliczyć wariancję D²(X) = σ². Moment zwykły rzędu drugiego m₂ może być traktowany jako wartość oczekiwana zmiennej losowej Y = X², czyli m₂ = E(X²). Korzystając z tego możemy otrzymać relację

D²(X) = E(X²) − E²(X).

Przykład Rzut kostką do gry. Rozkład zmiennej losowej X² jest następujący x²_k 1 4 9 16 25 36

p_k ¹₆ ¹₆ ¹₆ ¹₆ ¹₆ ¹₆

(4)

Obliczamy wartość oczekiwaną E(X²) =

6

X

k=1

k²p_k= 1

6(1 + 4 + 9 + 16 + 25 + 36) = 15, 17, skąd mamy

D²(X) = 15, 17 − (3, 5)² = 15, 17 − 12, 25 = 2, 92.

Przykład Zmienna losowa X ma rozkład jednostajny o gęstości

f (x) =











0 dla x < a,

1

b−a dla a ¬ x ¬ b, 0 dla x > b.

Wartość oczekiwana

E(X²) = 1 b − a

Z b a

x² dx = a²+ ab + b²

3 ,

skąd

D²(X) = a²+ ab + b²

3 − (a + b)²

4 = (b − a)² 12 .

2 Mediana

Medianą M e(X) zmiennej losowej typu skokowego X nazywa się liczbę x spełniającą związki P (X ¬ x)  1

2 oraz P (X x)  1 2. Przykład Rozkład zmiennej losowej X jest następujący

x_k 2 5 7 10

p_k 0, 1 0, 2 0, 5 0, 2 Mediana M e(X) = 7, ponieważ

P (X ¬ 7) = 0, 8 > 0, 5 oraz P (X 7) = 0, 7 > 0, 5.

Medianą M e(X) zmiennej losowej typu ciągłego X o gęstości f i dystrybuancie F nazywa się liczbę x spełniającą równość

F (x) = 1 2 lub

Z x

−∞f (t) dt = 1 2.

Przykład Zmienna losowa X ma rozkład wykładniczy o gęstości

f (x) =







0 dla x < 0, λe^−λx dla x 0.

(5)

Mamy

Z x

−∞f (t) dt = λ

Z x 0

e^−λt dt = −e^−λx+ 1 = 1 2, skąd otrzymujemy

x = M e(X) = 1 λln 2.

Dystrybuanta rozkładu wykładniczego jest dana wzorem

F (x) =







0 dla x ¬ 0,

1 − e^−λx dla x > 0.

Zatem warunek F (x) = ¹₂ prowadzi do równości 1 − e^−λx = 1

2, skąd

x = M e(X) = 1 λln 2.

3 Kwartyle

Kwartylem pierwszym (dolnym) Q₁(X) = Q_d(X) zmiennej losowej typu skokowego X nazywa się liczbę x spełniającą związki

P (X ¬ x)  1

4 oraz P (X x)  3 4.

Kwartylem trzecim (górnym) Q₃(X) = Q_g(X) zmiennej losowej typu skokowego X nazywa się liczbę x spełniającą związki

P (X ¬ x)  3

4 oraz P (X x)  1 4. Z powyższych definicji wynika, że Q₂(X) = M e(X).

Przykład Rozkład zmiennej losowej X jest następujący

x_k 2 5 7 10

pk 0, 1 0, 2 0, 5 0, 2 Kwartyl pierwszy Q₁(X) = 5, ponieważ

P (X ¬ 5) = 0, 3 > 0, 25 oraz P (X 5) = 0, 9 > 0, 75.

Kwartyl trzeci Q₃(X) = 7, ponieważ

P (X ¬ 7) = 0, 8 > 0, 75 oraz P (X 7) = 0, 7 > 0, 25.

(6)

Kwartylem pierwszym (dolnym) Q₁(X) = Q_d(X) zmiennej losowej typu ciągłego X o gęstości f i dystrybuancie F nazywa się liczbę x spełniającą równość

F (x) = 1 4 lub

Z x

−∞

f (t) dt = 1 4.

Kwartylem trzecim (górnym) Q₃(X) = Q_g(X) zmiennej losowej typu ciągłego X o gęstości f i dystrybuancie F nazywa się liczbę x spełniającą równość

F (x) = 3 4 lub

Z x

−∞f (t) dt = 3 4. Z powyższych definicji wynika, że Q2(X) = M e(X).

Przykład Zmienna losowa X ma rozkład wykładniczy o gęstości

f (x) =







0 dla x < 0, λe^−λx dla x 0.

Mamy

Z x

−∞

f (t) dt = λ

Z x 0

x = Q1(X) = 1 λln4

3. Dystrybuanta rozkładu wykładniczego jest dana wzorem

F (x) =







0 dla x ¬ 0,

1 − e^−λx dla x > 0.

Zatem warunek F (x) = ¹₄ prowadzi do równości 1 − e^−λx = 1

4, skąd

x = Q₁(X) = 1 λln4

3. Analogicznie

Z x

−∞f (t) dt = λ

Z x 0

x = Q₃(X) = 1 λln 4.

(7)

Dystrybuanta rozkładu wykładniczego jest dana wzorem F (x) =







0 dla x ¬ 0,

1 − e^−λx dla x > 0.

Zatem warunek F (x) = ³₄ prowadzi do równości 1 − e^−λx = 3

4, skąd

x = Q₃(X) = 1 λln 4.

4 Dominanta (Moda)

Dominantą Do(X) zmiennej losowej typu skokowego X nazywa się wartość zmiennej losowej, której odpowiada największe prawdopodobieństwo.

Przykład Rozkład zmiennej losowej X jest następujący

x_k 2 5 7 10

p_k 0, 1 0, 2 0, 5 0, 2 Z rozkładu zmiennej loswej wynika bezpośrednio, że Do(X) = 7.

Dominantą Do(X) zmiennej losowej typu ciągłego X nazywa się wartość zmiennej losowej X, dla której gęstość przyjmuje maksimumu lokalne.

Przykład Zmienna losowa X ma rozkład o gęstości

f (x) =











0 dla x < 0, 6(x − x²) dla 0 ¬ x ¬ 1, 0 dla x > 1.

Ponieważ

f⁰(x) =











0 dla x < 0, 6(1 − 2x) dla 0 < x < 1, 0 dla x > 1.

co oznacza, że Do(X) = ¹₂.

Uwaga Zachodzi wzór przybliżony (zwany wzorem Pearsona) E(X) − Do(X) ≈ 3 [E(X) − M e(X)] . Przykład Zmienna losowa X ma rozkład o gęstości

f (x) =











0 dla x < 0, 6(x − x²) dla 0 ¬ x ¬ 1, 0 dla x > 1.

(8)

Wiemy, że Do(X) = ¹₂. Obliczymy E(X) E(X) =

Z +∞

−∞

xf (x) dx =

Z 1 0

(6x²− 6x³) dx =

2x³−3 2x⁴

1 0

= 1 2. Z wzoru Pearsona wynika, że M e(X) ≈ ¹₂.

Wyznaczenie mediany z definicji prowadzi do równania

Z x 0

(6t − 6t²) dt = 3x²− 2x³ = 1 2, którego jednym z rozwiązań jest x = ¹₂, czyli M e(X) = ¹₂. Przykład Rozkład zmiennej losowej X jest następujący

x_k 2 5 7 10

pk 0, 1 0, 2 0, 5 0, 2 Wiemy, że M e(X) = Do(X) = 7.

Z wzoru Pearsona wynika więc, że E(X) ≈ 7.

Wyznaczenie wartości oczekiwanej z definicji prowadzi do

E(X) = 2 · 0, 1 + 5 · 0, 2 + 7 · 0, 5 + 10 · 0, 2 = 6, 7.