Rachunek prawdopodobieństwa i statystyka

(1)

Rachunek prawdopodobieństwa i statystyka

1 Przestrzeń probabilistyczna

Niech Ω będzie dowolnym zbiorem, zwanym przestrzenią zdarzeń elementarnych. Elementy ω tej przestrzeni nazywamy zdarzeniami elementarnymi.

Przykłady

1. Rzut monetą: Ω = {o, r}, gdzie o - wypadł orzeł, r - wypadła reszka,

2. Rzut kostką: Ω = {1, 2, 3, 4, 5, 6}, gdzie k - wypadło k oczek, k = 1, 2, 3, 4, 5, 6,

3. Ω = {(x, y)}, gdzie x - losowo umieszczony punkt na odcinku [0; 1], y - losowo umieszczony punkt na odcinku [0; 1].

Dowolony podzbiór A ⊂ Ω nazywamy zdarzeniem.

Przykłady

1. A : wypadła reszka,

2. A : wyrzucono parzystą liczbę oczek, 3. A : x < ¹₂ i y  ¹₂.

Niech Ω będzie ustaloną przestrzenią zdarzeń elementarnych. Zdarzenia, będące podzbiorami tej przestrzeni tworzą rodzinę (zwaną σ-algebrą zdarzeń) S taką, że

• zbiór pusty ∅ ∈ S,

• jeżeli A ∈ S, to A ∈ S,

• jeżeli A_i ∈ S, i ∈ N, to

∞

[

i=1

A_i ∈ S.

Zdarzenie ∅ nazywamy zdarzeniem niemożliwym, Ω - zdarzeniem pewnym, A = Ω \ A - zdarze- niem przeciwnym do A.

Jeżeli Ω jest przestrzenią zdarzeń elementarnych, a S jest σ-algebrą zdarzeń, to prawdopodo- bieństwem nazywamy funkcję P : S → R taką, że

(2)

• dla każdego A ∈ S

0 ¬ P (A) ¬ 1,

• p(Ω) = 1,

• jeżeli Ai∩ Aj = ∅, i 6= j, to P

∞

[

i=1

A_i

!

=

∞

X

i=1

P (A_i).

Jeżeli przestrzeń zdarzeń elementarnych Ω składa się z n zdarzeń elementarnych jednakowo możliwych i jeżeli jest wśród nich k zdarzeń sprzyjających zajściu zdarzenia A, to liczbę

P (A) = k n nazywamy prawdopodobieństwem zajścia zdarzenia A.

Przykład Dokonujemy trzech rzutów monetą. Przestrzeń zdarzeń elementarnych jest nastę- pująca:

Ω = {ooo, oor, oro, roo, orr, ror, rro, rrr},

czyli n = 8. Niech zdarzenie A polega na tym, że orzeł pojawi się dwa razy. Zbiór zdarzeń sprzyjających zdarzeniu A :

A = {oor, oro, roo}, czyli k = 3, zatem

P (A) = 3 8.

Niech zdarzenie B polega na tym, że orzeł pojawi się co najmniej dwa razy. Zbiór zdarzeń sprzyjających zdarzeniu B :

B = {ooo, oor, oro, roo}, czyli k = 4, zatem

P (B) = 4 8 = 1

2.

Niech zdarzenie C polega na tym, że orzeł pojawi się co najwyżej dwa razy. Zbiór zdarzeń sprzyjających zdarzeniu C :

C = {oor, oro, roo, orr, ror, rro, rrr}, czyli k = 7, zatem

P (C) = 7 8.

W przypadku, gdy przestrzeń zdarzeń elementarnych jest nieskończona, zachodzi potrzeba rozsze- rzenia definicji prawdopodobieństwa.

Niech dana będzie σ-algebra zdarzeń S określona na przestrzeni Ω. Każdemu zdarzeniu A ∈ S przypisujemy w sposób jednoznaczny liczbę m(A) ∈ R, spełniającą warunki

(3)

1. m(A) 0, 2. m(∅) = 0,

3. m (^S_iA_i) = ^P_im(A_i), jeżeli A_i∩ A_j = ∅, i 6= j.

Prawdopodobieństwo zdarzenia A określamy wzorem P (A) = m(A)

m(Ω).

Jeżeli Ω ⊂ R, to m(A) jest długością zbioru A, jeżeli Ω ⊂ R², to m(A) jest polem zbioru A, a jeżeli Ω ⊂ R³, to m(A) jest objętością zbioru A.

Przykład Na odcinku [0; 1] umieszczamy losowo oraz niezależnie dwa punkty x i y. Punkty te można traktować jako współrzędne punktu (x, y) należącego do kwadratu [0; 1]×[0; 1]. Kwadrat ten jest przestrzenią zdarzeń elementarnych Ω, a punkty tego kwadratu ω = (x, y) - zdarzeniami elementarnymi. Oczywiście m(Ω) = 1, jako pole kwadratu o boku długości 1.

Niech A będzie zdarzeniem polegającym na tym, że |x − y| < ¹₂, tzn.

A =

ω = (x, y) ∈ Ω : |x − y| < 1 2

. Ponieważ m(A) = ³₄, więc

P (A) = 3 4. Przestrzeń probabilistyczną określamy jako (Ω, S, P ).

Przykład Rzucamy jeden raz monetą. Wtedy Ω = {o, r}, S = {∅, o, r, Ω}, P (o) = P (r) = ¹₂. W ten sposób została określona przestrzeń probabilistyczna (Ω, S, P ).

Twierdzenie Jeżeli przestrzeń zdarzeń elementarnych Ω składa się z n zdarzeń elementar- nych, to S składa się z 2ⁿ zbiorów.

2 Zmienne losowe

Niech dana będzie przestrzeń probabilistyczna (Ω, S, P ). Zmienną losową nazywamy funkcję X : Ω → R,

spełniającą warunek

{ ω : X(ω) < x } ∈ S, czyli { ω : X(ω) < x } jest zdarzeniem dla każdego x ∈ R.

Bezpośrednio z definicji wynika, że zdarzeniami są również zbiory:

{ ω : X(ω) ¬ x }, { ω : X(ω) > x }, { ω : X(ω) x }, { ω : X(ω) = x },

{ ω : X(ω) ∈ (a; b) }, { ω : X(ω) ∈ [a; b) }, { ω : X(ω) ∈ (a; b] }, { ω : X(ω) ∈ [a; b] }.

(4)

Zamiast A = { ω : X(ω) < x } będziemy pisać w skróconej postaci A = { X < x } i mówić, że zdarzenia A polega na tym, że X < x. Analogicznie w przypadku wyżej wymienionych zdarzeń.

Przykład Rzucamy dwiema monetami. Przestrzeń zdarzeń elementarnych jest następująca:

Ω = {oo, or, ro, rr}, czyli n = 4. Określamy funkcję

X(ω) =











−2 gdy ω = rr,

0 gdy ω = or lub ω = ro,

4 gdy ω = oo.

Tak określona funkcja jest zmienną losową, gdyż { X < x } = ∅ ∈ S, gdy x ¬ −2,

{ X < x } = rr ∈ S, gdy −2 < x ¬ 0, { X < x } = {or, ro, rr} ∈ S, gdy 0 < x ¬ 4, { X < x } = Ω ∈ S, gdy x 4.

Funkcję F : R → [0; 1] określoną wzorem

F (x) = P (X < x),

czyli prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, nazywa- my dystrybuantą lub funkcją rozkładu prawdopodobieństwa zmiennej losowej X.

Twierdzenie Funkcja F jest dystrybuantą pewnej zmiennej losowej X wtedy i tylko wtedy, gdy F jest funkcją niemalejącą i lewostronnie ciągłą oraz

x→−∞lim F (x) = 0, lim

x→+∞F (x) = 1. Przykład Rzucamy dwiema monetami. Funkcja

X(ω) =











−2 gdy ω = rr,

0 gdy ω = or lub ω = ro, 4 gdy ω = oo.

jest zmienną losową. Dystrybuanta tej zmiennej losowej jest postaci

F (x) =











0 gdy x ¬ −2,

1

4 gdy − 2 < x ¬ 0,

3

4 gdy 0 < x ¬ 4, 1 gdy x > 4.

Wśród zmiennych losowych można, ze względu na postać dystrybuanty, wyróżnić dwa typy:

(5)

• zmienna losowa typu skokowego (zmienna losowa dyskretna),

• zmienna losowa typu ciągłego.

Zmienną losową typu skokowego nazywamy taką zmienną losową X, dla której istnieje funkcja P (X = x_k) = pk> 0, k = 0, 1, 2, . . ., taka, że dla każdego x ∈ R zachodzi relacja

F (x) = ^X

xk<x

P (X = x_k) = ^X

xk<x

p_k.

Funkcję P (X = x_k) = p_k nazywamy funkcją prawdopodobieństwa zmiennej losowej typu sko- kowego X, wartości x_k nazywamy punktami skokowymi, a prawdopodobieństwa p_k - skokami.

Z definicji dystrybuanty wynika, że

X

k

p_k = 1.

Zauważmy, że

P (a ¬ X < b) = ^X

a¬xk<b

P (X = x_k), gdzie −∞ ¬ a < b ¬ +∞, a jednocześnie

P (a ¬ X < b) = F (b) − F (a).

Zmienną losową typu ciągłego nazywamy zmienną losową X, dla której istnieje taka nieujemna funkcja f , że dla każdego x ∈ R zachodzi relacja

F (x) =

Z x

−∞f (t) dt.

Funkcję f nazywamy gęstością prawdopodobieństwa albo gęstością zmiennej losowej typu cią- głego. Z definicji dystrybuanty wynika, że

Z +∞

−∞

f (t) dt = 1.

Zauważmy, że

P (a ¬ X < b) =

Z b a

f (t) dt = F (b) − F (a), gdzie −∞ ¬ a < b ¬ +∞.

Mówimy, że dany jest rozkład zmiennej loswej, jeżeli znana jest dystrybuanta, albo jeśli znana jest funkcja prawdopodobieństwa w przypadku zmiennej losowej typu skokowego lub gęstość w przypadku zmiennej losowej typu ciągłego.

Przykład Rzucamy trzema monetami. Niech zmienna losowa będzie liczbą wyrzuconych orłów. Funkcja

X(ω) =











0 gdy ω = rrr,

1 gdy ω = orr lub ω = ror lub ω = ror, 2 gdy ω = oor lub ω = roo lub ω = oro, 3 gdy ω = ooo.

(6)

jest zmienną losową typu skokowego. Rozkład tej zmiennej losowej jest następujący

x_k 0 1 2 3

p_k 0,125 0,375 0,375 0,125

Przykład Zmienna losowa typu ciągłego X podlega rozkladowi według gęstości danej wzo- rem

f (x) =











0 dla x < 0, Cx dla 0 ¬ x ¬ 4, 0 dla x > 4.

Stałą C obliczamy z zależności

Z +∞

−∞

f (t) dt =

Z 4 0

Ct dt = C

1 2t²

4 0

= 8C = 1, czyli C = ¹₈.

Wyznaczymy dystrybuantę F (x) =

Z x

−∞f (t) dt =

Z x 0

1 8t dt =

1 16t²

x 0

= 1

16x² dla 0 < x ¬ 4, skąd

F (x) =











0 dla x ¬ 0,

1

16x² dla 0 < x ¬ 4, 1 dla x > 4.

Obliczymy prawdopodobieństwo

P (1 ¬ X ¬ 2) =

Z 2 1

1 8t dt =

1 16t²

2 1

= 3 16 albo

P (1 ¬ X ¬ 2) = F (2) − F (1) = 3 16.

3 Pewne rozkłady zmiennych losowych

3.1 Rozkład jednopunktowy

Mówimy, że zmienna losowa podlega rozkładowi jednopunktowemu, jeżeli istnieje taki punkt x0 ∈ R, że P (X = x⁰) = 1.

Dystrybuanta tego rozkładu jest określona wzorem

F (x) =







0 dla x ¬ x0, 1 dla x > x0.

(7)

3.2 Rozkład dwupunktowy

Mówimy, że zmienna losowa podlega rozkładowi jednopunktowemu, jeżeli przyjmuje jedynie dwie wartości x₁, x₂ ∈ R, x1 < x₂ oraz P (X = x₁) = p, P (X = x₂) = 1 − p = q, 0 < p < 1.

Dystrybuanta tego rozkładu jest określona wzorem

F (x) =











0 dla x ¬ x₁, q dla x₁ < x ¬ x₂, 1 dla x > x₂.

Często dla wygody przyjmuje się, że x₁ = 0, x₂ = 1. Wtedy P (X = 0) = p, P (X = 1) = 1 − p = q, 0 < p < 1 i taki rozkład nazywa się zero-jedynkowym.

Modelem rozkładu dwupunktowego jest rzut monetą, jeżeli zdarzeniu polegającemu na wyrzu- ceniu orła przypisać 1, a wyrzuceniu reszki - 0. Wtedy P (X = 0) = ¹₂, P (X = 1) = ¹₂.

3.3 Rozkład dwumianowy (Bernoulliego)

Niech zmienna losowa X równa się sumie n zmiennych losowych, tzn. X = X₁ + X₂ + . . . + X_n, z których każda może przyjmować wartość 1 z prawdopodobieństwem p albo wartość 0 z prawdopodobieństwem q = 1 − p, niezależnie od wartości przyjmowanych przez pozostałe zmienne. Tak określona zmienna losowa X może przyjąć każdą wartość całkowitą z przedziału [0; n], przy czym X = k oznacza, że k spośród n zmiennych X_i przyjmuje wartość 1, a n − k wartość 0.

Mówimy, że zmienna losowa X ma rozkład dwumianowy (Bernoulliego), jeżeli jej funkcja praw- dopodobieństwa dana jest wzorem

P (X = k) =

n k

p^kq^n−k, q = 1 − p, k = 0, 1, . . . , n.

Dystrybuanta rozkladu dwumianowego jest określona wzorem F (x) = P (X < k) = ^X

0¬k<x

n k

p^kq^n−k.

3.4 Rozkład Poissona

Niech zmienna losowa X_n ma rozkład dwumianowy określony wzorem P (X_n = k) =

n k

p^kq^n−k, q = 1 − p, k = 0, 1, . . . , n.

Załóżmy, że n → ∞ oraz iloczyn np jest stały, czyli np = λ. Wtedy P (X = k) = lim

n→∞P (X_n = k) = λ^k

k! · e^−λ, k = 0, 1, . . . .

(8)

Mówimy,że zmienna losowa X ma rozkład Poissona z parametrem λ, jeśli jej funkcja prawdo- podobieństwa dana jest wzorem

P (X = k) = λ^k

k! · e^−λ, k = 0, 1, . . . .

Z uwagi na metodę uzyskania funkcji prawdopodobieństwa, rozkład Poissona jest rozkładem granicznym rozkładu Bernoulliego przy podanych warunkach.

3.5 Rozkład jednostajny

Mówimy, że zmienna losowa X podlega rozkładowi jednostajnemu (równomiernemu, prostokąt- nemu) na odcinku [a; b], −∞ < a < b < +∞, jeżeli jej gęstość jest określona wzorem

f (x) =











0 dla x < a,

1

b−a dla a ¬ x ¬ b, 0 dla x > b.

Dystrybuanta tego rozkładu jest postaci

F (x) =











0 dla x ¬ a,

x−a

b−a dla a < x ¬ b, 1 dla x > b.

3.6 Rozkład wykładniczy

Mówimy, że zmienna losowa X ma rozkład wykładniczy z parametrem λ, λ > 0, jeżeli jej gęstość jest określona wzorem

f (x) =







0 dla x < 0, λe^−λx dla x 0.

Dystrybuanta tego rozkładu jest postaci

F (x) =







0 dla x ¬ 0,

1 − e^−λx dla x > 0.

3.7 Rozkład Weibulla

Mówimy, że zmienna losowa X ma rozkład Weibulla z parametrami λ i α λ, α > 0, jeżeli jej gęstość jest określona wzorem

f (x) =







0 dla x < 0,

αλx^α−1e^−λx^α dla x 0.

(9)

Dystrybuanta tego rozkładu jest postaci F (x) =







0 dla x ¬ 0,

1 − e^−λx^α dla x > 0.

Rozkład Weibulla jest uogólnieniem rozkładu wykładniczego i ma liczne zastosowania w teorii niezawodności.

3.8 Rozkład normalny

Mówimy, że zmienna losowa X ma rozklad normalny o parametrach m i σ, σ > 0, który oznacza się N (m, σ), jeżeli jej gęstość wyraża się wzorem

f (x) = 1 σ√

2πexp

"

−(x − m)² 2σ²

#

, −∞ < x < +∞.

Dystrybuanta rozkładu normalnego N (m, σ) wyraża się wzorem F (x) = 1

σ√ 2π

Z x

−∞exp

"

−(z − m)² 2σ²

#

dz.

Wprowadźmy nową zmienną losową U określoną wzorem U = X − m

σ .

Zmienna losowa U ma gęstość ϕ(u) = 1

√2πexp

"

−u² 2

#

, −∞ < u < +∞

oraz dystrybuantę

Φ(u) = 1

√2π

Z u

−∞exp

"

−z² 2

#

dz.

Rozkład zmiennej losowej U nazywa się standaryzowanym rozkładem normalnym i jest ozna- czany N (0, 1). Dystrybuanta tego rozkładu jest stablicowana.

3.9 Rozkład lognormalny

Zmienna losowa X przyjmująca wartości dodatnie ma rozkład lognormalny (logarytmiczno- normalny), gdy jej logarytm ma rozkład normalny, tzn. ln X ∼ N (m, σ). Dystrybuanta tej zmiennej wyraża się wzorem

F (x) =







0 dla x ¬ 0,

Φ^{ln x−m}_σ dla x > 0, gdzie Φ jest dystrybuantą rozkładu N (0, 1).

Gęstość tego rozkładu jest określona wzorem f (x) =







0 dla x ¬ 0,

x⁻¹ σ√

2πexp^h−^{(ln x−m)}_2σ2 ²

i dla x > 0,