Rachunek prawdopodobieństwa i statystyka
1 Przestrzeń probabilistyczna
Niech Ω będzie dowolnym zbiorem, zwanym przestrzenią zdarzeń elementarnych. Elementy ω tej przestrzeni nazywamy zdarzeniami elementarnymi.
Przykłady
1. Rzut monetą: Ω = {o, r}, gdzie o - wypadł orzeł, r - wypadła reszka,
2. Rzut kostką: Ω = {1, 2, 3, 4, 5, 6}, gdzie k - wypadło k oczek, k = 1, 2, 3, 4, 5, 6,
3. Ω = {(x, y)}, gdzie x - losowo umieszczony punkt na odcinku [0; 1], y - losowo umieszczony punkt na odcinku [0; 1].
Dowolony podzbiór A ⊂ Ω nazywamy zdarzeniem.
Przykłady
1. A : wypadła reszka,
2. A : wyrzucono parzystą liczbę oczek, 3. A : x < 12 i y 12.
Niech Ω będzie ustaloną przestrzenią zdarzeń elementarnych. Zdarzenia, będące podzbiorami tej przestrzeni tworzą rodzinę (zwaną σ-algebrą zdarzeń) S taką, że
• zbiór pusty ∅ ∈ S,
• jeżeli A ∈ S, to A ∈ S,
• jeżeli Ai ∈ S, i ∈ N, to
∞
[
i=1
Ai ∈ S.
Zdarzenie ∅ nazywamy zdarzeniem niemożliwym, Ω - zdarzeniem pewnym, A = Ω \ A - zdarze- niem przeciwnym do A.
Jeżeli Ω jest przestrzenią zdarzeń elementarnych, a S jest σ-algebrą zdarzeń, to prawdopodo- bieństwem nazywamy funkcję P : S → R taką, że
• dla każdego A ∈ S
0 ¬ P (A) ¬ 1,
• p(Ω) = 1,
• jeżeli Ai∩ Aj = ∅, i 6= j, to P
∞
[
i=1
Ai
!
=
∞
X
i=1
P (Ai).
Jeżeli przestrzeń zdarzeń elementarnych Ω składa się z n zdarzeń elementarnych jednakowo możliwych i jeżeli jest wśród nich k zdarzeń sprzyjających zajściu zdarzenia A, to liczbę
P (A) = k n nazywamy prawdopodobieństwem zajścia zdarzenia A.
Przykład Dokonujemy trzech rzutów monetą. Przestrzeń zdarzeń elementarnych jest nastę- pująca:
Ω = {ooo, oor, oro, roo, orr, ror, rro, rrr},
czyli n = 8. Niech zdarzenie A polega na tym, że orzeł pojawi się dwa razy. Zbiór zdarzeń sprzyjających zdarzeniu A :
A = {oor, oro, roo}, czyli k = 3, zatem
P (A) = 3 8.
Niech zdarzenie B polega na tym, że orzeł pojawi się co najmniej dwa razy. Zbiór zdarzeń sprzyjających zdarzeniu B :
B = {ooo, oor, oro, roo}, czyli k = 4, zatem
P (B) = 4 8 = 1
2.
Niech zdarzenie C polega na tym, że orzeł pojawi się co najwyżej dwa razy. Zbiór zdarzeń sprzyjających zdarzeniu C :
C = {oor, oro, roo, orr, ror, rro, rrr}, czyli k = 7, zatem
P (C) = 7 8.
W przypadku, gdy przestrzeń zdarzeń elementarnych jest nieskończona, zachodzi potrzeba rozsze- rzenia definicji prawdopodobieństwa.
Niech dana będzie σ-algebra zdarzeń S określona na przestrzeni Ω. Każdemu zdarzeniu A ∈ S przypisujemy w sposób jednoznaczny liczbę m(A) ∈ R, spełniającą warunki
1. m(A) 0, 2. m(∅) = 0,
3. m (SiAi) = Pim(Ai), jeżeli Ai∩ Aj = ∅, i 6= j.
Prawdopodobieństwo zdarzenia A określamy wzorem P (A) = m(A)
m(Ω).
Jeżeli Ω ⊂ R, to m(A) jest długością zbioru A, jeżeli Ω ⊂ R2, to m(A) jest polem zbioru A, a jeżeli Ω ⊂ R3, to m(A) jest objętością zbioru A.
Przykład Na odcinku [0; 1] umieszczamy losowo oraz niezależnie dwa punkty x i y. Punkty te można traktować jako współrzędne punktu (x, y) należącego do kwadratu [0; 1]×[0; 1]. Kwadrat ten jest przestrzenią zdarzeń elementarnych Ω, a punkty tego kwadratu ω = (x, y) - zdarzeniami elementarnymi. Oczywiście m(Ω) = 1, jako pole kwadratu o boku długości 1.
Niech A będzie zdarzeniem polegającym na tym, że |x − y| < 12, tzn.
A =
ω = (x, y) ∈ Ω : |x − y| < 1 2
. Ponieważ m(A) = 34, więc
P (A) = 3 4. Przestrzeń probabilistyczną określamy jako (Ω, S, P ).
Przykład Rzucamy jeden raz monetą. Wtedy Ω = {o, r}, S = {∅, o, r, Ω}, P (o) = P (r) = 12. W ten sposób została określona przestrzeń probabilistyczna (Ω, S, P ).
Twierdzenie Jeżeli przestrzeń zdarzeń elementarnych Ω składa się z n zdarzeń elementar- nych, to S składa się z 2n zbiorów.
2 Zmienne losowe
Niech dana będzie przestrzeń probabilistyczna (Ω, S, P ). Zmienną losową nazywamy funkcję X : Ω → R,
spełniającą warunek
{ ω : X(ω) < x } ∈ S, czyli { ω : X(ω) < x } jest zdarzeniem dla każdego x ∈ R.
Bezpośrednio z definicji wynika, że zdarzeniami są również zbiory:
{ ω : X(ω) ¬ x }, { ω : X(ω) > x }, { ω : X(ω) x }, { ω : X(ω) = x },
{ ω : X(ω) ∈ (a; b) }, { ω : X(ω) ∈ [a; b) }, { ω : X(ω) ∈ (a; b] }, { ω : X(ω) ∈ [a; b] }.
Zamiast A = { ω : X(ω) < x } będziemy pisać w skróconej postaci A = { X < x } i mówić, że zdarzenia A polega na tym, że X < x. Analogicznie w przypadku wyżej wymienionych zdarzeń.
Przykład Rzucamy dwiema monetami. Przestrzeń zdarzeń elementarnych jest następująca:
Ω = {oo, or, ro, rr}, czyli n = 4. Określamy funkcję
X(ω) =
−2 gdy ω = rr,
0 gdy ω = or lub ω = ro,
4 gdy ω = oo.
Tak określona funkcja jest zmienną losową, gdyż { X < x } = ∅ ∈ S, gdy x ¬ −2,
{ X < x } = rr ∈ S, gdy −2 < x ¬ 0, { X < x } = {or, ro, rr} ∈ S, gdy 0 < x ¬ 4, { X < x } = Ω ∈ S, gdy x 4.
Funkcję F : R → [0; 1] określoną wzorem
F (x) = P (X < x),
czyli prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, nazywa- my dystrybuantą lub funkcją rozkładu prawdopodobieństwa zmiennej losowej X.
Twierdzenie Funkcja F jest dystrybuantą pewnej zmiennej losowej X wtedy i tylko wtedy, gdy F jest funkcją niemalejącą i lewostronnie ciągłą oraz
x→−∞lim F (x) = 0, lim
x→+∞F (x) = 1. Przykład Rzucamy dwiema monetami. Funkcja
X(ω) =
−2 gdy ω = rr,
0 gdy ω = or lub ω = ro, 4 gdy ω = oo.
jest zmienną losową. Dystrybuanta tej zmiennej losowej jest postaci
F (x) =
0 gdy x ¬ −2,
1
4 gdy − 2 < x ¬ 0,
3
4 gdy 0 < x ¬ 4, 1 gdy x > 4.
Wśród zmiennych losowych można, ze względu na postać dystrybuanty, wyróżnić dwa typy:
• zmienna losowa typu skokowego (zmienna losowa dyskretna),
• zmienna losowa typu ciągłego.
Zmienną losową typu skokowego nazywamy taką zmienną losową X, dla której istnieje funkcja P (X = xk) = pk> 0, k = 0, 1, 2, . . ., taka, że dla każdego x ∈ R zachodzi relacja
F (x) = X
xk<x
P (X = xk) = X
xk<x
pk.
Funkcję P (X = xk) = pk nazywamy funkcją prawdopodobieństwa zmiennej losowej typu sko- kowego X, wartości xk nazywamy punktami skokowymi, a prawdopodobieństwa pk - skokami.
Z definicji dystrybuanty wynika, że
X
k
pk = 1.
Zauważmy, że
P (a ¬ X < b) = X
a¬xk<b
P (X = xk), gdzie −∞ ¬ a < b ¬ +∞, a jednocześnie
P (a ¬ X < b) = F (b) − F (a).
Zmienną losową typu ciągłego nazywamy zmienną losową X, dla której istnieje taka nieujemna funkcja f , że dla każdego x ∈ R zachodzi relacja
F (x) =
Z x
−∞f (t) dt.
Funkcję f nazywamy gęstością prawdopodobieństwa albo gęstością zmiennej losowej typu cią- głego. Z definicji dystrybuanty wynika, że
Z +∞
−∞
f (t) dt = 1.
Zauważmy, że
P (a ¬ X < b) =
Z b a
f (t) dt = F (b) − F (a), gdzie −∞ ¬ a < b ¬ +∞.
Mówimy, że dany jest rozkład zmiennej loswej, jeżeli znana jest dystrybuanta, albo jeśli znana jest funkcja prawdopodobieństwa w przypadku zmiennej losowej typu skokowego lub gęstość w przypadku zmiennej losowej typu ciągłego.
Przykład Rzucamy trzema monetami. Niech zmienna losowa będzie liczbą wyrzuconych orłów. Funkcja
X(ω) =
0 gdy ω = rrr,
1 gdy ω = orr lub ω = ror lub ω = ror, 2 gdy ω = oor lub ω = roo lub ω = oro, 3 gdy ω = ooo.
jest zmienną losową typu skokowego. Rozkład tej zmiennej losowej jest następujący
xk 0 1 2 3
pk 0,125 0,375 0,375 0,125
Przykład Zmienna losowa typu ciągłego X podlega rozkladowi według gęstości danej wzo- rem
f (x) =
0 dla x < 0, Cx dla 0 ¬ x ¬ 4, 0 dla x > 4.
Stałą C obliczamy z zależności
Z +∞
−∞
f (t) dt =
Z 4 0
Ct dt = C
1 2t2
4 0
= 8C = 1, czyli C = 18.
Wyznaczymy dystrybuantę F (x) =
Z x
−∞f (t) dt =
Z x 0
1 8t dt =
1 16t2
x 0
= 1
16x2 dla 0 < x ¬ 4, skąd
F (x) =
0 dla x ¬ 0,
1
16x2 dla 0 < x ¬ 4, 1 dla x > 4.
Obliczymy prawdopodobieństwo
P (1 ¬ X ¬ 2) =
Z 2 1
1 8t dt =
1 16t2
2 1
= 3 16 albo
P (1 ¬ X ¬ 2) = F (2) − F (1) = 3 16.
3 Pewne rozkłady zmiennych losowych
3.1 Rozkład jednopunktowy
Mówimy, że zmienna losowa podlega rozkładowi jednopunktowemu, jeżeli istnieje taki punkt x0 ∈ R, że P (X = x0) = 1.
Dystrybuanta tego rozkładu jest określona wzorem
F (x) =
0 dla x ¬ x0, 1 dla x > x0.
3.2 Rozkład dwupunktowy
Mówimy, że zmienna losowa podlega rozkładowi jednopunktowemu, jeżeli przyjmuje jedynie dwie wartości x1, x2 ∈ R, x1 < x2 oraz P (X = x1) = p, P (X = x2) = 1 − p = q, 0 < p < 1.
Dystrybuanta tego rozkładu jest określona wzorem
F (x) =
0 dla x ¬ x1, q dla x1 < x ¬ x2, 1 dla x > x2.
Często dla wygody przyjmuje się, że x1 = 0, x2 = 1. Wtedy P (X = 0) = p, P (X = 1) = 1 − p = q, 0 < p < 1 i taki rozkład nazywa się zero-jedynkowym.
Modelem rozkładu dwupunktowego jest rzut monetą, jeżeli zdarzeniu polegającemu na wyrzu- ceniu orła przypisać 1, a wyrzuceniu reszki - 0. Wtedy P (X = 0) = 12, P (X = 1) = 12.
3.3 Rozkład dwumianowy (Bernoulliego)
Niech zmienna losowa X równa się sumie n zmiennych losowych, tzn. X = X1 + X2 + . . . + Xn, z których każda może przyjmować wartość 1 z prawdopodobieństwem p albo wartość 0 z prawdopodobieństwem q = 1 − p, niezależnie od wartości przyjmowanych przez pozostałe zmienne. Tak określona zmienna losowa X może przyjąć każdą wartość całkowitą z przedziału [0; n], przy czym X = k oznacza, że k spośród n zmiennych Xi przyjmuje wartość 1, a n − k wartość 0.
Mówimy, że zmienna losowa X ma rozkład dwumianowy (Bernoulliego), jeżeli jej funkcja praw- dopodobieństwa dana jest wzorem
P (X = k) =
n k
pkqn−k, q = 1 − p, k = 0, 1, . . . , n.
Dystrybuanta rozkladu dwumianowego jest określona wzorem F (x) = P (X < k) = X
0¬k<x
n k
pkqn−k.
3.4 Rozkład Poissona
Niech zmienna losowa Xn ma rozkład dwumianowy określony wzorem P (Xn = k) =
n k
pkqn−k, q = 1 − p, k = 0, 1, . . . , n.
Załóżmy, że n → ∞ oraz iloczyn np jest stały, czyli np = λ. Wtedy P (X = k) = lim
n→∞P (Xn = k) = λk
k! · e−λ, k = 0, 1, . . . .
Mówimy,że zmienna losowa X ma rozkład Poissona z parametrem λ, jeśli jej funkcja prawdo- podobieństwa dana jest wzorem
P (X = k) = λk
k! · e−λ, k = 0, 1, . . . .
Z uwagi na metodę uzyskania funkcji prawdopodobieństwa, rozkład Poissona jest rozkładem granicznym rozkładu Bernoulliego przy podanych warunkach.
3.5 Rozkład jednostajny
Mówimy, że zmienna losowa X podlega rozkładowi jednostajnemu (równomiernemu, prostokąt- nemu) na odcinku [a; b], −∞ < a < b < +∞, jeżeli jej gęstość jest określona wzorem
f (x) =
0 dla x < a,
1
b−a dla a ¬ x ¬ b, 0 dla x > b.
Dystrybuanta tego rozkładu jest postaci
F (x) =
0 dla x ¬ a,
x−a
b−a dla a < x ¬ b, 1 dla x > b.
3.6 Rozkład wykładniczy
Mówimy, że zmienna losowa X ma rozkład wykładniczy z parametrem λ, λ > 0, jeżeli jej gęstość jest określona wzorem
f (x) =
0 dla x < 0, λe−λx dla x 0.
Dystrybuanta tego rozkładu jest postaci
F (x) =
0 dla x ¬ 0,
1 − e−λx dla x > 0.
3.7 Rozkład Weibulla
Mówimy, że zmienna losowa X ma rozkład Weibulla z parametrami λ i α λ, α > 0, jeżeli jej gęstość jest określona wzorem
f (x) =
0 dla x < 0,
αλxα−1e−λxα dla x 0.
Dystrybuanta tego rozkładu jest postaci F (x) =
0 dla x ¬ 0,
1 − e−λxα dla x > 0.
Rozkład Weibulla jest uogólnieniem rozkładu wykładniczego i ma liczne zastosowania w teorii niezawodności.
3.8 Rozkład normalny
Mówimy, że zmienna losowa X ma rozklad normalny o parametrach m i σ, σ > 0, który oznacza się N (m, σ), jeżeli jej gęstość wyraża się wzorem
f (x) = 1 σ√
2πexp
"
−(x − m)2 2σ2
#
, −∞ < x < +∞.
Dystrybuanta rozkładu normalnego N (m, σ) wyraża się wzorem F (x) = 1
σ√ 2π
Z x
−∞exp
"
−(z − m)2 2σ2
#
dz.
Wprowadźmy nową zmienną losową U określoną wzorem U = X − m
σ .
Zmienna losowa U ma gęstość ϕ(u) = 1
√2πexp
"
−u2 2
#
, −∞ < u < +∞
oraz dystrybuantę
Φ(u) = 1
√2π
Z u
−∞exp
"
−z2 2
#
dz.
Rozkład zmiennej losowej U nazywa się standaryzowanym rozkładem normalnym i jest ozna- czany N (0, 1). Dystrybuanta tego rozkładu jest stablicowana.
3.9 Rozkład lognormalny
Zmienna losowa X przyjmująca wartości dodatnie ma rozkład lognormalny (logarytmiczno- normalny), gdy jej logarytm ma rozkład normalny, tzn. ln X ∼ N (m, σ). Dystrybuanta tej zmiennej wyraża się wzorem
F (x) =
0 dla x ¬ 0,
Φln x−mσ dla x > 0, gdzie Φ jest dystrybuantą rozkładu N (0, 1).
Gęstość tego rozkładu jest określona wzorem f (x) =
0 dla x ¬ 0,
x−1 σ√
2πexph−(ln x−m)2σ2 2
i dla x > 0,