Przegląd ważniejszych rozkładów prawdopodobieństwa
- rozkłady dyskretne
a) rozkład jednopunktowy
Zmienna losowa X ma rozkład jednopunktowy, jeśli dla pewnego a ∈ R P (X = a) = 1.
Wtedy
µx = δa natomiast dystrybuanta jest funkcją postaci
F (x) = 0 gdy x < a, 1 gdy x ≥ a.
b) rozkład dwupunktowy
Jest to rozkład zmiennej losowej X przyjmującej tylko dwie wartości a, b, przy czym P (X = a) = p, P (X = b) = 1 − p, p ∈ (0, 1).
Wtedy
µx = pδa+ (1 − p)δb natomiast dystrybuanta wyraża się wzorem
F (x) = p1[a,∞)(x) + (1 − p)1[b,∞)(x), gdzie
1A(x) = 1 gdy x ∈ A, 0 gdy x /∈ A.
W przypadku, gdy a = 1, b = 0 mówimy o rozkładzie zero-jedynkowym.
c) rozkład Bernoulliego (dwumianowy)
Zmienna losowa X ma rozkład Bernoulliego z parametrami n ∈ N i p ∈ [0, 1] (X ∼ Bernoullie(n, p)), jeśli
P (X = k) =n k
pk(1 − p)n−k, k = 0, 1, . . . , n.
Jest to rozkład łącznej liczby sukcesów w n próbach Bernoulliego.
d) rozkład Poissona
Zmienna losowa X ma rozkład Poissona z parametrem λ > 0 (X ∼ P oisson(λ)), jeśli P (X = k) = λk
k!e−λ, k = 0, 1, 2, . . . . Rozwinięcie funkcji ex w szerego Maclaurena ma postać ex =
∞
P
n=1 xn
n!. Nietrudno jest zatem sprawdzić, że
∞
X
k=0
P (X = k) =
∞
X
k=0
λk
k!e−λ = e−λ
∞
X
k=0
λk k!
| {z }
=eλ
= 1.
e) rozkład geometryczny
Zmienna losowa X ma rozkład geometryczny z parametrem p ∈ (0, 1), jeśli P (X = k) = (1 − p)k−1p, k = 1, 2, . . .
Korzystając ze wzoru na sumę nieskończonego ciągu geometrycznego nietrudno sprawdzić,
że ∞
X
k=1
(1 − p)k−1p = p · 1
1 − (1 − p) = 1.
Jest to rozkład czasu oczekiwania na pierwszy sukces w ciągu doświadczeń Bernoulliego, rozumianego jako liczba doświadczeń, które należy wykonać, by doczekać się sukcesu.
e’) rozkład geometryczny - konwencja alternatywna
Zmienna losowa Y ma rozkład wykładniczy z parametrem p ∈ (0, 1), jeśli P (X = k) = (1 − p)kp, k = 0, 1, 2, . . .
Jest to rozkład liczby doświadczeń Bernoulliego wykonanych przed otrzymaniem pierwszego sukcesu. Oczywiście Y = X − 1.
f) rozkład ujemny dwumianowy
Zmienna losowa X ma ujemny rozkład dwumianowy z parametrami α > 0, p ∈ (0, 1), jeśli P (X = k) =α + k − 1
k
(1 − p)kpα, k = 0, 1, 2, . . .
Jeśli parametr α jest całkowity, to jest to rozkład czasu oczekiwania na α-ty sukces w ciągu prób Bernoulliego, czyli jest to tzw. rozkład Pascala. Dla α = 1 otrzymujemy rozkład geometryczny opisany w e).
g) rozkład hipergeometryczny
Zmienna losowa X ma rozkład hipergeometryczny z parametrami M, N, n ∈ N, n ≤ N, n ≤ M , jeśli
P (X = k) =
N k
M
n−k
N +M n
, k = 0, 1, . . . , n.
Łatwo jest podać przykład takiej zmiennej losowej. Rozważmy doświadczenie polegające na wylosowaniu 10 kart z talli 52 kart. Jeśli zmienna losowa X przyjmuje wartości równe liczbie wylosowanych pików, to ma ona rozkład hipergeometryczny z parametrami N = 13, M = 39, n = 10.
- rozkłady ciągłe
a) rozkład jednostajny na odcinku
Zmienna losowa X ma rozkład jednostajny na odcinku [a, b] (X ∼ U [a, b]), jeśli gęstość ma postać
f (x) =
1
b−a gdy x ∈ [a, b], 0 gdy x /∈ [a, b].
Dystrybuanta tego rozkładu ma postać
F (x) =
0 gdy x < a,
x−a
b−a gdy x ∈ [a, b), 1 gdy x ≥ b.
a’) rozkład jednostajny na A ⊂ R Niech A będzie borelowskim podzbiorem w R o dodatniej i skończonej mierze Lebesque’a λ1. Jeśli zmienna losowa X ma rozkład jednostajny na zbiorze A, to jej gęstość ma postać
f (x) =
1
λ1(A) gdy x ∈ A, 0 gdy x /∈ A b) rozkład wykładniczy
Zmienna losowa X ma rozkład wykładniczy z parametrem λ > 0 (X ∼ Exp(λ)), jeśli gęstość ma postać
f (x) = λe−λx gdy x > 0,
0 gdy x ≤ 0 (1)
Uwaga: w niektórych podręcznikach i zbiorach zadań stosuje się inną konwencję, tzn. przyj- muje się, że gęstość ma postać
f (x) =
1
λe−λ1x gdy x > 0,
0 gdy x ≤ 0 (2)
Nietrudno sprawdzić, że
Z ∞
−∞
f (x)dx = Z ∞
0
λe−λxdx = 1.
Dystrybuanta rozkładu wykładniczego ma postać
F (x) = 0 gdy x < 0, 1 − e−λx gdy x ≥ 0.
c) rozkład normalny
Zmienna losowa X ∼ N (m, σ), gdzie m ∈ R oraz σ > 0, jeśli gęstość ma postać f (x) = 1
√2πσe−(x−m)22σ2
w przypadku standardowego rozkładu normalnego N (0, 1) gęstość ma postać f (x) = 1
√2πe−x22 Wykazanie, że R∞
−∞f (x)dx = 1 nie jest proste, ponieważ funkcja pierwotna Φ(x) funkcji f (x) nie jest funkcją elementarną. Najłatwiej jest w tym celu rozważyć całkę podwójną funkcji e−x2+y22 po obszarze R2, wtedy z uwagi na to, że jest to funkcja o rozdzielonych zmiennych mamy
Z ∞
−∞
Z ∞
−∞
e−x2+y22 dxdy = Z ∞
−∞
e−x22 dx · Z ∞
−∞
e−y22 dy
= ( Z ∞
−∞
e−x22 dx)2
z drugiej strony przechodząc na współrzędne biegunowe, tj. stosując podstawienie x = r cos ϕ, y = r sin ϕ możemy tę całkę obliczyć
Z ∞
−∞
Z ∞
−∞
e−x2+y22 dxdy = Z ∞
0
Z 2π 0
e−r22 rdϕdr
= 2πh
− e−r22 i∞
0
= 2π.
Stąd
Z ∞
−∞
e−x22 dx =√ 2π.
Stosując podstawienie y = x−mσ sprawdzamy, że Z ∞
−∞
√1
2πσe−(x−m)22σ2 dx = 1
√2π Z ∞
−∞
e−x22 dx
| {z }
=√ 2π
= 1.
Niech Φ oznacza dystrybuantę rozkładu N (0, 1), z uwagi na to, że gęstość tego rozkładu jest funkcją parzystą zachodzi równość
Φ(−t) = 1 − Φ(t).
Ponadto jeśli FN (m,σ) jest dystrybuantą rozkładu normalnego N (m, σ), to FN (m,σ)(t) = Φt − m
σ
. d) rozkład gamma
Zmienna losowa X ma rozkład gamma z parametrami a, b > 0 (X ∼ Γ(a, b)), jeśli jej gęstość ma postać
γa,b(x) =
ba
Γ(a)xa−1e−bx gdy x > 0,
0 gdy x ≤ 0
Przypomnijmy, że funkcja gamma zdefiniowana jest wzorem Γ(a) =
Z ∞ 0
ta−1e−tdt, a > 0. (3)
Zauważmy, że stosując podstawienie bx = t mamy Z ∞
0
γa,b(x)dx = 1 Γ(a)
Z ∞ 0
ta−1e−tdt
| {z }
=Γ(a)
= 1
Ponieważ Γ(1) = 1 zatem dla a = 1 otrzymujemy rozkład wykładniczy z parametrem b.
e) rozkład beta
Zmienna losowa X ma rozkład beta z parametrami a, b > 0, jeśli jej gęstość ma postać βa,b(x) =
1
B(a,b)xa−1(1 − x)b−1 gdy x ∈ [0, 1],
0 gdy x /∈ [0, 1],
gdzie B(a, b) oznacza funkcję specjalną beta, tj. funkcję zadaną wzorem B(a, b) =
Z ∞ 0
ta−1(1 − t)b−1dt.
f) rozkład Cauchy’ego
Zmienna losowa X ma rozkład Cauchy’ego z parametrami a > 0 oraz m ∈ R, jesli jej gęstość zadana jest wzorem
f (x) = a
π(a2+ (x − m)2).
Z uwagi na to, że prosta x = m stanowi oś symetrii wykresu gęstości otrzymujemy równość P (X > m) = P (X < m) = 1
2.
W przypadku, gdy a = 1 oraz m = 1, tj. w przypadku standardowej postaci rozkładu Cauchy’ego dystrybuanta ma postać
F (x) = 1 2 + 1
π arctan x.
g) rozkład Pareto
Zmienna losowa X ma rozkład Pareto z parametrami c > 0 i α > 0, jeśli jej gęstość zadana jest wzorem
f (x) = 0 gdy x < c, αxcα+1α gdy x ≥ c.
Parametr c nazywamy parametrem położenia, natomiast α - kształtu.
h) rozkład logarytmiczno-normalny (lognormalny)
Zmienna losowa Y ma rozkład lognormalny z parametrami m, σ > 0, jeśli jej gęstość ma postać
f (x) =
( 1
xσ√
2πe−ln x−m2σ2 gdy x > 0,
0 gdy x ≤ 0.
Jest to rozkład zmiennej losowej Y = eX, gdzie X ∼ N (m, σ).
i) rozkład Weibulla
Zmienna losowa X ma rozkład Weibulla z parametrami α, β > 0, jeśli jej gęstość ma postać f (x) = αβ−αxα−1e−(xβ)α gdy x > 0,
0 gdy x ≤ 0.
Nietrudno policzyć, że dystrybuanta wyraża się wtedy wzorem F (x) = 1 − e−(xβ)α gdy x > 0,
0 gdy x ≤ 0.
Zauważmy, że dla α = 1 rozkład Weilbulla jest w szczególności rozkładem wykładniczym z parametrem λ = β1.
j) rozkład t-Studenta
Zmienna losowa X ma rozkład t-Studenta o n ∈ N stopniach swobody, jeśli jej gęstość ma postać
f (x) = 1
√nπ · Γ(n+12 ) Γ(n2)
1 + x2
n
−12(n+1)
Uwaga 1: Rozkład t-Studenta o n stopniach swobody jest rozkładem zmiennej losowej
√nX
√Yn
,
gdzie zmienne losowe X, Yn są niezależne oraz X ∼ N (0, 1), Yn ∼ χ2n.
k) rozkład χ2(n)
Zmienna losowa X ma rozkład chi-kwadrat o n ∈ N stopniach swobody (X ∼ χ2n), jeśli jej gęstość ma postać
γn
2,12(x) =
( 1
2n2Γ(n2)xn2−1e−12x gdy x > 0,
0 gdy x ≤ 0.
Uwaga 1: Rozkład chi-kwadrat o n stopniach swobody jest rozkładem sumy X12+ . . . + Xn2,
gdzie X1, . . . , Xn są niezależnymi zmiennymi losowymi o rozkładzie N (0, 1).
Uwaga 2: Rozkład chi-kwadrat o n stopniach swobody jest rozkładem Γ(n2,12).