Zmienna losowa, jej dystrybuanta i gęstość
Krótkie praktyczne przypomnienie pojęć z rachunku prawdopodobieństwa
Ω – przestrzeń zdarzeń elementarnych
F – σ-ciało zdarzeń (ustalona rodzina podzbiorów zbioru Ω będąca σ-ciałem)
B(R) – σ-ciało borelowskich podzbiorów R – wszystkie „sensowne” podzbiory R, jakie jesteśmy sobie w stanie wyobrazić, w szczególności wszystkie przedziały
Definicja 1 Zmienną losową nazywamy mierzalną funkcję X : Ω → R (mierzalną tzn. taką, że dla każdego B ∈ B(R) mamy X−1[B] = {ω ∈ Ω : X(ω) ∈ B} ∈ F ).
Jest do definicja formalna. Ze względu na jej teoretyczny charakter nie będziemy się nią posługiwać. Do naszych rozważań wystarczy nam intuicyjne rozumienie pojęcia zmiennej losowej.
Przez zmienną losową będziemy rozumieli wielkość losową, którą można zmierzyć i pomiar ten wyrazić za pomocą liczby rzeczywistej.
Czasem będziemy się też odwoływali do pojęcia wartości (realizacji) zmiennej losowej. Będzie ono dla nas oznaczać wartość zmiennej losowej zmierzoną w konkretnym przypadku.
Zmienna losowa Wartość zmiennej losowej
liczba oczek wyrzucona na kostce do gry liczba oczek wyrzucona na kostce do gry w kon- kretnym rzucie
wzrost kobiety wzrost ustalonej kobiety
masa mężczyzny masa ustalonego mężczyzny
temperatura powietrza temperatura powietrza zmierzona w danym miej- scu i czasie
liczba prosiąt w miocie liczba prosiąt w miocie z konkretnej ciąży u kon- kretnej lochy
ciśnienie skurczowe krwi obwodowej ciśnienie skurczowe zmierzone w danym momen- cie u konkretnej osoby
Zmienne losowe zazwyczaj oznaczamy wielkimi literami a ich wartości odpowiadającymi im małymi literami.
Definicja 2 Dystrybuantą zmiennej losowej X nazywamy funkcję FX: R → [0, 1] zadaną wzorem: FX(t) = P (X ≤ t).
Twierdzenie 1 (Charakteryzacja dystrybuanty) Funkcja F : R → [0, 1] jest dystrybuantą pewnej zmien- nej losowej X wtedy i tylko wtedy, gdy
funkcja F jest niemalejąca,
funkcja F jest prawostronnie ciągła,
limt→−∞F (t) = 0,
limt→∞F (t) = 1.
Fakt 1 Dla dowolnych a, b ∈ R, przy czym a ≤ b, zachodzi:
P (X ≤ a) = FX(a), P (X < a) = lim
t→a−
FX(t), P (X ≥ a) = 1 − lim
t→a−FX(t), P (X > a) = 1 − FX(a), P (a < X ≤ b) = FX(b) − FX(a), P (a ≤ X ≤ b) = FX(b) − lim
t→a−
FX(t),
P (a ≤ X < b) = lim
t→b−FX(t) − lim
t→a−FX(t), P (a < X < b) = lim
t→b−FX(t) − FX(a).
Jeśli dystrybuanta FX jest funkcją ciągłą, to
P (X ≤ a) = P (X < a) = FX(a), P (X ≥ a) = P (X > a) = 1 − FX(a), P (a < X ≤ b) = P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X < b) = FX(b) − FX(a).
W szczególności jeśli dystrybuanta FX jest funkcją ciągłą, to P (X = a) = 0.
Definicja 3 Jeśli dla danej zmiennej losowej X istnieje funkcja fX: R → [0, ∞) taka że
∀B ∈ B(R) Z
B
fX(t)dt = P (X ∈ B),
(równoważnie: ∀t ∈ R
Z t
−∞
fX(t)dt = P (X ≤ t) = FX(t) ) to funkcję fX nazywamy gęstością zmiennej losowej X.
Fakt 2 (Własności gęstości) Jeśli zmienna losowa X ma gęstość fX, to wówczas
limt→−∞fX(t) = limt→∞fX(t) = 0,
R−∞∞ fX(t)dt = 1,
dla dowolnego t ∈ R zachodzi FX(t) =Rt
−∞fX(u)du.
Twierdzenie 2 Jeśli dystrybuanta FX jest różniczkowalna w całym zbiorze R lub też wszędzie poza borelowskim zbiorem N ⊆ R o tej własności, że R
R1N(x)dx = 0 (gdzie 1N(x) = 1 wtedy i tylko wtedy, gdy x ∈ N ) i R
R\NFX0 (x)dx = 1, to zmienna losowa X posiada gęstość i dla x ∈ R \ N możemy przyjąć, że fX(x) = FX0 (x).
Na zbiorze N gęstość fX możemy określić dowolnie.
Fakt 3
Jeśli dystrybuanta FX nie jest ciągła, to nie istnieje gęstość (patrz: druga kropka powyżej).
Jeśli dystrybuanta FX jest ciągła a także różniczkowalna poza co najwyżej skończoną liczbą punktów (lub nawet co najwyżej przeliczalną liczbą [izolowanych] punktów), to możemy przyjąć, że fX = FX0 w tych punktach, w których FX jest różniczkowalna. W punktach nieróżniczkowalności funkcji FX gęstość fX
możemy określić dowolnie.
Jeśli zmienna losowa ma gęstość, to zmiana wartości gęstości na dowolnym zbiorze Q ⊆ R o tej własności, że R
R1Q(x)dx = 0, nie ma wpływu na bycie gęstością i na rozkład zadany przez tę gęstość (bo zmiana ta nie zmienia całki).
Warto zwrócić uwagę, że każdy skończony bądź przeliczalny zbiór Q ⊆ R złożony z punktów izolowanych ma tę własność, żeR
R1Q(x)dx = 0.
Każda zmienna losowa ma dystrybuantę, ale nie każda ma gęstość!
Definicja 4 Mówimy, że zmienne losowe X i Y są niezależne, jeśli
∀ s, t ∈ R P (X ≤ s, Y ≤ t) = P (X ≤ s) · P (Y ≤ t) = FX(s) · FY(t).
Definicja 5 Mówimy, że zmienne losowe X i Y mają taki sam rozkład, jeśli mają te same dystrybuanty tzn.
FX(t) = FY(t) dla każdego t ∈ R.
Fakt 4 Jeśli zmienne losowe X i Y mają gęstości fX i fY i gęstości te są sobie równe lub też równe poza borelowskim zbiorem N ⊆ R o tej własności, że R
R1N(x)dx = 0, to zmienne losowe X i Y mają taki sam rozkład.