Rachunek prawdopodobieństwa MAP1151 Wydział Elektroniki, rok akad. 2011/12, sem. letni
Wykładowca: dr hab. A. Jurlewicz
Wykład 8: Zbieżność według rozkładu. Centralne twierdzenie graniczne.
Zbieżności ciągu zmiennych losowych według rozkładu.
Definicja.
Niech Xn ma rozkład o dystrybuancie Fn(x), a X - rozkład o dystrybuancie F (x).
Ciąg zmiennych losowych X1, X2, . . . jest
zbieżny według rozkładu
(in.
słabo zbieżny
) do zmiennej losowej X, jeżeli Fn(x) −→n→∞F (x) dla każdego takiego x, w którym F (x) jest ciągła.Oznaczenie: Xn −→n→∞d X, Fn −→n→∞d F .
Fakt.
(a) Jeżeli Xn
−→P
n→∞X, to Xn
−→d
n→∞X.
(b) Gdy Xn −→n→∞d X, gdzie P (X = a) = 1 dla pewnej stałej a, to Xn −→n→∞P X.
(c) Jeżeli Xn z pr.1−→n→∞X, to Xn −→n→∞d X.
Uwaga:
W zbieżnościach z prawdopodobieństwem 1, stochastycznej, w przestrzeni Lr graniczna zmienna losowa X jest określona z prawdopodobieństwem 1, tzn. jeżeli X0 i X00 są grani- cami ciągu Xn, to P (X0 = X00) = 1.
W zbieżności słabej określony jest tylko rozkład graniczny danego ciagu i każda zmienna losowa X o takim rozkładzie może reprezentować słabą granicę tego ciągu.
Twierdzenie de Moivre’a-Laplace’a. Centralne twierdze- nie graniczne.
Z PWL Bernoulliego wiemy, że P
Sn n − p
>
−→
n→∞0 dla dowolnego > 0,
gdzie Sn to ilość sukcesów w n próbach Bernoulliego z prawdopodobieństwem sukcesu p.
Pytanie:
Jaka jest szybkość zbieżności, tzn. dla jakiego n mamy P
Sn
n − p
>
< δ, gdzie δ > 0 jest ustalone? Innymi słowy, dla jakiego n prawdopodobieństwo, że popełnimy błąd rzędu
przyjmując częstość otrzymaną z n prób jako prawdopodobieństwo sukcesu p, było małe rzędu δ?
Twierdzenie de Moivre’a-Laplace’a. (XVIII w.)
Niech Sn będzie liczbą sukcesów w n próbach Bernoulliego z prawdopodobieństwem suk- cesu p. Wtedy
Sn− np
qnp(1 − p) = Sn− ESn
√D2Sn
−→d
n→∞Y gdzie Y ma standardowy rozkład normalny N (0, 1).
Inaczej mówiąc, dla dowolnego x ∈R
P
Sn− np
qnp(1 − p)
< x
−→n→∞Φ(x)
gdzie Φ(x) =
x
Z
−∞
√1
2πe−t22dt to dystrybuanta standardowego rozkładu normalnego N (0, 1).
Uwaga:
Twierdzenie de Moivre’a-Laplace’a mówi o tym, że liczba sukcesów w n próbach Bernoul- liego z prawdopodobieństwem sukcesu p po standardyzacji (tzn. unormowaniu do zmiennej losowej o średniej 0 i wariancji 1) dąży według rozkładu do standardowego rozkładu nor- malnego, gdy n → ∞.
Zatem dla dużych n liczba sukcesów w n próbach Bernoulliego z prawdopodobieństwem sukcesu p ma asymptotycznie rozkład normalny N (np,qnp(1 − p)). Równoważnie, czę- stość występowania sukcesów Sn
n ma asymptotycznie rozkład normalny N
p,
qp(1−p) n
.
Zastosowanie twierdzenia de Moivre’a-Laplace’a
1. Oszacowanie prawdopodobieństwa błędu w PWL Bernoulliego:
P
Sn n − p
>
= P
Sn− np
qnp(1 − p)
> n
qnp(1 − p)
≈ 2
1 − Φ
√ n
qp(1 − p)
dla n dostatecznie dużych.
Błąd oszacowania nie przekracza 1, 6p2+ (1 − p)2
qnp(1 − p) .
2. Przybliżony sposób obliczania P (Sn< k)
Z twierdzenia de Moivre’a-Laplace’a można w przybliżony sposób szybko obliczyć praw- dopodobieństwa wystąpienia k sukcesów w n próbach Bernoulliego dla dużych n i p z wnętrza przedziału (0, 1), odległych od 0 i od 1.
P (Sn < k) = P (Sn< k − 0, 5) ≈ Φ
k − 0, 5 − np
qnp(1 − p)
P (Sn ¬ k) = P (Sn < k + 0, 5) ≈ Φ
k + 0, 5 − np
q
np(1 − p)
P (Sn k) = P (Sn> k − 0, 5) ≈ 1 − Φ
k − 0, 5 − np
qnp(1 − p)
P (Sn> k) = P (Sn > k + 0, 5) ≈ 1 − Φ
k + 0, 5 − np
q
np(1 − p)
z błędem, który nie przekracza 0, 8(p2+ (1 − p)2)
qnp(1 − p) .
P (Sn = k) = P (k − 0, 5 < Sn < k + 0, 5) ≈ Φ
k + 0, 5 − np
q
np(1 − p)
− Φ
k − 0, 5 − np
q
np(1 − p)
z błędem, który nie przekracza 1, 6(p2+ (1 − p)2)
qnp(1 − p) .
Przykłady do zad. 6.1
Centralne Twierdzenie Graniczne
PWL Bernoulliego (tw. Borela) to szczególny przypadek PWL dla ciągu niezależnych zmiennych losowych o jednakowym rozkładzie o skończonej średniej (gdy rozkład ten jest zerojedynkowy B(1, p)). Podobnie, twierdzenie de Moivre’a-Laplace’a jest szczególnym przypadkiem ogólniejszego
Centralnego Twierdzenia Granicznego (CTG) Lindeberga-Lévy’ego
:Centralne Twierdzenie Graniczne Lindeberga-Lévy’ego.
Niech (Xn) będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie, przy czym 0 < D2Xn= σ2 < ∞. Oznaczmy m = EXn (ta wartość oczekiwana istnieje na mocy założenia, że istnieje wariancja). Wówczas
Sn− nm σ√
n
−→d
n→∞Y, gdzie Y ma standardowy rozkład normalny N (0, 1).
Inaczej mówiąc, dla dowolnego x ∈R
P Sn− nm σ√
n < x
!
−→n→∞Φ(x)
gdzie Φ(x) =
Zx
−∞
√1
2πe−t22dt to dystrybuanta standardowego rozkładu normalnego N (0, 1).
Oszacowanie dokładności przybliżenia w CTG Lindeberga-Lévy’ego:
Nierówność Berry-Essena
Niech (Xn) będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie, przy czym E|Xn|3 < ∞. Ponadto niech m = EXn, σ2 = D2Xn > 0 (ta wartość oczekiwana i wariancja istnieją na mocy założenia o rozkładzie). Wówczas
sup
x∈R
P Sn− nm σ√
n < x
!
− Φ(x)
¬ CE|X1− m|3 σ3√
n , dla pewnej stałej C, która spełnia nierówność √12π ¬ C < 0, 8.
Uwagi:
1. Jeżeli zmienne losowe Xn maja niezerową skończoną wariancję, to do szacowa- nia szybkości zbieżności w PWL Kołmogorowa można stosować metody analogicz- ne do tych dotyczacych PWL Bernoulliego, opartych na twierdzeniu de Moivre’a- Laplace’a.
2. Twierdzenie de Moivre’a-Laplace’a, CTG Lindeberga-Lévy’ego to przykłady central- nych twierdzeń granicznych. CTG dla zmiennych o różnych rozkładach to np. twier- dzenie Lindeberga-Fellera, twierdzenie Lapunowa.
3. CTG Lindeberga-Lévy’ego to wynikanie:
istnieje niezerowa wariancja =⇒ zbieżność unormowanych sum do standardowego rozkładu normalnego.
Interpretacja CTG Lindeberga-Lévy’ego:
Jeżeli wielkość fizyczna jest opisana zmienną losową i jest wynikiem sumowania wielu niezależnych jednakowych statystycznie efektów, przy czym rozkład efektu ma skończoną wariancję, to wielkość ta ma asymptotycznie rozkład normalny.
Przykłady do zad. 6.2