Zmienne losowe dwuwymiarowe, rozkład łączny, rozkłady brzegowe.

(1)

Rachunek prawdopodobieństwa MAP1151 Wydział Elektroniki, rok akad. 2011/12, sem. letni

Wykładowca: dr hab. A. Jurlewicz

Wykład 7: Zmienne losowe dwuwymiarowe. Rozkła- dy łączne, brzegowe. Niezależność zmiennych loso- wych. Momenty. Współczynnik korelacji. Sumowa- nie niezależnych zmiennych losowych. Prawo wiel- kich liczb.

Zmienne losowe dwuwymiarowe, rozkład łączny, rozkłady brzegowe.

Definicja.

Zmienna losowa dwuwymiarowa

to wektor (X, Y ), którego składowe X, Y są zmiennymi losowymi.

Rozkład wektora losowego

(X, Y ) to funkcja P ((X, Y ) ∈ C), gdzie C to bo- relowski podzbiór płaszczyzny R². Nazywamy go

rozkładem łącznym

zmiennych losowych X, Y .

Rozkład zmiennej losowej X i rozkład zmiennej losowej Y nazywamy

rozkładami brzegowymi

wektora losowego (X, Y ).

Pełna informacja o rozkładzie łącznym zmiennych losowych X, Y zawarta jest:

(a) w dystrybuancie tego rozkładu, czyli funkcji

F_X,Y(x, y) = P (X < x, Y < y)

(b) w przypadku dyskretnego wektora losowego (X, Y ) zawarta jest także w ciągu trójek {(xn, yk, pnk), n ∈T¹ ^⊂N^{, k ∈}T² ^⊂N}, gdzie {xn, n ∈T¹^{} oraz {y}^k^{, k ∈}T²^} to ciągi wszystkich wartości przyjmowanych odpowiednio przez X i Y z dodatnimi prawdopodobieństwami, natomiast p_nk = P (X = x_n, Y = y_k), n ∈T1, k ∈T2. (Ciągi {x_n, n ∈ T1} oraz {y_k, k ∈ T2} muszą być różnowartościowe, natomiast pnk  0 dla wszystkich n, k oraz ^P

n∈T1

P

k∈T2

pnk = 1, aby rozkład był dobrze określony.) (c) w przypadku ciągłego rozkładu wektora losowego (X, Y ) zawarta jest także w

gęstości łącznej f (x, y), czyli takiej funkcji f (x, y) 0 dla każdego (x, y), że FX,Y(x, y) =

Zx

−∞

ds

y

Z

−∞

f (s, t)dt

(Aby funkcja f (x, y) była gęstością pewnego rozkładu prawdopodobieństwa musi spełniać warunki: f (x, y) 0 dla każdego (x, y) oraz

∞

Z

−∞

dx

∞

Z

−∞

f (x, y)dy = 1.)

(2)

Fakt: Jeśli znamy rozkład łączny, to znamy też rozkłady brzegowe, gdyż:

FX(x) = P (X < x) = P (X < x, Y < ∞) = lim

y→∞FX,Y(x, y), F_Y(y) = P (Y < y) = P (X < ∞, Y < y) = lim

x→∞F_X,Y(x, y) W przypadku dyskretnego wektora losowego (X, Y ) zadanego ciagiem {(x_n, y_k, p_nk), n ∈T1, k ∈T2}:

rozkład zmiennej losowej X zadany jest ciągiem {(x_n, p_n·), n ∈T¹^{}, gdzie} p_n· = P (X = x_n) = ^P

k∈T2

P (X = x_n, Y = y_k) = ^P

k∈T2

p_nk

Podobnie, rozkład zmiennej losowej Y zadany jest ciągiem {(y_k, p_·k), k ∈T²^}, gdzie p·k = P (Y = y_k) = ^P

n∈T1

P (X = x_n, Y = y_k) = ^P

n∈T1

p_nk

W przypadku wektora o rozkładzie ciągłym o gęstości łącznej f (x, y) można pokazać, że:

rozkład zmiennej losowej X jest ciągły o gęstości f_X(x) =

∞

Z

−∞

f (x, y)dy,

rozkład zmiennej losowej Y jest ciągły o gęstości fY(y) =

∞

Z

−∞

f (x, y)dx.

Niezależność zmiennych losowych

Definicja.

Zmienne losowe X i Y są

niezależne

, gdy dla dowolnych borelowskich zbiorów B₁ i B₂ zdarzenia {X ∈ B₁} i {Y ∈ B₂} są niezależne,

tzn. P (X ∈ B1, Y ∈ B2) = P (X ∈ B1)P (Y ∈ B2).

Zmienne losowe X₁, X₂, . . . , Xn są niezależne, gdy dla dowolnych borelowskich zbiorów B₁, B₂, . . . , B_n rodzina {{X_i ∈ B_i}, i = 1, 2, . . . , n} jest rodziną zdarzeń niezależnych.

Fakt.

Zmienne losowe X i Y są niezależne wtedy i tylko wtedy, gdy dla każdego (x, y) FX,Y(x, y) = FX(x)FY(y).

W przypadku rozkładu dyskretnego warunek ten jest równoważny warunkowi p_nk = p_n·p·k

dla każdego (n, k) z odpowiedniego zakresu.

W przypadku rozkładu ciągłego warunkiem równoważnym jest f (x, y) = f_X(x)f_Y(y)

dla prawie wszystkich (x, y) (tzn. równość może nie zachodzić na zbiorze o polu 0).

Przykłady do zad. 5.1, 5.2

(3)

Wartość oczekiwana i macierz kowariancji zmiennej loso- wej dwuwymiarowej. Współczynnik korelacji.

Definicja.

(EX, EY ) to wektor wartości oczekiwanych zmiennej losowej dwuwymiarowej (X, Y ).

Cov(X, Y ) = EXY − EXEY - współczynnik kowariancji zmiennych X i Y

"

D²X Cov(X, Y ) Cov(X, Y ) D²Y

#

to macierz kowariancji zmiennej losowej dwuwymiarowej (X, Y ) Parametry te są dobrze określone, o ile istnieją wartości oczekiwane i wariancje zmiennych losowych X i Y

Fakt.

Dla dowolnej funkcji borelowskiej EZ = Eg(X, Y ) =

∞

Z

−∞

∞

Z

−∞

g(x, y)dF_X,Y(x, y) =

=









 P

n∈T1

P

k∈T2

g(xn, yk)pnk, gdy X ma rozkład dyskretny

zadany ciągiem {(xn, yk, pnk), n ∈T1, k ∈T2};

∞

R

−∞

∞

R

−∞

g(x, y)f (x, y)dxdy, gdy X ma rozkład ciągły o gęstości f (x, y).

o ile całka (szereg) zbieżne.

Stąd jeśli istnieją EX i EY , to

E(X + Y ) = EX + EY oraz jeśli istnieją D²X i D²Y , to

D²(X + Y ) = D²X + D²Y + 2Cov(X, Y ).

Definicja.

Przy założeniu, że istnieją D²X > 0 i D²Y > 0, określamy

współczynnik korelacji

zmiennych losowych X i Y jako:

ρ_XY = Cov(X, Y )

√D²X · D²Y . Własności współczynnika korelacji:

• |ρXY| ¬ 1.

• |ρ_XY| = 1 wtedy i tylko wtedy, gdy Y = aX + b dla pewnych stałych a 6= 0, b, przy czym ρ_XY = 1 odpowiada a > 0, a ρ_XY = −1 odpowiada a < 0 (pełna liniowa zależność Y od X).

• Gdy ρ_XY = 0, mówimy, że X i Y są nieskorelowane.

Przykłady do zad. 5.3

(4)

Fakt.

Jeżeli zmienne losowe X i Y są niezależne oraz ich wartości oczekiwane i wariancje istnieją, przy czym wariancje są niezerowe, to

EXY = EXEY a stąd

D²(X + Y ) = D²X + D²Y oraz ρ_XY = 0.

Zatem jeśli zmienne losowe o skończonych i niezerowych wariancjach są niezależne, to są też nieskorelowane. Implikacja odwrotna nie jest prawdziwa.

Suma niezależnych zmiennych losowych.

X i Y to niezależne zmienne losowe odpowiednio o dystrybuantach F_X(x) i F_Y(y).

Wówczas Z = X + Y ma rozkład o dystrybuancie

F_X+Y(z) =

∞

Z

−∞

F_X(z − y)dF_Y(y).

Jest to tzw. splot dystrybuant (miar).

Jeśli X i Y mają rozkłady ciągłe o gęstościach odpowiednio fX(x) i fY(y), to Z = X + Y też ma rozkład ciągły o gęstości

f_X+Y(z) =

∞

Z

−∞

f_X(z − y)f_Y(y)dy = (f_X ∗ f_Y)(z).

Jest to znany nam splot gęstości.

(5)

Zbieżności ciągu zmiennych losowych z prawdopodobień- stwem 1 i stochastyczna.

Definicja.

Ciąg zmiennych losowych X₁, X₂, . . . jest

zbieżny z prawdopodobieństwem 1

(in.

prawie na pewno

) do zmiennej losowej X, jeżeli P (ω : lim

n→∞X_n(ω) = X(ω)) = 1.

Oznaczenie: Xn z pr.1

−→n→∞X, X_n −→^p.n.

n→∞X, lim

n→∞X_n = X z prawd. 1.

Uwaga:

Ciąg zbieżny punktowo jest zbieżny z prawdopodobieństwem 1.

(Ciąg X₁, X₂, . . . jest zbieżny punktowo do X, jeżeli

n→∞lim X_n(ω) = X(ω) dla każdego ω ∈ Ω.)

Zbieżność stochastyczna:

Definicja.

Ciąg zmiennych losowych X₁, X₂, . . . jest

zbieżny stochastycznie

(in.

według prawdopodobieństwa

) do zmiennej losowej X, jeżeli

^ P (|X_n− X| ) −→_n→∞0.

>0

Oznaczenie: X_n −→_n→∞^P X, P − lim

n→∞X_n = X.

Fakt.

(a) Jeżeli Xn z pr.1

−→n→∞X, to Xn

−→P

n→∞X.

(b) Jeżeli X_n −→_n→∞^P X, to istnieje podciąg (X_k_n) ciagu (X_n), taki że X_k_n ^{z pr.1}−→_n→∞X.

(6)

Prawa wielkich liczb (PWL)

Definicja.

Niech X₁, X₂, . . . będzie ciągiem zmiennych losowych o skończonych wartościach oczeki- wanych EX_n= m_n. Niech S_n= X₁+ X₂+ . . . + X_n, a_n= m₁+ m₂+ . . . + m_n.

Mówimy, że ciąg (X_n) spełnia

słabe prawo wielkich liczb (SPWL)

, gdy S_n− a_n

n = 1

n

X

k=1

(Xk− mk) −→^P

n→∞0.

Mówimy, że ciąg ten spełnia

mocne prawo wielkich liczb (MPWL)

, gdy S_n− a_n

n

z pr.1

−→n→∞0.

Oczywiście MPWL =⇒ SPWL.

PWL dla ciągów zmiennych losowych o jednakowym rozkładzie

Twierdzenie Chinczyna.

Niech (Xn) będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie, przy czym E|X_n| < ∞. Wtedy ciąg ten spełnia SPWL, które w tym przypadku można zapisać w postaci

S_n n = 1

n

X

k=1

X_k −→_n→∞^P m = EX₁.

MPWL Kołmogorowa.

Niech (Xn) będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie.

Ciąg ten spełnia MPWL, które w tym przypadku można zapisać w postaci S_n

n = 1 n

n

X

k=1

X_k ^{z pr.1}−→_n→∞m = EX₁.

wtedy i tylko wtedy, gdy E|X_n| < ∞.

(7)

Szczególny przypadek:

Jeżeli (X_n) to ciąg niezależnych zmiennych losowych o jednakowym rozkładzie zerojedyn- kowym B(1, p), tzn. P (Xn = 1) = p = 1 − P (Xn = 0), to Sn ma rozkład Bernoulliego B(n, p), taki jak rozkład ilości sukcesów w n próbach Bernoulliego z prawdopodobień- stwem sukcesu p, a m = EX₁ = p.

Prawo wielkich liczb Bernoulliego, twierdzenie Borela:

Niech S_n będzie liczbą sukcesów w n próbach Bernoulliego z prawdopodobieństwem suk- cesu p. Wtedy zachodzi

• PWL Bernoulliego (XVII/XVIII w.) (SPWL) S_n

n

−→P

n→∞p.

• twierdzenie Borela (pocz. XX w.) (MPWL) S_n

n

z pr.1

−→n→∞p.

Interpretacja:

Częstość występowania sukcesu w n próbach Bernoulliego przybliża przy dużym n praw- dopodobieństwo p sukcesu w pojedynczej próbie. Odpowiada to obserwacjom z natury, że częstość zdarzenia losowego stabilizuje się na pewnym poziomie.

(8)

Przykłady zastosowań PWL

Metoda Monte Carlo obliczania całek oznaczonych:

Niech X₁, X₂, . . . X_n będzie ciągiem niezależnych zmiennych losowych o jednakowym roz- kładzie jednostajnym na przedziale [a, b] oraz niech f będzie funkcją rzeczywistą taką, że Ef (X₁) istnieje i jest skończona.

Przy powyższych założeniach f (X₁), f (X₂), . . . f (X_n) jest także ciągiem niezależnych zmien- nych losowych o jednakowym rozkładzie, przy czym istnieje wartość oczekiwana Ef (X₁).

Ponadto Ef (X1) = 1 b − a

Zb

a

f (x)dx. Z MPWL Kołmogorowa mamy

1 n

n

X

k=1

f (X_k) ^{z pr.1}−→_n→∞Ef (X₁) = 1 b − a

b

Z

a

f (x)dx.

Możemy zatem do obliczania przybliżonej wartości całki oznaczonej

b

R

a

f (x)dx zastosować następujący algorytm:

(i) losujemy niezależnie liczby u₁, u₂, . . . , u_n z rozkładu jednostajnego U [0, 1];

(ii) przekształcamy x_k = a + (b − a)u_k dla k = 1, 2, . . . , n otrzymując w ten sposób próbkę z rozkładu U (a, b);

(iii) jako przybliżoną wartość całki przyjmujemy

b

R

a

f (x)dx ≈ b − a n

n

X

k=1

f (x_k).

Przykładowy program w Matlabie function calkowanieMonteCarlo

N=10000;%N - ilość prób Monte Carlo

%(im wieksze N, tym wynik przyblizony blizszy rzeczywistej wartosci calki) a=-1; %a - poczatek przedzialu calkowania

b=1; %b - koniec przedzialu calkowania

%generujemy x1, x2, ..., xN z rozkładu jednostajnego na przedziale (a, b) x=a+(b-a)*rand(1,N);

%liczymy wartości funkcji podcałkowej f (x₁), f (x₂), . . . , f (x_N), gdzie f (x) =√ 1 − x² f=sqrt(1-x.ˆ2);

%obliczamy przybliżoną wartość całki ze wzoru ^b−a_n ^Pⁿ_k=1f (x_k) calka=(b-a)/N*sum(f)

Uwaga:

b

R

a

f (x)dx =

1

R

−1

√1 − x²dx = ^π₂ ≈ 1, 5707963267

Kilka otrzymanych wyników przybliżonych: 1,5725; 1,5680; 1,5736; 1,5729.

(9)

Dystrybuanta empiryczna:

Rozważmy ciąg X₁, X₂, . . . X_nniezależnych zmiennych losowych o jednakowym rozkładzie opisanym dystrybuantą F (x). Ciąg ten interpretujemy jako opis wyników n niezależnych pomiarów pewnej wielkości fizycznej X, dokonywanych w tych samych warunkach fizycz- nych. Wartości x₁, x₂, . . . x_n zmiennych losowych w tym ciągu to wyniki konkretnych ta- kich pomiarów. Ciąg X1, X2, . . . Xn nazywamy próbą prostą.

Niech S_n(x; X₁, X₂, . . . X_n) oznacza ilość elementów próby prostej, których wartość jest mniejsza niż x.

F_n(x; X₁, X₂, . . . X_n) = S_n(x; X₁, X₂, . . . X_n)

n (albo F_n(x; x₁, x₂, . . . x_n)) nazywamy dys- trybuantą empiryczną.

Zauważmy, że Sn(x; X1, X₂, . . . X_n) oznacza ilość tych Xi, których wartość jest mniejsza niż x. Jest to zatem ilość sukcesów w n próbach Bernoulliego, gdzie sukces w itej próbie to zdarzenie {X_i < x} i p = P (X_i < x) = F (x) niezależnie od i.

Zatem Sn(x; X1, X₂, . . . X_n) ma rozkład Bernoulliego B(n, p = F (x)).

Z tw. Borela otrzymujemy, że

Fn(x; X₁, X₂, . . . Xn) = S_n(x; X1, X₂, . . . X_n) n

z pr.1

−→n→∞p = F (x).

Inaczej mówiąc, dla dużych n, dla prawie każdej wartości (x₁, x₂, . . . x_n) wektora losowego (X1, X₂, . . . X_n) mamy Fn(x; x1, x₂, . . . x_n) ≈ F (x), czyli dystrybuanta empiryczna jest w przybliżeniu równa dystrybuancie teoretycznej F .

0 2 4 6 8

0 1

0 2 4 6 8

0 1

0 2 4 6 8

0 1

n=10

n=100

n=1000

Przykład:

Niebieski wykres:

F (x) = 1 − e^−x dla x > 0, czerwony wykres:

realizacja dystrybuanty empirycznej.