• Nie Znaleziono Wyników

Rozdział 2Rozdział 2Rozdział 2Rozdział 2 ZMIENNA LOSOWA I ROZKŁAD ZMIENNA LOSOWA I ROZKŁAD ZMIENNA LOSOWA I ROZKŁAD ZMIENNA LOSOWA I ROZKŁAD PRAWDOPODOBIEŃSTWAPRAWDOPODOBIEŃSTWAPRAWDOPODOBIEŃSTWAPRAWDOPODOBIEŃSTWA

N/A
N/A
Protected

Academic year: 2021

Share "Rozdział 2Rozdział 2Rozdział 2Rozdział 2 ZMIENNA LOSOWA I ROZKŁAD ZMIENNA LOSOWA I ROZKŁAD ZMIENNA LOSOWA I ROZKŁAD ZMIENNA LOSOWA I ROZKŁAD PRAWDOPODOBIEŃSTWAPRAWDOPODOBIEŃSTWAPRAWDOPODOBIEŃSTWAPRAWDOPODOBIEŃSTWA"

Copied!
29
0
0

Pełen tekst

(1)

Rozdział 2 Rozdział 2 Rozdział 2

Rozdział 2 ZMIENNA LOSOWA I ROZKŁAD ZMIENNA LOSOWA I ROZKŁAD ZMIENNA LOSOWA I ROZKŁAD ZMIENNA LOSOWA I ROZKŁAD PRAWDOPODOBIEŃSTWA PRAWDOPODOBIEŃSTWA PRAWDOPODOBIEŃSTWA PRAWDOPODOBIEŃSTWA

Te dwa pojęcia – zmienna losowa i rozkład prawdopodobieństwa – są bez wątpienia kluczowymi pojęciami probabilistyki. Dzieje się tak dlatego, że wprowadzają one nowy porządek do opisu przestrzeni probabilistycznej (E,Z,P) doświadczenia losowego D. Porządek ten polega na tym, że przez przypisanie każdemu zdarzeniu elementarnemu e liczby X(e) nabywają one (zdarzenia) cechę właściwą liczbom – można je ustawić po kolei na osi x – i już z x-ami (czyli wartościami zmiennej losowej X) wiązać prawdopodobieństwo, tworząc w ten sposób bardzo wygodne pojęcie – rozkład prawdopodobieństwa. Takie podejście pozwala na lepsze całościowe spojrzenie na własności doświadczenia D, ułatwia też obliczenia.

Statystyka operuje liczbami, toteż pojęcie zmiennej losowej jest dla niej niezbędne. Z drugiej strony celem doświadczenia – a w szczególności doświadczenia losowego – jest z reguły dostarczenie liczby lub liczb, tak że pojęcie doświadczenie i pojęcie liczba są ściśle ze sobą związane.

2.1 2.1

2.1 2.1 JEDNOWYMIAROWA ZMIENNA LOSOWA JEDNOWYMIAROWA ZMIENNA LOSOWA JEDNOWYMIAROWA ZMIENNA LOSOWA JEDNOWYMIAROWA ZMIENNA LOSOWA XXXX (((( eeee ), ), ), ), eeee 0 0 0 0 EEEE

Wszystkie nowe pojęcia dotyczące tej zmiennej przenoszą się na zmienne więcejwymiarowe, toteż rozdział ten ma charakter podstawowy.

2.1.1 Definicja zmiennej losowej X(e), e0000E

Dane jest doświadczenie losowe D oraz jego przestrzeń probabilistyczna (E,Z,P).

Przypiszmy jednoznacznie (na ogół w sposób arbitralny) każdemu zdarzeniu elementarnemu e0E pewną liczbę rzeczywistą x. Określamy w ten sposób pewien

(2)

związek pomiędzy elementami zbioru E i liczbami lub mówiąc inaczej: definiujemy na przestrzeni E zdarzeń elementarnych pewną funkcję liczbową X(e). Funkcja ta nosi nazwę zmiennej losowej, jeśli spełnia warunki określone w poniższej definicji.

Definicja zmiennej losowej X. Jednoznaczną funkcję rzeczywistą X(e), e0E, nazywa się zmienną losową, jeśli dla dowolnej liczby rzeczywistej x przedziałowi (-4, x) odpowiada pewne zdarzenie losowe A (tzn. istnieje zbiór A takich zdarzeń elementarnych e0E, że X(e)<x oraz A0Z) (zob. rys. 2.1).

Definicja ta wydaje się cokolwiek skomplikowana, jednakże jej sens jest bardzo prosty: każdemu zdarzeniu elementarnemu przypisujemy (na ogół) arbitralnie jedną liczbę w taki sposób, że dla dowolnej liczby rzeczywistej x nierówność X<x oznacza pewne zdarzenie losowe.

Wielkości mierzalne i niemierzalne. Jednym z najczęściej spotykanych przykładów zmiennej losowej jest wynik pomiaru. Jest to całkiem naturalne przyporządkowanie pomiar e Y liczba x(e). Jednakże nawet ono nie jest jedyne (np. z powodu różnych systemów jednostek, w których możemy wyrażać wynik pomiaru).

Przyporządkowanie takie jest natomiast zupełnie arbitralne, gdy doświadczenie daje wyniki jakościowe. Najprostszym przykładem takiego doświadczenia jest rzut monetą. Tradycyjnie przyjmujemy przyporządkowanie orzeł Y zero, reszka Y jeden (lub na odwrót), ale każda inna para różnych liczb jest równie dobra.

Przykładami bardziej skomplikowanymi są wszystkie kwantyfikowane (tj. takie, którym przypisuje się liczby) wielkości niemierzalne, np. iloraz inteligencji, gdzie ten stopień dowolności jest duży.

Przestrzeń indukowana (EX=X, ZX, PX). Poprzez określenie zmiennej losowej powstaje nowa przestrzeń zdarzeń elementarnych EX = X (jako zbiór liczb x(e)) i nowy (borelowski) zbiór zdarzeń losowych ZX (zbiór podzbiorów przestrzeni X), na którym określone jest prawdopodobieństwo PX(X<x). Przestrzeń (EX=E, ZX, PX) nazywana jest czasami przestrzenią (probabilistyczną) indukowaną przez zmienną X(e). Głównie ona będzie używana w dalszym ciągu niniejszego tekstu, jednakże – ponieważ nie jest to niezbędne – obie te przestrzenie, tj. (E,Z,P) i (EX, ZX, PX), nie będą rozróżniane. Kontekst stosowanego zdania pozwoli na zidentyfikowanie użytej przestrzeni.

Z własności zbioru zdarzeń losowych wynika, że zdarzeniem losowym jest nie tylko (zrealizowanie się w doświadczeniu D nierówności) X<x, ale można także mówić o zdarzeniach X=x, X$x, czy a#X<b, gdzie a i b są ustalonymi liczbami rzeczywistymi (a<b) oraz, oczywiście, o prawdopodobieństwach wynoszących odpowiednio P(X<x), P(X=x), P(X$x) i P(a#X<b).

Zmienne losowe oznacza się na ogół dużymi literami (np. X, Y, Z), natomiast ich realizacje (konkretne wartości) małymi literami (odpowiednio: x, y, z). Ważną

(3)

losowej), gdyż może to mieć istotne konsekwencje dla rozumienia niektórych dalszych zagadnień i rozwiązywania praktycznych zadań.

Relacje pomiędzy wielkościami D, E, Z, P oraz X zilustrowane są na rys. 2.1.

X<x jest nierównością funkcyjną, a nie przedziałem! i oznacza zdarze- nie losowe. Należy mocno podkreślić, że nierówność X<x, która pojawiła się w defi- nicji zmiennej losowej X jest nierównością funkcyjną: X(e)<x (e0E,x0R), a więc dla ustalonego x nie oznacza zbioru wszystkich liczb z przedziału (-4,x), a jedynie takie, którym odpowiadają zdarzenia elemen- tarne. Liczba zdarzeń elementarnych e takich, że jest spełniona nierówność X(e)<x (a więc liczba realizacji zmiennej losowej X mniejszych od zadanej wartości x) zależy od liczebności przestrzeni zdarzeń elemen- tarnych E i wartości x, i w szczególności może wynosić zero.

Przykład 2.1. X<x jest nierównością funkcyjną, a nie przedziałem! i oznacza zdarzenie losowe.

Doświadczenie D jest rzutem idealną kostką sześcienną. Przestrzeń zdarzeń elemen- tarnych tego doświadczenia E={eK: K=1,2, ...,6}. Niech zmienna losowa będzie zdefiniowana wzorem X(eK)=K, K=1,2,...,6. Jeśli x=1, to nierówności X(eK)<x nie odpowiadają żadne zda- rzenia elementarne i nierówność X(eK)<1 oznacza zdarzenie niemożliwe A = q. Jeśli x=4, to nierówność X(eK)<4 może się zrealizować w wyniku doświadczenia D na 3 sposoby; oznacza ona więc jedynie trzy liczby: 1, 2 i 3 lub inaczej: (X(eK)<4) oznacza zdarzenie A = {1,2,3.} K duże czy małe??

2.1.2 Rozkład prawdopodobieństwa P(X0000S) i funkcje rozkładu

Pojęcie rozkład prawdopodobieństwa. Mówiąc nieprecyzyjnie pojęcie roz- kład prawdopodobieństwa oznacza funkcję zmiennej rzeczywistej x, która obrazuje jak zmienia się (rozkłada się) prawdopodobieństwo dotyczące zmiennej losowej X wzdłuż osi x – osi wartości (realizacji) tej zmiennej. Pojęcie to jest niejednoznaczne w tym sensie, że nazwa rozkład prawdopodobieństwa jest traktowana jako synonim pojęcia funkcja rozkładu prawdopodobieństwa, a tych jest kilka, m.in. dystrybuanta, funkcja gęstości prawdopodobieństwa oraz funkcja pi = P(X=xi) dla zmiennej

D E

e0 0 0 0E A d d d dE

A 0 0Z 0 0

Z

P(X<x) P(A)

P

P(X<x)=P(A)

X(e)<x

X(e) x

Rys. 2.1. Przestrzeń probabilistyczna (E,Z,P) doświadczenia losowego D i zmienna losowa X(e), e∈E

Zmienna losowa inaczej: Zmien- ną losową X można traktować jako zbiór możliwych wyników pomiaru wielkości X’.

(4)

dyskretnej. Za Fiszem [11] przedstawiona zostanie ogólna definicja rozkładu prawdopodobieństwa.

Definicja rozkładu prawdopodobieństwa. Dana jest zmienna losowa X i dowolny zbiór borelowski S na osi x. Rozkładem prawdopodobieństwa zmiennej losowej X nazywamy funkcję P(S), oznaczająca prawdopodobieństwo P(X0S) tego, że zmienna losowa przyjmie wartość (jedną!) z S.

Dwie podstawowe funkcje rozkładu prawdopodobieństwa. Teraz omó- wione zostaną dwie podstawowe funkcje rozkładu prawdopodobieństwa: dystry- buanta, oznaczana na ogół symbolem F(x), i funkcja prawdopodobieństwa przewyższenia, oznaczana na ogół symbolem p(x).

Dystrybuanta F(x). W definicji zmiennej losowej podane jest, że nierówność X<x odpowiada pewnemu zdarzeniu losowemu. Ponieważ x jest dowolną liczbą rzeczywistą, to prawdopodobieństwo P(X<x) jest funkcją wartości x. Oznaczmy tę funkcję symbolem F(x):

( ) P( )

def

F x = X <x (2.1)

Funkcja ta nazywa się dystrybuantą zmiennej losowej X i jest jedną z funkcji rozkładu prawdopodobieństwa zmiennej losowej X.

Własności dystrybuanty.

Dystrybuanta F(x) dowolnej zmiennej losowej X ma następujące własności:

1. œx0R 0#F(x)#1.

2. F(-4)=0 i F(+4)=1.

3. F(x) jest funkcją niemalejącą: jeśli x1<x2

to F(x1)#F(x2). (W większości praktycznych zastosowań dystrybuanta jest ściśle rosnąca).

4. F(x) jest funkcją co najmniej lewo- stronnie ciągłą: F(x-)= F(x), gdzie F(x-) oznacza lewostronną granicę funkcji F(x).

5. Prawdopodobieństwo, że w danym doświadczeniu losowym zrealizuje się zdarzenie losowe a#X<b, czyli że zmienna losowa X przyjmie którąkolwiek z wartości z przedziału lewostronnie domkniętego [a,b), wyraża się wzorem:

P(aX <b)=F b( )−F a( ) (2.2) 6. Prawdopodobieństwo, że w danym doświadczeniu losowym zrealizuje się zdarzenie losowe X=x, czyli że zmienna losowa X przyjmie określoną wartość x, wyraża się

F(x)=P(X# # # #x)

P(a# # # #X<b) F(a)

F(c+)

F(c-) F(b)

P(X=c)

a b c d x

P(X=d)

0 1

Rys. 2.2. Dystrybuanta F(x) zmiennej losowej X, ciągła w przedziale (-4,c), nieciągła w punktach c i d. Taka zmienna losowa nazywa się zmienną mie- szaną.

(5)

P(X =x)=F x( +)−F x( ) (2.3) gdzie F(x+) oznacza prawostronną, a F(x-) lewostronną granicę funkcji F(x). Ze wzoru tego wynika natychmiast, że jeśli dystrybuanta jest ciągła, to dla każdego x0R zacho- dzi równość P(X=x) = 0! Niezerowe prawdopodobieństwa możemy otrzymać w tym przypadku tylko dla niektórych niezerowych przedziałów -x zmiennej losowej X.

Należy mocno podkreślić, że równość P(X=x)=0 nie musi oznaczać, że (X=x) jest zdarzeniem niemożliwym. Jest tak, gdy zmienna losowa jest dyskretną zmienną, natomiast w przypadku ciągłej zmiennej losowej, równość ta na ogół oznacza tylko to, że zdarzenie (X=x) jest zdarzeniem bardzo mało prawdopodobnym.

Funkcja prawdopodobieństwa przewyższenia p(x). W ogólności mówiąc o rozkładzie prawdopodobieństwa danej zmiennej losowej X możemy mieć na myśli jeszcze inne funkcje, równoważne dystrybuancie. Jedną z nich jest funkcja praw- dopodobieństwa przewyższenia zmiennej losowej X, zdefiniowana następującym równaniem:

Przykład 2.2. Dystrybuanta zmiennej losowej X Niech doświadczenie D będzie rzutem idealną kostką

sześcienną. Niech zmienna losowa X będzie zdefiniowana wzorem X(eK)=K, K=1,2,...,6, gdzie eK jest zdarzeniem elementarnym jak w przykładzie poprzednim. Korzystając z klasycznej definicji prawdopodobieństwa i zakładając prawdopodobieństwo wyrzucenia dowolnej liczby K oczek P(eK)=1/6 (rys. 2.3), mamy:

F(1) = P(X<1) = 0, F(2) = P(X<2) =1/6, F(3) = P(X<3) = 2/6, F(4) = P(X<4) = 3/6, F(5) = P(X<5) = 4/6, F(6) = P(X<6) = 5/6.

Należy tutaj zwrócić uwagę na fakt, że dystrybuanta F(x) dowolnej zmiennej losowej X jest określona dla wszystkich liczb rzeczywistych (rys. 2.3). Pomimo więc, iż w niniejszym przykładzie najbardziej interesujące są wartości 1,2,...,6, to nie jest bez sensu pytanie o wartość F(x) dla każdej innej wartości x. Na przykład: F(x) = 0 dla każdego x#1 (zdarzenie niemożliwe), F(2.5) = 2/6, (zdarzenia sprzy- jające: e1 i e2), F(x) = 1 dla każdego x>6 (zdarzenie pewne) itp.

Rys. 2.3. Funkcje: pi = P(X=i), i=1,2, ...,6 oraz F(x) = P(X<x) dla jednokrotnego rzutu kostką

(6)

( ) P( )

def

p x = Xx (2.4)

określająca prawdopodobieństwo przekro- czenia przez zmienną X dowolnej zadanej wartości rzeczywistej x. (rys. 2.4). Ponieważ zdarzenia X≥x i X<x są zdarzeniami przeciwnymi, stąd mamy:

( ) ( ) 1

F x +p x = (2.5)

Na końcach przedziału zmienności zmiennej X przyjmuje wartości p(-4)=1 i p(4)=0.

Przykład 2.3. Funkcja prawdopodobieństwa przewyższenia zmiennej losowej X Przy warunkach jak w przykładzie 2.2, z klasycznej definicji prawdopodobieństwa oraz definicji funkcji praw- dopodobieństwa przewyższenia, mamy:

p(1) = P(X$1) = 6/6, p(2) = P(X$2) = 5/6, p(3) = P(X$3) = 4/6, p(4) = P(X$4) = 3/6, p(5) = P(X$5) = 2/6, p(6) = P(X$6) = 1/6.

Rys. 2.5 ilustruje przebieg funkcji p(x) prawdopodo- bieństwa przewyższenia. Kółeczka na rysunku wyłączają lewe końce odpowiednich odcinków.

pi=P(X=x)

p(x)=P(X$$$$x)

x

x

Rys. 2.5. Funkcje: pi = P(X=i), i=1, ...,6 oraz p(x) = P(X$x) dla jednokrotnego rzutu kostką

2.1.3 Rodzaje zmiennych losowych

Ze względów praktycznych wyróżnia się dwa główne typy zmiennych losowych:

dyskretne i ciągłe. Czasami, chociaż dużo rzadziej, używana jest zmienna mieszana.

Dyskretna (skokowa) zmienna losowa. Jest to taka zmienna, która z dodatnim prawdopodobieństwem przyjmuje przeliczalną lub skończoną liczbę war- tości X=xi, i=1,2,...,n, gdzie n<4 lub n=4. Dokładnie: zmienną losową typu dyskret- nego (lub: skokowego) nazywamy taką zmienną, która z prawdopodobieństwem jeden

p(x) F(x)

x

1/4

x

2/4

x

3/4

x 0

1 3/4 2/4 1/4

p(x)=P(X$x) p(x)=1-F(x)

Rys. 2.4 Funkcja p(x) prawdopodobieństwa przewyższenia zmiennej losowej X, czyli prawdopodobieństwo, że X przekroczy zadaną wartość x

(7)

przyjmuje wartości z pewnego, co najwyżej przeliczalnego zbioru, i każda wartość z tego zbioru realizuje się z prawdopodobieństwem dodatnim.

P( ), 1, 2,...

ozn

i i

p = X =x i= (2.6)

Funkcję tę nazywamy rozkładem prawdopodobieństwa zmiennej losowej dyskretnej X, zob. rys. 2.6, również rys. 2.3 i rys. 2.5).

Korzystając z niej możemy napisać wzory na dystrybuantę F(x):

( ) P( )

P( )

i i

i i

x x x x

F x X x

X x p

< <

= <

=

= =

(2.7)

i funkcję prawdopodobieństwa przewyższenia:

( ) P( )

P( )

i i

i i

x x x x

p x X x

X x p

= ≥

=

= =

(2.8)

zmiennej o takim rozkładzie, gdzie sumowanie odbywa się po wszystkich punktach xi

spełniających warunek pod znakiem sumy. Oczywiście:

( ) ( ) 0

i i

p =F ∞ = p −∞ =

(2.9)

(sumowanie odbywa się po wszystkich możliwych i).

Przykład 2.4. Dyskretna zmienna losowa Każda zmienna losowa przybierająca skończoną lub przeliczalną liczbę wartości jest zmienną losową dyskretną. Tak więc, zmienna losowa X = (liczba wyrzuconych oczek w jednym rzucie kostką sześcienną) jest zmienną dyskretną, podobnie liczba wadliwych sztuk w danej partii produkcji, czy liczba zdarzeń opadów atmosferycznych zaobserwowanych w ciągu jednego roku itp. Podane poprzednie dwa przykłady (2.2 i 2.3) ilustrują pojęcie zmiennej dyskretnej w sposób bardziej szczegółowy.

Ciągła zmienna losowa. Jest to taka zmienna, która

a) przyjmuje wszystkie wartości rzeczywiste z pewnego przedziału liczb rzeczywistych, np. 0#X<4, i

b) prawdopodobieństwo przyjęcia którejkolwiek z tych wartości wynosi zero, tzn.

P(X=x)=0 dla każdego x.

x1 x2 x3 x4 x5 x x'

F(x')

p1 p2 p3 p4 p3

p4

p5=P(X=x5) F(x) = P(X<x)

X = {x1,x2,x3,x4,x5} n=5

p1+p2+p3

Rys. 2.6 Dystrybuanta F(x) dyskretnej (skokowej) zmiennej losowej X i jej rozkład pi =P(X=xi)

(8)

Dokładna definicja ma postać następującą. Zmienną losową X nazywa się ciągłą, gdy istnieje taka funkcja nieujem-

na f(x), zwana gęstością (prawdopodo- bieństwa) zmiennej losowej X, że dla każdego rzeczywistej liczby x zachodzi równość

( ) P( ) x ( )

F x X x f x dx

−∞ ′ ′

= < =

(2.10)

(rys. 2.7). Oczywiście:

( ) P( ) ( ) 1

F X f x dx

−∞ ′ ′

∞ = < ∞ =

= (2.11)

Ciągłą zmienną losową można również zdefiniować jako taką zmienną, której dystrybuanta jest ciągłą funkcją. Jeśli ciągła zmienna losowa X jest taka, że P(X0[a,b))=1, to powiadamy, że rozkład

ten jest skoncentrowany (lub skupiony) na przedziale [a,b).

Przykład 2.5. Ciągła zmienna losowa: czas oczekiwania na autobus

Pasażer przychodzi na przystanek autobusowy, na którym nie ma rozkładu jazdy. Wiadomo jednak, że autobusy kursują dokładnie co 10 minut. Niech zmienna losowa X oznacza czas oczekiwania na autobus (w minutach). Zmienna ta jest ciągłą zmienną losową, która realizuje się w przedziale wartości [0,10] minut. Ponieważ żadna chwila x nie jest wyróżniona, gęstość prawdopodobieństwa f(x) jest funkcją stałą:

1 (0,10)

( ) 10

0 (0,10)

dla x f x

dla x

 ∈

=

 ∉

Rys. 2.8 pokazuje szczegółowo zarówno gęstość prawdopodobieństwa f(x) jak i dystrybuantę F(x) zmiennej X. Obie funkcje są zawsze określone w przedziale (-4, +4) (chociaż tylko przedział (0,10) jest interesujący).

Rys. 2.8. Funkcja gęstości praw- dopodobieństwa, f(x), oraz dys- trybuanta, F(x), czasu X oczeki- wania na autobus

F(x) = P(X<x)

F(b)

F(a)

a b

1

0

P(a###X<b)=#

F(b)-F(a) P(a####X<b) f x dF x

( ) dx( )

=

x

Rys. 2.7 Dystrybuanta F(x) i funkcja gęstości f(x) ciągłej zmiennej losowej X. Uwaga: Skale F(x) i f(x) są różne!

(9)

Zmienna losowa mieszana (dyskretno-ciągła). Zmienną losową X nazywa się zmienną mieszaną, jeśli w pewnym zakresie

swojej zmienności jest ciągła, a w pozostałym – dyskretna. Oznacza to, że w pewnym przedziale (lub przedziałach) istnieje funkcja gęstości, a w pozostałych – nie. Na rys. 2.2 pokazana jest dystry- buanta zmiennej losowej nieciągłej w punktach x=d oraz x=e i z jednym przedziałem ciągłości (-4, c).

Dystrybuanta mieszanej zmiennej losowej może być wyrażona wzorem

( ) P( ) ( )

i

x

i x x

F x X x f x dx p

−∞ <

′ ′

= < =

+

(2.12)

w którym prawdopodobieństwa pi są dodatnie, a funkcja f(·) jest różna od zera w co najwyżej

jednostronnie nieskończonym przedziale, a poza nim jest tożsamościowo (czyli dla wszystkich x) równa zeru.

Przykład 2.6. Mieszana zmienna losowa W Krainie Regularnego Deszczu opad deszczu wystę-

puje regularnie co drugi dzień i zawsze suma dobowa opadu nie przekracza 10 mm. Żadna z wysokości opadu dobowego nie jest wyróżniona (tzn. jest mniej więcej tyle samo opadów o wysokości 1 mm, jak 2 mm itp.).

Jeśli zmienną losową X (wysokość opadu dobowego) zdefiniujemy następująco:

X = 0, gdy brak opadu w danej dobie,

X = x, gdy wysokość opadu wynosi x mm, 0<x≤10, to zmienna ta jest zmienną losową mieszaną. W punkcie zero mamy bowiem P(X=0)= 1/2, natomiast w przedzia- le (0,10] mm X jest zmienną ciągłą (P(X=x|X>0)=0).

Rys. 2.10 pokazuje szczegółowo zarówno gęstość f(x) jak i dystrybuantę F(x) zmiennej X . Możemy oczywiście zdefiniować zmienną X wykluczając przypadek zerowej wysokości. Zmienna ta będzie wtedy zmienną ciągłą.

Obie funkcje – f(x) i F(x) – będą wyglądały inaczej (jak?).

F ( x ) = P ( X < x )

f( x) = 0 .1 d la x0 ( 0,1 ]

P (X = 0 ) = 1 /2

f( 0) =4444

Rys. 2.10. Funkcja gęstości praw- dopodobieństwa i dystrybuanta mieszanej zmiennej losowej X – wy- sokości opadu dobowego w KRD

F(x)=P(X###x)#

P(a###X<b)# F(a) F(c+) F(c-) F(b)

P(X=c)

a b c d x

P(X=d)

0 1

Rys. 2.9. Dystrybuanta F(x) mieszanej zmiennej losowej X, ciągłej w prze- dziale (-∞,c), poza nim nieciągłej (wraz z gęstością f(x).Uwaga: inna skala niż dla F(x) !)

Ostrzeżenie. Przykład 2.6 pokazuje, że spotykane czasami określenie zmiennej ciągłej, jako zmiennej przyjmującej wszystkie wartości z pewnego przedziału liczb rzeczywistych, jest niepoprawne (gdyż, jak widać, może dotyczyć również mieszanej zmiennej losowej) i nie powinno być stosowane.

(10)

2.1.4 Funkcje zmiennej losowej

Jeśli g jest jednoznacznym i ciągłym przekształceniem zmiennej losowej X w Y: Y = g(X), to Y jest zmienną losową, której dystrybuantę można wyznaczyć z dystrybuanty zmiennej X, a gdy jest zmienną ciągłą, to można wyznaczyć również gęstość prawdo- podobieństwa.

Rozkład dyskretny. Jeśli X jest dyskretną zmienną losową o rozkładzie px = P(X=x), to dla każdej wartości y zmiennej losowej Y = g(X) mamy rozkład praw- dopodobieństwa py zmiennej Y w postaci:

: ( )

P( ) P( ( ) )

y x

x g x y

p Y y g X y p

=

= = = = =

(2.13)

gdzie, aby znaleźć wartości x zmiennej X, po których odbywa się sumowanie, należy dla zadanego y rozwiązać równanie g(x)=y.

Przykład 2.7. Funkcja dyskretnej zmiennej losowej i jej rozkład Zmienna losową X o wartościach {-1,0,1} ma rozkład P(X=-1)=1/3, P(X=0) = 1/3, P(X=1)=1/3. Zdefiniujmy nową zmienną losową Y=X2. Przyjmuje ona tylko dwie wartości:

Y=0 lub Y=1. Stosując wzór (2.13) dostajemy:

P(Y=0) = P(X=0) = 1'3, P(Y=1) = P(X = - 1 lub X=+1) = P(X = -1) + P(X=+1) = 2'3.

Rozkład ciągły. Niech ciągła zmienna losowa X ma rozkład o gęstości F(x). Wtedy dla każdej liczby rzeczywistej y, będącej realizacją (inaczej: wartością) zmiennej losowej Y = g(X) i takiej, że y0 (y*,y*), gdzie liczby y*, y* są odpowiednio dolnym i górnym ograniczeniem funkcji g: y* = infg(x), y* = supg(x), możemy napisać ogólny wzór na dystrybuantę zmiennej Y:

: ( )

( ) P( ) P( ( ) ) ( )

Y

x g x y

F y Y y g X y

f x dx

<

= < = <

′ ′

=

(2.14)

(zob. rys. 2.11). Całka (2.14) daje się w

wielu przypadkach wyrazić w sposób bardziej jawny i łatwiejszy do obliczenia.

Dotyczy to szczególnie przypadków, gdy funkcja ograniczająca g(x)=y jest ściśle F(x)=P(X<x)

(Y<y 2 ) <=> (X<x2 )lub (x 2 '<X<x 2 ") P(Y<y 2 ) = P(X<x2 ) + P(x 2 '<X<x 2 ")

x 2 "

x 2 ' x 2 F(x 2 ')

F(x 2 ")

F(x 2 ) y 1

y 2

y y 3

m=1 m=3 m=1

x

y=g(x)

x =h (1)( y )

x =h (2)( y )

x =h (3) ( y )

(1) (2) (3)

1

Y<y 2 0

Rys. 2.11. Sposób obliczania wartości dystrybuanty FY(y) zmiennej Y=g(X) gdy dana jest dystrybuanta FX(x) i funkcja y=g(x). Liczba m jest liczbą pierwiastków równania g(x)=yi, i=1,2,3.

(11)

monotoniczna w całym przedziale zmienności zmiennej X. Wyniki te można uogólnić na przypadek, gdy omawiana funkcja jest ściśle monotoniczna przedziałami.

Przypadek funkcji ściśle monotonicznej. Jeśli g(x) jest ściśle rosnąca, to całka (2.14) da się łatwo wyrazić poprzez

(znaną) dystrybuantę FX(x) zmien- nej X, gdyż wtedy funkcja h(y) odwrotna do g(x):

h(y) = g-1(y)

jest również ściśle rosnąca i można napisać następujący ciąg równości:

( ) P( ) P( ( ) )

P( ( )) ( ( ))

Y

X

F y Y y g X y

X h y F h y

= < = <

= < = (2.15)

Równanie to zostało zilustrowane na rys. 2.12A.

Gdy g(x) jest ściśle malejąca, to h(y) jest również ściśle malejąca i mamy

( ) P( ) P( ( ) )

P( ( )) 1 ( ( ))

Y

X

F y Y y g X y

X h y F h y

= < = <

= ≥ = − (2.16)

(rys. 2.12B). Jeśli przez fY(y) ozna- czymy funkcję gęstości zmiennej Y, to dla przypadku (2.15)dostaniemy

( ) ( ) ( )

( ) Y X

Y

dF y dF h dh y f y

dy dh dy

= = (2.17)

w całym przedziale (y*,y*) zmien- ności zmiennej Y i fY (y) = 0 poza tym przedziałem (bo FY(y) = 0 dla

y#y* i FY (y) = 1 dla y$y*). Analogicznie: pochodna funkcji FY(y) wyrażonej drugim wzorem, tj. (2.16), wynosi

( ) ( ) ( )

( ) Y X

Y

dF y dF h dh y f y

dy dh dy

= = − (2.18)

(fY (y) = 0 poza przedziałem (y*,y*). Pamiętając, że pochodna funkcji ściśle malejącej jest ujemna (dh(y)/dy<0 w (2.18)), możemy połączyć wzory (2.17) i (2.18). Dosta- niemy wtedy wzór ogólny dla funkcji g(x) ściśle monotonicznej:

*

*

*

*

( ( )) ( )

( , )

( ) ( ) ( )

0 ( , )

X Y

Y

dF h y dh y

dla y y y

f y dF y dh y dy

dy dla y y y

 ∈

= =

 ∉

(2.19)

y=g(x) y=g(x)

F

X

(x)=P(X<x)

F

X

(x)=P(X<x)

P(Y<b)=P(X<a)=F

X

(a)

P(Y<b)=P(X>a)=1-F

X

(a)

Y<b Y=b

Y<b

Y=b b=g(a)

b=g(a)

y y

x a

a

x X<a

X>a

A

B

F

X

(a) F

X

(a)

0

1 1

0

Rys. 2.12. Obliczanie wartości dystrybuanty FY(y) zmien- nej Y=g(X), gdy g(x) jest A. rosnąca B. malejąca. Strzałki objaśniają tworzenie wzorów wypisanych na dole ramek.

(12)

Przykład 2.8. Funkcja ciągłej zmiennej losowej i jej rozkład. Przypadek funkcji ściśle monotonicznej Niech zmienna losową X będzie ciągłą zmienną losową o wartościach z przedziału (-4,+4) i rozkładzie prawdopodobieństwa opisanym dystrybuantą FX(x). Zdefiniujmy nową zmienną losową Y = aX + b, a…0. Również ona, jak zmienna X, przyjmuje wartości z przedziału (-4, +4). Znajdźmy dystrybuantę FY(y) zmiennej losowej Y:

FY(y) = P(Y<y) = P(aX+b<y) = ...

Nierówność w ostatnim nawiasie ma dwa rozwiązania, w zależności od znaku współczynnika kierunkowego a:

aX+b<y <=> X < (y-b)/a, gdy a>0 aX+b<y <=> X ≥ (y-b)/a, gdy a<0 stąd poszukiwany wzór ma postać:

... = P[X<(y-b)/a] = FX[(y-b)/a], gdy a>0 ... = P[X≥ (y-b)/a] = 1 – FX[(y-b)/a], gdy a<0

Przypadek funkcji ściśle monotonicznej przedziałami. Gdy funkcja y=g(x) nie jest ściśle monotoniczna w całym przedziale swojej zmienności, lecz jest ściśle monotoniczna przedziałami, to do obliczenia gęstości zmiennej Y możemy użyć wzoru (2.19), stosując go osobno w każdym przedziale monotoniczności. Liczba m tych przedziałów zależy od postaci funkcji g i aktualnej wartości y. Przykładowo (rys. 2.11, y=y2) mamy dla dystrybuant

2 2 2 2 2

2 2 2

(1) (3) (2)

2 2 2

( ) P( ) P( ) P( )

( ) ( ) ( )

( ( )) ( ( )) ( ( ))

Y

X X X

X X X

F y Y y X x x X x

F x F x F x

F h y F h y F h y

′ ′′

= < = < + ≤ <

′′ ′

= + −

= + −

(2.20)

Dla funkcji gęstości wzór będzie bardziej skomplikowany:

( )

( )

2

2 2 2 2

2 2

( ) ( ) ( )

3 3

2 2 ( ) 2

( ) 2

1 2 2 1 2

( )

( ) ( ) ( ) ( )

( ) ( )

( )

Y

Y X X X

i i i

m m

X i i X

i i

dF y d

f y F x F x F x

dy dy

dF x dx dh y

f h y

dx dy dy

= =

= =

′′ ′

= = + −

=

=

(2.21)

(i=1,m=3??) Wskaźnik sumowania i oznacza tu kolejno punkt nieprimowany, primo- wany (') i bisowany (''), a h(i)(y) oznacza odpowiednią gałąź funkcji h(y) odwrotnej do g(x) (odpowiednio w obszarze i-tym, i=1,2,3, na rys. 2.11). Znak wartości absolutnej pojawia się z powodu wyrazu środkowego (x'2), gdyż znajdujący się tam minus jest

"kompensowany" przez ujemną pochodną funkcji h(y) (porównaj wzór (2.19))

(13)

Przykład 2.9. Funkcja ciągłej zmiennej losowej i jej rozkład. Przypadek funkcji ściśle monotonicznej przedziałami Zmienna losową X jest ciągłą zmienną losową o wartościach z przedziału (-4,+4) i rozkładzie prawdopodobieństwa opisanym dystrybuantą FX(x). Zdefiniujmy nową zmienną losową Y = X2. Przyjmuje ona nieujemne wartości:

Y$0. Znajdźmy jej dystrybuantę FY(y) dla y$0 (oczywiście, FY(y)=0 dla y<0):

FY(y) = P(Y<y) = P(X2<y) = ...

Ponieważ

X2<y <=> - y < X < y stąd wzór końcowy:

... = P(- y < X < y ) = FX( y ) – FX(- y )

Obliczenie funkcji gęstości fY(y) zmiennej Y nie sprawia większej trudności:

fY(y) = dFY(y)'dy = d[FX( y )-FX(- y )]'dy

= fX( y )/(2 y ) + fX(- y )/(2 y ) = [fX( y ) + fX(- y )]/(2 y )

2.2 2.2

2.2 2.2 DWUWYMIAROWA ZMIENNA LOSOWA ( DWUWYMIAROWA ZMIENNA LOSOWA ( DWUWYMIAROWA ZMIENNA LOSOWA ( DWUWYMIAROWA ZMIENNA LOSOWA ( XXXX ,,,, YYYY ))))

W przypadku zmiennej losowej dwuwymiarowej aparat pojęciowy zostaje wzbogacony w porównaniu z przypadkiem jednowymiarowym o pojęcia związane z istnieniem zależności (tzw. zależności stochastycznej) między zmiennymi. Oznacza to badanie takich przypadków, gdy posiadamy pewną informację o jednej ze zmiennych, a chcemy uzyskać informację o drugiej z nich. Zagadnienie to jest związane z rozkładami warunkowymi.

2.2.1 Definicja dwuwymiarowej zmiennej losowej

Dane jest doświadczenie losowe D, jego przestrzeń zdarzeń elementarnych E, bore- lowskie ciało zbiorów Z utworzone z podzbiorów A zbioru E oraz określone jest prawdopodobieństwo P(A). W skrócie: dane jest D i jego przestrzeń probabilistyczna (E,Z,P). Przypiszmy każdemu zdarzeniu elementarnemu e układ dwu liczb (x,y).

Przykład 2.10. Dwuwymiarowa zmienna losowa 1. Doświadczenie D1 jest dwukrotnym rzutem idealną kostką sześcienną. Przestrzeń zdarzeń elementarnych tego doświadczenia E={(e'i,e'j): i,j= 1,2,...,6}. Dwuwymiarową zmienną losowa można zdefiniować np. tak: X(e'i)=i, i=1,2, ...,6, Y(e"j)=j, j=1,2,...,6. Zmienna X dotyczy wyników rzutu pierwszą kostką, zmienna Y – drugą.

2. Doświadczenie D2 jest pomiarem szerokości x0 i długości y0 danego obiektu. (Liczby x0 i y0

są oczywiście nieznane). Ponieważ każdy pomiar jest obarczony niepewnością, wyniki X i Y

-2 -1 1 2

1 2 3 4 y=x2

(14)

pomiaru wielkości x0 i y0 są zmiennymi losowymi, a dokładniej – dwuwymiarową zmienną losową (X,Y) o wartościach zawartych w (dwuwymiarowym) przedziale (0,4)x(0,4).

3. Doświadczenie D3 polega na niezależnym dwukrotnym losowaniu dowolnej liczby rzeczywistej z przedziału (0,1). Wynikiem losowania jest para liczb (x, y) będąca realizacją dwuwymiarowej zmiennej losowej (X,Y) o wartościach zawartych w (dwuwymiarowym) przedziale (0,1)x(0,1).

Definicja dwuwymiarowej zmiennej losowej. Niech będzie dana przestrzeń probabilistyczna (E,Z,P) doświadczenia losowego D. Układ dwu funkcji rzeczywistych i jednoznacznych (X(e), Y(e)) określonych na E, nazywamy dwuwymiarową zmienną losową, jeśli dla dowolnej pary liczb rzeczywistych (x,y) dwuwymiarowemu przedziałowi (-4,-4, x,y) odpowiada pewne zdarzenie losowe (tj.

istnieje zbiór A takich zdarzeń elementarnych e0E, że X(e)<x, Y(e)<y oraz A0Z).

Inne nazwy. Zmienną losową dwuwymiarową nazywamy także łączną (dwuwy- miarową) zmienną losową lub (dwuwymiarowym) wektorem losowym i oznaczamy często symbolem X=(X,Y). Realizacje zmiennej X oznaczane są (jak zwykle) małymi literami: x = (x,y).

Analogicznie jak w przypadku zmiennej losowej jednowymiarowej również teraz określić takie funkcje jak dystrybuanta, funkcja prawdopodobieństwa przewyższenia, itp.

2.2.2 Dystrybuanta F(x,y) i funkcja prawdopodobieństwa przewyższenia p(x,y) zmiennej losowej (X,Y)

Definicja dystrybuanty F(x,y) dwuwymiarowej zmiennej losowej X = (X,Y) dana jest równaniem:

( , ) P( , )

def

F x y = X <x Y <y (2.22) a funkcja prawdopodobieństwa przewyższenia p(x,y):

( , ) P( , )

def

p x y = Xx Yy (2.23) Suma funkcji (2.22) i (2.23) nie jest tożsamościowo jedynką, jak w przypadku jednowymiarowym. Jest to spowodowane tym, że funkcje te nie uwzględniają obszarów (X$x, Y<y) oraz (X<x,Y$y) (zob. rys. 2.13, obszary 1 i 2). Trochę inne są również warunki nakładane na dowolną funkcję F(x,y), aby mogła być dystrybuantą dwuwymiarowej zmiennej losowej (X,Y).

X$ $ $x, Y$ $ $ $y $

X<x, Y<y

x y

x y

1

2

Rys. 2.13. Obszary zmienności zmiennej (X,Y) uwzględniane przez F(x,y) (lewy dolny) i p(x,y) (prawy górny)

(15)

Aby bowiem jakaś funkcja dwu zmiennych, F(x,y), mogła być dystrybuantą wektora loso- wego (X,Y) musi być ona nie tylko

(1) niemalejąca,

(2) lewostronnie ciągła i (3) taka, że

F(-∞,y) = F(x,-∞) = 0 oraz

F(∞,∞) = 1 ale także

(4) musi spełniać następujący warunek (zob. rys. 2.14)

2 2 1 2 2 1 1 1

( , ) ( , ) ( , ) ( , ) 0

F x yF x yF x y +F x y(2.24)

równoważny temu, że

1 2 1 2

P(xX <x y, ≤Y < y )≥0 (2.25) dla każdej czwórki liczb rzeczywistych x1,x2, y1, y2. Potrzeba nałożenia warunku (4) wynika stąd, że istnieją funkcje spełniające warunki (1)-(3), ale nie spełniające warunku (4).

2.2.3 Rodzaje zmiennych losowych

Dwa główne typy dwuwymiarowych zmiennych losowych to – jak w przypadku jednowymiarowym – zmienne dyskretne i ciągłe. Definicje są analogiczne. Możliwe są także przeróżne kombinacje tych przypadków,

czyli zmienne o rozkładach mieszanych, jednak- że nie będą one omawiane.

Dyskretna zmienna losowa. Dwuwy- miarową zmienną losową (X,Y) typu dyskretnego (lub: skokowego) nazywamy taką zmienną, która z prawdopodobieństwem jeden przyjmuje wartości z pewnego co najwyżej przeliczalnego zbioru liczb (xi, yj), i,j są liczbami całkowitymi, a każda wartość z tego zbioru (zbioru realizacji zmiennej (X,Y)) realizowana jest z dodatnim prawdopodobieństwem pij (zob.

rys. 2.15). Prawdopodobieństwo to jako funkcję wartości (xi,yj):

P( , )

ij i j

p = X =x Y =y (2.26)

(i, j – liczby całkowite) nazywamy rozkładem prawdopodobieństwa (dwuwymiarowej dyskretnej) zmiennej (X,Y). Dystrybuanta tej zmiennej wyraża się wzorem:

y2

y1

x2 x1

x (x1#X<x2, y1#Y<y2) y

Rys. 2.14. Obszar realizacji zdarzenia loso- wego (x1#X<x2, y1#Y<y2)

x3

x2 x1 x

pij

y

y1 y2 y3 y4 y5

pij = P(X=xi,Y=yj), i=1,2,3; j=1,2,3,4,5 Rys. 2.15. Przykład dwuwymiarowego rozkładu dyskretnego

(16)

( , ) P( , )

i j

ij x x y y

F x y X x Y y p

< <

= < < =

∑ ∑

(2.27)

gdzie sumowanie odbywa się po wszystkich punktach (xi, yj) spełniających warunek pod znakiem sumy.

Przykład 2.11. Dwuwymiarowa dyskretna zmienna losowa. Funkcja rozkładu i dystrybuanta.

Niech dwuwymiarowa zmienna losowa (X,Y) ma rozkład prawdopodobieństwa pij = P(X=i,Y=j) = (i+j)/36, i,j=1,2,3. Dla znalezienia dystrybuanty F(x,y) należy obliczyć jej wartości (wzór (2.27) we wszystkich punktach

X=i,Y=j; i,j=1,2,3. Punktów tych jest dziewięć:

F(1,1) = P(X<1,Y<1) = 0/36 F (2,1) = P(X<2,Y<1) = 0/36 F (1,2) = P(X<1,Y<2) = 0/36 F (2,2) = P(X<2,Y<2) = p11 = 2/36 F (3,1) = P(X<3,Y<1) = 0/36 F (1,3) = P(X<1,Y<3) = 0/36

F (3,2) = P(X<3,Y<2) = p11 + p21 = 5/36 F (2,3) = P(X<2,Y<3) = p11 + p12 = 5/36

F (3,3) = P(X<3,Y<3) = p11 + p21 + p12 + p22 = 12/36

Aby objąć cały zakres zmienności dystrybuanty (tj. przedział [0,1]) warto obliczyć jej wartości dla zmiennych przewyższających maksymalne przyjmowane wartości o pewną dodatnią liczbę:

F(3+∆x,3) = P(X<3+∆x,Y<3) = p11 + p12 + p21 + p22 + p31 + p32 = 21/36, (∆x>0) F (3,3+∆x) = P(X<3,Y<3+∆x) = p11 + p21 + p12 + p22 + p13 + p23 = 21/36, (∆y>0)

F(3+∆x,3+∆y) = P(X<3+∆x,Y<3+∆y) = p11 + p12 + p21 + p22 + p31 + p32 + p13 + p23 + p33 = 36/36

= 1, (∆x>0, ∆y>0)

Ciągła zmienna losowa. Dwuwy- miarowa zmienna losowa X = (X,Y) nazy- wa się ciągłą, gdy istnieje taka funkcja nieujemna f(x,y), że dla każdej pary liczb rzeczywistych (x,y) zachodzi równość

( , ) P( , ) ( , )

x y

F x y X x Y y f x y dx dy

−∞ −∞

′ ′ ′ ′

= < < =

∫ ∫

(2.28) Funkcja f(x,y) jest gęstością (prawdopodo- bieństwa) łącznej zmiennej losowej (X,Y).

Przykład takiej funkcji pokazany jest na

Rys. 2.16. Przykład funkcji gęstości zmiennej (X,Y) (rozkład normalny o parametrach µXY=0, FX=FY=1, D=0.9)

1 2 3

1 2 3

0 0.05 0.1 0.15 0.2 0.25

(17)

gęstości dwuwymiarowego rozkładu normalnego (szczegółowa informacja na temat tego rozkładu znajduje się w rozdziale 4.3).

Przykład 2.12. Dwuwymiarowa ciągła zmienna losowa. Funkcja rozkładu fXY(x,y) i dystrybuanta FXY(x,y) łącznego rozkładu zmiennej (X,Y)

Niech ciągła dwuwymiarowa zmienna losowa (X,Y) ma rozkład prawdopodo- bieństwa o gęstości danej wzorem (rys. 2.17):

( , ) (0,1) (0,1) ( , )

0 ( , ) (0,1) (0,1)

XY

x y dla x y x f x y

dla x y x

+ ∈

=

 ∉ (2.29) Mamy kolejno:

1. dla x<0 lub y<0:

( , ) 0 0

y x

F x y dx dy

−∞ −∞

=

∫ ∫

⋅ ′ ′= (2.30) 2. dla x0[0,1] i y0[0,1]:

0 0

( , ) ( , ) ( ) ( )

−∞ −∞ 2

′ ′ ′ ′ ′ ′ ′ ′

=

∫ ∫

=

∫ ∫

+ ⋅ = +

y y

x x

F x y f x y dx dy x y dx dy xy x y (2.31)

3. dla x>1 i y0[0,1]:

1

0 0

( , ) ( , ) ( ) (1 )

−∞ −∞ 2

′ ′ ′ ′ ′ ′ ′ ′

=

∫ ∫

=

∫ ∫

+ ⋅ = +

y y

x y

F x y dx f x y dy dx x y dy y (2.32)

4. dla x0[0,1] i y>1:

1

0 0

( , ) ( , ) ( ) ( 1)

−∞ −∞ 2

′ ′ ′ ′ ′ ′ ′ ′

=

∫ ∫

=

∫ ∫

+ ⋅ = +

x y x

F x y dy f x y dx dy x y dx x x (2.33)

Tak więc dystrybuanta F(x,y) przedstawia się łącznym wzorem:

0 0 lub 0

( ) 0 1, 0 1

2

( , ) (1 ) 1, 0 1

2

( 1) 0 1, 1

2

1 1, 1

< <



 + < < < <



= + ≥ < <



+ < < ≥



≥ ≥



dla x y

xy x y dla x y

F x y y y dla x y

x x dla x y

dla x y

(2.34)

0 0.25

0.5 0.75

1 x

0 0.25

0.5 0.75

1

y 0

0.5 1 1.5

2 fHx,yL

0 0.25

0.5 0.75

1 x

Rys. 2.17. Funkcja gęstości prawdopodobieństwa fXY(x,y) = x + y w obszarze (0,1)x(0,1), fXY(x,y) = 0 poza obszarem (0,1)x(0,1)

(18)

2. Zmienna losowa i rozkład prawdopodobieństwa

18

2.2.4 Rozkłady brzegowe (marginalne), fX(x) i fY(y), w rozkładzie dwuwymiarowej zmiennej (X,Y)

W przypadku zmiennych losowych wielowymiarowych istnieje potrzeba wprowadzenia nowych wielkości. Są to m.in. rozkłady brzegowe.

Ciągła zmienna losowa (X,Y). Jeśli (X,Y) jest ciągłą zmienną losową dwuwy- miarową o zadanej funkcji gęstości prawdopodobieństwa (o łącznym rozkładzie) f(x,y), to jednowymiarowa funkcja gęstości fX(x) rozkładu brzegowego zmiennej losowej X w rozkładzie dwuwymiarowej zmiennej (X,Y) będzie miała postać:

( ) ( , )

fX x f x y dy

−∞

=

(2.35)

a dystrybuanta brzegowa FX(x)

( ) ( ) ( , ) ( , )

x x

X X

F x f x dx dx f x y dy F x

−∞ −∞ −∞

′ ′ ′ ′

=

=

∫ ∫

= ∞ (2.36)

gdzie F(x,y) jest dystrybuantą zmiennej (X,Y). Podobnie dla zmiennej Y: jej brzegowa funkcja gęstości, fY(y), wyraża się wzorem:

( ) ( , )

fY y f x y dx

−∞

=

(2.37)

a dystrybuanta brzegowa FY(y):

( ) ( ) ( , ) ( , )

y y

Y Y

F y f y dy dy f x y dx F y

−∞ −∞ −∞

′ ′ ′ ′

=

=

∫ ∫

= ∞ (2.38)

Przykład 2.13. Dwuwymiarowa ciągła zmienna losowa. Funkcja gęstości fX(x) i dystrybuanta FX(x) rozkładu brzegowego zmiennej X Funkcja gęstości fX(x) i dystrybuanta FX(x) rozkładu brzegowego zmiennej X o łącznym rozkładzie (2.29) mają postać:

1

0

0 0

( ) ( , ) ( ) 1 0 1

2

0 1

X

dla x

f x f x y dy x y dy x dla x

dla x

−∞

 ≤



= = + = + < <

 ≥

∫ ∫

(2.39)

( )

0

0 0

( ) ( ) ( 1) 1 0 1

2 2

1 1

x x

X X

dla x

F x f x dx x dy x x dla x

dla x

−∞

 ≤



′ ′

= = + = + < <

 ≥

∫ ∫

(2.40)

(19)

Wzory na funkcję gęstości fY(y) i dystrybuantę FY(y) rozkładu brzegowego zmiennej Y mają postać identyczną (dlaczego?).

Dyskretna zmienna losowa (X,Y). Analogicznie jak w przypadku ciągłym:

jeśli mamy dany rozkład dwuwymiarowy:

P( , )

ij i i

p = X =x Y = y (2.41)

to możemy utworzyć dwa rozkłady brzegowe:

* P( )

def

i i ij

j

p = X =x =

p (2.42)

* P( )

def

j j ij

i

p = Y =y =

p (2.43)

gdzie sumowanie odbywa się po wszystkich wskaźnikach i lub j.

Przykład 2.14. Rozkład brzegowy (marginalny) dyskretnej zmiennej losowej X w rozkładzie dwuwymiarowej zmiennej (X,Y) Niech dwuwymiarowa zmienna losowa (X,Y) ma rozkład prawdopodobieństwa pij = P(X=i,Y=j) = (i+j)/36, i,j=1,2,3. Dla otrzymania rozkładu brzegowego zmiennej losowej X zastosujmy wzór (2.42) :

[ ]

3 3

*

1 1

1 2

P( ) ( 1) ( 2) ( 3)

36 36 12

j j

i i ij

j j

i j i

p X x p i i i

= =

= =

+ +

= = =

=

= + + + + + = (2.44)

A dystrybuanta brzegowa, FX(x), wyraża się wzorem

*

( ) P( ) 2

X i 12

i x i x i x

F x X i p i

< < <

=

= =

=

+ (2.45)

Analogiczny (dlaczego?) wzór dostajemy na dystrybuantę brzegową FY(y).

2.2.5 Rozkłady warunkowe, g(y****x) i h(x****y), w rozkładzie dwuwymiarowej zmiennej (X,Y)

Innymi nowymi wielkościami wprowadzanymi w przypadku zmiennych losowych wielowymiarowych są rozkłady warunkowe.

Znane nam już jest pojęcie prawdopodobieństwa warunkowego i wzoru na nie:

P(A*B) = P(AB)'P(B), P(B)>0. Wzór ten przeniesiemy teraz na zmienne losowe.

Warunkiem będzie w tym przypadku posiadanie pewnej informacji o jednej ze zmiennych. Na ogół oznacza to, że znamy wartość tej zmiennej lub przedział, do którego ona należy.

Zmienna dyskretna. W tym przypadku można zdefiniować następujące rozkłady warunkowe:

(20)

|

*

P( , )

=P( | )

P( )

i j ij

Y X j i

i i

X x Y y p

p Y y X x

X x p

= =

= = = =

= (2.46)

|

*

P( , )

=P( | )

P( )

i j ij

X Y i j

j j

X x Y y p

p X x Y y

Y y p

= =

= = = =

= (2.47)

Przykład 2.15. Rozkład warunkowy dyskretnej zmiennej losowej Y w rozkładzie dwuwymiarowej zmiennej (X,Y) Niech dwuwymiarowa zmienna losowa (X,Y) ma rozkład prawdopodobieństwa pij = P(X=i,Y=j) = (i+j)/36, i,j=1,2,3. Rozkład brzegowy zmiennej X ma postać: pi* = (i+2)/12, i=1,2,3 (patrz przykład 2.14). Rozkład warunkowy pj*i zmiennej losowej Y przy warunku X=xi, ma postać:

|

*

P( | ) P( | )

P( , ) ( ) / 36

P( ) ( 2) /12 3( 2)

Y xi j i

ij i

p Y y X x Y j X i

X i Y j p i j i j

X i p i i

= = = = = =

= = + +

= = = =

= + +

(2.48)

Dystrybuanta warunkowa, FY*x(y* xi), zmiennej losowej Y przy warunku X=xi ma postać:

| |

( | ) 1 ( )

3( 2) 3( 2)

i i

j

Y x i Y x

y y j y j y

i j

F y x p i j

i i

< < <

= = + = +

+ +

∑ ∑ ∑

(2.49)

Analogicznie liczymy rozkład warunkowy |

X yj

p = P(X=x*Y=yj) zmiennej losowej X przy warunku Y=yj i jej dystrybuantę | ( | )

X yj j

F x y . Przydałby się wykres!!**

Zmienna ciągła. Analogicznie: jeśli mamy daną gęstość prawdopodobieństwa f(x,y) zmiennej losowej (X,Y) i rozkład brzegowy

fX(x) zmiennej X, to funkcja gęstości g(y*x) rozkładu warunkowego zmiennej Y pod warunkiem X=x (czyli funkcja gęstości zmiennej Y*x) będzie miała postać:

( , ) ( | )

X( ) f x y g y x

f x

= (2.50)

(por. rys. 2.18). Jej dystrybuantę można wyrazić następująco:

( | ) ( | ) 1 ( , )

( )

y y

X

G y x g y x dy f x y dy

f x

−∞ −∞

′ ′ ′ ′

=

=

(2.51)

Wyprowadzenia powyższych wzorów znajdują się np. w podręczniku Fisza [11].

Zwróćmy uwagę, że ze wzoru (2.50) możemy dostać wzór na dwuwymiarową funkcję

Rys. 2.18. Gęstość warunkowa g(y*a) jest proporcjonalna do gęstości łącznej f(a,y)

(21)

( | ) X( ) ( , )

g y x f x = f x y (2.52)

Jest to odpowiednik wzoru P(B*A)P(A) = P(AB). Analogiczny odpowiednik wzoru na prawdopodobieństwo całkowite ma postać:

( ) ( , ) ( | ) ( )

Y X

f y f x y dx g y x f x dx

−∞ −∞

=

=

(2.53)

Rozkład warunkowy zmiennej X|y i pozostałe wzory otrzymuje się analogicznie.

Przykład 2.16. Rozkład warunkowy. Ciągła zmienna losowa.

Niech ciągła dwuwymiarowa zmienna losowa (X,Y) ma łączny rozkład prawdopo- dobieństwa

( , ) (0,1)x(0,1) ( , )

0 ( , ) (0,1)x(0,1) x y dla x y

f x y

dla x y

+ ∈

=

 ∉ (2.54)

Rozkład brzegowy fX(x) wyraża się wzorem (2.39). Stąd i z (2.50) mamy ( , ) (0,1)x(0,1)

1 ( , )

( | )

( ) 2

0 ( , ) (0,1)x(0,1)

X

x y

dla x y f x y

g y x x

f x

dla x y

 +

 ∈

= = +

 ∉



(2.55)

Jeśli A jest zdarzeniem losowym zależnym od pewnej zmiennej losowej X o funkcji gęstości f(x), to prawdziwe są następujące wzory

P( )A P( | ) ( )A x f x dx

−∞

=

(2.56)

|

P( | ) ( ) ( | )

P( | ) ( )

X A

A x f x f x A

A x f x dx

−∞

=

(2.57)

Wzór (2.56) jest jeszcze jedną postacią wzoru na prawdopodobieństwo całkowite, a wzór (2.57) – wzoru Bayesa.

2.2.6 Rozkład ucięty

Szczególnym przykładem rozkładu warunkowego jest rozkład ucięty.

Nazwa jego pochodzi stąd, że z jakichś powodów zakres zmienności zmiennej X zawężamy (ucinamy) do pewnego podzbioru S tego zakresu. Tak więc jeśli

Rys. 2.19. Rozkład ucięty ciągłej zmiennej losowej

(22)

X jest zmienną losową, a S takim zbiorem borelowskim, że 0<P(X0S)<1, to rozkładem uciętym, określonym dla każdej liczby rzeczywistej x, nazywamy rozkład warunkowy P(X<x*X0S), który można wyrazić następującym wzorem ogólnym (dystrybuantą warunkową):

P( , )

P( | )

P( )

def X x X S

X x X S

X S

< ∈

< ∈ =

(2.58)

Dalsza postać powyższego wzoru zależna jest od tego, czy zmienna losowa X jest dyskretna, czy ciągła. Gdy zmienna X jest ciągłą zmienną losową, to obliczając pochodną dystrybuanty po x mamy

( )

P( )

( | )

0

f x dla x S X S

f x X S

dla x S

 ∈

 ∈

∈ =

 ∉

(2.59)

Przykład 2.17. Rozkład ucięty

Zmienna losowa X ma rozkład f(x):

6 ( 1) (0,1)

( ) 0 (0,1)

x x dla x

f x dla x

− − ∈

=

 ∉

(2.60)

(wykres 1 na rys. 2.20). Niech S = (0,3/4).

Obliczymy P(X0[0,3/4]):

( )

3 / 4

0.75 3 2

0 0

[0, 3 / 4] 6 ( 1) 6 27

3 2 32

x x

P X x x dx  

∈ = − − = −  −  =

 

(2.61)

Wykorzystując ten wynik oraz (2.59) i (2.60) dostajemy gęstość uciętą:

( ) ( )

( )

6 ( 1)

[0, 3 / 4]

| [0, 3 / 4] 27 / 32

P [0, 3 / 4]

0 [0, 3 / 4]

f x x x dla x

f x X

X dla x

− −

 ∈

∈ = =

∈  ∈

(2.62)

(wykres 2 na rys. 2.20).

Rys. 2.20. Funkcja gęstości f(x) (2.60) (1) i funkcja gęstości f(x*X0[0,0.75]) rozkładu uciętego

2.2.7 Niezależność zmiennych losowych X i Y

Pojęcie to wprowadzone zostało już uprzednio dla zdarzeń losowych (p. rozdział 1.2.5). Przeniesione na grunt zmiennych losowych oznacza, że łączny rozkład tych zmiennych jest iloczynem rozkładów brzegowych.

Cytaty

Powiązane dokumenty

Trzech współlokatorów (Bartek, Czarek i Darek) decydują się oddać butelki do skupu.. Zadanie wymaga udziału

Niech F oznacza liczbę losowań, w których wyciągnięto monetę fałszywą, K-liczbę

• Rozkład prawdopodobieństwa (inne nazwy: funkcja rozkładu prawdopodobieństwa, funk- cja prawdopodobieństwa ) – tylko w przypadku zmiennych dyskretnych.. Rozkłady zmien- nej

Zbudujemy model doświadczenia losowego (Ω, F, P ), polegaj¸ acego na losowym wyci¸ agni¸eciu z kieszeni jednej z dwóch monet i wyrzuceniu orła

[r]

dla IV roku matematyki, specjalno´sci zastosowania rach, prob i stat.. Obliczy´c jego ryzyko i ryzyko bayesowskie.. c) Zbada´c dopuszczalno´s´c

Zadania ze statystyki matematycznej (Statystyka B)

Skonstruowa´c estymatory NW warto´sci oczekiwanej i wariancji tego rozk