Zdarzenia losowe i prawdopodobieństwo
Rachunek prawdopodobieństwa zajmuje się badaniem praw rządzącymi zdarzeniami losowymi. Pojęciami pierwotnymi są: zdarzenie elementarne i przestrzeń zdarzeń elementarnych związane z doświadczeniem losowym D polegającym na realizacji określonego zespołu warunków, Poszczególne wyniki doświadczenia losowego traktujemy jako zdarzenia elementarne i zbiór wszystkich zdarzeń elementarnych jako przestrzeń zdarzeń elementarnych .
Przykład I. Rzucamy kostką do gry - doświadczenie losowe D. Zdarzenie elementarne - liczba wyrzuconych oczek. = { 1 , 2 , 3 , 4 , 5 , 6 }
Przykład II. Losujemy element z populacji generalnej Z tak aby każdy element miał jednakowe szansę wylosowania - doświadczenie losowe D. Zdarzenie elementarne - wylosowany element z populacji generalnej. - zbiór wszystkich możliwych elementów populacji generalnej tzn. =Z. Tak będziemy traktować populację generalną za pomocą rachunku prawdopodobieństwa.
Praktycznie interesują nas nie pojedyncze zdarzenia elementarne doświadczenia D lecz podzbiory przestrzeni . W przypadku gdy przestrzeń jest skończona lub przeliczalna to każdy podzbiór przestrzeni nazywamy zdarzeniem losowym. W przypadku gdy przestrzeń
jest nieprzeliczalna to nie każdy podzbiór jest zdarzeniem losowym.
-ciałem zdarzeń losowych przestrzeni nazywamy rodzinę podzbiorów przestrzeni
spełniających warunki (aksjomaty):
1o
2o Jeżeli A to A’ gdzie A’ = - A dopełnieniem (przeciwne) zdarzenia A.
3o Suma przeliczalnej lub skończonej liczby zbiorów z rodziny należy do rodziny , tzn. jeżeli A1 ,………, An ,….. to (A1…. An…… ) .
Każdy zbiór A należący do -ciała zdarzeń losowych (A ) będziemy nazywać zdarzeniem losowym.
W przypadku przestrzeni skończonej lub przeliczalnej =2 = { A ; A podzbiór } Czyli każdy podzbiór przestrzeni jest zdarzeniem losowym należącym do rodziny .
Aksjomatyczna definicja prawdopodobieństwa
Funkcje P : R przyporządkowującą każdemu zdarzeniu losowemu A liczbę P(A) R nazywamy prawdopodobieństwem jeżeli są spełnione warunki (aksjomaty):
P1: P(A)≥0 dla dowolnego zdarzenia losowego A P2: P()=1
P3: Jeżeli A1 ,………, An ,….. jest ciągiem parami rozłącznych zdarzeń losowych to P(A1…. An…… )= P(A1)+….+P( An)+..…
Uwaga Zdarzenia A1 ,………, An ,….. są parami rozłączne jeżeli część wspólna dowolnej pary zdarzeń jest pusta tzn. AiAj= dla i j i zbiór pusty.
Z definicji prawdopodobieństwa wynikają następujące własności prawdopodobieństwa.
1o P( )=0 2o Jeżeli zdarzenie losowe A pociąga zdarzenie B (A B ) to P(A) P(B ).
3o P(A) 1 dla dowolnego zdarzenia losowego A
4o Jeżeli zdarzenie losowe A pociąga zdarzenie B (A B ) to P(B - A) =P(B ) - P(A).
5o Jeżeli A1 ,………, An są parami rozłącznymi zdarzeniami losowymi to P(A1…. An)= P(A1)+….+P( An)
6o P(A)+P( A’) =1 a stąd P(A)=1 - P( A’) i P(A’)=1 - P( A)
7o P(A B) P(A)+P(B)-P(AB) dla dowolnych zdarzeń losowych A ,B .
8o Jeżeli przestrzeń zdarzeń elementarnych jest skończona lub przeliczalna. Wtedy prawdopodobieństwa pi = P({i}) 0 dla i i
P1+….+ pn=1 gdy przestrzeń jest skończona n – elementowa P1+….+ pn+…..=1 gdy przestrzeń jest przeliczalna
9o a) Jeżeli przestrzeń zdarzeń elementarnych jest n – elementowa tzn. n
b) zdarzenia elementarne {i} są jednakowo prawdopodobne tzn.
P({1})= P({2})=…….= P({n})=
n 1
to prawdopodobieństwo zdarzenia losowego A składającego się z k zdarzeń elementarnych tzn. A k wyraża się wzorem
P(A)=
A =
n
k =liczbaliczbazdarzenwszystkichelementarn zdarzenych elementarnsprzyjajacychych przestrzenzdarzeniui A Jest to klasyczna definicja prawdopodobieństwa.
Tak określoną trójkę ( , , P ) nazywamy przestrzenią probabilistyczną.
Prawdopodobieństwo warunkowe.
Niech B i P(B)>0.
Definicja. Prawdopodobieństwem warunkowym pod warunkiem zdarzenia B dowolnego zdarzenia A nazywamy liczbę P(AB) określoną wzorem:
) (
) ) (
( P B
AB B p
A
P
A, B
P(B)0. Stąd0 ) ( ) ( ) ( )
(AB P B P AB P B
P ; P(AB) P(A)P(B A) P(A)0 Definicja. Zdarzenia
A, B
są niezależne P(AB) P(A) ) ( ) ( )
(AB P A P B
P .
Definicja. Zdarzenia
A
1, A
2,..., A
n
są niezależne każdego m i n rosnącego ciągu liczb naturalnych 1i1i2 ...im n) ( )...
( ) ( ) ...
(Ai1Ai2 Aim P Ai1 P Ai2 P Aim
P .
Twierdzenie o prawdopodobieństwie zupełnym.
Jeżeli B jest dowolnym zdarzeniem i A1,A2,...,An są zdarzeniami spełniającymi warunki:
a). Parami rozłączne tzn. AiAj i j
b). Pokrywają zdarzenie B tzn. B A1A2...An i P(Ai)0 i1,2,....,n to P(B) P(A1)P(BA1)P(A2)P(B A2)....P(An)P(BAn)
Twierdzenie Bayesa.
Jeżeli zdarzenia B,A1,A2,...,An spełniają założenia twierdzenia o
prawdopodobieństwie zupełnym i P(B)0 to prawdopodobieństwo warunkowe
) (A B
P k zdarzenia Ak pod warunkiem zdarzenia B wyraża się wzorem
k n
B P
A B P A B P
A
P k k k 1,2,..., )
(
) ( ) ) (
(
Wariancje i kombinacja
Jeżeli A{a1,a2,...,an} jest zbiorem różnych elementów.
Wariancją bez powtórzeń nazywamy każdy k – wyrazowy ciąg k różnych elementów zbioru A. Taki k – wyrazowy ciąg k różnych elementów zbioru A powstaje ciągnąc k razy z zbioru A bez zwracania elementów. Liczba wszystkich k – wyrazowych wariancji bez powtórzeń n – elementowego zbioru A wynosi
n k k
n n
n n
Vnk ( 1)( 2)...( 1) .
Wariancją z powtórzeniami nazywamy każdy k – wyrazowy ciąg k elementów zbioru A.
Taki k – wyrazowy ciąg k elementów zbioru A powstaje ciągnąc k razy z zbioru A z zwracaniem wylosowanych elementów do zbioru A. Liczba wszystkich k – wyrazowych wariancji z powtórzeniami n – elementowego zbioru A wynosi Vnk nk.
Kombinacja bez powtórzeń nazywamy każdy k – wyrazowy ciąg k różnych elementów zbioru A w którym kolejność występowania wyrazów jest nie istotna czyli każdy k elementowy podzbiór zbioru A. Liczba wszystkich k – wyrazowych kombinacji bez
powtórzeń n – elementowego zbioru A wynosi
nk knk n k
knnnn k
C n k n
)!(!
!
! )1)...(2)(1(
.
Kombinacja z powtórzeniami nazywamy każdy k – wyrazowy ciąg k elementów zbioru A w którym kolejność występowania wyrazów jest nie istotna . Liczba wszystkich k – wyrazowych kombinacji z powtórzeniami n – elementowego zbioru A wynosi
! k C n
k k
n .
Zmienne losowe jednowymiarowe
Niech ( , , P ) będzie dowolną przestrzenią probabilistyczną
Definicja. Zmienną losową nazywamy dowolną funkcję X:R określoną na przestrzeni zdarzeń elementarnych o wartościach ze zbioru liczb rzeczywistych R jeżeli dla dowolnej liczby rzeczywistej
x
zbiór zdarzeń elementarnych X()x jest zdarzeniem losowym tzn.{ : X ( ) x }
dla każdego xR.Gdy przestrzeń jest skończona lub przeliczalna to każda funkcja X:R jest zmienną losową.
Zmienne losowe będziemy oznaczać dużymi literami np. X , Y, S, T, Z…… a odpowiadające im wartości odpowiednio małymi literami x , y, s, t, z……
Prawdopodobieństwo przyjęcia przez zmienną losową wartości ze zbioru A podzbioru liczb rzeczywistych R.
Gdy X jest zmienną losową to zdarzeniami losowymi są zbiory zdarzeń elementarnych }
) ( :
{ X A gdy np. A{x0},
A b a ,
,Aa, b),A b ( a ,
,) , ( ba
A ,A(,b), A a,), A a( ,), A N itd.
Również w przypadku gdy
A
gdzie jest najmniejszym -ciałem zdarzeń losowych przestrzeni =R zawierających różnego rodzaju przedziały liczbowe / zbiory Borelowskie / zbiory {:X()A} są zdarzeniami losowymi .Wtedy określone są prawdopodobieństwa P(XA) przyjęcia przez zmienną losową X wartości ze zbioru A, określone w następujący sposób:
}) ) ( : ({
)
(X A P X A
P .
A więc np. gdy Aa, b). Wtedy
}) ) ( :
({
) (
)) ,
(X a b P a X b P a X b
P
Tak określone prawdopodobieństwa określają rozkład prawdopodobieństwa zmiennej losowej X .
Definicja. Dystrybuantą zmiennej losowej X nazywamy funkcję F:RR określoną na zbiorze liczb rzeczywistych R taką , że F(x)P(X x) dla każdego xR.
Dystrybuanty rozkładów prawdopodobieństwa pewnych zmiennych losowych są stablicowane i z tablic możemy znaleźć najważniejsze prawdopodobieństwa zmiennej losowej X . Np.
) ( ) ( )
(a X b F b F a
P ; P(X a)1F(a) .
W badaniu statystycznym populacji generalnej ze względu na jedną cechę zmiennymi losowymi będą funkcje X:ZR przyjmujące wartości – wartość cechy elementu populacji.
Zmienne losowe określone na tym samym zbiorze zdarzeń elementarnych można dodawać(mnożyć) – dodając(mnożąc) ich wartości dla zdarzenia elementarnego.
Zmiennymi losowymi są funkcje stałe tzn. przyjmujące tylko ustaloną określoną wartość - dlatego też zmienne losowe można mnożyć i dzielić przez liczbę i dodawać lub odejmować liczbę do zmiennej.
Zmienne losowe typu skokowego
Zmienna losowa X jest typu skokowego (dyskretnego) jeżeli istnieje skończony zbiór
} ,..., ,
{ 1 2 n
X x x x
W lub przeliczalny WX {x1,x2,...,xn,...} jej wartości taki, że:
n i
p x X
P( i) i 0 1,2,...., i ... 1
1 2
1
n i
i
n p
p p
p w przypadku
skończonym
N i p
x X
P( i) i 0 i ... .... 1
1 2
1
i
i
n p
p p
p w przypadku przeliczalnym
Zmienną losową X typu skokowego i jej rozkład prawdopodobieństwa można zapisać za pomocą tabelki:
. ...
) (
. ...
2 1
2 1
n i
i
n i
p p
p p x X P
x x
x x
X
w przypadku skończonym
...
. ...
) (
...
. ...
2 1
2 1
n i
i
n i
p p
p p x X P
x x
x x
X
w przypadku przeliczalnym
Wtedy:
A x
i
i
p A
X
P( ) i dystrybuanta
x x
i
i
p x
F( ) Wartość oczekiwana m E( X) określa się wzorem
n
i i i n
np x p
x p
x p x X E m
1 2
2 1
1 ...
)
( w przypadku skończonym
1 2
2 1
1 ... ....
) (
i i i n
np x p
x p
x p x X E
m w przypadku przeliczalnym
Wariancja 2 D2(X) określa się wzorem
n
i
i i
n
n m p x m p
x p
m x p m x X D
1
2 2
2 2 2 1 2 1 2
2 ( ) ( ) ( ) ... ( ) ( )
w przypadku
skończonym
1
2 2
2 2 2 1 2 1 2
2 ( ) ( ) ( ) ... ( ) .. ( )
i
i i
n
n m p x m p
x p
m x p m x X
D w przypadku
przeliczalnym Twierdzenie
2 1
2 2 2
2 2 2 1 2 1 2
2 D (X) x p x p ... x p m n x p m
i i i n
n
w przypadku skończonym
2 1
2 2 2
2 2 2 1 2 1 2
2 D (X) (x p x p ... x p ....) m x p m
i i i n
n
w przypadku
przeliczalnym
Odchylenie standardowe D( X) określa się wzorem D(X) 2
Przykład wykorzystania i interpretacja obliczonych parametrów patrz plik „ Wartość oczekiwana w multi lotku” na mojej stronie internetowej.
Przykład
Rzucamy kostką do gry tak długo aż wypadnie szóstka. Wyznaczyć zmienną losową X przyjmującą wartości - liczbę rzutów kostką do momentu wyrzucenia szóstki oraz rozkład prawdopodobieństwa tej zmiennej losowej. Ponadto wyznaczyć wartość oczekiwaną m tej zmiennej losowej i prawdopodobieństwo, że liczba rzutów będzie większa niż 4.
Niech zdarzenie losowe Ai oznacza zdarzenie losowe, że w i – tym rzucie wypadnie szóstka iN. P(Ai)= 16 i P(Bi)= 65 gdzie Bi zdarzenie losowe przeciwne zdarzenia Ai a więc zdarzenie, że w i – tym rzucie wypadnie inna liczba oczek niż 6. Ciąg zdarzeń Z1 , Z2 ,
…… , Zk Z=A lub Z =B dla dowolnego kN jest niezależny. Do momentu wyrzucenia szóstki w k – tym rzucie w poprzednich rzutach zachodzi zdarzenie Bi i=1,2,3,….,k-1 a w k – tym rzucie wystąpi zdarzenie Ak. A więc zdarzenie, że zmienna losowa X przyjmie wartość k, tzn.
{X=k}=B1B2…..Bk-1Ak . Z niezależności ciągu zdarzeń mamy pk=P(X=k)=P(B1B2…..Bk-1Ak)= P(B1)P(B2)…..P(Bk-1)P(Ak)= k
k k k
6 5 6 1 6
5 1
1
1
. Stąd tabelka zmiennej losowej X typu skokowego przeliczalnego ma postać:
....
6 ...5 6
5 6 1 )
(
...
. ...
2 1
1
2 k
k i
i i
p x
X P
k x
X
Uwaga
p q
p k
p q k X P
pk ( ) k1 1,2,3,.... 0 1 1 - rozkład geometryczny z parametrem 0 p1. W naszym przypadku
6 1 ,....;
3 , 2 , 1 6 1 6 ) 5 (
1
p k
k X P
k
. Ponieważ
0
1 1
n
xn
x stąd
1
1
)2
1 (
1 1
1
n
nxn
x
x dla x 1 jako suma
wyrazów postępu geometrycznego dla q x i a1 1 oraz można różniczkować obie strony równości a prawą stronę wszystkie wyrazy szeregu potęgowego w obszarze zbieżności.
A więc
1 6 1 5
1 6 1 6 5 6 1 6
5 6 1 6 1 6 5
0 1
1
1 1
1
k
k
k k
k k
k
pk
Wartość oczekiwana
1 2
2 1
1 ... ....
) (
i i i n
np x p
x p
x p x X E m
6 6 1 5
1 6 1 6
5 6
1 6 ) 5
( 2
1
1 1
1
kk
k k
k
k k
X E m
Prawdopodobieństwo, że liczba rzutów będzie większa niż 4.
P(X>4)=1-P(X4)=1-P({X=1}{X=2}{X=3}{X=4})=1-(P(X=1)+P(X=2)+P(X=3)+P(X=4)) 4823 , 0 5177 , 0 1296 1 1 671 6
5 6 5 6 5 1 6
6 ) 5 6 5 6
5 6 (1 1 ) 4
( 4
3 2
2 3
4 3 3 2
2
X P
Analogicznie P(X>5)=0,4119 ; P(X>6)=0,3349 ; P(X>90)=
13375568
1 ; P(X>91)=
16050678
1
Stąd prawdopodobieństwo zdarzenia losowego, że rzucimy co najmniej 90 razy kostką do gry i nie pojawi się szóstka jest takie same a nico większe co prawdopodobieństwo trafienia szóstki w dużym lotku , które wynosi
13983816
1 .
Niektóre rozkłady skokowe.
Rozkład zero-jedynkowy.
Zmienna losowa X typu skokowego ma rozkład zero-jedynkowy z parametrem p , p(0,1) jeżeli jej funkcja prawdopodobieństwa ma postać:
p p q
q p x
i
i 1
.
. 1 0
p p p X
E
m ( )0(1 )1 2 D2(X)pq Rozkład dwumianowy (Bernoulliego )
Zmienna losowa X typu skokowego ma rozkład dwumianowy z parametrami N
n i p
p , (0,1) , jeżeli jej funkcja prawdopodobieństwa ma postać:
Wartościami zmiennej są liczby k 0,1,2,...,n i n
k q k p k n X P
pk ( ) k n k 0,,12,....,
gdzie q 1 p
Wtedy mE(X)np 2 D2(X)npq
Zmienna losowa X o rozkładzie dwumianowym jest związana z schematem Bernoulliego z n niezależnymi doświadczeniami D1 , D2, …..,Dn w których prawdopodobieństwo
wystąpienia sukcesu A wynosi p . Wartościami zmiennej losowej X jest liczba sukcesów w n doświadczeniach.
Rozkład Poissona
Zmienna losowa X typu skokowego ma rozkład Poissona z parametrami >0 jeżeli jej funkcja prawdopodobieństwa ma postać:
Wartościami zmiennej są liczby k =0,1,2,……,n,…N0 i
0) !
(
k N
e k k X P
pk k
e2,72
E( X)
m 2 D2(X)
Zmienna losowa X rozkładu Poissona zastępuje z dużą dokładnością rozkład
dwumianowy dla dużej liczby doświadczeń n i małym prawdopodobieństwem sukcesu p.
W rozkładzie Poissona =np. .
Zmienne losowe typu ciągłego.
Zmienne losowe X jest typu ciągłego jeżeli istnieje funkcja y f(x) f :RR taka, że:
10 Przyjmuje wartości nieujemne tzn. f(x) 0 xR
20 Pole zawarte między wykresem funkcji y f(x) a osią OX jest równe 1 .
30 Prawdopodobieństwa P(a X b) ab a,bR, jest równe polu zawartemu między wykresem funkcji y f(x) , prostymi x a , xb i osią OX.
Funkcja y f(x) f :RR spełniająca powyższe własności nazywa się funkcją gęstości rozkładu prawdopodobieństwa zmiennej losowej X .
Dla zmiennej losowej typu ciągłego P(X x0)0 dla dowolnej ustalonej wartości x0. Stąd w prawdopodobieństwach
) (
) (
) (
)
(a X b P a X b P a X b P a X b
P .
Dla zmiennej losowej typu skokowego rodzaj nierówności ma znaczenie.
Dla tych co nie znają teorii całek podstawowe parametry nie można zdefiniować i poszczególne parametry będą podawane dla poszczególnych rozkładów którymi będziemy posługiwać się i które są stablicowane.
Dla tych co znają całki poszczególne wzory są następujące:
Własność 20 w definicji funkcji gęstości ma postać
1 ) (x dx f
Własność 30 w definicji funkcji gęstości ma postać
ba
dx x f b X a
P( ) ( )
E X xf x dx
m ( ) ( )
D2(X) (x m)2 f(x)dx
2
Dystrybuanta
P X x x f d x
F( ) ( ) ( ) .
Niektóre rozkłady typu ciągłego
.Rozkład równomierny (jednostajny , prostokątny).
Zmienna losowa X typu ciągłego ma rozkład równomierny skoncentrowany na przedziale < a , b > jeżeli funkcja gęstości tego rozkładu jest określona wzorem:
x h pozostalyc dla
b x a a dla
x b f
0
1 )
(
Wtedy
b x dla
b x a a dla
b a x
a x dla x
F
1
0 ) (
( ) a2b X
E
m
12 ) ) (
(
2 2
2 b a
X
D
Rozkład normalny.
Zmienna losowa X typu ciągłego ma rozkład normalny (gaussowski) jeżeli funkcja gęstości tego rozkładu jest określona wzorem:
2 2
2 ) (
2 ) 1
(
m x
e x
f
dla x gdzie nlim(1 1)n 2,72 e n
Parametrami rozkładu są liczby m,R i 0
Zmienna losowa X typu ciągłego mająca rozkład normalny oznaczać będziemy symbolem )
, (m
N . Zapis X ~N(m,) oznacza, że zmienna losowa X ma rozkład normalny z parametrami m,R i 0.
Wtedy :
wartość oczekiwana mE(X)m ; wariancja 2 D2(X)2 ; odchylenie standardowe
;współczynnik asymetrii (skośności) g3 0 ; współczynnik spłaszczenia (eksces) g4 0 ;
Współczynnik spłaszczenia dla dowolnej zmiennej losowej porównuje skupienie rozkładu wokół jego wartości oczekiwanej
m
z rozkładem skupienia rozkładu N(m,). Jeżeli g4 0 to rozkład jest bardziej skupiony (stromy) niż odpowiedni rozkład normalny. Jeżeli g4 0 to jest przeciwne.Jest to najważniejszy i najczęściej występujący w zastosowaniach i w przyrodzie rozkład typu ciągłego.
Twierdzenie
Jeżeli zmienna losowa X ma rozkład normalny (X ~ N(m,)) to zmienna losowa
m
U X ma rozkład normalny standaryzowany N(0,1) (U ~ N(0,1)).
Twierdzenie to pozwala na sprowadzenie obliczania zagadnień związanych z zmienną losową X ~ N(m,) do obliczania tych zagadnień związanych z zmienną losową
) 1 , 0 (
~ N
U który jest stablicowany. Np. jeżeli X ~ N(m,) to
) ( ) ( ) (
) (
)
(
m a m
b m
U b m P a m b m X m P a b X a
P
Gdzie wartości (bm),(am) są wartościami dystrybuanty rozkładu normalnego standaryzowanego U ~ N(0,1) który jest stablicowany.
Twierdzenie
% 73 , 99 9973 , 0 ) 3 3
( ) 3
(X m P m X m P
% 45 , 95 9545 , 0 ) 2 2
( ) 2
(X m P m X m P
P(X m )P(m X m)0,682768,27%
Oznacza to np. że wszystkich wartości jakie przyjmie zmienna losowa X ~ N(m,) z przedziału
m 3 m , 3
będzie w przybliżeniu 99,73%Ponieważ np.
9973 , 0 00135 , 0 99965 , 0 ) 3 ( ) 3 ( ) 3 3
( ) 3 3
( ) 3 3
( X m P U
P m
X m
P
Inne rozkłady które będziemy wykorzystywać i które są stablicowane:
Rozkład chi-kwadrat