Statystyka i opracowanie danych Probabilistyczne modele danych
Zmienne losowe.
Rozkład prawdopodobieństwa i dystrybuanta.
Wartość oczekiwana i wariancja zmiennej losowej
Dr Anna ADRIAN
Zmienne losowe
Zmienna losowa jest to funkcja rzeczywista X, określona na zbiorze zdarzeń elementarnych Ω
X: Ω→ W
Zmienne losowe zwykle oznacza się dużymi literami z końca alfabetu : X, Y, Z.
Wartości zmiennych losowych zwykle oznacza się
małymi literami z końca alfabetu: x,y,z.
Rodzaje zmiennych losowych
• Ze względu na zbiór wartości badanej cechy (zastosowaną skalę pomiarową) rozróżnia się dwa podstawowe typy
zmiennych losowych:
– jakościowe – zbiory wartości lingwistycznych opisujących np kolor, wielkość, dzień tygodnia...
– ilościowe – zbiory liczbowe, zawierające wartości cech mierzalnych....
Zmienne losowe ilościowe mogą przyjmować wartości:
– dyskretne (skokowe) ze zbioru skończonego (np.
ocena) lub dowolnego podzbioru liczb całkowitych, np liczba sztuk wadliwych,
– ciągłe z przedziału liczb rzeczywistych, np. czas działania urządzenia, temperatura, ciężar...
Definiowanie zmiennej losowej
Z partii wyrobów zawierającej wyroby dobre i wyroby wadliwe losuję jeden wyrób, wtedy Ω = { ω
d, ω
w}
gdzie
ωd
- oznacza wylosowanie wyrobu dobrego
ωw- oznacza wylosowanie wyrobu wadliwego
Określam zmienną losową X w następujący sposób:
X(
ωd)=1 X(
ωw)=0
Definiowanie zmiennej losowej polega na przypisaniu poszczególnym zdarzeniom
elementarnym konkretnych wartości (liczbowych)
Rozkład prawdopodobieństwa dyskretnej zmiennej losowej
Rozkład prawdopodobieństwa dyskretnej zmiennej losowej X jest zbiorem par {xi, p(xi)}, gdzie
• xi jest wartością zmiennej X dla zdarzenia ωi, X(ωi)= xi
;
• p- prawdopodobieństwem wystąpienia wartości x.
Twierdzenie
Założenie: Jeśli x1 , x2 , x3…….. oznaczają wszystkie
różne wartości dyskretnej zmiennej losowej, to Teza
1 )
(
1
∑
∞=
= i
x
ip
Dystrybuanta zmiennej losowej
Dystrybuantą, FX(x0), zmiennej losowej X jest funkcja F określona na zbiorze liczb rzeczywistych, jako prawdopodobieństwo zdarzenia,
polegającego na tym, że zmienna ta przyjmie wartości mniejsze od x0. FX(x0) = P(X< x0)
Dystrybuanta jest funkcją:
• określoną na zbierze liczb rzeczywistych;
• o wartościach z przedziału [0-1];
• niemalejącą
• prawostronnie ciągłą
Dystrybuantę zmiennej losowej X oznaczamy zwykle jako FX
FX(x0) = PX((-∞,x0)) = P(X<x0)
P ([a,b]) = P(a ≤ X< b) = FX(b) - FX(a)
Zastosowanie teorii w praktyce – wyznaczanie rozkładu zmiennej losowej
Z partii wyrobów losujemy 3 sztuki.
Na rysunku pokazano
• przestrzeń możliwych zdarzeń
• sposób określania zmiennej losowej
www 3 dww
wdw 2 ddw
wwd 1 dwd
wdd 0 ddd
Przestrzeń zdarzeń
Zmienna=Liczba sztuk wadliwych
Rozkład i dystrybuanta zmiennej losowej
p
1=P( X=0)=1/8, p
2=P( X=1)=3/8, ...
i 1 2 3 4
x
i0 1 2 3
p
i1/8 3/8 3/8 1/8
F(x) 0 1/8 1/2 7/8
Rozkład prawdopodobieństwa zmiennej losowej X
Dystrybuanta
F
X(0) = P
X((- ∞ ,0)) = P(X<0) = 0
F
X(1) = P
X((- ∞ ,1)) = P(X<1) = P(X=0) =1/8 F
X(2) = P
X((- ∞ ,2)) = P(X<2) = 1/8+3/8 = 4/8
F
X(3) = P
X((- ∞ ,3)) = P(X<3) = 1/8+3/8 +3/8 = 7/8
F
X(4) = P
X((- ∞ ,4)) = P(X<4) = 1
Wykresy rozkładu prawdopodobieństwa i dystrybuanty zmiennej losowej dyskretnej (skokowej)
Wykres dystrybuanty
0 0,2 0,4 0,6 0,8 1 1,2
-2 -1 0 1 2 3 4 5 6
Wartości zmiennej X
Prawdopodobieństwo
Parametry rozkładu zmiennej losowej - Wartość oczekiwana
Wartość oczekiwaną [nadzieję matematyczną / wartość
przeciętną], zmiennej losowej X oznacza się E(X) i określa w następujący sposób
Dla zmiennej losowej dyskretnej
Dla zmiennej losowej ciągłej
∑
==
ni
i i
p x
X E
0
) (
=
+∞∫
∞
−
dx x
xf X
E ( ) ( )
Twierdzenia o wartości oczekiwanej
Założenia : X, Y są zmiennymi losowymi α jest liczbą rzeczywistą, c oznacza stałą wartość Tezy:
1. E (c) = c
2. E ( α X) = α E (X)
3. E (X +Y) = E (X) + E (Y)
Parametry rozkładu zmiennej losowej –
Wariancja D
2(X) i odchylenie standardowe D(X)
• Wariancją zmiennej losowej X nazywamy wyrażenie
• Wariancja jest /parametrem/charakterystyką określającą stopień rozrzutu (rozproszenia, zróżnicowania, dyspersji).
Ze względu na łatwość interpretacji geometrycznej, za miarę
rozrzutu przyjmuje się pierwiastek kwadratowy z wariancji, czyli
• Odchylenie standardowe:
• Stosunek odchylenia standardowego do wartości oczekiwanej nazywamy współczynnikiem zmienności :
V=D(X)/E(X)
) (
)
( X D
2X
D =
{ }
22
( X ) E X E ( X )
D = −
Parametry rozkładu zmiennej losowej – Wariancja D
2(X) – miara rozproszenia
• Wariancja zmiennej losowej skokowej
• Wariancja zmiennej losowej ciągłej
{ }
∑ −
= x
iE X p
iX
D
2( ) ( )
2{ }
+∞
∫
∞
−
−
= x E X f x dx X
D
2( ) ( )
2( )
Twierdzenia o wariancji
Założenia:
X, Y : zmienne losowe, a: liczba;
Tezy:
• D
2(X)=E (X
2) – (E(X))
2• D
2(const)= 0
• D
2(a*X)= a
2*D
2(X)
• D
2(aX +b)= a
2*D
2(X)
• D
2(X +Y) = D
2(X) + D
2(Y)
Funkcje zmiennej losowej
X jest zmienną losową i Y = g(X) to Y jest zmienną losową, Rozkład zmiennej Y wyznaczymy znając rozkład zmiennej X
Przykład dla zmiennej dyskretnej
Y=2X+1 (1)
Zmienna X ma rozkład dwupunktowy P(X=0)=0,25 i P(X=1)=0,75
Wyznaczmy rozkład zmiennej Y Z (1) obliczymy Y
gdy X=0 to Y=1 oraz gdy X=1 to Y=3 Zatem:
P(X=0)= P(Y=1) = 0,25 P(X=1)= P(Y=3) = 0,75
Funkcje zmiennej losowej - Momenty
W szczególnym przypadku, gdy
g(x) = X k, gdzie k∈Ν. liczbę
mk = E(Xk)
nazywamy momentem rzędu k zmiennej losowej X.
Mówimy, że jest to moment zwykły.
Wartość oczekiwana jest momentem zwykłym rzędu pierwszego m1=E(X)
Moment rzędu k względem punktu d
µ
k= E((X - d)
k)
gdzie:
k - nazywamy rzędem momentu, d - punktem odniesienia
,
Jeżeli
d=0 mamy momenty bezwzględne d=E(X) mamy momenty centralne
Przypadki szczególne :
jeżeli d= 0; k=1 Wartość oczekiwana:
jeżeli d= E (X); k=2 Wariancja:
Dla rozkładów symetrycznych momenty centralne rzędu nieparzystego są równe zero.
Przykład jak prosto obliczyć wartość oczekiwaną i wariancję
3 1,125
1,5 0,375
0 xi2*pi
1,5 0,375
0,75 0,375
0 xi*pi
0,125 0,375
0,375 0,125
pi
ΣΣΣΣ 3
2 1
0 xi
E(X) = 1,5
D
2(X)=E (X
2) – (E(X))
2=3 – (1,5)
2= 0,75
Wybrane rozkłady zmiennej skokowej rozkład binarny – dwupunktowy
Jeżeli w przedstawionym przykładzie, dotyczącym kontroli jakości wyrobów, 90% wyrobów było dobrych, natomiast 10% stanowiły wybraki, to możemy mówić o prawdopodobieństwie zdarzeń:
P({ω : X(ω)=0}) = 0,1 P({ω : X(ω)=1}) = 0,9
(jest to tzw. „dwupunktowy” rozkład prawdopodobieństwa)
Rozkład prawdopodobieństwa zmiennej losowej X jest zbiorem par {x, p}, gdzie
x jest wartością zmiennej X,
p- prawdopodobieństwem wystąpienia wartości x.
xi 0 1
pi 0,1 0,9
Tablicowy zap is rozkładu
p rawdop odobieństwa zmiennej losowej X
Wybrane rozkłady zmiennej skokowej Schemat Bernouliego
• Mam rozkład dwupunktowy.
• Zmienna losowa może przyjąć tylko jedną z dwóch wartości {x1, x2 }, jeśli przyjmie wartość x1 mówimy o sukcesie, jeśli x2 nazwiemy to porażką, p jest prawdopodobieństwem sukcesu
P(X=x
1)= p gdzie 0<p<1 P(X=x
2)= 1- p
Schemat Bernoulliego:
w niezmienionych warunkach wykonujemy n razy to samo doświadczenie, w wyniku każdego doświadczenia może wystąpić jedno z dwóch zdarzeń A lub  (nie A) Zakładamy, że dla każdego z n doświadczeń
P(A)=p, P(Â)=1 – p = q oraz 0<p<1
Rozkład Bernoulliego - dwumianowy
• Prawdopodobieństwo odniesienia k sukcesów w n doświadczeniach,
Pn(X=k)= P({ω: X(ω)=k})=Σ P({ωi1,..., ωin)})
• gdy
p-oznacza prawdopodobieństwo sukcesu w pojedynczym
doświadczeniu, wtedy Pn(X=k) obliczamy z wzoru Bernouliego
k n
k
n
p q
k k n
X
P
−
=
= ) (
Wartość oczekiwana w rozkładzie Bernouliego E (X)= n*p
Wariancja w rozkładzie Bernouliego D2(X) = n*p*q
Zadanie
Student na egzaminie losuje 4 pytania, aby zdać egzamin należy odpowiedzieć poprawnie na co najmniej dwa pytania.
Proszę:
1. Zdefiniować zmienną losową
2. Określić rozkład prawdopodobieństwa tej zmiennej w trzech różnych przypadkach, tzn gdy, wiadomo, że student opanował
a. 25% materiału, b. 50%
c. 75% materiału
3. Wykonać wykresy tych rozkładów i dystrybuanty dla a, b, c
4. Wskazać najbardziej prawdopodobną liczbę poprawnych odpowiedzi, w każdym z podanych przypadków a, b, c.
5. Obliczyć oczekiwaną liczbę odpowiedzi poprawnych
Zastosowania rozkładu Bernoulliego
Robotnik obsługuje cztery jednakowe automaty funkcjonujące niezależnie od siebie.
Prawdopodobieństwo, że w ciągu godziny automat będzie wymagał interwencji wynosi 0,9.
Obliczyć prawdopodobieństwo tego, że w ciągu godziny:
• Żaden automat nie będzie wymagał interwencji
• Co najmniej jeden będzie wymagał interwencji
• Znaleźć najbardziej prawdopodobną liczbę automatów wymagających interwencji
( w ciągu godziny)
Rozkład Poissona
i jego związek z rozkładem Bernouliego
Jeśli zmienna losowa Xn ma rozkład Bernoulliego
i prawdopodobieństwo sukcesu p=p(n) maleje do zera w ten sposób, że poczynając od pewnego n0
dla każdego n > n0 spełniony jest związek n*p=
λ ,
( gdzie λ>0 jest wielkością stałą) to) ! (
lim )
( k
k e X
P k
p
k n n
λ
λ
−
∞
→
= =
=
gdzie k=0,1,2,... oraz λ = n*p
Wartość oczekiwana w rozkładzie Poissona E (X)= n*p = λ
Wariancja w rozkładzie Poissona D2(X) = n*p*q = λ
Przykład zastosowania rozkładu Poissona
W skład złożonej aparatury wchodzi między innymi n=1000 elementów określonego rodzaju.
Prawdopodobieństwo uszkodzenia wciągu roku każdego z tych n elementów p=0,001 i nie zależy od stanu
pozostałych elementów.
Obliczyć prawdopodobieństwo uszkodzenia w ciągu roku:
a. dokładnie dwóch elementów b. co najmniej dwóch elementów
c. oczekiwaną liczbę uszkodzonych elementów d. wariancję dla liczby elementów uszkodzonych
w ciągu roku
Rozwiązanie
λλλλ = n*p = 1000 * 0,001=1
a) P(X=2) = 0,5* e
-1=0,184
b) P(X ≥ 2) = 1- P(X<2) = 1- [P(X=0) +P(X=1)]
= 1-(e
-1+ e
-1)=0,264
c) E(X) = n*p = λλλλ = 1
d) D
2(X) = λλλλ = 1
Zadanie – praca indywidualna
W zawodach strzeleckich bierze udział 120 zawodników.
Każdy oddaje 7 strzałów do wyznaczonego celu
Niech zmienna losowa X oznacza liczbę trafionych strzałów, wyznaczyć
– Rozkład zmiennej X
– Wykonać wykres tego rozkładu
– Wskazać najbardziej prawdopodobną liczbę trafionych – Obliczyć oczekiwaną liczbę strzałów trafionych
– Jakie jest prawdopodobieństwo przejścia do następnego etapu jeśli warunkiem jest uzyskanie co najmniej 5
trafionych
Rozkład zmiennej losowej ciągłej
Uwagi o zmiennej losowej ciągłej:
– Liczba wszystkich możliwych i wzajemnie wykluczających się zdarzeń elementarnych jest nieskończona
– Dystrybuanta dla dowolnej zmiennej losowej F(x) = P (X<x),
– Zmienna losowa o dystrybuancie F jest typu ciągłego, jeśli istnieje funkcja f≥0, spełniająca równość
Funkcję f nazywa się gęstością prawdopodobieństwa zmiennej losowej ciągłej
∫
∞−
=
x
dx x
f x
F ( ) ( ) (1)
Związek dystrybuanty i gęstości zmiennej losowej ciągłej
Dla dowolnej funkcji f, będącej gęstością prawdopodobieństwa zachodzi zależność
Dla zmiennej losowej ciągłej zachodzi równość
P(a
≤X
≤b) = F(b) – F (a)
Stąd wynika, że:
ponieważ P (X = a) = P (a ≤ X ≤ a) = F (a) - F (a) = 0
P (X= a)= 0
1 )
( )
( ∞ = ∫
∞=
∞
−
dx x
f
F
Funkcja gęstości prawdopodobieństwa
Funkcja gęstości prawdopodobieństwa odgrywa najważniejszą rolę w definiowaniu rozkładów prawdopodobieństwa zmiennych losowych typu ciągłego
.
Definicja
Funkcją gęstości prawdopodobieństwa zmiennej losowej typu ciągłego nazywamy funkcję f (x), określoną na zbiorze liczb rzeczywistych, taką że:
f(x)≥0 ( przyjmuje wartości nieujemne) oraz
dla dowolnych a < b zachodzi
• oraz
∫
b = < <a
b X
a P dx
x
f ( ) ( )
1 )
( )
( ∞ = ∫
∞=
∞
−
dx x
f
F
Interpretacja graficzna związku funkcji gęstości z prawdopodobieństwem
a b
∫
b= < <
a
b X
a P dx
x
f ( ) ( )
f(x)
Własności funkcji gęstości prawdopodobieństwa
• Funkcja gęstości jest nieujemna; f ≥ 0.
• W punktach, w których f jest ciągła zachodzi równość:
f(x) = F’(x); funkcja gęstości jest pochodną dystrybuanty.
• Każda funkcja f, będąca gęstością prawdopodobieństwa, wyznacza jednoznacznie pewną dystrybuantę, a tym samym rozkład
prawdopodobieństwa pewnej zmiennej.
• Z faktu, że prawdopodobieństwo zdarzenia jest równe zeru, nie wynika , że zdarzenie to jest niemożliwe, bo
∫
∆∫
+
→
∆
→
∆
≤ < + ∆ = = =
=
=
x x
x
x
x x
x
P x X x x f x dx f x dx
x X
P
0
0
0
0
0 )
( )
( lim
) (
lim )
(
0 0Przykład – czy dana funkcja może być funkcją gęstości
Sprawdzić czy dana funkcja f ,
1. jest gęstością prawdopodobieństwa 2. znaleźć dystrybuantę F(x)
3. obliczyć P (X< 0,5) P (1<X<2)
4. przedstawić graficzną interpretację wyników obliczeń
≥
=
−<
0 0 ) 0
( e dla x
x x dla
f
xRozwiązanie
Czy f jest gęstością prawdopodobieństwa:
1. Funkcja f jest nieujemna 2.
Dystrybuanta
0 1 0
) (
0
0
∞ =
−
= +
=
−∞
∞
− −∞
∞ −
∫ f x dx ∫ dx ∫ e
xdx e
x
>
−
=
−≤
0 1
0 ) 0
( e dla x
x x dla
F
xP(X<0,5) = F(0,5) = 1- e
-0,5P(1<X<2) = F(2) – F(1) = (1- e
-2) – ( 1- e
-1)= e
-1+ e
-2Zadanie do domu
• Wyznaczyć stałą A taką , aby funkcja f była gęstością prawdopodobieństwa zmiennej losowej X.
• Obliczyć P(X>1)
• Zinterpretować otrzymane wyniki na wykresie gęstości i dystrybuanty
≥
=
−<
0 0 ) 0
(
3x dla
Ae
x x dla
f
xFunkcje zmienne losowej
• Niech zmienna losowa Y będzie funkcją pewnej zmiennej X, tzn Y( ω)= g(X(ω))
• Znając rozkład zmiennej X możemy wyznaczyć rozkład zmiennej Y
• Zadanie :
Znaleźć rozkład zmiennej losowej Y (dystrybuantę i gęstość), gdy :
Y= aX+b, gdzie a≠0
X jest zmienną losową typu ciągłego z gęstością fX i dystrybuantą FX
Rozważmy dwa przypadki : a>0 i a<0
Funkcje zmienne losowej
dla a>0
FY(y)= P(Y<y) = P(aX+b <y) = P(X<(y-b)/a)= FX((y-b)/a)
zauważmy, że funkcja FX jest różniczkowalna w punktach ciągłości fX więc
dla < 0
FY(y)= P(Y<y) = P(aX+b <y) = P(X >(y-b)/a) = 1- FX((y-b)/a)
zauważmy, że funkcja FX jest różniczkowalna w punktach ciągłości fX więc
gęstość f Y (y) możemy napisać przy użyciu jednego
) 1 (
) ( )
( )
( )
( ( )/
a b f y
dx a x dy f
d a
b F y
dy y d
dy F y d
fY = Y = X − =
∫
−∞y−b a X = X −) 1 (
) ( )]
( 1
[ )
( )
( ( )/ a
b f y
dx a x dy f
d a
b F y
dy y d
dy F y d
f X
a b
y X
X Y
Y
−
= −
− =
−
=
=
∫
∞−) 1 (
)
( a
b f y
y a
f
Y=
X−
Wartość przeciętna i wariancja zmiennej losowej ciągłej
• Obliczyć wartość oczekiwaną i wariancję
zmiennej losowej ciągłej, o gęstości prawdopodobieństwa
wartość oczekiwana/nadzieja matematyczna
[ ] [ ] 1
) ( )
(
100
_
=
0= − + = − − =
=
∞ − − ∞ − −∞
∞ −
∫
∫ xf x dx ∫ xe
xdx xe
xe
xdx xe
xe
xX E
≥
=
−<
0 0 ) 0
( e dla x
x x dla
f
x[ ] 2 2
) (
) ( )
(
0 02 0
2
_ 0
2 2
2
= ∫
∞∞x f x dx = ∫
∞x e
−dx = − ∫
∞x d e
−= − x e
− ∞+ ∫
∞x e
−dx =
X
E
x x x xwariancja/dyspersja: D2(X) = E[X-E(X)]2 = E(X2)-(E(X))2
D
2(X)= 2- 1
2=1
Mediana,
Medianę zmiennej losowej X oznaczaną x1/2 lub me definiują następujące wzory
P( {ω: X(ω)≤ me })≥1/2 i P( {ω: X(ω) ≥ me }) ≥1/2
Dla zmiennej losowej ciągłej medianę wyznacza się ze wzoru
Przykład czyli 1- exp(- me)=1/2
stąd me = ln2
2 1
0
=
∫
mee
−xdx
2 ) 1
_
( =
∫
m∞ef x dx
Kwantyle
• Mediana jest szczególnym przypadkiem ogólniejszego parametru, zwanego Kwantylem.
• Definicja
Kwantylem rzędu p (0<p<1) zmiennej losowej X, o dystrybuancie F, nazywamy liczbę xp, taką że
F(xp) ≤ p ≤ F(xp+)
• Dla zmiennej losowej ciągłej Kwantyl xp jest wyznaczany z wzoru F(xp) = p
• Mediana jest kwantylem rzędu 1/2
Rozkład jednostajny
• Rozkład jednostajny (zwany też równomiernym lub prostokątnym albo płaskim) to ciągły rozkład prawdopodobieństwa, dla którego gęstość
prawdopodobieństwa w przedziale od a do b jest stała i różna od zera, a poza nim równa zeru.
• Ponieważ rozkład jest ciągły, nie ma większego znaczenia czy punkty a i b włączy się do
przedziału czy nie. Rozkład jest określony parą
parametrów a i b, takich że b>a.
Rozkład jednostajny
Funkcja gęstości prawdopodobieństwa
Dystrybuanta
Wartość oczekiwana Wariancja
b x a b x
a b
a x x
f ≤ ≤
>
−
<
= ;
; 0
1
; 0 )
(
) 2
( a b
X
E = + ( )
) 12 (
2
2
b a
X
D = −
Zastosowanie rozkładu jednostajnego
• Rozkład jednostajny: ma zastosowanie przy analizie niepewności systematycznych.
Gęstość prawdopodobieństwa f(x) jest stała
wewnątrz przedziału (a, b) i równa zero poza nim.
• Dla pomiarów obarczonych niepewnością
systematyczną ∆ x, mamy b – a = 2 ∆ x, zatem
12 3 ) ) (
(
2
2
b a x
X D
S
x= = − = ∆
Zadanie
Punkt materialny porusza się ruchem jednostajnym po okręgu koła o promieniu r. Niech O będzie ustalonym punktem
okręgu, natomiast X długością łuku łączącego punkty OM.
• Określić rozkład zmiennej losowej X
• Narysować wykres funkcji gęstości i dystrybuanty zmiennej X
• Obliczyć P (X<πr) oraz P(X> 3πr/2)
• Obliczyć wartość oczekiwaną i wariancję
O
M
X
Rozwiązanie zadania – postać funkcji gęstości
; 2
; 0
2 0
2 ; 1
0
; 0
)
(
>
≤
≤
<
=
r x
r r x
x x
f
π π π
Zadanie należy dokończyć samodzielnie
Zadanie – praca samodzielna
Pociągi przyjeżdżają na stację dokładnie co 10 minut.
Pasażer przychodzi na stację w pewnej przypadkowej chwili. Niech X oznacza czas oczekiwania na przybycie pociągu.
Należy:
• Określić funkcję gęstości prawdopodobieństwa f, wykonać wykres
• Określić dystrybuantę F, wykonać wykres
• Obliczyć P(X<8) i przedstawić interpretację graficzną
• Obliczyć oczekiwany/średni czas czekania na przyjazd pociągu
Rozkład wykładniczy
Znajduje zastosowanie do obliczania prawdopodobieństwa przejścia obiektu ze stanu X w stan Y w czasie δ t, przy
stałym, w jednostce czasu, prawdopodobieństwie zmiany stanu obiektu z X na Y.
Funkcja gęstości
f(x) = λ e
- λ xDystrybuanta:
F(x) = 1- e
- λ xWartość oczekiwana
E(x) = λ
-1Wariancja
D (X) = λ
-2( )
− −
=
22
2
2 ) 1
( σ
µ
π σ
x
e x
f
Rozkład nazywany też rozkładem Gaussa - Laplace'a jest najczęściej spotykanym rozkładem zmiennej losowej ciągłej Funkcja gęstości w rozkładzie normalnym o postaci:
jest określona dla wszystkich rzeczywistych wartości zmiennej X.
Rozkład normalny N ( µ , σ )
Funkcja gęstości w rozkładzie normalnym
Parametry rozkładu N
(µ,σ),µ - Wartość oczekiwana σ
2- Wariancja
µ
σ
f(x)
Rozkład normalny – wykres funkcji gęstości i interpretacja
x
Rozkład normalny
interpretacja prawdopodobieństwa P(X<z)=p
Funkcja gęstości w rozkładzie normalnym:
• jest symetryczna względem prostej x = µ
• w punkcie x = µ osiąga wartość maksymalną
• ramiona funkcji mają punkty przegięcia dla x = µ - σ oraz x = µ + σ
Kształt funkcji gęstości zależy od wartości parametrów: µ , σ : - parametr µ decyduje o przesunięciu krzywej,
- parametr σ decyduje o „smukłości” krzywej.
Cechy charakterystyczne funkcji gęstości
rozkładu normalnego
0 0,5
-4 -3 -2 -1 0 1 2 3 4
N(0,1) N(3,1) N(0,2) N(3,2)
Przykłady funkcji gęstości rozkładów N ( µ , σ) dla różnych wartości µ i σ
Wykresy funkcji gęstości rozkładów N ( µ , σ)
Wykresy dystrybuanty rozkładu normalnego
N
(µ,σ),dla różnych wartości µ i σ
-0,2 0 0,2 0,4 0,6 0,8 1 1,2
-4 -3 -2 -1 0 1 2 3 4
N (0,1) N (3,1) N (0,2) N (3,2)
Wykresy dystrybuanty rozkładów N ( µ , σ)
Jeżeli zmienna losowa ma rozkład normalny N(µ,σ) to:
- 68,3 % populacji mieści się w przedziale ( µµµµ - σ; µµµµ + σ)
- 95,5 % populacji mieści się w przedziale ( µµµµ - 2σ; µµµµ + 2σ)
- 99,7 % populacji mieści się w przedziale ( µµµµ - 3σ; µµµµ + 3σ)
Rozkład normalny
Reguła 3 sigma
Dla uproszczenia obliczeń prawdopodobieństwa P(a<X≤ b) dla zmiennej losowej o rozkładzie normalnym, z wartością oczekiwaną µ i odchyleniem standardowym σ, dokonuje się standaryzacji zmiennej losowej.
Prawdopodobieństwo w rozkładzie normalnym ( podobnie jak w każdym innym rozkładzie ciągłym) wyznaczane jest dla wartości zmiennej losowej z określonego przedziału, P(a<X
≤
b)Prawdopodobieństwo w rozkładzie normalnym
P(a<X ≤ b) = F(b)- F(a),
Rozkład normalny - standaryzacja
Standaryzacja polega na sprowadzeniu dowolnego rozkładu normalnego N(µ, σ), o danych parametrach µ i σ do rozkładu
standaryzowanego (modelowego) o wartości oczekiwanej µ = 0 i odchyleniu standardowym σ = 1.
Zmienną X zastępuje się zmienną standardową U, która ma rozkład N(0,1)
Wtedy otrzymujemy następujące zależności: f(x)→ϕ(u), F(x) →Φ(u), czyli:
) (
) ( )
( σ
µ Φ −
=
=
≤ x
x F x
X P
σ
µ
= x −
u
Własności dystrybuanty
standaryzowanego rozkładu normalnego N(0,1)
) ( )
(
) (
1 )
( 1
) (
) ( 1
) (
) (
) ( )
( )
( )
(
u u
U P
u u
U P
u U
P
u u
u U
P
u u
U P
x X
P x
F
Φ
=
−
>
Φ
−
=
≤
−
=
>
Φ
−
=
− Φ
=
−
≤
Φ
=
≤
=
≤
=
gdzie Φ(u) oznacza wartości dystrybuanty standaryzowanego rozkładu normalnego N(0,1) Wartości te znajdziemy w tablicach statystycznych
−
Φ
−
−
Φ
=
−
=
≤
<
−
Φ
−
−
Φ
=
− < ≤ −
=
=
− < − ≤ −
=
≤
<
σ µ σ
µ
σ µ σ
µ σ
µ σ
µ
σ µ σ
µ σ
µ
a a b
F b
F b
X a
P
a b
U b P a
b X
P a b
X a
P
) ( )
( )
(
) (