• Nie Znaleziono Wyników

3. W ybrane rozkłady zm iennych losowych oraz podstawowe tw ierdzenia graniczne

3.2. Wybrane rozkłady jednowymiarowych ciągłych zmiennych losow ych

3.2.2. Rozkład normalny

Z m ienn a losowa X m a rozkład norm alny, nazywany też rozkładem M oivre’a- -G aussa13, o param etrach |i i ct (co zapisujemy w skrócie X ~ N (\i\ o)), jeżeli jej funkcja gęstości praw dopodobieństw a ma postać:

W artość oczekiwana oraz w ariancja zmiennej losowej X wynoszą odpowiednio:

C harakterystyczny wygląd krzywej rozkładu norm alnego prezentuje rys. 20:

Jak widać, rozkład norm alny jest rozkładem symetrycznym względem prostej przebiegającej x = |i. Funkcja ta w punkcie osiąga swoje maksim um wynoszące14:

13 Carl Friedrich Gauss (1777-1855), jeden z najwybitniejszych niemieckich matematyków; Abraham de Moivre (1667-1754), matematyk angielski pochodzenia francuskiego. 14 Wartość maksimum można obliczyć, wyznaczając pochodną funkcji (3.30) i przyrównując

ją do zera. f ( x ) = — exp a -J2n (3.30) przy czym: x g R , h e R, natom iast o e f l + E ( X ) = n, (3.31) D 2{X) = a 2. (3.32) u - 2o M

Rys. 20. Przykładowa krzywa gęstości rozkładu normalnego

/ ( -v) = — i _ . (3.33) a

Im dalej na lewo i praw o od w artości (J. - w której funkcja gęstości osiąga maksimum - tym krzywa gęstości bardziej op ad a i zbliża się asym ptotycznie do osi odciętych. Punkty przegięcia krzywej gęstosci rozkładu norm alnego m ają odcięte H ± a. P aram etr |i decyduje o położeniu krzywej na wykresie, n atom iast odchylenie standardowe o decyduje o kształcie tej krzywej (wpływa na w artość m aksym alną funkcji gęstości). Im odchylenie standardow e jest mniejsze, tym krzywa gęstości jest bardziej „wysmukla”, im większe, tym bardziej „spłaszczona”. N a rysunku 21 przedstawiono dwa wykresy rozkładu norm alnego o tym samym odchyleniu sta n ­ dardowym, lecz różniące się w artością oczekiwaną. Z kolei na rysunku 22 w artość oczekiwana jest taka sam a, natom iast rozkłady różnią się w artością odchylenia standardowego.

standardowych i różnych wartościach oczekiwanych Hi <

Źródło: opracowanie własne.

Rys. 22. Dwie krzywe rozkładu normalnego o identycznych wartościach oczekiwanych i różnych odchyleniach standardowych

D ystrybuanta zm iennej losowej X ~ N ( \i, o) w yrażana jest wzorem:

F ( x ) = 75= } exP a v 2n J

Przykładowy wykres dystrybuanty przedstaw iono na rysunku 23.

Rys. 23. Przykładowy wykres dystrybuanty rozkładu normalnego Źródło: opracowanie własne.

Funkcję gęstości rozkładu norm alnego charakteryzują następujące właściwo­ ści15:

P(H — o < X < n + c ) = 0,6826, (3.35)

P(H - 2o < X < (i + 2o) = 0,9545, (3.36) P(H - 3 c < X < n + 3o) = 0,9973. (3.37) Powyższe zależności ilustruje rysunek 24.

W łasność (3.37) określa się m ianem reguły „trzech sigm”. Oznacza ona, że prawie sto pro cen t w artości, jakie przyjm uje zm ienna losowa X , znajduje się w przedziale

(H - 3o, (i + 3o).

i f ^ V

2 1 a ) dx. (3.34)

H - 2 o M + 2o |i + 3 a x

Rys. 24. Własności funkcji gęstości rozkładu normalnego

Źródło: A. Iwasiewicz, Z. Paszek: Statystyka..., op. cit., s. 43.

W praktyce korzysta się najczęściej ze zm iennej standaryzow anej U ~ N {\i = 0; o = l ) , która powstaje w wyniku następującej transpozycji:

X - E { X ) D ( X ) W artości zm iennej losowej U wynoszą:

Modyfikacji ulegnie również funkcja gęstości i dystrybuanta zm iennej stan d a­ ryzowanej U.

Funkcja gęstości praw dopodobieństw a m a postać:

przy czym u e R , n ato m iast dystry b u an ta (nazyw ana często funkcją lub całką Laplace’a 16) zm iennej losowej U przedstaw ia się następująco:

lfl Pierre S. de Laplace’a (1749-1855).

(3.39) a

W artość oczekiwana oraz w ariancja zm iennej U wynoszą odpow iednio: E( U) = 0,

D 2(U) = 1.

(3.40) (3.41)

1 / , 2 ' ® (k)= .— f e x p - — du

4 ln

1 a J (3.43)

W w iększości podręczników do statystyki publikuje się tablice prezentujące w artości funkcji (3.43) w przedziale od u « -3 do u » 3, lub w przedziale od u = 0 do u ~ 3.

W dodatku do tego p odręcznika (zob. tablica I) zam ieszczono tablice dystrybu- anty zm iennej standaryzow anej U w przedziale od u = -3 do u = 3.

Dzięki tablicom nie musimy w ielokrotnie wyznaczać całki zgodnie ze wzorem (3.43). W przypadku, gdy mam y do wyznaczenia w artość dystrybuanty zmiennej losowej U dla dowolnej w artości -uo, i korzystam y z tablic podających wartości dystrybuanty tylko dla przedziału od u = 0 do u » 3, to wówczas m ożna skorzystać z następującej zależności:

Powyższa własność wynika z faktu, że funkcja gęstosci jest funkcją symetryczną względem osi rzędnych. N a rysunku 25 przedstaw iono graficzną prezentację dys­ trybuanty 0(«o).

O bok w łasności (3.44) możemy również sform ułow ać trzy kolejne własności:

O(-wo) = 1 - O(w0). (3.44)

<p(«)

0 14

Rys. 25. Graficzna prezentacja dystrybuanty ®(«n)

Ź r ó d ło: opracowanie własne.

(3.45)

P ( x l < X < x 2) = p \ ± - ^ <

v a a a

= p \ Z i z Ł < u< £łZiL| = (1,[£łZłL|_c,[£iZE| = ®(M2)_®(Ml).

a a J \ a ) \ a )

W łasności (3.46) i (3.47) ilustrują rysunki 26 i 27.

Źródło-, opracowanie własne.

Źródło', opracowanie własne.

P rzy k ład 3.7

W bardzo dużej grupie studentów przeprow adzono egzam in z „Z arządzania jakością” - m ierząc wyniki na ciągłej skali od 0 do 40 punktów. U stalono, że rozkład wyników jest zbliżony do norm alnego ze średnią 29,5 i odchyleniem standardow ym wynoszącym 6,4.

1) Obliczyć prawdopodobieństwo, zdarzenia losowego, że wybrany przypadkowo stu d en t otrzym a! liczbę punktów :

a) m niejszą niż 25, b) z przedziału (25; 35), c) większą niż 35;

2) wiedząc, że 10% studentów otrzym ało oceny bardzo do bre (5,0), proszę ob­ liczyć, ile m inim alnie należało otrzym ać punktów , aby otrzym ać ocenę 5,0? ad 1)

N iech zm ienna losowa X oznacza liczbę punktów uzyskanych przez losowo w ybranego stud en ta, przy c z y m * ~ N(29,5; 6,4).

ad la ) P ( X <25) = P X ~ 29'5 < = p ( u < - 0,70) = 6,4 6,4 J = 0 (-0 ,7 0 ) = 1 - 0 ( 0 ,7 0 ) = 1 - 0,7580 = 0,242. ad lb ) P ( 2 5 < X < 3 5 ) = P [ 25~ 29’5 < ‘y ~ 29’5 < 35~ 29’5 ] = p ( - 0,70 <£/< 0,86) = ' l 6,4 6,4 6,4 ) V J = 0 (0 ,8 6 ) - 0 (-0 ,7 0 ) = 0,8051 - [ 1 - 0 ( 0 ,7 0 ) ] = = 0,8051 - 1 + 0,7580 = 0,5631. ad lc) P { X > 35) = p f A' ~ 29’5 > 35~ 29,5) = P (U >0,86) = { 6,4 6,4 J = 1 - 0 ( 0 ,8 6 ) = 1 -0 ,8 0 5 1 = 0,1949.

U zyskane wyniki oznaczają, że ok. 24% studentów otrzym ało m niej niż 25 punktów , p onad 56% studentów otrzym ało liczbę punktów z przedziału (25; 35) i ok. 19,5% badanych m iało liczbę punktów większą niż 35.

ad 2)

W iedząc, że 10% studentów otrzym ało ocenę bardzo dobrą, m ożemy wniosko­ wać, że oceny 90% badanych są niższe niż 5,0. M ożna zatem zapisać:

P (X < Xd) = 0,9,

g d z i e ś oznacza dolną granicę przedziału punktow ego, którem u przyporządkowano ocenę 5,0.

P ( X < x d)=Q,9=>P =>P ' X -29,5 x d -29,5 Ł/< 6,4 6,4 * „-2 9 ,5 = 0 ,9 : 6,4 = 0,9 => O / -t rf~29,5 x 6,4 = 0,9.

O becnie naszym zadaniem jest znalezienie takiej wartości Mo, dla której dystry- buanta d>(uo) = 0,9. K orzystając z tablicy I, szukamy w śród w artości dystrybuanty najbliższej 0,9 i odczytujemy wartość m jako sumę wartości występujących w nagłówku odpowiedniej kolum ny i odpow iedniego wiersza dającego na przecięciu w artość najbardziej zbliżoną do 0,9. W badanym przypadku jest to wiersz 1,2 i kolum na 0,08, co po zsum owaniu daje w artość 1,28. M ożna więc zapisać:

r - 7 9 5

0(1,28) * 0,9 => ^ = 1,28.

Po rozwiązaniu powyższej równości w z g lę d e m ^ otrzymamy: x d = 1,28 • 6,4 + 29,5 = 37,692 * 37,7.

Powyższy wynik oznacza, że w przybliżeniu od 38 punktów n a 40 możliwych sta ­ wiano studentom ocenę bardzo dobrą, {kp}

W pewnych przypadkach rozkład norm alny m ożna stosować jako dosyć dobre przybliżenie rozkładu dwumianowego. Dzieje się tak w przypadkach, gdy liczność próby (/z) jest duża, a praw dopodobieństw o „sukcesu” bliskie 0,5. J.E. F reu n d 17 podaje, że rozkład norm alny o średniej n = np i odchyleniu standardow ym o = np (1 - p ) , można stosować do aproksymowania rozkładów dwumianowych, naw et gdy n jest „nie­ zbyt duże”, ap różne od 0,5, lecz nie bliskie 0 ani 1. Cytowany autor podaje, że aby m oż­ liwe było użycie rozkładu norm alnego do aproksymacji rozkładu dwum ianowego, to w praktyce wystarczy sprawdzić, czy np oraz n ( l - p ) jest większe niż 5.

P rzy k ład 3.8

Załóżmy, że badamy opisaną w przykładzie 2.1 grupę 30 studentów, ze względu na otrzymaną ocenę z egzaminu z „Zarządzania jakością”. Przeprow adzono doświadcze­ nie polegające na 12-krotnym niezależnym wylosowaniu stu den ta i spraw dzeniu jego oceny z egzam inu. Obliczyć praw dopodobieństw o zdarzenia losowego, że podczas losowania czterokrotnie natrafiono na studenta z oceną dostateczną (3.0) lub stu den ­ ta z oceną dobrą (4.0). „Sukcesem ” w tym doświadczeniu jest wylosowanie stu den ta 17 Zob. np. J. E. Freund: Podstawy nowoczesnej statystyki..., op. cit., s. 185.

z oceną dostateczną lub stu d en ta z oceną dobrą. Ponieważ (zob. przykład 2.1, tab­ lica 2.1) w badanej grupie było 9 studentów z ocenam i dostatecznym i i 6 z ocenam i dobrym i, praw dopodobieństw o sukcesu w pojedynczym losowaniu wyniesie:

p = (9 + e»)/30 = 0,5.

Obliczmy najpierw szukane praw dopodobieństw o, posługując się schem atem B ernoulliego. N iech zm ienna Z ~ B ( n = 12, p = 0,5) oznacza liczbę studentów z oceną 3,0 lub 4,0 w niezależnej próbie n — 12 osób. Poszukiwane praw dopodo­ bieństw o wyniesie:

P( Z = 4 ;n — 12,p = 0,5) = 12 v ^

0,54 - 0,58 = 495 ■ 0,0625 0,00390625 = 0,1208.

Ponieważ np = 6 > 5 oraz n( 1 - p ) = 6 > 5, do przybliżenia wartości szukanego prawdopodobieństwa możemy użyć rozkładu norm alnego o param etrach \i = np = 6 i a = ^ n p { \ - p ) = V12- 0,5 0,5 =J3 «1,732. Ponieważ zm ienna Z jest zm ienną dys­ kretn ą (skokow ą), m ogącą przyjm ować wartości z = 0,1,2, ..., n, musimy zastoso­ wać tu popraw kę na ciągłość, k tóra będzie polegała na zam ianie kolejnych w artoś­ ci z na przedziały od z - 0,5 do z + 0,5. I tak na przykład z = 1 będzie odpowiadał przedział od 0,5 do 1,5, z = 2 to przedział od 1,5 do 2,5 itd.

W miejsce szukanego prawdopodobieństwa zdarzenia losowego P (Z = 4; n = 12, p = 0,5), będziem y mieli obecnie P(3,5 < Z < 4,5; n = 6,0, o = 1,732), przy czym

Z ~ N ( b , 0 ; 1,732).

Postępując analogicznie jak w punkcie lb przykładu 3.7, otrzymamy:

P{3,5 < Z < 4,5) = Pf 3,5 - 6,0 < Z -6 ,0 — < ’ 4 ,5 -6 ,0= P ( - l,4 4 < U < -0,87) =

1,732 1.732 1,732

= <H ( - 0 ,8 7 ) - ® (-1,44) = 1 - 0 ( 0 ,8 7 ) - [ 1 - 0(1,44)] = = 1 - 0,8078 - 0,9251 = 0,1173.

Jak łatwo zauważyć, różnica pom iędzy w artością dokładną - obliczoną na podsta­ wie rozkładu dw um ianow ego - a wartością przybliżoną, wyznaczoną za pom ocą roz­ kładu norm alnego, jest bardzo m ała i wynosi zaledwie 0,0035 (0,1208 - 0,1173).

Wykorzystując rozkład norm alny, możemy również szybko obliczyć np. P( Z > 4), co po uw zględnieniu popraw ki n a ciągłość zapiszem y P ( Z > 3,5). Jeżeli tak jak p o ­ przednio założymy, że Z ~ N (6 ,0 ', 1,732), to wówczas szukane praw dopodobieństw o wyniesie:

P(Z> 3,5) = P Z >P Z > — = P ( U > -1,44) = 1 - P ( U < -1,44) = 1,732 ,

3,5 — 6,0

= 1 - 0 ( - l , 4 4 ) = 1 - [ 1 - 0 ( 1 ,4 4 ) ] = 0 (1 ,4 4 ) = 0,9251.

Zauważmy, że gdybyśmy próbow ali rozwiązać to zagadnienie, stosując wzór Bernoulliego, to szukane praw dopodobieństw o P ( Z > 4) należałoby rozbić n a sum ę prawdopodobieństw:

P( Z > 4) = 1 - P ( Z < 4) = 1 -F ,(4 ) = 1 - [P(Z = 0) + (Z = 1) + (Z = 2) + P ( Z = 3)]. Liczba koniecznych obliczeń byłaby oczywiście niew spółm iernie większa do tych, jakie musimy wykonać, stosując jako przybliżenie rozkład norm alny.