• Nie Znaleziono Wyników

Wybrane rozkłady jednowymiarowych zmiennych losowych dyskretnych

3. W ybrane rozkłady zm iennych losowych oraz podstawowe tw ierdzenia graniczne

3.1. Wybrane rozkłady jednowymiarowych zmiennych losowych dyskretnych

Opiszemy obecnie kilka najważniejs2ych rozkładów zmiennej losowej dyskretnej. Będą to w kolejności ich omawiania: rozkład dwupunktowy, rozkład zero-jedynkowy, rozkład dwumianowy nazywany od nazwiska jego twórcy rozkładem Bem oulliego. W następnej kolejności opiszemy rozkład Poissona, rozkład hipergeometryczny i na koniec rozkład Pascala oraz rozkład geometryczny. Każdy typ rozkładu p o­ staramy się zobrazować krótkim przykładem liczbowym. Podamy również wzory, dzięki którym można szybko wyznaczyć podstawowe parametry badanych zmiennych losowych, takie jak: wartość oczekiwana, wariancja i odchylenie standardowe.

3.1.1. Rozkład dwupunktowy i rozkład zero-jedynkowy

Zmienna losowa X ma rozkład dw upunktow y, jeżeli m oże ona przyjąć tylko dwie wartości x\ i odpowiednio z prawdopodobieństwami1:

Jeżeli .ti = 1, natomiast X2 = 0, to wówczas mamy do czynienia ze szczególnym przypadkiem rozkładu dwupunktowego, który nazywany jest rozkładem zero-je- dynkowym. Funkcja prawdopodobieństwa ma wówczas następującą postać:

P( X — xi) = p, P ( X = x 2) — q, przy czymp + q = 1. (3.1)

P( X — l ) = p , P ( X = 0) = l - p = q. (3.2) W artość oczekiwana takiej zm iennej losowej wynosi:

E ( X ) = p ,

(3-3)

natom iast w ariancja:

D \ X ) = p q . (3.4)

Z m ien n a losowa o rozkładzie (3.2) jest związana z doświadczeniem losowym, którego wyniki m ogą być dwojakiego rodzaju: posiadające interesującą nas cechę (wówczas zm iennej X nadajem y w artość 1) i nie m ające tej cechy (przyjmujemy, że X - 0). P rzypadek pierwszy zwykło nazywać się „sukcesem ”, natom iast drugi „p o rażką” lub „niepow odzeniem ”2.

Przykład 3.1

D ośw iadczenie polega na losowym wyborze jednej osoby z grupy 30 studentów i zbadaniu oceny, jak ą otrzym ała ona z egzam inu z „Z arządzania jakością”. Z ałóż­ my, że badanie dotyczy grupy studentów opisanej w przykładzie 2.1, a rozkład ocen przedstaw ia tablica 2.1. Załóżm y, że „sukcesem ” nazwiemy takie zdarzenie losowe, podczas którego wylosowana osoba otrzym ała o cenę bardzo d ob rą (5,0), natom iast „p o rażką” pozostałe przypadki. Ponieważ w przykładzie 2.1 sy m b o le m * o z n a c z o ­ no zm ienną losową będącą oceną losowo wybranego studenta, w celu uniknięcia konfliktu oznaczeń przyjmijmy obecnie, że zm ienną o rozkładzie zero-jedynkowym oznaczymy sym bolem Y. Z m ienna Y przyjmie w artość 1, jeżeli X — 5,0, natom iast Y = 0, jeżeli X * 5,0. D okładniej:

Korzystając z tablicy 2.1, możemy wyznaczyć częstość rozważanych tu zdarzeń losowych. Ponieważ w badanej grupie 30 studentów były tylko 3 osoby z oceną bardzo dobrą, a pozostałych 27 studentów otrzym ało oceny niższe, dlatego:

W artość oczekiw ana, w ariancja i odchylenie standardow e badanej zm iennej wyniosą odpow iednio:

Y=>fl gdy X = 5,0 [0 gdy * = 2,0 v * = 3,0 ^ X = 3,5 v X = 4,0 v X = 4,5. oraz D(Y) = J p q = ^ f 3,09 = 0,3. E( Y) - p - 0,1, D 2(Y) = p ą — 0,1 • 0,9 = 0,09, D(Y) = s[pq =-/0j09 = 0,3. {kp}

3.1.2. Rozkład dwumianowy (binomialny)

Załóżmy, że rozpatrzym y obecnie n zero-jedynkow ych zm iennych losowych X u X 2, . . . , X n.

Załóżmy p onadto, że:

P ( X i = 1) =/>, - P ( X 2 = 1) =P2 = ... = P ( X n = 1 ) = p n = p . (3.5) Niech zm ienna losowa Z będzie sum ą rozważanych n zm iennych zero-jedyn- kowych:

Z = X , + X 2 + ... + X n (3.6)

Z m ienna Z m oże przyjąć dow olną w artość z = 0, 1, 2 ,..., n. Rozkład praw dopodobieństw a tej zm iennej opisuje wzór:

P ( Z = z ; n , p ) gdzie:

n ' p * ( l - p ) " * = p zq n z , (3.7)

nl z \ ( n - z

Powyższy rozkład prawdopodobieństwa zmiennej losowej Z nazywa się rozkładem

dwum ianowym (binom inalnym )3, z p aram etram i n \p. W skrócie fakt, że zm ienna

losowa Z ma rozkład dwumianowy, m ożna zapisać, stosując n astęp ują symbolikę: Z ~ B ( n , p ) .

Z m ienną losową Z m ożna interpretow ać również jako możliwą liczbę sukcesów (realizacji określonego zdarzenia losow ego) uzyskanych w dow olnej kolejności, w n niezależnych doświadczeniach, przy założeniu, że praw dopodobieństw o sukcesu w każdym doświadczeniu jest jednakow e'i wynosi p.

Powyższy schem at postępow ania zwykło się nazywać schem atem B

ernoullie-go4.

Niezależność doświadczeń w praktyce oznacza najczęściej losowanie ze zw ra­ caniem z populacji ograniczonej (skończonej) lub bezzw rotne, ale z popu lacji nieograniczonej, przy czym wynik pojedynczego losow ania jest zm ienną losową o rozkładzie zero-jedynkowym.

W artość oczekiwana, w ariancja i odchylenie standardow e zm iennej Z są rów ne odpowiednio:

3 Nazwa rozkładu wiąże się z faktem, że prawa strona (1.71) jest rozwinięciem dwumianu Newtona postaci (p + q)n. Szerzej zob. np. Z. Hellwig: op. cit. s. 19.

4 Jakub Bernoulli (1654-1705), szwajcarski matematyk i fizyk, prof. uniwersytetu w Bazylei; twórca podstaw rachunku prawdopodobieństwa, za: Encyklopedia PWN, Warszawa 2005, t. 2.

E ( Z ) = np, (3.8)

D \ Z ) = npq, (3.9)

D ( Z ) = yf npq. (3.10)

P rz y k ła d 3.2

Załóżm y, że rozważam y zbiorow ość studentów b ad an ą ze względu na ocenę z „Z arządzania jakością” opisaną w przykładach 2.1 i 3.1. Załóżmy, że doświadczenie polega na trzykrotnym niezależnym losowaniu stu d en ta i spraw dzaniu oceny, jaką otrzym ał z egzam inu z „Z arząd zania jakością”. Wyznaczyć praw dopodobieństw o zdarzenia losowego polegającego na tym, że mniej niż dwa razy natrafiono w badaniu na stu d en ta z oceną bardzo dobrą. Ponieważ założyliśmy, że losowanie będzie nie­ zależne (co oznacza, że ta sam a osoba m oże być poddaw ana badaniu w ielokrotnie), oraz bad an a zm ienna Z jest sum ą trzech zm iennych zero-jedynkowych (Vi, Yj, Y3) o praw dopodobieństw ach P(Y\ - 1) = P (Y i = 1) = P(Yj = 1) = /? = 0,1, możemy stwierdzić, opisane powyżej doświadczenie spełnia warunki schem atu Bernoulliego.

M ożna zatem w skrócie zapisać Z ~ B ( n = 3, p = 1). Poszukujemy wartości praw dopodobieństw a następującego zdarzenia losowego:

P(Z< 2; n = 3 , p = 0,l) = P ( Z = 0) + P ( Z = 1) = ( V '3 ' ■0,1° 0,93 + ,0, ,1. 0,1 • 0,92 = = 0,93+3 • 0,1 ■ 0,92 = 0,729+ 0,243 = 0,972.

Jak łatwo zauważyć, szukane praw dopodobieństw o, zgodnie z definicją (2.5), jest dystrybuantą zm iennej Z w punkcie xn = 2, co zapiszemy:

Fz (xo = 2) = P ( Z < 2) = P { Z = 0) + P ( Z = I).

W artość oczekiw ana, w ariancja i odchylenie standardow e zm iennej Z wyniosą odpow iednio:

E ( Z ) - np = 3 • 0,1 = 0,3, D 2(Z ) = npq = 3 • 0,1 • 0,9 = 0,27, D ( Z ) = J n p q =70^27 * 0,5196. {kp}

3.1.3. Rozkład Poissona

Z m ienna losowa Z posiada rozkład Poissona5, jeżeli przyjm uje w artości z = 1, 2, 3 ,... z praw dopodobieństw am i6:

P (Z = z ; X ) = e ^ , (3.11)

z!

gdzie X = np jest param etrem tego rozkładu, natom iast e « 2,718.

Fakt, że zm ienna Z m a rozkład Poissona o p aram etrze X, będziem y zapisywać w skrócie: Z ~P(X).

W praktyce rozkładu Poissona używa się w sytuacji, gdy liczba serii niezależnych doświadczeń w zrasta do nieskończoności (n -» a>), natom iast praw dopodobieństw o „sukcesu” p m aleje do zera (p -> 0), przy czym np = X jest wielkością stałą (A. > 0).

Z powyższego stw ierdzenia wynika, że rozkład Poissona m ożna traktow ać, jak o rozkład graniczny rozkładu dwum ianowego. M ożna zatem zapisać:

lim Л —»co n Z p ^ q n-z= e x , 3 1 2 ) 7/

Rozkład Poissona stanowi tym lepsze przybliżenie rozkładu dw um ianow ego, im n jest większe, a p bliższe zera.

Problem atyczne pozostaje ustalenie m inim alnych w artości n i X przy których m ożna zastąpić wzór (3.7) w zorem (3.11). W literaturze znajdujem y kilka propozycji. Na przykład T. G erstenko rn i T. Ś rodka7 proponują, aby n > 100 i X < 20; Krysicki i współautorzy książki R achunek prawdopodobieństwa i statystyka m atem atyczna w zadaniach8 podają, że wystarczy aby n > 50 i X < 10. N a jeszcze większe ustępstw a pozwalają A. Iwasiewicz i Z. Paszek, autorzy książki Statystyka z elem entam i staty­ stycznych m etod sterowania jakością9, proponując, aby: n > 20, a X < 4.

Na użytek niniejszej publikacji w dalszej części p o dręczn ika przyjm iem y, że to ostatnie - najbardziej liberalne założenie - jest wystarczające, aby dość dobrze przybliżyć rozkład dwumianowy.

W artość oczekiwana oraz w ariancja zm iennej losowej Z o rozkładzie Poissona wynosi:

E ( Z ) = D 2( Z) = X, (3.13)

5 Denis Simon Poisson (1781-1840), francuski mechanik, fizyk i matematyk, za: Encyklopedia PWN, Warszawa 2005, t. 13.

6 Zob. A. Iwasiewicz, Z. Paszek: Statystyka..., op. cit., s. 33.

7 T. Gerstenkorn, T. Środka: Kombinatoryka i rachunek prawdopodobieństwa, wyd. 5, op. cit. 8 W. Krysicki i inni: Rachunek prawdopodobieństwa..., op. cit, s. 85

natom iast odchylenie standardow e:

D (Z ) = A . (3.14)

Przykład 3.3

Podczas kontroli jakości sprzedaw anych paliw zakłada się, że 1% stacji pali­ wowych w kraju sprzedaje paliwo złej jakości. Obliczyć praw dopodobieństw o, że w losowo wybranej niezależnej próbie 100 stacji znajdą się:

a) dwie stacje sprzedające paliwo złej jakości,

b) co najwyżej je d n a stacja handlująca paliwam i złej jakości. ad a)

N iech Z oznacza zm ienną losową będącą liczbą stacji, które w próbie 100 po­ branych do kontroli sprzedawały paliw a zlej jakości.

Ponieważ n — 100, a X = 1, do wyznaczenia wartości szukanego praw dopodo­ bieństw a m ożem y wykorzystać wzór (3.11) i otrzymamy:

P ( Z = 2;3L=1) =i- 1 - |p * 0,184. ad b)

O kreślenie, że co najwyżej jed n a stacja sprzedaje paliwa złej jakości, oznacza, że w pobranej próbie znajdzie się jed na stacja sprzedająca paliwa złej jakości lub wszyst­ kie ze zbadanych stu stacji handlowały paliwam i spełniającym i norm y jakościowe.

Szukamy praw dopodobieństw a następującego zdarzenia losowego: P ( Z < 1;X = 1) = F z (2) = P ( Z = 0) + P ( Z = 1) =

= e i j _ + e ' 1 = 2 e 1 = 2 - 0,368 = 0,736.

0! 1!

D o obliczenia szukanych praw dopodobieństw , m ożna wykorzystać również roz­ kład dwumianowy. Wówczas praw dopodobieństw o realizacji zdarzenia opisanego w podpunkcie a wyniesie:

rioo-i

P ( Z = 2 ; n = ] 00, p = 0,01) - • 0,012 ■ 0,99* =

v /

= 4950 • 0,0001 • 0,0001 • 0,37346428 = 0,184864819* 0,185.

K orzystając z rozkładu dwum ianowego, m ożna również wyznaczyć dokładną w artość praw dopodobieństw a zdarzenia losowego, wyznaczonego w punkcie b tego przykładu.

'100 O O , 0 ; • 0,01° 0,99100 + 1 .

P { Z < 2; n = 100, p = 0,01) = P { Z = 0) + P ( Z = 1) =

0,01- 0,99" = 0,99ino + 100 0,1 0,99« = = 0,366032341 + 0,369729638 = 0,735761979* 0,736.

Porównując powyższe wyniki, wyznaczone z zastosow aniem schem atów rozkładu Poissona i rozkładu dwum ianowego, m ożna dojść do wniosku, że różnice pom iędzy wynikami przybliżonymi za pom ocą schem atu Poissona i wynikam i dokładnym i obliczonymi z wykorzystaniem schem atu B ernoulliego są na tyle m ałe, że m ożna je zignorować na rzecz zm niejszenia pracochłonności obliczeń, {kp}

3.1.4. Rozkład hipergeometryczny

Załóżmy obecnie, że z populacji /V-elementowej, w której znajduje się M ele­ m entów posiadających określoną cechę, losujem y w sposób za le żn y (bezzw rot­ ny) «-elem entów . Interesujące nas zdarzenie losowe to wylosowanie z elem entów o określonej cesze.

Poniższe doświadczenie zilustrow ano na rys. 17.

Rys. 17. Schemat losowania zależnego Źródło: opracowanie własne.

Niech zm ienna Z oznacza liczbę elem entów o określonej cesze (n a rysunku e le­ mentów zacieniowanych) znajdujących się w wylosowanej zależnie próbie o liczności n. Z m ienna ta m oże przyjmować w artości całkow ite z przedziału [0,«], a jej rozkład

praw dopodobieństw a nazywany jest rozkładem hipergeom etrycznym (Z ~ H ( N , M, n)). Praw dopodobieństw o zdarzenia losowego P ( Z = z; N, M, n) wyznaczamy, stosując następujący wzór kom binatoryczny:

P ( Z = z; N, M, ń) =

M N - M

n - z

gdzie:

(3.15)

N - M - liczba elem entów w populacji pozbaw ionych określonej cechy (na rysunku elem enty biate),

n - z - liczba elem entów w próbie nieposiadających określonej cechy, przy czym:

z = 0 ,1 ,...,n \ n < N - , z < M \ z < n \ n - z < N - M . M

Jeżeli założymy, ż e p = — , to wówczas wzór (3.15) m ożna zapisać następują-co10.

P ( Z = z; N, M, n) =

N p Nq

n - z

(3.16)

W artość oczekiw aną oraz w ariancję zm iennej losowej Z wyznacza się, stosując wzory (3.17) i (3.18): , s n M E \ Z ) = —— =np, N D 2( Z )= ——- n p q . N - 1 УН (3.17) (3.18)

W pewnych przypadkach, zwłaszcza, gdy — 0, rozkład hipergeom etryczny

m ożna przybliżyć za pom ocą rozkładu dwum ianowego.

W przypadku, gdy N -> oo, M -» oo, n -> oo, a także E ( Z ) -> X, X > 0, wówczas

P ( Z = z; N, M, n) -» P (Z = z; A.), (3.19)

co oznacza, że dokładną w artość uzyskaną z rozkładu hipergeom etrycznego m ożna przybliżyć, używając rozkładu P oissona11.

10 Zob. A. Iwasiewicz, Z. Paszek: Statystyka..., op. cit., s. 38.

Przykład 3.4

Wykorzystując inform acje zaw arte w przykładzie 3.2 oraz powiązanych z nim przykładach 2.1 i 3.1, wyznaczyć praw dopodobieństw o zdarzenia losowego polega­ jącego na tym, że w trzykrotnym zależnym (bez zw racania) losow aniu studentów , mniej niż dwa razy natrafiono w b adaniu na stu d en ta z o ceną bardzo dobrą.

Ponieważ założyliśm y obecnie, że losow anie odbywa się bez zw racania, do wyznaczenia szukanego praw dopodobieństw a, nie m ożna zastosow ać schem atu Bernoulliego, lecz należy skorzystać ze wzoru na rozkład hipergeom etryczny.

W artość szukanego praw dopodobieństw a wyniesie:

P ( Z < 1; N = 30, M = 3, n = 3) = P ( Z = 0) + P (Z = l) = P I 2Tj f 3l f 27l U J U w U J 2925 1053 p O ] p o 'l 4060 4060 3 J 3 j = 0,72 4- 0,259= 0,979.

Jak widać, różnica pom iędzy w artością otrzym aną przy wykorzystaniu rozkładu hipergeom etrycznego i w artością obliczoną na podstaw ie rozkładu dw um ianow ego (zob. Przykład 3.2) jest bardzo m ała i wynosi zaledwie 0,007 (0,979 - 0,972 = 0,007). Jest to efekt tego, że stosunek n / N — 0,1 jest w artością bliską zera, co pozw ala na aproksymację rozkładu hipergeom etrycznego za pom ocą rozkładu dwum ianowego,

{kp}

3.1.5. Rozkład Pascala (ujemny rozkład dwumianowy)

i rozkład geometryczny

Zagadnienie Pascala jest nieco podobne do zagadnienia Bernoulliego. W schemacie Bernoulliego liczba niezależnych doświadczeń n jest z góry ustalona, a szukamy praw­ dopodobieństwa, że podczas tych doświadczeń z razy osiągniemy sukces. W schemacie Pascala szukamy natom iast praw dopodobieństw a zdarzenia losowego, polegającego na tym, że liczba przeprow adzonych zgodnie ze schem atem B ernoulliego dośw iad­ czeń będzie równa N = n, przy czym zakłada się, że losowanie przeprow adza się do m om entu otrzym ania ustalonej liczby sukcesów z (z > 1).

T. G erstenkorn i T. Ś rodka rozw iązanie tego problem u ujm ują w form ie n astę­ pującego tw ierdzenia12:

Jeżeli przeprow adzam y dośw iadczenia w edług schem atu B ernoulliego o stałym praw dopodobieństw ie sukcesu w poszczególnym doświadczeniu równym p aż do m o­ m entu uzyskania z góry ustalonej liczby z sukcesów (z > 1), to praw dopodobieństw o, że liczba dośw iadczeń będzie rów na n (n > z), wyraża się wzorem:

P ( N = n; z , p ) = przy czym:

' r c - n

, p l ą n \ (3.20)

n > z > l , q — 1 - p .

Fakt, że zm ienna losowa N m a rozkład Pascala z param etram i p i z (ujem ny dwu­ mianowy, ang. negative binom ial), będziem y zapisywać w skrócie N ~ N B ( p , z).

W artość oczekiw ana i w ariancja zm iennej losowej N jest rów na odpowiednio:

E ( N y S , (3.21)

P

D 2 { N ) = L 1 .

(

3

.

22

)

P

W przypadku, gdy liczba sukcesów z = 1, wzór (3.20) redukuje się do postaci:

P {N - n ; z = \ , p ) - pq"~'. (3.23)

R ozkład p raw dopodobieństw a zm iennej losowej N wyrażony wzorem (3.23) zwykło nazywać się rozkładem geom etrycznym , a fakt ten zapisywać w skrócie N ~ G ( p , z ) .

W artość oczekiw aną oraz w ariancję zm iennej losowej o rozkładzie geom etrycz­ nym opisują wzory:

E ( N ) = — , (3.24)

P

D - ( N ) = Ą - (3.25)

Przykład 3.5

D ośw iadczenie polega n a losowaniu niezależnym stu den ta z grupy 30-osobowej i spraw dzeniu oceny otrzym anej z egzam inu z „Z arządzania jakością”. Losowanie prow adzi się do m om entu dw ukrotnego wylosowania studenta, który otrzym ał oce­ ną bardzo dobrą (5,0). Z akładając, że rozkład ocen studentów jest identyczny jak w przykładzie 2.1, obliczyć prawdopodobieństwo, że losowanie będzie sześciokrotne.

otrzymuje-P( N = 6 ;z = 2,/> = 0,1) = 5 0,12 0,94 = 5 ■ 0,01 ■ 0,6561 = 0,032805 = 0,033. Załóżmy obecnie, że prowadzimy losowanie niezależne do m om entu natrafienia na pierwszego studenta, który otrzym ał oceną bardzo dobrą. Wyznaczmy p raw do­ podobieństw o zdarzenia losowego, że potrzeb n e będzie rów nież sześć losowań. Intuicyjnie praw dopodobieństw o takiego zdarzenia pow inno być dwa razy większe od praw dopodobieństw a wyznaczonego w pierwszej części tego przykładu.

Ponieważ losowanie przeprow adzam y do m om entu osiągnięcia pierwszego „suk­ cesu” (z = 1), wzór (3.20) m ożna zastąpić w zorem (3.23). O trzym am y wówczas:

P ( N = 6; z = \ , p = 0,1) = 0,1 ■ 0,95 = 0,059.

Potwierdza się intuicyjne przypuszczenie, że praw dopodobieństw o uzyskania jednego sukcesu w sześciu niezależnych próbach (ok. 6%) jest dw ukrotnie większe niż uzyskanie dwóch sukcesów (ok. 3%). {kp}

3.2. Wybrane rozkłady jednowymiarowych