ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA XII (1978)
TADEUSZ GERSTENKORN (Łódź)
Wielowymiarowe ucięte rozkłady dyskretne
(Praca
przyjętado druku 20.01.1977)
O.
Wstęp.Celem pracy jest przedstawienie metody konstrukcji wielowymiaro- wych dyskretnych
rozkładów uciętychprzy warunkach
najczęściejspotykanych w zagadnieniach statystycznych i sprecyzowanych
dokładniew paragrafie 1. Zada- niem, które sobie postawiono w tym paragrafie,
byłouzyskanie funkcji prawdo-
podobieństwa rozkładu uciętego
wektora losowego (X
1 , ••. ,Xk) przy
założeniu, że ucięciez
dołu wartości określonejdowolnie wybranej zmiennej losowej ma miejsce o
dowolną całkowitą liczbęb
mniejsząod n.
Rozważaniaprzedstawione w paragrafie 2
dotycząprzypadku, gdy
obcięciadokonuje
siędla dowolnej liczby zmiennych losowych Xi (1
~i:::;;.k) z
dołuo
wartościbi na
ogół różnedla
każdejze zmien- nych. W efekcie uzyskuje
się funkcję prawdopodobieństwa uciętegowielowymiaro- wego
rozkładu całkowito-liczbowych zmiennych losowych, z których
każdaprzyjmuje
wartości
od O do n, i których suma
wartościrówna
sięn.
Ważnym
momentem uzyskanych wyników teoretycznych jest
możliwośćich zastosowania w praktyce. Temu celowi
służąparagrafy 3 i 4. W paragrafie 3 przed- stawiono wielowymiarowy schemat losowania i
związanyz nim wielowymiarowy
rozkład
Pólya
dającyopis sytuacji (jednej z
najważniejszychw zastosowaniach sta- tystycznych)
zdarzeń zależnychoraz przedstawiono
wynikającez tej struktury wielowymiarowe przypadki szczególne
najczęściejspotykane w praktyce, tzn.
schemat
losowań niezależnych (rozkładwielomianowy) i schemat
losowańbez zwrotu
(rozkładhipergeometryczny). W opisie schematu Pólya zwrócono
szczególną uwagęna elementy
ważnew zastosowaniach statystycznych.
Paragraf 4 dotyczy konstrukcji
uciętych rozkładówPólya. (z
ucięciemdla jednej i wielu zmiennych) w oparciu o wyniki uzyskane w paragrafie 1 i 2. Problemowi temu
poświęcono również uwagęw paragrafie 1 pracy autora [4],
jednakże podejściedo zagadnienia w obu przypadkach jest
całkowicieinne. W pracy [4] konstrukcja
rozkładu uciętego
dotyczy
wyłącznie rozkładuPólya (i jego przypadków szczegól- nych), w przedstawionej tutaj pracy
rozkładPólya jest tylko
egzemplifikacjąszerzej zarysowanego problemu.
1. Konstrukcja wielowymiarowego
uciętego rozkładudyskretnego z
obcięciemdla jednej zmiennej. Rozpatrzmy
łączną k-wymiarową dyskretną zmienną losową(wektor losowy) (X
1 ,X
2 , ••• ,Xk)
taką, że każdaze
składowychX
1 ,X
2 , ••• ,Xk oraz zmienna
[77)
78 T. G er s te n ko r n
Xk+i
może przyjmować wartości całkowitexi (i= J, 2, „., k + l) od O do n przy
spełnieniu ograniczającego
warunku (1.1)
tj. inaczej
mówiąc, wartość(k+ 1)-szej zmiennej Xk+i jest wyznaczona
zależnością k(1.2) xk+l =n-
i=lLxi,
co oznacza,
żedo
rozważańwprowadzamy k zmiennych wolnych. Wygodnie nam przy tym
będzie rozpatrywaćzmienne losowe Xi (i= 1, 2, ... , k+ 1) jako cechy w pewnej populacji statystycznej
pojawiające sięw niej z
prawdopodobieństwemPi> O, tak
że(1.3) P1+P2+ ··· +Pk+Pk+1 = 1.
Zakładamy
dalej,
żerozpatrywany wektor losowy (X
1 ,X
2 , •.• ,Xk) podlega pewnemu
rozkładowi prawdopodobieństwa
z parametrem () i
określonyjest
funkcjąprawdo-
podobieństwa
postaci:
(1.4a)
lub w postaci
uwydatniającejwprowadzone
założenia:(1.4) P(X=
X1,X2 '= X2, ... , xk = xk;n;p1,P2, .„,Pk; ()) =
= p(x1, X2, ... , xk; n; P1, P2, ···, Pk; 0).
W wielu przypadkach, dla uproszczenia zapisu (1.4),
będziemy posługiwać sięza- pisem krótszym (1.4a):
p(X1, ... , Xk).
Zakładamy, że
zakres
zmiennościjednej ze zmiennych losowych - powiedzmy Xi - zostaje ograniczony z
dołuo
wartość całkowitąb > O, tj.
( 1. 5) b + 1
~ X j ~n .
Ze
względuna
przyjętyprzez nas warunek (1.1) lewostronne ograniczenie o b
wartości
zmiennej losowej Xi
pociągaza
sobąprawostronne ograniczenie
wartościprzyjmowanych przez
pozostałezmienne losowe, tj.
( 1. 6) O
~x
i ~n - ( b + I) dla i = 1 , 2, ... , j- 1 , j + J , .•• , k + 1.
Przy tak
nałożonychwarunkach na zmienne losowe Xi (i = 1 , 2, ... , k + 1) zachodzi
następującetwierdzenie.
TWIERDZENIE
1.
Jeślidana jest funkcja
prawdopodobieństwa(1.4) k-wymiarowej
łącznej
zmiennej losowej (X
1 , ••• ,Xk)
spełniającejwarunki (1.1) (lub (1.2)) i (1.5), to funkcja
prawdopodobieństwak-wymiarowego
rozkładu uciętegop* (x
1 , •.. ,xi, ... , xk)
wyraża się
wzorem
(1.7)
Wielowymiarowe
ucięte rozkładydyskretne
gdzie Qj(b) jest tzw. „ogonem"
rozkładubrzegowego zmiennej Xi, tj.
(1.8) Q/b) = 1-Fj(b),
a Fi(b) jest
wartościądystrybuanty Fj(xi) zmiennej losowej Xi w punkcie xi = b o war-
tości
mniejszej od 1 (b < n):
b
(1.9) P.(b)
J= )
~P·(X·)·
J J'Xj=O
użycie
kreseczki nad xi oznacza przy tym,
że ucięcie określonewarunkami (1.5) i (1.6)
nastąpiło
ze
względuna
wartościprzyjmowane przez
zmiennąXi.
D o w ó d. Oznaczmy przez Kk+
1, n klasęwszystkich
układów(x
1' ... 'Xk+
1)k+ 1 liczb
całkowitych spełniającychwarunek (1.1) (lub (1.2)), a przez
K~+1
,n klasęwszystkich
układów(x1, ... , xk+i) k+ 1 liczb
całkowitych,które
spełniająwarunki (1.1), (1.5) i (1.6). Niech
K~~i,n będzie klasąwszystkich
układów(x
1 , •.• ,Xk+i) k+ 1 liczb
całkowitych spełniającychoprócz warunku (1.1)
takżewarunki
0
~Xi~b,
O
~xi
~n dla i = 1 , 2, ... , j- 1, j + 1 , ... , k + 1.
Przy
przyjętejumowie co do oznaczenia klas, zachodzi dla nich
następującarelacja:
(1.10)
ponieważ
Wprowadźmy
do
rozważańjeszcze
klasęKk,n-x
1wszystkich
układów(x
1 ,x
2 , •••. . . , xi_
1,xi+
1 , •.. ,xk+
1)k liczb
całkowitych spełniającychjeden z warunków
gdzie xi = O, 1, ... , b.
Funkcja
prawdopodobieństwa rozkładu uciętego, którą oznaczyliśmyprzez p* (x
1 , ••• ,xi, ... , xk), musi
spełniać następującewarunki:
(1.11) L p*(x1, ... , xi, ... , xk) = 1.
K~+1,n
Uwzględniając
warunek (1.10) otrzymujemy:
(1.12) L p(x
1 , ••• ,xk) = L p(x
1 , ..• ,xk) - L p(x
1 , ... ,xk) =
K~+1,n Kk+l,n K~'+1.n
b
1- L p(x1, ... ,xk) = 1- L L p(x1, ... ,xk) ..
x~'+1.n Xj=O Kk,n-xj
80 T. G e r s t e n ko r n
Zauważmy, że 2: p(X1' „.' xk) przedstawia rozkład brzegowy zmiennej xj
w k-wymiarowym
rozkładzie łącznejzmiennej losowej (Xi, „., Xk), tj.
(l.13) ,L p(xi, ... , xk) = P(Xi = xi) = pixi).
Kk,n-xJ
Po
uwzględnieniuwzorów (1.12), (l.13), (1.9) i (1.8) otrzymujemy:
b
(1.14) .L p(X1, .„,xk) = 1- _Lpi(xi) = 1-FJ(b) = Qj(b).
K~+l.n XJ=O
Funkcję prawdopodobieństwa rozkładu uciętego
otrzymuje
się już bezpośredniona podstawie wzorów (1.11) i (1.14), co
kończydowód twierdzenia 1.
2. Konstrukcja wielowymiarowego
uciętego rozkładudyskretnego z
obcięciemdla wielu zmiennych. Z kolei rozpatrzymy problem konstrukcji
rozkładu uciętegowielo - wymiarowej
łącznejzmiennej losowej (wektora losowego) (Xi, „., Xk) przy zadanej funkcji
prawdopodobieństwa(1.4) i przy
założeniu, że ucięciupodlega zakres zmien-
ności
dowolnej liczby zmiennych losowych. Dla uproszczenia sprawy przyjmujemy,
że
kolejne zmienne Xi , X2, ... , Xi w liczbie t :::::;:; k
są uciętez lewej strony (z
dołu),(w przypadku dowolnego doboru zmiennych
podlegających ucięciutrzeba by zasto-
sować podwójną numerację wskaźników),
tj.
żezakres
zmienności każdejz nich jest ograniczony z
dołuprzez
liczbębi+ 1
(bi~O, i= 1, 2, „., t), tj.
(2.1) bi+ 1 :::::;:; xi :::::;:; n dla i = 1 , 2, „., t
przy zachowaniu warunku,
że(2.2)
Z uwagi na warunek (I.I)
obcięcie wartościzmiennych losowych Xi przez bi (i=
= 1 , 2, ... , t) z
dołu pociągaza
sobąograniczenie
wartości pozostałychzmiennych losowych z góry, tzn.
(2.3) 0
<Xi~n-(b1 +b2 + .„ +bt+t), i= t+ 1, t+2, „., k+ 1.
Przy tak sprecyzowanych warunkach
nałożonychna zmienne Xi zachodzi
następującetwierdzenie.
TWIERDZENIE
2.
Jeżelidana jest k-wymiarmva zmienna losowa (Xi, ... , Xk) o funkcji
prawdopodobieństwa
(1.4) z warunkiem (1.1), to
zakładając, żezmienne losowe Xi (i = 1, 2, ... , t) w liczbie t
~k
podlegająwarunkowi
ucięciaz lewej strony (z
dołu)określonemu
przez (2.1) i (2.2), otrzymujemy dla funkcji
prawdopodobieństwap*(i1, „., x,, Xt+ 1, .„, xk) k-wymiarowego
rozkładu uciętego postać wyrażonąwzo- rem
(2.4)
przy czym
użyciekreseczki nad
wartościązmiennej losowej oznacza,
żerozpatruje
się ucięcie ze w!ględu na tę zmienną losową, a Qi, .„,t(b
1 ,.„, bt) oznacza „ogon"
Wielowymiarowe
ucięte rozkładydyskretne 81
rozkładubrzegowego wektora (X
1 , ••• ,Xr) w
rozkładzie łącznejzmiennej losowej (X1, ... , Xk), tj.
(2.5)
gdzie F
1„ .. ,t(b
1 ,„., bt) jest
wartościądystrybuanty F
1 , ...,t(x
1 ,„., Xt) zmiennej loso- wej (X1, „., Xr) w punkcie (b
1 ,.„, bk), tj.
bi. ····bt
(2.6) F1, ... ,t(b1, „., bt) = L P1, ... ,t(X1, „.,Xr) ·
X1=0, .. „Xc=0
z warunkiem F1, ... ,t(b1, „., bt) < 1 z uwagi na (2.2).
Do wód. Niech klasa
Kk+i,nma znaczenie jak poprzednio. Przez
klasę K~+i,n rozumiećteraz
będziemyzbiór wszystkich
układów(x
1 ,„., xk+i) k+ 1 liczb
całkowitych
spełniającychoprócz warunku (1.1) warunki bi + 1 ::;;; xi ::;;; n dla i = 1 , 2, ... , t,
o::;;;xi ::;;; n-(b1+b2+ „. +bt+t) dla i=t+l,t+2,„.,k+l.
Klasę K~~i.n stanowić
teraz
będziezbiór wszystkich
układówk+ 1 liczb
całkowitych spełniającychoprócz warunku (1.1)
następującewarunki:
0 ::;;;
Xi ::;;; bidla i = 1, 2, „. , t,
O < xi < n dla i =
t+ 1 ,
t+ 2, .. . , k + 1.
Przez
klasę Kk+i-t,n-(x1+ ...
+xc) rozumieć będziemyzbiór wszystkich
układówk + 1- t nieujemnych liczb
całkowitych spełniającychjeden z warunków
Xt+ 1 +xt+2 +
„.+xk+r = n-(x
1+x2 +
„.+x,)
przy ustalonej
wartościsumy x 1 +x2 +
.„+xt równej O lub 1, „. , lub b
1+b
2+ „.
+bt.
Po
uwzględnieniuzasadniczej
równości(1.10)
następująkolejne
przekształcenia:L p(x1,.„,xk) = 1- L p(x
1 ,„ ., xk) =
Kt+l,n K~+l,n
Zauważmy, że L p(x
1 ,„., xk) przedstawia rozkład brzegowy we-
Kk+1-c, n-(Xi+·„+x1>
ktora losowego (X
1 ,X
2 , ••• ,Xt) w k-wymiarowym
rozkładzie łącznejzmiennej losowej (X
1 ,„., Xk), tj.
L p(x1, „., xk) = P1, ... ,r(X1, „., Xr).
Kk+i-t, n-(x1 +"·+x,)
82
T. Ger sten
kor n
Po uwzględnieniu · tego wżoru oraz (2.6) i (2.5) otrzymujemy
bi, .„,br
Lp(X1, ... ,xk)=l- L P1, ... ,r(X1,„.,Xr)=
K~+l,n X1=0, ... ,Xr=0
= l-F1, .. „r(b1, ... ,br)= Qi .... ,r(h1, ... ,br).
Z
określenia rozkładu uciętegowynika,
żefunkcja
prawdopodobieństwa tegoż rozkładu będzie mieć postać(2.4).
3. Schemat i
rozkładPólya. Jednowymiarowy
rozkładPólya oparty na schemacie urnowym podali w r. 1923 F. Eggenberger i G. Pólya [3]. Autorzy ci zaproponowali i dyskutowali
następującyproblem.
Wyobraźmy
sobie,
żew urnie znajduje
sięb
białychi c czarnych kul; b + c = N.
Wyciągamy
w sposób losowy
kulęz urny i
następniezwracamy
jądo urny oraz wykonujemy
jednąz
następujących czynności:1. dodajemy s kul tego samego koloru, co pobrana uprzednio kula;
2. wyjmujemy z urny s kul tego koloru, co pobrana uprzednio kula;
3. nie
dokładamyani nie wyjmujemy kuli.
Umawiamy
się, żew
każdymz omówionych przypadków
postępowania będziemymówili o dodawaniu s kul, z tym,
żew przypadku pierwszym przyjmujemy s > O, w przypadku drugim przyjmujemy s < O, natomiast w przypadku trzecim przyjmu- jemy s =O.
Przypadek trzeci daje tzw. schemat losowania Bernoulliego.
Widać, żeschemat losowania Pólya jest schematem ogólniejszym, schematem (w
ogólności) losowań zależnych, dającymw
szczególnościdla s = - 1 tzw. schemat hipergeometryczny, czyli schemat losowania bez zwrotu.
Zauważmy, żew przypadku s < O
należy poczynić założenia:-ks :s;; b oraz -(n-k)s
~c.
Oznaczmy przez X
zmienną losową,która przybiera
wartośćk (k = O, l, ... , n), gdy w rezultacie n
ciągnięćotrzymano k razy
kulęnp.
białą.Funkcja prawdopodo-
bieństwa
zmiennej losowej X
wyraża sięwówczas wzorem (3.1) P(X = k) = ·(n)-~i~-~!)_(b±2sl_._._J~_+ (k-_!)j_ x
k N(N+s)(N+2s) ... (N+(k-l)s)
c(c+s)(c+2s) ... (c+ (n-k- l)s)
x (N+.ks)(N+(l+·l)s)(N+ (k+2)s) ... (N+ (n-l)s)' gdzie n = 1, 2, „.
Przyjmując
oznaczenia
b c s
N = p, ii= q, N= a,
wzór (3.1)
można napisaćw sposób
następujący:(3.2) P(X = k) =(n) p(p+a)(p+2a)
„.CE.:+ (k-1~~1 x
k 1(1 +a)(l +2a) .„ (I+ (k- I)a)
q(q+a)(q+2a)
„.(q+ (n-k- l)a)
X - - - --- -- - -- --- - - -
(l +ka)(l + (k+ l)a)(1+(k+2)a) ... (I+(n-l)a) ·
Wielowymiarowe
ucięte rozkładydyskretne 83
Upraszczając
nieco zapis, wzór (3.2)
można podać następująco:k-l n-k-l
(3.3) n (p+ia) n (q+ia)
P(X = k) = (~)
i=O n-1 i=O •n (I +ia)
i=O
W
rozważaniachpodanych
niżej posłużymy się wygodnądo
przekształceń formązapisu tzw. wielomianów czynnikowych.
DEFINICJA.
Wielomianem czynnik owym stopnia n
względemx
(uogólnioną potęgąliczby x) z krokiem a nazywamy wielomian
określonyza
pomocą następującegowzoru rekurencyjnego (por. [I], str. 47):
(3.4)
X[O,a]= 1,
X[n,a]=
X[n-1.a](x-na),n= 0, 1, „.,
gdzie a jest
dowolną liczbą rzeczywistą.Na podstawie
związku(3.4) otrzymujemy xfn,a1 = x(x-a)(x-2a)
„.(x-(n._ l)a).
Jeżeli
a = O, to wielomian czynnikowy redukuje
siędo
zwykłej potęgi X[n, OJ= x".
W przypadku a = 1 stosujemy prostszy zapis:
Dla klasy
Kk+t. n układów(x
1 , ••• ,xk+
1)takich k+ 1 nieujemnych liczb
całkowitych,
żex
1+ ... +xk+
1= n i dla uogólnionej
potęgiprzy
każdyma prawdziwy jest wzór:
(3.5)
k+l k+l
( ~
~p, ·)[n,a] --n. '~„ L n p~x,,-a] ' .
. i=l Xi·
1=1 Kt+1,n
Wzór ten nazywamy uogólnionym wielomianowym wzorem Newtona lub wzorem Vandermonde'a.
Dowód tego wzoru dla k = 1
znaleźć możnaw [1], str. 49, a dla dowolnego naturalnego kw [2], str. 45. Wzór jest bardziej znany dla k = 1 i a = O ([5], str. 64, lub [5a], str. 94).
W oparciu o wzór (3.4)
funk-ej~ prawdopodobieństwa danąwzorem (3.3)
można przedstawić następująco:(3.6) P(X = k) = (n)
kp~_k·-=-~!J~:~~-~aJ_
J[n,-a]'
p>O, p+q=1, k=0,1,2, ... ,n.
Wzór (3.6) jest
konsekwencją rozważańschematu urnowego, tzn.
określaprawdo-
podobieństwo
uzyskania k sukcesów przy przeprowadzaniu n
losowań wedługwska- zanego schematu.
Prawdopodobieństwop pierwszego sukcesu oraz liczba a
sątu
więc
liczbami wymiernymi z
przedziału(O, 1). Z drugiej strony, wzór (3.6)
można84 T. Ger sten kor n
traktować
jako
propozycjęwprowadzenia do
rozważań rozkładudyskretnego o takiej
właśnie
postaci, przy
założeniu, żep
będzietym razem
dowolną liczbą rzeczywistąz
przedziału(O, 1), natomiast a
dowolną liczbą rzeczywistą, spełniającąpodany
niżej
warunek. Dla
powiązaniatego typu
rozkładuz problemami praktycznymi
można zaproponować następujący
schemat losowania.
Dokonujemy n
doświadczeńw ten sposób,
że prawdopodobieństwosukcesu zmienia
się(ogólnie
biorąc)od próby do próby
według następującejzasady. Niech w pierwszej próbie
prawdopodobieństwosukcesu
będzie liczbąp (O < p < l);
jeśli
w pierwszych I
doświadczeniachotrzymano m sukcesów i /- m
porażek~to
prawdopodobieństwo
sukcesu w (/+ 1)-szym
doświadczeniu określa sięjako równe (p+ma)/(l +la).
Stąd jużwynika,
że prawdopodobieństworealizacji k sukcesów w dowolnej
kolejnościw n
doświadczeniach wyraża sięwzorem (3.6).
W przypadku a < O
należy uwzględnićwarunek:
-na~min(p, q), ogranicza-
jący
zakres
użycia wartościparametru.
Wyżej
opisany schemat nazwiemy teoretycznym
(ciągłym)schematem Pólya dla
odróżnienia
od
zwykłego(dyskretnego) urnowego schematu Pólya.
(Użytetu te_rminy
„ciągły",
„dyskretny" nie
należy odnosićdo samego
rozkładu ,który
oczywiściejest w
każdymwypadku tylko dyskretny).
Opisane tu schematy i
rozkładyPólya
można uogólnićna przypadek wielo- wymiarowy w sposób
następujący. Rozważymynajpierw przypadek dyskretny.
Niech
będziedana N-elementowa populacja, której elementy klasyfikujemy
według
k+ 1 wybranych cech, tzn. przypisujemy do klas Ci, gdzie i= 1, 2, „., k+ 1, przy
założeniu, żeklasy
są rozłączne.Niech Npi
będzie liczbąelementów klasy C.
Wówczas
k+IL Pi = 1. Z rozważanej populacji pobieramy próbę n-elementową
i=l
według następującego
schematu. Po pobraniu losowym pierwszego elementu zwra- camy go z powrotem i dodajemy (s > O), wyjmujemy (s < O) s elementów tej samej klasy, co element wylosowany lub nie zmieniamy
składupopulacji (s = O). Proces ten powtarzamy n razy
uzyskującw efekcie
pewną liczbęxi (i = 1 , 2, ... , k + 1)
elementów
każdejz klas, przy oczywistym warunku: x
1+x2 + „. +xk+t =n.
Wartości
xi
sąrealizacjami zmiennych losowych Xi (i= I, 2, ... , k+ 1), czyli zmiennych losowych o
wartościachrównych liczbie elementów wylosowanych z po- szczególnych klas, przy czym Xk+t =n- L
kXi. (Jest to spełnienie warunku (1.2)).
Funkcja
prawdopodobieństwa rozkładuk-wymiarowej zmiennej losowej (X1, X2, ...
i=l. „, Xk)
związanejz przedstawionym (urnowym) schematem losowania dana jest
wzorem
Wielowymiarowe
ucięte rozkładydyskretne 85 W przypadku s < O
zakładamy, że-ns
~min(NP1, ... , NPk).
Podany tu
rozkład(3. 7)
będziemy zapisywaćW postaci
uwypuklającej
wszystkie
występującew tym
rozkładzieparametry, lub krócej w po- staci p(x
1 , ... ,xk).
Uogólnieniem wzoru (3.7) na przypadek
„ciągły",tzn. przy
przyjęciu założenia, żep jest
dowolną liczbą rzeczywistąz
przedziału(O; I) oraz
żea jest
dowolną liczbą rzeczywistą spełniającąwarunek:
-na ~min(p
1,p
2 , ••.,Pk+i) (warunek ten
możnaopuścić,
gdy a
~O), jest wzór na
funkcję prawdopodobieństwawielowymiarowego
rozkładu
Pólya postaci (3.8)
gdzie Pi > O (i = 1 , 2, ... , k + 1 ),
k+1L Pi = 1, a n jest ustaloną liczbą naturalną.
- i=l
Funkcję prawdopodobieństwa
(3.8)
będziemy zapisywaćw postaci
lub
prościejp(x1, x2, ... , xk). Pierwszy sposób zapisu jest zwykle stosowany
wówczas~gdy chodzi o zaznaczenie wszystkich
występującychw
rozkładzieparametrów.
Wykorzystamy to w dalszych paragrafach.
Zauważamy, żerozpatrywany
rozkład(i jego sposób zapisu) odpowiada warunkom
sformułowanymw paragrafie 1.
W przypadku, gdy we wzorze (3.8) parametr a przyjmuje
wartośćzero lub we wzorze (3.7) parametr s = O, otrzymujemy tzw.
rozkładwielomianowy w postaci (3.9)
Funkcję prawdopodobieństwa
(3.9)
można również zanotowaćsymbolicznie przez p(x1, ... ,xk;n;p1, ... ,Pk).
Jeśli
we wzorze (3. 7)
założyć, żes = - 1, to ze wzoru tego otrzymujemy
postaćfunkcji
prawdopodobieństwawielowymiarowego
rozkładuhipergeometrycznego
n! J]
k+l(Npi)C:c11 p(x1, X2, ... , xk) = N[n~
i=I .I 'X,.
(3. 10)
co
można również zapisaćsymbolem
p(x1, ... , xk; n; p1, ... ,Pk; N).
Zauważmy, że każda
ze zmiennych losowych Xi (i= 1, 2, ... , k+ 1) wy-
stępującychw
rozkładachod (3. 7) do (3.1 O)
może przyjmować dowolnąwar-
tość całkowitą
od O do n w taki jednak sposób, by
spełniony byłwarunek:
x 1 +x2 + ... +xk+1 =n.
86 T. Ger sten ko r n
Niektóre problemy
związanez
rozkładami(3. 7) i (3.10)
można znaleźćw pra- cy [6]. Charakteryzacji
rozkładów(3. 7)-(3.10)
poświęconajest praca [2].
4. Konstrukcja
uciętego rozkładuPólya. Twierdzenia 1 i 2 uzyskane dla klasy wielowymiarowych
rozkładówdyskretnych
całkowitoliczbowych spełniającychwarunek (1.1)
pozwoląnam teraz
otrzymaćfunkcje
prawdopodobieństwawielo- wymiarowych
uciętych rozkładówPólya oraz szczególnych przypadków:
rozkładuwielomianowego i hipergeometrycznego omówionych w paragrafie 3.
RozkładPólya dany wzorem (3.7) lub (3.8) stanowi
interesujący przykład rozkładu rozważanej przez nas klasy
rozkładówdyskretnych.
Konstrukcjęfunkcji
prawdopodobieństwa uciętych rozkładówPólya przeprowadzimy zarówno w przypadku
założeniao
obcięciu
wartościjednej, jak i wielu zmiennych losowych.
TWIERDZENIE
4.1.
Jeślidana jest funkcja
prawdopodobieństwap(x
1 , ••• ,xk) k-wymiarowego
rozkładuPólya (3.8) i
wartościjednej ze zmiennych, np. Xi (1 :s;; j
~k),
są obcięte
z lewej strony (z
dołu)o
wartośćb
~O,to funkcja
prawdopodobieństwap*(x 1, ... , xi, ... , xk) otrzymanego
rozkładu uciętegojest dana wzorem (4.1)
Do wód.
Mającna
względzie(l.7) dla uzasadnienia wzoru (4.1)
należyjedynie
uzyskać postać
wzoru
rozkładubrzegowego zmiennej losowej Xi w wielowymiarowym
rozkładzie
(3.8). Okazuje
się, że będzieto
także rozkładPólya, jednowymiarowy,
przy czym nie jest to rzecz dana a priori.
Można siętu
posłużyćwynikiem uzyska-
nym w [2], str. 56, lub
też uzyskaćpotrzebny wzór na drodze
następującegorozumo-
wania. Przyjmiemy oznaczenia klas
układówliczb (x
1 , ••• ,xk) podane w§ 1. Mamy
wówczas
Wielowymiarowe
ucięte rozkładydyskretne 87 W
przekształceniach oparliśmy sięna
założeniu(1.3) oraz
wykorzystaliśmywzór (3.5).
Postaćwzoru (4.1) jest
jużdalej
sprawąprostych rachunków.
Z kolei
przystąpimydo
sformułowaniawzoru funkcji
prawdopodobieństwa rozkładuPólya w przypadku
obcięcia wartościz
dołudowolnej (mniejszej lub równej k) liczby zmiennych losowych. Mamy mianowicie
TWIERDZENIE
4.2.
Jeślidana jest funkcja
prawdopodobieństwap(x
1 ,„., xk) k-wymiarowej zmiennej losowej (X
1 , ••. ,Xk) o
rozkładzie,Pólya (3.8) i
wartościt zmiennych losowych (t
~k), np. X
1 , ••• ,Xr
są obciętez lewej strony (z
dołu)o b
1 , ••• ,br
~O z warunkiem b
1+ . . . + b, < n, to funkcja
prawdopodobieństwap* (x
i,„. , xt, x
1+1 ,„. , xk) otrzymanego
rozkładu uciętegodana jest wzorem
t
Ł II (1- L
Piln-(x1+„.+x:),-a]i=l X1=b1+l, ... ,Xc=bt+l i=l
przy czym kreseczka nad x oznacza
obcięcie wartościze
względuna
daną zmienną losową,a suma x
1+
.„+xr przybiera
najmniejszą wartość równąb
1+ „. +b,+t,
a
największą równąn.
D o w ó d. Zgodnie ze wzorem (2.4) twierdzenia 2 dla wyznaczenia wzoru na
funkcję prawdopodobieństwa uciętego rozkładu
Pólya potrzebny jest
rozkładbrzego- wy I-wymiarowego wektora losowego (X
1 , ••• ,Xr) w k-wymiarowym
rozkładzie(3.8).
Rozkład
ten otrzymamy
przeprowadzającsumowanie
wartościfunkcji (3.8) po klasie
Kk+t-t,n-cx1+ ... +xr>.
Otrzymujemy wówczas przy wykorzystaniu wzoru (3.5):
~ L.J (n-(~1 +
Kk+i-t, n-<x1 +·· ·+xt>
t t
nCx1' +„.+xr]
II
p~x,, -a] ( Ł )[n-(X1 +.„+x,), -a]- - - - - 1cn,-a]
i=lX·' · 1-
Pi'
I' i=l I
czyli
88 T. G e r s
te n k o r n
tzn. otrzymany !-wymiarowy
rozkładbrzegowy w k-wymiarowym
rozkładziePólya jest
również rozkłademPólya (!-wymiarowym) (por. ze wzorem (3.8)).
Zapowiedzianąw tezie twierdzenia
postaćwzoru ( 4.2) otrzymuje
się już łatwopo
uwzględnieniuwzoru (2.4). .
Z przedstawionych tutaj
twierdzeń4.1 i 4.2
wynikają łatwo następującewnioski.
WNIOSEK
4.1. Funkcja
prawdopodobieństwa uciętego rozkładuPólya
związanegoz uogólnionym wielowymiarowym schematem losowania Pólya dana jest wzorem
k+l
IT (Npi)[x,,-s]/Xi ! (4.3) p*(xi, ... ,Xj, ... ,xk) = _ _
n _ _ _ _ _ _ _ _ _ _ i=I _L (Npj)Cx1,-s] (N-Npj)[n-x1,-s]
XJ=b+t
xi! (n-xi)!
lub
'(4.4) p*(x1' ... 'Xt, Xt+l' ... 'xk) =
k+l
IT (Npi)[x,, -sl/xi !
i=l
przy czym wzór (4.3) odnosi
siędo
ucięciaze
względuna
wartościjednej ze zmiennych, a wzór ( 4.4) odnosi
siędo
ucięciaze
względuna
wartościwielu zmiennych.
Przedstawione tu wzory
są konsekwencją zależnościa = s/N
łączącejze
so~ąrozkłady
(3.8) i (3. 7).
WNIOSEK
4.2. Funkcja
prawdopodobieństwa uciętego rozkładuwielomianowego dana jest wzorem
k+l
n pf'/xi!
(4.5)
i=1lub
(4.6) p*(x 1, ... , Xr,
Xr+1, ... ,xk) =
k+l i=l
n pf'/xi!
(l-
~ t.)n-(x
1+ ... +xt)t x1 ~p,
~ IT Pi
i=l~ . xi! (n-(x
1+ ... +x,))!
1=b1+1,„„Xt=bt+ 1 1=1
w
zależnościod tego, czy konstrukcja dotyczy
obcięciajednej czy wielu zmiennych
zaznaczonych
kreseczkąnad
odpowiednią zmienną.Uzyskanie tych wzorów jest natych-
Wielowymiarowe
ucięte rozkładydyskretne 89
miastową konsekwencją
wzorów ( 4.1) i ( 4.2) przy podstawieniu a = 0,
4które prowadzi z
rozkładuPólya (3.8) do
rozkładuwielomianowego (3.9).
WNIOSEK
4.3. Funkcja
prawdopodobieństwa uciętegowielowymiarowego
rozkładuhipergeometrycznego dana jest wzorem
(4.7)
lub
(4.8) p*[i 1, ... , :X"
Xt+1, ... , xk) =
k+l i=l
Il (Npiri
1/xi!
t
t
(N-N
LPiyn-(xi+„.+Xt)]2= n (Np~~rx11 ___
i=_l _ _ _ _ _ X1=bi+l,„.,Xt=bt+l l=l .x,. (n-(X1 + „. +x,))!
przy czym
ucięcieze
względuna
jednąlub
więcejzmiennych zaznaczone jest
kreseczką~Wzory (4.7) i (4.8) uzyskuje
sięz (4.3) i (4.4)
mającna
względzie, żepodstawienie s = -1 prowadzi w
rozkładziePólya do
rozkładuhipergeometrycznego, co
zostałowskazane we wzorze (3.10). Warto
również zaznaczyć, żewzory (4.7) i (4.8)
mogąsłużyć również
jako punkt
wyjściadla otrzymania wzorów (4.5) i (4.6),
gdyż,jak
można udowodnić,
przy N--+ oo, k-wymiarowy
rozkładhipergeometryczny jest
zbieżny
do k-wymiarowego
rozkładuwielomianowego.
WNIOSEK
4.4. Funkcja
prawdopodobieństwa uciętegowielowymiarowego
rozkładuPoissona
wyraża sięwzorem
(4.9)
lub (4.10)
Wzór (4.9) dotyczy tak jak w poprzednich przypadkach
ucięciaze
względuna
jedną zmienną,
a wzór (4.10)-
ucięciaze
względuna wiele zmiennych. Wynik ten
jest
konsekwencjątwierdzenia granicznego
przeprowadzającego rozkładwielo-
mianowy w
rozkładPoissona.
Łatwo sprawdzić, żeotrzymane ze wzorów (4.5) i (4.6)
funkcje ( 4.9) i ( 4.1 O)
spełniająwarunek (1.11 ).
90 T. Gerstenkorn Prace cytowane
111 Z. K.
Charzyński,Wielomiany czynnikowe jako pew.-ie uogólnienie
potęgi,Matematyka
1 (130)(1974), str. 47-50.
121 W. Dyczka, On the multidimensional Pólya distribution, Comment. Math. (Prace Mat.) 17 (1973), str. 43-63.
'[31 F. E g gen ber g er, G. P ó I y a, Ober die Statistik verketteter Vorgange, Z. Angew. Math.
Mech. 3 (1923), str. 279-289.
141 T. Ger sten kor n, The multidimensional truncated Pólya distribution, Comment. Math.
(Prace Mat.) 19 (1976), str. 209-230.
{51 M. G. K e n d a 11, A. S t u art, The advanced theory of statistics, Vol. 1, Distribution theory, Griffin, London 1958.
l5a1 M.
:Ke
Hga
JI JI,A. CT
b IOap T,
Teopu11 pacnpeoeAeuuu, lfa,f.{.„Hay1<a", Moc1rna 1966,
przekład