(X Wielowymiarowe dyskretne

(1)

ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA XII (1978)

TADEUSZ GERSTENKORN (Łódź)

Wielowymiarowe ucięte rozkłady dyskretne

(Praca

^przyjęta

do druku 20.01.1977)

O.

^Wstęp.

Celem pracy jest przedstawienie metody konstrukcji wielowymiaro- wych dyskretnych

rozkładów uciętych

przy warunkach

najczęściej

spotykanych w zagadnieniach statystycznych i sprecyzowanych

^dokładnie

w paragrafie 1. Zada- niem, które sobie postawiono w tym paragrafie,

było

uzyskanie funkcji prawdo-

podobieństwa rozkładu uciętego

wektora losowego (X

1 , ••. ,

Xk) przy

założeniu, że ucięcie

z

dołu wartości określonej

dowolnie wybranej zmiennej losowej ma miejsce o

dowolną całkowitą liczbę

b

^mniejszą

od n.

Rozważania

przedstawione w paragrafie 2

^dotyczą

przypadku, gdy

^obcięcia

dokonuje

^się

dla dowolnej liczby zmiennych losowych Xi (1

^~i:::;;.

k) z

^dołu

o

^wartości

bi na

ogół różne

dla

^każdej

ze zmien- nych. W efekcie uzyskuje

się funkcję prawdopodobieństwa uciętego

wielowymiaro- wego

rozkładu całkowi

to-liczbowych zmiennych losowych, z których

^każda

przyjmuje

wartości

od O do n, i których suma

^wartości

równa

^się

n.

Ważnym

momentem uzyskanych wyników teoretycznych jest

możliwość

ich zastosowania w praktyce. Temu celowi

^służą

paragrafy 3 i 4. W paragrafie 3 przed- stawiono wielowymiarowy schemat losowania i

^związany

z nim wielowymiarowy

rozkład

Pólya

^dający

opis sytuacji (jednej z

najważniejszych

w zastosowaniach sta- tystycznych)

zdarzeń zależnych

oraz przedstawiono

wynikające

z tej struktury wielowymiarowe przypadki szczególne

najczęściej

spotykane w praktyce, tzn.

schemat

losowań niezależnych (rozkład

wielomianowy) i schemat

^losowań

bez zwrotu

^(rozkład

hipergeometryczny). W opisie schematu Pólya zwrócono

szczególną uwagę

na elementy

^ważne

w zastosowaniach statystycznych.

Paragraf 4 dotyczy konstrukcji

uciętych rozkładów

Pólya. (z

ucięciem

dla jednej i wielu zmiennych) w oparciu o wyniki uzyskane w paragrafie 1 i 2. Problemowi temu

poświęcono również uwagę

w paragrafie 1 pracy autora [4],

jednakże podejście

do zagadnienia w obu przypadkach jest

całkowicie

inne. W pracy [4] konstrukcja

rozkładu uciętego

dotyczy

wyłącznie rozkładu

Pólya (i jego przypadków szczegól- nych), w przedstawionej tutaj pracy

^rozkład

Pólya jest tylko

egzemplifikacją

szerzej zarysowanego problemu.

1. Konstrukcja wielowymiarowego

uciętego rozkładu

dyskretnego z

^obcięciem

dla jednej zmiennej. Rozpatrzmy

łączną k-wymiarową dyskretną zmienną losową

(wektor losowy) (X

1 ,

X

2 , ••• ,

Xk)

taką, że każda

ze

składowych

X

1 ,

X

2 , ••• ,

Xk oraz zmienna

[77)

(2)

78 T. G er s te n ko r n

Xk+i

może przyjmować wartości całkowite

xi (i= J, 2, „., k + l) od O do n przy

spełnieniu ograniczającego

warunku (1.1)

tj. inaczej

mówiąc, wartość

(k+ 1)-szej zmiennej Xk+i jest wyznaczona

zależnością k

(1.2) xk+l =n-

_i=l

Lxi,

co oznacza,

że

do

rozważań

wprowadzamy k zmiennych wolnych. Wygodnie nam przy tym

będzie rozpatrywać

zmienne losowe Xi (i= 1, 2, ... , k+ 1) jako cechy w pewnej populacji statystycznej

pojawiające się

w niej z

prawdopodobieństwem

Pi> O, tak

^że

(1.3) P1+P2+ ··· +Pk+Pk+1 = 1.

Zakładamy

dalej,

że

rozpatrywany wektor losowy (X

1 ,

X

2 , •.• ,

Xk) podlega pewnemu

rozkładowi prawdopodobieństwa

z parametrem () i

^określony

jest

^funkcją

prawdo-

podobieństwa

postaci:

(1.4a)

lub w postaci

uwydatniającej

wprowadzone

założenia:

(1.4) P(X=

^X1,

X2 '= X2, ... , xk = xk;n;p1,P2, .„,Pk; ()) =

= p(x1, X2, ... , xk; n; P1, P2, ···, Pk; 0).

W wielu przypadkach, dla uproszczenia zapisu (1.4),

będziemy posługiwać się

za- pisem krótszym (1.4a):

p(X1, ... , Xk).

Zakładamy, że

zakres

zmienności

jednej ze zmiennych losowych - powiedzmy Xi - zostaje ograniczony z

dołu

o

wartość całkowitą

b > O, tj.

( 1. 5) b + ¹

^~^X^j ^~

^{n .}

Ze

względu

na

przyjęty

przez nas warunek (1.1) lewostronne ograniczenie o b

wartości

zmiennej losowej Xi

^pociąga

za

sobą

prawostronne ograniczenie

wartości

przyjmowanych przez

^pozostałe

zmienne losowe, tj.

( 1. 6) O

~

x

ⁱ^~

n - ( b + ^I) ^dla ⁱ = 1 , 2, ... , j- 1 , j + J , .•• , k + 1.

Przy tak

nałożonych

warunkach na zmienne losowe Xi (i = 1 , 2, ... , k + 1) zachodzi

następujące

twierdzenie.

TWIERDZENIE

1.

^Jeśli

dana jest funkcja

prawdopodobieństwa

(1.4) k-wymiarowej

łącznej

zmiennej losowej (X

1 , ••• ,

Xk)

spełniającej

warunki (1.1) (lub (1.2)) i (1.5), to funkcja

prawdopodobieństwa

k-wymiarowego

rozkładu uciętego

p (x*

1 , •.. ,

xi, ... , xk)

wyraża się

wzorem

(1.7)

(3)

Wielowymiarowe

ucięte rozkłady

dyskretne

gdzie Qj(b) jest tzw. „ogonem"

rozkładu

brzegowego zmiennej Xi, tj.

(1.8) Q/b) = 1-Fj(b),

a Fi(b) jest

wartością

dystrybuanty Fj(xi) zmiennej losowej Xi w punkcie xi = b o war-

tości

mniejszej od 1 (b < n):

b

(1.9) P.(b)

_J

= )

_~

P·(X·)·

_J _J'

Xj=O

użycie

kreseczki nad xi oznacza przy tym,

że ucięcie określone

warunkami (1.5) i (1.6)

nastąpiło

ze

względu

na

wartości

przyjmowane przez

zmienną

Xi.

D o w ó d. Oznaczmy przez Kk+

1, n klasę

wszystkich

^układów

(x

1' ... '

Xk+

1)

k+ 1 liczb

całkowitych spełniających

warunek (1.1) (lub (1.2)), a przez

K~+

1

^{,n klasę}

wszystkich

układów

(x1, ... , xk+i) k+ 1 liczb

całkowitych,

które

spełniają

warunki (1.1), (1.5) i (1.6). Niech

K~~i,n będzie klasą

wszystkich

układów

(x

1 , •.• ,

Xk+i) k+ 1 liczb

oprócz warunku (1.1)

także

warunki

0

^~Xi~

b,

O

~

xi

~

n dla i = 1 , 2, ... , j- 1, j + ^{1 , ... ,} ^k + ^1.

Przy

przyjętej

umowie co do oznaczenia klas, zachodzi dla nich

następująca

relacja:

(1.10)

ponieważ

Wprowadźmy

do

rozważań

jeszcze

klasę

Kk,n-x

₁

wszystkich

układów

(x

1 ,

x

2 , •••

. . . , xi_

^1,

xi+

1 , •.. ,

xk+

1)

k liczb

jeden z warunków

gdzie xi = O, 1, ... , b.

Funkcja

prawdopodobieństwa rozkładu uciętego, którą oznaczyliśmy

przez p (x*

1 , ••• ,

xi, ... , xk), musi

spełniać następujące

warunki:

(1.11) L p(x1, ... , xi, ... , xk)* = 1.

K~+1,n

Uwzględniając

warunek (1.10) otrzymujemy:

(1.12) L ^p(x

1 , ••• ,

xk) = L ^p(x

1 , ..• ,

xk) - L ^p(x

1 , ... ,

xk) =

K~+1,n Kk+l,n K~'+1.n

b

1- L p(x1, ... ,xk) = 1- L L p(x1, ... ,xk) ..

x~'+1.n Xj=O Kk,n-xj

(4)

80 T. G e r s t e n ko r n

Zauważmy, że 2: ^p(X1' ^„.' xk) przedstawia rozkład brzegowy zmiennej xj

w k-wymiarowym

rozkładzie łącznej

zmiennej losowej (Xi, „., Xk), tj.

(l.13) ,L p(xi, ... , xk) = P(Xi = xi) = pixi).

Kk,n-xJ

Po

uwzględnieniu

wzorów (1.12), (l.13), (1.9) i (1.8) otrzymujemy:

b

(1.14) .L p(X1, .„,xk) = 1- _Lpi(xi) = ^1-FJ(b) ⁼ Qj(b).

K~+l.n XJ=O

Funkcję prawdopodobieństwa rozkładu uciętego

otrzymuje

się już bezpośrednio

na podstawie wzorów (1.11) i (1.14), co

kończy

dowód twierdzenia 1.

2. Konstrukcja wielowymiarowego

uciętego rozkładu

dyskretnego z

obcięciem

dla wielu zmiennych. Z kolei rozpatrzymy problem konstrukcji

rozkładu uciętego

wielo - wymiarowej

^łącznej

zmiennej losowej (wektora losowego) (Xi, „., Xk) przy zadanej funkcji

prawdopodobieństwa

(1.4) i przy

założeniu, że ucięciu

podlega zakres zmien-

ności

dowolnej liczby zmiennych losowych. Dla uproszczenia sprawy przyjmujemy,

że

kolejne zmienne Xi , X2, ... , Xi w liczbie t :::::;:; k

^{są ucięte}

z lewej strony (z

dołu),

(w przypadku dowolnego doboru zmiennych

podlegających ucięciu

trzeba by zasto-

sować podwójną numerację wskaźników),

tj.

że

zakres

zmienności każdej

z nich jest ograniczony z

^dołu

przez

^liczbę

bi+ 1

^(bi~

O, i= 1, 2, „., t), tj.

(2.1) bi+ 1 :::::;:; xi :::::;:; n dla i = 1 , 2, „., ^t

przy zachowaniu warunku,

że

(2.2)

Z uwagi na warunek (I.I)

obcięcie wartości

zmiennych losowych Xi przez bi (i=

= 1 , 2, ... , t) z

dołu pociąga

za

sobą

ograniczenie

wartości pozostałych

zmiennych losowych z góry, tzn.

(2.3) 0

<Xi~

n-(b1 +b2 + .„ +bt+t), i= t+ 1, t+2, „., k+ 1.

Przy tak sprecyzowanych warunkach

nałożonych

na zmienne Xi zachodzi

następujące

twierdzenie.

TWIERDZENIE

2.

Jeżeli

dana jest k-wymiarmva zmienna losowa (Xi, ... , Xk) o funkcji

prawdopodobieństwa

(1.4) z warunkiem (1.1), to

zakładając, że

zmienne losowe Xi (i = 1, 2, ... , t) w liczbie t

^~

k

^podlegają

warunkowi

^ucięcia

z lewej strony (z

^dołu)

określonemu

przez (2.1) i (2.2), otrzymujemy dla funkcji

prawdopodobieństwa

p(i1,* „., x,, Xt+ 1, .„, xk) k-wymiarowego

rozkładu uciętego postać wyrażoną

wzo- rem

(2.4)

przy czym

^użycie

kreseczki nad

^wartością

zmiennej losowej oznacza,

^że

rozpatruje

się ucięcie ze ^w!ględu na tę zmienną losową, a Qi, .„,t(b

_{1 ,}

.„, bt) oznacza „ogon"

(5)

Wielowymiarowe

ucięte rozkłady

dyskretne 81

rozkładu

brzegowego wektora (X

1 , ••• ,

Xr) w

zmiennej losowej (X1, ... , Xk), tj.

(2.5)

gdzie F

1

„ .. ,t(b

1 ,

„., ^{bt) jest}

^wartością

dystrybuanty F

1 , ...

,t(x

1 ,

„., Xt) zmiennej loso- wej (X1, „., ^Xr) w punkcie (b

1 ,

.„, ^bk), ^tj.

bi. ····bt

(2.6) F1, ... ,t(b1, „., ^bt) ⁼ L P1, ... ,t(X1, „.,Xr) ·

X1=0, .. „Xc=0

z warunkiem F1, ... ,t(b1, „., ^bt) < 1 z uwagi na (2.2).

Do wód. Niech klasa

Kk+i,n

ma znaczenie jak poprzednio. Przez

klasę K~+i,n rozumieć

teraz

będziemy

zbiór wszystkich

układów

(x

1 ,

„., xk+i) k+ 1 liczb

całko

witych

spełniających

oprócz warunku (1.1) warunki bi + ^{1 ::;;;} xi ::;;; n dla i = 1 , 2, ... , t,

o::;;;xi ::;;; n-(b1+b2+ „. +bt+t) dla i=t+l,t+2,„.,k+l.

Klasę K~~i.n stanowić

teraz

będzie

zbiór wszystkich

^układów

k+ 1 liczb

oprócz warunku (1.1)

następujące

warunki:

0 ::;;;

Xi ::;;; bi

dla i = 1, 2, „. , t,

O < ^xi < ⁿ ^{dla i} =

^t

+ 1 ,

t

+ 2, .. . , k + ^1.

Przez

^klasęKk+i-t,n-(x₁

+ ...

+xc) rozumieć będziemy

zbiór wszystkich

^układów

k + 1- t nieujemnych liczb

jeden z warunków

Xt+ 1 +xt+2 +

^„.

^+xk+r = n-(x

1

+x2 +

^„.

+x,)

przy ustalonej

^wartości

sumy x 1 +x2 +

^.„

^+xt równej O lub 1, „. , lub b

1

+b

2

+ „.

+bt.

Po

uwzględnieniu

zasadniczej

^równości

(1.10)

^następują

kolejne

przekształcenia:

L p(x1,.„,xk) = 1- L ^p(x

^{1 ,}

^{„ .,} ^xk) ⁼

Kt+l,n K~+l,n

Zauważmy, że L ^p(x

1 ,

„., ^xk) przedstawia rozkład brzegowy we-

Kk+1-c, n-(Xi+·„+x1>

ktora losowego (X

1 ,

X

2 , ••• ,

Xt) w k-wymiarowym

zmiennej losowej (X

1 ,

„., ^Xk), tj.

L ^p(x1, ^„., ^xk) ⁼ ^{P1, ...} ^,r(X1, ^„., ^Xr).

Kk+i-t, n-(x1 +"·+x,)

(6)

82

^{T. G}

^{er sten}

^k

^{or n}

Po uwzględnieniu · tego wżoru oraz (2.6) i (2.5) otrzymujemy

bi, .„,br

Lp(X1, ... ^,xk)=l- L P1, ... ,r(X1,„.,Xr)=

K~+l,n X1=0, ... ,Xr=0

= l-F1, .. „r(b1, ... ,br)= Qi .... ,r(h1, ... ,br).

Z

określenia rozkładu uciętego

wynika,

^że

funkcja

prawdopodobieństwa tegoż rozkładu będzie mieć postać

(2.4).

3. Schemat i

rozkład

Pólya. Jednowymiarowy

^rozkład

Pólya oparty na schemacie urnowym podali w r. 1923 F. Eggenberger i G. Pólya [3]. Autorzy ci zaproponowali i dyskutowali

następujący

problem.

Wyobraźmy

sobie,

że

w urnie znajduje

^się

b

^białych

i c czarnych kul; b + ^c = N.

Wyciągamy

w sposób losowy

^kulę

z urny i

^następnie

zwracamy

^ją

do urny oraz wykonujemy

jedną

z

następujących czynności:

1. dodajemy s kul tego samego koloru, co pobrana uprzednio kula;

2. wyjmujemy z urny s kul tego koloru, co pobrana uprzednio kula;

3. nie

^dokładamy

ani nie wyjmujemy kuli.

Umawiamy

^{się, że}

w

każdym

z omówionych przypadków

postępowania będziemy

mówili o dodawaniu s kul, z tym,

^że

w przypadku pierwszym przyjmujemy s > O, w przypadku drugim przyjmujemy s < O, natomiast w przypadku trzecim przyjmu- jemy s =O.

Przypadek trzeci daje tzw. schemat losowania Bernoulliego.

^{Widać, że}

schemat losowania Pólya jest schematem ogólniejszym, schematem (w

ogólności) losowań zależnych, dającym

w

szczególności

dla s = - 1 tzw. schemat hipergeometryczny, czyli schemat losowania bez zwrotu.

Zauważmy, że

w przypadku s < O

należy poczynić założenia:

-ks :s;; b oraz -(n-k)s

^~

c.

Oznaczmy przez X

zmienną losową,

która przybiera

^wartość

k (k = O, l, ... , n), gdy w rezultacie n

ciągnięć

otrzymano k razy

^kulę

np.

^białą.

Funkcja prawdopodo-

bieństwa

zmiennej losowej X

wyraża się

wówczas wzorem (3.1) P(X = k) ⁼ ·(n)-~i~-~!)_(b±2sl_._._J~_+ (k-_!)j_ x

k N(N+s)(N+2s) ... (N+(k-l)s)

c(c+s)(c+2s) ... (c+ (n-k- l)s)

x (N+.ks)(N+(l+·l)s)(N+ (k+2)s) ... (N+ (n-l)s)' gdzie n = 1, 2, „.

Przyjmując

oznaczenia

b c s

N = p, ii= ^q, N= ^a,

wzór (3.1)

można napisać

w sposób

następujący:

(3.2) P(X = ^k) =(n) p(p+a)(p+2a)

^„.

CE.:+ ^(k-1~~1 ^x

k 1(1 +a)(l +2a) ^.„ (I+ (k- I)a)

q(q+a)(q+2a)

^„.

(q+ (n-k- l)a)

X - - - --- -- - -- --- - - -

(l +ka)(l + (k+ l)a)(1+(k+2)a) ... (I+(n-l)a) ·

(7)

Wielowymiarowe

ucięte rozkłady

dyskretne 83

Upraszczając

nieco zapis, wzór (3.2)

można podać następująco:

k-l n-k-l

(3.3) n ^(p+ia) n ^(q+ia)

P(X = k) = (~)

i=O n-1 i=O •

n ^{(I +ia)}

i=O

W

rozważaniach

podanych

niżej posłużymy się wygodną

do

przekształceń formą

zapisu tzw. wielomianów czynnikowych.

DEFINICJA.

Wielomianem czynnik owym stopnia n

względem

x

(uogólnioną potęgą

liczby x) z krokiem a nazywamy wielomian

określony

za

pomocą następującego

wzoru rekurencyjnego (por. [I], str. 47):

(3.4)

X[O,a]

= 1,

X[n,a]

=

X[n-1.a](x-na),

n= 0, 1, „.,

gdzie a jest

dowolną liczbą rzeczywistą.

Na podstawie

związku

(3.4) otrzymujemy xfn,a1 = x(x-a)(x-2a)

„.

(x-(n._ l)a).

Jeżeli

a = O, to wielomian czynnikowy redukuje

się

do

zwykłej potęgi X[n, OJ

= x".

W przypadku a = 1 stosujemy prostszy zapis:

Dla klasy

Kk+t. n układów

(x

1 , ••• ,

xk+

₁₎

takich k+ 1 nieujemnych liczb

całko

witych,

że

x

₁

+ ... ^+xk+

1

= n i dla uogólnionej

potęgi

przy

każdym

a prawdziwy jest wzór:

(3.5)

k+l k+l

( ^~

_~p,^{·)[n,a] -}

_-n. ^'~„ _L n ^p~x,,-a] _{' .}

. i=l Xi·

1=1 Kt+1,n

Wzór ten nazywamy uogólnionym wielomianowym wzorem Newtona lub wzorem Vandermonde'a.

Dowód tego wzoru dla k = 1

znaleźć można

w [1], str. 49, a dla dowolnego naturalnego kw [2], str. 45. Wzór jest bardziej znany dla k = 1 i a = O ([5], str. 64, lub [5a], str. 94).

W oparciu o wzór (3.4)

funk-ej~ prawdopodobieństwa daną

wzorem (3.3)

można przedstawić następująco:

(3.6) P(X = k) = (n)

_k

p~_k·-=-~!J~:~~-~aJ_

_J[n,-a]

'

p>O, p+q=1, k=0,1,2, ... ,n.

Wzór (3.6) jest

konsekwencją rozważań

schematu urnowego, tzn.

określa

prawdo-

podobieństwo

uzyskania k sukcesów przy przeprowadzaniu n

losowań według

wska- zanego schematu.

Prawdopodobieństwo

p pierwszego sukcesu oraz liczba a

są

tu

więc

liczbami wymiernymi z

przedziału

(O, 1). Z drugiej strony, wzór (3.6)

można

(8)

84 T. Ger sten kor n

traktować

jako

propozycję

wprowadzenia do

rozważań rozkładu

dyskretnego o takiej

właśnie

postaci, przy

założeniu, że

p

^będzie

tym razem

dowolną liczbą rzeczywistą

z

przedziału

(O, 1), natomiast a

dowolną liczbą rzeczywistą, spełniającą

podany

niżej

warunek. Dla

powiązania

tego typu

^rozkładu

z problemami praktycznymi

można zaproponować następujący

schemat losowania.

Dokonujemy n

doświadczeń

w ten sposób,

że prawdopodobieństwo

sukcesu zmienia

^się

(ogólnie

^biorąc)

od próby do próby

według następującej

zasady. Niech w pierwszej próbie

prawdopodobieństwo

sukcesu

będzie liczbą

p (O < p < l);

jeśli

w pierwszych I

doświadczeniach

otrzymano m sukcesów i /- m

^porażek~

to

prawdopodobieństwo

sukcesu w (/+ 1)-szym

doświadczeniu określa się

jako równe (p+ma)/(l +la).

Stąd już

wynika,

że prawdopodobieństwo

realizacji k sukcesów w dowolnej

kolejności

w n

doświadczeniach wyraża się

wzorem (3.6).

W przypadku a < O

należy uwzględnić

warunek:

-na~

min(p, q), ogranicza-

jący

zakres

użycia wartości

parametru.

Wyżej

opisany schemat nazwiemy teoretycznym

^(ciągłym)

schematem Pólya dla

odróżnienia

od

zwykłego

(dyskretnego) urnowego schematu Pólya.

^(Użyte

tu te_rminy

„ciągły",

„dyskretny" nie

należy odnosić

do samego

rozkładu ,

który

oczywiście

jest w

^każdym

wypadku tylko dyskretny).

Opisane tu schematy i

^rozkłady

Pólya

można uogólnić

na przypadek wielo- wymiarowy w sposób

następujący. Rozważymy

najpierw przypadek dyskretny.

Niech

będzie

dana N-elementowa populacja, której elementy klasyfikujemy

według

k+ 1 wybranych cech, tzn. przypisujemy do klas Ci, gdzie ⁱ⁼ 1, 2, „., k+ 1, przy

założeniu, że

klasy

są rozłączne.

Niech Npi

będzie liczbą

elementów klasy C.

Wówczas

k+I

L ^Pi ⁼ ^1. ^Z rozważanej populacji pobieramy próbę n-elementową

i=l

według następującego

schematu. Po pobraniu losowym pierwszego elementu zwra- camy go z powrotem i dodajemy (s > O), wyjmujemy (s < O) s elementów tej samej klasy, co element wylosowany lub nie zmieniamy

^składu

populacji (s = O). Proces ten powtarzamy n razy

uzyskując

w efekcie

pewną liczbę

xi (i = 1 , 2, ... , k + ¹⁾

elementów

^każdej

z klas, przy oczywistym warunku: x

1

+x2 + ^„. +xk+t =n.

Wartości

xi

są

realizacjami zmiennych losowych Xi ⁽ⁱ⁼ I, 2, ... , k+ 1), czyli zmiennych losowych o

wartościach

równych liczbie elementów wylosowanych z po- szczególnych klas, przy czym Xk+t =n- L

k

Xi. (Jest to spełnienie warunku (1.2)).

Funkcja

prawdopodobieństwa rozkładu

k-wymiarowej zmiennej losowej (X1, X2, ...

i=l

. „, Xk)

związanej

z przedstawionym (urnowym) schematem losowania dana jest

wzorem

(9)

Wielowymiarowe

ucięte rozkłady

dyskretne 85 W przypadku s < O

zakładamy, że

-ns

~

min(NP1, ... , NPk).

Podany tu

rozkład

(3. 7)

będziemy zapisywać

W postaci

uwypuklającej

wszystkie

występujące

w tym

rozkładzie

parametry, lub krócej w po- staci p(x

1 , ... ,

xk).

Uogólnieniem wzoru (3.7) na przypadek

„ciągły",

tzn. przy

przyjęciu założenia, że

p jest

dowolną liczbą rzeczywistą

z

przedziału

(O; I) oraz

^że

a jest

dowolną liczbą rzeczywistą spełniającą

warunek:

^{-na ~}

min(p

1

,p

2 , ••.

,Pk+i) (warunek ten

^można

opuścić,

gdy a

^~

O), jest wzór na

funkcję prawdopodobieństwa

wielowymiarowego

rozkładu

Pólya postaci (3.8)

gdzie Pi > O (i = 1 , 2, ... , k + 1 ),

k+1

L ^Pi ⁼ 1, a n jest ustaloną liczbą naturalną.

- i=l

Funkcję prawdopodobieństwa

(3.8)

będziemy zapisywać

w postaci

lub

^prościej

p(x1, x2, ... , xk). Pierwszy sposób zapisu jest zwykle stosowany

wówczas~

gdy chodzi o zaznaczenie wszystkich

występujących

w

rozkładzie

parametrów.

Wykorzystamy to w dalszych paragrafach.

Zauważamy, że

rozpatrywany

rozkład

(i jego sposób zapisu) odpowiada warunkom

sformułowanym

w paragrafie 1.

W przypadku, gdy we wzorze (3.8) parametr a przyjmuje

^wartość

zero lub we wzorze (3.7) parametr s = O, otrzymujemy tzw.

^rozkład

wielomianowy w postaci (3.9)

Funkcję prawdopodobieństwa

(3.9)

można również zanotować

symbolicznie przez p(x1, ... ,xk;n;p1, ... ,Pk).

Jeśli

we wzorze (3. 7)

założyć, że

s = - 1, to ze wzoru tego otrzymujemy

^postać

funkcji

prawdopodobieństwa

wielowymiarowego

rozkładu

hipergeometrycznego

n! J]

k+l

(Npi)C:c11 p(x1, X2, ... , xk) = ^N[n~

_i=I ^.I ^'

X,.

(3. 10)

co

można również zapisać

symbolem

p(x1, ... , xk; n; p1, ... ,Pk; N).

Zauważmy, że każda

ze zmiennych losowych Xi (i= 1, 2, ... , k+ 1) wy-

stępujących

w

rozkładach

od (3. 7) do (3.1 O)

może przyjmować dowolną

war-

tość całkowitą

od O do n w taki jednak sposób, by

spełniony był

warunek:

x 1 +x2 + ... +xk+1 =n.

(10)

86 T. Ger sten ko r n

Niektóre problemy

^związane

z

rozkładami

(3. 7) i (3.10)

można znaleźć

w pra- cy [6]. Charakteryzacji

^rozkładów

(3. 7)-(3.10)

poświęcona

jest praca [2].

4. Konstrukcja

uciętego rozkładu

Pólya. Twierdzenia 1 i 2 uzyskane dla klasy wielowymiarowych

rozkładów

dyskretnych

całkowitoliczbowych spełniających

warunek (1.1)

^pozwolą

nam teraz

otrzymać

funkcje

prawdopodobieństwa

wielo- wymiarowych

uciętych rozkładów

Pólya oraz szczególnych przypadków:

^rozkładu

wielomianowego i hipergeometrycznego omówionych w paragrafie 3.

^Rozkład

Pólya dany wzorem (3.7) lub (3.8) stanowi

interesujący przykład rozkładu rozważa

nej przez nas klasy

^rozkładów

dyskretnych.

Konstrukcję

funkcji

prawdopodobieństwa uciętych rozkładów

Pólya przeprowadzimy zarówno w przypadku

^założenia

o

obcię

ciu

^wartości

jednej, jak i wielu zmiennych losowych.

TWIERDZENIE

4.1.

Jeśli

dana jest funkcja

prawdopodobieństwa

p(x

1 , ••• ,

xk) k-wymiarowego

^rozkładu

Pólya (3.8) i

^wartości

jednej ze zmiennych, np. Xi (1 :s;; ^j

^~

^k),

są obcięte

z lewej strony (z

^dołu)

o

^wartość

b

^~O,

to funkcja

prawdopodobieństwa

p(x* _{1, ... ,} xi, ... , ^xk) otrzymanego

rozkładu uciętego

jest dana wzorem (4.1)

Do wód.

^Mając

na

względzie

(l.7) dla uzasadnienia wzoru (4.1)

^należy

jedynie

uzyskać postać

wzoru

^rozkładu

brzegowego zmiennej losowej Xi w wielowymiarowym

rozkładzie

(3.8). Okazuje

się, że będzie

to

także rozkład

Pólya, jednowymiarowy,

przy czym nie jest to rzecz dana a priori.

^{Można się}

tu

posłużyć

wynikiem uzyska-

nym w [2], str. 56, lub

też uzyskać

potrzebny wzór na drodze

następującego

rozumo-

wania. Przyjmiemy oznaczenia klas

^układów

liczb (x

1 , ••• ,

xk) podane w§ 1. Mamy

wówczas

(11)

Wielowymiarowe

ucięte rozkłady

dyskretne 87 W

przekształceniach oparliśmy się

na

^założeniu

(1.3) oraz

wykorzystaliśmy

wzór (3.5).

^Postać

wzoru (4.1) jest

^już

dalej

^sprawą

prostych rachunków.

Z kolei

przystąpimy

do

sformułowania

wzoru funkcji

prawdopodobieństwa rozkładu

Pólya w przypadku

obcięcia wartości

z

^dołu

dowolnej (mniejszej lub równej k) liczby zmiennych losowych. Mamy mianowicie

TWIERDZENIE

4.2.

^Jeśli

dana jest funkcja

prawdopodobieństwa

p(x

1 ,

„., xk) k-wymiarowej zmiennej losowej (X

1 , ••. ,

Xk) o

rozkładzie,

Pólya (3.8) i

^wartości

t zmiennych losowych (t

^~

k), np. X

1 , ••• ,

Xr

są obcięte

z lewej strony (z

^dołu)

o b

1 , ••• ,

br

^~

O z warunkiem b

1

+ . . . + b, < n, to funkcja

prawdopodobieństwa

p* (x

^i,

„. , xt, x

1+_{1 ,}

„. , xk) otrzymanego

rozkładu uciętego

dana jest wzorem

t

Ł II ^(1- ^L

Piln-(x1+„.+x:),-a]

i=l X1=b1+l, ... ,Xc=bt+l i=l

przy czym kreseczka nad x oznacza

obcięcie wartości

ze

^względu

na

daną zmienną losową,

a suma x

1

+

^.„

+xr przybiera

najmniejszą wartość równą

b

1

+ ^„. ^+b,+t,

a

największą równą

n.

D o w ó d. Zgodnie ze wzorem (2.4) twierdzenia 2 dla wyznaczenia wzoru na

funkcję prawdopodobieństwa uciętego rozkładu

Pólya potrzebny jest

^rozkład

brzego- wy I-wymiarowego wektora losowego (X

1 , ••• ,

Xr) w k-wymiarowym

rozkładzie

(3.8).

Rozkład

ten otrzymamy

przeprowadzając

sumowanie

wartości

funkcji (3.8) po klasie

Kk+t-t,n-cx₁+ ... +xr>.

Otrzymujemy wówczas przy wykorzystaniu wzoru (3.5):

~ L.J ^(n-(~1 +

Kk+i-t, n-<x1 +·· ·+xt>

t t

nCx1' +„.+xr]

II

p~x,, -a] ( Ł )[n-(X1 +.„+x,), -a]

- - - - - 1cn,-a]

_i=l

X·' · 1-

Pi

'

I' i=l ^I

czyli

(12)

88 T. G e r s

t

e n k o r n

tzn. otrzymany !-wymiarowy

^rozkład

brzegowy w k-wymiarowym

rozkładzie

Pólya jest

również rozkładem

Pólya (!-wymiarowym) (por. ze wzorem (3.8)).

Zapowiedzianą

w tezie twierdzenia

^postać

wzoru ( 4.2) otrzymuje

się już łatwo

po

uwzględnieniu

wzoru (2.4). .

Z przedstawionych tutaj

^twierdzeń

4.1 i 4.2

wynikają łatwo następujące

wnioski.

WNIOSEK

4.1. Funkcja

prawdopodobieństwa uciętego rozkładu

Pólya

związanego

z uogólnionym wielowymiarowym schematem losowania Pólya dana jest wzorem

k+l

IT (Npi)[x,,-s]/Xi ! (4.3) p(xi, ...* ,Xj, ... ,xk) = _ _

n _ _ _ _ _ _ _ _ _ _ ^i=I _

L (Npj)Cx1,-s] (N-Npj)[n-x1,-s]

XJ=b+t

xi! (n-xi)!

lub

'(4.4) p(x1' ... 'Xt, Xt+l' ...* 'xk) =

k+l

IT (Npi)[x,, -sl/xi !

i=l

przy czym wzór (4.3) odnosi

^się

do

ucięcia

ze

względu

na

^wartości

jednej ze zmiennych, a wzór ( 4.4) odnosi

się

do

^ucięcia

ze

^względu

na

wartości

wielu zmiennych.

Przedstawione tu wzory

są konsekwencją zależności

a = s/N

^łączącej

ze

^so~ą

rozkłady

(3.8) i (3. 7).

WNIOSEK

4.2. Funkcja

prawdopodobieństwa uciętego rozkładu

wielomianowego dana jest wzorem

k+l

n ^pf'/xi!

(4.5)

ⁱ⁼¹

lub

(4.6) p(x* _{1, ... ,} Xr,

Xr+1, ... ,

xk) =

k+l _i=l

n ^pf'/xi!

(l-

^~t

^.)n-(x

¹+ ... +xt)

t x1 ~p,

~ IT ^Pi

^i=l

~ . xi! (n-(x

1

+ ... +x,))!

1=b1+1,„„Xt=bt+ 1 1=1

w

zależności

od tego, czy konstrukcja dotyczy

^obcięcia

jednej czy wielu zmiennych

zaznaczonych

^kreseczką

nad

odpowiednią zmienną.

Uzyskanie tych wzorów jest natych-

(13)

Wielowymiarowe

ucięte rozkłady

dyskretne 89

miastową konsekwencją

wzorów ( 4.1) i ( 4.2) przy podstawieniu a = 0,

⁴

które prowadzi z

^rozkładu

Pólya (3.8) do

rozkładu

wielomianowego (3.9).

WNIOSEK

4.3. Funkcja

prawdopodobieństwa uciętego

wielowymiarowego

^rozkładu

hipergeometrycznego dana jest wzorem

(4.7)

lub

(4.8) p[i* 1, ... , :X"

^Xt+

1, ... , xk) =

k+l _i=l

Il ^(Npiri

¹

^/xi!

t

(N-N

LPiyn-(xi+„.+Xt)]

2= n ^(Np~~rx11 ^___

i=_l _ _ _ _ _ X1=bi+l,„.,Xt=bt+l l=l .

x,. (n-(X1 + ^„. +x,))!

przy czym

ucięcie

ze

względu

na

jedną

lub

więcej

zmiennych zaznaczone jest

kreseczką~

Wzory (4.7) i (4.8) uzyskuje

się

z (4.3) i (4.4)

mając

na

względzie, że

podstawienie s = -1 prowadzi w

rozkładzie

Pólya do

^rozkładu

hipergeometrycznego, co

^zostało

wskazane we wzorze (3.10). Warto

również zaznaczyć, że

wzory (4.7) i (4.8)

^mogą

służyć również

jako punkt

^wyjścia

dla otrzymania wzorów (4.5) i (4.6),

^gdyż,

jak

można udowodnić,

przy N--+ oo, k-wymiarowy

rozkład

hipergeometryczny jest

zbieżny

do k-wymiarowego

rozkładu

wielomianowego.

WNIOSEK

4.4. Funkcja

prawdopodobieństwa uciętego

wielowymiarowego

rozkładu

Poissona

wyraża się

wzorem

(4.9)

lub (4.10)

Wzór (4.9) dotyczy tak jak w poprzednich przypadkach

ucięcia

ze

względu

na

jedną zmienną,

a wzór (4.10)-

ucięcia

ze

^względu

na wiele zmiennych. Wynik ten

jest

konsekwencją

twierdzenia granicznego

przeprowadzającego rozkład

wielo-

mianowy w

^rozkład

Poissona.

Łatwo sprawdzić, że

otrzymane ze wzorów (4.5) i (4.6)

funkcje ( 4.9) i ( 4.1 O)

spełniają

warunek (1.11 ).

(14)

90 T. Gerstenkorn Prace cytowane

111 Z. K.

Charzyński,

Wielomiany czynnikowe jako pew.-ie uogólnienie

^potęgi,

Matematyka

1 (130)

(1974), str. 47-50.

121 W. Dyczka, On the multidimensional Pólya distribution, Comment. Math. (Prace Mat.) 17 (1973), str. 43-63.

'[31 F. E g gen ber g er, G. P ó I y a, Ober die Statistik verketteter Vorgange, Z. Angew. Math.

Mech. 3 (1923), str. 279-289.

141 T. Ger sten kor n, The multidimensional truncated Pólya distribution, Comment. Math.

(Prace Mat.) 19 (1976), str. 209-230.

{51 M. G. K e n d a 11, A. S t u art, The advanced theory of statistics, Vol. 1, Distribution theory, Griffin, London 1958.

l5a1 M.

:K

e

Hg

a

JI JI,

A. CT

b IO

ap T,

Teopu11 pacnpeoeAeuuu, lfa,f.{.

„Hay1<a", Moc1rna 1966,

przekład