W
iesławP
asewic z(Szczecin)
Estymatory kwadratowej funkcji dyskryminacyjnej w przypadku specjalnych struktur macierzy kowariancji
(Praca wpłynęła do Redakcji 1985.03.27)
1. Wstęp. Załóżmy, że w populacji rc,- (i = 1, 2) wektor losowy Zf ma symetryczny rozkład normalny [8], tj. rozkład normalny z zerowym wekto- rem wartości oczekiwanych i macierzą kowariancji postaci
gdzie of jest wspólną wariancją składowych wektora losowego Z,, jest wspólnym współczynnikiem korelacji dla wszystkich par składowych wektora losowego Zh Ipxp jest macierzą jednostkową, a Epxp jest macierzą, której wszystkie elementy są jedynkami. Niech f (z) będzie funkcją gęstości wektora losowego Zf, i = 1, 2. Problem polega na znalezieniu estymatora kwadrato- wej funkcji dyskryminacyjnej postaci
W pracy [7] przedstawiony został estymator bayesowski funkcji f (z) dla i = l,2 . Podstawiając w miejsce nieznanych funkcji (z) i f 2 (z) ich odpo- wiednie estymatory, otrzymamy natychmiast estymator funkcji U (z).
W niniejszej pracy dyskutowany będzie semibayesowski estymator funkcji U (z) oraz estymator klasyczny tej funkcji, w przypadku gdy parametry <x,- i nie są znane.
2. Estymacja semibayesowska kwadratowej funkcji dyskryminacyjnej z symetrycznym rozkładem normalnym. Załóżmy, że Zijk jest k-tą obserwacją,
;-tej cechy z i-tej populacji, gdzie k = 1,..., j = 1,..., p; i = 1, 2. Wpro- wadźmy następujące oznaczenia:
(1)
£« = [(!-& )/ + &£]»
( 2 )
(3) k j
(4) Ar+ ^ = X ( I zl7fc)2 = pNi Sf [1 + (p - 1) r j , a = T zh a + h = ( l zj)2-
j j
( 5 )
Załóżmy dalej ([2], [7]), że łączny rozkład a priori parametrów <rt, pf ma następującą gęstość:
(6) g(ah Qi) oc {<r,(l-p.) [1+ ( p - 1)^,]}"
Niech T(z) będzie semibayesowskim estymatorem kwadratowej funkcji dys- kryminacyjnej U (z). Estymator ten znajdziemy jako wartość oczekiwaną funkcji U (z) [6] posthci
(7) U(z) = -1 , crf I l - p 2 1 1 -b(p— 1) p2 _ p ln—y -f- _ (p 1) ln . -1- _ In -I- 2^ a\ 2'y l - e , 2 l + ( p - l ) e ,
1 1
a — Qi
_<r|(l-p2) (Ti(l-Pi) _(1-P2)[1+(P-1)P2] 0-2 _________Qi_________
( l - P i ) [ l + ( p - l ) P i > i
względem łącznego rozkładu a posteriori parametrów c, i pf [3] dla i = 1, 2 lub (co jest równoważne) jako wartość oczekiwaną funkcji danej wzorem (8) l / W - i t o ? f + i ( p - l ) l n £ + a + b /1
2p \a2
1 \ | ( p - l ) a - b / 1___1 \
ai / 2 p \02 e j
względem łącznego rozkładu a posteriori parametrów a,, 0, (i = 1, 2) określo- nych wzorami [2]
(9) [1 + (p- 1) p j of = a,-, (1 - pi) < t ? = 0,.
Wiadomo [7], że zmienne losowe af, są niezależne, a ich gęstości, tj.
(
10
)1 2 Ni
P(«,\A„ Bi) = (2p)-?w‘- ^ tf i| )
i //V
a? * r , „2
exp 1 4 + M 2p af /
( U )
P{di\Ai, Bi) =
Z r ^ L exp 0?lp 1)JV, + 1E [i(p-l)iV i]
1 ( p - l ) Ą . - ą
2p 0t
dla i = l,2 , są gęstościami uogólnionego rozkładu gamma [5] postaci ( 12 ) /(*) = 0
r(pM exp( —Ax“)
dla x ^ 0
dla x > 0, ap > 0, k > 0.
L
e ma t1. Jeżeli zmienne losowe a f i O i mają uogólnione rozkłady gamma odpowiednio postaci (10) i (11), to istnieją wartości oczekiwane zmiennych losowych Ina,- i ł n przy czym
(13) E (In a,) = ln A^ Bl - js ( ~ oraz
(14) £(lnfl,) = ln(P~ 1)/4'~ 'g |- l/»
2 P dla i
=l,2
=r'(x) T~1 (x)).
Dowód. Znajdźmy najpierw drugą pochodną funkcji charakterystycznej zmiennej losowej Ina, w punkcie zero. Mamy
(P-I)N,- 2
ę(t) = E(ei,lna\
00
(*
aj-‘ P(ai|/li, BjjdcLi o
Aj + BjY 2P ) Stąd
<P"( 0) = 2^ l n d i ± ? i - A n ^
2 P < oo.
Wiadomo [1], [4], że jeśli funkcja charakterystyczna ę(t) zmiennej losowej X ma skończoną pochodną parzystą <p(2°(0), to istnieją momenty rzędów 1, 2 ,..., 21 zmiennej losowej X.
Z powyższego wynika, że istnieje wartość oczekiwana zmiennej losowej Ina,-. Ażeby uzyskać równość (13), wystarczy teraz zauważyć, że £(lna,-)
= < p '(0)/ j .
Podobnie można dowieść, że istnieje £(ln0,) i jest równa prawej stronie równości (14).
L
e m a t2. Jeżeli zmienna losowa X (12), to
( P
(15) £ (2 T 1) = ^ *
l p - 1 ’
ma uogólniony rozkład gamma postaci
gdy a = - 1 i p < 0, gdy a = 1 i p > 0.
Dowód. Zauważmy, że E(X 1) = £(|X l\). Wystarczy zatem wykazać
równość (15).
W przypadku gdy a = — 1 i p < O, mamy
£ ( * - ' > \ xP~2eA ~ i Podobnie można dowieść drugą część tezy.
OKorzystając z lematu 2, otrzymujemy
dx r ( i - p )
xr(-P)
(16) E(ix f1) pNi
Ai + Bi
P A*
oraz
(17) E ie r 1) p(p-l)Ni
{p-\)A i-B i
Z lematu 1 i równości (16) i (17), przy uwzględnieniu związku (4) i związku postaci
(18) { p -\)A i-B i = p{p-\)NiSf{\-ri) wynika bezpośrednio następujące twierdzenie.
T
w ie r d z e n ie1. Dla ustalonej obserwacji z, semibayesowski estymator T(z) ma postać
(19) S22[ l+ ( P - l) r 2]
S ? [ l + ( p - l ) r 1] + - ( p - l ) l n S22( l - r 2) S K l - r J + a + b i 1
+ 2P [ S l[ l+ ( p - l) r 2]
1
Sl l l + ( p - l ) r j + ( p - l ) a - b
2 p
1 S l ( l - r 2)
1
5 f ( l - r 1) + 2pln *2 Ni + K,
gdzie Si, r{ (określone wzorami (3) i (4)) są estymatorami parametrów odpowiednio dla i = 1, 2 oraz
(20) 1 p - 1 i , r i i fi 1
] + 2 \* i to l “a 1
1 __ _ -•A 2(P-l)^2 Wyniki w postaci wzoru (19) uzyskali również autorzy pracy [2]. Ponieważ funkcję daną wzorem (7) można zapisać w postaci (8), więc łatwo dostrzec, że p lim T{z) = U(z). Zatem estymator T(z) jest estymatorem zgodnym
N l t N 2 -*00