ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA XXVII (1986)
S t a n is ła w G n o t Wrocław
Kwadratowa estymacja komponentów wariancyjnych w modelach liniowych
(
Praca wpłynęła do Redakcji 1983.10.04)
0. Wstęp ... 98
1. Model regresji liniowej. Przykłady . . . 99 2. Nieobciążona estymacja komponentów wariancyjnych w modelu
regresji liniowej ... 103 2.1. Formy kwadratowe jako estymatory komponentów warian-
cyjnych. Metody Hendersona estymacji . . . 1 0 3 2.2. Zasada MINQUE ... 105 2.3. Najlepsze estymatory nieobciążone ...108 2.3.1. Ogólny model liniowy • • • • • • • • • • • • • 108 2.3.2. Funkcje estymowalne i ich nieobciążone
estymatory w ogólnym modelu liniowym . . . 109 2.3.3. Funkcje kwadratowo estymowalne w modelu
regresji liniowej... . 1 1 1
2.3.4. Najlepsze estymatory nieobciążone w ogólnym modelu liniowym • • • • • • • • • • • • • • • • 1 1 4 2.3.5. Najlepsze kwadratowe estymatory nieobciążone
komponentów wariancyjnych w modelu regresji liniowej • • • • • • • • • • • • • • • • • • • 1 1 6
2.4. Dopuszczalne estymatory nieobciążone ... . . . 1 2 5 2.4.1. Charakterystyka estymatorów dopuszczalnych
w ogólnym modelu liniowym • • • • • ... .126 2.4.2. Dopuszczalne, kwadratowe estymatory niezmien-
nicze w modelu z dwoma komponentami . . . 1 2 8 3. Obciążona estymacja komponentów wariancyjnych . . . 1 3 4
3.1. Bayesowskie i dopuszczalne estymatory obciążone
w ogólnym modelu liniowym ... • • • 1 3 4 3.2. Bayesowskie i dopuszczalne estymatory kwadratowe
komponentów wariancyjnych w modelu regresji liniowej . 137
3.2.1. Dopuszczalne, niezmiennicze estymatory obcią- żone w modelu z dwoma komponentami . . . 1 3 9 4. Uwagi końcowe • • • • • • • • • . • • • • • • • • • • • • • 1 4 2 5. Prace cytowane • • • • • • • • • • • • • • ... 143
[97]
0. WSTĘP
W niniejszym opracowaniu przedstawiam teorię kwadratowej estymacji komponentów wariancyjnych w modelu regresji liniowej. Problem es- tymacji liniowej wektora wartości oczekiwanej w ogólnym modelu liniowym jest tu przedstawiony fragmentarycznie, w stopniu umo- żliwiającym zastosowanie wyników estymacji liniowej do problemu estymacji kwadratowej. W rozdziale 1 wprowadzam model regresji liniowej i podaję przykłady prowadzące do tego modelu. Rozdział 2 0 nieobciążonej estymacji kwadratowej poświęcony jest w głównej mierze wynikom Seely’ego i Zyskinda oraz ich uogólnieniom. Oma- wiam tam również w wielkim skrócie metody Hendersona estymacji 1 zasadę MINQUE Rao. W rozdziale 3 przedstawiam problem estymacji komponentów wariancyjnych w klasie wszystkich estymatorów kwadra- towych bez ograniczeń do estymatorów nieobciążonych. Jako kryte- rium estymacji przyjmuję kwadratową funkcję straty. Szczególnie wiele miejsca poświęcam estymatorom niezmienniczym względem pew- nej grupy przesunięć. Szeroko omawiam problem bayesowskiej i do- puszczalnej estymacji komponentów wariancyjnych. Szczegółowo roz- ważam model liniowy z dwoma komponentami wariancyjnymi. W modelu tym podaję pełną charakterystykę obciążonych i nieobciążonych estymatorów dopuszczalnych w klasie estymatorów kwadratowych i niezmienniczych.
Literatura na temat estymacji komponentów wariancyjnych jest
bardzo bogata. Szereg interesujących wyników uzyskano zwłaszcza
w ostatnim 15-leciu. Opublikowano również na ten temat kilka prac
przeglądowych (por. dla przykładu Searle [39]# Kłeffe [19] oraz
Rao i Kleffe [38]). Konieczne stało się zatem dokonanie w tyra
opracowaniu pewnego subiektywnego wyboru tematów, z których część
została przedstawiona w wielkim skrócie. Dla czytelników zainte-
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH ... 99
resowanych szczegółami zamieszczam w końcowej części opracowania bogaty spis literatury.
1. MODEL REGRESJI LINIOWEJ. PRZYKŁADY
Przedmiotem moich rozważań jest następujący model liniowy:
(1.1) y = X£> + Z U± £ i# K i *1
gdzie y jest n-wymiarowym wektorem obserwacji, X,U|,U 2 # «••, UK są macierzami znanymi, (?> jest p-wymiarowym wektorem nieznanych parametrów, natomiast <£ ^,§ 2 * nieobserwowanymi wek- torami losowymi, spełniającymi następujące warunki:
E § i = 0,
E § i 5 j = 0 dla i / j,
E ^ f ^ « śfl dla i * 1,2, ..., K.
2 2 2
Nieznane parametry 6 ^, <52, •••, nazywane są komponentami wariancyjnymi modelu (1.1). Z powyższych założeń wynika, że
E y = x p ,
(1.2 K 2 ,
C o v y = Z 6 jvi# Vi = U.u', i = 1,2, ..., K.
Model (1.2), zwany w literaturze modelem regresji liniowej, jest
często stosowany do opisu eksperymentów w różnych dziedzinach nau-
ki, takich jak nauki biologiczne, medyczne czy rolnicze. Oto je-
den z przykładów genetycznych takiego eksperymentu.
PRZYKŁAD 1* Przypuśćmy, że z badanej populacji zwierząt wy- brano losowo s samców, i-temu samcowi przyporządkowano losowo d^
samic, a(i,j)-ta para zwierząt wydała na świat n ^ potomków# Niech y^Ljk będzie wartością zmiennej losowej Y zaobserwowaną na k-tym potomku j-tej samicy i-tego samca# Załóżmy, że na wartość y^jk mają wpływ następujące wielkości:
p- - przeciętna wartość obserwacji, oc^ - efekt reprezentujący i-tego samca,
^ij ~ reprezentujący j-tą samicę i-tego samca, e ^ k - błąd losowy, w skład którego wchodzą błędy pomiaru
i efekty innych niekontrolowanych czynników.
Jeżeli założymy, że poszczególne wielkości oddziaływają na siebie w sposób addytywny, to dla y^jk możemy przyjąć następującą równość:
i = 1*2, ••#, s, yijk * M w i + frij + eijk* J * 1,2f *••• dif
k ~ 1,2, ••#, ^•
0 błędach będziemy zakładać, że są nieskorelowane oraz że wszy-
stkie mają wartość oczekiwaną zero i wspólną wariancję 6 • Powstaje 2
problem, jak traktować efekty oc i ^ , jako wielkości stałe, czy
jako zmienne losowe. Odpowiedź na to pytanie w dużej mierze zale-
ży od tego, czy na podstawie uzyskanych wyników chcemy wnioskować
o potomkach wszystkich osobników w populacji, czy interesuje nas
potomstwo tylko tej szczególnej grupy zwierząt użytej do doświad-
czenia. W pierwszym przypadku przyjmujemy zazwyczaj założenie o
losowości parametrów oc i £ , model ( 1 . 3 ) nazywamy wówczas mode-
lem losowym. W drugim przypadku parametry te traktujemy jako
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH ... 101
stałe, a model (1.3) nazywamy modelem stałym. Model stały jest przykładem modelu (1.2) z jedną komponentą wariancyjną 6 • Model 2 losowy przy założeniu, że varoc^ * nie zależy od i, natomiast var y . . = < 5 ^ nie zależy od i, j jest przykładem modelu ( 1 . 2 ) z
2 2 2
trzema komponentami wariancyjnymi <5^ , 6 6 • Możliwe jest rów- nież rozważanie tzw. modelu mieszanego, w którym tylko jeden z wektorów parametrów oc lub y traktujemy jako losowy. Przedstawimy teraz model (1.3) w postaci macierzowej (1.2). W celu uproszcze- nia zapisu ograniczymy się do tzw. zrównoważonej wersji modelu (1.3), przyjmując, że d^^ ■ d, n ^ » n nie zależą od i,j. Przyj- mijmy następujące oznaczenia:
yi “ Cyi 1 1 *yi 12 » •••• yi 1 n,yi 2 1 *yi 22 yidn) • 1
ei * ^ei 11 *ei 12 # ei 1 n,ei 21 ,ei 22 * •••• eidn^*
, / i /. i i y - (y1:y2 ;••• ;yś) * e » (e^ ; | ; eś ^ * OC = (OC-jfOCg, •••» ) *
F * ^11*^12* ^1d*$21* •••• ^sd^ *
1 - wektor złożony z a jedynek, a
- macierz jednostkowa o wymiarach bxb, A0B - iloczyn Kroneckera macierzy A i B.
Przy tych oznaczeniach równość (1.3) przyjmuje postać
y m 1 sdn^+ <Is ® 1 dnl°c + U s d ® 1n U + «.
Stąd w przypadku modelu stałego Ey « X(3, Cov y = (5 ls(jn# gdzie 2 (?> ■ (jLL | a'; y'),' X * [ 1sdn; (Is® 1dn) i (I sd0 1n) ]. Dla modelu losowego, przy dodatkowych założeniach Ecx> 0, Ey« o, Eocy** 0, Eocer« 0,
ty y
E y e 1* 0 , Eaa'a oraz E ft ^y-^dn* wektQr wartości ocze-
kiwanej i macierz kowariancji wektora y są postaci Ey * 1g(jn^f Cov y . 0$, + 62(V2 ♦ S2! ^ , gdzie V, = Is® 1d/ dn oraz
V2 " *sd®V'n*
W rozważanym przez nas losowym eksperymencie genetycznym kom- 2 2 2
ponenty wariancyjne 6 6 mają specyficzną interpretację.
2 2
Wielkość <5^ + (5 jest kowariancją pomiędzy potomkami mającymi wspólnych rodziców, natomiast 6^ jest kowariancją pomiędzy po- 2
2 2 2
tomkami mającymi wspólnego ojca. Suma + 6 ^ + (5 jest całko-
2 2 2 2
witą wariancją potomków, a iloraz h » + ć ^ + o ) nosi w badaniach genetycznych nazwę współczynnika odziedziczalności.
Szczegóły dotyczące modeli genetycznych tego typu można znaleźć np. w pracach: Henderson [12], Hill i Nicholas [14], Thompson
[44], [45], [46], Gnot [2] oraz Gnot i Kleffe [9]*
PRZYKŁAD 2. W przypadku szczególnym przykładu 1, gdy s =* 1 model ( 1 . 3 ) redukuje się do postaci
Yjk * /•'* & j + ejk* ^ •••* d« ^ ®
i nosi w analizie wariancji nazwę modelu z jednokierunkową klasy- fikacją. Model ten można przedstawić w następującej postaci macie- rzowej:
y = 1N M + U 5 ' + e,
gdzie y = (yii*y12* •••* ydn,/ * e * ^e11*e12* •••* edn.)' * a a
£ c (&i* Iz* •••♦ Ja)1* N * ^ ni oraz u * dia6 {1n 1 • St^d Przy
założeniach z przykładu 1 dotyczących i e otrzymujemy
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH .. 103
E y * ^ j j *
Cov y = (52V + 6 2 In# gdzie V » UUf,
2. NIEOBCI^ŻONA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH W MODELU REGRESJI LINIOWEJ
2.1* Formy kwadratowe jako estymatory komponentów wariancyjnych.
Metody Hendersona estymacji
Pierwsze znaczące wyniki dotyczące estymacji komponentów warian-
O O O
cyjnych (5 G ...# (5* w modelu (1.2) uzyskał Henderson [11].
Zaproponowane przez niego trzy metody estymacji oparte są na na- stępującej podstawowej równości dla macierzy losowej z = yyr:
K
Ez » X(3 p'x 4 + H 6 ?v..
i =*1
W rezultacie wartość oczekiwana dowolnej formy kwadratowej y*Ay jest postaci
(2.1) Ey'Ay = Z K <5 ? + (3'x'AX(ł,
i=1 *
gdzie f^ * tr AV^. Metodyka estymatorów Hendersona jest bardzo prosta i naturalna. Polega ona na wyborze K macierzy A^#A2. ....
Aję spełniających warunki XłA^X = 0 i rozwiązaniu układu równań
Ey*A^y = y A^y* i » 1 » 2 f • ••«
2 2 2
ze względu na komponenty wariancyjne <5^, 6 2, Zauważmy, że Jeżeli X'AX « 0, to Eyy Ay = ż L f. <5? nie zależy od (3 • Trzy
i *1
metody estymacji podane przez Hendersona to w rezultacie trzy sposoby wyboru macierzy A«jfA2, • A^. Szczegółowy opis tych metod wraz z dyskusją można znaleźć w oryginalnej pracy Hender- sona [li] lub w przeglądowej pracy Searle [39]* Tutaj ograniczy- my się do podania estymatorów Hendersona dla modelu z jednokie- runkową klasyfikacją przedstawionego w przykładzie 2 , przyjmując dodatkowo założenie, że model jest zrównoważony, tzn. n. * n nie U zależy od j* Przy tym założeniu Ey = 1dnJi» Cov y = c5 2 Id® 1p1 ^ + + ó 2 Je^eli założymy dodatkowo, że y ma rozkład normalny, to statystykami dostatecznymi wektora 0 » (jj., < 5 ^, <5 j są
y.. - (1/dn) E yik, SSW = E (y-ik~ y 1 ')2.
SSB a n £ (yi - y )2, j
gdzie y.^ = (1/n) 51 y^. Zauważmy, że SSW » y'A^y oraz SSB * Y ^ Y dla A1 ■ Jdn - (1/r)ld® 1 ni; oraz A2-(1/n)Ida 1n1n-(l/dn)ldn1^n.
Ponadto
ESSW * d(n-1)a2, ESSB * (d-1)(ó 2 + n 6 2 ).
Rozwiązując układ równań ESSW * SSW, ESSB * SSB, otrzymujemy
2 2
następujące nieobciążone estymatory dla <5 i 6 ^,
s 2 * L 1/d(n-1)]SSW, a 2 «[ 1/n (d-1) ]SSB - [1/n(n-1)d]SSW,
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH ... 105
Niektóre własności tych estymatorów omówię w punkcie 2.3.6.
W rozważanym powyżej modelu zrównoważonym wybór macierzy A^
2 2
i A 2 do estymacji 6 i 6 ^ jest naturalny i wynika choćby z postaci statystyk dostatecznych przy założeniu normalności roz- kładu wektora y. Dla modeli niezrównoważonych wybór par A^A^,
2 2
na podstawie których chcemy estymować <5 i 6 ^ nie jest jedno- znaczny. Do tego problemu powrócimy przy okazji omawiania estyma- torów dopuszczalnych w modelu regresji liniowej z dwoma komponen- tami wariancyjnymi.
2.2. Zasada MINQUE
Zaproponowana przez C.R. Rao [31]# [33]* [3^]f l35] zasada MINQUE (Minimum Norm Quadratic Unbiased Estimator) uzyskiwania estymatorów
komponentów wariancyjnych w modelu ( 1 . 2 ) oparta jest na czysto algebraicznych przesłankach. Rozważmy funkcję parametryczną
= U Niech W a (W^jw^;... WK;)» gdzie W^ *
i a1 1
WiWi * ^i^i dla Pewnych nieujemnych skalarów oc-j♦ oc2* •••* k k*
Przyjmijmy oznaczenia A - diag n± Óest liczbą kolumn macierzy U^ i » 1,2, ..., K. Formę kwadratową y'Ay nazywamy MINQUE dla f'd , jeżeli A minimizuje normę ||WrAW - A||
w klasie macierzy spełniających warunki
(2.2) AX a 0f
(2.3) tr AVX a f±, i a 1 f2 K.
Uzyskany tą drogą estymator zależy od wektora parametrów oc =
0 ( 2 * •••* °C k)# oraz od wyboru normy || • || . Warunek (2.2) spełniają
macierze, dla których forma kwadratowa yfAy jest niezmiennicza względem przesunięć y 'o wektory z przestrzeni R(X), tzn. y'Ay =
* (y+Xft/ A(y+X(3) dla każdego (3e RP. Większość estymatorów pro- ponowanych w literaturze spełnia ten warunek niezmienniczości
2 2
(por. estymatory Hendersona dla 6 i (5^ z jednokierunkową kla- syfikacją). Wydaje się bowiem naturalne żądanie, aby estymator funkcji komponentów wariancyjnych nie zależał od przesunięcia we- ktora y o wektor leżący w przestrzeni wartości oczekiwanej. Waru- nek ( 2 . 3 ) przy założeniu, że spełniony jest warunek ( 2 . 2 ) gwaran- tuje nieobciążoność estymatora y'Ay dla funkcji f'(5. Warunki ko- nieczne i dostateczne na to, aby y‘Ay był nieobciążonym estymato- rem dla f'c5 są nieco słabsze od (2*2) i (2.3). Wynikają one natych- miast z równości ( 2 . 1 ) i przyjmują postać
[ x ' ax , = 0,
(2.4) [tr AV± » fi§ i * 1,2 K.
Można podać przykłady modeli oraz funkcji, dla których nie istnie- je macierz A spełniająca warunki (2.4). Jeżeli taka macierz istnie- je, to funkcję f'(5 nazywamy kwadratowo estymowalną. Warunki konie- czne i dostateczne na to, aby zadana funkcja f*<5 była kwadratowo estymowalna zostaną podane w punkcie 2.3*3 (twierdzenie 2.4) przy okazji omawiania wyników Seely*ego i Zyskinda.
Rao w następujący sposób uzasadnia swoją metodę estymacji.
Przypuśćmy, że (X 1 ,(X 2 * ...♦CCK są wartościami a priori komponen-
2 2 2 r—
tów wariancyjnych <5^, O 2 » •••t & k * Niech Gdyby rj A były znane, naturalnymi estymatorami 0^ dla i * 1,2, ..., K 2
A 2 <
powinny być wielkości o'\ Q i^ni* na'toin^asi estymatorem
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH ... 107 K
f'cY * P°winno być wyrażenie 17 * A 17 , gdzie ą = ('71* > 72 *
• ••» 7 k )/- Proponowanym estymatorem jest y*Ay = r^W^AW^ (AX = 0).
MINQUE minimalizuje odległość pomiędzy macierzami A i W*AW form kwadratowych 17 *A 17 oraz i^W^AWią, przy odpowiednio dobranej normie, w klasie macierzy spełniających warunki ( 2 . 2 ) i ( 2 . 3 ).
Dla normy euklidesowej przy założeniu, że macierz V » Y. jest dodatnio określona, to minimum osiągnięte jest dla
K
A * YL A . A. , i »1 1 i
gdzie Aa * WyV.jWy, natomiast Wy » V “1 - V“ 1 X(X*V~ 1 X)~X*V “1 » (MVM)+, M » I - X(X*X)~X*. Tutaj dla dowolnej macierzy A symbol A* oznacza macierz uogólnioną odwrotną do A^podczas gdy A+ oznacza macierz od- wrotną Moore^a-Penrose'a. Równość V “1 - V“^X(XIV“, 1 X)“X#V "1 * (MVM)+
jest prawdziwa niezależnie od wyboru macierzy uogólnionej odwrotnej (X*V~ X)" i wynika bezpośrednio z definicji (MVM)+ oraz z równości * Wy =* V ^(I-Py), gdzie Py a X(X'V- 1 X)-X'V “1 jest rzutem na R(X) wzdłuż V[R (X*)] . Wektor A “ (A^,^ 2 * •••* ^ jes"^ dobra- ny, aby spełniony był warunek (2.3). Łatwo sprawdzić, że A jest dowolnym rozwiązaniem układu równań G A » f, gdzie G = [tr Aivj]•
Jeżeli f* o' jest funkcją kwadratowo estymowalną, to układ ten po- siada rozwiązanie. Założenie o dodatniej określoności macierzy V nie jest zbyt dużym ograniczeniem rozważań. W wielu przypadkach (por. przykłady 1 1 2 ), jedna z macierzy jest nieosobliwa, a to już wystarcza, aby macierz V była dodatnio określona, gdy
CXj, > 0 . Zauważmy również, że w miejsce V można podstawić
Vq m V + XX*, ponieważ dla macierzy A spełniającej warunek (2.2)
prawdziwa jest następująca równość tr AVAV * tr AV q AV q . Pewne własności MINQUE omówione są w punkcie 2.3*5*
2.3, Najlepsze estymatory nieobciążone
2.3.1. Ogólny model liniowy. Wiemy z poprzednich rozważań jak estymować komponenty wariancyjne, nie wiemy natomiast dlaczego
tak właśnie należy postępować. Jednolitą teorię estymacji kompo- nentów wariancyjnych wraz z badaniem optymalnych własności propo- nowanych estymatorów zapoczątkowali w latach siedemdziesiątych Seely i Zyskind serią prac opublikowanych w Annals of Statistics (Seely [40j, [41], [42], Seely i Zyskind [43]). Punktem wyjścia dla tych oryginalnych rozważań stanowiło spostrzeżenie, że kwadra- towa estymacja komponentów wariancyjnych i liniowa estymacja war- tości oczekiwanej stanowią ten sam teoretyczny problem. Można go sformułować w następujący sposób. Niech [P * |PQ: 0 € ©} będzie rodziną miar probabilistycznych, określonych na przestrzeni pro- babilistycznej {u,s} i niech z będzie wektorem losowym określonym na U, przyjmującym wartości w pewnej skończenie wymiarowej prze- strzeni liniowej X z iloczynem skalarnym [•,•] • Załóżmy, że dla każdego 0 e ® istnieje wektor wartości oczekiwanej Egz * ju.e • Przyjmijmy oznaczenia J ■ {[a»MeJ: a £ ^) • ^ ■ {[b,z]:
be X}. Zauważmy, że J jest zbiorem funkcji g( 6 ), dla których istnieje nieobciążony estymator w ^ . Funkcje z klasy ^ będzie- my nazywać ^ -estymowalnymi. Problem polega na nieobciążonej estymacji funkcji z klasy ^ w klasie ^ estymatorów liniowych.
W zastosowaniu do estymacji kwadratowej funkcji f*6 w modelu
( 1 . 2 ) element losowy z * yyf jest macierzą losową, przyjmującą
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH ... 109
wartości w przestrzeni liniowej X n macierzy symetrycznych o wy- miarach n x n, z iloczynem skalarnym [AfB] » tr AB. Ponieważ dla dowolnego Ae mamy [A,z] » y*Ay, ^ jest dla tego problemu klasą estymatorów kwadratowych, natomiast jest na mocy wzoru ( 2 . 1 ) zbiorem funkcji postaci
[A,Ez] * p'x'AXp + i. (tr AV±) 6 Jt
i»1
Obecnie dokonam krótkiego przeglądu wyników Seely *ego i Zyskin- da oraz ich uogólnień, wyniki przedstawię w terminach umożliwiają- cych ich zastosowanie do kwadratowej estymacji komponentów warian- cyjnych w modelu (1.2). Rozpocznę od charakterystyki funkcji esty- mowalnych i ich nieobciążonych estymatorów.
2.3.2. Funkcje estymowalne i ich nieobciążone estymatory w ogólnym modelu liniowym. Niech hi będzie skończenie wymiarową przestrzenią liniową z iloczynem skalarnym (•, •) i niech H będzie operatorem liniowym przekształcającym hi w X takim, że £ c R(H), gdzie £ ■ sp [jLlg: 0e©}. Oznaczmy przez H* operator sprzężony z H. Dla każdego s t 0 niech ^ e X będzie wektorem takim, że jxg= H . Przy tych oznaczeniach każda funkcja [a,y. ] może być przedstawiona w następującej postaci*
[a.Me j . [a,H|e] - (H'a.^) .
Niech {£o: 0 £ ®} i niech W będzie operatorem liniowym
o wartościach w przestrzeni X takim, że R(W) + £ x = X •
Tutaj £ X jest ortogonalnym uzupełnieniem t do 1 , Następujące twierdzenie (Seely [4ol ) podaje warunki konieczne i wystarczające na to* aby zadana funkcja g(G)=* (f, £,Q) była funkcją ^ -estymowal- ną.
TWIERDZENIE 2.1. Funkcja parametryczna jest ^ -esty- mowalna wtedy i tylko wtedy, gdy feR(H*W) +
Twierdzenie 2.1 jest bezpośrednią konsekwencją następującego twierdzenia;
TWIERDZENIE 2.2. Warunkiem koniecznym i dostatecznym na to*
aby Cj = {[a, /iQ]: a e ^ c l ) jest* aby J\ + £ 1 = X .
Zauważmy, że jeżeli ę jest wektorem takim, że H Wg = f, to zmienna losowa [W q ,z] jest estymatorem nieobciążonyro dla (f,§Q).
Oczywiście* jeżeli (f*£e) jest funkcją ^ -estymowalną, to taki wektor zawsze istnieje. Jeżeli dodatkowo założymy, że
i ^
5? h c R(H W), to na mocy twierdzenia 2.1 istnienie wektora ę takiego, że H*W ę * f jest warunkiem koniecznym i dostatecznym na to, aby funkcja (f, była ^-estymowalna. Ten fakt przed- stawiam w formie wniosku.
WNIOSEK 2.1. Jeżeli $ 3 ^ R(H*W), to
a) funkcja parametryczna (f#£Q) jest ^ -estymowalna wtedy i tylko wtedy* gdy f e R(H*W),
b) jeżeli jest funkcją 5 -estymowalną, to[Wę,z jest estymatorem nieobciążonym (f»£,0) dla każdego 5
takiego, że H*Wę * f.
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH . 111
2.3*3. Funkcje kwadratowo estymowalne w modelu regresji liniowej. Przedstawię teraz zastosowanie wcześniej zaprezentowa- nych twierdzeń do problemu kwadratowej estymacji komponentów wa- riancyjnych w modelu (1.2). Zauważmy na wstępie, że na mocy wzoru (2.1) każdą funkcję kwadratowo estymowalną [A,Ez] można przedsta- wić w następującej postaci:
[A,Ez] - frj(ir Pj ♦ £ f± S \ = (f, |e).
gdzie 0 * ((i, 0 ), frj są współczynnikami formy kwadratowej P'X'AXp, » tr AV±, |rj(S) = (3r (3j, ^(9) - <s\ oraz
* m Al**12* •••* ^pp*^1'^2* '*** ^ = ^11* ^12* •*** ^pp*
§ 2 * •••• Ż y )* s3 wektorami z przestrzeni Rq, q = K + p(p+ 1 )/ 2 . Ponadto Ez = » E. E,rJ (,G)Brj + E ^ ( 0 ) Vt, £ . sp [t^Tj, ..
r^j i =1
V. K} + |x A X#: A = 6 dzie Br-j = xrxJ + xjx^ oraz
X|fx2f ..., są kolumnami macierzy X. Rozważmy operator H okreś- lony w następujący sposób: H . Kładąc W = H, łatwo spraw- dzić, że założenia wniosku 2.1 są spełnione i z tego wniosku otrzymujemy następujące twierdzenie (Seely [41]):
TWIERDZENIE 2.3. W modelu (1.2)
a) funkcja parametryczna (f*£G) = H + Z fĄ 6 ?
r*j d i 1 1
jest kwadratowo estymowalna wtedy i tylko wtedy, gdy ffeR(H*H),
b) jeżeli (f, ^ ) jest funkcją kwadratowo estymowalną, to forma kwadratowa y*Ay, z macierzą A postaci A = H ^ =
* Tl + Z ?iv£ jest dla każdego (3 spełniają-
cego warunek H*H<^ * f nieobciążonym estymatorem dla
Postać macierzy H*H uzyskamy łatwo z definicji operatora H•
Zauważmy, że H*A » (trB^A, trB^A, • ••, trBppAf trV^A, ..., trVKA)<. Stąd
H*H
trB11B11 trB11B12 *•* trB11Bpp trBi'jvl • trBg-jB^ trB2 1 B12 ... trB21Bpp trB21V1 *
trB B^ trB,Bio ••• trB B trB V. . pp 11 pp 12 pp pp pp 1
t r V ^ tr V 1 B 12 ... tr V 1 Bpp tr .
tr VKB 11 tr VkB 12 ... tr VKBpp tr VRV 1 .
• trB11VK
• trB21VK
• trBppVK
• tr V1VK
• tr VKVK
Twierdzenie 2.3 podaje warunki konieczne i dostateczne kwa- dratowej estymowalności funkcji postaci H f ^ (3r ^ fi^i oraz sposób otrzymywania kwadratowych estymatorów nieobciążonych dla tych funkcji. Jednoczesna estymacja parametrów (3 i 6 Jest z praktycznego punktu widzenia mniej interesująca od estymacji
r- 2
funkcji postaci 2_ f^ 6 ^ zależnej Jedynie od 5 . Oczywiście wa- runki estymowalności podane w twierdzeniu 2.3 dotyczą również tych szczególnych funkcji, ale w tym przypadku można Je nieco zmodyfikować, o czym informuje następujące twierdzenie:
TWIERDZENIE 2.4. Niech P « X(X#X)~X* będzie rzutem ortogonal-
nym na przestrzeń R(X). Wówczas
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH ... 113
a) estymator y*Ay jest nieobciążony dla funkcji 2_ f.* <5j wtedy i tylko wtedy, gdy X#AX » O oraz tr AV^ = f^, 1 i * 1,2, «««, K,
b) funkcja Z f, c, jest kwadratowo estymowalna wtedy
i 1 1
i tylko wtedy, gdy f » (f^,f2, ..., fK)*€ R(G), gdzie G » {trCV^^ - PViPV^)} ,
c) jeżeli y ma rozkład normalny, to funkc ja Z f * 6 ? i i i jest kwadratowo estymowalna wtedy i tylko wtedy, gdy jest estymowalna w klasie wszystkich estymatorów niekoniecznie kwadratowych•
Warunek a) twierdzenia 2.4 jest przedyskutowanym w punkcie 2.2 warunkiem (2.4). Warunek b) był dyskutowany przez Seely*ego [4l], a także przez Rao [31], [33], [34]. Własność c) udowodnił Pincus
[28] • Warto zaznaczyć, że w warunku b) za macierz G możemy przy- jąć {tr gdzie M * I - P.
Twierdzenie 2.4 dotyczy nieobciążonej estymacji funkcji
Z 2
^ w k3-as;*-e wszystkich form kwadratowych. W punkcie 2.2 wspomniałem, że naturalne wydaje się ograniczyć rozważania do klasy estymatorów kwadratowych, niezmienniczych względem grupy przesunięć y —*■ y + X(3 , tzn. rozważać tylko te formy kwadratowe y*Ay, dla których AX * O. Ponieważ AX * 0 implikuje X*AX * 0, więc niezmienniczo estymowalne są jedynie funkcje postaci Z 6 Warunki konieczne i dostateczne kwadratowej i niezmienniczej esty- i mowalności takiej funkcji podane są w punkcie b) twierdzenia 2 . 5 .
TWIERDZENIE 2.5. W modelu (1.2)
a) y*Ay jest nieobciążonym estymatorem niezmienniczym
f'* cT = Z f 4 6 * wtedy i tylko wtedy, gdy AX » O oraz
Ai 1 1
tr AV^ ■ f^, i = 1 , 2 , ..., K;
b) funkcja £*6 jest kwadratowo i niezmienniczo estymo- walna wtedy i tylko wtedy, gdy feR(G), gdzie
G » {tr MV±MVj};
c) jeżeli y ma rozkład normalny, to funkcja f*<5 jest kwadratowo i niezmienniczo estymowalna wtedy i tylko wtedy, gdy jest estymowalna w klasie wszystkich estyma- torów niezmienniczych.
Szczegóły dotyczące kwadratowej i niezmienniczej estymowal- ności można znaleźć w przeglądowych pracach Kleffe [19] oraz Rao i Kleffe [38].
2.3.4. Najlepsze estymatory nieobclążone w ogólnym modelu liniowym. W punkcie 2.3.2 omówiłem problem estymowalności funkcji
parametrycznych oraz podałem charakterystykę ich estymatorów nie- obciążonych. Do tych celów wystarczająca była znajomość postaci wektora wartości oczekiwanej Ji-6. W tym rozdziale zbadam optymalne
własności estymatorów nieobciążonych i tu istotną rolę będzie od- grywać struktura operatora kowariancji Cov0z = L Q . Przyjmijmy oznaczenie 2^ = { : 0 e 0 } • Niech H e /V' będzie ustalo- nym operatorem kowariancji ( Y. = Fg, ) dla pewnej wartości a prio- ri 9 = 0q . Estymator [a,z] będziemy nazywać Y -najlepszym nie- o
obciążonym estymatorem swojej wartości oczekiwanej w klasie g , jeżeli [a, Z a ] ^ [ b, Fb] dla każdego b e “X takiego, że [a, Jie]»
■ [bf ] tożsamościowo względem ©e@ • Estymator [a,z] będziemy
nazywać najlepszym nieobciążonym estymatorem swojej wartości ocze-
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH .. 115
kiwanej w klasie Jeżeli Jest on Z!-najlepszym w klasie g dla każdego Z e l¥ • Następujące podstawowe twierdzenie CLehmann i Scheffe [26]) podaje warunki konieczne i dostateczne na to, aby estymator [a,z ] był Z -najlepszy.
TWIERDZENIE 2.6. Estymator. [afz] jest Z -najlepszym estymato- rem nieobciążonym swojej wartości oczekiwanej w klasie £ wtedy i tylko wtedy, gdy [a, Z e | =0 dla każdego e fe £ ^
tzn. gdy Z a e £
Dla dowolnego podzbioru cA c X niech Z^Cc^)® {a e X tZafecAj*
Z twierdzenia 2.6 wynika, że zbiór wszystkich estymatorów Z -naj-
lepszych jest postaci
(2.5) {[a,z]: ae Z ’1(£)},
Ponieważ Z e 1T jest operatorem nieujemnie określonym, więc
£ ( £ % £ = [o] lub, co jest równoważne, Z (£) + fc 1 » X • Stąd i z twierdzenia 2.2 wynika następujący wniosek;
WNIOSEK 2.2. Dla każdej funkcji ,-estymowalnej i dla każde- go Z € V' istnieje Z -najlepszy estymator nieobciążony w ^ • Jest on określony jednoznacznie wtedy i tylko wte- dy, gdy jV(Ł) n £ 1 = { 0 } *
Zauważmy, że f[a,z]: a € Z 1 jest zbiorem wszystkich
L I e V
estymatorów najlepszych. Z twierdzenia 2.2 wynika, że dla każdej
funkcji ^ -estymowalnej istnieje najlepszy estymator nieobcią-
— 1
żony w C wtedy i tylko wtedy, gdy Z ~ (£) + £"*■ = 3C.
Ze'if
Warunek ten jest trudny do sprawdzenia w konkretnych przypadkach.
Następujące równoważne warunki podaje Drygas [1]•
TWIERDZENIE 2,7, Następujące warunki są równoważne:
a) dla każdej funkcji ^ -estymowalnej istnieje najlepszy nieobciążony estymator w klasie 5 »
b) sp ( Z (6 L) J I e V) n E * {o)j
c) Z ( £ A ) C H q C e 1 ) dla każdego Z e V' i I Q takiego, że R ( E ) c R ( I 0) dla każdego Z € V >
d) Z ( £ )c Z 0(6 ) dla każdego Zielni Z Q takiego, że R(Z ) c R(Z0) dla każdego Zel?" , .
2,3*5, Najlepsze kwadratowe estymatory nieobciążone komponen- tów wariancyjnych w modelu regresji liniowej. W zastosowaniach powyższych wyników do kwadratowej estymacji komponentów warian- cyjnych w modelu (1,2) podstawową sprawą jest określenie struktu- ry operatora kowariancji Z G macierzy losowej z * yy*• Istnienie i postać operatora Z 0 zależy w tym przypadku od istnienia i po- staci czwartych momentów składowych wektora y. Jeżeli y ma rozkład normalny, to dla dowolnych form kwadratowych y;Qy i y*Ry, gdzie Q i R są macierzami symetrycznymi, zachodzi następująca równość:
Cov(y'Qy,y'Ry) * 2tr QV(c)RV(<?) + k ft'x'QVCS ) RX (5
(por. Searle [39]), Wynika stąd następująca postać operatora
kowariancji dla z * yy':
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH ... 117
( 2 . 6 ) 2 { V ( c ) « V ( e O + X(3p'x'» V C6) + V(6)«X(3 0 ' x ' } «
- 2 \ [ V ( c ) + X p ^ j a t V
(O)
+ X p f i V ]-
X p p V f i a X(2>p'x'}.Tutaj dla dowolnych macierzy symetrycznych A,B symbol AsB ozna- cza operator liniowy przekształcający zbiór macierzy symetrycz-
to odnotować, że macierz operatora A aB jest iloczynem Kroneckera A®B. Założenie normalności rozkładu wektora y jest warunkiem wy- starczającym na to, aby operator L Q był postaci (2.6). Warunki konieczne i wystarczające przedstawione zostały w pracy [5]. W dalszej części opracowania przyjmę założenie o postaci ( 2 . 6 ) ope- ratora kowariancji . Podam teraz warunki konieczne i dosta- teczne na to, aby
a) dla ustalonego Z > 0 estymator y/Ay był T -najlepszym estymatorem nieobciążonym funkcji f1 g » Z f^ ^ w klasie estyma- torów kwadratowych i kwadratowych niezmienniczych,
b) każdą funkcja estymowalna miała najlepszy estymator nie- obciążony w klasie estymatorów kwadratowych oraz kwadratowych i niezmienniczych.
W przypadku b) będziemy zakładać, że jedna z macierzy V^,V2,...
•••» jest macierzą jednostkową. Dla ustalenia uwagi przyjmiemy, że VK = I. Wystarczy w zasadzie założyć, że I e £ *• Rozważmy na początek szczególny przypadek modelu (1.2), w któryta X * 0. Wów- czas Ez = V(G), £ = sp[V 1 #V2, VK} oraz Z 0 * V(s)a V(fi).
Niech dla ustalonego (5 * 6 n, u °o * Z będzie operatorem do-
datnio określonym i niech będzie funkcją kwadratowo estymo-
nych w siebie, określony w następujący sposób (AaB)C » ACB. War-
^ -J
wtedy, gdy A » . z twierdzenia 2.6 otrzymujemy następujący wniosek:
WNIOSEK 2.3. Forma kwadratowa y^Ay jest ź. -najlepszym nie- obciążonym estymatorem kwadratowym dla f 4<5 wtedy i tylko wtedy, gdy A « 21 , gdzie A = ( ^2* * • •
• ••» Ak )^ spełnia warunek nieobciążoności G /\ ■ f, G - {tr V ^ V ^ V j ] .
Załóżmy teraz, że * I. Wówczas I ca I e T i R (X) c R(I® I) dla każdego Z e T . Z warunku c) twierdzenia 2.7 wynika, że dla każdej funkcji kwadratowo estymowalnej istnieje najlepszy estyma- tor kwadratowy wtedy i tylko wtedy, gdy dla każdego A,V e 6 speł- niony jest warunek VAV e£ . W szczególności, kładąc A * I, mamy V 2 e t • Przestrzeń liniową £ spełniającą warunek A e ć ^A 2 ę £ Seely [42] nazwał przestrzenią kwadratową. Wykazał on również, że „kwadratowość" przestrzeni £ jest warunkiem dostatecznym na to, aby istniał najlepszy estymator kwadratowy dla każdej funkcji kwadratowo estymowalnej. Ten wynik przedstawiam w formie twierdzenia.
TWIERDZENIE 2.8. Niech VR » I oraz X * 0. Dla każdej funkcji kwadratowo estymowalnej istnieje najlepszy estymator kwa- dratowy wtedy i tylko wtedy, gdy £ * sp
jest podprzestrzenią kwadratową•
Pojęcie przestrzeni kwadratowej zostało powtórnie zbadane
przez Jensena [15]. Jensen udowodnił, że £ jest przestrzenią
kwadratową wtedy i tylko wtedy, gdy jest przestrzenią Jordana.
KWADRATOWA ESTYMACJA KOMPONENTÓW WARIANCYJNYCH .. 119
Rozważmy teraz przypadek ogólny, gdy X jest dowolną macierzą.
Jak wynika z poprzednich rozważań dla ustalonego
oraz Z a Z ((3q, (Sq') forma kwadratowa y*Ay jest Z -najlepszym nieobciążonym estymatorem kwadratowym f *6 wtedy i tylko wtedy, gdy
(2.7) Z (A) e S t *'aX * O, tr AV± * fi# i = 1,2, ..., K.
LaMotte [21] znalazł jawną postać macierzy A, spełniającej warunki ( 2 . 7 ), wykorzystując następujące macierze:
Wy a V “1 - V~ 1 X(X/V“ 1 X)~X,V ~1 = (MVM)+, Hy » X(X/V* 1 X)“X / + X (3 0 p' 0 X/.
Przypominam, że V a V (G q ) > 0. Niech c a Wówczas
* V” 1 X(X'V“ 1 X)"X/V "1 - [ 1/(1+c)]V~1X (i 0 (3qV “1
jest uogólnioną macierzą odwrotną do Hy. Ponieważ XrAX a o, z de- finicji (2.6) operatora Z otrzymujemy
(2.8) Z (A) a 2 (V + X p o £' 0 x')A(V + X^f/^').
Łatwo sprawdzić, że Z (A)H^
a0 oraz
(2.9) WyZ(A)Wy + WyZ(A)Fę + Hy Z(A)Wy =
= (Wy + i ę ) Z ( A ) ( W y + H ^ ) .