ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA XII (1978)
JERZY K. BAKSALARY
i
RADOSŁAW KALA (Poznań)Estymowalność
liniowych funkcji parametrycznych w jednowymiarowym modelu liniowym
(Praca przyjęta do druku 12.05.1976)
O.
Wstęp.Problem
estymowalnościpojawia
sięprzy opracowywaniu
doświadczeńwówczas, gdy zachodzi
koniecznośćsprawdzenia, czy
interesującebadacza funkcje parametryczne
mająliniowe estymatory
nieobciążone.Na problem ten
należy zwrócić uwagę chociażb)'.dlatego,
żew wielu pracach i programach obliczeniowych jest on obchodzony poprzez
nakładaniena parametry modelu pewnych dodatkowych
związków zapewniających estymowalność
wszystkich funkcji parametrycznych.
Tymczasem
postępowanietakie jest uzasadnione jedynie wtedy, gdy wprowadzane do modelu
związki reprezentują pewną dodatkową wiedzęa priori o jego para- metrach, natomiast stosowanie takiej procedury w sposób mechaniczny, jedynie w celu zapewnienia
estymowalnościwszystkich funkcji parametrycznych,
może prowadzićdo
błędóww interpretacji wyników, na co zwrócili
uwagę międzyinnymi Searle [17], str. 209 i 212, oraz Pringle i Rayner [10], str. 93-98 i 118.
Niniejsza praca zawiera
przeglądkryteriów
estymowalnościliniowych funkcji parametrycznych w jednowymiarowym modelu liniowym wraz z dowodami podanymi w jednolitym
językualgebry macierzy. Dodatkowo, w paragrafie ostatnim, przed- stawiono
próbęoceny
tychżekryteriów z numerycznego punktu widzenia oraz wskazano
istniejącealgorytmy i procedury
użyteczneprzy ich stosowaniu.
W pracy stosowane
są następująceoznaczenia:
./li m,n -
zbiór m x n-wymiarowych macierzy rzeczywistych,
I - macierz jednostkowa (stopnia
wynikającegoz kontekstu), A' - transpozycja macierzy A,
A-
1 - odwrotnośćmacierzy A,
A- -
g-odwrotnośćmacierzy A, tzn. dowolna macierz
spełniającawarunek AA-A= A,
A+ -
odwrotnośćMoore'a-Penrose'a macierzy A, tzn. macierz
spełniającawarunki: AA+ A = A, A+ AA+ = A+, (AA+)' = AA+, (A+ A)' = A+ A, r(A) -
rządmacierzy A,
tr(A)-
śladmacierzy ·A, •
<C(A) -
podprzestrzeń rozpiętana kolumnach macierzy A,
[133]134 J. K. Baks a I ary i R. Ka I a
<tl(A)-
dopełnienieortogonalne (w sensie standardowego iloczynu skalarnego) podprzestrzeni CC(A),
Bł(A)
-
podprzestrzeń rozpiętana wierszach macierzy A.
Ponadto, przy
odwoływaniu siędo
twierdzeńi definicji
używanajest litera T zamiast wyrazu twierdzenie, a litera D zamiast wyrazu definicja.
1. Postawienie problemu.
Rozważanianasze
dotycząmodelu liniowego postaci
y = XĘ+e,gdzie
y E J/t N, 1jest wektorem obserwowanych zmiennych losowych,
XE J/t N,pjest
znaną macierzą
dowolnego
rzędu, Ę E .fi p, 1jest wektorem nieznanych parametrów, a e
E J/t N, 1jest wektorem
błędówlosowych.
Załóżmy początkowo, żeE(e)
=Ooraz D(e) = a
21, gdzie E(e) i D(e)
oznaczająodpowiednio
wartość oczekiwanąi macierz kowariancji wektora losowego e, a
a2jest nieznanym parametrem dodatnim.
Tak
określonymodel
będziemy oznaczaćsymbolem
(1.1) (y,
XĘ,a
21).
Postawmy pytanie, czy wektor parametrów
Ęjest w tym modelu estymowalny, tzn. czy istnieje taka macierz AE
.fi p,N, żedla
każdego ĘE(Ay)
= Ę.Wobec
Żałożeńmodelowych relacja ta jest
równoważna tożsamości (względem Ę) AXĘ=
Ę,a ta z kolei
równościAX =I.
Wynika
stąd, żewektor
Ęjest estymowalny wtedy i tylko wtedy, gdy macierz X ma
odwrotność lewostronną,
na to
zaś(patrz np.
[18],str. 27) potrzeba i wystarcza, aby
byłaona
pełnego rzędukolumnowego. Okazuje
się więc, żew modelu liniowym (1.1), w którym
założenieo
pełności rzędumacierzy X nie jest
spełnione,nie
istniejątakie liniowe funkcje wektora
y,które
byłyby nieobciążonymiestymatorami po- szczególnych
składowychwektora
Ę.Fakt
nieestymowalnościwektora
Ęnie wyklucza jednak estym
owalnościpewnych liniowych funkcji jego
składowych.Najprostszy
przykład stanowiątu funkcje postaci
XĘ,
których
nieobciążonymiestymatorami liniowymi
sąnp. odpowiednie
składowewektora
y. Spostrzeżenieto stanowi
podstawękoncepcji
polegającejna
wyróżnieniuw klasie wszystkich liniowych funkcji parametrycznych podklasy funkcji estymowal- nych, rozumianych zgodnie z
następującą definicją.DEFINICJA
1.1. Liniowe funkcje parametryczne
CĘ,gdzie CE
J/tk,p'nazywamy estymowalnymi w modelu (y,
XĘ,a
21),
jeżeliistnieje taka macierz AE
J/tk,N' żedla
każdego Ę
(1.2) E(Ay)
=CĘ.•
Estymowalność funkcji w modelu liniowym 135
Autorem przedstawionego
podejściado problemu
estymowalnościjest Bose [6].
On
teżjest autorem pierwszego kryterium, które przytaczamy
poniżejjako
TWIERDZENIE 1.1.
Liniowe funkcje parametryczne
CĘ sąestymowalne w modelu (y,
XĘ,cr
21) wtedy
itylko wtedy, gdy
(1.3) •
Bł(C) c Bł(X).D
o w ó d.
Jeżelifunkcje
CĘ sąestym owalne, to na mocy
D1.1 istnieje macierz
A spełniającawarunek
(1.2),który
można napisaćw postaci
AXĘ=
CĘ,jako
żeE(y)
=
XĘ.Wobec
dowolności Ęwynika
stąd równość AX=
C,a z niej relacja (1.3).
Na odwrót, inkluzja (1.3) implikuje istnienie takiej macierzy L,
żeC = LX.
Wtedy dla
każdego ĘE(Ly) =
LXĘ=
CĘ,co na mocy Dl. I dowodzi
estymowalnościfunkcji
CĘ. •W
następnychparagrafach pracy podamy dalsze kryteria
estymowalnościfunkcji parametrycznych, dla celów numerycznych wygodniejsze
niż(1.3), natomiast tutaj poruszymy jeszcze inny aspekt zagadnienia, a mianowicie problem, na ile dotychcza- sowe
rozważania pozostają słusznedla modelu
(1.4)
(y,
XĘ,cr
2V),
w którym
Vjest
dowolną znaną macierzą określonąnieujemnie.
Na
początekkilka uwag o samym modelu.
Jeżeliprzez A oznaczymy dowolny wektor taki,
żeAE <&-L([X: V]), to A.'X = O i A.'V = O, a
stądE(A.'y)
= A.'XĘ = Ooraz
Var(A.'y) = cr
2A.'VA. = O.
Tak
więc,z
prawdopodobieństwem1 (w skrócie: z pr. 1), ")..'y = O, czyli A.
E<c 1.(y).
Wobec
dowolnościA mamy
<&.L([X; V])
c<&-L(y) z
pr.1, a w konsekwencji
<&(y)
c<&([X; V]) z pr. 1.
Warunek
(1.5) Yo E
<&([X:V]),
gdzie
Yooznacza
zaobserwowaną wartośćwektora losowego y, wyprowadzony w podany
wyżejsposób przez Rao [14], a nieco inaczej przez Zyskinda [20], stanowi warunek
niesprzecznościmodelu (1.4).
Oznaczmy teraz przez K
takąmacierz, dla której <&(K) = <cJ-(V). Wówczas K'V
=O, a
stądD(K'y) = 'cr
2K'VK =O.
Tak
więcE(K'y) =
K'y z pr. 1,
136 J. K. B a ks a I ary i R. K a I a skąd,
wobec E(y)
= XĘ,wynika,
żez
prawdopodobieństwem1
(1.6)
K'XĘ= K'y.
Po
zastąpieniuw (1.6) wektora losowego
yjego
zaobserwowaną wartością y0waru- nek ten
wyrażarestrykcje na wektor parametrów
Ę,w naturalny sposób
związanez
osobliwościąmacierzy V.
OznaczającK'Yo przez d
możemyje
napisaćw postaci
(1.7)
K'XĘ= d.
Jest jasne,
żeod restrykcji (1. 7) musimy
wymagać,aby
byłyone niesprzeczne jako
układ równań.Okazuje
się, żewymaganie to ma
ścisły związekz niesprzecz-
nością
modelu (1.4)
wyrażoną relacją(1.5). Podaje go
TWIERDZENIE
1.2. Warunkiem koniecznym i dostatecznym
niesprzecznościmodelu (y,
XĘ,a
2V) jest
niesprzeczność układu równań K'XĘ=
d.Do wód.
Załóżmynajpierw
niesprzecznośćmodelu (1.4). Wtedy na mocy (1.5) d
=K'y
0 ECC([K'X; K'V])
=CC([K'X; O])
=CC(K'X),
co zapewnia
niesprzeczność układu równań(1. 7).
Na odwrót, z
niesprzeczności układu(1.7) wynika istnienie takiego wektora A,
że
d = K'X:A. Lecz, z drugiej strony, d = K'Yo,
więcK'(Yo-X:A)
=O,
co oznacza,
że(y
0-X:A)'E CC-L(K).
Ponieważjednak
CCL(K) = CC(V),
więc(y
0-X:A)
E ECC(V), a zatem istnieje taki wektorµ,
żeYo= X:A+Vµ,
co implikuje
relację(1.5)
wyrażającą niesprzecznośćmodelu (1.4). •
Na gruncie
powyższychuwag o modelu (1.4)
przejdźmydo
rozważeniaw nim problemu
estymowalności.Fakt pojawienia
sięw tym modelu restrykcji (1.7) powo- duje,
iż bezpośrednieprzeniesienie
nańDl.1 nie jest
możliwe. Koniecznąjej modyfi-
kację uwzględnia
DEFINICJA 1.2. Liniowe funkcje parametryczne
CĘ,gdzie
CE .,Hk,p'nazywamy estymowalnymi w modelu (y,
XĘ,a
2V),
jeżeliistnieje taka macierz AE
.,Hk,N' żedla
każdego Ę spełniającego
warunek (1. 7) zachodzi
równość(1.2). •
Zauważmy, że
Dl.1 wynika z definicji
powyższej, jeślibowiem macierz V jest nieosobliwa, to CC.l(V)
={O}.
StądK = O i w konsekwencji wektor parametrów
Ęnie podlega
żadnymrestrykcjom.
Jest
interesujące zapytaćteraz, czy wraz ze
zmianądefinicji ulega zmianie
równieżkryterium
estymowalności wyrażonew Tl.1. Okazuje
się, żenie, przy czym wzmian- ka o
możliwościtakiego uogólnienia tego kryteriµm znajduje
sięw [21], natomiast
prowadzące
do tego wniosku rozumowanie podane jest w [20]. Przytoczymy
j~tutaj w nieco zmodyfikowanej formie jako dowód
następującegotwierdzenia.
TWIERDZENIE
1.3. Liniowe funkcje parametryczne
CĘ sąestymowalne w modelu
(y,
XĘ,a
2V) wtedy i tylko wtedy, gdy
spełnionajest relacja
(1.3).Estymowalność funkcji w modelu liniowym
137 D o w ó d.
Jeżelizachodzi relacja (1.3), to istnieje taka macierz L, dla której C =LX. Wtedy
E(Ly) =
LXĘ =CĘdla
każdego Ę,a
więcw
szczególnościdla
każdego Ę spełniającegowarunek (1. 7), co wobec Dl.2 dowodzi
estymowalnościfunkcji
CĘw modelu (1.4).
Dla dowodu
koniecznościwykorzystamy ogólne
rozwiązanieniesprzecznego
układu równań
liniowych Hx
=g,
wyrażoneprzez Rao (12] w postaci (1.8)
gdzie z jest dowolnym wektorem odpowiedniego wymiaru. Na mocy Dl.2
zakładamyistnienie takiej macierzy A,
żedla
każdego Ę spełniającegowarunek (1. 7) zachodzi
równość
E(Ay) =
CĘ,czyli
AXĘ=
CĘ,a
więc(AX-C)Ę
=O.
Lecz z (1.7) i (1.8) wynika,
że Ęjest postaci
Ę
= (K'X)-d+ {1-(K'X)-K'X} z.
Tak
więcdla
każdegoz musi
zachodzić równość Stąd(AX-C)(K'Xrd+(AX-C){I-(K'X)-K'X}z =o.
(AX-C){I-(K'X)-K'X} =O, co implikuje
inkluzję•
~(AX-C)
c &ł(K'X).Zatem
&ł(C) c &ł(X),a to stanowi
żądaną relację(1.3).
11Niezależność
kryterium (1.3) od postaci macierzy kowariancji wektora
błędówlosowych pozwala nam w dalszym
ciągupracy
formułować równieżwszystkie inne kryteria
estymowalnościdla ogólnego modelu liniowego (1.4), mimo
żew
źródłach,z których je czerpiemy,
sąodnoszone do modelu (1.1).
2. Kryteria
estymowalności wyrażone równościamimacierzy. Rao (12]
wyraziłkryterium
estymowalności wykorzystując pojęcie g-odwrotnościmacierzy. Przy- taczamy je tutaj jako
TWIERDZENIE
2.1. Liniowe funkcje parametryczne
CĘ .rąestymowalne w modelu (y,
XĘ,a
2V)wtedy i tylko wtedy, gdy dla dowolnej
g-odwrotności(X'X)- macierzy X'X
spełnionyjest warunek
(2.1) C(X'X)-X'X = C. •
Bezpośredni
dowód tego twierdzenia pomijamy,
gdyż poniżej wykażemy, żestanowi ono szczególny przypadek kryterium
następnego, sformułowanegoprzez Rao i
Mitrę((15], str. 139).
TWIERDZENIE
2.2. Liniowe funkcje parametryczne
CĘ sąestymowalne w modelu
(y, XĘ,a
2V) wtedy i tylko wtedy, gdy dla dowolnej
g-odwrotności x-macierzy X
spełniony
jest warunek
(2.2) cx-x
=c.
138
J. K. Ba ks a I ary i R. K a I aD o w ó d. Z (2.2) wynika
bezpośrednio, żewiersze macierzy C
sąliniowymi kombinacjami wierszy macierzy X, a zatem (2.2) implikuje (1.3).
Na odwrót,
jeżeli spełnionajest inkluzja (1.3), to istnieje taka macierz L,
żeC
=LX.
Korzystającz definicji
g-odwrotnościotrzymujemy wówczas
cx-x = Lxx-x =LX= c.
Okazuje
się więc, żewarunek (2.2) jest
równoważnyrelacji (1.3), a to na mocy Tl.3 stanowi dowód T2.2. •
Dla uzasadnienia poprzedniej uwagi o wynikaniu T2.
lz T2.2 wystarczy
zauważyć, żedla dowolnej
g-odwrotności(X'X)- macierzy X'X macierz (X'X)-X' jest g-odwrot-
nością
macierzy X. To
zaśjest
prostą konsekwencjąwykazanej przez Rao [13]
równości
X(X'X)-X'X = X.
Nieco inny charakter ma kryterium
estymowalności znajdujące sięw [16], str. 20.
Jest ono
wyrażoneprzez odpowiednio wybrane podmacierze macierzy X i C.
TWIERDZENIE
2.3. Niech P
będzie taką macierząpermutacji,
żew przedstawieniu XP = [X
1 :X2] podmacierz X1
E dl N,r<x>jest
pełnego rzędukolumnowego i niech ponadto CP = [C 1 : C2], gdzie C 1
E .fi k,r<X>.Wówczas liniowe funkcje parametryczne
CĘ są
estymowalne w modelu (y,
XĘ,a2V) wtedy i tylko wtedy, gdy (2.3)
Do wód.
Załóżmynajpierw
estymowalnośćfunkcji
CĘ.Na mocy Tl.3 istnieje wtedy taka macierz L,
żeC =LX, a w konsekwencji CP= LXP. Po
uwzględnieniupodanych w dowodzonym twierdzeniu postaci macierzy CP i XP uzyskujemy
stądC
1= LX
1i C2
=LX
2 •Lecz z
określeniapodmacierzy X
1wynika istnienie takiej macierzy M,
że(2.4) Zatem
C
1
(X~X1
)-1X~X2=
C1
(X~X1)-1X~X1M= C1M = LX1M = LX2 = C2.
Na odwrót,
podstawiającdo (2.3) podmacierz X
2w postaci (2.4), otrzymujemy
(2.5) C
2= C
1M.
Z drugiej strony,
ponieważpodmacierz X
1jest
pełnego rzędukolumnowego,
więc9ł(C1) c: 9ł(X1),
a zatem istnieje taka macierz N,
żeC
1= NX1.
Uwzględniającw (2.5)
tę równośćwraz z (2.4) uzyskujemy
C
2= NX
1M = NX
2 •Tak
więc[C
1 :C
2] =N[X
1 :X2], czyli CP= NXP. Wobec
nieosobliwościmacierzy P wynika
stąd równośćC
=NX,
równoważnarelacji
f!ł(C) c: f!ł(X),która na mocy Tl.3 implikuje
estymowalnośćfunkcji
CĘ.•
3. Kryteria
estymowalności wyrażone równościami rzędówmacierzy. Jako pierwsze
twierdzenie tego typu zacytujemy kryterium podane w [7], str. 2.
Estymowalność funkcji w modeli! liniowym•·
139
TWIERDZENIE
3.1.
Każdyz warunków:
(3.1) oraz (3.2)
jest konieczny
idostateczny na to, by liniowe funkcje parametryczne
CĘ byłyestymo- walne w modelu (y,
XĘ,a
2V).Do wód. Z Tl.3 wiadomo,
żefunkcje
CĘ sąestymowalne wtedy i tylko wtedy, gdy
spełnionyjest warunek (1.3), tzn. gdy
Bł(C) c Bł(X).Dowód pierwszego z po- danych kryteriów
można więc sprowadzićdo stwierdzenia
równoważnościwarunku (3.1) z
tą właśnie relacją,a to wynika wprost z definicji
rzędumacierzy jako maksy- malnej liczby jej liniowo
niezależnychwektorów wierszowych.
Równie prosto
można udowodnićkryterium drugie
zauważając równoważnośćwarunku (3.2) z
relacją Bł(C) c Bł(X'X),która wobec
równości Bł(X'X) = Bł(X)jest na równi z (1.3) warunkiem koniecznym i dostatecznym
estymowalnościfunkcji
CĘ.•
Z numerycznego punktu widzenia bardzo ciekawe jest kryterium
sformułowaneprzez Millikena [9].
TWIERDZENIE
3.2. Liniowe funkcje parametryczne
CĘ,gdzie C jest
macierzą pełnego
rzęduwierszowego,
sąestymowalne w modelu (y,
XĘ,a
2V)wtedy i tylko wtedy„
gdy
(3.3) r{X(l.;_C+C)} = r(X)-r(C). •
Dowód tego twierdzenia pomijamy,
gdyż poniżejzamieszczamy wraz z dowodem
•twierdzenie ogólniejsze, w którym z jednej strony odrzucone jest
założenieo
rzędziemacierzy C, a z drugiej strony,
odwrotnośćMoore'a-Penrose'a c+ macierzy C za-
stąpiona
jest jej
dowolną g-odwrotnościąc-. Ta ogólniejsza
postaćkryterium MilJi- kena
zostałapodana w [4].
TWIERDZENIE
3.3. Liniowe funkcje parametryczne
CĘ sąestymowalne w modelu
(y, XĘ,a
2V) wtedy
itylko wtedy, gdy dla dowolnej
g-odwrotnośd c-macierzy C
(3.4) r{X(1-c-c)} = r(X)-r(C).
Do wód. Przedstawiona tu wersja dowodu wykorzystuje
wyłącznieaparat algebry macierzy i
różni sięistotnie od wersji podanej w [4].
Zauważmy
najpierw,
żena mocy definicji macierzy c- i c+ oraz
własności rzędumacierzy mamy
r{X(1-c-q}
~r{x+x(1-c-q(1-c+q}
=r{x+x(1-c+C)}
~~
r{XX+X(I-C+C)(I-C-q} = r{X(I-c-q}, a zatem
r{X(I-C-C)} = r{X+X(I-C+C)}.
140 J.K. Baksalary i R. Kala
Z drugiej strony,
możliwość użyciaw
równości(2.2) dowolnej
g-odwrotnościma- cierzy X pozwala
wyrazićwarunek konieczny i dostateczny
estymowalnościfunkcji
CĘ
w postaci
(3.5) cx+x = c.
Tak
więcdowód T3.3 sprowadza
siędo pokazania
równoważnościwarunku (3.5) z warunkiem
(3.6) r{X+X(I-C+C)} = r(X)-r(C).
Załóżmy
na
początek, że„ zachodzi
równość(3.5).
Możnawtedy
łatwo sprawdzić, żemacierz x+X(I-c+q jest idempotentna.
Ponieważ rządmacierzy idempotentnej jest równy jej
śladowii
ponieważponadto dla dowolnej macierzy A i dowolnej jej
g-odwrotności
A- (3.7)
więc
r(A) = tr(A - A),
r{X+X(I-C+C)} = tr(X+X)-tr(X+xc+q = tr(X+X)-tr(C+cx+X) =
= tr(X+X)-tr(C+C) = r(X)-r(C).
Pokazaliśmy
zatem,
że(3.5)
pociąga(3.6).
Na odwrót,
załóżmyteraz,
żezachodzi warunek (3.6). Wtedy
oczywiścier(X) ;;?:
;;?: r(C).
Jeżelir(X) = r(C);to na mocy (3.6) x+xc+c = x+x,
a
stąd,wobec relacji (3. 7) i wykorzystanej
już powyżej własności przemiennościiloczynu dwóch macierzy przy operacji obliczania
~ładu,tr{C+C(1-x+x)} = tr(C+C)-tr(x+xc+q ,, =
= tr(C+C)-tr(X+X) = r(C)-r(X) =O.
Wykażemy
obecnie,
że równość(3.8) tr{c+c(1-x+x)} = o
zachodzi
równieżwtedy, gdy r(X) > r(C).
Przekształćmyw tym celu
lewą stronęrelacji (3.6)
wykorzystując symetrięmacierzy x+x i 1-C+c,
idempotentnośćma- cierzy I- c+c oraz fakt,
żedla dowolnej macierzy A
spełnionajest
równośćr(A)
==
r(AA'). Otrzymujemy
r{X+X(J-c+qx+x}
=r(X)-r(C),
a
stąd,wobec twierdzenia z [8], str. 227,
orzekającego, żedla
każdejniezerowej macierzy symetrycznej A zachodzi
nierównośćr(A) ;;?: { tr(A) }2 /tr(A
2),mamy dalej (3.9) r(X)- r(C);;?: [tr{X+X(I-C+qx+X}]2 /tr[{X+X(I-C+C)X+X}
2].Ponieważ
jednak
Estymowalność funkcji w modelu liniowym
oraz
tr[ {x+x(1-c+qx+x}2] = tr[ {x+x(J-C+C)}2],
więc
(3.9)
można napisaćw postaci (3.10)
141
Mianownik szacujemy teraz
stosując następującetwierdzenie z [8], str. 226:
jeżeliA i B
sąmacierzami symetrycznymi jednakowego stopnia, to tr{ (AB}
2 } ~tr(A
2B
2).Uzyskujemy wtedy
tr[{x+x(1-c+C)}2J < tr{(x+x)
2(1-c+q
2 }= tr{x+x(1-c+q}, co pozwala (3.10)
napisaćw postaci
r(X)-r(C)
~tr{X+X(J-C+C)}.
Ponieważ
ponadto
tr{X+X(J-C+C)} = tr(X+X)-tr(x+xc+C) = r(X)-tr(C+cx+x),
więc
zachodzi
nierównośćtr(c+cx;x)
~r(C), na mocy której
tr{C+C(J-X+X)} = r(C)-tr(C+cx+X) <O.
Jednakże
z drugiej strony macierze c+c i 1-X+X, jako symetryczne i idempotentne,
są określone
nieujemnie, a wiadomo (patrz [8], str. 318),
że śladiloczynu dwóch macierzy
określonychnieujemnie jest
liczbą nieujemną.Zatem tr{C+C(J-X+X)}
~~
O, co w
połączeniuz
nierównością poprzedniądaje
równość(3.8). Ta
zaśimpli- kuje
relację(3.11)
jako
że(patrz [8], str. 3
I8)
śladiloczynu dwóch macierzy
określonychnieujemnie jest zerem wtedy i tylko wtedy, gdy iloczyn ten jest
macierzą zerową. Mnożąclewo- stronnie (3.11) przez macierz C otrzymujemy (3.5), co
kończydowód T3.3. •
Zastosowanie relacji (3.7) do
przekształceniawarunku (3.4) zawartego w T3.3 pozwala
wyrazićkryterium
estymowaJnościw postaci
równości śladówmacierzy.
TWIERDZENIE
3.4. Liniowe funkcje parametryczne
CĘ sąestymowalne w modelu
(y, XĘ,a
2V)wtedy i tylko wtedy, gdy dla dowolnych
g-odwrotnościmacierzy
Ci
iX(I-c-q zachodzi
równość(3.12) tr[{X(1-c-c)}-x(1-c-c)] = tr(x-x)-tr(c-q. •
;Analogiczny wynik, tyle
że wyrażony \za
pomocą odwrotnościMoore'a-Penrose'a,
został
podany w [9].
4.
Uwagi końcowe.Zamieszczamy tutaj uwagi
próbujące ocenić przydatnośćprzedstawionych kryteriów
estymowalnościz numerycznego punktu widzenia,
a ponadto wskazujemy procedury
użyteczneprzy ich realizacji maszynowej.
142
J. K. B a ks a I a r y i R. Ka I aZauważmy
najpierw,
żewe wszystkich warunkach
zawierających g-odwrotnościmacierzy,
g-odwrotnościte
są mnożoneprawostronnie przez macierze odwracane.
Ponieważ
dla dowolnej
g-odwrotnościA - macierz A - A stanowi (patrz np. [5], str. 59) operator rzutu na
Ył(A), więckryteria (2.1), (2.2), (3.3), (3.4) oraz (3.12)
mogą zostać wyrażone
w
językutakich
właśnieoperatorów.
Spostrzeżenieto jest istotne,
gdyż umożliwiawykorzystywanie takich procedur, w których nie wyznacza
się
explicite
g-odwrotnościmacierzy A. Algorytm wyznaczania operatora A+ A rzutu ortogonalnego (w sensie standardowego iloczynu skalarnego) jest podany w [11] (patrz
również[9]), a oparta na tym algorytmie procedura algolowska znaj- duje
sięw [l]. Skonstruowany na tej samej zasadzie algorytm (wraz z
odpowiednią procedurą algolowską)wyznaczania operatora
A-A,
rzutującego równi:żna
Ył(A),lecz niekonieczni<? ortogonalnie, jest natomiast zawarty w [2]. Przedstawione w ostat- nio wspomnianej pracy porównanie obu procedur wskazuje,
żemniejszymi
błędami zaokrągleńobarczone
sąrzuty wykonywane za
pomocąoperatora postaci A - A.
Płynie stąd
wniosek,
żewe wszystkich sytuacjach, w których z teoretycznego punktu widzenia
możliwajest rezygnacja z
ortogonalnościrzutowania,
należyze
względównumerycznych
korzystaćz procedury podanej w [2].
Właśniez tego
względu należy przedkładaćkryterium (3.4) nad (3.3) oraz nie
stosowaćrzutów ortogonalnych w kryteriach (2.1) i (2.2).
Z drugiej strony,
porównującwarunki (2.1) i (2.2),
należy pamiętaćo tym,
żedla problemu odwracania macierz X'X nie jest nigdy lepiej, a na
ogółjest gorzej uwarunkowana od macierzy X (patrz [5], str. 241 ). Celem
formułowaniakryteriów
estymowalności
za
pomocąmacierzy X'X jest
dążeniedo zmniejszenia wymiarów macierzy, które w tych kryteriach
występują. Zauważmyjednak,
żew przypadku, gdy X jest
złożonąz zer i jedynek
macierzą układu doświadczalnego,wówczas zmniejszenie wymiarów
można osiągnąć takżepoprzez
usunięciez macierzy X wierszy
powtarzających się,-co uwarunkowania nie pogarsza.
Postępowanietakie uzasadnione jest tym,
żenie zmienia ono przestrzeni
Bł(X),a
więcw konsekwencji nie zmienia
równieżoperatorów rzutu na
Bł(X).Uwaga o gorszym uwarunkowaniu macierzy X'X dotyczy
równieżkryterium (2.3).
Ponieważ
ponadto jego stosowanie wymaga wielokrotnego obliczania iloczynów macierzy,
więcz numerycznego punktu widzenia
należyje
ocenićjako
małoprzy- datne.
Przy
używaniukryteriów zawartych w § 2 pojawia
siędodatkowo zagadnienie numerycznego porównania dwóch macierzy. Jest jasne,
żedaje
sięono
sprowadzićdo porównania
różnicytych macierzy z
macierzą zerową.Wtedy
jednakżepowstaje problem doboru normy,
wedługktórej
zerowośćmacierzy ma
byćoceniona. Nie-
dogodności
tej pozbawione
sąkryteria
wyrażające się równościami rzędówmacierzy, które skomentujemy
poniżej.Nawiązując
do poprzednich uwag o operatorach rzutowania i uwarunkowaniu macierzy
należy ocenićkryterium (3.4)
wyżej niż(3.3), a kryterium (3.1)
wyżej niż(3.2). Trudno jest nam natomiast
porównaćwarunki (3.1) i (3.4)
między sobą.Stosowanie dowolp.ego z nich wymaga w
każdymrazie wyznaczania
rzędówmacierzy.
Estymowalność funkcji w modelu liniowym
143 Przy prowadzeniu
obliczeń możnado tego celu
wykorzystać procedurę podanąw [3],
bądź też,ze
względuna
równość(3.7),
procedurę zawartąw [2], która oblicza operatory rzutu.
Na inny aspekt zagadnienia
należy zwrócić uwagęprzy porównaniu kryterium (3.4) z (2.2). W obydwu
występująoperatory rzutu na przestrzenie wierszy, tyle
że
w kryterium (2.2) na 9l(X), a w kryterium (3.4) na 9l(C).
Ponieważ przeważniemacierz C zawiera mniej wierszy (niekiedy jest tylko wektorem wierszowym)
niżmacierz X,
więcprzy obliczeniach maszynowych operator c-c jest na
ogółwyzna-
czony dokładniej niż operator x-x. ·
Na
zakończenie należy zaznaczyć, żezawarta w tym paragrafie próba oceny
przydatności
poszczególnych kryteriów
estymowalności zostaładokonana w oder- waniu od innych aspektów analizy ogólnego modelu liniowego, a ponadto,
żeocena ta opiera
sięjedynie na wynikach szeregu
obliczeńprzeprowadzonych dla macierzy testowych (patrz [19]) i nie
rościsobie prawa do analizy formalnej.
Prace cytowane
[1] J. Baks a I ary, A. Dobek, R. Ka I a, Wyznaczanie operatorów rzutowania ortogonal- nego, ABS-49, Alg. Biom. Statyst. 5 (1976), str. 187-194.
[2] - - -, Wyznaczanie operatorów rzutowania, ABS-60, ibidem 6 (1977), str. 175-183.
[3] - -, R. Ka I a, Wyznaczanie bazy macierzy, ABS-11, ibidem 2(1873), str. 3-9.
[4] - -, Extensions of Milliken's estimability criterion, Ann. Statist. 4 (1976), w str. 639-641.
[5] A. Be n Is r a e 1, T. N. E. Gr e v i I Ie, Generalized inverses: Theory and applications New York 1974.
[6] R. C. Bose, The fundamental theorem of linear estimation, Proceedings of the Thirty-First Indian Science Congress 4 III (1944), str. 2-3.
[7] M. C. C ha kr a b a r t i, Mathematics of design and analysis of experiments, Bombay 1962.
[8] F. A. Gr a y bi 11, An introduction to matrices with applications in statistics, Belmont 1969.
[9] G. A. Mi 11 i k en, New criteria for estimability for linear models, Ann. Math. Statist.
24 (1971), str. 1588-1594.
[10] R. M. Pr i n g 1 e, A. A. Ray ner, Generalized inverse matrices with applications to statistics, London 1971.
[11] L. D. P y I e, Generalized inverse computations using the gradient projection method, J. Assoc.
Comput. Mach. 11 (1964), str. 422-428.
[12] C. R. Ra o, A note on a generalized inverse of a matrix with applications to problems in math- ematical statistics, J. R. Statist. Soc. B 24 (1962), str. 152-158.
[13] -, Calcu/us of generalized inverses of matrices. Part I - General theory, Sankhya A 29 (1967), str. 317-342.
[14] -, Representations ofbest linear unbiased estimators in the Gauss-Markoffmodel with a singular dispersion matrix, J. Multivariate Anal. 3 (1973), str. 276-292.
[15] -, S. K. M i t r a, Generalized inverse of matrices and its applications, New York 1971.
[16] S. N. Roy, R. Gna n ad esik a n, J. N. Sr i va st-a va, Analysis and design for certain quantitative multiresponse experiments, Oxford 1971.
·[17] S. R. Se a r1 e, Linear models, New York 1971.
[18] M. W ar mus, Uogólnienie odwrotności macierzy, Warszawa 1972.
[19] J. R. West 1 a k e, A Handbook ofnumerical matrix inversion and solution of linear equations, New York 1968.
[20] G. Zysk i n d, Error structures, projections and conditional inverses in /ineat· model theory;
144 J. K. B a k s a I a r y i R. K a I a
w: A survey of statistical design and linear models (J. N . Sr i va st a va, ed.), 647-663„
Amsterdam 1975.
[21] -, F. B. Mart i n, On best linear estimation and a generał Gauss-Markov theorem in linear models with arbitrary nonnegative covariance structure, SIAM J. Appl. Math. 17 (1969)„
str. 1190-1202.
ZAKŁAD METOD MATEMATYCZNYCH I STATYSTYCZNYCH AKADEMII ROLNICZEJ W POZNANIU