Seria I: PRACE MATEMATYCZNE X I (1967) ANNALES SO CI ETAT IS MATHEMATICAE POLONAE Series I: COMMENTATIONES MATHEMATICAE X I (1967)
E. Kącki und W. Krysicki (Łódź)
D ie Parameterschatzung einer Miscłmng
von zwei Laplaceschen Yerteilungen (im allgemeinen Fali)
§ 1. Einfiihmng. Die Homogenitat der Grundgesamtheit ist eines der wichtigsten Merkmale bei jeder statistischen Forschung. Es ist jedoch bekannt, daB man oft unhomogenen Grundgesamtheiten begegnet, die durch Vereinigung von zwei oder mehr Grundgesamtheiten entstanden sind. In diesen Teilgrundgesamtheiten unterliegt oft das zu untersuchende Merkmal einer Wahrscheinlichkeitverteilung von einem bekannten Diehtentypus(i.i) f ( x , a, ft, ...),
jedoch mit verschiedenen Werten von endlichyielen entsprechenden Parametern a , ft, ...
Bezeichnen wir mit Pi (i = 1 , 2 , . . . , Jc) den relativen Anted der г-ten Teilgrundgesamtheit in der ganzen Grundgesamtheit, so kann die Dichte einer Mischung dieser & Teilgrundgesamtheiten durch die Dichte der Form (1.1) und die jeweiligen Parameter a * , i n der Gestalt
к к
(i-2) щ , f t i , ...), wo ^ P i = l , P i > 0 ,
i = 1 г=1
ausgedriickt werden.
Die erste Arbeit fiber die Parameterschatzung einer Mischung wurde schon gegen Ende des vergangenen Jahrhunderts von K. Pearson verof- fentlicht [7]. Sie betraf die Mischung zweier normaler Yerteilungen ini allgemeinen Fall; die Schatzfunktionen der fiinf unbekannten Parameter wurden durch die Methode der Momente ermittelt.
24 E. K ą c k i und W. K r y s i c k i § 2. Probleinstellung. In (1.1) setzen wir
1 l \x — u\ \
(2.1) f { x, Д, /л) = — e x p l--- -—
J,
A >0, OO < X, p < -f- cod.h. die sog. Laplacesche Yerteilungsdichte. Es ist klar, dafi infolge der Symmetrie dieser Yerteilnng in Bezng anf x = p der Mittelwert, die Me dianę und der Modalwert einander gleich und gleieh p sind:
E ( X ) = Me(X) = Mo(X) = p .
Sind in (1.2) nur zwei Summanden vorhanden, so wird die Wahr- scheinlichkeitsdichte soldier Mischung durch die Formel
(2.2) f(x) V 2Яг exp X—p x\ \ Ax ) <1 2Aaexp x —p2 А2 ausgedrtickt, wo Я1> 0,Я2> 0,0 < р < 1, р + д = 1.
Um ein voiles Yerlaufsbild der Funktion (2.2) zu gewinnen, wer- den wir in § 3 die Anzahl und die Art ihrer Modalwerte untersuchen. Wir stellen uns folgende Aufgabe: Aus einer Grundgesamtheit, die eine Mischung in einem unbekannten Yerhaltnis von zwei Teilgrundgesamthei- ten ist und in der das untersuchende Merkmal X einer Yerteilung von der Dichte (2.2) unterliegt, nimmt man eine sogenannte einfache Stich- probe aus n Elementen.
Es seien
(2.3) x x, x 2, ..., x^
die Werte von X in n aufeinanderfolgenden Elementen der Stichprobe. Auf Grund der Ergebnisse (2.3) sind die Schatzfunktionen der unbekann ten Parameter Xx, p x, Я2, p 2, p zu bestimmen. In dem allgemeinen Fall haben wir also ftinf Parameter zu schatzen.
Gewisse Spezialfalle dieser Aufgabe sind schon bearbeitet worden; und zwar in [3] folgende Falle: (1) Schatzung von vier Parametern
p x = P% = Pi Vi h i A2; (2) Schatzung von drei Parametern p, Ях, l2 bei gegebenen p x = p2 = p\ (3) Schatzung von drei Parametern p , p^, p2 bei gegebenen Ях = 12 = X > 0, wahrend die in [5] untersuchten Falle sind: (1) Schatzung von drei Parametern Ях,Я2, р bei p x = p2 — 0 und (2) Schatzung der Parameter Ях, 12 bei gegebenen p. In § 4 wird die all- gemeine Losung des Problems der Schatzung von ftinf Parametern an- gegeben.
§ 3. Bedingungen, unter welchen eine Mischung von zwei Laplace- schen Verteilungen eingipflig oder zweigipflig ist.
Satz 1. Wenn p x = p2= so ist f u r einen beliebigen Wert p ,
0 < p < 1, und fiir beliebige Xx > 0, A2 > 0 die Verteilung (2.2) eingipflicb
(3.1)
Der Satz folgt direkt ans der Gestalt der Formel (2.2) in diesem Fali. Betrachten wir nnn den Fali p x Ф p 2, z.В. p x < p 2.
Satz 2. 1st fu r р г < p2 die Bedingung
%
^ ^^
--- < p < ---o , -i2 /^2 l11 ,2 i i2 _ P1 P2 X\ + A|exp — ^---- Xx+ A2exp —
----A2 Ax
erfullt, so ist die Verteilung (2.2) zweigipflig und Hire Modalwerte sind
Mox = p x, Mo2 = fi2.
B ew eis. Wir berechnen die Ableitung der Funktion (2.2) in dem Interval! p x < x < [x2 (3.2) Wir setzen f i x ) = P 2Xl exp fix —x 1 —p expX p 2 X2
(3.3) p exp —-— = cpx И , fix—x - я т г exp — — - <p1—p x —fi2 2 (x ) .
A A^ A^ AiA<i A 2
Dann erhalten wir wegen (3.2) und (3.3) fur p x < x < P2i f ( x ) = (P2(X) —
— (pxix ) und aus (3.3) schlieben wir das in dem Intervall {px, P2) <P2(X)
eine wachsende und <рг (x) eine abnehmende Funktion ist. Zugleich haben wir wegen (3.1)
f'(fii~\-0) —
und aus demselben Grund
f ( p 2-O ) = 1—p fix fi2 P 2A5 exp —X2 2X1 - - P p exp Px p 2 2A2 2X\ X,1 < 0 > 0 .
Wir haben also bewiesen, dab bei der Yoraussetzung (3.1) die Funktion (3.2) in dem Intervall (px, p 2) zunimmt, ihr rechtsseitiger Grenzwert in px negativ, der linksseitige Grenzwert in p 2 aber positiv ist, und daraus folgt schon, dab die Ableitung f' (x) in genau einem Punkt dieses Inter v als verschwindet. Gerade dort erreicht die Funktion f(x) ihr Minimum. Da tiberdies fur — 00 < x < p x gilt
p x —px
xp und fur p2 < x < + 0 0 gilt
f (x ) = exP f ' ( x ) - P XX Px—X q x ~ P 2 ^ n —^ exp —-— > 0 2X1 F X2 ^2 ^ 0 exp —— - — —фг exp —---- < 0, 2X1 Xx 2X1 X2 ’
26 E. K ą c k i und W. K r y s i c k i
(3.4)
AnschlieBend beweisen wir
Satz 3. 1st filr p x < p2 die Bedingung
a; o < p <
Al+/l2eXPk 2 i^l
erfiillt, so ist die Verteilung (2.2) eingipflig und ikr Modalwert ist p 2. B ew eis. Da f'(x) > O fitr jedes ж е ( - c » ,^ ) und f ( x ) < O fiir jedes
x e( p2, + °°)> so geniigt es zu beweisen, daB f ' { x ) > 0 im Intervall {[a-l, Ръ). Aus der Voraussetzung (3.4) schlieBen wir, daB
V 1 —P t*l~t*2
~TAj 2 < A2 eXP ----j---- -Ag und daher gilt auf Grund von (3.2) fur ж е(^ ,/«2)
P p x—x l —p P i ~ p2 V ■> Г "1 / ' ( » ) > - — у exp —---1 — f - exp Л А о их —х\ > ^ ( 1- ехр^ г 1 > 0 Aj 2А2 Я2
was den Beweis schlieBt.
ISun gehen wir zu dem letzten Satz dieses Abscłmitts iiber.
Satz 4. 1st fiir р г < p2 die Bedingung a;
(3.5)
/li+A2exPPi p 2
< p < 1
erfiillt, so ist die Verteilung (2.2) eingipflig mit dem Modalwert p i .
B ew eis. Da f { x ) > 0 fiir xe( — 00, p x) und f ( x ) < 0 fiir x e( p2, -f 00), so geniigt es zu beweisen, daB f'{x) < 0 in {pt , p 2). Es folgt aus der Vor aussetzung (3.5), daB
l —p <
fi i eX
P
A,und deswegen haben wir auf Grund von (3.3) fiir х е { рг, p 2)
P p i—p 2 1—V X — Uo 1
2Я[
Pi p 2
f {x) < — exp '-V -^ +
Я1 2A2 Damit ist der Beweis zu Ende.
p x p2
2— exP —1— < 2A
p I x p2 exp— —
Ап
i < o.
§ 4. Losung des Problems. Zur Losung des Problems verwenden wir die Methode der Momente. Auf Grund der aus der Sticłiprobe (2.3) ge- wonnenen Ergebnisse berechnen wir die fiinf aufeinanderfolgenden Aull- momente
mk
= —
- V
x \, n -k—iг= 1
Dann benutzen wir die in [2] abgeleiteten Formeln ftir die Nullmomente einer Laplaceschen Verteilung (2.1)
= m2 = 2!^A2+ - ^ j p 2j, m3 = 3! +
(4.2)
m4 = Щ = 5 ! ^ V + ^ ^ V + - ^ 5j. Nachher driicken wir die Nullmomente der Mischung (2.2) durch die Nullmomente (4.2) aus, die einmal fur die Parameter /их, Ax und dann nochmals fur die Parameter /u2, A2 berechnet wurden.
Bezeichnen wir nun die Schatzfunktionen der ftinf unbekannten Pa rameter p , A4, ju1, A2, ju2, die mit Hilfe der Momente (4.1) aus der Stich- probe (2.3)gewonnen wurden, entsprechend mit p , Ax, Л2, p 2, so erhalten
wir folgendes System von ftinf algebraischen Gleichungen
№ + ( l - p )^2 = m 'i, 2\ p\A\ 2!Pi +2!(1- P ) U2+ —
(*“+
2F ’)
m.2 1 (4.3) 3! p [X\pxĄ- — + З Ц 1 — V) |^2/G + ^7^2 4! p + — l\p\ + — +4! (1 — p)^A\ + %2pt + — m3> m.4 j 5! р \ А \ р х-{- — + “gyA ij + 5 ! ( 1 — p ) [ X \p 2-\- — ^ / 4 + ^ту^г) — m s-Dieses System ist nicht bequem losbar. Es nimmt eine einfachere Form an, wenn wir den Ursprung zum Punkt m[ verschieben und die Bechnun- gen nicht ftir die Veranderliche X sondern ftir die Veranderliche Z = X —m[ durchftihren. Dann—wie es leicht einzusehen is t—andern sich die Para meter Ax, X2 nicht, wahrend die Parameter p x, /л2 als Mittelwerte derTeilgrundgesamtheiten folgende Werte annehmen:
(4.4) fi[ = p x—m[, p2 = p 2—m[
und die Nullmomente mk, ~k = 1,2, . . . , 5 in die Ilauptmomente aus der Stichprobe M k tibergehen:
П
M k = — \ { X i —m[)k n J—t
i = l
28 E. K ą c k i und W. K r y s i c k i
hJach der Durchfuhrung dieser Anderungen wird das System (4.3) in das folgende hbergehen
=
o,
2 'p |^ i+ — i“i2j +2! (1 — — /b2j — №21
5) 3! p |li/b + ia13j + 3 ! ( l — ^y/b3j — ^ 3?
4 ’• P |^ i+ — ^i/“i2+ -^y/h4j + 4!(1 ~~^)|^2+ ^y^2^22+ yy/b4j = ^ 4’ 5 ! P 1^1^!+ — — /Ь^ + 5 ! (1 — p)(%tp2 + ^y^2i“23+ "^y/^25^ = -^5-Zuerst bemerken wir, daB ans der Yoraussetzung 0 < p < 1, О Ф p[
Ф ju'2 Ф 0 folgt. Ans der ersten Gleichung des Systems (4.5) bestimmen
wir p:
(4.6) P A / У2A , «
№2 /b
Dann setzen wir das so bestimmte p in die zweite und dritte Gleichung des Systems (4.5) nnd wir erhalten zwei Gleichungen
2/M2^1 2piA2 — (/Wg /h) ( Hi №2) 1
^>P'l[^2^2 ~ (/b У1) ( Af3 —G/^1/^2 + /h №2)
ans denen wir Д* und Ag ais Funktionen yon p[ nnd ^ ermitteln:
(4.7)
^ 2+ / г1^2 -^3+^1/“2 (/“1+ ^2)
- ^
АГ2А ^1^2 -lI^ + ^/^g^i+jMg) 2
AnschlieBend fiihren wir in (4.7) und dann in die vierte nnd fiinfte Glei chung des Systems (4.5) die Hilfsunbekannten
(4.8) x = P1+P2, У = fi'iK
ein. Nach Beriicksichtigung von (4.7) in den letzten zwei Gleichungen in (4.5) erhalten wir folgende zwei Gleichungen mit den Unbekannten х, у :
сс2у 2фЗу3ф 2 М 3х у ф 1 8 М 2у 2фЗ(6М22- М ^ у - 2 М 1 = О,
(4.9)
- х 3у 2ф4:2ху3—20Ш3х 2у-\-60М2ху2ф100М3у
Die Elimination von x aus (4.9) ergibt folgende Gleichung neunten Grades mit einer Unbekannten у :
(4.10) (i5ysĄ 7 S M ^ + A y + U M l f { 3 y 3+ l S M 2y2+ A y 2 M l )
-- 2 3 1 ^ 4 5 / + 78M2y2+ A y +ИМ 1)( 1ММ г/ + В у 2 + Су -- 3 6 Ml) + + ( l M M 3y3+ B t / + O y ~ 3 6 M l f = О
wobei
А = 3 (6Ml —М^), В = 444Ж2Ж3- Ж 5, С = 54Ж3(6Ж2- Ж 4) . Interessant kann hier die Bemerknng sein, dab auch Pearson anlablich des in der Einftihrung besprochenen .Problems eine Gleichung neunten Grades erhielt.
Nach Ermittlnng der reellen Wurzeln der Gleichung (4.10) (wenig- stens eine reelle Wurzel existiert sicherlich), berechnen wir die entspre- chenden Werte der Unbekannten x nach der Formel
—1543/ 3ys — By2—Cy + 3 6 Ж 3
X 45?/4 + 78Ж2у3+ А у 2+14ЖзУ *
Dann erhalten wir aus (4.8) die Gleichung y '2 — xy' Ą-y — 0. Wir lassen diejenigen Wnrzeln weg, fiir welche die Bedingung x 2—4y > 0 nicht erftillt ist. Wegen (3.1) und (4.4) scheint es naturgemab anzunehmen
л, X—Vx2—4: у л, X-\-\/x2—4: у
Nun berechnen wir p mittels (4.6), X\ und A2 mittels (4.7) und schheblich
y[, y 2 mittels (4.4).
Selbstverstandlich kann es vorkommen, dab die Auflósung des Sy stems (4.5) mehr als eine Wertegruppe p, , 12, y x, y 2 ergibt die die Bedingungen 0 < p < 1, > 0 , 12 > 0, — oo < y-^, y 2 < + oo erftillt.
Nun liegt das Problem nahe: welche der so erhaltenen Gruppen ist zu wahlen 4 Diese Wahl kann in verschiedener Weise getroffen werden. Wir konnen z.B. das nachste, in den Berechnungen nicht ausgenutzte Moment, d.h. das sechste, auf Grund der Ergebnisse der Stichprobe ermitteln und es mit den sechsten Momenten der Mischung vergleichen, die fur verschiedene Wertegruppen der geschatzten Parameter berechnet wurden, d.h. wir konnen
П
30 E. K ą c k i und W. K r y s i c k i
berechnen und dann m'6 mit dem Wert
m, = 6! p + \ % + 1 „
2!^2^2 “t“ (^2)0-—V)
vergleichen, den wir fur verschiedene Wertegruppen p, 11512, ji1,
ermitteln. Man kann also diejenige Wertegruppe wahlen der
(4.11) min \m'6—m6
entspricht. Falls die erhaltenen zwei oder mehr Wertegruppen sich vonein- ander nicht betrachtlich unterscheiden, kann ais entscheidendes Kri- terium (4.11) dienen.
§ 5. SchluBbemerkungen. Praktische Anwendung des kier darge- stellten Yerfahrens nimmt viel Zeit in Anspruch. Daher scheint es emp- fehlenswert yor der Anwendung folgendes in Betracht zu nehmen. Falls die Hypothese aufgestellt wird, dab das zu untersucłiende Merkmal einer Laplaceschen Verteilung oder einer Mischung soldier Yerteilung unter- liegt, so soli zuerst an Hand eines Testes der Giite der Anpassung fest- gestellt werden, ob die Ergebnisse dei Stichprobe (2.3) tatsachlich mit einer Laplaceschen Yerteilung im Einklang stehen.
In diesem Fali geniigt es yon den drei ersten Aullmomenten, die in (4.2) angegeben wurden, Gebrauch zu machen. Der Mittelwert ist gleich [л und die Yarianz 2A2, wir erhalten also leicht ais Schatzfunktionen dieser Parameter
П I П
* =
1 = x
2 1 {Xt~ 2)2 •
i=l i=1
Wird diese Hypothese bei genugend umfangreicher Stichprobe und einem у on yornherein bestimmten Konfidenzkoeffizient abgelehnt, so soli das oben dargelegte Yerfahren verwendet werden. Aach Ermittlung der Schatzfunktionen und nach einer geeigneten Auswahl eines Systems von solchen Funktionen falls mehrere Systeme in Frage kommen, soil man sich iiberzeugen, ob die Ergebnisse der Stichprobe (2.3) mit einer neuen Hypothese liber die Yerteilung der Mischung (2.2) ubereinstimmen, indem man an Stelle yon Parametern die Werte der erhaltenen Schatz funktionen einsetzt. Denn es ist bekannt, daB bei unbeschrankter Yer- groBerung des Stichprobenumfanges, wenn die Hypothese richtig ist mit einer an Eins beliebig nahe kommenden Wahrscheinlichkeit das System von Gleichungen (4.3) eine Losung hat, die den Bedingungen
Literatu rverzeich n is
[1] E. J. Glumbel, La dissection d'une repartition, Ann. Univ. Lyon, Serie 3, Section A, 2 (1940), S. 39-51.
[2] E. K ą c k i, Absolutne momenty dla rozkładu Laplace’a, Prace Mat. 10 (1965), S. 89-93.
[3] — Pewne przypadki estymacji parametrów mieszaniny dwóch rozkładów
Laplace'a, Zeszyty Naukowe Politechniki Łódzkiej, Elektryka, 20 (1965).
[4] W. K r y s ic k i, Application de la methode des moments a Vestimation des
parametres d'un melange de deux distributions de Eayleigh, Rev. Statist. Appl. 11 (4)
.(1963), S. 25-34.
[5] — Zastosowanie metody momentów do estymacji parametrów mieszaniny
dwóch rozkładów Laplace’a, Zeszyty Naukowe Politechniki Łódzkiej, Włókiennictwo,
14 (1966), S. 3-14.
[6] W. M e n d e n h a ll, R. J. H ad er, Estimation of parameters of mixed expo
nentially distributed failure time distributions from censored life test date, Biometrika,
45 (1958), S. 504-520.
[7] K. P e a r s o n , (lonstributions to the mathematical theory of evolution, Philos. Trans. Roy. Soc. London, 185A (1894), S. 71-110.
[8] P. R id er, The method of moments applied to a mixture of two exponential
distributions, Annals of Math. Stat. 3 (1960).
[9] M. W a s ile w s k i, V ber gewisse Merkmale der Mischung von zwei Maxwell-