• Nie Znaleziono Wyników

Jeśli jakość w procesie produkcyjnym jest stabilna, to xt mają identyczny rozkład o pewnej dystrybuancie Fx| (x)

N/A
N/A
Protected

Academic year: 2021

Share "Jeśli jakość w procesie produkcyjnym jest stabilna, to xt mają identyczny rozkład o pewnej dystrybuancie Fx| (x)"

Copied!
57
0
0

Pełen tekst

(1)

ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III. MATEMATYKA STOSOWANA XXVIII (1986)

U. Sc h u l z e

Berlin

Identyfikacja momentu zmiany rozkładu w ciągu zmiennych losowych*

(Praca wpłynęła do R edakcji 1984.10.01)

WSTgP

¥ celu zapewnienia wysokiej jakości wyrobów przemysłowych powstaje konieczność badania zmian jakości w toku procesu produkcyjnego i możliwie najszybszego ustalania odstępstw od przyjętej normy, aby móc ewentualnie podjąć kroki w celu skorygowania procesu.

Problem wykrywania zmiany jakości daje się często matematycznie sformułować jako problem wykrywania zmiany rozkładu ciągu zmiennych losowych. ¥ związku z tym rozpatrujemy następujący prosty model.

Niech będzie dany ciagjx^, t = 1, ..., nj niezależnych zmien- nych losowych (próba losowa). Jeśli jakość w procesie produkcyjnym jest stabilna, to xt mają identyczny rozkład o pewnej dystrybuancie Fx| (x). Skoro jednak po wykonaniu m-tego produktu następuje zmiana

(*)Z języka niemieckiego tłumaczył Tomasz Rychlik.

[33]

(2)

jakości, to pierwsze m zmiennych losowych x., , ..«, ma jednakowy rozkład z dystrybuantą F^x), a pozostałe n-m zmiennych losowych x ,,, ...» x ma jednakowy rozkład .z pewną inną dystryhuantą F2 (x); m+1 n *~

rF1 (x) t = 1, .., m,

xt ~

F2 (x ), t = m+1, . . ., n.

Przykładowo, w prostym przypadku kontroli alternatywnej F,,(x) i F2 (x) są rozkładami dwupunktowymi z prawdopodobieństwami wystąpie- nia wadliwego produktu 0 1 i 0 2. W razie pogorszenia jakości

V V

Moment zmiany rozkładu m jest nieznany. Wyłaniają się natych- miast trzy problemy:

1. Czy istnieje moment zmiany m, czy proces jest stabilny?

2. W jaki sposób estymuje się moment m oraz jak testuje się hi- potezy dotyczące m?

3* W jaki sposób estymuje się dystrybuanty F>j(x) i F2 (x) lub ich parametry 0^ i $ 2?

W ostatnich latach powstała bogata literatura dotycząca tej pro- blematyki, obejmująca przypadki różnych założeń o funkcjach F^(x) i F2 (x ). Zasadniczo zakłada się, że dystrybuanty F^x), i = 1, 2, należą do jednej z następujących klas:

rozkłady dwupunktowe, rozkłady normalne,

jednoparametrowe rozkłady typu wykładniczego,

klasa rozkładów absolutnie ciągłych (metody nieparametryczne).

Dla wszystkich typów rozkładów odpowiedz na pytanie 3 jest współ-

(3)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W CI£GU ZMIENNYCH... 35

na. Niech będzie dany estymator m liczby m. Dystrybuanty F^(x) i F2 (x) bądź ich parametry 0^ i są estymowane oddzielnie na pod- stawie obserwacji , ..., xa i x a+^, ..., x . Możemy ograniczyć się zatem do omówienia zagadnień 1 i 2.

Celem pracy jest przedstawienie przeglądu istniejących metod odpowiedzi na pytania 1 i 2 dla rozkładów F.(x), i = 1,2, wyżej wspomnianych typów.

Stosujemy następujące oznaczenia:

1 Z . n i=1

w i-1

x0 (m) = — — V 1 x. , 2 v n-m *—> i i=m+1

= 5=T Z - s ć , i=1

n

) - ^ ( Z (*i - *,(m))2 + Z ‘Xi - x2 (m))‘

i=1 i=m+

Symbole u^, %yLt<x* \ ;CK2 1 Fk,i;oc oznaczają kwantyle rzędu oc stan- dardowego rozkładu normalnego N(0, 1), rozkładów % 2, t oraz F o k bądź k i l stopniach swobody. Kwantyl ca rzędu oc dystrybuanty F(x) jest przy tym zdefiniowany jako:

(4)

= F_y| (1- cC) := min {t: F(t) ^ 1- orf.

1. ROZKŁADY DWUPUNKTOWE

Niech F^(x) i F2 (x) będą dystrybuantami rozkładów dwupunktowych na zbiorze {0, 1} o parametrach i 02 ^ 02 ):

P(xt = 1) := Pt =

0>j t t — 1, • •«> m,

02 , t — m+1, . • . , n <

1.1. Testowanie ^stabilności

Chcemy zweryfikować hipotezę o stabilności

H0 : „Pt = 01 dla każdego t = 1, ...» n"

wobec alternatywy o istnieniu zmiany jakości

: „istnieje moment zmiany m€ j 1 n - U taki. że

Pt

t = 1, ...» m,

t = m+1, ..., n".

W zależności od założenia, czy 0^ < 02 , 8^ > 02 lub 0^ f 02 wy- różnia się jednostronne i dwustronne alternatywy. Jeśli p^_ =

= P(x^ = 1 ) interpretujemy jako prawdopodobieństwo wystąpienia bra

(5)

ku, to przykładowo dla < 02 PrzY 'zachodzi pogorszenie jakoś- ci. Dalej należy rozróżnić, czy i 0^ znane, czy nieznane.

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W ClęGU ZMIENNYCH... 37

(Page (1954, 1955), Kander i Zacks (1966), Zacks (1980)).

Do weryfikacji hipotezy stabilności proponowano różne typy tes- tów:

b) testy oparte na skumulowanych sumach (przy ustalonej wiel- kości próby losowej lub sekwencyjne),

c) testy oparte na podejściu bayesowskim.

Test oparty na ilorazie wiarogodności. Rozpatrzymy przypadek nie- znanych parametrów 0^ i 0 2 . Statystyka testowa testu ilorazowego jest równoważna statystyce L zdefiniowanej poprzez:

W wielu przypadkach wychodzi się od znanego poziomu wyjściowego 0

a) testy oparte na ilorazie wiarogodności,

r Lm dla dwustronnej alternatywy

L = 0 1 4 0 2 »

dla jednostronnej alternatywy

gdzie

Lm = 2 {“ [^(m) ln x1 (m) + (1-5Ł, (m) )ln(1-x1 (m)) ] +

+ (n-m)[x2 (m)ln x2 (m) + (1-x2 (m))ln(1-x2 (m))] -

-n[ x ln x + (1 - x) ln(1-x)]}

(6)

O, jeśli x1(m) < x2 (m), Lm w przeciwnym wypadku.

Hipoteza Hq zostaje odrzucona, jeżeli zachodzi L ^ la , gdzie 1^.

oznacza kwantyl rzędu cc rozkładu L przy hipotezie Hq. Worsley (1983) podaje iteracyjną procedurę obliczania rozkładu L pod wa- runkiem ustalonej liczby braków M = ^ x^ nie tylko przy hipote-ri zie zerowej Hq, lecz także przy alternatywach jednostronnych bądź i=1

dwustronnych.

Testy oparte na skumulowanych sumach. W literaturze badano wiele testów opartych na skumulowanych sumach (por. spis cytowanych prac), różniących się następującymi cechami:

- rozważanymi sumami cząstkowymi,

- ustaleniem obszarów krytycznych poprzez wybór ich granic, - sekwencyjnym lub niesekwencyjnym sposobem ich przeprowadze- nia.

Punkt wyjścia testów opartych na skumulowanych sumach stanowią sumy cząstkowe S,= T] x. (Bissel (1969), Zacks (1981)) lub sumy t

t i=1 x t

cząstkowe y. odpowiednio transformowanych zmiennych i=1

y^ = y(Xj.) (Page (1955), Barnard (1959), Kemp (1971), Brook i Evans (1972), Pettitt (1980a), Worsley (1983)). Przy ustalonej li- czebności próby losowej n hipoteza Hq zostaje odrzucona, jeśli jed-

(7)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W CI£GU ZMIENNYCH... 39

na z sum cząstkowych , ...» leży w obszarze krytycznym. Gra- nice obszaru krytycznego należy przy tym tak wybrać, żeby błąd pierwszego rodzaju zachowywał zadany poziom istotności oc . Można też przerywać testowanie, gdy pierwsza suma cząstkowa S, leży w obszarze krytycznym i zaniechać obliczania następnych sum

St +1, Sn , tzn. odrzucenie HQ następowałoby już po wykorzys- taniu tylko t^j obserwacji. Sugeruje to ideę sekwencyjnego przepro- wadzania testu, co odpowiada rzeczywistej sytuacji przy bieżąco na pływających danych pomiarowych (kontrola automatyczna).

Sekwencyjne przeprowadzanie testu skumulowanych sum jest zwią- zane z regułą zatrzymania, tj. najmniejszą naturalną liczbą, dla jakiej rozpatrywany ciąg sum cząstkowych 2 P° raz Pier wszy wpada do obszaru krytycznego. Istotny jest rozkład reguły za- trzymania i jej wartość oczekiwana - średnia długość badania, na podstawie której są porównywane testy sekwencyjne. Przy hipotezie Hq średnia długość badania powijana być możliwie jak największa, a przy alternatywach - jak najmniejsza.

Wybór granic obszaru krytycznego wynika z postawienia problemu - alternatywy jednostronne lub dwustronne - i zadanych ograniczeń na błąd pierwszego rodzaju lub średni czas badania przy HQ .

Własności sekwencyjnych testów opartych na skumulowanych su- mach były analizowane m.in. przez Kempa (1961, 1962, 1971), Nadle- ra i Robbinsa (1971), Brooka i Evensa (1972), Khana (1981) oraz Zacksa (1980, 1981).

Testy skumulowanych sum mają tę zaletę, że dają się łatwo prze prowadzać metodami graficznymi. Niektóre z nich będą dalej nieco bardziej szczegółowo opisane.

(8)

Znany poziom -wyjściowy 0^. Page (1954, 1955) stosuje sumy cząstkowe Sq = 0,

s t = 2 y ( x i ) » i=1

gdzie

y(Xi) =

a, jeśli xi - 1,

,-b, jeśli x = 0,

"t — *l| • • •} rij

przy czym parametry a, b ) 0 są tak dobrane, że y(x^) przy Hq mają wartość oczekiwaną równą 0, S, = 0 dla każdego t. Przy altema- tywach

H.(m): „p, = <

©>|, przy t = 1, ..., m, przy t = m+1, ..., n"

z ustalonym momentem zmiany m zachodzi

EH1 (m)St <

dla t / m,

(t-m) (a+b)(02-$1 ) dla t > m.

W przypadku jednostronnych alternatyw 6^ < 02 istnieje więc takie me{l, ..., n-1}, że E^ S^. > 0 dla wszystkich t > m. Page (1955) od-

(9)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W ClfGU ZMIENNYCH... 41

rzuca zatem hipotezę HQ na korzyść jednostronnej alternatywy ,

^ ^2 (n^-eznane m )» Jeżeli

(1.1) max. { S - min S } > h re{0,...,n} r ts{0,...,r-1} t

zachodzi dla pewnej wartości krytycznej h = hn (oc), którą należy tak wybrać, żeby dla podanych a, b, i n test nie przekraczał założo- nego poziomu istotności CK . W szczególnym przypadku a = b = 1,

'I Page (1955) podaje tabelę wartości krytycznych h^(cx) dla

oc = 0.05 i oc = 0.01 przydrożnych wielkościach próby losowej n.

Gdy przeprowadza się test (1.1) sekwencyjnie, wtedy wybór war- tości krytycznej opiera się na średniej długości badania. Dla b = 1 i dowolnego a Page (1954) podaje przybliżone wzory do obliczania średniej długości badania dla małych 6^ oraz tablice, za pomocą których można wyznaczyć a i wartość krytyczną h.

Analogicznie mogą być skonstruowane testy oparte na skumulowa- nych sumach dla przypadku jednostronnych hipotez alternatywnych 6 > ©2 - Dla weryfikacji HQ przeciwko dwustronnej alternatywie

(0^ £ $2 ) Page (1954) proponuje jednoczesne stosowanie obu jedno- stronnych testów skumulowanych sum dla przypadków 0^ < © 2 i 01 > e2 .

Dla znanych 6^ i ©2 , ©^ < ©2 Zacks (1980, 1981) proponuje dwa jednostronne, sekwencyjne testy skumulowanych sum. Wychodząc od sum częściowych Sq = 0,

t

St = ^I xit t = 1,2,..., i=1

(10)

definiuje reguły zatrzymania:

= m m { n ^ 1 : Sn > b(n)}

dla pewnej funkcji liniowej b(n) (Zacks (1980)) i

min { n ^ 1 : Sn-bQ-b1 (n-j) >n 0 1

dla pewnego j = 0, 1, • • • f

gdzie bg i b^ są liczbami naturalnymi (Zacks (1981)). Przedstawia on dokładną postać dystrybuanty zmiennej i metodę jej aproksy- macji (Zacks (1980)) oraz pokazuje, że ma skończoną wartość ocze- kiwaną. Zacks (1981) podaje rekurencyjny algorytm obliczania

P(N£ > n) i analizuje średnią długość badania dla ^ przy hipotezie Hq. Do obliczania rozkładu reguł zatrzymania przy Hq potrzebna jest znajomość 6 , do obliczania rozkładu przy alternatywach - również znajomość

Nieznany poziom wyjściowy 0^. Pettitt (1980a) i Worsley (1983) zaproponowali testy skumulowanych sum przy nieznanym poziomie wyj- ściowym, obydwa oparte na próbie ustalonej liczności n.

Pettitt (1980a) wykorzystuje sumy cząstkowe

t

st = XI n (xi - x ) i=1

(11)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W ClfGU ZMIENNYCH... 43 i odrzuca hipotezę Hn , jeśli

Vk - St0 < Sf * ■ 1... n | M = k ) > v-tł (w przypadku jednostronnej alternatywy, lub

Vk " (stQ -' !st0P l st h t - 1» •••• n ! M " k) > vkf0c

(w przypadku dwustronnej alternatywy;, gdzie M = ^ x .n i=1

Przy tym vk K i vk K oznaczają kwantyle rzędu oz rozkładów Vk i Vk przy hipotezie HQ . Rozkłady V” i Vk są odpowiednio równe rozkła- dom -k(n-k)Dk n_k oraz k(n-k)Dk n_k » natomiast Dk n_k oznacza dwu- próbkową statystykę Kołmogorowa-Smirnowa, tablice rozkładu której znajdują się w pracy Pearsona i Hartleya (1972), a także Zieliń- skiego (1972) oraz Bolszewa i Smirnowa (1983).

Pettitt (1980a) przeprowadza badania metodą Monte Carlo dla porównania testu opierającego się na Vk z odpowiadającym testem opartym na ilorazie wiarogodności i konkluduje, że różnica mocy między tymi dwoma testami przy równym (w przybliżeniu) poziomie is- totności jest bardzo mała. Test oparty na Vk ma przy m = ~ większą moc niż test ilorazu wiarogodności. Ponieważ ponadto obliczenia dla statystyki testowej testu ilorazowego są bardziej kosztowne, a pos- tać jej rozkładu trudniejsza w użyciu, preferuje on test bazujący na Vk .

Worsley (1983) stosuje sumy cząstkowe

(12)

i odrzuca hipotezę Hq, jeśli zachodzi

Q t=1

(przy jednostronnej alternatywie, 0 < ©2) oraz

Q t=1

(przy dwustronnej alternatywie), przy czym q- i q oznaczają od-«C oC powiednio kwantyle rzędu oc rozkładów CT oraz Q przy Hq. Podaje on metodę obliczania P(Q < q) pod warunkiem ustalonej liczby wadliwych

natywach. Rozkład Q przy hipotezie zerowej jest niezależny od war- tości 0^.

Testy oparte na podejściu bayesowskim. Często posiadamy wstępne wia- domości o położeniu ewentualnego momentu zmiany rozkładu, które chce' my uwzględnić przy podejmowaniu ostatecznej decyzji. Możliwość tego dają metody bayesowskie. Zakładają one zapis wstępnej wiedzy w pos- taci rozkładu a priori nieznanych parametrów. Poniższe metody tes- towania wykorzystują prawdopodobieństwa a priori momentu zmiany m€^1, ..., n-1}. Jeśli nie istnieje żadna informacja na temat m,

n

wyrobów M = ^ nie tylko przy hipotezie Hq, ale też przy alter- i=1

(13)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W CI£GU ZMIENNYCH... 45

to jako rozkład a priori jest wybierany równomierny rozkład na { 1 » • • • 9 Dr* ^ J

Kander i EaGks (1966-) wychodzą od rozważenia rozkładu dwupunkto- wego na f-1, 1} 3e znanym poziomem wyjściowym 8^:

yt * y(xt )

1, jeśli xt = 1,

-1, jeśli = 0,

Pt = P(yt = =

t 4 m,

6 2 * t > m.

Przy założeniu równomierności rozkładu m na [i, ..., n-l], jedno- stronnych alternatyw 0^ < $ 2 i użyciu argumentów związanych z ilo-

n

razem wiarogodności, uzyskują statystykę testową T . = . £ (t-Dyt .

t=i

W tej statystyce ostatnie obserwacje otrzymują największe wagi tak, że również przy dużej wartości m momentu zmiany rozkładu można spo- dziewać się, że statystyka zareaguje na zmianę parametru.

Wartość oczekiwana i wariancja Tn wynoszą:

R T = (20-1) £ & - 1) ,

^ 0 n 1 2

VarH Tn = 4 0y] (1-^ )(2n~1 ) ? 6

(14)

V “ >T» = V “ + f82-81 )(n(n-1)-ffi(m-1))'

VarHl(m)T„ -

= VarH Tn + )(1-(0^+02 ))(n(n-1 )(2n-1 )-m(m-1 )(2n*-1 )).

Hipoteza Hq zostaje odrzucona na korzyść jednostronnych alternatyw.

0, < ®2 , jeśli > c , przy czym c^ oznacza kwanty1 rzędu oc roz- kładu T przy Hq. Kander- i Zacks (1966) przedstawiają metodę obli- czania gęstości T przy H^ i H^ oraz dowodzą asymptotyczną normal- ność . Aproksymacja rozkładem normalnym prowadzi do odrzucenia Hq

jeśli

T \ c „ := ui \/varTI T + Fu. T n * at or H~ :n 0 Tir, n 0

Badania -wykazały, że często już przy małej wielkości próby losowej dostaje się dobrą aproksymację rozkładu T przy hipotezie zerowej przez standardowy rozkład normalny.

Zacks (1980) oraz Zacks i Barzily (1981) rozpatrywali sekwen- cyjne testy bayesowskie. Startując od prawdopodobieństw a priori

pQ (m) =* *r (i-or)*-1, m = 1, 2, gr ^ 0 ,

i znanych Zacks (1980) oblicza prawdopodobieństwa a poste- riori pn (m ^ n- | x^j, x ) tego, że wystąpiła zmiana wartości parametru podczas pierwszych n obserwacji. Odrzuca on hipotezę Hq,

(15)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W CI^GU ZMIENNYCH. . . ■47

gdy po raz pierwszy p (rn-^nj x^, krytyczną p*. Dla odpowiadającej

...» x ) przekracza daną wartość reguły zatrzymania

N = min (n > 1 : pn (m i n | x1, ..., ) > p* j

podaje dokładny rozkład bądź jego aproksymację numeryczną,

Zacks i Barziły (1981) wychodzą od nieznanych parametrów , o pewnej gęstości a priori h(6*^, 62 ) na zbiorze 0 < ^ ^ ®2 ^ 1 (jednostronna alternatywa). Dla prawdopodobieństw a priori

pQ (m) = r

(1- 3T )p(1-p)m'

m = 0,

m - 1, 2,

r > 0

9

oraz C* i C2 - ocen ryzyka Konsumenta i producenta - obliczają oni prawdopodobieństwa a posteriori pn ;m^ n [ x ), Proces obserwacji jest zatrzymywany i hipoteza Hq odrzucana, kiedy po raz pierwszy pn (m^ n j x^... xn ) jest większe niż wartość krytycz- na p*(x,j, ..., x ), która może być wybrana w pewnym sensie optymal- nie.

1.2. Estymacja momentu zmiany rozkładu m

¥ literaturze były omawiane estymatory największej wiarogodności (Hinkley i Hinkley (1970)), estymatory oparte na skumulowanych su- mach (Pettitt (1980a)) i estymatory bayesowskie (Smith (1975)).

Estymatory największej wiarogodności. Sstymatdr największewiaro- godności opiera się na maksymalizacji, funkcji wiarogodności

(16)

m

L(m) = X {xiln ^ C 131) + (1-xi )ln(1-01 (m))} + t=1

n

+ X {Xj^ln fi2 (m) + (1-xi )ln(1-52 (m))}, t=m+1

przy czym

®i* jeśli 0^ jest znane, i x^(m), jeśli 6.i jest nieznane,

Hinkley i Hinkley (1970) analizują asymptotyczny rozkład estymato- ra największej wiarogodności in = arg max L(m) w przypadku znanych parametrów ć?^ i 02 °raz w przypadku, gdy oba parametry są niezna- ne. W obydwu wypadkach otrzymują taki sam asymptotyczny rozkład’

oraz podają jego iteracyjne przedstawienie.

Estymatory oparte na skumulowanych sumach. Pettit (1980a) podaje >

w przypadku nieznanych parametrów 0>| i 02 estymatory mg i nw, które opierają się na skumulowanych sumach (1.2) lub na unormo-

^ — 1 /2

wanych skumulowanych sumach = (t(n-t)) ' S^:

’ inf ( V S, < S., t = 1, ..., n), jeśli 0 1 < ®2 , m = As inf ( t o : S . ^ S,, t = 1, ..., n), jeśli 0,| > 02 ,

inf ( V |St | > | |, t = 1, ..., n), jeśli £ 9

(17)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W ClfGU ZMIENNYCH... 49

Estymator m~S jest zdefiniowany analogicznie jak m , przy czym S,S "C zostaje zastąpione S^.(V

Dla przypadku 6^ y 6^ Pettitt dokonał asymptotycznego porówna- nia estymatorów mg, mg oraz estymatora największej wiarogodności m.

A A

Stwierdził, że mg i nu są asymptotycznie niemal równoważne estyma- torowi największej wiarogodności. Badania metodą Monte Carlo wyka- zały przy porównaniu błędu średniokwadratowego i wariancji jedynie nieznaczne różnice między nu a m, przy czym mg był na ogół nieco

lepszy niż m. Estymator m był na ogół gorszy niż m* i m.s s

Estymatory bayesowskie. Jeśli istnieją informacje o położeniu mo- mentu zmiany m, które można opisać za pomocą pewnego rozkładu a priori na £ 1, ...» n-lj, to stosuje się estymatory bayesowskie

(por. str. 44). Estymatory bayesowskie momentu m bazują na tak zwa- nych prawdopodobieństwach a posteriori p (m) wartości m, które przy danym rozkładzie a priori nieznanych parametrów zależą od obserwa- cji , ..., x . Estymatory są wówczas zdefiniowane:

A arg max p (m)

me{l, ... ,n-1} n

albo

m = arg min E , s(m-u)‘

B u«{1,...,n-l} Pnlm; r

Łatwo jest stwierdzićj że zachodzi

mB = arg min ( 2

jll - E , s (m)) ,

* Pn (m)

(18)

tj. mB jest leżącą najbliżej wartości oczekiwanej (m )(m ) liczbą naturalną.

Dla pewnego rozkładu a priori Smith (1975) wyprowadza prawdopo- dobieństwa a posteriori p (m). Zakłada, że rozkład a priori momen- tu zmiany m jest niezależny od 0 ^ i © 2 * w Przypadku nieznanych parametrów 6H, i = 1,2, ustala on czteroparametrowy ucięty roz- kład beta jako rozkład a priori dla 0^.

1.3. Testowanie hipotez o momencie zmiany rozkładu

Hinkley i Hinkley (1970) badają test oparty na ilorazie wiarogod- ności do weryfikacji hipotezy H^: „n^mg" przeciwko jednej z alter- natyw :

: Itm < m 0 ", : „ m > m 0" lub : „m f m0",

podczas gdy mg jest jednym z możliwych momentów zmiany rozkładu.

«Festy ilorazu wiarogodności opierają się na statystykach

A 1 = max (L(m)-L(mQ )), A r = max (L(m)-L(mQ )),

m^mQ m^mQ

A = max (L(m)-L(mn )), 1<m*n-1

przy czym L(m) jest zdefiniowaną przez (1.3) funkcją wiarogodności przy znanych bądź nieznanych parametrach 0^ i 02*

Dla przypadku znanych parametrów 0^ i Hinkley i Hinkley (1970) podają iteracyjne wzory do obliczania asymptotycznych roz- kładów unormowanych statystyk

(19)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W CI£GU ZMIENNYCH... 51

ln(©1/e2 )^' ln(0^/e2 ) ^ 1 ln(d^/02 ) ^

zarówno przy hipotezie Hq, jak i przy każdej z alternatyw. Dla przypadku nieznanych parametrów 6’^ i $2 odpowiednie unormowane statystyki mają takie same rozkłady asymptotyczne, które jednak za- leżą od nieznanych parametrów 8^ i ©2 i dlatego nie mogą być wy- korzystane do testowania.

Z drugiej strony można skonstruować testy, które oparte są na estymatorze największej wiarogodności m i jego asymptotycznym roz- kładzie (por. 1.2). Porównanie mocy testów opartych na m i statys- tyce A . , które dla przypadku nieznanych parametrów przeprowadzili Hinkley i Hinkley (1970) wykazało, że test ilorazu wiarogodności jest mocniejszy niż test oparty na estymatorze największej wiaro- godności .

1.4. Uwagi dotyczące innych rozkładów dyskretnych

Niektóre z metod identyfikacji momentu zmiany opisane dla rozkładów dwupunktowych można wykorzystać dla innych rozkładów dyskretnych.

Tak więc sekwencyjna bayesowska procedura Zacksa (1980) i sekwen- cyjna procedura skumulowanych sum do testowania stabilności Zacksa

(1980, 1981) mogą być stosowane dla dowolnych rozkładów dyskretnych na nieujemnej półosi. Własności metod opartych na skumulowanych su- mach obowiązują często dla szerszej klasy rozkładów dyskretnych

(por. Kemp (1971), Brook i Evans (1972)).

(20)

2. ROZKŁADY NORMALNE

Gdy rozpatruje się rozkłady normalne o zmiennych parametrach, wte- dy zachodzą trzy przypadki:

(i) zmiana wartości oczekiwanej przy stałej wariancji, (ii) zmiana wariancji przy stałej wartości oczekiwanej, (iii) jednoczesna zmiana wartości oczekiwanej i wariancji.

W zależności od wiedzy o parametrach i kierunku ich zmiany mo- gą być wyróżnione dalsze przypadki.

Przypadek (iii) nie był dotąd, z wyjątkiem estymatorów bayesow- skich (Hsu (1982)), omawiany w literaturze.

Dla przypadku (ii) pewne wskazówki do weryfikacji stabilności znajdują się w pracach Page (1957) oraz Deshayesa i Picarda (1980).

Deshayes i Picard (1980) dowodzą asymptotycznych własności optymal- nych testu stabilności opartego na ilorazie wiarogodności. Mence- fricke (1981) przedstawia bayesowską analizę problemu momentu zmia- ny precyzji (odwrotność wariancji) rozkładów normalnych.

Interesujący przypadek (i) był omawiany w wielu pracach. Dalej ograniczamy się do przypadku (i) i zakładamy poniższy model:

(2.1) N(^it ,62 ), t = 1, ..., n,

gdzie

t = 1, ..., m,

t = m+1, ..., n.

r

Pt =

(21)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W ClfGU ZMIENNYCH... 53

2.1. Testowanie stabilności

W modelu (2.1) należy zweryfikować hipotezę o stabilności

Hg i = ®'|» t = 1, ..., n"

przeciwko alternatywie o zmianie wartości parametru

fi, : „ 3me{l, n-1]

t = 1 , .

t = m+1, m,

n"

przy różnych założeniach o 0^, 0^ i wariancji d . W tym celu za2

proponowano wiele testów,Jktóre można zestawić w następujące grupy testy oparte na ilorazie wiarogodności,

testy oparte na podejściu bayesowskim, testy oparte na skumulowanych sumach,

testy oparte na porównywaniu dwóch grup obserwacji, testy weryfikujące odstępstwa od przyjętego modelu.

Testy ilorazu wiarogodności. Niezależnie od spotykanych założeń o parametrach statystyki testowe mają postać

X= min X , l^m^n

gdzie Am oznacza odpowiadającą statystykę testową testu opartego na ilorazie wiarogodności do weryfikacji hipotezy Hg przeciwko al- ternatywie

(22)

9*, t = 1, ..., m, Hx| (m): ^

$2» t = m+1, ...» n",

że zaszła zmiana wartości parametru po m-tej obserwacji. Statysty- ki testowe testu opartego na ilorazie wiarogodności lub równoważne im statystyki zostały obliczone przy rozmaitych założeniach o 0 ^ < 0 2»

i (S'2 : Sen i Srivastava (1973, 1975a, b, c), Srivastava (1980), Hawkins (1977), Maronna i Yohai (1978), Worsley (1979). Jednakże postacie rozkładów i tablice dokładnych bądź przybliżonych kwanty- li rzędu cc rozkładów tych statystyk dotychczas istnieją jedynie dla opisanych w tablicy 2.1 przypadków.

Tablica 2.1. Testy oparte na ilorazie wiarogodności do weryfikacji Hq : „\ft <Ut = 0^" przeciw

L, : „3me {1, . .., n-1) =<

01, t ^ m,

02 » t > m".

0. < , 0,, 0O , 6' nieznane

s . max ( B l s a l ) V 2 4 (m) -

1^m<n n W

Tabela kwantyli uzyskanych metodą Monte Carlo rzędu oc = 0.01, 0.05, 0.10 dla n = 9, 10, 12, 15(5)60 (Sen i Srivastava (1975c), Sriva- stava (1980)) '

(23)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W ClfGU ZMIENNYCH... 55

6L| f ^ = 1, 0^, ©2 nieznane

tt /m(n-m)\1/2. - / s - / \ i U = max (— i---L) ' x9 (m) - x.(m) .

1^m<n n ^

Rekurencyjna postać gęstości U przy Hq i H^ , tabela dokładnych

kwantyli rzędu oc = 0.01, 0.05, 0.10 dla n = 4, 5, 10, 15, 20, 30, 50 ,>

tabela kwantyli uzyskanych metodą Monte Carlo rzędu oc = 0.10 dla n = 50, 100, 500, 1000, 5000 (Hawkins (1977)

©1 £ ©2» » ©2* ** nieznaneo

W = max - U (m)l

1^m<n n Cf2 (m)

Tabela kwantyli rzędu 0c = 0.01, 0.05, 0.10 dla n = 3, 4, ..., 10, tabela kwantyli uzyskanych metodą Monte Carlo rzędu oc dla

n = 15(5)50 (Worsley (1979)). Rozkład W jest asymptotycznie, przy n-» oo , równy rozkładowi U (Hawkins (1977), Worsley (1979)).

Testy oparte na podejściu bayesowskim. Testy opierające się na baye- sowskich założeniach były najpierw wprowadzone przez Chernoffa i Zacksa (1964) oraz Gardnera (1969) dla przypadku znanej wariancji 6 . Sen i Srivastava (1975b, c) uzyskali z nich testy dla przypad-2

ku nieznanej wariancji, normując statystyki testowe przez odpowied- ni nieobciążony przy Hq estymator 6 . Powstałe statystyki testowe 2

i własności ich rozkładów są zestawione w tablicy 2.2.

Badania Gardnera (1969) oraz Sena i Srivastavy (1975a) wykaza- ły, że rozkład U* może być dobrze aproksymowany przez rozkład a-

(24)

symptotyczny już przy tak małej wielkości próby jak n = 10, 20, 50.

Tablice asymptotycznego rozkładu statystyki Smirnowa GJn znajdują 2

się w pracy Andersona i Darlinga (1952) oraz Bolszewa i Smirnowa (1983).

Tablica 2.2. Testy oparte na podejściu bayesowskim do weryfikacji Hq •* „Vt = 0^' przeciw

, t ^ m, H1 : u 3m£{l,. ..., n-1} = <

60, t > m".

0 = 6^ < 6 = 1, p ©2 nieznane n-1

Tn = 2 i ^xi+1^lT N(0, gn(n-1)(2n-1 ))

i=1 0

(Chernoff.i Zacks (1964))

$1 < ©2» <5"2 = 1, 0 , Q 2 nieznane n-1

T* = X! .i(xi+i " *) *ff N(0, ^ n(n2-1 ))

i=1 0

(Chernoff i Zacks (1964)) 0 = 0^ ^ 02> < 5 = 1 , p $2 nieznane

U

n-1 n-1

>-2 £ ( £ x.+1)t i=1 j=i

Dokładny i asymptotyczny rozkład U przy HQ , tabela wartości dla n = 10, 20, 50 (Sen i Srivastava (1975a))

(25)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU ¥ CI£GU ZMIENNYCH... 57

^ 02 » p 0>|» 0 2 nieznane

n-1 n-1

U* = n"2 X! ( 2 (Xj+1 " x ))2- i=1 j=i

Dokładny rozkład U"* (Sen i Srivastava (1975a)), rozkład 6(n2-1 )""^n2U jest asymptotycznie równy rozkładowi statystyki Smirnowa w n (Gard-2

ner (1969)).

0^ < $2’ 66|» $2* ^ nieznane P = T*/B lub P1 = V/CT, ,

[ 6 /((n -1 )R 2 n 2-3n-5));i-P2 -'r B e j , 2(n-1)) H0 ^

(Sen i Srivastava (1975c)),

*5 /2 ^

uzyskane przez symulację kwantyle rozkładu n ' rzędu

oc = 0.01, 0.05, 0.10 dla n = 10(10)50 (Sen i Srivastava (1975c)) 0 = 0>| ^ ®2> ©2* ^ 2 nieznane

P = U/g2 lub P1 = U/<?2 .

Wzory do obliczania rozkładów P i P^ przy HQ (Sen i Srivastava (1975b))

©1 f @2* Qs\3 &2f & ~2 nieznane

P* = U*/£2 lub P* = U*/£2 , lub Q* = (T^)2/62 . Wzory do obliczania rozkładów P* i P* przy HQ (Sen i Srivastava

(1975b))

(26)

(n-2 )Q#/ (^ 2 (n-1 ) n(n+1 )-Q*) ^ n__2 (Srivastava (1980))

n-1 n

d 2 0\-1 V t \2 3, 2 -1 <r-» 2

= (2n-2) 2_. (xt+1“xt' ’ 6 = n 2^ xt»

t=1 t=1

n-1

(2n-1 )"" ' (2x2 + x2 + ^ (xt+1-xt)2).

t=2

Uogólnienia statystyk opisanych w tablicy 2.2 dokonano w dwóch przypadkach. Mustafi (1968) uogólnia statystykę Tn dla modelu z r

(r ^ 2) zmianami wartości parametru, każdorazowo o jednakową wiel- kość. Sen i Srivastava (1973), (1980) utworzyli wielowymiarowe wersje U, U* i Q* dla x^_ o p-wymiarowym rozkładzie' normalnym.

Testy oparte na skumulowanych sumach. Do weryfikacji stabilności wartości oczekiwanej rozkładu normalnego zostały zaproponowane roz- maite testy skumulowanych sum, a ich własności badali: Page (1955, 1957), Brown, Durbin i Evans (1975), Deshayes i Picard (1979, 1980), Goldsmith i Whitfield (1961), Hinkley (1971), Johnson (1961), Kemp (1961, 1971), Nadler i Robbins (1971), Brock i Evans (1972), Bagshaw i Johnson (1975), Hackl (1980), Lucas i Crosier (1982a, b) i inni.

Własności tych testów zachowują przy tym często ważność dla szerszej klasy rozkładów, która obejmuje rozkład normalny. Testy skumulowa- nych sum różnią' się ze względu na stosowane sumy cząstkowe, wybór zbioru krytycznego oraz sekwencyjny bądź niesekwencyjny sposób ich przeprowadzenia. Niektóre testy skumulowanych sum są poniżej nieco dokładniej przedstawione.

(27)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W CI£GU ZMIENNYCH... 59

Znany poziom -wyjściowy 0^. Do weryfikacji stabilności parametru przeciwko jednostronnej alternatywie o wzroście wartości oczekiwa- nej do wielkości 02 = S>«| + £, £ > 0 , Page (1957) używa sum cząstkowych

t

S0 = o, st = S (xi - e -| - 4 )l t = 1... n - i=1

Przy hipotezie zerowej oraz alternatywach o momencie zmiany m za- chodzi odpowiednio

& t 2 i

^ (m)S, =

- ^t + (t-m)<T

t ^ m,

t ^ m,

a to sugeruje odrzucanie Hq, jeżeli

S - min

1^t Ąn S+ > c00

gdzie c^. należy tak wybrać, żeby test zachowywał zadany poziom is- totności oc * Dla danego £ = 0 2 “ 0-] > 0 i znanej wariancji 6^ Page podaje wzory przybliżonego obliczania błędu pierwszego rodzaju. Na ich podstawie uzyskuje dla oc= 0.05, n = 25, 50, 100 i kilku war-

(28)

tości - tablicę przybliżonych wielkości c^ /O'.

Jeżeli 6 2 jest nieznane, to zostaje wybrane stosowne &. Bagshaw i Johnson (1975) analizowali wpływ wielkości 8 na średnią długość badania odpowiadającego testu sekwencyjnego.

Nieznany poziom wyjściowy 0^. Dla nieznanych wartości oczeki- wanych 6^ i §2 w pracy Browna, Durbina i Evansa (1975) przedstawio- no testy skumulowanych sum, które opierają się na resztach

Przy hipotezie o stabilności parametru są one niezależne i mają

Prosty test oparty na skumulowanych sumach wykorzystuje statys- tyki

wt = (^p-)1/2 (xt - x(t-1)), t = 2, ..., n.

rozkład N(0,S' ), a przy zmianie wartości parametru w chwili m ich2 wartości oczekiwane wynoszą

c0 , t = 1 m,

tTt^TT (02 “ 0 1}’ = m+1’ . . ., n.

t w. t = 2

i=2

przy czym w przypadku nieznanej wariancji w miejsce jest stoso- wany pewien estymator, np.

(29)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W CI£GU ZMIENNYCH... 61

n (2 . 3 ) ( x t - x ( n) ) 2 Z

t=1 t=2

Z uwagi na (2.2) hipoteza HQ zostaje przyjęta wtedy i tylko wtedy, gdy

| W^J ^ c^(t) dla wszystkich t = 2, ...» n.

Rys. 2.1. Obszar przyjęcia prostego testu skumulowanych sum

c (t) jest tu pewną daną funkcją definiującą granice obszaru przy- jęcia, którą należy wybrać tak, aby test zachowywał (przynajmniej w przybliżeniu) poziom istotności oc. Brown, Durbin i Evans (1975) przyjmują jako granicę prostą przechodzącą przez punkty (2, a(oc')\/n-1 i (n, 3a(oe) \Jn-f):

\ 'in-f j. . (n-6) \ln-V y t ) — 2a(oc) ^ n—2 ®(oc)

( rys. 2.1 ). Na podstawie asymptotycznego rozkładu podają oni następującą tabelę wartości a(oc) :

(30)

oc 0.01 0.05 0.10 a (ot) 1.143 0.948 0.850

Deshayes i Picard (1979) wybierają następującą prostą:

(2.4) cw (t) = b(oc)t + b (oc).

Przy znanej wariancji wykazują, że dla każdego b(oc) > 0

lim ln PH ( 3te {2, ..., n} : | ¥t | > c (t)) = - b2 (oc),

n—»ao n0

skąd wynika dla dużych n przybliżona równość

z n / lnot \ 1/2 b(oc) = (-

Dla przypadku nieznanej wariancji O 2 , przy ograniczeniu b(oc) < 1/v/2^

podają dla dużych wielkości próby przybliżone dolne i górne ograni- czenia dla błędu pierwszego rodzaju.

Kwadratowy test oparty na skumulowanych sumach wykorzystuje statystyki

t 0

_ w. 2 - £ ( ^ > ,

i=2

t = 2,

przy czym w przypadku nieznanej wariancji <6 zostaje wstawiony jej 2 estymator (np. (2.3)). Przy hipotezie Hq wartości oczekiwane Q^,

(31)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU ¥ CI^GU ZMIENNYCH... 63

t = 2, ..., n, leżą na prostej y = t - 1. Brown, Durbin i Evans (1975) proponują przyjąć hipotezę Hq wtedy i tylko wtedy, kiedy za- chodzi

-r-rlQ. - (t-1 ) I ^ c . dla każdego t = 2, ..., n n-1 i t 1 N oC

(2.5) n-1 Qt «1 t-1

n-1 + c,oc dla każdego t = 2, , n.

Rys. 2.2. Obszar przyjęcia kwadratowego testu skumulowanych sum

Wykazują oni, że dla znanego (52

lim ~ ln PH^(3t€ {2, ..., nj : Qt > (t-1) + (n-1)) =

Cbc“ 111(1+0^)

= — ,

2

z czego dla dużych n wynika przybliżona równość określająca wybór wartości krytycznej c^

y=t-1 2

(32)

— Inan

ca - ln(1 + c#) 2

Hackl (1980) rozpatruje rozmaite modyfikacje prostego i kwadra- towego testu opartego na skumulowanych sumach, w których za każdym razem sumuje się ostatnie G reszt oraz wykorzystuje się różne esty- matory nieznanej wariancji 6 . Testy te nazywają się ruchomymi tes- tami skumulowanych sum. Hackl stosuje m.in. statystykę

t

\ = T 2 V i=t-G-1

przy czym<5^ jest zdefiniowana przez (2.3). Odrzuca hipotezę o sta- bilności parametru, jeśli zachodzi

t = G+1, max

. • •, n > u przy oC*= ot 2(n-G) *

Arytmetyczne porównanie efektywności oraz empiryczne porówna- nie mocy prostego testu skumulowanych sum i ruchomego testu sku- mulowanych sum prowadzą Hackla (1980) do wniosku, że ruchomy test skumulowanych sum jest lepszy niż prosty.

Testy oparte na porównywaniu dwóch grup obserwacji. Niech dla każ- dego ustalonego momentu zmiany rozkładu m (1 ^ m < n) T(m) będzie statystyką testową testu do weryfikacji hipotezy HQ przeciwko alter- natywie :

(33)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W CI£GU ZMIENNYCH... 65

H^| (m):

r 0V t x< m,

6^, t > m "

zmiany wartości parametru po wykonaniu m-tej obserwacji. Niech

^ ( m ) będzie kwantylem rzędu oc rozkładu T(m) przy Hq. Hipoteza Hq

zostaje odrzucona na korzyść H^(m), jeśli T(m) ^ t^m). Zgodnie z ( ^ \ zaproponowaną przez Roya (1953) zasadą „union-intersection"v ' z testów dla m = 1, ...» n-1 uzyskujemy test do weryfikacji prze- ciwko H^|, odrzucając hipotezę HQ wtedy i tylko wtedy, gdy jeden z testów do weryfikacji Hq przeciw H^(m), 1 ^ m < n, prowacdzi do od- rzucenia Hq. Statystyki testowe T(m) i odpowiadające im kwantyle rzędu oc są zestawione w tablicy 2.3. Kwantyle są niezależne od m, tzn. możemy zapisać t^(m) = t^ i hipoteza Hq zostaje odrzucona wte- dy i tylko wtedy, gdy zachodzi

max T(m) ^ ta . l^m^.n-1

Testy do weryfikacji odstępstw od modelu. Rozważany tutaj model da- je się ująć jako szczególny przypadek modelu regresji liniowej, a występowanie momentu zmiany można interpretować jako występowanie odchylenia od modelu. Z tego względu nasuwa się idea użycia do we- ryfikacji wystąpienia momentu zmiany testów, które zostały utworzo-

(*)Nazwa zasady pochodzi stąd, że obszar krytyczny tak utworzo- nego testu jest sumą obszarów krytycznych, obszar przyjęcia hipote- zy zaś - wspólną częścią obszarów przyjęcia poszczególnych testów dla m = 1, ..., n-1 (przyp. tłum.).

(34)

Tablica 2.3. Testy oparte na zasadzie „union-intersection"

Założenia Statystyka testowa T(m) Kwantyl ta rzędu ck

e1 < g2 , <52 = i O^l, ©2 nieznane

( ^ (x2(m) - x1(m)) U oc

0 = ^ < ^2* <5Z = 1

©2 nieznane (n-m)1/2 x2(m) U0C

®1 < S2

0^» ©2» $2 nieznane /m(n-m) \1/2 ' L M

1 n } or(m) ^n-2; oc

o = 01 < 02

©2» & Z nieznane

(n-m)1/2 x2(m)/ff(m) lub

(n-m)1/2 x2(m)/(T>| (m)

^n-2 ; oc

^n-1 ; oc

01 ^ ®2» ^ = 1

0,] , ©2 nieznane m(S'm)(X2(m) - ^ ( m))2 > 1

o = 01 ^ 02 , #2 = 1

02 nieznane (n-m)(x2(m))2 ?1

»1 ^«2

6-1» ©2» 2 nieznane

m(n-m) ^ 2(m) "

n 0'2(m) F1,n-2;a

0 = 01 ^ 02

0 2 , (5 nieznane2

(n-m) x2(m)/S(m) lub

(n-m) x2(m)/^1(m)

F1 ,n-2; oc

F1,n-1;a

m n

<5^(m) = (n-1)"1(^] x? + (xi-x2(m))2 ) i=1 i=m+1

(35)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU W CI£GU ZMIENNYCH... 67

ne dla weryfikacji odstępstw od modelu w modelach regresji linio- wej. Testy takie zostały między innymi opisane przez Ramseya (1969) i Thalheima (1977).

Porównanie testów. Trudno jest obliczyć i porównać moce posz- czególnych testów. Deshayes i Picard (1980) wykazują asymptotyczną optymalnośó testu ilorazu wiarogodności przy znanych wartościach oczekiwanych 0 ^ ^ Q2 (U, W w tabl. 2.1) w klasie testów niezmien- niczych ze względu na parametry położenia i skali.

Statystyki T^ i T^ przy danym momencie zmiany m i ó- = 0^ - 0^

mają rozkład normalny również przy alternatywach H^(m) tak, że moż- na natychmiast podać funkcje mocy testów opartych na Tn bądź T*

(Chernoff i Zacks (1964)). Dokładne postacie funkcji mocy pozosta- łych, przedstawionych w tablicy 2.2, testów ani testów opartych na ilorazie wiarogodności (tabl. 2.1) nie są znane.

Dla prostego testu skumulowanych sum o granicy (2.4) oraz kwa- dratowego testu skumulowanych sąm, którego obszar przyjęcia jest zdefiniowany przez (2.5) Deshayes i Picard (1979) podają dla przy- padku znanej wariancji asymptotyczną postać błędu drugiego rodzaju.

W celu porównania różnych proponowanych testów wielokrotnie prze prowadzano badania metodą Monte Carlo. Sen i Srivastava (1975a, b, c) wykonali badania metodą Monte Carlo dla różnych s y t u a c j i p o - równując każdorazowo test oparty na podejściu bayesowskim z odpowia- dającym testem opartym na ilorazie wiarogodności. Wśród nich żaden nie okazał się jednostajnie najmocniejszy. Ponadto okazało się, że utworzone przy jednakowych założeniach testy oparte na podejściu

(*)Opisanych w tablicy 2.2 (przyp. tłum.).

(36)

bayesowskim (P, ; P, P^; P*, P*) pod względem mocy prawie nie różnią się.

Dla testu ilorazu wiarogodności, prostego testu skumulowanych sum o granicach (2.4) i kwadratowego testu skumulowanych sum z ob- szarem przyjęcia (2.5) Deshayes i Picard (1980) wykonali badania asymptotyczne zdolności rozdzielczej oraz badania metodą Monte Car- lo w celu porównania mocy. Reasumując, doszli oni do następującego rezultatu: Przy jednakowym poziomie istotności test ilorazowy jest lepszy niż obydwa testy oparte na skumulowanych sumach. Przy małych zmianach S' = 0^ - 6^ oraz wczesnej zmianie rozkładu (małe m) prosty test skumulowanych sum jest lepszy niż kwadratowy.

Dotychczas nie zostały przeprowadzone badania mocy dla testów opartych na zasadzie „union-intersection" ani dla testów, które we- ryfikują odchylenia od modelu.

2.2. Estymatory momentu zmiany rozkładu

Hinkley (1970, 1971, 1972) bada estymatory największej wiarogod- ności oraz estymatory oparte na skumulowanych sumach. Estymatory bayesowskie są omawiane przez Smitha (1975), Holberta i Broemelin- ga (1977), Schulze (1982) i Hsu (1982).

Estymator największej wiarogodności. Definicje estymatorów najwięk- szej wiarogodności m przy różnych założeniach o pozostałych parame- trach modelu znajdują się w tablicy 2.4. Hinkley (1970) podaje re- kurencyjną postać asymptotycznego rozkładu estymatora m. W każdym z rozważanych przypadków asymptotyczny rozkład m jest jednakowy.

Jest on symetryczny względem m i zależy od parametru A = '2^r|^2~®ll

(37)

IDENTYFIKACJA MOMENTU ZMIANY ROZKŁADU ¥ CI^GU ZMIENNYCH... 69

Tablica 2.A-. Estymatory największej wiarogodności momentu zmiany

2 2

rozkładu normalnego N(0^, 6 ) na N(02» 6 ) Założenia Estymator największej wiarogodności m

0,, Q1 20 znane

m

m = arg max Y] X "

me {1, ... ,n-1] ± = 1

0,j znane, m = arg max (n-m)(x9 (m ) - 0., )2 = me {1, . . . ,n-1}

02 nieznane = arg max (n-m) ^ ■ Z (x, - e p j 2

_i=m+1 J

0 , G2 nieznane m = arg A max me {1, .. .

n

m* (n-m)/- / \ - ( \\2

-- ---- (x9 (m) - x1(m)) =

n-1} n 2 1

’ m |

J 2

— arg max —7m(n-m)---

Hinkley podaje tablicę asymptotycznych prawdopodobieństw

PA (in = m + k) i PA (m ^ m + k) dla k = 0, 1, ..., 10, 12, 14, ..., 20 i A = 0.5(0.1)1.5. Jeżeli parametr A jest nieznany, to stoso- wany jest pewien estymator A .

Estymator oparty na skumulowanych sumach. Wychodząc od skumulowa- nych sum

= 0, - Z o

i=1 - 0. + S 6 ),

(38)

które Page wykorzystywał przy weryfikacji hipotezy o stabilności parametru (por. str. 58), Hinkley (1971) definiuje przy założeniu

0p < 0^ estymator

m = inf (t: St ^ Su , u = 1, ..., n) .

Dodatkowo przyjmuje się, że 0^ i S są znane.

Przy założeniu 0^ - 0^ > && Hinkley podaje asymptotyczny roz- kład m. Jeśli 6,| jest znane oraz stosujemy & = (9^ - 02 )> to ^ jest zgodny z estymatorem największej wiarogodności m.

Estymatory bayesowskie. Tak jak w wypadku rozkładu dwupunktowego można zdefiniować estymatory bayesowskie jako:

m = arg . max p (m) B me {1, ... ,n-1} n oraz

4 ,

m = arg m m E / =

B jji e {1, ... ,n-1] pn W

gdzie Pn (m ) oznaczają prawdopodobieństwa a posteriori wartości m względem danego rozkładu a priori nieznanych parametrów i obserwa- cji x,|, ..., x^. Ep (m )(m ) oznacza wartość oczekiwaną m a posterio- ri. W literaturze zakładano rozmaite rozkłady a priori dla niezna-

Cytaty

Powiązane dokumenty

lądowy, a latem ląd się szybciej nagrzewa niż wody morskie (Borneo jest

Z podanych wyrazów ułóż zdania, pytania lub przeczenia w czasie Present Perfect dodając for lub since tam, gdzie to konieczne.. Smith/ have/ this

[r]

Naj… Europy -czyli - rzeka wyspa, półwysep, góry, szczyt, depresja, jezioro itp.. Sąsiedzi Polski wraz

Pojęcia do wyjaśnienia np.: Klima, pogoda, pasat, wyspa, półwysep, gejzer, wiatr, zatoka, rzeka główna, dopływ, dorzecze itp..  MIŁEJ ZABAWY I OWOCNEJ NAUKI

JeŜeli uczeń wykonuje obliczenia w cm, a wcześniej źle zamienił metry na centymetry, wówczas otrzymuje punkt za realizację tego kryterium, jeŜeli poprawnie obliczył 0,7

Uwaga: Przyznajemy punkt za II kryterium takŜe wtedy, gdy uczeń poprawnie wykonał diagram, a nie otrzymał punktu w kryterium I ( niewłaściwe uporządkowanie).. (południowo-wschodnim

Który wariant określa uporządkowanie poziomów bezpieczeństwa systemów od najbardziej do najmniej bezpiecznych:A. Kategorie bezpieczeństwa: Ochronę świadczonych usług