• Nie Znaleziono Wyników

Index of /rozprawy2/10474

N/A
N/A
Protected

Academic year: 2021

Share "Index of /rozprawy2/10474"

Copied!
76
0
0

Pełen tekst

(1)Akademia Górniczo-Hutnicza im. Stanisława Staszica Wydział Matematyki Stosowanej Katedra Analizy Matematycznej, Matematyki Obliczeniowej i Metod Probabilistycznych. Rozprawa doktorska. APROKSYMACJE NAJMOCNIEJSZYCH NIEZMIENNICZYCH TESTÓW ZGODNOŚCI DLA ROZKŁADÓW WIELOWYMIAROWYCH. Piotr Majerski. Promotor: dr hab. Zbigniew Szkutnik. Kraków 2011.

(2) Spis treści 1 Wstęp. 8. 2 Rozwinięcia Laplace’a 12 2.1 Rozwinięcia asymptotyczne typu Poincar´ego i lemat Watsona . 14 2.2 Formalne rozwinięcie Laplace’a . . . . . . . . . . . . . . . . . 17 3 Przybliżenia najmocniejszych testów niezmienniczych 3.1 Dokładne najmocniejsze niezmiennicze testy zgodności . . . . 3.1.1 Przypadek jednowymiarowy . . . . . . . . . . . . . . . . . . 3.1.2 Przypadek wielowymiarowy . . . . . . . . . . . . . . . . . . . 3.1.3 Najmocniejsze testy niezmiennicze w modelu regresji liniowej 3.2 Quasi-najmocniejsze testy niezmiennicze dla rozkładów jednowymiarowych . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Przybliżenia najmocniejszych testów niezmienniczych w modelu regresji liniowej . . . . . . . . . . . . . . . . . . . . . . . 3.4 Testowanie dwuwymiarowej normalności przeciwko dwuwymiarowej jednostajności . . . . . . . . . . . . . . . . . . . . . 3.5 Rozszerzenia na wyższe wymiary . . . . . . . . . . . . . . . . 3.6 Testowanie dla dwuwymiarowej alternatywy wykładniczej i rozszerzenia na większe wymiary . . . . . . . . . . . . . . . . . 3.7 Symulacje Monte Carlo mocy testów i przykład z danymi rzeczywistymi . . . . . . . . . . . . . . . . . . . . . . . . . . .. 27 27 27 29 30 31 33 34 42 44 45. 4 Rozwinięcia asymptotyczne mocy testów przybliżonych 53 4.1 Główny rezultat . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.2 Przykłady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 5 Podsumowanie. 68. 6 Oznaczenia i skróty. 76.

(3) Podziękowania Chciałbym serdecznie podziękować mojemu Promotorowi Prof. Zbigniewowi Szkutnikowi za cały trud włożony w opiekę nad moim rozwojem naukowym. Dziękuję za wskazywanie kierunków badań, wszelkie dyskusje i współpracę naukową, która, między innymi, zaowocowała niniejszą rozprawą i cytowanymi w niej artykułami.. Dziękuję mojej Żonie Kasi za miłość, wsparcie i nieustanną próbę zarażania mnie wiarą w sukces. Dziękuję też całej mojej Rodzinie.. Praca nad tą rozprawą była wspierana przez Ministerstwo Nauki i Szkolnictwa Wyższego w ramach grantu promotorskiego nr N N201 527438..

(4) Streszczenie Praca podejmuje zagadnienie optymalnych testów zgodności bazujących na obserwacji niezależnych wektorów losowych o tym samym rozkładzie. Testowanie zgodności rozkładu dla wielowymiarowej próby prostej jest szczególnie ważne w kontekście weryfikacji założenia o wielowymiarowej normalności. Biorąc pod uwagę ogrom literatury dotyczącej testów uniwersalnych wielowymiarowej normalności, stosunkowo niewiele wyników dotyczy kwestii testów kierunkowych. W niniejszej rozprawie zajmiemy się tym drugim zagadnieniem i rozważać będziemy hipotezy o rodzinach rozkładów, które są niezmiennicze ze względu na transformacje afiniczne i które w szczególnym przypadku opisują rodzinę wielowymiarowych rozkładów normalnych. Ogólna postać najmocniejszych testów niezmienniczych dla rozważanych alternatyw jest znana, ale ich jawne wyznaczenie jest zwykle zbyt trudne ze względu na trudności techniczne związane z obliczaniem skomplikowanych wielowymiarowych całek. Podobne problemy dla przypadku danych jednowymiarowych zrodziły pomysł przybliżania statystyk testowych najmocniejszych testów niezmienniczych. Badania prowadzone w minionej dekadzie zaowocowały konstrukcją takich przybliżeń przy użyciu metody Laplace’a aproksymacji całek. W efekcie powstała nowa gałąź badań tzw. quasi-najmocniejszych testów niezmienniczych. W rozprawie podejmujemy próbę zastosowania tej metodologii do najmocniejszych testów niezmienniczych dla danych wielowymiarowych, a także zbadania związku rozwinięć asymptotycznych statystyk testowych i rozwinięć mocy odpowiadających im testów. Szczegółowo rozważane będą testy dwuwymiarowej normalności przy alternatywach generowanych przez rozkład jednostajny na kwadracie oraz dwuwymiarowy rozkład wykładniczy. W obu przypadkach skonstruowane zostaną przybliżenia statystyk testowych przy użyciu metody Laplace’a. Dla tak uzyskanych statystyk wyprowadzimy dalsze rozwinięcia, co, jak pokażemy, prowadzi do testu ilorazu wiarogodności. Przedyskutowane zostaną rozszerzenia tych wyników na przypadek większych wymiarów. Wyniki teoretyczne zostaną zweryfikowane za pomocą symulacji mocy.

(5) metodą Monte Carlo. Pokażemy, że przybliżenia działają dobrze już dla niedużych wielkości próby. Symulacyjnie wyznaczone zostaną przybliżone górne oszacowania mocy dowolnych testów niezmienniczych w rozpatrywanych problemach. Przedstawimy i przedyskutujemy ogólny wynik, pozwalający oszacować tempo zbieżności do zera różnicy mocy testu i jego przybliżenia w zależności od rzędu stochastycznej zbieżności do zera różnicy statystyk testowych obu testów. Zastosowanie tego wyniku do wyprowadzonych wcześniej rozwinięć dla statystyk testów pozwala uzyskać rozwinięcia ich mocy, oraz rzuca nowe światło na koncepcję przybliżeń testów metodą asymptotycznych rozwinięć statystyk testowych, w tym quasi-najmocniejszych testów niezmienniczych.. Słowa kluczowe metoda Laplace’a, najmocniejszy test niezmienniczy, quasi-najmocniejszy test niezmienniczy, rozwinięcie asymptotyczne, test ilorazu wiarogodności, test przybliżony.

(6) Abstract The main scope of the thesis are optimal goodness-of-fit tests based on the observation of independent, identically distributed random vectors. Testing goodness-of-fit for the multivariate sample is especially important in the context of multivariate normality. Compared to the myriad of results concerning the omnibus tests, a relatively minor attention has been paid to the case of directed tests. In this thesis, we focus on the latter problem in a more general setup and consider the hypotheses on the families of distributions that are invariant with respect to affine transformations, with multinormal distributions as a special case. A general form of the most powerful invariant tests for such alternatives is known, but their closed form is usually too complicated, due to intractable multivariate integrals. Similar problems in the case of univariate data led to the idea of approximation of test statistics of the most powerful invariant tests. In the past decade, constructions of such approximations have been developed using the Laplace method of expansions of integrals. Consequently, a new branch of research emerged, devoted to quasi-most powerful invariant tests. In this dissertation, we make an attempt to apply this methodology to the most powerful invariant tests for multivariate data, as well as to investigate a possible relation between the asymptotic expansions of test statistics and the expansions for powers of the corresponding tests. We consider in detail tests of binormality against the alternatives generated by both the uniform distribution on the square and the bivariate exponential distribution. In both cases, the approximations for the test statistics are constructed using the Laplace method. For the obtained statistics, some further expansions are developed, which, as we show, leads to the likelihood ratio tests. Some extensions to higher dimensions are also discussed. These theoretical results are verified using the Monte Carlo simulations for the powers of the tests. We show that the approximations work well, even for small sample sizes. The approximate upper bounds for the power of any invariant test in the problems under study are computed through simulations. We provide and discuss a general result, that can be used to estimate the.

(7) rate of convergence to zero of a difference between the powers of the exact and the approximate tests in function of the stochastic convergence rate of the statistics of both tests. Its application to the previously obtained approximations provides us with expansions of their powers and casts new light on the concept of approximating tests through the asymptotic expansions of test statistics, including the quasi-most powerful invariant tests.. Key words asymptotic expansion, Laplace method, likelihood ratio test, most powerful invariant test, perturbed test, quasi-most powerful invariant test.

(8) Rozdział 1 Wstęp U podstaw każdego wnioskowania statystycznego leży jakiś rozkład prawdopodobieństwa. W niektórych przypadkach rozkład ten determinuje optymalne, w sensie ustalonego kryterium, postępowanie; w innych, może być założeniem umożliwiającym zastosowanie pożądanej metody. Mocniejsze założenia pozwalają na mocniejsze wnioskowanie, ale niosą także ryzyko błędnych decyzji, gdy nie są spełnione. Między innymi z tego powodu zagadnienie testowania zgodności rozkładu stanowi jeden z fundamentalnych problemów statystyki matematycznej i cieszy się niesłabnącym zainteresowaniem w pracach badaczy na całym świecie. Przykładowo, w przeglądowej pracy z 2004 roku Mecklin i Mundfrom ([36]) wskazują istnienie w literaturze co najmniej 50 procedur służących do testowania wielowymiarowej normalności. Prace [30, 46, 45, 4, 21, 26, 12, 2, 51, 35, 37, 52] (kolejność chronologiczna) pokazują, że także po roku 2004 tematyka ta jest nadal żywa. W dalszej części, dla p, n ∈ N, będziemy rozważać n-elementową próbkę niezależnych p-wymiarowych obserwacji X1 , . . . , Xn o wspólnym rozkładzie absolutnie ciągłym względem miary Lebesgue’a na Rp . Niech f0 będzie ustaloną gęstością p-wymiarowego wektora losowego i niech f oznacza prawdziwą gęstość wektora X1 . Niech Θ = GL(p) × Rp , gdzie GL(p) jest zbiorem nieosobliwych macierzy p × p. Rozważmy problem testowania hipotezy n. o. H0 : f ∈ F0 = |det(A)|f0 (A(· − b)) : (A, b) ∈ Θ ,. (1.1). na poziomie istotności α ∈ (0, 1). Szczególnym przypadkiem tego problemu jest problem testowania wielowymiarowej normalności. Przy alternatywie będącej prostym zaprzeczeniem H0 test jednostajnie najmocniejszy do testowania (1.1) nie istnieje. Dlatego w literaturze rozważa się zasadniczo dwa rodzaje testów. Testy uniwersalne (ang. omnibus tests, overall tests) służą do testowania H0 przy ogólnej alternatywie i wymaga się od nich „rozsądnie”.

(9) 9. dużej mocy dla możliwie szerokiego spektrum alternatyw. Ponieważ klasa F0 jest niezmiennicza ze względu na transformacje afiniczne (z nieosobliwą macierzą przekształcenia), powszechnie akceptowanym wymogiem stawianym testom uniwersalnym jest niezmienniczość względem takich transformacji ([47, 19, 22, 27]). Drugą grupę testów stanowią testy kierunkowe (ang. directed tests), które cechuje wysoka moc dla ustalonej węższej rodziny alternatyw, co jednak, potencjalnie, może oznaczać ich bezużyteczność w przypadku innych alternatyw. Niech f1 będzie ustaloną gęstością wektora losowego na Rp . Rozważmy alternatywę postaci n. o. H1 : f ∈ F1 = |det(A)|f1 (A(· − b)) : (A, b) ∈ Θ .. (1.2). W problemie testowania H0 przy alternatywie H1 (w skrócie: (H0 ,H1 )) wymaga się od testów niezmienniczości względem nieosobliwych afinicznych transformacji danych. Zamiast zbioru Θ w (1.1) i (1.2) rozważa się również jego podzbiór Θ∗ = UT(p)×Rp ([47, 48]), gdzie UT(p) jest zbiorem górnych trójkątnych macierzy p × p o dodatnich elementach diagonalnych. Przyjmijmy oznaczenie H0∗ dla hipotezy zerowej n. o. (1.3). o. (1.4). H0∗ : f ∈ F0∗ = |det(A)|f0 (A(· − b)) : (A, b) ∈ Θ∗ , i rozważmy alternatywę postaci n. H1∗ : f ∈ F1∗ = |det(A)|f1 (A(· − b)) : (A, b) ∈ Θ∗ .. Odnotujmy, iż w problemie testowania wielowymiarowej normalności klasy F0 i F0∗ są identyczne, ale F1 i F1∗ są zwykle różne. Problem testowania hipotezy (1.3) przeciwko hipotezie (1.4) jest więc niezmienniczy ze względu na transformacje afiniczne z macierzą przekształcenia ze zbioru UT(p), ale niekoniecznie ze zbioru GL(p), dlatego rozważania trzeba zawęzić do testów niezmienniczych względem takich transformacji. Pionierskie wyniki z drugiej połowy lat 80-tych ubiegłego stulecia gwarantują istnienie i podają postać najmocniejszych testów niezmienniczych (NTN) dla problemów (H0 ,H1 ) i (H0∗ ,H1∗ ) ([48, 56]). Ich zastosowanie rodzi jednak problemy. Ze względu na trudności techniczne związane z obliczaniem skomplikowanych wielowymiarowych całek, w jawnej formie znane są jedynie testy dla najprostszych dwuwymiarowych alternatyw ([48]) i są one raczej skomplikowanej postaci. Rodzi to potrzebę przybliżania statystyk testowych tych testów, a naturalną ku temu drogą jest podjęcie próby konstrukcji asymptotycznych, przy n → ∞, rozwinięć kłopotliwych całek. Ta kwestia stanowi główną motywację i jeden z celów niniejszej rozprawy..

(10) 10. Inne ważne aspekty dotyczące problemów postaci (H0 ,H1 ), czy (H0∗ ,H1∗ ) stanowią: badanie związków między istniejącymi w literaturze testami oraz analiza ich mocy. Przykładowo, Cox ([14]) rozważając nieco ogólniejsze problemy (ale wyłącznie dla p = 1) zaproponował, między innymi, test oparty na ilorazie wiarogodności (IW). W dyskusji kończącej tą pracę, wymieniając najważniejsze nadal otwarte problemy, Cox wskazuje na analizę mocy zaproponowanych testów oraz dyskusję o „potencjalnych optymalnych własnościach asymptotycznych” testu opartego na IW. Jest oczywistym, że również w przypadku danych wielowymiarowych z p ­ 2 ten test jest naturalnym kandydatem, a powyższe kwestie nie mniej ważne. Podobnie, Szkutnik ([48]) z powodów, o których była mowa wcześniej, podaje heurystyczne przybliżenia dla statystyk testowych NTN w rozważanych problemach. Badania nad wyjaśnieniem natury tych przybliżeń i ich formalne związki ze statystykami testowymi NTN stanowią kolejny cel niniejszej rozprawy. Wreszcie, w wielu, nie tylko tym rozważanym w tej pracy, kontekstach, asymptotyczne testy przybliżone konstruuje się poprzez znajdowanie takich przybliżeń statystyk testowych, które są asymptotycznie „bliskie” oryginalnym statystykom testowym. Wówczas zastępując wyjściowe statystyki przez ich asymptotyczne przybliżenia otrzymuje się testy przybliżone. Kwestią dotychczas nierozstrzygniętą był ogólny związek „rzędu bliskości” statystyk wyjściowych i odpowiadających im przybliżeń z „rzędem bliskości” mocy testów oryginalnych i przybliżonych. Ten krytyczny aspekt takiej analizy stanowi następne, ważne w odczuciu autora, zadanie, które stawia sobie niniejsza rozprawa. Rozdział 2 jest całkowicie poświęcony metodzie Laplace’a. Metoda ta stanowi podstawowe narzędzie w konstrukcji asymptotycznych aproksymacji całek, w tym takich, o których mowa w tej rozprawie. Zasadniczą częścią rozdziału 2 jest podrozdział 2.2, który przedstawia formalny dowód rozwinięcia Laplace’a dla dwóch najważniejszych przypadków, tj. tzw. wersji „regularnej” oraz tzw. wersji „brzegowej”. Podane będą szczegółowe dowody, gdyż autorowi tej rozprawy nie są znane żadne kompletne, opublikowane dowody tych twierdzeń w wersji używanej w tej rozprawie, choć szkice wyprowadzeń można znaleźć w wielu źródłach. Dodatkowo, w przypadku wersji „regularnej” uzyskany jest istotnie nowy fakt pokazujący, że oczekiwany zwykle rząd zbieżności metody 1/n, wymaga od stosownych funkcji stosunkowo wysokiej regularności i że nie jest to tylko techniczne założenie przyjmowane na potrzeby dowodu. Pokazujemy, że w√przypadku tylko trochę mniej regularnym poprawnym rzędem jest już 1/ n. W pierwszym podrozdziale rozdziału 3 przedstawione są znane dokładne wyniki o NTN dla problemu (H0∗ ,H1∗ ) w przypadku danych jednowymiarowych (p = 1, podrozdział 3.1.1) i wielowymiarowych (p ­ 2, podrozdział 3.1.2) oraz.

(11) 11. w podobnym problemie dla modelu regresji liniowej (podrozdział 3.1.3). We wszystkich przypadkach odpowiednie statystyki testowe NTN wyrażają się za pomocną trudnych do wyliczenia całek i jawna znajomość testów ogranicza się, do niewielkiej liczby alternatyw. W dwóch kolejnych podrozdziałach omówione są aproksymacje testów dla p = 1 oraz w modelu regresji liniowej, bazujące na asymptotycznych rozwinięciach całek przy użyciu metody Laplace’a. Podrozdziały 3.1, 3.2 i 3.3 nakreślają stan wiedzy o NTN w dotychczasowej literaturze. Pozostałe podrozdziały rozdziału 3 oparte są na wynikach autora z pracy [31]. Zawierają one wyprowadzenie przybliżeń statystyk testowych NTN dla problemu (H0∗ ,H1∗ ) z p = 2 i dwóch typów alternatyw: dwuwymiarowego rozkładu jednostajnego i dwuwymiarowego rozkładu wykładniczego. Następnie, w obu przypadkach, pokazany jest formalny związek między tak otrzymaną statystyką, a statystyką testową testu IW, wyrażony oszacowaniem rzędu zbieżności różnicy tych statystyk. Przedstawione są również pewne rozszerzenia tych wyników na przypadek p ­ 3. Rozdział kończą symulacje mocy rozważanych testów i przykład z danymi rzeczywistymi. Rozdział 4 przedstawia pewien ogólny wynik dla problemu mocy testów przybliżonych, o którym mowa była wyżej. Wprowadzone są warunki regularności, przy których można podać zależność między rzędem stochastycznej zbieżności do zera błędu przybliżenia statystyki dokładnej przez przybliżoną, a rzędem zbieżności do zera różnicy mocy obu testów. Za pomocą kontrprzykładów pokazujemy istotną konieczność najważniejszych spośród zaproponowanych warunków, pokazując w szczególności, że ich pominięcie może prowadzić do złej aproksymacji mocy testu, tj. przypadku, w którym różnica mocy obu testów nie zbiega do zera mimo arbitralnie dobrego rzędu przybliżenia statystyki testowej. Rozdział kończy zastosowanie głównego wyniku do rozwinięć otrzymanych w rozdziale 3, co odpowiada na pytanie postawione przez Coxa w przypadku hipotez rozważanych w niniejszej rozprawie. Treść rozdziału 4 bazuje na wynikach autora, opublikowanych w pracy [32]..

(12) Rozdział 2 Rozwinięcia Laplace’a Niech, dla D ⊂ Rk , f : D → R będzie funkcją posiadającą dokładnie jedno minimum globalne t0 w D, natomiast g : D → R niech będzie funkcją ciągłą w t0 i załóżmy, że g(t0 ) 6= 0. Dla λ ­ 0 rozważmy całkę I(λ) =. Z. e−λf (t) g(t)dt. (2.1). D. i przyjmijmy, że f i g są takie, że dla dostatecznie dużych λ, I(λ) istnieje i jest skończona. W niniejszym rozdziale zajmiemy się konstrukcjami asymptotycznych przybliżeń całki I(λ), przy λ zbiegającym do nieskończoności. Całki postaci (2.1) nazywane są całkami typu Laplace’a, a ich asymptotyczne przybliżenia rozwinięciami Laplace’a. Zauważmy, że gdy λ rośnie, to po znormalizowaniu masa funkcji podcałkowej coraz bardziej koncentruje się w kurczącym się otoczeniu t0 , a poza nim znormalizowana funkcja podcałkowa degeneruje się do zera. Ilustrują to wykresy na rysunku 2.1. Obserwując ewolucję funkcji podcałkowej z rysunku 2.1 widzimy, że o ile dla małych λ jej przebieg zależy od przebiegów f i g (w szczególności dla λ = 0 pod całką mamy g(t)), o tyle dla coraz to większych λ efekt przebiegów zostaje wygaszony, a prawie cała masa znormalizowanej funkcji podcałkowej zostaje ściągnięta w otoczenie punktu t0 . Można więc podejrzewać, że asymptotycznie, przy λ → ∞, wartość całki I(λ) zdeterminowana jest przez zachowanie się funkcji f w otoczeniu punktu t0 oraz wartość g(t0 ). By to lepiej zrozumieć i scharakteryzować wiodący wyraz przybliżenia, rozważmy szczególny przypadek k = 1, D = [a, b] i g ≡ 1. Przyjmijmy też, że t0 leży we wnętrzu D, f ∈ C 2 (a, b), t0 jest silnym minimum globalnym funkcji f , oraz że f 00 (t0 ) > 0. Z rozwinięcia Taylora możemy więc w otoczeniu t0 , powiedzmy (t0 − , t0 + ), zapisać 1 f (t) ≈ f (t0 ) + f 00 (t0 )(t − t0 )2 . 2. (2.2).

(13) λ = 0.5. λ=0. λ=1. 0.6. 1.5. 0.3. 0.4. 1.0. 0.2. 0.1. 0.2 2. 2 0. −2. x. 0 2. 0. −2. y. −2. x. 0 2. (a). 2 0. −2. y. −2. x. 0 2. (b). λ=5. y. −2. (c). λ = 15. λ = 50. 2e−07 0.004 1e−22 1e−07. 0.002 2 0.000. 2 0e+00. 0. −2. x. 0 2. (d). −2. y. 2 0e+00. 0. −2. x. 0 2. (e). −2. y. 0. −2. x. 0 2. y. −2. (f). 13. Rysunek 2.1: Funkcja podcałkowa z (2.1) w przypadku k = 2, D = [−3, 3]2 , f (x, y) = ln(x2 + 1) + ln(y 2 + 1) + 1 i g(x, y) = (2 + sin(2x))−1 + (2 + cos(2y))−1 dla coraz większych wartości λ. Wraz ze wzrostem λ, masa funkcji podcałkowej coraz wyraźniej gromadzi się wokół minimum globalnego funkcji f , tj. punktu t0 = (0, 0)..

(14) 2.1 Rozwinięcia asymptotyczne typu Poincar´ ego i lemat Watsona. 14. Dla dużych wartości λ mamy I(λ) ≈. Z t0 +. e−λf (t) dt. t0 −. i dalej z (2.2) dostajemy I(λ) ≈ e−λf (t0 ). Z t0 +. e−λf. 2 00 (t ) (t−t0 ) 0 2. dt. t0 −. s −λf (t0 ). =e. Z √λf 00 (t0 ) 1 −x2 2π √ · e 2 dt √ λf 00 (t0 ) − λf 00 (t0 ) 2π. Gdy λ → ∞, to ostatnia całka zbiega do 1 i ostatecznie otrzymujemy s. I(λ) ≈ e−λf (t0 ). 2π . λf 00 (t0 ). Powyższe nieformalne rozumowanie pozwala zrozumieć ideę rozwinięcia Laplace’a, a ostatnie wyrażenie przedstawia wyraz wiodący tego przybliżenia.. 2.1. Rozwinięcia asymptotyczne typu Poincar´ ego i lemat Watsona. ¯ gdzie D ¯ ozNiech D ⊂ R będzie przedziałem otwartym i niech x0 ∈ D, nacza domknięcie przedziału D. Mówimy, że x → x0 w D, jeśli x → x0 przez wartości ze zbioru D. Poniższe definicje są nieco zmodyfikowanymi dla potrzeb tej pracy definicjami z [11] (zob. również [13, 20, 38], gdzie definicje te występują w jeszcze innych wersjach). Definicja 1. Ciąg funkcji {φn (x)}N n=0 zadanych na D nazywamy ciągiem asymptotycznym przy x → x0 w D, jeśli dla każdego n = 0, . . . , N , φn+1 (x) = o(φn (x)), gdy x → x0 w D.. (2.3). Definicja 2. Niech f (x) będzie funkcją określoną na D i niech {φn (x)}N n=0 będzie ciągiem asymptotycznym przy x → x0 w D. Niech {an }N będzie n=0 P ciągiem liczbowym. Sumę N a φ (x) nazywamy rozwinięciem asympton=0 n n tycznym funkcji f (x) przy x → x0 ze względu na {φn (x)}, jeśli dla K ∈ {1, . . . , N } zachodzi warunek f (x) =. K−1 X. an φn (x) + O(φK (x)), gdy x → x0 w D.. n=0. Rozwinięcie to nazywane jest rozwinięciem typu Poincar´ ego.. (2.4).

(15) 2.1 Rozwinięcia asymptotyczne typu Poincar´ ego i lemat Watsona. 15. Warto podkreślić, iż rozwinięcia typu Poincar´ego rozważa się zwykle dla P nieskończonych ciągów asymptotycznych i że wtedy szereg ∞ n=0 an φn (x) nie musi być zbieżny (por. przykład 1), a ponadto nie każdy zbieżny szereg funkcyjny jest rozwinięciem asymptotycznym swojej sumy (por. przykład 2). Ta rozprawa wykorzystuje wyłącznie skończone rozwinięcia, a praktyczne zastosowania ograniczają się do przypadku N = 1, czyli do rozwinięć postaci f (x) = a0 φ0 (x) + O(φ1 (x)), gdy x → x0 , które można również zapisać jako !!. φ1 f (x) = a0 φ0 (x) 1 + O (x) φ0. , gdy x → x0 .. Przykład 1. Przykład ten zaczerpnięty jest z pracy [8], str. 55. Dla λ > 0 R rozważmy funkcję Ψ(λ) = λ∞ φ(x)dx, gdzie φ(x) jest gęstością standardowego rozkładu normalnego. Wyprowadzimy rozwinięcie asymptotyczne dla funkcji R przeżycia Ψ(λ) przy λ → ∞. W tym celu zapiszmy Ψ(λ) = λ∞ (−x−1 )φ0 (x)dx. Wykonując całkowanie przez części, dostajemy φ(λ) Z ∞ φ(x) Ψ(λ) = − dx. λ x2 λ Powtarzając całkowanie przez części k-krotnie z k ­ 2, otrzymujemy Ψ(λ) =. 1 1 1·3 φ(λ) − 3 φ(λ) + 5 φ(λ) − . . . + λ λ λ Z ∞ (2k − 3)!! k (2k − 1)!! + (−1)k+1 φ(λ) + (−1) φ(x)dx, λ2k−1 x2k λ. (2.5). gdzie (2k −1)!! = 1·3·. . .·(2k −1). Niech a0 = 1 oraz an = (−1)n (2n−1)!! dla n ­ 1. Oznaczmy przez φn (λ) = λ−2n−1 φ(λ) dla n = 0, 1, . . .. Dla dowolnego N ∈ N, {φn }N n=0 jest ciągiem asymptotycznym przy λ → ∞. Ponadto, dla dowolnego N ∈ N zachodzi (2.4), bowiem szacując resztę w (2.5), mamy dla dowolnego K ∈ N,

(16)

(17) K−1

(18)

(19) X

(20)

(21) Ψ(λ) − an φn (λ)

(22)

(23)

(24)

(25) n=0. (2K − 1)!! (2K − 1)!! Z ∞ φ(x)dx φ(x)dx ¬ x2K λ2K λ λ (2K − 1)!! Z ∞ x (2K − 1)!! ¬ φ(x)dx = φ(λ) 2K λ λ2K+1 λ λ = O(φK (λ)), przy λ → ∞. =. Z ∞.

(26) 2.1 Rozwinięcia asymptotyczne typu Poincar´ ego i lemat Watsona. 16. Suma N n=0 an φn (λ) jest dla dowolnego N ∈ N rozwinięciem asymptotycznym typu Poincar´ego przy λ → ∞. W takim sensie definiuje się nieskończone rozwinięcia asymptotyczne. Łatwo jednak zauważyć, że dla dowolnego λ > 0 szereg ! ∞ ∞ X X φ(λ) an φn (λ) = 1+ (−1)n (2n − 1)!!(λ−2 )n (2.6) λ n=0 n=1 P. jest rozbieżny, bo dla cn := (−1)n (2n − 1)!! mamy limn→∞ |cn+1 /cn | = ∞, a więc szereg potęgowy po prawej stronie (2.6) jest dla każdego λ > 0 rozbieżny. n Przykład 2. Dla każdego x ∈ R mamy ex = ∞ n=0 x /n!. Nie jest jednak P∞ prawdą, że dla dowolnego x0 ∈ R szereg n=0 xn /n! jest rozwinięciem asymptotycznym typu Poincar´ego funkcji f (x) = ex . Warunek (2.4) zachodzi dla wszystkich skończonych x0 , ale jedyną wartością x0 , dla której ciąg {xn }∞ n=0 jest ciągiem asymptotycznym jest x0 = 0. Jest to więc jedyna wartość x0 , dla P n której szereg ∞ n=0 x /n! jest nieskończonym rozwinięciem asymptotycznym typu Poicar´ego swojej sumy ex .. P. Następujący lemat, który jest sformułowaniem lematu Watsona ([55]) dla skończonych ciągów asymptotycznych (patrz [11, str. 103], [13, str. 49], [20, str. 44], [38, str. 71]), zostanie użyty do formalnego wyprowadzenia aproksymacji Laplace’a. Lemat 1. Niech g(t) będzie funkcją zmiennej rzeczywistej t > 0, natomiast µ > 0, σ > 0 i N ∈ N niech będą ustalonymi liczbami. Ponadto, niech przy t → 0+ , N X. an tσ(n+µ)−1. n=0. będzie rozwinięciem typu Poincar´ego dla g(t). Wówczas, przy λ → ∞, N X. an Γ(σ(n + µ)) λσ(n+µ) n=0 jest rozwinięciem typu Poincar´ego dla I(λ) =. Z ∞. e−λt g(t)dt,. 0. o ile całka I(λ) istnieje i jest skończona dla dostatecznie dużych λ..

(27) 2.2 Formalne rozwinięcie Laplace’a. 17. Uwaga 1. Teza lematu 1 jest prawdziwa również dla całki Ib (λ) =. Z b. e−λt g(t)dt,. 0. gdzie b > 0 jest ustaloną liczbą, bo można zdefiniować g˜(x) := g(x)1(0,b) (x). Wówczas g˜ ma przy t → 0+ to samo rozwinięcie co g oraz dla dowolnego λ, dla którego Ib (λ) istnieje, mamy Ib (λ) =. 2.2. Z ∞. e−λt g˜(t)dt.. 0. Formalne rozwinięcie Laplace’a. Heurystyczne rozumowanie z początku tego rozdziału można znaleźć w wielu klasycznych podręcznikach (np. [20, str. 46], [11, str. 180], lub [8, str. 60]). Trudniej jest znaleźć formalne wyprowadzenie rozwinięcia Laplace’a przy możliwie słabych założeniach. Poniżej podajemy własną wersję twierdzenia i własny dowód, którego szkielet jest identyczny z dowodem z [11, str. 183]. Autorzy tego ostatniego dowodu podają jednak wyłącznie tezę (ii) naszego twierdzenia 1 przy mocniejszych niż tu założeniach (przyjmują f ∈ C 4 [a, b] i g ∈ C 2 [a, b]), oraz nie podają żadnych szczegółów wyprowadzenia kluczowego rozwinięcia (5.1.16) na str. 184 (tutaj (2.22)). W dowodzie będziemy używać następującego lematu, który jest nieco zmodyfikowaną wersją twierdzenia Taylora. Tej wersji twierdzenia nie udało się znaleźć w standardowej literaturze, więc podajemy je z dowodem. Lemat 2. Niech  > 0, t0 ∈ R i niech f : (t0 − , t0 + ) → R. Załóżmy, że dla pewnego n ∈ {0, 1, . . . }, istnieje f (n) lipschitzowska na (t0 − , t0 + ). Wówczas f (t) =. n X.   f (i) (t0 )(t − t0 )i + O (t − t0 )n+1 , i! i=0. przy t → t0 ,. (2.7). gdzie, dla i = 1, . . . , n, f (i) oznacza i-tą pochodną funkcji f oraz f (0) = f . Dowód (i): Z założenia o lipschitzowskości wynika, że istnieje L > 0, takie, że ∀t ∈ (t0 − , t0 ) ∪ (t0 , t0 + ) :.

(28)

(29)

(30) f (n) (t) − f (n) (t )

(31) 0

(32)

(33)

(34)

(35)

(36)

(37) t − t0. ¬ L.. (2.8). Dla n = 0, (2.7) wynika wprost z (2.8). Przyjmijmy więc, że n ­ 1. Dla a 6= b, przez I[a, b] (I(a, b)) będziemy oznaczać przedział domknięty (otwarty) o.

(38) 2.2 Formalne rozwinięcie Laplace’a. 18. końcach w zbiorze {a, b}. Weźmy t ∈ (t0 − , t0 ) ∪ (t0 , t0 + ) i zdefiniujmy P funkcje g1 : I[t, t0 ] 3 x → f (x) − ni=0 f (i) (t0 )(x − t0 )i /i! oraz h1 : I[t, t0 ] 3 x → (x − t0 )n+1 . Z twierdzenia Cauchy’ego o wartości średniej, istnieje ξ1 ∈ I(t, t0 ), takie, że (i). i−1. )(ξ1 −t0 ) f 0 (ξ1 ) − ni=1 f (t0(i−1)! g1 (t) = h1 (t) (n + 1)(ξ1 − t0 )n. P. .. Niech teraz g2 : I[ξ1 , t0 ] 3 x → f 0 (x) − ni=1 f (i) (t0 )(x − t0 )i−1 /(i − 1)! oraz h2 : I[ξ1 , t0 ] 3 x → (n + 1)(x − t0 )n . Ponownie, z twierdzenia Cauchy’ego o wartości średniej, mamy dla pewnego ξ2 ∈ I(ξ1 , t0 ), P. (i). i−2. )(ξ2 −t0 ) f 00 (ξ2 ) − ni=2 f (t0(i−2)! g2 (ξ1 ) g1 (t) = = h1 (t) h2 (ξ1 ) (n + 1)n(ξ2 − t0 )n−1. P. .. Powtarzając to rozumowanie i definiując analogicznie kolejne pary funkcji (gi , hi ) otrzymujemy f (n) (ξn ) − f (n) (t0 ) g1 (t) = , h1 (t) (n + 1)n · · · 2(ξn − t0 ) dla pewnego ξn ∈ I(t, t0 ). Zatem, dla t ∈ (t0 − , t0 ) ∪ (t0 , t0 + ),

(39)

(40) P

(41) f (i) (t0 )(t−t0 )i

(42)

(43) f (t) − n

(44) i=0 i!

(45)

(46)

(47)

(48) n+1 (t − t0 )

(49)

(50). =.

(51)

(52)

(53) g (t)

(54)

(55) 1

(56)

(57)

(58)

(59) h1 (t)

(60).

(61).

(62).

(63) f (n) (ξ ) − f (n) (t )

(64) 1 n 0

(65)

(66) =

(67)

(68)

(69) (n + 1)!

(70) ξn − t0. ¬. L , (n + 1)!. gdzie w ostatniej nierówności użyliśmy (2.8). Twierdzenie 1 (Rozwinięcie Laplace’a - wersja regularna). Niech a < t0 < b. Załóżmy, że na przedziale [a, b] funkcja f osiąga wartość najmniejszą w t0 i f 00 (t0 ) > 0. Niech f 0 (t) 6= 0 dla t ∈ (a, b)\{t0 } oraz niech g(t0 ) 6= 0. Załóżmy, R że dla dostatecznie dużych λ > 0, całka I(λ) = ab exp(−λf (t))g(t)dt istnieje i jest skończona. (i) Jeśli, w pewnym otoczeniu t0 , f jest klasy C 3 , a g jest lipschitzowska, to s −λf (t0 ). I(λ) = e. g(t0 ).  2π  −1/2 1 + O(λ ) , λf 00 (t0 ). λ → ∞..

(71) 2.2 Formalne rozwinięcie Laplace’a. 19. (ii) Jeśli, w pewnym otoczeniu t0 , f jest klasy C 4 , a g 0 jest lipschitzowska, to s. I(λ) = e. −λf (t0 ). g(t0 ).  2π  −1 1 + O(λ ) , λf 00 (t0 ). λ → ∞.. Dowód (i): Zapiszmy I(λ) =. Z t0. exp(−λf (t))g(t)dt +. Z b. a. exp(−λf (t))g(t)dt. t0. = Ia (λ) + Ib (λ) i zajmijmy się najpierw całką Ib (λ). Podstawiając τ = f (t) − f (t0 ), otrzymujemy Ib (λ) =. Z b. exp(−λf (t))g(t)dt = e−λf (t0 ). t0. Z f (b)−f (t0 ). exp(−λτ )G(τ )dτ,. 0. gdzie

(72). g(t)

(73) ∈ R. (0, f (b) − f (t0 )) 3 τ → G(τ ) := 0

(74)

(75) f (t)

(76) t=f −1 (τ +f (t0 )) Krok 1 Rozwiniemy mianownik funkcji G(·) w prawostronnym otoczeniu τ = 0. W tym celu zdefiniujmy funkcję [0, f (b) − f (t0 )] 3 τ → u(τ ) := f −1 (τ + f (t0 )) ∈ [t0 , b] i zauważmy, że f 0 (u(τ )) ∼. q. 2f 00 (t0 )τ ,. τ → 0+ .. (2.9). Mamy bowiem f 0 (u(0+ )) = 0 i dalej, z reguły de l’Hˆospitala i z wykorzystaniem faktu f 0 (u(τ ))u0 (τ ) = [f (u(τ ))]0 = 1, {f 0 (u(τ ))}2 2f 00 (u(τ )) lim+ = lim+ = 2f 00 (t0 ), τ →0 τ →0 τ 1 co jest równoważne z (2.9). Stosując dwukrotnie regułę de l’Hˆospitala otrzymujemy, lim+. τ →0. f 0 (u(τ ))2 − 2f 00 (t0 )τ 2f 00 (u(τ )) − 2f 00 (t0 ) = lim 3√ τ →0+ τ 3/2 τ 2 s √ 8 000 τ 4 2 = lim+ f (u(τ )) 0 = f 000 (t0 ), 00 τ →0 3 f (u(τ )) 3 f (t0 ).

(77) 2.2 Formalne rozwinięcie Laplace’a. 20. gdzie w ostatniej równości skorzystaliśmy z (2.9). Mianownik funkcji G(·) można więc zapisać jako f 0 (u(τ )) =. q.  √  2f 00 (t0 )τ 1 + O( τ ) ,. τ → 0+ .. (2.10). Krok 2 Zajmijmy się teraz zachowaniem licznika G(·), gdy τ → 0+ . Mamy, korzystając z reguły de l’Hˆospitala u(τ ) − t0 √ = lim+ τ →0 τ. s. 2 f 00 (t0 ). .. (2.11). Z założeń o funkcji g możemy napisać g(t) = g(t0 ) + O(t − t0 ),. t → t0 ,. co w połączeniu z (2.11) daje √ g(u(τ )) = g(t0 ) + O( τ ),. τ → 0+ .. (2.12). Krok 3 Łącząc (2.10) i (2.12) otrzymujemy rozwinięcie G(τ ) = q. g(t0 ). 1. 2f 00 (t0 ). τ − 2 + O(1),. τ → 0+. i ostatecznie, z lematu 1 dla σ = 12 , µ = 1 oraz N = 1 dostajemy eλf (t0 ) Ib (λ) = q. Γ( 12 ) 1 + O , 1/2 λ 2f 00 (t0 ) λ g(t0 ).  . a stąd Ib (λ) = e. −λf (t0 ). s. g(t0 ).   π −1/2 1 + O(λ ) . 2λf 00 (t0 ). (2.13). Jest oczywiste, że całe powyższe rozumowanie można przeprowadzić dla całki Ia (λ) i otrzymać Ia (λ) = e. −λf (t0 ). s. g(t0 ). Teza (i) wynika z (2.13) i (2.14)..   π −1/2 1 + O(λ ) . 2λf 00 (t0 ). (2.14).

(78) 2.2 Formalne rozwinięcie Laplace’a. 21. Dowód (ii): Rachunki w tej części dowodu są dosyć żmudne. Dla kompletności prezentacji podajemy je ze szczegółami. Krok 1 Wyprowadzimy dalsze rozwinięcie mianownika G(·). Mamy lim. f 0 (u(τ )) −. q. √ 2f 00 (t0 ) τ. τ. τ →0+. = lim+. f 0 (u(τ √ )) τ. τ →0. √. q. − 2f 00 (t0 ) √ τ 0. 2. )) f 00 (u(τ )) − f (u(τ τ 2τ √ = 2 lim+ 0 · lim+ τ →0 f (u(τ )) τ →0 τ s 1 0 00 τ f (u(τ )) − 2 f (u(τ ))2 2 lim = f 00 (t0 ) τ →0+ τ 3/2. s. =. (2.15). 000. (u(τ )) f 00 (u(τ )) + τ ff 0 (u(τ − f 00 (u(τ )) 2 2 2f 000 (t0 ) )) √ · · lim = . f 00 (t0 ) 3 τ →0+ τ 3f 00 (t0 ). Otrzymujemy więc f 0 (u(τ )) −. q. √ 2f 00 (t0 ) τ −. 2f 000 (t0 ) τ 3f 00 (t0 ). τ. τ → 0+ .. = o(1),. (2.16). W celu dalszego rozwinięcia funkcji f 0 (u(·)) musimy określić rząd zbieżności w (2.16). Oznaczmy przez C = 2f 000 (t0 )/3f 00 (t0 ). Mamy, korzystając czterokrotnie z reguły de l’Hˆospitala, lim. f 0 (u(τ )) −. τ →0+. √ 2f 00 (t0 ) τ − Cτ. q. τ 3/2 √  τ f 00 (u(τ )) · f 0 (u(τ − )). = lim+ . = lim+. −. q. √ 2f 00 (t0 ) − C τ τ. τ →0. f 0 (u(τ √ )) 2 τ. τ. τ →0. f 0 (u(τ √ )) τ. . C − √  2 τ. √. =. 1 τ 2τ f 00 (u(τ )) − f 0 (u(τ ))2 − Cτ f 0 (u(τ )) lim+ 0 · lim+ 2 τ →0 f (u(τ )) τ →0 τ2 000. 1. = q 2 2f 00 (t0 ). 00. (u(τ )) (u(τ )) 2f 00 (u(τ )) + 2τ ff 0 (u(τ − 2f 00 (u(τ )) − Cf 0 (u(τ )) − Cτ ff 0 (u(τ )) )). 2τ √. 2τ f 000 (u(τ )) − Cf 0 (u(τ ))2 − Cτ f 00 (u(τ )) τ = q lim+ 0 · lim+ τ 3/2 4 2f 00 (t0 ) τ →0 f (u(τ )) τ →0 1. (4). 000. (u(τ )) (u(τ )) 2f 000 (u(τ )) + 2τ ff 0 (u(τ − 3Cf 00 (u(τ )) − Cτ ff 0 (u(τ 1 )) )) √ = lim+ 00 12f (t0 ) τ →0 τ.

(79) 2.2 Formalne rozwinięcie Laplace’a. 1 = 12f 00 (t0 ) =. 22. √ n o τ lim+ 0 · lim+ 2f (4) (u(τ )) − Cf 000 (u(τ )) + τ →0 f (u(τ )) τ →0. ". 1. h. q. 12f 00 (t0 ) 2f 00 (t0 ). i. 6f (4) (t0 ) − 7Cf 000 (t0 ) =. 9f 00 (t0 )f (4) (t0 ) − 7{f 000 (t0 )}2 q. 18 2f 00 (t0 )f 00 (t0 )2. .. Mianownik G(·) można zatem zapisać w postaci f 0 (u(τ )) =. q. √ 3 2f 000 (t0 ) 2f 00 (t0 ) τ + 00 τ + O(τ 2 ). 3f (t0 ). (2.17). Krok 2 Mamy, korzystając trzykrotnie z reguły de l’Hˆospitala, q q √ √ √ u(τ ) − t0 − f 00 2(t0 ) τ 2f 00 (t0 ) τ − f 0 (u(τ )) τ q = lim+ 0 · lim lim τ →0 f (u(τ )) τ →0+ τ →0+ τ 2f 00 (t0 )τ =. 1 3. (2f 00 (t0 )) 2. lim. f 0 (u(τ √ )) τ. q. τ →0+. q. 00. 2f 00 (t0 ) − 2f 00 (u(τ )) C f 2(t0 ) − f 000 (t0 ) √ = , 3 2 τ (2f 00 (t0 )) 2 (2.18). gdzie w ostatniej równości skorzystaliśmy z (2.15). Korzystając z tego wyprowadzenia otrzymujemy s. u(τ ) = t0 +. 2. √. f 00 (t0 ). τ → 0+ .. τ + O(τ ),. (2.19). Stosując lemat 2 z n = 1 do funkcji g otrzymujemy . . g(t) = g(t0 ) + g 0 (t0 )(t − t0 ) + O (t − t0 )2 ,. t → t0 ,. co w połączeniu z (2.11) oraz (2.19) daje (s. g(u(τ )) = g(t0 ) + g 0 (t0 ).  √  2 √ 2 τ + O(τ ) + O ( τ ) , f 00 (t0 ) ). τ → 0+ ,. i wreszcie s 0. g(u(τ )) = g(t0 ) + g (t0 ). 2 √ τ + O(τ ), f 00 (t0 ). τ → 0+ .. Krok 3 Mamy z (2.17) 1 f 0 (u(τ )). =. √ A τ+. 1 2f 000 (t0 ) τ 3f 00 (t0 ). 3 2. + O(τ ). ,. τ → 0+ ,. (2.20).

(80) 2.2 Formalne rozwinięcie Laplace’a. gdzie A :=. 23. q. 2f 00 (t0 ). Korzystając z rozwinięcia 1 = 1 − x + O(x2 ), 1+x. x → 0,. otrzymujemy przy τ → 0+ 1 1 1 1 C√ = √ · τ + O(τ ) . (2.21) = √ 1− C√ 0 f (u(τ )) A τ 1 + A τ + O(τ ) A τ A . . Zatem z (2.20) oraz (2.21)  √ C 2√ 1 √ − 2 + O( τ ) G(τ ) = g(t0 ) + g (t0 ) τ + O(τ ) · A A τ A ". . #. 0. z czego ostatecznie G(τ ) =. √ g(t0 ) −1/2 2g 0 (t0 ) − Cg(t0 ) τ + + O( τ ), A A2. τ → 0+ .. (2.22). Stosując lemat 1 dostajemy rozwinięcie całki Ib (λ) w postaci −λf (t0 ). Ib (λ) = e. s. g(t0 ). π 2g 0 (t0 ) − Cg(t0 ) e−λf (t0 ) + · 2λf 00 (t0 ) A2 λ e−λf (t0 ) +O , λ3/2 !. λ → ∞. (2.23). Krok 4 Całkę Ia (λ) można rozwinąć w analogiczny sposób. Szczegóły zostaną pominięte, gdyż są bardzo podobne do wcześniejszego rozumowania. W szczególności można otrzymać Ia (λ) =. Z t0. exp(−λf (t))g(t)dt = e−λf (t0 ). a. Z f (a)−f (t0 ). exp(−λτ )(−G(τ ))dτ. 0. oraz G(τ ) = −. √ g(t0 ) −1/2 2g 0 (t0 ) − Cg(t0 ) τ + + O( τ ), 2 A A. τ → 0+. i w konsekwencji Ia (λ) = e. −λf (t0 ). s. g(t0 ). π 2g 0 (t0 ) − Cg(t0 ) e−λf (t0 ) − · 2λf 00 (t0 ) A2 λ e−λf (t0 ) +O , λ3/2 !. λ → ∞. (2.24). Ponieważ I(λ) = Ia (λ) + Ib (λ), więc teza wynika z rozwinięć (2.23) i (2.24)..

(81) 2.2 Formalne rozwinięcie Laplace’a. 24. Twierdzenie 2 (Rozwinięcie Laplace’a - wersja brzegowa). Załóżmy, że funkcja f (t) rośnie dla t ∈ (t0 , b), f 0 (t+ 0 ) > 0, a g(t0 ) 6= 0. Załóżmy po00 + 00 nadto, że f (t0 ) istnieje, f jest prawostronnie ciągła w t0 , natomiast g jest lipschitzowska w przedziale [t0 , t0 + ) dla pewnego  ∈ (0, b − t0 ]. Jeśli dla R dostatecznie dużych λ > 0, całka I(λ) = tb0 exp(−λf (t))g(t)dt istnieje i jest skończona, to I(λ) = e−λf (t0 ) g(t0 ).   1 −1 1 + O(λ ) , + λf 0 (t0 ). λ → ∞.. Dowód: Dowód zostanie przeprowadzony analogicznie do dowodu poprzedniego twierdzenia dla przypadku (i) oraz całki Ib (λ), jednak stosowne rozwinięcia można w tym przypadku uzyskać ze wzoru Taylora. Podobnie jak tam, mamy −λf (t0 ). I(λ) = e. Z f (b)−f (t0 ). exp(−λτ )G(τ )dτ.. 0. Mamy u(0) = t0 , ale tym razem u0 (0+ ) istnieje i wynosi 1/f 0 (t+ 0 ). Podobnie 0 + 00 + 00 + u (0 ) = −f (t0 )/f (t0 ). Stosując wzór Taylora, otrzymujemy u(τ ) = t0 +. 1. τ f 0 (t+ 0). + O(τ 2 ),. τ → 0+ .. (2.25). Ponieważ przy założeniach o funkcji g mamy g(t) = g(t0 ) + O(t − t0 ) przy t → t+ 0 , więc stosując (2.25), możemy licznik funkcji G(·) zapisać w postaci g(u(τ )) = g(t0 ) + O(τ ),. τ → 0+ .. (2.26). Korzystając z założeń o f 00 i kolejny raz ze wzoru Taylora, mamy f 0 (t) = 0 0 f 0 (t0 ) + O(t − t0 ), t → t+ 0 , co w połączeniu z (2.25) daje f (u(τ )) = f (t0 ) + + O(τ ), τ → 0 , a stąd 1 f 0 (u(τ )). =. 1 f 0 (t0 ). (1 + O(τ )) .. Z powyższego i (2.26) mamy więc G(τ ) =. g(u(τ )) g(t0 ) = 0 + + O(τ ), 0 f (u(τ )) f (t0 ). Zastosowanie lematu 1 kończy dowód.. τ → 0+ ..

(82) 2.2 Formalne rozwinięcie Laplace’a. 25. Uwaga 2. Rozwinięcie Laplace’a w przypadku regularnym jest również prawdziwe w przypadku, gdy któraś z granic w całce I(λ) jest nieskończona, tj. gdy a = −∞ lub b = +∞. Podobnie w przypadku brzegowym b może być zastąpione przez +∞. Uwaga 3. Przy założeniach twierdzenia 1 w przedziale (a, b), jego tezy pozostają prawdziwe dla całki I(λ) zdefiniowanej na obszarze (−∞, +∞), jeśli dodatkowo założymy jej istnienie dla dostatecznie dużych λ, oraz założymy że g jest nieujemna i że f (t) ­ f (b) dla t ­ b i f (t) ­ f (a) dla t ¬ a. PrzyjR ∞ −λf (t) mijmy bowiem, że całka ta istnieje dla λ ­ Λ i zapiszmy −∞ e g(t)dt jako Z Z Z a. b. e−λf (t) g(t)dt +. −∞. ∞. e−λf (t) g(t)dt +. a. e−λf (t) g(t)dt.. b. Do środkowej całki stosuje się twierdzenie 1, natomiast dwie pozostałe są odpowiednio małe. Pokażemy to dla pierwszej całki. Dla trzeciej rozumowanie jest analogiczne. Mamy dla λ > Λ Z a. −λf (t). e. g(t)dt =. Z a n. o. e−Λf (t) g(t) e−(λ−Λ)f (t) dt. −∞. −∞. ¬e. −(λ−Λ)f (a). ·. Z a. e−Λf (t) g(t)dt. −∞. e−λf (t0 ) , =o λk !. = Ce−λf (t0 ) e−λ(f (a)−f (t0 )). dla dowolnego k > 0, gdyż f (a) > f (t0 ). Podobnie, przyjmując założenia twierdzenia 2 na przedziale (t0 , b) i takie same jak wyżej założenia o f i g na przedziale (b, ∞), otrzymujemy prawdziwość tezy twierdzenia o brzegowej aproksymacji Laplace’a dla całki I(λ) po zbiorze (t0 , ∞). Przykład 3. Przykładem całki, dla której zachodzą założenia (i) wersji regularnej rozwinięcia Laplace’a, ale nie zachodzą założenia (ii) może być całka Z ∞. 4 7 exp −λ |t| 2 + |t|3 + 2t2 7 −∞ . . . =2. Z ∞ 0. 4 7 exp −λ t 2 + t3 + 2t2 7 . . . ,. gdyż dla funkcji f : [0, ∞) 3 t → (4/7)t7/2 + t3 + 2t2 mamy f 0 (t) = 2t5/2 + √ √ 3t2 + 4t = t( t + 2)(2t − t + 2) > 0 dla t > 0. Ponadto f 0 (0+ ) = 0, f 00 (0+ ) = 4, f 000 (0+ ) = 6, ale f (4) (0+ ) = +∞. Zgodnie z tezami twierdzenia.

(83) 26. 0. 50. 100. 150. 200. 2.2 Formalne rozwinięcie Laplace’a. 0. 2 ⋅ 105. 4 ⋅ 105. 6 ⋅ 105. 8 ⋅ 105. 1 ⋅ 106. λ. ˜ Rysunek 2.2: Wykres funkcji λ · |I(λ)/I(λ) − 1| (plusy) rozważanej w √ przykładzie 3 porównany z wykresem funkcji 0.203 λ (linia ciągła). 1, przyjmując oznaczenie s. ˜ I(λ) =e. −λf (0). 2π = 00 λf (0+ ). r. π , 2λ. √ ˜ − 1) = O(1) przy λ → ∞, ale niekoniecznie musi zamamy λ(I(λ)/I(λ) ˜ chodzić λ(I(λ)/I(λ)−1) = O(1). Eksperymenty numeryczne, których wyniki przedstawia wykres na rysunku 2.2, sugerują, że ta druga równość nie zachodzi. Obliczenia, które, ze względu na czas obliczeń, udało się wykonać dla ˜ − maksymalnej wartości λ = 106 , wyraźnie sugerują, że funkcja λ(I(λ)/I(λ) √ 1) wzrasta w tempie λ..

(84) Rozdział 3 Przybliżenia najmocniejszych testów niezmienniczych 3.1. 3.1.1. Dokładne najmocniejsze niezmiennicze testy zgodności Przypadek jednowymiarowy. W tym podrozdziale będziemy rozważać wyłącznie dane jednowymiarowe. Niech X = (X1 , . . . , Xn ) ∈ Rn będzie próbą prostą pochodzącą z rozkładu o gęstości f względem miary Lebesgue’a. Niech f0 i f1 będą dwiema ustalonymi gęstościami na R i rozważmy problem testowania hipotezy zerowej H0∗ : f ∈. . ·−µ 1 f0 : (µ, σ) ∈ R × R+ σ σ . . . (3.1). na poziomie istotności α ∈ (0, 1), przeciwko alternatywie H1∗. : f∈. . ·−µ 1 f1 : (µ, σ) ∈ R × R+ . σ σ . . . (3.2). Są to szczególne przypadki hipotez (1.3) i (1.4) z p = 1. Rodziny gęstości występujące w hipotezach Hj∗ , j = 0, 1, nazywane są rodzinami z parametrami położenia i skali (ang. location-scale families) ([17]). Problem testowania (H0∗ , H1∗ ) jest niezmienniczy ze względu na (afiniczne) transformacje Rn → Rn z grupy GA postaci x → ax + b1Tn , gdzie (a, b) ∈ R+ × R, 1Tn = (1, . . . , 1) oraz x = (x1 , . . . , xn ) ∈ Rn . 1 Można pokazać, że najmocniejszy test niezmienniczy 1. Warto zaznaczyć, że w przypadku, gdy obie gęstości f0 i f1 są funkcjami parzystymi, można rozważać szerszą grupę, takiej samej postaci jak GA , ale z (a, b) ∈ R2 i a 6= 0 ([47])..

(85) 3.1 Dokładne najmocniejsze niezmiennicze testy zgodności. 28. względem grupy GA (w skrócie: GA -NTN) istnieje i jest postaci (. 1, dla L∗1 (X)/L∗0 (X) > cα , 0, w przec. przyp.. ϕ(X) = gdzie L∗j (X). =. Z Z R. n  Y 1. R+ i=1. σ. . fj. Xi − µ σ. . 1 dσdµ, σ. (3.3). (3.4). a stała cα dobrana jest tak, żeby zapewnić założony rozmiar α ([25, str. 48]). Ze względu na postać statystyki testowej GA -NTN, można go użyć dla każdej pary gęstości (f0 , f1 ) w (3.1) i (3.2), dla której potrafimy wyznaczyć odpowiadające im statystyki L∗j , j = 0, 1. Niestety, ze względu na trudności techniczne związane z wyznaczeniem całki w (3.4), statystyka L∗j została, jak dotąd, wyznaczona w jawnej postaci jedynie dla rozkładów: normalnego ([25]), jednostajnego, wykładniczego ([53]), Laplace’a ([54]) oraz Cauchy’ego ([24]). Szczególnie prostą postać przyjmuje L∗j dla gęstości (poniżej stosujemy uproszczoną notację L∗R , gdzie R oznacza skrót nazwy rozkładu, którego gęstością jest fj ): • gaussowskiej: L∗N =. ) Γ( n−1 2 n 2. n−1 2. ·σ ˆ −(n−1) ,. 2n π 2 2 −1 Pn ¯ gdzie σ ˆ =n i=1 (Xi − X) jest wariancją z próby X1 , . . . , Xn ;. (3.5). • jednostajnej: L∗U =.  −(n−1) 1 · X(n) − X(1) , (n − 1)n. (3.6). gdzie X(1) = min{X1 , . . . , Xn } oraz X(n) = max{X1 , . . . , Xn }; • oraz wykładniczej: L∗E =. −(n−1) Γ(n − 1)  ¯ · X − X . (1) nn. (3.7). Te statystyki pojawiają się też w dalszej części bieżącego rozdziału, jako funkcje wierszy wielowymiarowej macierzy obserwacji w przybliżonych wersjach odpowiednich statystyk testowych..

(86) 3.1 Dokładne najmocniejsze niezmiennicze testy zgodności. 3.1.2. 29. Przypadek wielowymiarowy. Niech X1 , . . . , Xn będą p-wymiarowymi wektorami z próby prostej o rozkładzie absolutnie ciągłym względem miary Lebesgue’a w Rp , i niech X oznacza odpowiadającą im losową macierz obserwacji o wymiarach (p, n). Dwie grupy w naturalny sposób uogólniają grupę przekształceń afinicznych Rn → Rn postaci x → ax + b1Tn . Pierwszą i odpowiadającą przypadkowi a 6= 0, jest grupa G transformacji postaci Rpn 3 X → AX + b1Tn ∈ Rpn , z A ∈ GL(p) i z b ∈ Rp . Druga z nich, oznaczana przez G∗ i odpowiadająca przypadkowi a > 0, ma tę samą postać, ale z A ∈ UT(p). W niniejszej rozprawie będziemy zajmować się grupą G∗ . W [47] pokazano, że jest to największa podgrupa G zachowująca tzw. lewostronną ograniczoność rozkładu. Niech f0 i f1 będą ustalonymi gęstościami względem miary Lebesgue’a pwymiarowych wektorów losowych. Rozważmy problem testowania (H0∗ , H1∗ ) (patrz (1.3) i (1.4)). Dla x = (x1 , . . . , xp ) ∈ Rp , zakładamy, że fj (x) = Qp i=1 fj,brz (xi ), gdzie fj,brz , dla j = 0, 1 są gęstościami jednowymiarowymi. Podkreślmy, że nie wszystkie rozkłady w Fj∗ , j = 0, 1, mają tą cechę i znajdują się w niej gęstości rozkładów o zarówno niezależnych, jak i zależnych rozkładach brzegowych. Ogólna postać najmocniejszego G∗ -niezmienniczego testu dla (H0∗ , H1∗ ) została wyprowadzona w pracy [48]. Niech dla macierzy Y, Y(i) oznacza jej i-ty wiersz. Twierdzenie 3 (Szkutnik, 1988). Niech V ∈ UT(p) z vii = 1, i niech L∗j będzie zdefiniowane jak w (3.4), ale po zamianie fj na gęstości brzegowe fj,brz , j = 0, 1. Test postaci ϕ(X) = gdzie Fj∗ (X) =.  . 1 gdy F1∗ (X)/F0∗ (X) > cα ,  0 w przec. przyp.. Z Rp(p−1)/2. h. i. h. i. L∗j (VX)(1) · · · L∗j (VX)(p) dV,. (3.8). (3.9). jest najmocniejszym G∗ -niezmienniczym testem dla problemu (H0∗ , H1∗ ). Podobnie jak dla danych jednowymiarowych, G∗ -NTN można zastosować do każdej pary gęstości (f0 , f1 ) w (1.3) i (1.4), dla której potrafimy obliczyć odpowiadające im statystyki Fj∗ , j = 0, 1. Jednakże, obliczenie Fj∗ z równania (3.9) wymaga znajomości statystyki L∗j (a więc rozwiązania problemu dla p = 1), a następnie wykonania całkowania w (3.9). Zważywszy na nieliczne wyniki dla danych jednowymiarowych (por. podrozdział 3.1.1), nie powinien dziwić fakt, że w w przypadku wielowymiarowym obliczenie statystyk Fj∗ ograniczone jest do niewielu przypadków. Jak dotąd, w jawnej postaci dla.

(87) 3.1 Dokładne najmocniejsze niezmiennicze testy zgodności. 30. dowolnego p ­ 2 znana jest tylko statystyka Fj∗ dla fj będącej gęstością wielowymiarowego rozkładu normalnego ([48, równ. (2.8)]). Dodatkowo, dla p = 2, w jawnej, ale skomplikowanej postaci, znane są współczynniki Fj∗ dla: rozkładu jednostajnego na kwadracie oraz dwuwymiarowego rozkładu wykładniczego ([48]). Dla wielowymiarowego rozkładu normalnego statystyka Fj∗ zależy od danych wyłącznie poprzez empiryczną macierz kowariancji. Dzięki G∗ -niezmienniczości testu, statystykę tą można zredukować do stałej przy pomocy ˜ ˜ T będzie empiryczną standaryzacji danych. Niech Sx = n−1 (X − X)(X − X) −1 T ˜ = n−1 X1n 1 , i niech S = LT Lx , gdzie Lx ∈ macierzą kowariancji, z X n x x ˜ nosi nazwę konfiU T (p). Zestandaryzowana macierz danych Y = Lx (X − X) guracji próby. Z niezmienniczości testu ϕ mamy ϕ(Y) = ϕ(X), a empiryczna macierz kowariancji dla Y ma postać Lx Sx LTx = I.. 3.1.3. Najmocniejsze testy niezmiennicze w modelu regresji liniowej. W tym podrozdziale powrócimy do danych jednowymiarowych, ale w odróżnieniu od podrozdziału 3.1.1, przyjmiemy inne założenia o strukturze modelu i w konsekwencji będziemy rozważać inną grupę przekształceń. Niech, dla n ­ d, A będzie nielosową macierzą pełnego rzędu o wymiarach (n, d), w której pierwszą kolumną jest 1n . Niech Z = (Z1 , . . . , Zn )T ∈ Rn będzie wektorem obserwacji z modelu regresji liniowej Z = Aβ + σ, gdzie β ∈ Rd jest wektorem nieznanych współczynników regresji, σ > 0 nieznanym parametrem skali, a T = (1 , . . . , n ) wektorem błędów, stanowiących próbę prostą z rozkładu o nieznanej gęstości f . Do przetestowania jest hipoteza f = f0 , przeciwko hipotezie f = f1 , gdzie fj , j = 0, 1, są ustalonymi gęstościami. Jeżeli f = fj , to gęstość łączna obserwacji fz wyraża się wzorem fz (z) =. n Y i=1. ". zi − A(i) β 1 fj σ σ. !#. (3.10). i rozważany problem testowania można przedstawić jako problem testowania (reg) (reg) (reg) (H0 , H1 ), gdzie Hj oznacza hipotezę, że fz ma postać (3.10) dla d pewnych (σ, β) ∈ R+ × R . (reg) (reg) Problem testowania (H0 , H1 ) jest niezmienniczy ze względu na transformacje Rn → Rn grupy Greg postaci z → az + Ab, gdzie (a, b) ∈ R+ × Rd ..

(88) 3.2 Quasi-najmocniejsze testy niezmiennicze dla rozkładów jednowymiarowych. 31. Greg -NTN istnieje i jest postaci ([16, 40]) (reg). (. (reg). 1, dla L1 (Z)/L0 0, w przec. przyp.. ϕ(Z) =. (Z) > cα. ,. (3.11). gdzie (reg) Lj (Z). =. Z. n Y. Z. R+. Rd. i=1. ". zi − A(i) β 1 fj σ σ. !#. 1 dσdβ, σ. (3.12). a stała cα dobrana jest tak, żeby zapewnić założony rozmiar α. Zauważmy, że dla d = 1 bieżący problem redukuje się do problemu z podrozdziału 3.1.1, i statystyki (3.12) i (3.4) są identyczne. Dla d > 1, statystyki (reg) Lj są jednak o wiele bardziej skomplikowane niż ich odpowiedniki z pod(reg) rozdziału 3.1.1. Zgodnie z wiedzą autora rozprawy, dla d > 1 statystyka Lj w jawnej postaci nie jest znana dla żadnego rozkładu (w przypadku ogólnej macierzy planu A).. 3.2. Quasi-najmocniejsze testy niezmiennicze dla rozkładów jednowymiarowych. Ducharme i Frichot ([16]) rozważali asymptotyczne przybliżenia statystyk (3.4), gdy n → ∞, używając do tego metody Laplace’a. Następnie, zastępując nieznane (lub skomplikowane) statystyki w (3.3) przez ich aproksymacje otrzymali testy przybliżone, które nazwali quasi-najmocniejszymi testami niezmienniczymi (QNTN). Celem przedstawienia tego podejścia, rozważmy ponownie kwestie podjęte w podrozdziale 3.1.1. P Oznaczmy `j (µ, σ) = ni=1 log(σ −1 fj (σ −1 (Xi − µ))), zapiszmy (3.4) jako L∗j (X). =. 1 1 e−n{− n `j (µ,σ)} dσdµ σ R+. Z Z R. i przyjmijmy f (µ, σ) = −n−1 `j (µ, σ) oraz g(µ, σ) = σ −1 . Dalej, zakładając istnienie we wnętrzu obszaru całkowania powyższej całki jednoznacznego minimum funkcji f i jej dwukrotną różniczkowalność w otoczeniu tego minimum, autorzy [16] używają dwuwymiarowego odpowiednika twierdzenia 1 (por. [8, str. 170, wzór (6.5)]). W ten sposób otrzymują asymptotyczne ˆ ∗ , i dla których, przybliżenia statystyk L∗j , które będziemy oznaczać przez L j ˆ ∗ (1 + O(n−1 )). Bazując na zgodnie z twierdzeniem 1 z [16] zachodzi L∗j = L j takich rozwinięciach Ducharme i Frichot definiują przybliżone najmocniejsze.

(89) 3.2 Quasi-najmocniejsze testy niezmiennicze dla rozkładów jednowymiarowych. 32. testy niezmiennicze, które nazywają QNTN, jako  . ˆ ∗ (X) L. 1, dla Lˆ 1∗ (X) > cˆα ϕ(X) ˆ = , 0 0, w przec. przyp.. (3.13). gdzie stała cˆα jest tak dobrana, by ϕˆ był testem o rozmiarze α. Tak skonstruowane przybliżenia zostały użyte do wyprowadzenia wzorów na przybliżenia dwóch nieznanych wcześniej statystyk L∗j , tj. dla rozkładów logistycznego oraz Gumbela, jak również zastosowane do dwóch rozkładów, dla których te współczynniki były już znane w jawnej postaci, tj. dla rozkładu normalnego i Cauchy’ego. W rozdziale 5 autorzy przedstawili wyniki symulacji Monte Carlo, w których rozważane były NTN oraz QNTN dla problemu testowania (H0∗ , H1∗ ) z f0 będącą gęstością rozkładu normalnego przy kilku alternatywnych gęstościach f1 . Okazało się, że nawet dla małych wielkości próby (n = 10, 20) moce QNTN były praktycznie równe mocom NTN dla typowych wartości poziomów istotności α w przypadku rozważanych rozkładów (por. [16, tablica 1]). Pomimo dużej wartości tych wyników w aspekcie konstrukcji przybliżeń niedostępnych wcześniej statystyk testowych NTN, pewne kwestie w pracy [16] zostały potraktowane w sposób pobieżny i niekompletny. Po pierwsze, w świetle twierdzenia 1 i przykładu 3, założenie o dwukrotnej różniczkowalności funkcji f (µ, σ) wydaje się zbyt słabe by uzyskać rząd zbieżności O(n−1 ). W istocie, Barndorff-Nielsen i Cox, podając warunki regularności potrzebne do prawdziwości wspomnianego wyżej wzoru (6.5) ([8, str. 204]), odsyłają do pracy Hsu ([28]). Jednakże tezą twierdzenia Hsu jest jedynie asymptotyczna równość podanego rozwinięcia i rozważanej wielowymiarowej całki typu Laplace’a postaci (2.1). Choć autorowi rozprawy nie jest znana wersja twierdzenia Hsu podająca (przy dodatkowych założeniach) oszacowanie rzędu tej zbieżności, to przez analogię do twierdzenia 1, można przewidywać, że funkcja f powinna być czterokrotnie różniczkowalna w sposób ciągły w otoczeniu swojego minimum. Warunek ten nie wydaje się istotnie restrykcyjny w kontekście rozważanym w [16] i jest spełniony dla omawianych tam przykładów. Kolejnym problemem jest zastosowanie rozwinięcia (6.5) z [8] do funkcji f (µ, σ). (6.5) jest wzorem ważnym dla funkcji niezależnych od n. Tymczasem f (µ, σ) nie tylko zależy od n, ale, przede wszystkim, od obserwacji X1 , . . . , Xn . Przypadek deterministycznej funkcji f w (2.1), która zależy nie tylko od t, ale też od λ, był rozważany przez Hsu w pracy [29], gdzie autor znów rozważa wyłącznie asymptotyczna równość całki i jej przybliżenia, wymagając od funkcji f stosownej zbieżności wraz z λ → ∞ (por. [29, tw. 1 i tw. 2]). Kwestia stochastycznej funkcji f w (2.1) została podjęta przez.

(90) 3.3 Przybliżenia najmocniejszych testów niezmienniczych w modelu regresji liniowej 33. Barndorffa-Nielsena i Juppa w rozdziale 6 pracy [10]. Adaptując rozumowanie z tej pracy do kontekstu bieżącego rozdziału, przy dodatkowym wymogu, że f (µ, σ) = f (µ, σ, X1 , . . . , Xn ) → h(µ, σ) p.p., przy n → ∞, można oczekiwać, że błąd aproksymacji Laplace’a w (dwuwymiarowym) przypadku regularnym jest rzędu O(n−1 ) p.p. Podobnie jak wcześniej wydaje się jednak, że do tego tempa potrzebne byłyby raczej dodatkowe warunki na regularność, np. o czwartych pochodnych funkcji f . Na koniec tego podrozdziału wspomnijmy, iż Ducharme i Frichot w pracy [16] rozważają również rozkłady wielowymiarowe. W rozdziale 4.2 tej pracy zajmują się przypadkiem danych dwuwymiarowych i rozważają rozwinięcia Laplace’a dla statystyk w (3.8) zakładając, że gęstość rozkładu danych należy do klasy gęstości eliptycznych. Rozwinięcia te zostały tam jednak zastosowane jedynie w formie ilustracji dla przypadku gaussowskiego, dla którego znana jest jednak jawna postać dokładnych statystyk.. 3.3. Przybliżenia najmocniejszych testów niezmienniczych w modelu regresji liniowej. W rozdziale tym krótko omówimy wyniki uzyskane przez Pace i in. ([40]) w kontekście testowania zgodności rozkładu błędów w modelu regresji liniowej z podrozdziału 3.1.3. Główny nacisk w pracy [40] został położony na symulacyjne porównania mocy różnych testów dla problemu testowania (reg) (reg) (H0 , H1 ) (por. podrozdział 3.1.3). Autorzy analizowali różne pary alternatywnych rozkładów dla różnych wartości d ∈ N. Ze względu na nieznaną postać Greg -NTN, dla d > 1 test ten obliczano metodą całkowania numerycznego i porównywano go z testami opartymi na aproksymacji Laplace’a całek (3.12) oraz testem ilorazu wiarogodności (IW). Podobnie jak w pracy [16], i tu rozwinięcia Laplace’a stosowane są z milczącym zaniedbaniem kwestii stochastyczności funkcji podcałkowych, a rzędy zbieżności tych rozwinięć postulowane z regularnością rzędu drugiego (por. uwagi na końcu podrozdziału 3.2). Z przedstawionych w rozdziale 5 w pracy [40] symulacji wynika kilka interesujących wniosków. W przypadku n wyraźnie większych niż d, moce wszystkich tych testów były praktycznie takie same, gdy natomiast d stanowiło istotną frakcję n, wówczas Greg -NTN wyraźnie dominował nad pozostałymi. Kolejną obserwacją z tych symulacji jest fakt, że moc testu IW była bądź taka sama, bądź nieco lepsza niż moc testu opartego na aproksymacji Laplace’a (por. [40, tablice 1,4,5,6 i 7])..

(91) 3.4 Testowanie dwuwymiarowej normalności przeciwko dwuwymiarowej jednostajności. 3.4. 34. Testowanie dwuwymiarowej normalności przeciwko dwuwymiarowej jednostajności. Rozważmy problem testowania (H0∗ , H1∗ ), gdzie Hj∗ , j = 0, 1, zdefiniowane są w (1.3) i (1.4). Przyjmijmy, że p = 2, f0 jest gęstością dwuwymiarowego rozkładu normalnego, a f1 gęstością rozkładu jednostajnego na kwadracie [0, 1]2 . Dla wektora x = (x1 , . . . , xn ), niech R(x) := max1¬i¬n {xi }−min1¬i¬n {xi } oznacza jego rozstęp. Wzory (3.8) i (3.9) dają obszary odrzucenia zdefiniowane przez nierówność . R X(2) TU∗ (X). =. . ". R∞ n . R X(1) + sX(2). o−(n−1). #−1/(n−1). ds. −∞. q. n−1. σ ˆ22. . q. σ ˆ1 σ ˆ2 1 −. 2 r12. < cα ,.  n−2. (3.14). n−1. z odpowiednio dobranym cα (por., [48]), gdzie σ ˆ12 , σ ˆ22 i r12 oznaczają odpowiednio, wariancję z próby dla pierwszego i dla drugiego wiersza oraz empiryczny współczynnik korelacji. Jawna, ale skomplikowana postać (3.14) została wyprowadzona w [48], gdzie autor również podaje heurystyczne przybliżenie dla dużych rozmiarów próby. Moce testów dokładnego i przybliżonego okazały się w symulacjach niemal takie same. W pracy [31] autora rozprawy, przy użyciu rozwinięć Laplace’a dla całki w (3.14), otrzymane zostały bardzo podobne wyniki, co pozwala wyjaśnić naturę heurystycznej aproksymacji z [48]. Szczegóły tej aproksymacji będą podane na końcu tego rozdziału. Zapiszmy funkcję podcałkową z (3.14) jako exp[−(n − 1) log R(X(1) + (2) sX )] i zauważmy, że R(X(1) + sX(2) ) zależy od n. W celu zastosowania aproksymacji Laplace’a, należy zbadać zarówno kształt funkcji h(s) = R(X(1) + sX(2) ), jak i jej graniczne zachowanie przy n → ∞. Lemat 3 (Rezultat własny). Niech X = [X1 , . . . , Xn ] będzie macierzą (p, n) z kolumnami Xi ∈ Rp i wierszami X(i) , i niech R(x) oznacza rozstęp wektora x. Dla każdego k = 1, . . . , p − 1, funkcja . . h(s1 , . . . , sk ) := R X(p−k) + s1 X(p−k+1) + . . . + sk X(p) ,. (3.15). jest kawałkami liniowa ze skończoną liczbą odcinków, ciągła i wypukła. Ponadto, jeśli X jest macierzą losową z rozkładem absolutnie ciągłym względem miary Lebesgue’a w Rpn , to wówczas, z prawdopodobieństwem 1, minimum h jest jednoznaczne..

(92) 3.4 Testowanie dwuwymiarowej normalności przeciwko dwuwymiarowej jednostajności. 35. Dowód: Dla prostoty oznaczeń połóżmy Y(i) := X(p−k+i) dla i = 0, . . . , k. Funkcja h przyjmuje postać h(s1 , . . . , sk ) =R Y. (0). +. k X. !. si Y. (i). i=1. (. = max. 1¬j¬n. y0j +. k X. ). (. si yij − min. 1¬j¬n. i=1. y0j +. k X. ). si yij .. i=1. Zarówno minimum, jak i maksimum skończonej liczby funkcji liniowych jest funkcją ciągłą i kawałkami liniową (ze skończoną liczbą kawałków). Zatem, dla dowodu pierwszej części, wystarczy pokazać, że h jest wypukła, a to jest natychmiastowe, ponieważ maksimum (minimum) skończonej liczby funkcji wypukłych (wklęsłych) jest funkcją wypukłą (wklęsłą). Jako różnica funkcji wypukłej i wklęsłej, h jest funkcją wypukłą. Dla dowodu drugiej części tezy przypuśćmy, że sˆ1 , sˆ2 ∈ Rk są dwoma minimami funkcji h(·) i, że sˆ1 6= sˆ2 . Wypukłość implikuje, że dla wszystkich α ∈ [0, 1], s := αˆ s1 + (1 − α)ˆ s2 jest również minimum. Ponadto, dla pewnego u, l ∈ {1, . . . , n} i dla wszystkich α ∈ [0, 1], (. h(s) = max. 1¬j¬n. y0j +. =y0u − y0l +. k X i=1. k X. ). (. si yij − min. 1¬j¬n. y0j +. k X. ). si yij. i=1. si (yiu − yil ) ≡ const.. i=1. Stąd, dla i = 1, . . . , k, yiu = yil , ale prawdopodobieństwo takiego zdarzenia wynosi zero.  Z lematu 3 wiadomo, że wykres h jest wypukłą łamaną, która z prawdopodobieństwem 1 posiada jednoznaczne minimum. Zachowanie asymptotyczne h jest opisane w następującym lemacie. Lemat 4 (Rezultat własny). Przy hipotezie H0∗ , limn→∞ (8 log n)−1/2 h(s) = [(1, s)Σ(1, s)T ]1/2 p.p. dla każdego s, gdzie X1 ∼ N2 (m, Σ). Przy H1∗ , limn→∞ h(s) = A + B |s| p.p. dla każdego s, gdzie A i B są długościami najkrótszych przedziałów zawierających nośniki, odpowiednio, pierwszego i drugiego wiersza X1 . Dowód: Jeśli Rn jest rozstępem n-elementowej próby prostej ze standardowego rozkładu normalnego, to (8 log n)−1/2 Rn → 1 p.p. (por., np. [43, 2.4 przykład C])..

(93) 3.4 Testowanie dwuwymiarowej normalności przeciwko dwuwymiarowej jednostajności. 36. Przy H0∗ , X(1) +sX(2) tworzy próbę prostą z rozkładu N [(1, s)m, (1, s)Σ(1, s)T ]. Zatem, po standaryzacji, otrzymujemy pierwszą część tezy. Przy H1∗ , elementy X(1) mają rozkład trójkątny lub jednostajny na pewnym przedziale [a, b], a elementy X(2) mają rozkład jednostajny na pewnym przedziale [c, d]. W konsekwencji, X(1) + sX(2) stanowi próbę prostą z rozkładu o niezerowej gęstości na [a + sc, b + sd] dla s ­ 0, oraz na przedziale [a + sd, b + sc], gdy s ¬ 0. Stąd, oczywiście, h(s) → (b − a) + |s|(d − c) p.p., przy n → ∞. By uzasadnić ostatnie stwierdzenie, wystarczy użyć twierdzenia 1.3.4 z [43] by otrzymać zbieżność p.p. minimum i maksimum próby prostej do, odpowiednio, lewego i prawego końca przedziału.  Następujący lemat omawia graniczne zachowanie się minimum mocno punktowo zbieżnych funkcji wypukłych. Lemat ten zostanie wykorzystany w rozdziale 4. Lemat 5 (Rezultat własny). Załóżmy, że {hn (·)} jest ciągiem wypukłych losowych funkcji Rk → R i niech dla każdego n ∈ N, hn ma jednoznaczne mimimum sˆn ∈ Rk p.p. Załóżmy, że dla każdego s ∈ Rk lim hn (s) = A(s) p.p.,. n→∞. (3.16). gdzie A : Rk → R jest funkcją nielosową, której jednoznacznym minimum jest s˜ ∈ Rk . Wówczas sˆn → s˜ p.p. (3.17) Ponadto, dla dowolnego ciągu s∗n takiego, że s∗n → s˜ p.p. zachodzi hn (s∗n ) − hn (˜ s) → 0 p.p.. (3.18). Dowód: Niech B(r) i S(r) oznaczają odpowiednio kulę domkniętą i sferę o środku w s˜ i promieniu r w przestrzeni euklidesowej Rk . A(·) jest oczywiście funkcją wypukłą na Rk . Funkcje wypukłe na Rk są funkcjami ciągłymi, a na zwartym zbiorze B(1) zbieżność w (3.16) jest jednostajna (por. [42, twierdzenie 10.8] i [1, dodatek II]). Mamy więc sup |hn (s) − A(s)| → 0 p.p. s∈B(1). Niech. !. 1 min A(s) − A(˜ s) . δ0 := 2 S(1). (3.19).

Cytaty

Powiązane dokumenty

stwo, za nim zaś totalitaryzm, to dla Tischnera przede wszyst- kim stan ducha ludzkiego, rodzący się za sprawą odpowiedniego pobudzenia zewnętrznego, ale zarazem pobudzenia

Z podręcznika „Biologia na czasie 3” zapoznajcie się z metodami datowania, które są stosowane w paleontologii i krót- ko je scharakteryzujcie.. 1–6) i opisy

1. Zapis taki powinien się składać z następujących elementów ujętych w nawiasie kwadratowym: nazwisko autora cytowanej pracy, rok wydania publikacji i strona / strony, np.

1966, doktor habilitowany nauk filologicznych, profesor Ka­ tedry Języka Rosyjskiego i Językoznawstwa Ogólnego Uralskiego Uniwersytetu Państwowego;

Udowodnić, że każdy skończony pierścień bez dzielników zera jest ciałem.. Rozwiązać następujące

Być może nie jest to jeszcze bardzo powszechne postrzeganie wolontariatu, ale staje się on znaczącym elementem widniejącym w rubryce „doświadczenie zawodowe”. Dla przyszłego

administracyjnych jest możliwe i jak dotąd sprawdzało się w powojennych demokracjach – zwłaszcza w konsensualnych systemach

Udowodnić, że średnia arytmetyczna tych liczb jest równa n+1 r