• Nie Znaleziono Wyników

Statystyka Matematyczna

N/A
N/A
Protected

Academic year: 2021

Share "Statystyka Matematyczna"

Copied!
37
0
0

Pełen tekst

(1)

Statystyka Matematyczna

Anna Janicka

wykład VII, 11.04.2016

WŁASNOŚCI ESTYMATORÓW, CZ. III

ESTYMACJA PRZEDZIAŁOWA, CZ. I

(2)

Plan na dzisiaj

1. Asymptotyczne własności estymatorów – cd.

zgodność – cd.

asymptotyczna normalność asymptotyczna efektywność

2. Zgodność, asymptotyczna normalność i asymptotyczna efektywność ENW

3. Estymacja przedziałowa – przedziały ufności

wstęp modele

(3)

Zgodność – przypomnienie

Niech X1, X2, ..., Xn ,... będzie próbą IID, tzn.

niezależnych zmiennych losowych o

identycznych rozkładach. Niech

będzie ciągiem estymatorów wielkości g(θ ).

Estymator jest zgodny, jeśli jest zbieżny do g(θ ) według prawdopodobieństwa i mocno zgodny, jeśli jest zbieżny prawie na pewno.

) ,...,

,

ˆ( X1 X2 Xn g

(4)

Zgodność – przykłady

Dla dowolnej rodziny rozkładów mających wartość oczekiwaną: średnia z próbki jest zgodnym estymatorem wartości

oczekiwanej µ (θ )=Eθ (X1). Zbieżność wynika z MPWL.

Dla dowolnej rodziny rozkładów mających wariancję: i

są zgodnymi estymatorami wariancji

σ 2(θ )=Varθ (X1). Zbieżność wynika z MPWL

Xn

=

= n

i i

n n X X

S 1

2 1

2 1

)

( = n=

i i

n n X X

S 1

1 2

2 ( )

ˆ

(5)

Zgodność – przykłady/własności

Estymator może być nieobciążony i nie być zgodny; np. Tn(X1, X2, ..., Xn )=X1

jako estymator µ (θ )=Eθ (X1).

Estymator może być obciążony i być zgodny; np. obciążony estymator

wariancji j.w., lub np. dowolny zgodny estymator nieobciążony + 1/n.

(6)

Asymptotyczna normalność

Estymator wielkości g(θ ) jest asymptotycznie normalny, jeśli dla każdego θ∈Θ istnieje σ 2(θ ) takie, że gdy n→∞

Zbieżność wg. rozkładu, tzn. dla dowolnego a

lub równoważnie, rozkład jest dla dużych n zbliżony do rozkładu

) ,...,

,

ˆ(X1 X2 Xn g

(

gˆ( X1, X2,..., X ) g(θ )

)

N(0,σ 2(θ ))

n n →D

( ˆ( , ,..., ) ( )) ( )

)

lim (n g X1 X2 X g a a

P n

n = Φ

θ

θ

θ σ

) ,...,

,

ˆ( X1 X2 Xn g

) ),

(

(g n2 N θ σ

(7)

Asymptotyczna normalność – co to znaczy

Estymator asymptotycznie normalny jest zgodny (niekoniecznie mocno zgodny).

Zawiera warunek podobny do

nieobciążoności – wartość oczekiwana

rozkładu asymptotycznego jest równa g(θ ) (ale sam estymator nie musi być

nieobciążony).

Podobnie dla tzw. wariancji

asymptotycznej definiowanej jako

lub – jest to wariancja rozkładu asymptotycznego

n )

2(θ σ

)

2(θ σ

(8)

Asymptotyczna normalność – czym nie jest

Zazwyczaj dla estymatora asymptotycznie normalnego zachodzi:

ale nie musi tak być, bo zbieżność wg

rozkładu nie pociąga za sobą zbieżności wartości oczekiwanych ani wariancji

) ( )

,..., ,

ˆ( 1 2 θ

θ g X X X g

E n  →n

) ( )

,..., ,

ˆ(

var g X1 X2 Xn  →n σ 2 θ

n

(9)

Asymptotyczna normalność – przykład

Niech X1, X2, ..., Xn ,... będzie próbą IID o średniej µ i wariancji σ 2. Wówczas dla

średniej z próby mamy z CTG

Asymptotyczna wariancja, , jest tu tożsama z wariancją estymatora.

) ,

0 ( )

( X µ N σ 2

n →D

n σ 2

(10)

Asymptotyczna normalność – jak liczyć

W wielu przypadkach przydatny jest lemat:

Metoda Delta. Jeśli dla ciągu zmiennych losowych Tn mamy

gdy n→∞ oraz h:R→R jest funkcją

różniczkowalną w punkcie µ t.że h’(µ)≠0, to

µ, σ2 są funkcjami parametru θ

stosujemy zwykle wtedy, kiedy estymatory są funkcjami

statystyk Tn, których zbieżność łatwo wywnioskować z CTG

) ,

0 ( )

(T µ N σ 2

n n →D

(h(T ) h(µ)) N(0,σ 2(h'(µ))2 )

n n →D

(11)

Asymptotyczna normalność – przykłady cd.

W modelu wykładniczym:

Z CTG mamy

więc z Lematu Delta mamy dla h(t)=1/t:

a więc jest asymptotycznie normalnym (co za tym idzie: zgodnym) estymatorem λ.

ENW (λ) = X1

) ,

0 ( )

( 1 12

λ N λ

X

n →D

) ) (

, 0 ( )

( 2

) / 1 (

1 1

1

2

2 λ

λ → λ

N

n X D

X 1

(12)

Asymptotyczna efektywność

Dla asymptotycznie normalnego estymatora wielkości g(θ ) możemy

określić asymptotyczną efektywność jako

gdzie σ 2(θ )/n jest wariancją asymptotyczną, tj. mamy gdy n→∞

(

gˆ( X1, X2,..., X ) g(θ )

)

N(0,σ 2(θ ))

n n →D

) ,...,

,

ˆ( X1 X2 Xn g

( )

) , ( )

(

) ( ) '

( ˆ

as.ef 2

2

θ θ

σ

θ

In

n g g

=

( )

) ( ) (

) ( ) '

( ˆ as.ef

1 2

2

θ θ

σ

θ I g g

=

modyfikacja „zwykłej” efektywności do przypadku granicznego, z wariancją asymptotyczną zamiast zwykłej

(13)

Asymptotyczna efektywność względna

Asymptotyczna efektywność względna dla

asymptotycznie normalnych estymatorów i

ˆ ) ( as.ef

ˆ ) ( as.ef )

( ) ) (

, ˆ ( ˆ

as.ef

2 1 2

1 2 2 2

1 g

g g

g = =

θ σ

θ σ

) ˆ1(X

g gˆ2(X )

Uwaga. Estymator mniej (asymptotycznie) efektywny może mieć inne cechy, które sprawiają, że ma przewagę nad estymatorem bardziej (asymptotycznie) efektywnym.

(14)

Asymptotyczna efektywność względna – Przykład 1

Estymacja prawdopodobieństwa braku szkód w modelu Poissona: Poiss(θ ) (typowy model aktuarialny dla liczby szkód w poszczególnych latach dla polisy, albo dla grupy polis)

– pr-stwo braku szkód

) 0 (

)

( = e = P Xi = g θ θ

= =

= n

i X

n i

X

g 1 { 0} 1

1( )

ˆ 1 gˆ2(X ) = eX = ENW (g(θ )) (gˆ1 g(θ))→N(0,eθ(1 eθ ))

n D

(gˆ2 g(θ))→N(0,θ (eθ )2)

n D

z CTG dla schematu Bernoulliego

z Lematu Delta

1 1 )

1 ) (

, ˆ ( ˆ

as.ef

2 2

1 <

=

=

θ θ

θ

θ θ

θ

e e

e g e

g

as.ef

(15)

Asymptotyczna efektywność względna –

Przykłady 2: lepsza średnia czy mediana z próbki?

To zależy od rozkładu!

a) model normalny N(µ, σ 2):

b) model Laplace’a Lapl(µ, λ)

c) niektóre rozkłady nie mają średniej...

Twierdzenie: Dla próbki z rozkładu ciągłego o gęstości f(x), mediana

próbkowa jest estymatorem asymptotycznie normalnym dla mediany m (o ile gęstość jest ciągła i ≠0 w punkcie m):

(X µ) N(0,σ 2)

n →D

(md µ) N(0,πσ22 )

n →D

1 )

, d m (

as.ef X = π2 <

(X µ) N(0, λ22 )

n →D

(md ) (0, 2 )

1

µ N λ

n →D as.ef(md, X ) = 2 > 1

(md ) (0, 2 )

)) ( ( 4

1 m f

D N

m

n →

as.ef

(16)

Zgodność ENW

Niech X1, X2, ..., Xn,... będą próbą z gęstości fθ (x), gdzie θΘ ⊆ R jest otwarty, oraz:

Wszystkie gęstości fθ mają ten sam nośnik równanie ma dokładnie jedno

rozwiązanie ,

to jest ENW(θ ) i jest to estymator zgodny

Uwaga. Nawet „porządne” estymatory ENW nie muszą być nieobciążone!

0 ) (

ln θ = θ L

d d

θˆ

θˆ

(17)

Asymptotyczna normalność ENW

Niech X1, X2, ..., Xn,... będą próbą z gęstości fθ (x), gdzie θΘ ⊆ R jest otwarty, a jest zgodnym

estymatorem największej wiarygodności (np.

spełnia założenia poprzedniego twierdzenia), oraz

istnieje

można wyliczyć informację Fishera, 0<I1(θ )<∞

można zmieniać kolejność całkowania po x i różniczkowania po θ

to jest asymptotycznie normalny oraz

θˆ

) (

2 ln

2

θ L θ d

d

θˆ

(

θˆ θ

)

D N(0, I1(1θ ))

n →

(18)

Asymptotyczna normalność ENW

Przy założeniach j.w., jeśli dodatkowo g:R→R jest funkcją różniczkowalną w punkcie θ, t.że g’(θ ) ≠ 0, a jest ENW(g(θ )), to

(

ˆ( 1, 2,..., ) ( )

)

(0, ( '(( ))) )

1

2

θ

θ D gI θ

n g N

X X

X g

n →

) ,...,

,

ˆ( X1 X2 Xn g

(19)

Asymptotyczna efektywność ENW

Jeśli spełnione są założenia poprzednich twierdzeń, to estymator największej

wiarogodności (parametru θ oraz dla g(θ )) jest asymptotycznie efektywny.

(20)

Asymptotyczna normalność i efektywność ENW – przykłady

W modelu liczby szkód:

jest asymptotycznie efektywny

W modelu normalnym: średnia jest

asymptotycznie efektywnym estymatorem µ W modelu Laplace’a: mediana jest

asymptotycznie efektywnym estymatorem µ

)) (

( )

ˆ2(X e ENW g θ

g = X =

Przykład 1

Przykłady 2

(21)

Podsumowanie: badanie własności estymatorów

obciążoność wariancja

ryzyko

efektywność

zgodność

asymptotyczna normalność asymptotyczna efektywność

(22)

Estymacja przedziałowa – przedziały ufności

Estymujemy parametr z zadaną dokładnością

Zamiast pojedynczego oszacowania podajemy dolną i górną granicę dla

oszacowania (prawdziwy parametr będzie się w nich mieścił z zadanym

prawdopodobieństwem)

(23)

Przedział ufności

Niech g(θ ) będzie funkcją nieznanego

parametru θ, zaś oraz będą statystykami

Wówczas to przedział ufności dla g(θ ) na poziomie ufności 1-α, jeśli dla każdego θ

) ,...,

,

( X1 X2 Xn g

g =

(

θ

)

α

θ g(X1, X2,..., Xn ) g( ) g( X1, X2,..., Xn ) 1 P

) ,...,

,

( X1 X2 Xn g

g =

] , [g g

(24)

Przedział ufności – użycie i interpretacja

Typowo: α jest małą liczbą, np. 1-α = 0,95 albo 1-α = 0,99

Warunek z definicji oznacza: losowy

przedział zawiera nieznaną liczbę g(θ ) z dużym prawdopodobieństwem (zadanym).

Jeśli obliczymy realizację przedziału ufności (np. ) to już NIE możemy mówić o tym, że nieznany

parametr zawiera się w tym przedziale z prawdopodobieństwem 1-α !

] , [g g

3 ,

1 =

= g g

(25)

Przedział ufności – konstrukcja

Z definicji, przedział ufności zależy od rozkładu prawdopodobieństwa, z jakim mamy do czynienia

Najczęściej rozważa się próbki

pochodzące z rozkładów normalnych

(takie rozkłady występują „w przyrodzie”

najczęściej)

(26)

Przedział ufności – konstrukcja cd.

wygodna metoda: szukamy zmiennych losowych zależnych od próby i funkcji parametrów, których rozkłady nie zależą od wartości nieznanych

parametrów – tzw. funkcji centralnych

Jeśli U = U(X1, X2, ..., Xn, θ ) – funkcja centralna, to szukamy przedziału ufności postaci [a,b] t.że

Najczęściej dodatkowo szukamy przedziałów

„symetrycznych”

( ) α

θ a U b 1 P

( ) ( )

2 2 ,

α α

θ

θ U < a P U > b

P

(27)

Najczęściej wykorzystywane modele

Model I (normalny): przedział ufności dla średniej, wariancja znana

Model II (normalny): przedział ufności dla średniej, wariancja nieznana

Model II (normalny): przedział ufności dla wariancji Model III (asymptotyczny): przedział ufności dla średniej

Model IV (asymptotyczny): przedział ufności dla odsetka

Model asymptotyczny: przedział ufności oparty o ENW

(28)

Przedział ufności dla średniej – Model I

Model normalny: X1, X2, ..., Xn są próbą IID z rozkładu N(µ, σ 2), przy czym σ 2 jest znane.

Przedział ufności dla µ, na poziomie 1-α :

gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)

+

u n n X

u

X σ σ

α

α /2 1 /2

1 ,

(29)

Przedział ufności – Model I, uzasadnienie:

Punktowy estymator dla µ: ENW(µ) = Znamy rozkład :

Korzystamy z funkcji centralnej. Chcemy: przedział ufności symetryczny wokół estymatora punktowego (rozkład funkcji centralnej jest symetryczny wokół 0).

Mamy:

skąd u = u1-α /2

X X

) 1 , 0 (

~

), ,

(

~ 2 X N

N X

n

n σ

σ µ

µ

rozkład nie zależy od µ -- funkcja centralna

( )

α σ

µ µ

=

Φ

=

Φ

Φ

=

1

1 )

( 2 )

( )

( /

)

( X u u u u

n P

(30)

Przedział ufności – Model I, własności

Błąd oszacowania:

Długość przedziału ufności: 2d

Liczebność próby wystarczająca do uzyskania zadanej precyzji (błędu) d:

u n

d σ

α /2 1

=

2 2

2 / 1 2

d n σ u α

(31)

Przedział ufności dla średniej – Model II

Model normalny: X1, X2, ..., Xn są próbą IID z rozkładu N(µ, σ 2), przy czym σ 2 jest nieznane Przedział ufności dla µ, na poziomie 1-α :

gdzie t1-α /2(n-1) jest kwantylem rzędu 1-α / 2 z rozkładu t-Studenta z n-1 stopniami swobody t(n-1), a dla nieobciążonego

estymatora wariancji S2.

+

n n S

t n X

n S t

X 1 α /2( 1) , 1 α /2( 1)

S2

S =

(32)

Przedział ufności – Model II, uzasadnienie:

Punktowy estymator dla µ: ENW(µ) = Znamy rozkład :

Korzystamy z funkcji centralnej T. Chcemy:

przedział ufności symetryczny wokół estymatora punktowego (rozkład T jest symetryczny wokół 0). Mamy:

skąd t = t1-α /2(n-1)

X X

) 1 (

~

), 1 , 0 (

~

), ,

(

~ 2

=

n X t

T X N

N X

n S n

n

µ µ µ

σ σ

(

µ

)

α

σ

µ, n(X )/ S t = 1 P

(33)

Przedział ufności – Model II, własności

Błąd oszacowania:

Długość przedziału ufności: 2d

Liczebność próby wystarczająca do uzyskania zadanej precyzji (błędu) d:

do wyznaczenia na podstawie tzw.

dwuetapowej procedury Steina – musimy najpierw wstępnie oszacować wariancję

n n S

t

d = 1α /2( 1)

(34)

Duetapowa procedura Steina

1. Pobieramy wstępną próbkę X1, X2, ..., Xn0

na jej podstawie obliczamy estymator wariancji

2. Sprawdzamy, czy próbka spełnia żądany warunek: obliczamy

a) jeśli n0 ≥ k to za przedział ufności przyjmujemy

b) jeśli n0 < k to wybieramy n ≥ k i dolosowujemy Xn0+1, Xn0+2, ..., Xn, obliczamy średnią z połączonej próbki X1, X2, ..., Xn, i za przedział ufności przyjmujemy

=

= 0

0 1

2 1 0

2 1

0 n ( )

i i

n X X

S

2

2 0

2 / 1 2

0[ ( 1)]

d n t

k S

= α

+

0 0 0

2 / 1 0 0

0 0

2 / 1

0 ( 1) , ( 1)

n n S

t n X

n S t

X α α

+

n n S

t n X

n S t

X 1 α /2( 0 1) 0 , 1 α /2( 0 1) 0

(35)

Przedział ufności dla wariancji – Model II

Model normalny: X1, X2, ..., Xn są próbą IID z rozkładu N(µ, σ 2).

Przedział ufności dla σ 2, na poziomie 1-α :

gdzie są kwantylami rzędu α / 2 oraz 1-α / 2,

odpowiednio, z rozkładu chi-kwadrat z n -1 stopniami swobody

( 1)

) 1 , (

) 1 (

) 1 (

2 2 /

2 2

2 / 1

2

n S n

n S n

α

α χ

χ

) 1 (

oraz )

1

( 12 /2

2 2

/ n α n

α χ

χ

(36)

Przedział ufności – Model II, uzasadnienie

Punktowy estymator dla σ 2: ENW(σ 2)= S2 Znamy rozkład:

Korzystamy z funkcji centralnej U. Rozkład chi-kwadrat nie jest symetryczny. Chcemy

„symetryczny” przedział ufności, tj.

szukamy takiego przedziału [a,b] że

a więc

) 1 (

) ~ 1

( 2 2

2

= n S n

U χ

σ

( ) ( )

2

2 , 2

2

α α

σ

σ U < a = P U > b = P

) 1 (

oraz )

1

( 12 / 2

2 2

/ =

= n b n

a χα χ α

(37)

Cytaty

Powiązane dokumenty

Chcemy: przedział ufności symetryczny wokół estymatora punktowego (rozkład funkcji centralnej jest symetryczny wokół

Procedura, która na podstawie konkretnych obserwacji (tj.. Test statystyczny formalnie – cd.. Test statystyczny formalnie – cd. statystyki testowej) oraz liczby c (tzw..

Stosowany zwł. dla próbek o liczebności do 30, kiedy jest lepszy niż test zgodności chi- kwadrat.. Test zgodności chi-kwadrat – postać testu. Ogólna

(nieznanych) parametrach opisujemy przy pomocy rozkładów prawdopodobieństwa, przy czym dodatkowa wiedza może wpływać na nasz

Estymator Bayesowski przy zadanej funkcji straty.. przedział

Gdy rozstaw elektrod jest równoległy do kierunku jego przemieszczania na wykresie oporności pozornej w zależności od odległości środka rozstawu od granicy obserwuje się cztery

Wykona¢ w p¦tli kolejne procedury: a Wyznaczy¢ prost¡ zawieraj¡c¡ ostatni i przedostatni punkt nale»¡cy do ogrodzenia, b Wyznaczy¢ k¡ty, jakie tworz¡ wektory rozpoczynaj¡ce si¦

VII.5 Zastosowania 1: bąki symetryczne- swobodny i ważki... Bąk swobodny