Statystyka Matematyczna

(1)

Statystyka Matematyczna

Anna Janicka

wykład VIII, 18.04.2016

ESTYMACJA PRZEDZIAŁOWA

(2)

Plan na dzisiaj

Estymacja przedziałowa – przedziały ufności

podstawy

Model I (normalny): przedział ufności dla średniej, wariancja znana

Model II (normalny): przedział ufności dla średniej, wariancja nieznana

Model II (normalny): przedział ufności dla wariancji Model III (asymptotyczny): przedział ufności dla średniej

Model IV (asymptotyczny): przedział ufności dla odsetka

Model asymptotyczny: przedział ufności oparty o ENW

(3)

Przedział ufności – przypomnienie

Niech g(θ ) będzie funkcją nieznanego

parametru θ, zaś oraz będą statystykami

Wówczas to przedział ufności dla g(θ ) na poziomie ufności 1-α, jeśli dla każdego θ

) ,...,

,

( X₁ X₂ X_n g

g =

(

^θ

)

^α

θ g(X₁, X₂,..., X_n ) ≤ g( ) ≤ g( X₁, X₂,..., X_n ) ≥ 1− P

) ,...,

,

( X₁ X₂ X_n g

g =

] , [g g

(4)

Przedział ufności – konstrukcja

Z definicji, przedział ufności zależy od rozkładu prawdopodobieństwa, z jakim mamy do czynienia

Najczęściej rozważa się próbki

pochodzące z rozkładów normalnych

(takie rozkłady występują „w przyrodzie”

najczęściej)

(5)

Przedział ufności – konstrukcja cd.

wygodna metoda: szukamy zmiennych losowych zależnych od próby i funkcji parametrów, których rozkłady nie zależą od wartości nieznanych

parametrów – tzw. funkcji centralnych

Jeśli U = U(X₁, X₂, ..., X_n, θ ) – funkcja centralna, to szukamy przedziału ufności postaci [a,b] t.że

Najczęściej dodatkowo szukamy przedziałów

„symetrycznych”

( )

^α

θ a ≤ U ≤ b ≥ 1− P

( ) ( )

2 2 ,

α α

θ

θ U < a ≤ P U > b ≤ P

(6)

Przedział ufności dla średniej – Model I

Model normalny: X₁, X₂, ..., X_n są próbą IID z rozkładu N(µ, σ ²), przy czym σ ² jest znane Przedział ufności dla µ, na poziomie 1-α :

gdzie u_1-_α _/2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)



 



 − ₋ + ₋

u n n X

u

X σ σ

α

α /2 1 /2

1 ,

(7)

Przedział ufności – Model I, uzasadnienie:

Punktowy estymator dla µ^{: ENW(}µ^{) =}

Znamy rozkład :

Korzystamy z funkcji centralnej. Chcemy: przedział ufności symetryczny wokół estymatora punktowego (rozkład funkcji centralnej jest symetryczny wokół 0).

Mamy:

skąd u = u_1-_α _/2

X X

) 1 , 0 (

~

), ,

(

~ ² N

n N X

X _n

σ

µ ^σ ⁻ µ rozkład nie

zależy od µ -- funkcja centralna

( )

α σ

µ µ

−

=

− Φ

=

− Φ

=

≤

−

1

1 )

( 2 )

( )

( /

)

( X u u u u

n P

(8)

Przedział ufności – Model I, własności

Błąd oszacowania:

Długość przedziału ufności: 2d

Liczebność próby wystarczająca do uzyskania zadanej precyzji (błędu) d:

u n

d σ

α /2 1−

=

2 2

2 / 1 2

d n

σ

u ₋^α

≥

(9)

Przedział ufności dla średniej – Model II

Model normalny: X₁, X₂, ..., X_n są próbą IID z rozkładu N(µ, σ ²), przy czym σ ² jest nieznane Przedział ufności dla µ, na poziomie 1-α :

gdzie t_1-_α _/2(n-1) jest kwantylem rzędu 1-α / 2 z rozkładu t-Studenta z n-1 stopniami swobody t(n-1), a dla nieobciążonego

estymatora wariancji S².



 



 − ₋ − + ₋ −

n n S

t n X

n S t

X ₁ _α _/₂( 1) , ₁ _α _/₂( 1)

S2

S =

(10)

Przedział ufności – Model II, uzasadnienie:

Punktowy estymator dla µ: ENW(µ) = Znamy rozkład :

Korzystamy z funkcji centralnej T. Chcemy:

przedział ufności symetryczny wokół estymatora punktowego (rozkład T jest symetryczny wokół 0). Mamy:

skąd t = t_1-_α _/2(n-1)

X X

) 1 (

~

), 1 , 0 (

~

), ,

(

~ ² − −

− =

n t n

S T X

N n

N X

X _n µ

σ µ ^σ µ

(

^µ

)

^α

σ

µ_, n(X − )/ S ≤ t = 1− P

(11)

Przedział ufności – Model II, własności

Błąd oszacowania:

Długość przedziału ufności: 2d

do wyznaczenia na podstawie tzw.

dwuetapowej procedury Steina – musimy najpierw wstępnie oszacować wariancję

n n S

t

d = ₁₋_α _/₂( −1)

(12)

Duetapowa procedura Steina

1. Pobieramy wstępną próbkę X₁, X₂, ..., X_n0

na jej podstawie obliczamy estymator wariancji

2. Sprawdzamy, czy próbka spełnia żądany warunek: obliczamy

a) jeśli n₀ ≥ k to za przedział ufności przyjmujemy

b) jeśli n₀ < k to wybieramy n ≥ k i dolosowujemy X_n0+1, X_n0+2, ..., X_n, obliczamy średnią z połączonej próbki X₁, X₂, ..., X_n, i za przedział ufności przyjmujemy

∑

=

− −

= ⁰

0 1

2 1 0

2 1

0 ⁿ ( )

i i

n X X

S

2

2 0

2 / 1 2

0[ ( 1)]

d n t

k S −

= ⁻^α











 − ₋ − + ₋ −

0 0 0

2 / 1 0 0

0 0

2 / 1

0 ( 1) , ( 1)

n n S

t n X

n S t

X _α _α



 



 − ₋ − + ₋ −

n n S

t n X

n S t

X ₁ _α _/₂( ₀ 1) ⁰ , ₁ _α _/₂( ₀ 1) ⁰

(13)

Przedział ufności dla wariancji – Model II

Model normalny: X₁, X₂, ..., X_n są próbą IID z rozkładu N(µ, σ ²).

Przedział ufności dla σ ², na poziomie 1-α :

gdzie są kwantylami rzędu α / 2 oraz 1-α / 2,

odpowiednio, z rozkładu chi-kwadrat z n -1 stopniami swobody



 





−

− ( 1)

) 1 , (

) 1 (

2 2 /

2 2

2 / 1

2

n S n

α

α χ

χ

) 1 (

oraz )

1

( ₁² _/₂

2 2

/ n − ₋_α n −

α

χ

(14)

Przedział ufności – Model II, uzasadnienie

Punktowy estymator dla σ ²: ENW(σ ²)= S² Znamy rozkład:

Korzystamy z funkcji centralnej U. Rozkład chi-kwadrat nie jest symetryczny. Chcemy

„symetryczny” przedział ufności, tj.

szukamy takiego przedziału [a,b] że

a więc

) 1 (

) ~ 1

( ₂ ₂

2 −

= n − S n

U χ

σ

( ) ( )

2

2 , ²

2

α α

σ

σ U < a = P U > b = P

) 1 (

oraz )

1

( ₁² _/ ₂

2 2

/ − = −

= n b ₋ n

a

χ

_α

χ

_α

(15)

Przedział ufności dla średniej – Model III

Model asymptotyczny: X₁, X₂, ..., X_n są próbą IID z rozkładu mającego średnią (µ) oraz wariancję, n – duże.

Przybliżony przedział ufności dla µ, na poziomie 1-α :

gdzie u_1-_α _/2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1), a dla nieobciążonego estymatora wariancji S².

Uzasadnienie: z CTG, gdy n →∞ mamy



 



 − ₋ + ₋

n u S

n X u S

X ₁ _α _/₂ , ₁ _α _/₂

S2

S =

) 1 , 0

/ N(

n S

X _D

→

− µ 

(16)

Przedział ufności dla odsetka – Model IV

Model asymptotyczny: X₁, X₂, ..., X_n są próbą IID z rozkładu dwupunktowego, n – duże.

Przybliżony przedział ufności dla p, na poziomie 1-α :

) 0 (

1 )

1

(X = = p = − P X =

P_p _p











 −

− +

− ₋ ₋

n p u p

n p p u p

p ˆ(1 ˆ)

, ˆ ˆ) 1

ˆ(

ˆ ₁ _α _/₂ ₁ _α _/₂

(17)

Przedział ufności – Model IV, uzasadnienie

Estymator punktowy odsetka (wskaźnika struktury) p:

Znamy rozkłady asymptotyczne: z CTG, gdy n →∞

mamy

Korzystamy z funkcji centralnej U, analogicznie do modelu I.

X p

ENW

pˆ = ( ) =

) 1 , 0 ) (

1 ˆ ˆ(

ˆ n N

p p

p

U p →^D

−

= −

(18)

Przedział ufności – Model IV, własności

Błąd oszacowania:

jeśli nic nie wiemy o p, należy uwzględnić najbardziej niekorzystny przypadek p=1/2:

np. 1,645²/(4 * 0,025²) ≈ 1082

n p u p

d ˆ(1 ˆ)

2 / 1

= ₋_α −

2 2

2 /

) 1

1 ˆ ˆ(

d u p

n p − ⁻^α

≥

2 2

2 / 1

4d n ≥ u ⁻^α

(19)

Przedział ufności oparty o ENW – Model asymptotyczny

Model asymptotyczny: X₁, X₂, ..., X_n są próbą IID z rozkładu o nieznanym parametrze θ, n – duże.

Jeśli ma asymptotyczny rozkład normalny z wariancją asymptotyczną , tzn i jeśli dodatkowo jest zgodny:

Przybliżony przedział ufności dla θ, na poziomie 1-α :

)

ˆ (θ

θ = ENW

) 1 (

1 θ I

) ,

0 ( ˆ )

( ¹ ₍ ₎

1 θ

θ

θ − n →^D N _I

)) (

( ˆ)

(θ ENW I θ I =

) 1 , 0 ( ˆ)

( ˆ )

(θ −θ nI θ →^D N











 − ₋ + ₋

ˆ) ( ˆ 1

, ˆ) ( ˆ 1

1 2

/ 1 1

2 /

1 θ θ

θ _α θ _α

nI u

(20)

Przedział ufności oparty o ENW – Model asymptotyczny, przypadek ogólny

Model asymptotyczny: X₁, X₂, ..., X_n są próbą IID z rozkładu o nieznanym parametrze θ, n – duże.

Jeśli ma asymptotyczny rozkład normalny z wariancją asymptotyczną , tzn i jeśli dodatkowo jest zgodny:

Przybliżony przedział ufności dla g(θ), na poz. 1-α :

)) (

( ˆ)

(θ g ENW θ g =

) ( )) ( ' (

1 2

θ θ I g

) ,

0 ( ˆ )

( ⁽ ^'⁽ ⁾⁾ ₍ ₎

1 2

θ θ

θ

θ − n →^D N ^g _I

) 1 , 0 ( ˆ)

( ˆ )

(θ −θ nI θ →^D N











 − ₋ + ₋

ˆ) (

| ˆ) ( ' ) |

( ˆ , ˆ) (

| ˆ) ( ' ) |

( ˆ

1 2

/ 1 1

2 /

1 θ

θ θ θ

θ _α θ _α

nI u g

g nI

u g g

)) (

( ˆ)

(θ ENW I θ I =

(21)

Przedział ufności oparty o ENW – przykład Niech X₁, X₂, ..., X_n będzie próbą IID z rozkładu Poissona z nieznanym parametrem θ, n – duże.

jest asymptotycznie normalny (CTG) z wariancją asymptotyczną

zachowuje się dobrze.

Przybliżony przedział ufn. dla θ, na poziomie 1-α :

gdzie u_1-_α _/2 jest kwantylem rzędu 1-α / 2 rozkładu N(0,1) Na przykład, jeśli dla n=900 mamy , to 90% PPU dla θ

byłby

X ENW =

= ( )

ˆ θ

θ ¹ ₍_θ₎ = θ

I1

θ θ ) 1 ^ˆ ˆ( =

I











 − ₋ + ₋

n u X

n X u X

X ₁ _α _/₂ , ₁ _α _/₂

= 4

[

⁴ ⁻¹^,⁶⁴⁵ ⁴⁹⁰⁰^;⁴ ⁺¹X^,⁶⁴⁵ ⁴⁹⁰⁰

]

^≈ ^[³^,⁸⁹^;⁴^,¹¹^]

≈

(22)

Przedział ufności oparty o ENW – przykład cd.

Gdybyśmy chcieli estymować prawdopodobieństwo wyniku = 0, mielibyśmy

I przybliżony PU dla g(θ), na poziomie 1-α :

gdzie u_1-_α _/2 jest kwantylem rzędu 1-α / 2 rozkładu N(0,1) Na przykład, gdyby dla n=900 było , to 90% PPU dla g(θ) byłby równy

e X

ENW g

g(θˆ) = ( (θ )) = ⁻











 ⁻^X − ₋ ⁻^X ⁻^X + ₋ e⁻^X

n u X

e n e

u X

e ₁ _α _/₂ , ₁ _α _/₂

= 4 X

[

⁴ ⁻¹^,⁶⁴⁵ ⁴⁹⁰⁰ ⁴^; ⁴ ⁺¹^,⁶⁴⁵ ⁴⁹⁰⁰ ⁴

]

^≈ ^[⁰^,⁰¹⁶^;⁰^,⁰²⁰^]

≈ e⁻ e⁻ e⁻ e⁻

θ = e⁻θ

g( )

(23)