• Nie Znaleziono Wyników

Statystyka Matematyczna

N/A
N/A
Protected

Academic year: 2021

Share "Statystyka Matematyczna"

Copied!
23
0
0

Pełen tekst

(1)

Statystyka Matematyczna

Anna Janicka

wykład VIII, 18.04.2016

ESTYMACJA PRZEDZIAŁOWA

(2)

Plan na dzisiaj

Estymacja przedziałowa – przedziały ufności

podstawy

Model I (normalny): przedział ufności dla średniej, wariancja znana

Model II (normalny): przedział ufności dla średniej, wariancja nieznana

Model II (normalny): przedział ufności dla wariancji Model III (asymptotyczny): przedział ufności dla średniej

Model IV (asymptotyczny): przedział ufności dla odsetka

Model asymptotyczny: przedział ufności oparty o ENW

(3)

Przedział ufności – przypomnienie

Niech g(θ ) będzie funkcją nieznanego

parametru θ, zaś oraz będą statystykami

Wówczas to przedział ufności dla g(θ ) na poziomie ufności 1-α, jeśli dla każdego θ

) ,...,

,

( X1 X2 Xn g

g =

(

θ

)

α

θ g(X1, X2,..., Xn ) ≤ g( ) ≤ g( X1, X2,..., Xn ) ≥ 1− P

) ,...,

,

( X1 X2 Xn g

g =

] , [g g

(4)

Przedział ufności – konstrukcja

Z definicji, przedział ufności zależy od rozkładu prawdopodobieństwa, z jakim mamy do czynienia

Najczęściej rozważa się próbki

pochodzące z rozkładów normalnych

(takie rozkłady występują „w przyrodzie”

najczęściej)

(5)

Przedział ufności – konstrukcja cd.

wygodna metoda: szukamy zmiennych losowych zależnych od próby i funkcji parametrów, których rozkłady nie zależą od wartości nieznanych

parametrów – tzw. funkcji centralnych

Jeśli U = U(X1, X2, ..., Xn, θ ) – funkcja centralna, to szukamy przedziału ufności postaci [a,b] t.że

Najczęściej dodatkowo szukamy przedziałów

„symetrycznych”

( )

α

θ a U b 1 P

( ) ( )

2 2 ,

α α

θ

θ U < a P U > b P

(6)

Przedział ufności dla średniej – Model I

Model normalny: X1, X2, ..., Xn są próbą IID z rozkładu N(µ, σ 2), przy czym σ 2 jest znane Przedział ufności dla µ, na poziomie 1-α :

gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)



 

 − +

u n n X

u

X σ σ

α

α /2 1 /2

1 ,

(7)

Przedział ufności – Model I, uzasadnienie:

Punktowy estymator dla µ: ENW(µ) =

Znamy rozkład :

Korzystamy z funkcji centralnej. Chcemy: przedział ufności symetryczny wokół estymatora punktowego (rozkład funkcji centralnej jest symetryczny wokół 0).

Mamy:

skąd u = u1-α /2

X X

) 1 , 0 (

~

), ,

(

~ 2 N

n N X

X n

σ

µ σ µ rozkład nie

zależy od µ -- funkcja centralna

( )

α σ

µ µ

=

Φ

=

Φ

Φ

=

1

1 )

( 2 )

( )

( /

)

( X u u u u

n P

(8)

Przedział ufności – Model I, własności

Błąd oszacowania:

Długość przedziału ufności: 2d

Liczebność próby wystarczająca do uzyskania zadanej precyzji (błędu) d:

u n

d σ

α /2 1

=

2 2

2 / 1 2

d n

σ

u α

(9)

Przedział ufności dla średniej – Model II

Model normalny: X1, X2, ..., Xn są próbą IID z rozkładu N(µ, σ 2), przy czym σ 2 jest nieznane Przedział ufności dla µ, na poziomie 1-α :

gdzie t1-α /2(n-1) jest kwantylem rzędu 1-α / 2 z rozkładu t-Studenta z n-1 stopniami swobody t(n-1), a dla nieobciążonego

estymatora wariancji S2.



 

 − − +

n n S

t n X

n S t

X 1 α /2( 1) , 1 α /2( 1)

S2

S =

(10)

Przedział ufności – Model II, uzasadnienie:

Punktowy estymator dla µ: ENW(µ) = Znamy rozkład :

Korzystamy z funkcji centralnej T. Chcemy:

przedział ufności symetryczny wokół estymatora punktowego (rozkład T jest symetryczny wokół 0). Mamy:

skąd t = t1-α /2(n-1)

X X

) 1 (

~

), 1 , 0 (

~

), ,

(

~ 2

=

n t n

S T X

N n

N X

X n µ

σ µ σ µ

(

µ

)

α

σ

µ, n(X − )/ St = 1− P

(11)

Przedział ufności – Model II, własności

Błąd oszacowania:

Długość przedziału ufności: 2d

Liczebność próby wystarczająca do uzyskania zadanej precyzji (błędu) d:

do wyznaczenia na podstawie tzw.

dwuetapowej procedury Steina – musimy najpierw wstępnie oszacować wariancję

n n S

t

d = 1α /2( 1)

(12)

Duetapowa procedura Steina

1. Pobieramy wstępną próbkę X1, X2, ..., Xn0

na jej podstawie obliczamy estymator wariancji

2. Sprawdzamy, czy próbka spełnia żądany warunek: obliczamy

a) jeśli n0 ≥ k to za przedział ufności przyjmujemy

b) jeśli n0 < k to wybieramy n ≥ k i dolosowujemy Xn0+1, Xn0+2, ..., Xn, obliczamy średnią z połączonej próbki X1, X2, ..., Xn, i za przedział ufności przyjmujemy

=

= 0

0 1

2 1 0

2 1

0 n ( )

i i

n X X

S

2

2 0

2 / 1 2

0[ ( 1)]

d n t

k S

= α

+

0 0 0

2 / 1 0 0

0 0

2 / 1

0 ( 1) , ( 1)

n n S

t n X

n S t

X α α

+

n n S

t n X

n S t

X 1 α /2( 0 1) 0 , 1 α /2( 0 1) 0

(13)

Przedział ufności dla wariancji – Model II

Model normalny: X1, X2, ..., Xn są próbą IID z rozkładu N(µ, σ 2).

Przedział ufności dla σ 2, na poziomie 1-α :

gdzie są kwantylami rzędu α / 2 oraz 1-α / 2,

odpowiednio, z rozkładu chi-kwadrat z n -1 stopniami swobody



 

( 1)

) 1 , (

) 1 (

) 1 (

2 2 /

2 2

2 / 1

2

n S n

n S n

α

α χ

χ

) 1 (

oraz )

1

( 12 /2

2 2

/ nα n

α

χ

χ

(14)

Przedział ufności – Model II, uzasadnienie

Punktowy estymator dla σ 2: ENW(σ 2)= S2 Znamy rozkład:

Korzystamy z funkcji centralnej U. Rozkład chi-kwadrat nie jest symetryczny. Chcemy

„symetryczny” przedział ufności, tj.

szukamy takiego przedziału [a,b] że

a więc

) 1 (

) ~ 1

( 2 2

2

= n S n

U χ

σ

( ) ( )

2

2 , 2

2

α α

σ

σ U < a = P U > b = P

) 1 (

oraz )

1

( 12 / 2

2 2

/ − = −

= n b n

a

χ

α

χ

α

(15)

Przedział ufności dla średniej – Model III

Model asymptotyczny: X1, X2, ..., Xn są próbą IID z rozkładu mającego średnią (µ) oraz wariancję, n – duże.

Przybliżony przedział ufności dla µ, na poziomie 1-α :

gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1), a dla nieobciążonego estymatora wariancji S2.

Uzasadnienie: z CTG, gdy n →∞ mamy



 

 − +

n u S

n X u S

X 1 α /2 , 1 α /2

S2

S =

) 1 , 0

/ N(

n S

X D

→

µ

(16)

Przedział ufności dla odsetka – Model IV

Model asymptotyczny: X1, X2, ..., Xn są próbą IID z rozkładu dwupunktowego, n – duże.

Przybliżony przedział ufności dla p, na poziomie 1-α :

gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)

) 0 (

1 )

1

(X = = p = P X =

Pp p

+

n p u p

n p p u p

p ˆ(1 ˆ)

, ˆ ˆ) 1

ˆ(

ˆ 1 α /2 1 α /2

(17)

Przedział ufności – Model IV, uzasadnienie

Estymator punktowy odsetka (wskaźnika struktury) p:

Znamy rozkłady asymptotyczne: z CTG, gdy n →∞

mamy

Korzystamy z funkcji centralnej U, analogicznie do modelu I.

X p

ENW

pˆ = ( ) =

) 1 , 0 ) (

1 ˆ ˆ(

ˆ n N

p p

p

U p →D

=

(18)

Przedział ufności – Model IV, własności

Błąd oszacowania:

Liczebność próby wystarczająca do uzyskania zadanej precyzji (błędu) d:

jeśli nic nie wiemy o p, należy uwzględnić najbardziej niekorzystny przypadek p=1/2:

np. 1,6452/(4 * 0,0252) ≈ 1082

n p u p

d ˆ(1 ˆ)

2 / 1

= α

2 2

2 /

) 1

1 ˆ ˆ(

d u p

n pα

2 2

2 / 1

4d nu α

(19)

Przedział ufności oparty o ENW – Model asymptotyczny

Model asymptotyczny: X1, X2, ..., Xn są próbą IID z rozkładu o nieznanym parametrze θ, n – duże.

Jeśli ma asymptotyczny rozkład normalny z wariancją asymptotyczną , tzn i jeśli dodatkowo jest zgodny:

Przybliżony przedział ufności dla θ, na poziomie 1-α :

gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)

)

ˆ (θ

θ = ENW

) 1 (

1 θ I

) ,

0 ( ˆ )

( 1 ( )

1 θ

θ

θ n →D N I

)) (

( ˆ)

(θ ENW I θ I =

) 1 , 0 ( ˆ)

( ˆ )

(θ θ nI θ →D N

+

ˆ) ( ˆ 1

, ˆ) ( ˆ 1

1 2

/ 1 1

2 /

1 θ θ

θ α θ α

nI u

nI u

(20)

Przedział ufności oparty o ENW – Model asymptotyczny, przypadek ogólny

Model asymptotyczny: X1, X2, ..., Xn są próbą IID z rozkładu o nieznanym parametrze θ, n – duże.

Jeśli ma asymptotyczny rozkład normalny z wariancją asymptotyczną , tzn i jeśli dodatkowo jest zgodny:

Przybliżony przedział ufności dla g(θ), na poz. 1-α :

gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)

)) (

( ˆ)

(θ g ENW θ g =

) ( )) ( ' (

1 2

θ θ I g

) ,

0 ( ˆ )

( ( '( )) ( )

1 2

θ θ

θ

θ n →D N g I

) 1 , 0 ( ˆ)

( ˆ )

(θ θ nI θ →D N

+

ˆ) (

| ˆ) ( ' ) |

( ˆ , ˆ) (

| ˆ) ( ' ) |

( ˆ

1 2

/ 1 1

2 /

1 θ

θ θ θ

θ α θ α

nI u g

g nI

u g g

)) (

( ˆ)

(θ ENW I θ I =

(21)

Przedział ufności oparty o ENW – przykład Niech X1, X2, ..., Xn będzie próbą IID z rozkładu Poissona z nieznanym parametrem θ, n – duże.

jest asymptotycznie normalny (CTG) z wariancją asymptotyczną

zachowuje się dobrze.

Przybliżony przedział ufn. dla θ, na poziomie 1-α :

gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 rozkładu N(0,1) Na przykład, jeśli dla n=900 mamy , to 90% PPU dla θ

byłby

X ENW =

= ( )

ˆ θ

θ 1 (θ) = θ

I1

θ θ ) 1 ˆ ˆ( =

I

+

n u X

n X u X

X 1 α /2 , 1 α /2

= 4

[

4 1,645 4900;4 +1X,645 4900

]

[3,89;4,11]

(22)

Przedział ufności oparty o ENW – przykład cd.

Gdybyśmy chcieli estymować prawdopodobieństwo wyniku = 0, mielibyśmy

I przybliżony PU dla g(θ), na poziomie 1-α :

gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 rozkładu N(0,1) Na przykład, gdyby dla n=900 było , to 90% PPU dla g(θ) byłby równy

e X

ENW g

g(θˆ) = ( (θ )) =

X X X + eX

n u X

e n e

u X

e 1 α /2 , 1 α /2

= 4 X

[

4 1,645 4900 4; 4 +1,645 4900 4

]

[0,016;0,020]

e e e e

θ = eθ

g( )

(23)

Cytaty

Powiązane dokumenty

Jeśli natomiast zwiększamy nadmiernie wartość poziomu ufności to rośnie długość przedziału ufności i spada jakość oszacowania parametru (rośnie błąd

Przy założeniu, że długości rozmów mają rozkład normalny wyznaczyć przedział ufności dla średniej długości rozmowy na poziomie ufności

Zweryfi- kuj hipotezę zerową H 0 mówiącą, że rozkład grup jest równomierny (to znaczy każda z grup ma jednakowe prawdopodobieństwo)... Wykorzystamy Mocne Prawo

Zweryfi- kuj hipotezę zerową H 0 mówiącą, że rozkład grup jest równomierny (to znaczy każda z grup ma

Zakładając, że rozkład wieku ogółu lekarzy jest normalny, zbudować przedział ufności dla przeciętnego wieku ogółu lekarzy (miejskich i wiejskich łącznie),

Weryfikacja hipotez o wariancji; wiedza o populacji generalnej, własności próby statystycznej, sformułowanie hipotezy zerowej i alternatywnej, dobór testu i rozkład statystyki

Weryfikacja hipotez o wariancji; wiedza o populacji generalnej, własności próby statystycznej, sformułowanie hipotezy zerowej i alternatywnej, dobór testu i rozkład statystyki

Weryfikacja hipotez o wariancji; wiedza o populacji generalnej, własności próby statystycznej, sformułowanie hipotezy zerowej i alternatywnej, dobór testu i rozkład statystyki