Statystyka Matematyczna
Anna Janicka
wykład VIII, 18.04.2016
ESTYMACJA PRZEDZIAŁOWA
Plan na dzisiaj
Estymacja przedziałowa – przedziały ufności
podstawy
Model I (normalny): przedział ufności dla średniej, wariancja znana
Model II (normalny): przedział ufności dla średniej, wariancja nieznana
Model II (normalny): przedział ufności dla wariancji Model III (asymptotyczny): przedział ufności dla średniej
Model IV (asymptotyczny): przedział ufności dla odsetka
Model asymptotyczny: przedział ufności oparty o ENW
Przedział ufności – przypomnienie
Niech g(θ ) będzie funkcją nieznanego
parametru θ, zaś oraz będą statystykami
Wówczas to przedział ufności dla g(θ ) na poziomie ufności 1-α, jeśli dla każdego θ
) ,...,
,
( X1 X2 Xn g
g =
(
θ)
αθ g(X1, X2,..., Xn ) ≤ g( ) ≤ g( X1, X2,..., Xn ) ≥ 1− P
) ,...,
,
( X1 X2 Xn g
g =
] , [g g
Przedział ufności – konstrukcja
Z definicji, przedział ufności zależy od rozkładu prawdopodobieństwa, z jakim mamy do czynienia
Najczęściej rozważa się próbki
pochodzące z rozkładów normalnych
(takie rozkłady występują „w przyrodzie”
najczęściej)
Przedział ufności – konstrukcja cd.
wygodna metoda: szukamy zmiennych losowych zależnych od próby i funkcji parametrów, których rozkłady nie zależą od wartości nieznanych
parametrów – tzw. funkcji centralnych
Jeśli U = U(X1, X2, ..., Xn, θ ) – funkcja centralna, to szukamy przedziału ufności postaci [a,b] t.że
Najczęściej dodatkowo szukamy przedziałów
„symetrycznych”
( )
αθ a ≤ U ≤ b ≥ 1− P
( ) ( )
2 2 ,
α α
θ
θ U < a ≤ P U > b ≤ P
Przedział ufności dla średniej – Model I
Model normalny: X1, X2, ..., Xn są próbą IID z rozkładu N(µ, σ 2), przy czym σ 2 jest znane Przedział ufności dla µ, na poziomie 1-α :
gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)
− − + −
u n n X
u
X σ σ
α
α /2 1 /2
1 ,
Przedział ufności – Model I, uzasadnienie:
Punktowy estymator dla µ: ENW(µ) =
Znamy rozkład :
Korzystamy z funkcji centralnej. Chcemy: przedział ufności symetryczny wokół estymatora punktowego (rozkład funkcji centralnej jest symetryczny wokół 0).
Mamy:
skąd u = u1-α /2
X X
) 1 , 0 (
~
), ,
(
~ 2 N
n N X
X n
σ
µ σ − µ rozkład nie
zależy od µ -- funkcja centralna
( )
α σ
µ µ
−
=
− Φ
=
− Φ
− Φ
=
≤
−
1
1 )
( 2 )
( )
( /
)
( X u u u u
n P
Przedział ufności – Model I, własności
Błąd oszacowania:
Długość przedziału ufności: 2d
Liczebność próby wystarczająca do uzyskania zadanej precyzji (błędu) d:
u n
d σ
α /2 1−
=
2 2
2 / 1 2
d n
σ
u −α≥
Przedział ufności dla średniej – Model II
Model normalny: X1, X2, ..., Xn są próbą IID z rozkładu N(µ, σ 2), przy czym σ 2 jest nieznane Przedział ufności dla µ, na poziomie 1-α :
gdzie t1-α /2(n-1) jest kwantylem rzędu 1-α / 2 z rozkładu t-Studenta z n-1 stopniami swobody t(n-1), a dla nieobciążonego
estymatora wariancji S2.
− − − + − −
n n S
t n X
n S t
X 1 α /2( 1) , 1 α /2( 1)
S2
S =
Przedział ufności – Model II, uzasadnienie:
Punktowy estymator dla µ: ENW(µ) = Znamy rozkład :
Korzystamy z funkcji centralnej T. Chcemy:
przedział ufności symetryczny wokół estymatora punktowego (rozkład T jest symetryczny wokół 0). Mamy:
skąd t = t1-α /2(n-1)
X X
) 1 (
~
), 1 , 0 (
~
), ,
(
~ 2 − −
− =
n t n
S T X
N n
N X
X n µ
σ µ σ µ
(
µ)
ασ
µ, n(X − )/ S ≤ t = 1− P
Przedział ufności – Model II, własności
Błąd oszacowania:
Długość przedziału ufności: 2d
Liczebność próby wystarczająca do uzyskania zadanej precyzji (błędu) d:
do wyznaczenia na podstawie tzw.
dwuetapowej procedury Steina – musimy najpierw wstępnie oszacować wariancję
n n S
t
d = 1−α /2( −1)
Duetapowa procedura Steina
1. Pobieramy wstępną próbkę X1, X2, ..., Xn0
na jej podstawie obliczamy estymator wariancji
2. Sprawdzamy, czy próbka spełnia żądany warunek: obliczamy
a) jeśli n0 ≥ k to za przedział ufności przyjmujemy
b) jeśli n0 < k to wybieramy n ≥ k i dolosowujemy Xn0+1, Xn0+2, ..., Xn, obliczamy średnią z połączonej próbki X1, X2, ..., Xn, i za przedział ufności przyjmujemy
∑
=− −
= 0
0 1
2 1 0
2 1
0 n ( )
i i
n X X
S
2
2 0
2 / 1 2
0[ ( 1)]
d n t
k S −
= −α
− − − + − −
0 0 0
2 / 1 0 0
0 0
2 / 1
0 ( 1) , ( 1)
n n S
t n X
n S t
X α α
− − − + − −
n n S
t n X
n S t
X 1 α /2( 0 1) 0 , 1 α /2( 0 1) 0
Przedział ufności dla wariancji – Model II
Model normalny: X1, X2, ..., Xn są próbą IID z rozkładu N(µ, σ 2).
Przedział ufności dla σ 2, na poziomie 1-α :
gdzie są kwantylami rzędu α / 2 oraz 1-α / 2,
odpowiednio, z rozkładu chi-kwadrat z n -1 stopniami swobody
−
−
−
−
− ( 1)
) 1 , (
) 1 (
) 1 (
2 2 /
2 2
2 / 1
2
n S n
n S n
α
α χ
χ
) 1 (
oraz )
1
( 12 /2
2 2
/ n − −α n −
α
χ
χ
Przedział ufności – Model II, uzasadnienie
Punktowy estymator dla σ 2: ENW(σ 2)= S2 Znamy rozkład:
Korzystamy z funkcji centralnej U. Rozkład chi-kwadrat nie jest symetryczny. Chcemy
„symetryczny” przedział ufności, tj.
szukamy takiego przedziału [a,b] że
a więc
) 1 (
) ~ 1
( 2 2
2 −
= n − S n
U χ
σ
( ) ( )
2
2 , 2
2
α α
σ
σ U < a = P U > b = P
) 1 (
oraz )
1
( 12 / 2
2 2
/ − = −
= n b − n
a
χ
αχ
αPrzedział ufności dla średniej – Model III
Model asymptotyczny: X1, X2, ..., Xn są próbą IID z rozkładu mającego średnią (µ) oraz wariancję, n – duże.
Przybliżony przedział ufności dla µ, na poziomie 1-α :
gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1), a dla nieobciążonego estymatora wariancji S2.
Uzasadnienie: z CTG, gdy n →∞ mamy
− − + −
n u S
n X u S
X 1 α /2 , 1 α /2
S2
S =
) 1 , 0
/ N(
n S
X D
→
− µ
Przedział ufności dla odsetka – Model IV
Model asymptotyczny: X1, X2, ..., Xn są próbą IID z rozkładu dwupunktowego, n – duże.
Przybliżony przedział ufności dla p, na poziomie 1-α :
gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)
) 0 (
1 )
1
(X = = p = − P X =
Pp p
−
− +
− − −
n p u p
n p p u p
p ˆ(1 ˆ)
, ˆ ˆ) 1
ˆ(
ˆ 1 α /2 1 α /2
Przedział ufności – Model IV, uzasadnienie
Estymator punktowy odsetka (wskaźnika struktury) p:
Znamy rozkłady asymptotyczne: z CTG, gdy n →∞
mamy
Korzystamy z funkcji centralnej U, analogicznie do modelu I.
X p
ENW
pˆ = ( ) =
) 1 , 0 ) (
1 ˆ ˆ(
ˆ n N
p p
p
U p →D
−
= −
Przedział ufności – Model IV, własności
Błąd oszacowania:
Liczebność próby wystarczająca do uzyskania zadanej precyzji (błędu) d:
jeśli nic nie wiemy o p, należy uwzględnić najbardziej niekorzystny przypadek p=1/2:
np. 1,6452/(4 * 0,0252) ≈ 1082
n p u p
d ˆ(1 ˆ)
2 / 1
= −α −
2 2
2 /
) 1
1 ˆ ˆ(
d u p
n p − −α
≥
2 2
2 / 1
4d n ≥ u −α
Przedział ufności oparty o ENW – Model asymptotyczny
Model asymptotyczny: X1, X2, ..., Xn są próbą IID z rozkładu o nieznanym parametrze θ, n – duże.
Jeśli ma asymptotyczny rozkład normalny z wariancją asymptotyczną , tzn i jeśli dodatkowo jest zgodny:
Przybliżony przedział ufności dla θ, na poziomie 1-α :
gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)
)
ˆ (θ
θ = ENW
) 1 (
1 θ I
) ,
0 ( ˆ )
( 1 ( )
1 θ
θ
θ − n →D N I
)) (
( ˆ)
(θ ENW I θ I =
) 1 , 0 ( ˆ)
( ˆ )
(θ −θ nI θ →D N
− − + −
ˆ) ( ˆ 1
, ˆ) ( ˆ 1
1 2
/ 1 1
2 /
1 θ θ
θ α θ α
nI u
nI u
Przedział ufności oparty o ENW – Model asymptotyczny, przypadek ogólny
Model asymptotyczny: X1, X2, ..., Xn są próbą IID z rozkładu o nieznanym parametrze θ, n – duże.
Jeśli ma asymptotyczny rozkład normalny z wariancją asymptotyczną , tzn i jeśli dodatkowo jest zgodny:
Przybliżony przedział ufności dla g(θ), na poz. 1-α :
gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 z rozkładu N(0,1)
)) (
( ˆ)
(θ g ENW θ g =
) ( )) ( ' (
1 2
θ θ I g
) ,
0 ( ˆ )
( ( '( )) ( )
1 2
θ θ
θ
θ − n →D N g I
) 1 , 0 ( ˆ)
( ˆ )
(θ −θ nI θ →D N
− − + −
ˆ) (
| ˆ) ( ' ) |
( ˆ , ˆ) (
| ˆ) ( ' ) |
( ˆ
1 2
/ 1 1
2 /
1 θ
θ θ θ
θ α θ α
nI u g
g nI
u g g
)) (
( ˆ)
(θ ENW I θ I =
Przedział ufności oparty o ENW – przykład Niech X1, X2, ..., Xn będzie próbą IID z rozkładu Poissona z nieznanym parametrem θ, n – duże.
jest asymptotycznie normalny (CTG) z wariancją asymptotyczną
zachowuje się dobrze.
Przybliżony przedział ufn. dla θ, na poziomie 1-α :
gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 rozkładu N(0,1) Na przykład, jeśli dla n=900 mamy , to 90% PPU dla θ
byłby
X ENW =
= ( )
ˆ θ
θ 1 (θ) = θ
I1
θ θ ) 1 ˆ ˆ( =
I
− − + −
n u X
n X u X
X 1 α /2 , 1 α /2
= 4
[
4 −1,645 4900;4 +1X,645 4900]
≈ [3,89;4,11]≈
Przedział ufności oparty o ENW – przykład cd.
Gdybyśmy chcieli estymować prawdopodobieństwo wyniku = 0, mielibyśmy
I przybliżony PU dla g(θ), na poziomie 1-α :
gdzie u1-α /2 jest kwantylem rzędu 1-α / 2 rozkładu N(0,1) Na przykład, gdyby dla n=900 było , to 90% PPU dla g(θ) byłby równy
e X
ENW g
g(θˆ) = ( (θ )) = −
−X − − −X −X + − e−X
n u X
e n e
u X
e 1 α /2 , 1 α /2
= 4 X
[
4 −1,645 4900 4; 4 +1,645 4900 4]
≈ [0,016;0,020]≈ e− e− e− e−
θ = e−θ
g( )