Statystyka Matematyczna

(1)

Statystyka Matematyczna

Anna Janicka

wykład IV, 14.03.2016

ESTYMACJA PUNKTOWA

(2)

Plan na dzisiaj:

1. Zagadnienie estymacji punktowej – cd.

2. Statystyki próbkowe jako estymatory 3. Metody estymacji

metoda momentów metoda kwantyli

metoda największej wiarogodności

(3)

Estymacja punktowa

Wybór, na podstawie danych, najlepszego parametru θ spośród parametrów, jakie

mogą opisywać rozkład P_θ

Esytmator parametru θ to dowolna statystyka

o wartościach w zbiorze Θ (interpretujemy ją jako przybliżenie θ ). Zwykle

zapisywany jako

Czasem estymowane nie θ, a g(θ ).

) ,...,

,

( X

₁

X

₂

X

_n

T

T =

θ ^ˆ

(4)

Estymacja – statystyki próbkowe

Charakterystyki próbkowe:

estymatory tworzone w oparciu o rozkład empiryczny (dystrybuantę empiryczną)

(5)

Momenty i kwantyle z próby jako estymatory

Momenty i kwantyle empiryczne (z próby) są momentami i kwantylami rozkładu

empirycznego, a co za tym idzie są estymatorami odpowiednich wartości teoretycznych, np.

średnia empiryczna = estymator wartości oczekiwanej

wariancja empiryczna = estymator wariancji mediana empiryczna = estymator mediany kwantyle empiryczne = estymatory kwantyli

(6)

Estymacja metodą momentów (EMM)

Porównujemy momenty rozkładu teoretycznego (zależą od

nieznanego(ych) parametru(ów)) do

odpowiednich momentów empirycznych.

Uzasadnienie: twierdzenia graniczne

Dostajemy układ równań, na podstawie którego wyznaczamy parametr(y).

(7)

EMM – cd.

Jeśli parametr θ jednowymiarowy, to jedno równanie, zwykle:

Jeśli parametr θ dwuwymiarowy, to dwa równania, zwykle:

Jeśli parametr θ k-wymiarowy, to k równań, zwykle

X X

E_θ =





=

ˆ 2

Var

, S X

X X

E

θ θ











−

=

−

=

−

=

∑ ∑

=

n i

k n i

k

n

i i

n

X X

X E X

E

X X

X E X

E

S X

X X

E

1 1

1 1 3

3 2

) (

....

, ) (

) (

ˆ , Var

,

θ θ

(8)

EMM – Przykład 1.

Model wykładniczy: X₁, X₂, ..., X_n są

próbką z rozkładu wykładniczego Exp(λ).

wiadomo:

równanie:

rozwiązanie:

λ λ

= 1 X E

= X

λ

1

EMM ( ) ˆ

_MM

X 1

ˆ = λ = λ =

λ

(9)

EMM – Przykład 2.

Model gamma: X₁, X₂, ..., X_n są próbką z rozkładu gamma Gamma(α,λ).

Wiadomo:

Układ równań:

rozwiązanie:

, 2 , , Var

λ α λ

α

λ α λ

α X = X =

E

2

2 ˆ

, S

X =

= λ

α λ

α

2 2 2 , ˆ ˆ ˆ ˆ

S X S

X

MM

MM = α =

λ

(10)

Estymacja metodą kwantyli (EMK)

Jeśli momenty są trudne do obliczenia albo równania zawiłe, zamiast momentów

można użyć kwantyli. Wybieramy tyle

różnych poziomów p, ile mamy nieznanych parametrów i układamy równania

lub równoważnie

p

q

q ( θ ) = )

p q

F ( )

_p

) =

θ

(11)

EMK – Przykład 1.

Model wykładniczy: X₁, X₂, ..., X_n są

próbką z rozkładu wykładniczego Exp(λ).

Dystrybuanta: dla λ>0 Jeden parametr → jedno równanie,

zwykle dla mediany rozwiązanie:

) exp(

1 x

F_λ = − −

λ

2 1 2

/ 1 ) exp( ˆ

1− −

λ

q =

Med 2 ln ˆ

ˆ ln )

(

2 / 1

2 1 =

−

=

= q

EMK λ λ_MK

(12)

EMK – Przykład 2.

Model Weibulla: X₁, X₂, ..., X_n są próbką z rozkładu o dystrybuancie

gdzie b, c >0 są nieznanymi parametrami.

dwa parametry → dwa równania; zwykle kwartyle

rozwiązanie:

) exp(

, 1

b c

b cx

F = − −

dla b=1 rozkład

wykładniczy z parametrem c





=

−

=

−

34 4

/ 3

14 4

/ 1

ˆ ) exp(

1

ˆ ) exp(

1

b b

q c

b MK

MK

q c

c EMK

q q

b b

EMK

ˆ 4 / 3

4 / 1 4

/ ) 3

3 ln 4 4(ln ln

4 ˆ ln )

(

ˆ ), ˆ ln

/(ln )

ˆ ln(

) (

−

=

−

=

= )

(13)

Własności EMM, EMK

Proste koncepcyjnie

Nieskomplikowane obliczeniowo

Niestety: czasem nie są optymalne

(duże błędy, niekoniecznie zachowują się odpowiednio dobrze dla mniejszych prób)

Lepsza (zwykle) metoda: największej wiarogodności

(14)

Estymacja metodą największej wiarogodności (ENW)

Wybieramy taki parametr θ, dla którego

otrzymane wyniki doświadczenia są najbardziej prawdopodobne.

Wiarogodność – opisuje prawdopodobieństwo f (gęstość lub funkcję prawdopodobieństwa)

rozważane jako funkcję parametru θ przy ustalonych wartościach obserwacji; L:Θ→R

) ,...,

,

; ( )

( f x

₁

x

₂

x

_n

L θ = θ

(15)

Estymator Największej Wiarogodności

jest estymatorem

największej wiarogodności parametru θ, jeśli

dla dowolnych x₁, x₂, ..., x_n. ozn.

estymator ENW(g(θ )) = g(ENW(θ)) )

,..., ,

ˆ(

ˆ θ X1 X2 Xn

θ =

) ,...,

,

; ( sup

) ,...,

, );

,..., ,

ˆ ( (

2 1

n n

n

x x

x f

x x

f

θ θ

θ∈Θ

=

)

ˆ (θ

θ = ^ENW

w definicji nie ma wymagania niezależności obserwacji;

jednak wyrażenie na L(θ ) upraszcza się gdy obserwacje są niezależne

(16)

ENW – kwestie praktyczne

Zwykle: próbka niezależnych obserwacji.

Wówczas

Jeśli L(θ ) jest różniczkowalne, a θ jest k- wymiarowe, to szukanie maximum

„standardowo”:

bardzo często: z uwagi na

multiplikatywność wiarogodności zamiast max L(θ ) znajdowane max l(θ ) = ln(L(θ ))

) (

)...

( )

( f x

₁

f x

₂

f x

_n

L θ =

_θ _θ _θ

k L j

j

,..., 2

, 1

, ) 0

( = =

∂

θ θ

(17)

ENW – Przykład 1.

Kontrola jakości, cd. Maksymalizujemy równoważnie, można maksymalizować

tzn. rozwiązać równanie rozwiązanie:

x n x

X P

L  − ⁻



 



= 

=

= ( ) (1 )

)

(θ _θ θ θ

) 1

ln(

) (

) ln(

ln )

) 1

ln((

) ln(

ln )

(θ θ θ  + θ + − −θ



 



= 

− +

 +



 



=  ⁻ x n x

x n x

n

l ^x ⁿ ^x

1 0 )

(

' =

−

− −

= θ θ

θ ^x ⁿ ^x l

n ENW x

NW =

=

θ

) ^ˆ (

(18)

Model wykładniczy: X₁, X₂, ..., X_n są próbką z rozkładu wykładniczego Exp(λ), λ nieznane.

Mamy:

maksymalizujemy rozwiązujemy

dostajemy

xi

n

e

x x

x f

L ( λ ) =

_λ

(

₁

,

₂

,..., ) = λ

⁻^λ ^Σ

x

i

n L

l ( λ ) = ln ( λ ) = ln λ − λ Σ 0 )

(

' = n − Σ x

_i

=

l λ λ

NW X ˆ = 1

λ

(19)

Model normalny: X₁, X₂, ..., X_n są próbką z rozkładu N(µ, σ²). µ, σ nieznane.

rozwiązujemy

wynik:

( ) ( )

( )

(

² ²

)

2 1 2

2 2

1 2

1

2 ln

) 2 ln(

) (

exp ln

) , (

2 2

µ µ

σ π

µ σ

µ

σ σ σ

π

n x

x n

x l

i i

n

i n

+ Σ

− Σ

−

=

−

=

∑







=

− Σ

=

= +

Σ

− Σ

+

−

=

∂∂

0

0 )

2 (

2 2

3

1

2 1 2

σ µ µ σ

σ σ

σ µ µ

n i

l

i i

l n

x n x

x

1 2

2 ( )

ˆ ,

ˆ^NW ⁼ ^X

^σ

^NW ⁼ ⁿ

∑

^xⁱ ⁻ ^X

µ

(20)

Statystyka Matematyczna