Statystyka Matematyczna

(1)

Statystyka Matematyczna

Anna Janicka

wykład XIV, 06.06.2016

S

^TATYSTYKA

B

^AYESOWSKA

–

^CD

.

(2)

Plan na dzisiaj

1. Statystyka Bayesowska

rozkłady a priori i a posteriori estymacja Bayesowska:

Bayesowski Estymator Największej Wiarogodności (BENW)

Estymator Bayesowski przy zadanej funkcji straty

przedział ufności HPD

(3)

Model Bayesowski

zmienne X

₁

, ..., X

_n

, pochodzące z rozkładu P _θ , o gęstości f _θ (x) – gęstość warunkowa pod warunkiem konkretnej wartości θ .

P – rodzina rozkładów prawdopodobieństw P _θ , indeksowana parametrem θ ∈Θ

Wiedza ogólna: rozkład p-stwa Π na

przestrzeni parametrów Θ, zadany przez

π ( θ ) – tzw. rozkład a priori parametru θ ,

θ ~ Π

(4)

Model Bayesowski – cd.

Wiedza dodatkowa, szczególna,

kontekstualna: wynika z obserwacji. Mamy rozkład łączny obserwacji i parametru θ :

z którego możemy wyznaczyć warunkowy rozkład dla θ (po uwzględnieniu obserwacji) gdzie

jest rozkładem brzegowym dla obs.

) ( )

| ,...,

, (

) , ,...,

,

( x

₁

x

₂

x

_n

θ f x

₁

x

₂

x

_n

θ π θ

f =

) , ,...,

(

) ( )

| ,...,

) ( ,...,

| (

1 1

1

n n

n

m x x

x x

x f

x θ π θ

θ

π =

θ θ

π

θ d

x x

f x

x

m (

₁

,...,

_n

) = ∫

Θ

(

₁

,...,

_n

| ) ( )

(5)

Model Bayesowski – rozkład a posteriori

Rozkład nazywany jest rozkładem a posteriori, ozn. Π

_x

Rozkład a posteriori obrazuje całą wiedzę:

ogólną (wstępną) oraz szczególną

(wynikającą z konkretnych danych). Jest podstawą wnioskowania Bayesowskiego

) ,...,

|

( θ x

₁

x

_n

π

(6)

Bayesowski Estymator Największej Wiarogodności (BENW)

Wyznaczamy tak, by maksymalizował p- stwo a posteriori (moda rozkładu):

czyli

) ,...,

| ( max

) ,...,

ˆ |

( θ

_BENW

x

₁

x

_n

π θ x

₁

x

_n

π =

_θ

) ,...,

| ( max

ˆ arg )

(

_BENW

x

₁

x

_n

BENW θ = θ =

_θ

π θ

(7)

BENW: przykłady

1. Niech: X

₁

, ..., X

_n

IID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)

znamy rozkład a posteriori:

max dla

np. dla 5 sukcesów zaobserwowanych w 10 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=5/10 = ½

a dla 9 sukcesów zaobserwowanych w 10 próbach i tego samego rozkładu a priori, mamy BENW(θ )=9/10

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

^α ^β

B

−

=

rozkład Beta(α,β);

jego moda

= (α-1)/(α+ β-2) dla α>1, β>1

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

2 ) 1

(

¹

− +

+

−

= ∑

=

+

α β

θ α

n BENW x

n

i i

(8)

BENW: przykłady (2)

2. Niech: X

₁

, ..., X

_n

IID z rozkładu N( θ , σ

²

), przy czym

σ

²

^znane; θ ^~N(m, τ

²

) dla pewnych m, τ ^znanych.

Wówczas rozkład a posteriori dla θ : a zatem

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 4) a rozkład a priori θ ~N(1, 1), to

BENW( θ ) = (5 /4 * 2 + 1)/(5/4 + 1) = 14/9 ≈ 1.56 a gdyby rozkład a priori θ ~N(3, 1), to

BENW( θ ) = (5 /4 * 2 + 1*3)/(5/4 + 1) = 22/9 ≈ 2.44













+ +

+

2 2 2

2

2 2

1 1

1

1 1

,

τ σ

n n

m X

N n

2 2

1 1

) (

τ σ

τ

θ

σ

+

= +

n

m X

BENW n

(9)

Estymator Bayesowski

przy zadanej funkcji straty

L( θ , a) – funkcja straty zależna od prawdziwej wartości parametru θ oraz decyzji a.

np. jeśli estymujemy wielkość g( θ ):

L( θ , a) = (g( θ ) - a)

²

– kwadratowa funkcja straty L( θ , a) = |g( θ ) - a| – modułowa funkcja straty

Definiujemy też ryzyko a posteriori:

(średnia strata estymatora przy ustalonym

rozkładzie a priori i danych, tj. przy wyliczonym rozkładzie a posteriori)

( = ) = ∫

Θ

=

Π g x E L θ g x X x L θ g x π θ x d θ

R ( , ˆ ( )) ( , ˆ ( )) | ( , ˆ ( )) ( | )

(10)

Estymator Bayesowski

przy zadanej funkcji straty – cd.

Estymator Bayesowski przy danej funkcji straty L( θ , a) to t. że

Przy kwadratowej funkcji straty ( θ – a)

²

: Przy modułowej funkcji straty | θ – a|:

gˆ

B

) ,

( min

)) ˆ (

, (

R g x R a

x Π

_B

=

_a

Π

∀

) (

)

| ˆ (

x B

= E θ X = x = E Π

θ

) ˆ (

x B

= Med Π

θ

ogólniej: E(g(θ)|x)

(11)

Estymator Bayesowski: przykłady

1. Niech: X

₁

, ..., X

_n

IID z rozkładu 0-1 z p-stwem

sukcesu θ ; niech dla θ ∈(0,1) znamy rozkład a posteriori:

a zatem estymator Bayesowski przy kwadratowej funkcji straty to

np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy θ_B=11/22 = ½

a dla 15 sukcesów przy tym samym rozkładzie a priori:

θ_B=16/22 = 8/11

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

^α ^β

B

−

=

jego średnia

= α/(α+ β)

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

α β

θ α

+ +

= ∑

=

+ n

n

x

i i

B

ˆ

1

(12)

BENW: przykłady

1. Niech: X

₁

, ..., X

_n

IID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)

znamy rozkład a posteriori:

max dla

np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=10/20 = ½

a dla 15 sukcesów zaobserwowanych w 20 próbach i tego samego rozkładu a priori, mamy BENW(θ )=15/20 = ¾

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

^α ^β

B

−

=

jego moda

= (α-1)/(α+ β-2) dla α>1, β>1

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

2 ) 1

(

¹

− +

+

−

= ∑

=

+

α β

θ α

n BENW x

n

i i

(13)

Estymator Bayesowski: przykłady (2)

2. Niech: X

₁

, ..., X

_n

IID z rozkładu N( θ , σ

²

), przy czym

σ

²

^znane; θ ^~N(m, τ

²

) dla pewnych m, τ ^znanych.

Wówczas rozkład a posteriori dla θ :

a zatem Bayesowski estymator przy kwadratowej i modułowej funkcji straty to

np. jeśli próba 5 obserwacji 1,2; 1,7 ; 1,9 ; 2,1; 3,1 z rozkładu N( θ , 1) a rozkład a priori θ ~N(1, 1), to

θ

_B

= (5 /1 * 2 + 1)/(5 + 1) = 11/6 ≈ 1,83 a gdyby rozkład a priori θ ~N(3, 1), to

θ

_B

= (5 /1 * 2 + 1*3)/(5 + 1) = 13/6 ≈ 2,17













+ +

+

2 2 2

1 1 1

1 1

,

τ σ τ

σ τ σ

n n

m X

N n

2 2

1 1

ˆ

τ σ

τ

θ

σ

+

= +

n

m X

n

B

(14)

BENW: przykłady (2)

2. Niech: X

₁

, ..., X

_n

IID z rozkładu N( θ , σ

²

), przy czym

σ

²

^znane; θ ^~N(m, τ

²

) dla pewnych m, τ ^znanych.

Wówczas rozkład a posteriori dla θ : a zatem

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 4) a rozkład a priori θ ~N(1, 1), to

BENW( θ ) = (5 /4 * 2 + 1)/(5/4 + 1) = 14/9 ≈ 1.56 a gdyby rozkład a priori θ ~N(3, 1), to

BENW( θ ) = (5 /4 * 2 + 1*3)/(5/4 + 1) = 22/9 ≈ 2.44













+ +

+

2 2 2

2

2 2

1 1

1

1 1

,

τ σ

n n

m X

N n

2 2

1 1

) (

τ σ

τ

θ

σ

+

= +

n

m X

BENW n

(15)

Bayesowski przedział ufności HPD

Bayesowski przedział ufności HPD (Highest Posterior Density) dla parametru θ na poziomie ufności 1- α ^to

zbiór A ⊆ Θ t. że

oraz

dla pewnej wartości (największej t.że drugi warunek jest spełniony)

Przedział ufności HPD ma „intuicyjną” własność zawierania, której nie mają „zwykłe” przedziały ufności

} )

| (

: {

θ π θ k _α

A = x >

α

−

≥ Π ( A | x ) 1

k α

(16)

Przedział ufności HPD: przykład

Niech: X

₁

, ..., X

_n

IID z rozkładu N( θ , σ

²

), przy czym

σ

²

^znane; θ ^~N(m, τ

²

) dla pewnych m, τ ^znanych.

Wówczas rozkład a posteriori dla θ :

a zatem przedział ufności HPD na poziomie istotności α = 0,05 to

np. jeśli próba 5 obserwacji z rozkładu N( θ , 1) ma średnią 2 a rozkład a priori to θ ~N(1, 1), mamy u

_0,975

≈1,96 i mamy













+ +

+

2 2 2

1 1 1

1 1

,

τ σ τ

σ τ σ

n n

m X

N n

 





 





⋅ + + +

+

⋅ + + −

+

2 2

1 1

1

1 96 , 1 1 ,

96 , 1

τ σ

n n

m X

n n

n

m X

n

( ¹ ^, ⁸³ ⁻ ¹ ^, ⁹⁶ ^⋅

¹₆

^; ¹ ^, ⁸³ ⁺ ¹ ^, ⁹⁶ ^⋅

¹₆

) ( ⁼ ¹ ^, ⁵⁰ ^; ² ^, ¹⁵ )

≈

(17)

Przykładowe zadania egzaminacyjne

(18)

Przykładowe zadania egzaminacyjne (2)

(19)

Przykładowe zadania egzaminacyjne (3)

(20)

Statystyka Matematyczna