Statystyka Matematyczna

(1)

Statystyka Matematyczna

Anna Janicka

wykład XIII, 30.05.2016

S

^TATYSTYKA

B

^AYESOWSKA

(2)

Plan na dzisiaj

1. Statystyka Bayesowska

rozkłady a priori i a posteriori estymacja Bayesowska:

Bayesowski Estymator Największej Wiarogodności (BENW)

Estymator Bayesowski przy zadanej funkcji straty

(3)

Statystyka Bayesowska vs. tradycyjna

Tradycyjna: nieznane parametry są ustalone, dane (obserwacje) są zmiennymi losowymi

Bayesowska: dane (obserwacje) są ustalone,

nieznane parametry są losowe

(4)

Statystyka Bayesowska

Różnica w stosunku do „tradycyjnej” statystyki i metod wnioskowania: naszą wiedzę o

(nieznanych) parametrach opisujemy przy pomocy rozkładów prawdopodobieństwa, przy czym dodatkowa wiedza może wpływać na nasz opis. Wiedza:

ogólna

dotycząca konkretnego przypadku

Przykład: Rzut monetą

(5)

Model Bayesowski

zmienne X

₁

, ..., X

_n

, pochodzące z rozkładu P

_θ

, o gęstości f

_θ

(x) – gęstość warunkowa pod warunkiem konkretnej wartości θ

(funkcja wiarogodności).

P – rodzina rozkładów prawdopodobieństw P

_θ

, indeksowana parametrem θ ∈Θ

Wiedza ogólna: rozkład p-stwa Π na

przestrzeni parametrów Θ, zadany przez

π ( θ ) – tzw. rozkład a priori parametru θ ,

θ ~ Π

(6)

Model Bayesowski – cd.

Wiedza dodatkowa, szczególna,

kontekstualna: wynika z obserwacji. Mamy rozkład łączny obserwacji i parametru θ :

z którego możemy wyznaczyć warunkowy rozkład dla θ (po uwzględnieniu obserwacji) gdzie

jest rozkładem brzegowym dla obs.

) ( )

| ,...,

, (

) , ,...,

,

( x

₁

x

₂

x

_n

θ f x

₁

x

₂

x

_n

θ π θ

f =

) , ,...,

(

) ( )

| ,...,

) ( ,...,

| (

1 1

1

n n

n

m x x

x x

x f

x θ π θ

θ

π =

θ θ

π

θ d

x x

f x

x

m (

₁

,...,

_n

) = ∫

Θ

(

₁

,...,

_n

| ) ( )

(7)

Model Bayesowski – rozkład a posteriori

Rozkład nazywany jest rozkładem a posteriori, ozn. Π

_x

Rozkład a posteriori obrazuje całą wiedzę:

ogólną (wstępną) oraz szczególną (wynikającą z konkretnych danych).

Jest podstawą wnioskowania Bayesowskiego

) ,...,

|

( θ x

₁

x

_n

π

(8)

Rozkłady a priori i a posteriori: przykłady

1. Niech: X

₁

, ..., X

_n

IID z rozkładu 0-1 z p- stwem sukcesu θ ; niech

dla θ ∈(0,1) gdzie

oraz

wówczas rozkład a posteriori:

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

^α ^β

B

−

=

) (

) ( ) ) (

1 ( )

,

( ¹

0

1 1

β α

β β α

α ^α ^β

+ Γ

Γ

= Γ

−

=

∫

^u ⁻ ^u ⁻ ^du

B

) 1 (

) exp(

)

( 0

1 − = − Γ −

=

Γ ^α

∫

^∞^u^α⁻ ^u ^du ^α ^α

rozkład Beta(α^,β⁾

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

(9)

Dla Beta (1,1) a priori i danych: n=10 i 1, 5, 9 sukcesów

(10)

Dla Beta (1,1) a priori i danych: n=100 i 10, 50, 90 sukcesów

(11)

Dla Beta (1,5) a priori i danych: n=10 i 1, 5, 9 sukcesów

(12)

Dla Beta (1,5) a priori i danych: n=100 i 10, 50, 90 sukcesów

(13)

Rozkłady a priori i a posteriori: przykłady (2)

2. Niech: X

₁

, ..., X

_n

IID z rozkładu N( θ , σ

²

), przy czym σ

²

znane; θ ~N(m, τ

²

) dla

pewnych m, τ znanych.

wówczas rozkład a posteriori dla θ :

 





 





+ +

+

2 2

1 1

1

1 ,

τ σ

n n

m X

N n

(14)

Statystyka Bayesowska

Korzystając z modeli Bayesowskich, możemy wyznaczać estymatory

wyznaczać odpowiedniki przedziału ufności weryfikować hipotezy

dokonywać predykcji

(15)

Bayesowski Estymator Największej Wiarogodności (BENW)

Wyznaczamy tak, by maksymalizował p- stwo a posteriori (moda rozkładu):

czyli

) ,...,

| ( max

) ,...,

ˆ |

( θ

_BENW

x

₁

x

_n

π θ x

₁

x

_n

π =

_θ

) ,...,

| ( max

ˆ arg )

(

_BENW

x

₁

x

_n

BENW θ = θ =

_θ

π θ

(16)

BENW: przykłady

1. Niech: X

₁

, ..., X

_n

IID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)

znamy rozkład a posteriori:

max dla

np. dla 5 sukcesów zaobserwowanych w 10 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=5/10 = ½

a dla 9 sukcesów zaobserwowanych w 10 próbach i tego samego rozkładu a priori, mamy BENW(θ )=9/10

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

^α ^β

B

−

=

rozkład Beta(α,β);

jego moda

= (α-1)/(α+ β-2) dla α>1, β>1

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

2 ) 1

(

¹

− +

+

−

= ∑

=

+

α β

θ α

n BENW x

n

i i

(17)

BENW: przykłady (2)

2. Niech: X

₁

, ..., X

_n

IID z rozkładu N( θ , σ

²

), przy czym

σ

²

^znane; θ ^~N(m, τ

²

) dla pewnych m, τ ^znanych.

Wówczas rozkład a posteriori dla θ : a zatem

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 4) a rozkład a priori θ ~N(1, 1), to

BENW( θ ) = (5 /4 * 2 + 1)/(5/4 + 1) = 14/9 ≈ 1.56 a gdyby rozkład a priori θ ~N(3, 1), to

BENW( θ ) = (5 /4 * 2 + 1*3)/(5/4 + 1) = 22/9 ≈ 2.44













+ +

+

2 2 2

2

2 2

1 1

1

1 1

,

τ σ

n n

m X

N n

2 2

1 1

) (

τ σ

τ

θ

σ

+

= +

n

m X

BENW n

(18)

Estymator Bayesowski

przy zadanej funkcji straty

L( θ , a) – funkcja straty zależna od prawdziwej wartości parametru θ oraz decyzji a.

np. jeśli estymujemy wielkość g( θ ):

L( θ , a) = (g( θ ) - a)

²

– kwadratowa funkcja straty L( θ , a) = |g( θ ) - a| – modułowa funkcja straty

Definiujemy też ryzyko a posteriori:

(średnia strata estymatora przy ustalonym

rozkładzie a priori i danych, tj. przy wyliczonym rozkładzie a posteriori)

( = ) = ∫

Θ

=

Π g x E L θ g x X x L θ g x π θ x d θ

R ( , ˆ ( )) ( , ˆ ( )) | ( , ˆ ( )) ( | )

(19)

Estymator Bayesowski

przy zadanej funkcji straty – cd.

Estymator Bayesowski przy danej funkcji straty L( θ , a) to t. że

Przy kwadratowej funkcji straty ( θ – a)

²

: Przy modułowej funkcji straty | θ – a|

²

:

gˆ

B

) ,

( min

)) ˆ (

, (

R g x R a

x Π

_B

=

_a

Π

∀

) (

)

| ˆ (

x B

= E θ X = x = E Π

θ

) ˆ (

x B

= Med Π

θ

ogólniej: E(g(θ)|x)

(20)

Estymator Bayesowski: przykłady

1. Niech: X

₁

, ..., X

_n

IID z rozkładu 0-1 z p-stwem

sukcesu θ ; niech dla θ ∈(0,1) znamy rozkład a posteriori:

a zatem estymator Bayesowski przy kwadratowej funkcji straty to

np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy θ_B=11/22 = ½

a dla 15 sukcesów przy tym samym rozkładzie a priori:

θ_B=16/22 = 8/11

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

^α ^β

B

−

=

jego średnia

= α/(α+ β)

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

α β

θ α

+ +

= ∑

=

+ n

n

x

i i

B

ˆ

1

(21)

BENW: przykłady

1. Niech: X

₁

, ..., X

_n

IID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)

znamy rozkład a posteriori:

max dla

np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=10/20 = ½

a dla 15 sukcesów zaobserwowanych w 20 próbach i tego samego rozkładu a priori, mamy BENW(θ )=15/20 = ¾

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

^α ^β

B

−

=

jego moda

= (α-1)/(α+ β-2) dla α>1, β>1

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

2 ) 1

(

¹

− +

+

−

= ∑

=

+

α β

θ α

n BENW x

n

i i

(22)

Estymator Bayesowski: przykłady (2)

2. Niech: X

₁

, ..., X

_n

IID z rozkładu N( θ , σ

²

), przy czym

σ

²

^znane; θ ^~N(m, τ

²

) dla pewnych m, τ ^znanych.

Wówczas rozkład a posteriori dla θ :

a zatem Bayesowski estymator przy kwadratowej i modułowej funkcji straty to

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 1) a rozkład a priori θ ~N(1, 1), to

θ

_B

= (5 /1 * 2 + 1)/(5 + 1) = 11/6 ≈ 1.83 a gdyby rozkład a priori θ ~N(3, 1), to

θ

_B

= (5 /1 * 2 + 1*3)/(5 + 1) = 13/6 ≈ 2.17













+ +

+

2 2 2

1 1 1

1 1

,

τ σ τ

σ τ σ

n n

m X

N n

2 2

1 1

ˆ

τ σ

τ

θ

σ

+

= +

n

m X

n

B

(23)

BENW: przykłady (2)

2. Niech: X

₁

, ..., X

_n

IID z rozkładu N( θ , σ

²

), przy czym

σ

²

^znane; θ ^~N(m, τ

²

) dla pewnych m, τ ^znanych.

Wówczas rozkład a posteriori dla θ : a zatem

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 1) a rozkład a priori θ ~N(1, 1), to

BENW( θ ) = (5 /1 * 2 + 1)/(5/1 + 1) = 11/6 ≈ 1.83 a gdyby rozkład a priori θ ~N(3, 1), to

BENW( θ ) = (5 /1 * 2 + 1*3)/(5 + 1) = 13-6 ≈ 2.17













+ +

+

2 2 2

2

2 2

1 1

1

1 1

,

τ σ

n n

m X

N n

2 2

1 1

) (

τ σ

τ

θ

σ

+

= +

n

m X

BENW n

(24)