• Nie Znaleziono Wyników

Statystyka Matematyczna

N/A
N/A
Protected

Academic year: 2021

Share "Statystyka Matematyczna"

Copied!
20
0
0

Pełen tekst

(1)

Statystyka Matematyczna

Anna Janicka

wykład XIV, 06.06.2016

S

TATYSTYKA

B

AYESOWSKA

CD

.

(2)

Plan na dzisiaj

1. Statystyka Bayesowska

rozkłady a priori i a posteriori estymacja Bayesowska:

Bayesowski Estymator Największej Wiarogodności (BENW)

Estymator Bayesowski przy zadanej funkcji straty

przedział ufności HPD

(3)

Model Bayesowski

zmienne X

1

, ..., X

n

, pochodzące z rozkładu P θ , o gęstości f θ (x) – gęstość warunkowa pod warunkiem konkretnej wartości θ .

P – rodzina rozkładów prawdopodobieństw P θ , indeksowana parametrem θ ∈Θ

Wiedza ogólna: rozkład p-stwa Π na

przestrzeni parametrów Θ, zadany przez

π ( θ ) – tzw. rozkład a priori parametru θ ,

θ ~ Π

(4)

Model Bayesowski – cd.

Wiedza dodatkowa, szczególna,

kontekstualna: wynika z obserwacji. Mamy rozkład łączny obserwacji i parametru θ :

z którego możemy wyznaczyć warunkowy rozkład dla θ (po uwzględnieniu obserwacji) gdzie

jest rozkładem brzegowym dla obs.

) ( )

| ,...,

, (

) , ,...,

,

( x

1

x

2

x

n

θ f x

1

x

2

x

n

θ π θ

f =

) , ,...,

(

) ( )

| ,...,

) ( ,...,

| (

1 1

1

n n

n

m x x

x x

x f

x θ π θ

θ

π =

θ θ

π

θ d

x x

f x

x

m (

1

,...,

n

) = ∫

Θ

(

1

,...,

n

| ) ( )

(5)

Model Bayesowski – rozkład a posteriori

Rozkład nazywany jest rozkładem a posteriori, ozn. Π

x

Rozkład a posteriori obrazuje całą wiedzę:

ogólną (wstępną) oraz szczególną

(wynikającą z konkretnych danych). Jest podstawą wnioskowania Bayesowskiego

) ,...,

|

( θ x

1

x

n

π

(6)

Bayesowski Estymator Największej Wiarogodności (BENW)

Wyznaczamy tak, by maksymalizował p- stwo a posteriori (moda rozkładu):

czyli

) ,...,

| ( max

) ,...,

ˆ |

( θ

BENW

x

1

x

n

π θ x

1

x

n

π =

θ

) ,...,

| ( max

ˆ arg )

(

BENW

x

1

x

n

BENW θ = θ =

θ

π θ

(7)

BENW: przykłady

1. Niech: X

1

, ..., X

n

IID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)

znamy rozkład a posteriori:

max dla

np. dla 5 sukcesów zaobserwowanych w 10 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=5/10 = ½

a dla 9 sukcesów zaobserwowanych w 10 próbach i tego samego rozkładu a priori, mamy BENW(θ )=9/10

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

α β

B

=

rozkład Beta(α,β);

jego moda

= (α-1)/(α+ β-2) dla α>1, β>1

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

2 ) 1

(

1

− +

+

= ∑

=

+

α β

θ α

n BENW x

n

i i

(8)

BENW: przykłady (2)

2. Niech: X

1

, ..., X

n

IID z rozkładu N( θ , σ

2

), przy czym

σ

2

znane; θ ~N(m, τ

2

) dla pewnych m, τ znanych.

Wówczas rozkład a posteriori dla θ : a zatem

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 4) a rozkład a priori θ ~N(1, 1), to

BENW( θ ) = (5 /4 * 2 + 1)/(5/4 + 1) = 14/9 ≈ 1.56 a gdyby rozkład a priori θ ~N(3, 1), to

BENW( θ ) = (5 /4 * 2 + 1*3)/(5/4 + 1) = 22/9 ≈ 2.44





+ +

+

2 2 2

2

2 2

1 1

1 1

1

1 1

,

τ σ

τ σ

τ σ

n n

m X

N n

2 2

2 2

1 1

1 1

) (

τ σ

τ

θ

σ

+

= +

n

m X

BENW n

(9)

Estymator Bayesowski

przy zadanej funkcji straty

L( θ , a) – funkcja straty zależna od prawdziwej wartości parametru θ oraz decyzji a.

np. jeśli estymujemy wielkość g( θ ):

L( θ , a) = (g( θ ) - a)

2

– kwadratowa funkcja straty L( θ , a) = |g( θ ) - a| – modułowa funkcja straty

Definiujemy też ryzyko a posteriori:

(średnia strata estymatora przy ustalonym

rozkładzie a priori i danych, tj. przy wyliczonym rozkładzie a posteriori)

( = ) = ∫

Θ

=

Π g x E L θ g x X x L θ g x π θ x d θ

R ( , ˆ ( )) ( , ˆ ( )) | ( , ˆ ( )) ( | )

(10)

Estymator Bayesowski

przy zadanej funkcji straty – cd.

Estymator Bayesowski przy danej funkcji straty L( θ , a) to t. że

Przy kwadratowej funkcji straty ( θ – a)

2

: Przy modułowej funkcji straty | θ – a|:

B

) ,

( min

)) ˆ (

, (

R g x R a

x Π

B

=

a

Π

) (

)

| ˆ (

x B

= E θ X = x = E Π

θ

) ˆ (

x B

= Med Π

θ

ogólniej: E(g(θ)|x)

(11)

Estymator Bayesowski: przykłady

1. Niech: X

1

, ..., X

n

IID z rozkładu 0-1 z p-stwem

sukcesu θ ; niech dla θ ∈(0,1) znamy rozkład a posteriori:

a zatem estymator Bayesowski przy kwadratowej funkcji straty to

np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy θB=11/22 = ½

a dla 15 sukcesów przy tym samym rozkładzie a priori:

θB=16/22 = 8/11

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

α β

B

=

rozkład Beta(α,β);

jego średnia

= α/(α+ β)

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

α β

θ α

+ +

= ∑

=

+ n

n

x

i i

B

ˆ

1

(12)

BENW: przykłady

1. Niech: X

1

, ..., X

n

IID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)

znamy rozkład a posteriori:

max dla

np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=10/20 = ½

a dla 15 sukcesów zaobserwowanych w 20 próbach i tego samego rozkładu a priori, mamy BENW(θ )=15/20 = ¾

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

α β

B

=

rozkład Beta(α,β);

jego moda

= (α-1)/(α+ β-2) dla α>1, β>1

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

2 ) 1

(

1

− +

+

= ∑

=

+

α β

θ α

n BENW x

n

i i

(13)

Estymator Bayesowski: przykłady (2)

2. Niech: X

1

, ..., X

n

IID z rozkładu N( θ , σ

2

), przy czym

σ

2

znane; θ ~N(m, τ

2

) dla pewnych m, τ znanych.

Wówczas rozkład a posteriori dla θ :

a zatem Bayesowski estymator przy kwadratowej i modułowej funkcji straty to

np. jeśli próba 5 obserwacji 1,2; 1,7 ; 1,9 ; 2,1; 3,1 z rozkładu N( θ , 1) a rozkład a priori θ ~N(1, 1), to

θ

B

= (5 /1 * 2 + 1)/(5 + 1) = 11/6 ≈ 1,83 a gdyby rozkład a priori θ ~N(3, 1), to

θ

B

= (5 /1 * 2 + 1*3)/(5 + 1) = 13/6 ≈ 2,17

+ +

+

2 2 2

2 2 2

1 1 1

1 1

1 1

,

τ σ τ

σ τ σ

n n

m X

N n

2 2

2 2

1 1

1 1

ˆ

τ σ

τ

θ

σ

+

= +

n

m X

n

B

(14)

BENW: przykłady (2)

2. Niech: X

1

, ..., X

n

IID z rozkładu N( θ , σ

2

), przy czym

σ

2

znane; θ ~N(m, τ

2

) dla pewnych m, τ znanych.

Wówczas rozkład a posteriori dla θ : a zatem

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 4) a rozkład a priori θ ~N(1, 1), to

BENW( θ ) = (5 /4 * 2 + 1)/(5/4 + 1) = 14/9 ≈ 1.56 a gdyby rozkład a priori θ ~N(3, 1), to

BENW( θ ) = (5 /4 * 2 + 1*3)/(5/4 + 1) = 22/9 ≈ 2.44





+ +

+

2 2 2

2

2 2

1 1

1 1

1

1 1

,

τ σ

τ σ

τ σ

n n

m X

N n

2 2

2 2

1 1

1 1

) (

τ σ

τ

θ

σ

+

= +

n

m X

BENW n

(15)

Bayesowski przedział ufności HPD

Bayesowski przedział ufności HPD (Highest Posterior Density) dla parametru θ na poziomie ufności 1- α to

zbiór A ⊆ Θ t. że

oraz

dla pewnej wartości (największej t.że drugi warunek jest spełniony)

Przedział ufności HPD ma „intuicyjną” własność zawierania, której nie mają „zwykłe” przedziały ufności

} )

| (

: {

θ π θ k α

A = x >

α

≥ Π ( A | x ) 1

k α

(16)

Przedział ufności HPD: przykład

Niech: X

1

, ..., X

n

IID z rozkładu N( θ , σ

2

), przy czym

σ

2

znane; θ ~N(m, τ

2

) dla pewnych m, τ znanych.

Wówczas rozkład a posteriori dla θ :

a zatem przedział ufności HPD na poziomie istotności α = 0,05 to

np. jeśli próba 5 obserwacji z rozkładu N( θ , 1) ma średnią 2 a rozkład a priori to θ ~N(1, 1), mamy u

0,975

≈1,96 i mamy

+ +

+

2 2 2

2 2 2

1 1 1

1 1

1 1

,

τ σ τ

σ τ σ

n n

m X

N n

 

 

⋅ + + +

+

⋅ + + −

+

2 2

2 2

2 2

2 2

2 2

2 2

1 1

1 1

1 1

1 1

1 1

1

1

1

96 , 1 1 ,

96 , 1

τ σ

τ σ

τ σ

τ σ

τ σ

τ σ

n n

m X

n n

n

m X

n

( 1 , 83 1 , 96

16

; 1 , 83 + 1 , 96

16

) ( = 1 , 50 ; 2 , 15 )

(17)

Przykładowe zadania egzaminacyjne

(18)

Przykładowe zadania egzaminacyjne (2)

(19)

Przykładowe zadania egzaminacyjne (3)

(20)

Cytaty

Powiązane dokumenty

(nieznanych) parametrach opisujemy przy pomocy rozkładów prawdopodobieństwa, przy czym dodatkowa wiedza może wpływać na nasz

Przy założeniach poprzedniego zadania podaj przedział ufności dla

Producent samochodów w USA chce oszacować średnie zużycie paliwa przez nowy model samochodu, mierzone ilością mil przejechanych na jednym galonie paliwa na autostradzie..

Metody momentów i kwantyli (wszystkie podane tu zadania należy rozwiązać tymi dwoma metodami)..

Informacja Fishera, asymptotyczna normalność

Estymator najwi¸ ekszej wiarogodno´ sci - zadania do.. samodzielnego

Dobrać najmniejsze n, przy którym prawdopodobieństwo tego, że tak utworzony przedział pokrywa wartość parametru θ jest większe niż

• Jeżeli wiemy w przybliżeniu, jakie jest p, to możemy tej przybliżonej wartości użyć w równaniu na długość przedziału (skąd wyznaczymy n). • Jeżeli brak