• Nie Znaleziono Wyników

Statystyka Matematyczna

N/A
N/A
Protected

Academic year: 2021

Share "Statystyka Matematyczna"

Copied!
24
0
0

Pełen tekst

(1)

Statystyka Matematyczna

Anna Janicka

wykład XIII, 30.05.2016

S

TATYSTYKA

B

AYESOWSKA

(2)

Plan na dzisiaj

1. Statystyka Bayesowska

rozkłady a priori i a posteriori estymacja Bayesowska:

Bayesowski Estymator Największej Wiarogodności (BENW)

Estymator Bayesowski przy zadanej funkcji straty

(3)

Statystyka Bayesowska vs. tradycyjna

Tradycyjna: nieznane parametry są ustalone, dane (obserwacje) są zmiennymi losowymi

Bayesowska: dane (obserwacje) są ustalone,

nieznane parametry są losowe

(4)

Statystyka Bayesowska

Różnica w stosunku do „tradycyjnej” statystyki i metod wnioskowania: naszą wiedzę o

(nieznanych) parametrach opisujemy przy pomocy rozkładów prawdopodobieństwa, przy czym dodatkowa wiedza może wpływać na nasz opis. Wiedza:

ogólna

dotycząca konkretnego przypadku

Przykład: Rzut monetą

(5)

Model Bayesowski

zmienne X

1

, ..., X

n

, pochodzące z rozkładu P

θ

, o gęstości f

θ

(x) – gęstość warunkowa pod warunkiem konkretnej wartości θ

(funkcja wiarogodności).

P – rodzina rozkładów prawdopodobieństw P

θ

, indeksowana parametrem θ ∈Θ

Wiedza ogólna: rozkład p-stwa Π na

przestrzeni parametrów Θ, zadany przez

π ( θ ) – tzw. rozkład a priori parametru θ ,

θ ~ Π

(6)

Model Bayesowski – cd.

Wiedza dodatkowa, szczególna,

kontekstualna: wynika z obserwacji. Mamy rozkład łączny obserwacji i parametru θ :

z którego możemy wyznaczyć warunkowy rozkład dla θ (po uwzględnieniu obserwacji) gdzie

jest rozkładem brzegowym dla obs.

) ( )

| ,...,

, (

) , ,...,

,

( x

1

x

2

x

n

θ f x

1

x

2

x

n

θ π θ

f =

) , ,...,

(

) ( )

| ,...,

) ( ,...,

| (

1 1

1

n n

n

m x x

x x

x f

x θ π θ

θ

π =

θ θ

π

θ d

x x

f x

x

m (

1

,...,

n

) = ∫

Θ

(

1

,...,

n

| ) ( )

(7)

Model Bayesowski – rozkład a posteriori

Rozkład nazywany jest rozkładem a posteriori, ozn. Π

x

Rozkład a posteriori obrazuje całą wiedzę:

ogólną (wstępną) oraz szczególną (wynikającą z konkretnych danych).

Jest podstawą wnioskowania Bayesowskiego

) ,...,

|

( θ x

1

x

n

π

(8)

Rozkłady a priori i a posteriori: przykłady

1. Niech: X

1

, ..., X

n

IID z rozkładu 0-1 z p- stwem sukcesu θ ; niech

dla θ ∈(0,1) gdzie

oraz

wówczas rozkład a posteriori:

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

α β

B

=

) (

) ( ) ) (

1 ( )

,

( 1

0

1 1

β α

β β α

α α β

+ Γ

Γ

= Γ

=

u u du

B

) 1 (

) 1 (

) exp(

)

( 0

1 − = − Γ −

=

Γ α

uα u du α α

rozkład Beta(α,β)

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

(9)

Dla Beta (1,1) a priori i danych: n=10 i 1, 5, 9 sukcesów

(10)

Dla Beta (1,1) a priori i danych: n=100 i 10, 50, 90 sukcesów

(11)

Dla Beta (1,5) a priori i danych: n=10 i 1, 5, 9 sukcesów

(12)

Dla Beta (1,5) a priori i danych: n=100 i 10, 50, 90 sukcesów

(13)

Rozkłady a priori i a posteriori: przykłady (2)

2. Niech: X

1

, ..., X

n

IID z rozkładu N( θ , σ

2

), przy czym σ

2

znane; θ ~N(m, τ

2

) dla

pewnych m, τ znanych.

wówczas rozkład a posteriori dla θ :

 

 

+ +

+

2 2

2 2

2 2

1 1

1 1

1

1

1

,

τ σ

τ σ

τ σ

n n

m X

N n

(14)

Statystyka Bayesowska

Korzystając z modeli Bayesowskich, możemy wyznaczać estymatory

wyznaczać odpowiedniki przedziału ufności weryfikować hipotezy

dokonywać predykcji

(15)

Bayesowski Estymator Największej Wiarogodności (BENW)

Wyznaczamy tak, by maksymalizował p- stwo a posteriori (moda rozkładu):

czyli

) ,...,

| ( max

) ,...,

ˆ |

( θ

BENW

x

1

x

n

π θ x

1

x

n

π =

θ

) ,...,

| ( max

ˆ arg )

(

BENW

x

1

x

n

BENW θ = θ =

θ

π θ

(16)

BENW: przykłady

1. Niech: X

1

, ..., X

n

IID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)

znamy rozkład a posteriori:

max dla

np. dla 5 sukcesów zaobserwowanych w 10 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=5/10 = ½

a dla 9 sukcesów zaobserwowanych w 10 próbach i tego samego rozkładu a priori, mamy BENW(θ )=9/10

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

α β

B

=

rozkład Beta(α,β);

jego moda

= (α-1)/(α+ β-2) dla α>1, β>1

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

2 ) 1

(

1

− +

+

= ∑

=

+

α β

θ α

n BENW x

n

i i

(17)

BENW: przykłady (2)

2. Niech: X

1

, ..., X

n

IID z rozkładu N( θ , σ

2

), przy czym

σ

2

znane; θ ~N(m, τ

2

) dla pewnych m, τ znanych.

Wówczas rozkład a posteriori dla θ : a zatem

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 4) a rozkład a priori θ ~N(1, 1), to

BENW( θ ) = (5 /4 * 2 + 1)/(5/4 + 1) = 14/9 ≈ 1.56 a gdyby rozkład a priori θ ~N(3, 1), to

BENW( θ ) = (5 /4 * 2 + 1*3)/(5/4 + 1) = 22/9 ≈ 2.44

+ +

+

2 2 2

2

2 2

1 1

1 1

1

1 1

,

τ σ

τ σ

τ σ

n n

m X

N n

2 2

2 2

1 1

1 1

) (

τ σ

τ

θ

σ

+

= +

n

m X

BENW n

(18)

Estymator Bayesowski

przy zadanej funkcji straty

L( θ , a) – funkcja straty zależna od prawdziwej wartości parametru θ oraz decyzji a.

np. jeśli estymujemy wielkość g( θ ):

L( θ , a) = (g( θ ) - a)

2

– kwadratowa funkcja straty L( θ , a) = |g( θ ) - a| – modułowa funkcja straty

Definiujemy też ryzyko a posteriori:

(średnia strata estymatora przy ustalonym

rozkładzie a priori i danych, tj. przy wyliczonym rozkładzie a posteriori)

( = ) = ∫

Θ

=

Π g x E L θ g x X x L θ g x π θ x d θ

R ( , ˆ ( )) ( , ˆ ( )) | ( , ˆ ( )) ( | )

(19)

Estymator Bayesowski

przy zadanej funkcji straty – cd.

Estymator Bayesowski przy danej funkcji straty L( θ , a) to t. że

Przy kwadratowej funkcji straty ( θ – a)

2

: Przy modułowej funkcji straty | θ – a|

2

:

B

) ,

( min

)) ˆ (

, (

R g x R a

x Π

B

=

a

Π

) (

)

| ˆ (

x B

= E θ X = x = E Π

θ

) ˆ (

x B

= Med Π

θ

ogólniej: E(g(θ)|x)

(20)

Estymator Bayesowski: przykłady

1. Niech: X

1

, ..., X

n

IID z rozkładu 0-1 z p-stwem

sukcesu θ ; niech dla θ ∈(0,1) znamy rozkład a posteriori:

a zatem estymator Bayesowski przy kwadratowej funkcji straty to

np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy θB=11/22 = ½

a dla 15 sukcesów przy tym samym rozkładzie a priori:

θB=16/22 = 8/11

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

α β

B

=

rozkład Beta(α,β);

jego średnia

= α/(α+ β)

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

α β

θ α

+ +

= ∑

=

+ n

n

x

i i

B

ˆ

1

(21)

BENW: przykłady

1. Niech: X

1

, ..., X

n

IID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)

znamy rozkład a posteriori:

max dla

np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=10/20 = ½

a dla 15 sukcesów zaobserwowanych w 20 próbach i tego samego rozkładu a priori, mamy BENW(θ )=15/20 = ¾

) , (

) 1

) ( (

1 1

β α

θ θ θ

π

α β

B

=

rozkład Beta(α,β);

jego moda

= (α-1)/(α+ β-2) dla α>1, β>1

) ,

(

Beta ∑

=1

+ α − ∑

=1

+ β

n

i i

n

i

x

i

n x

2 ) 1

(

1

− +

+

= ∑

=

+

α β

θ α

n BENW x

n

i i

(22)

Estymator Bayesowski: przykłady (2)

2. Niech: X

1

, ..., X

n

IID z rozkładu N( θ , σ

2

), przy czym

σ

2

znane; θ ~N(m, τ

2

) dla pewnych m, τ znanych.

Wówczas rozkład a posteriori dla θ :

a zatem Bayesowski estymator przy kwadratowej i modułowej funkcji straty to

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 1) a rozkład a priori θ ~N(1, 1), to

θ

B

= (5 /1 * 2 + 1)/(5 + 1) = 11/6 ≈ 1.83 a gdyby rozkład a priori θ ~N(3, 1), to

θ

B

= (5 /1 * 2 + 1*3)/(5 + 1) = 13/6 ≈ 2.17

+ +

+

2 2 2

2 2 2

1 1 1

1 1

1 1

,

τ σ τ

σ τ σ

n n

m X

N n

2 2

2 2

1 1

1 1

ˆ

τ σ

τ

θ

σ

+

= +

n

m X

n

B

(23)

BENW: przykłady (2)

2. Niech: X

1

, ..., X

n

IID z rozkładu N( θ , σ

2

), przy czym

σ

2

znane; θ ~N(m, τ

2

) dla pewnych m, τ znanych.

Wówczas rozkład a posteriori dla θ : a zatem

np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 1) a rozkład a priori θ ~N(1, 1), to

BENW( θ ) = (5 /1 * 2 + 1)/(5/1 + 1) = 11/6 ≈ 1.83 a gdyby rozkład a priori θ ~N(3, 1), to

BENW( θ ) = (5 /1 * 2 + 1*3)/(5 + 1) = 13-6 ≈ 2.17

+ +

+

2 2 2

2

2 2

1 1

1 1

1

1 1

,

τ σ

τ σ

τ σ

n n

m X

N n

2 2

2 2

1 1

1 1

) (

τ σ

τ

θ

σ

+

= +

n

m X

BENW n

(24)

Cytaty

Powiązane dokumenty

W pliku index.html przy użyciu znaczników nagłówków od <h1> do <h6> należy zapisać swoje Imię7. W pliku index.html przy użyciu znacznika paragrafu <p>

Rachunek prawdopodobieństwa i statystyka matematyczna 10.. Rodzaje zbieżności

Przyjmując poziom istotności 0,05 zweryfikować hipotezę, że prawdopodobieństwo wystą- pienia na tym terenie wypadku spowodowanego przez kierowcę w stanie nietrzeźwym jest

14.1 W celu oszacowania wartości przeciętnego czasu bezawaryjnej pracy maszyny z partii tych maszyn wybrano losowo 7 maszyn i mierzono czas ich pracy do pierwszej awarii.. Wiedząc,

16.5 Z populacji pobrano 1000

Przyjmując poziom istotności α = 0, 05 zweryfikować hipotezę, że prawdopodobień- stwo wystąpienia na tym terenie wypadku spowodowanego przez kierowcę w stanie nietrzeźwym

19.5 Z populacji pobrano 1000

będzie ciągiem niezależnych zmiennych losowych o rozkładzie jednos- tajnym na odcinku (−1, 1). będzie ciągiem niezależnych zmiennych losowych o rozkładzie jednos- tajnym na