Statystyka Matematyczna
Anna Janicka
wykład XIII, 30.05.2016
S
TATYSTYKAB
AYESOWSKAPlan na dzisiaj
1. Statystyka Bayesowska
rozkłady a priori i a posteriori estymacja Bayesowska:
Bayesowski Estymator Największej Wiarogodności (BENW)
Estymator Bayesowski przy zadanej funkcji straty
Statystyka Bayesowska vs. tradycyjna
Tradycyjna: nieznane parametry są ustalone, dane (obserwacje) są zmiennymi losowymi
Bayesowska: dane (obserwacje) są ustalone,
nieznane parametry są losowe
Statystyka Bayesowska
Różnica w stosunku do „tradycyjnej” statystyki i metod wnioskowania: naszą wiedzę o
(nieznanych) parametrach opisujemy przy pomocy rozkładów prawdopodobieństwa, przy czym dodatkowa wiedza może wpływać na nasz opis. Wiedza:
ogólna
dotycząca konkretnego przypadku
Przykład: Rzut monetą
Model Bayesowski
zmienne X
1, ..., X
n, pochodzące z rozkładu P
θ, o gęstości f
θ(x) – gęstość warunkowa pod warunkiem konkretnej wartości θ
(funkcja wiarogodności).
P – rodzina rozkładów prawdopodobieństw P
θ, indeksowana parametrem θ ∈Θ
Wiedza ogólna: rozkład p-stwa Π na
przestrzeni parametrów Θ, zadany przez
π ( θ ) – tzw. rozkład a priori parametru θ ,
θ ~ Π
Model Bayesowski – cd.
Wiedza dodatkowa, szczególna,
kontekstualna: wynika z obserwacji. Mamy rozkład łączny obserwacji i parametru θ :
z którego możemy wyznaczyć warunkowy rozkład dla θ (po uwzględnieniu obserwacji) gdzie
jest rozkładem brzegowym dla obs.
) ( )
| ,...,
, (
) , ,...,
,
( x
1x
2x
nθ f x
1x
2x
nθ π θ
f =
) , ,...,
(
) ( )
| ,...,
) ( ,...,
| (
1 1
1
n n
n
m x x
x x
x f
x θ π θ
θ
π =
θ θ
π
θ d
x x
f x
x
m (
1,...,
n) = ∫
Θ(
1,...,
n| ) ( )
Model Bayesowski – rozkład a posteriori
Rozkład nazywany jest rozkładem a posteriori, ozn. Π
xRozkład a posteriori obrazuje całą wiedzę:
ogólną (wstępną) oraz szczególną (wynikającą z konkretnych danych).
Jest podstawą wnioskowania Bayesowskiego
) ,...,
|
( θ x
1x
nπ
Rozkłady a priori i a posteriori: przykłady
1. Niech: X
1, ..., X
nIID z rozkładu 0-1 z p- stwem sukcesu θ ; niech
dla θ ∈(0,1) gdzie
oraz
wówczas rozkład a posteriori:
) , (
) 1
) ( (
1 1
β α
θ θ θ
π
α βB
−
−
−
=
) (
) ( ) ) (
1 ( )
,
( 1
0
1 1
β α
β β α
α α β
+ Γ
Γ
= Γ
−
=
∫
u − u − duB
) 1 (
) 1 (
) exp(
)
( 0
1 − = − Γ −
=
Γ α
∫
∞uα− u du α αrozkład Beta(α,β)
) ,
(
Beta ∑
=1+ α − ∑
=1+ β
n
i i
n
i
x
in x
Dla Beta (1,1) a priori i danych: n=10 i 1, 5, 9 sukcesów
Dla Beta (1,1) a priori i danych: n=100 i 10, 50, 90 sukcesów
Dla Beta (1,5) a priori i danych: n=10 i 1, 5, 9 sukcesów
Dla Beta (1,5) a priori i danych: n=100 i 10, 50, 90 sukcesów
Rozkłady a priori i a posteriori: przykłady (2)
2. Niech: X
1, ..., X
nIID z rozkładu N( θ , σ
2), przy czym σ
2znane; θ ~N(m, τ
2) dla
pewnych m, τ znanych.
wówczas rozkład a posteriori dla θ :
+ +
+
2 2
2 2
2 2
1 1
1 1
1
1
1
,
τ σ
τ σ
τ σ
n n
m X
N n
Statystyka Bayesowska
Korzystając z modeli Bayesowskich, możemy wyznaczać estymatory
wyznaczać odpowiedniki przedziału ufności weryfikować hipotezy
dokonywać predykcji
Bayesowski Estymator Największej Wiarogodności (BENW)
Wyznaczamy tak, by maksymalizował p- stwo a posteriori (moda rozkładu):
czyli
) ,...,
| ( max
) ,...,
ˆ |
( θ
BENWx
1x
nπ θ x
1x
nπ =
θ) ,...,
| ( max
ˆ arg )
(
BENWx
1x
nBENW θ = θ =
θπ θ
BENW: przykłady
1. Niech: X
1, ..., X
nIID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)
znamy rozkład a posteriori:
max dla
np. dla 5 sukcesów zaobserwowanych w 10 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=5/10 = ½
a dla 9 sukcesów zaobserwowanych w 10 próbach i tego samego rozkładu a priori, mamy BENW(θ )=9/10
) , (
) 1
) ( (
1 1
β α
θ θ θ
π
α βB
−
−
−
=
rozkład Beta(α,β);
jego moda
= (α-1)/(α+ β-2) dla α>1, β>1
) ,
(
Beta ∑
=1+ α − ∑
=1+ β
n
i i
n
i
x
in x
2 ) 1
(
1− +
+
−
= ∑
=+
α β
θ α
n BENW x
n
i i
BENW: przykłady (2)
2. Niech: X
1, ..., X
nIID z rozkładu N( θ , σ
2), przy czym
σ
2znane; θ ~N(m, τ
2) dla pewnych m, τ znanych.
Wówczas rozkład a posteriori dla θ : a zatem
np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 4) a rozkład a priori θ ~N(1, 1), to
BENW( θ ) = (5 /4 * 2 + 1)/(5/4 + 1) = 14/9 ≈ 1.56 a gdyby rozkład a priori θ ~N(3, 1), to
BENW( θ ) = (5 /4 * 2 + 1*3)/(5/4 + 1) = 22/9 ≈ 2.44
+ +
+
2 2 2
2
2 2
1 1
1 1
1
1 1
,
τ σ
τ σ
τ σ
n n
m X
N n
2 2
2 2
1 1
1 1
) (
τ σ
τ
θ
σ+
= +
n
m X
BENW n
Estymator Bayesowski
przy zadanej funkcji straty
L( θ , a) – funkcja straty zależna od prawdziwej wartości parametru θ oraz decyzji a.
np. jeśli estymujemy wielkość g( θ ):
L( θ , a) = (g( θ ) - a)
2– kwadratowa funkcja straty L( θ , a) = |g( θ ) - a| – modułowa funkcja straty
Definiujemy też ryzyko a posteriori:
(średnia strata estymatora przy ustalonym
rozkładzie a priori i danych, tj. przy wyliczonym rozkładzie a posteriori)
( = ) = ∫
Θ=
Π g x E L θ g x X x L θ g x π θ x d θ
R ( , ˆ ( )) ( , ˆ ( )) | ( , ˆ ( )) ( | )
Estymator Bayesowski
przy zadanej funkcji straty – cd.
Estymator Bayesowski przy danej funkcji straty L( θ , a) to t. że
Przy kwadratowej funkcji straty ( θ – a)
2: Przy modułowej funkcji straty | θ – a|
2:
gˆ
B) ,
( min
)) ˆ (
, (
R g x R a
x Π
B=
aΠ
∀
) (
)
| ˆ (
x B
= E θ X = x = E Π
θ
) ˆ (
x B
= Med Π
θ
ogólniej: E(g(θ)|x)
Estymator Bayesowski: przykłady
1. Niech: X
1, ..., X
nIID z rozkładu 0-1 z p-stwem
sukcesu θ ; niech dla θ ∈(0,1) znamy rozkład a posteriori:
a zatem estymator Bayesowski przy kwadratowej funkcji straty to
np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy θB=11/22 = ½
a dla 15 sukcesów przy tym samym rozkładzie a priori:
θB=16/22 = 8/11
) , (
) 1
) ( (
1 1
β α
θ θ θ
π
α βB
−
−
−
=
rozkład Beta(α,β);
jego średnia
= α/(α+ β)
) ,
(
Beta ∑
=1+ α − ∑
=1+ β
n
i i
n
i
x
in x
α β
θ α
+ +
= ∑
=+ n
n
x
i i
B
ˆ
1BENW: przykłady
1. Niech: X
1, ..., X
nIID z rozkładu 0-1 z p-stwem sukcesu θ ; niech dla θ ∈(0,1)
znamy rozkład a posteriori:
max dla
np. dla 10 sukcesów zaobserwowanych w 20 próbach i dla rozkładu a priori U(0,1) (czyli Beta(1,1)), mamy BENW(θ)=10/20 = ½
a dla 15 sukcesów zaobserwowanych w 20 próbach i tego samego rozkładu a priori, mamy BENW(θ )=15/20 = ¾
) , (
) 1
) ( (
1 1
β α
θ θ θ
π
α βB
−
−
−
=
rozkład Beta(α,β);
jego moda
= (α-1)/(α+ β-2) dla α>1, β>1
) ,
(
Beta ∑
=1+ α − ∑
=1+ β
n
i i
n
i
x
in x
2 ) 1
(
1− +
+
−
= ∑
=+
α β
θ α
n BENW x
n
i i
Estymator Bayesowski: przykłady (2)
2. Niech: X
1, ..., X
nIID z rozkładu N( θ , σ
2), przy czym
σ
2znane; θ ~N(m, τ
2) dla pewnych m, τ znanych.
Wówczas rozkład a posteriori dla θ :
a zatem Bayesowski estymator przy kwadratowej i modułowej funkcji straty to
np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 1) a rozkład a priori θ ~N(1, 1), to
θ
B= (5 /1 * 2 + 1)/(5 + 1) = 11/6 ≈ 1.83 a gdyby rozkład a priori θ ~N(3, 1), to
θ
B= (5 /1 * 2 + 1*3)/(5 + 1) = 13/6 ≈ 2.17
+ +
+
2 2 2
2 2 2
1 1 1
1 1
1 1
,
τ σ τ
σ τ σ
n n
m X
N n
2 2
2 2
1 1
1 1
ˆ
τ σ
τ
θ
σ+
= +
n
m X
n
B
BENW: przykłady (2)
2. Niech: X
1, ..., X
nIID z rozkładu N( θ , σ
2), przy czym
σ
2znane; θ ~N(m, τ
2) dla pewnych m, τ znanych.
Wówczas rozkład a posteriori dla θ : a zatem
np. jeśli próba 5 obserwacji 1.2; 1.7 ; 1.9 ; 2.1; 3.1 z rozkładu N( θ , 1) a rozkład a priori θ ~N(1, 1), to
BENW( θ ) = (5 /1 * 2 + 1)/(5/1 + 1) = 11/6 ≈ 1.83 a gdyby rozkład a priori θ ~N(3, 1), to
BENW( θ ) = (5 /1 * 2 + 1*3)/(5 + 1) = 13-6 ≈ 2.17
+ +
+
2 2 2
2
2 2
1 1
1 1
1
1 1
,
τ σ
τ σ
τ σ
n n
m X
N n
2 2
2 2
1 1
1 1
) (
τ σ
τ