Ekonometria Bayesowska
Wykład 8: MCMC. Próbnik Gibbsa. Numeryczna ocena gęstości brzegowej
Andrzej Torój
Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
Próbnik Gibbsa Marginal likelihood
Plan wykładu
1 Próbnik Gibbsa
2 Wiarygodność brzegowa modelu – ocena numeryczna
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 2 / 12
Plan prezentacji
1 Próbnik Gibbsa
2 Wiarygodność brzegowa modelu – ocena numeryczna
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – idea
Czy potrafimy losować z tych rozkładów?
f (x , y ) ∝ e−
(xy −µ)2
2σ2 (x 6= 0, y 6= 0)
f (x|y) ∝ e−
(xy−µ)2
2σ2 = e
−(x −µy)2
2(σy)2
f (y|x) ∝ e−
(xy −µ)2
2σ2 = e
−(y −µx)2
2(σx)2
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 4 / 12
Próbnik Gibbsa – idea
Czy potrafimy losować z tych rozkładów?
f (x , y ) ∝ e−
(xy −µ)2
2σ2 (x 6= 0, y 6= 0)
f (x|y) ∝ e−
(xy−µ)2
2σ2 = e
−(x −µy)2
2(σy)2
f (y|x) ∝ e−
(xy −µ)2
2σ2 = e
−(y −µx)2
2(σx)2
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – idea
Czy potrafimy losować z tych rozkładów?
f (x , y ) ∝ e−
(xy −µ)2
2σ2 (x 6= 0, y 6= 0)
f (x|y) ∝ e−
(xy−µ)2
2σ2 = e
−(x −µy)2
2(σy)2
f (y|x) ∝ e−
(xy −µ)2
2σ2 = e
−(y −µx)2
2(σx)2
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 4 / 12
Próbnik Gibbsa – idea
Czy potrafimy losować z tych rozkładów?
f (x , y ) ∝ e−
(xy −µ)2
2σ2 (x 6= 0, y 6= 0)
f (x|y) ∝ e−
(xy−µ)2
2σ2 = e
−(x −µy)2
2(σy)2
f (y|x) ∝ e−
(xy −µ)2
2σ2 = e
−(y −µx)2
2(σx)2
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – przypadek dwuwymiarowy
Rozważmy wektor parametrów θ = (θ1, θ2) o nieznanej gęstości a posteriori p (θ1, θ2|y ).
1 Wybieramy startową wartość θ2(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 , y
.
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 , y .
4 Losujemy θ(2)1 z rozkładu warunkowego p
θ1|θ(1)2 , y .
5 Losujemy θ(2)2 z rozkładu warunkowego p
θ2|θ(2)1 , y .
6 Powtarzamy kroki 4 i 5 naprzemiennie S razy, każdorazowo warunkując wynikiem poprzedniego losowania.
7 Otrzymujemy θ(1), θ(2), ..., θ(S).
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 5 / 12
Próbnik Gibbsa – przypadek dwuwymiarowy
Rozważmy wektor parametrów θ = (θ1, θ2) o nieznanej gęstości a posteriori p (θ1, θ2|y ).
1 Wybieramy startową wartość θ2(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 , y
.
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 , y .
4 Losujemy θ(2)1 z rozkładu warunkowego p
θ1|θ(1)2 , y .
5 Losujemy θ(2)2 z rozkładu warunkowego p
θ2|θ(2)1 , y .
6 Powtarzamy kroki 4 i 5 naprzemiennie S razy, każdorazowo warunkując wynikiem poprzedniego losowania.
7 Otrzymujemy θ(1), θ(2), ..., θ(S).
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – przypadek dwuwymiarowy
Rozważmy wektor parametrów θ = (θ1, θ2) o nieznanej gęstości a posteriori p (θ1, θ2|y ).
1 Wybieramy startową wartość θ2(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 , y
.
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 , y .
4 Losujemy θ(2)1 z rozkładu warunkowego p
θ1|θ(1)2 , y .
5 Losujemy θ(2)2 z rozkładu warunkowego p
θ2|θ(2)1 , y .
6 Powtarzamy kroki 4 i 5 naprzemiennie S razy, każdorazowo warunkując wynikiem poprzedniego losowania.
7 Otrzymujemy θ(1), θ(2), ..., θ(S).
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 5 / 12
Próbnik Gibbsa – przypadek dwuwymiarowy
Rozważmy wektor parametrów θ = (θ1, θ2) o nieznanej gęstości a posteriori p (θ1, θ2|y ).
1 Wybieramy startową wartość θ2(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 , y
.
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 , y .
4 Losujemy θ(2)1 z rozkładu warunkowego p
θ1|θ(1)2 , y .
5 Losujemy θ(2)2 z rozkładu warunkowego p
θ2|θ(2)1 , y .
6 Powtarzamy kroki 4 i 5 naprzemiennie S razy, każdorazowo warunkując wynikiem poprzedniego losowania.
7 Otrzymujemy θ(1), θ(2), ..., θ(S).
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – przypadek dwuwymiarowy
Rozważmy wektor parametrów θ = (θ1, θ2) o nieznanej gęstości a posteriori p (θ1, θ2|y ).
1 Wybieramy startową wartość θ2(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 , y
.
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 , y .
4 Losujemy θ(2)1 z rozkładu warunkowego p
θ1|θ(1)2 , y .
5 Losujemy θ(2)2 z rozkładu warunkowego p
θ2|θ(2)1 , y .
6 Powtarzamy kroki 4 i 5 naprzemiennie S razy, każdorazowo warunkując wynikiem poprzedniego losowania.
7 Otrzymujemy θ(1), θ(2), ..., θ(S).
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 5 / 12
Próbnik Gibbsa – przypadek dwuwymiarowy
Rozważmy wektor parametrów θ = (θ1, θ2) o nieznanej gęstości a posteriori p (θ1, θ2|y ).
1 Wybieramy startową wartość θ2(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 , y
.
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 , y .
4 Losujemy θ(2)1 z rozkładu warunkowego p
θ1|θ(1)2 , y .
5 Losujemy θ(2)2 z rozkładu warunkowego p
θ2|θ(2)1 , y .
6 Powtarzamy kroki 4 i 5 naprzemiennie S razy, każdorazowo warunkując wynikiem poprzedniego losowania.
7 Otrzymujemy θ(1), θ(2), ..., θ(S).
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – przypadek dwuwymiarowy
Rozważmy wektor parametrów θ = (θ1, θ2) o nieznanej gęstości a posteriori p (θ1, θ2|y ).
1 Wybieramy startową wartość θ2(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 , y
.
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 , y .
4 Losujemy θ(2)1 z rozkładu warunkowego p
θ1|θ(1)2 , y .
5 Losujemy θ(2)2 z rozkładu warunkowego p
θ2|θ(2)1 , y .
6 Powtarzamy kroki 4 i 5 naprzemiennie S razy, każdorazowo warunkując wynikiem poprzedniego losowania.
7 Otrzymujemy θ(1), θ(2), ..., θ(S).
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 5 / 12
Próbnik Gibbsa – uzasadnienie
p (θ1, θ2|y ) = p (θ1|θ2, y ) p (θ2|y )
Losowanie (θ1, θ2) z rozkładu łącznego można zastąpić
losowaniem θ1 z rozkładu warunkowego (względem θ2) oraz θ2 z rozkładu brzegowego.
Nie znamy jednak rozkładu brzegowego! Nasz wybór θ2(0) nie jest więc losowaniem.
Nie wpływa to jednak na rozkład, o ile liczba losowań S jest odpowiednio długa (często odrzucamy S0 pierwszych losowań jako tzw. burn-in i zostawiamy S1 = S − S0 pozostałych.
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – uzasadnienie
p (θ1, θ2|y ) = p (θ1|θ2, y ) p (θ2|y )
Losowanie (θ1, θ2) z rozkładu łącznego można zastąpić
losowaniem θ1 z rozkładu warunkowego (względem θ2) oraz θ2 z rozkładu brzegowego.
Nie znamy jednak rozkładu brzegowego! Nasz wybór θ2(0) nie jest więc losowaniem.
Nie wpływa to jednak na rozkład, o ile liczba losowań S jest odpowiednio długa (często odrzucamy S0 pierwszych losowań jako tzw. burn-in i zostawiamy S1 = S − S0 pozostałych.
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 6 / 12
Próbnik Gibbsa – uzasadnienie
p (θ1, θ2|y ) = p (θ1|θ2, y ) p (θ2|y )
Losowanie (θ1, θ2) z rozkładu łącznego można zastąpić
losowaniem θ1 z rozkładu warunkowego (względem θ2) oraz θ2 z rozkładu brzegowego.
Nie znamy jednak rozkładu brzegowego! Nasz wybór θ2(0) nie jest więc losowaniem.
Nie wpływa to jednak na rozkład, o ile liczba losowań S jest odpowiednio długa (często odrzucamy S0 pierwszych losowań jako tzw. burn-in i zostawiamy S1 = S − S0 pozostałych.
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – uzasadnienie
p (θ1, θ2|y ) = p (θ1|θ2, y ) p (θ2|y )
Losowanie (θ1, θ2) z rozkładu łącznego można zastąpić
losowaniem θ1 z rozkładu warunkowego (względem θ2) oraz θ2 z rozkładu brzegowego.
Nie znamy jednak rozkładu brzegowego! Nasz wybór θ2(0) nie jest więc losowaniem.
Nie wpływa to jednak na rozkład, o ile liczba losowań S jest odpowiednio długa (często odrzucamy S0 pierwszych losowań jako tzw. burn-in i zostawiamy S1 = S − S0 pozostałych.
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 6 / 12
Próbnik Gibbsa – przypadek ogólny
Rozważmy wektor parametrów θ = (θ1, θ2, ..., θK) o gęstości a posteriori p (θ|y ).
1 Wybieramy wektor wartości startowychθ(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 ,θ3(0), ...,θ(0)K , y .
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 ,θ3(0), ...,θ(0)K , y .
4 Losujemy θ(1)3 z rozkładu warunkowego p
θ3|θ(1)1 ,θ(1)2 ,θ4(0), ...,θ(0)K , y .
5 Kontynuujemy aż do kroku K, czyli uzyskania całego wektoraθ(1).
6 Powtarzamy kroki 1-5 zθ(1) jako wektorem wartości startowych.
7 Powtarzamy tę sekwencję S razy.
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – przypadek ogólny
Rozważmy wektor parametrów θ = (θ1, θ2, ..., θK) o gęstości a posteriori p (θ|y ).
1 Wybieramy wektor wartości startowychθ(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 ,θ3(0), ...,θ(0)K , y .
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 ,θ3(0), ...,θ(0)K , y .
4 Losujemy θ(1)3 z rozkładu warunkowego p
θ3|θ(1)1 ,θ(1)2 ,θ4(0), ...,θ(0)K , y .
5 Kontynuujemy aż do kroku K, czyli uzyskania całego wektoraθ(1).
6 Powtarzamy kroki 1-5 zθ(1) jako wektorem wartości startowych.
7 Powtarzamy tę sekwencję S razy.
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 7 / 12
Próbnik Gibbsa – przypadek ogólny
Rozważmy wektor parametrów θ = (θ1, θ2, ..., θK) o gęstości a posteriori p (θ|y ).
1 Wybieramy wektor wartości startowychθ(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 ,θ3(0), ...,θ(0)K , y .
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 ,θ3(0), ...,θ(0)K , y .
4 Losujemy θ(1)3 z rozkładu warunkowego p
θ3|θ(1)1 ,θ(1)2 ,θ4(0), ...,θ(0)K , y .
5 Kontynuujemy aż do kroku K, czyli uzyskania całego wektoraθ(1).
6 Powtarzamy kroki 1-5 zθ(1) jako wektorem wartości startowych.
7 Powtarzamy tę sekwencję S razy.
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – przypadek ogólny
Rozważmy wektor parametrów θ = (θ1, θ2, ..., θK) o gęstości a posteriori p (θ|y ).
1 Wybieramy wektor wartości startowychθ(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 ,θ3(0), ...,θ(0)K , y .
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 ,θ3(0), ...,θ(0)K , y .
4 Losujemy θ(1)3 z rozkładu warunkowego p
θ3|θ(1)1 ,θ(1)2 ,θ4(0), ...,θ(0)K , y .
5 Kontynuujemy aż do kroku K, czyli uzyskania całego wektoraθ(1).
6 Powtarzamy kroki 1-5 zθ(1) jako wektorem wartości startowych.
7 Powtarzamy tę sekwencję S razy.
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 7 / 12
Próbnik Gibbsa – przypadek ogólny
Rozważmy wektor parametrów θ = (θ1, θ2, ..., θK) o gęstości a posteriori p (θ|y ).
1 Wybieramy wektor wartości startowychθ(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 ,θ3(0), ...,θ(0)K , y .
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 ,θ3(0), ...,θ(0)K , y .
4 Losujemy θ(1)3 z rozkładu warunkowego p
θ3|θ(1)1 ,θ(1)2 ,θ4(0), ...,θ(0)K , y .
5 Kontynuujemy aż do kroku K, czyli uzyskania całego wektoraθ(1).
6 Powtarzamy kroki 1-5 zθ(1) jako wektorem wartości startowych.
7 Powtarzamy tę sekwencję S razy.
Próbnik Gibbsa Marginal likelihood
Próbnik Gibbsa
Próbnik Gibbsa – przypadek ogólny
Rozważmy wektor parametrów θ = (θ1, θ2, ..., θK) o gęstości a posteriori p (θ|y ).
1 Wybieramy wektor wartości startowychθ(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 ,θ3(0), ...,θ(0)K , y .
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 ,θ3(0), ...,θ(0)K , y .
4 Losujemy θ(1)3 z rozkładu warunkowego p
θ3|θ(1)1 ,θ(1)2 ,θ4(0), ...,θ(0)K , y .
5 Kontynuujemy aż do kroku K, czyli uzyskania całego wektoraθ(1).
6 Powtarzamy kroki 1-5 zθ(1) jako wektorem wartości startowych.
7 Powtarzamy tę sekwencję S razy.
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 7 / 12
Próbnik Gibbsa – przypadek ogólny
Rozważmy wektor parametrów θ = (θ1, θ2, ..., θK) o gęstości a posteriori p (θ|y ).
1 Wybieramy wektor wartości startowychθ(0).
2 Losujemy θ(1)1 z rozkładu warunkowego p
θ1|θ(0)2 ,θ3(0), ...,θ(0)K , y .
3 Losujemy θ(1)2 z rozkładu warunkowego p
θ2|θ(1)1 ,θ3(0), ...,θ(0)K , y .
4 Losujemy θ(1)3 z rozkładu warunkowego p
θ3|θ(1)1 ,θ(1)2 ,θ4(0), ...,θ(0)K , y .
5 Kontynuujemy aż do kroku K, czyli uzyskania całego wektoraθ(1).
6 Powtarzamy kroki 1-5 zθ(1) jako wektorem wartości startowych.
7 Powtarzamy tę sekwencję S razy.
Próbnik Gibbsa Marginal likelihood
Plan prezentacji
1 Próbnik Gibbsa
2 Wiarygodność brzegowa modelu – ocena numeryczna
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 8 / 12
Wiarygodność brzegowa modelu
Metody klasy MCMC, m.in. próbnik Gibbsa (jak również próbniki zaimplementowane w rstan) pozwalają na symulację rozkładu a posteriori (tzn. wielokrotne losowanie z niego).
Wyzwaniem pozostaje wyznaczenie wiarygodności brzegowej (ang. marginal likelihood) modelu, czyli całki licznika gęstości a posteriori ze względu na wszystkie parametry (lub, równoważnie, mianownika gęstości a posteriori).
Ta stała skalująca jest używana m.in. do wyznaczenia czynnika Bayesa dla pary modeli.
Czynnik Bayesa
BF(i ,j )= P y |M(i ) P y |M(j )
P y |M(j )
=
˙
Θ
P
y |θ(j ), M(j ) P
θ(j )|M(j ) d θ(j )
¯
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 9 / 12
Próbnik Gibbsa Marginal likelihood
Metody
Estymator średniej harmonicznej
Wzór Bayesa: P (θ|y ) =P(y |θ)P(θ)
P(y ) → P(θ)P(y ) = P(θ|y )P(y |θ)
P (y ) =
1 P(y )
−1
=
¯
Θ
P(θ)d θ P(y )
!−1
=
¯
Θ
P(θ) P(y )
d θ
−1
=
=
¯
Θ
P(θ|y ) P(y |θ)
d θ
−1
Wyrażenie w nawiasie kwadratowym można interpretować jako wartość oczekiwaną P(y |θ)1 ze względu na gęstość a posteriori P (θ|y ). Dysponując próbkami z gęstości a posteriori
θ(1), θ(2), ..., θ(S1), możemy wyznaczyć dla każdej z nich wartość f.
wiarygodności, a wyniki uśrednić (Newton & Raftery, 1994):
P (y ) '
"
1 S1
S1
X
s=1
1 P y |θ(s)
#−1
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 10 / 12
Krytyka i inne metody
Radford Neal (2008), "Worst Monte Carlo method ever": The bad news is that the number of points required for this
estimator to get close to the right answer will often be greater than the number of atoms in the observable universe.
Estymator średniej harmonicznej miewa w wielu przykładach nieskończoną wariancję. (Polecam replikację przykładów R.
Neala.)
Inne podejścia:
metodaGelfanda-Deya (1994)– zob. Koop (2003), roz.
5.7
losowanie z funkcji ważności
zob. też przeglądy Gronau i in. (2017, 2018)
Próbnik Gibbsa Marginal likelihood
Metody
Bridge sampling
Meng i Wong (1996). Pakiet bridgesampling w R (dobrze współpracuje z rstan, ale jest uniwersalny).
P (y )=
´P(y |θ)P(θ)h(θ)g (θ)d θ
´ P(y |θ)P(θ)
P(y ) h(θ)g (θ)d θ =
´P(y |θ)P(θ)h(θ)g (θ)d θ´ h(θ)g (θ)P(θ|y )d θ
Licznik to wartość oczekiwana wyrażenia P (y |θ) P (θ) h (θ) ze względu na funkcję generującą kandydatów g (θ) – konceptualny odpowiednik funkcji ważności. Częsty wybór to gęstość (wielowymiarowa) normalna z wartością oczekiwaną i wariancją jak w rozkładzie a posteriori. Losujemy N razy z tej funkcji, i dla wszystkich wyników θ(n) uśredniamy
P
y |θ(n) P
θ(n) h
θ(n) .
Mianownik to wartość oczekiwana wyrażenia h (θ) g (θ) ze względu na gęstość a posteriori. Po przeprowadzeniu symulacji a posteriori metodą MCMC, uśredniamy h
θ(s) g
θ(s) . h (θ): ang. bridge function. Odpowiada za to, by próbki z ogonów nie zdominowały zachowania estymatora, i w ten sposób stabilizuje jego wariancję. Meng i Wong (1996)
proponują iteracyjną metodę wyznaczania h (θ) minimalizującą MSE estymatora.
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(8) Ekonometria Bayesowska 12 / 12