Model probitowy
Ekonometria
Modelowanie zmiennej jakościowej
Jakub Mućk
Katedra Ekonomii Ilościowej
Model probitowy
Zmienna jakościowa
Zmienna ilościowa
może zostać zmierzona w skali.
Zmienna jakościowa
to zmienna, która jest niemierzalna ilościowo i której pomiar polega na przypisaniu do grupy z daną cechą.
Zmienne jakościowe:
uporządkowane(np. poziom wykształcenia), nominalne(np. ukończenie studiów wyższych).
Zmienna binarna (zero-jedynkowa, indykatorowa):
Model probitowy
Zmienna jakościowa
Zmienna ilościowa
może zostać zmierzona w skali.
Zmienna jakościowa
to zmienna, która jest niemierzalna ilościowo i której pomiar polega na przypisaniu do grupy z daną cechą.
Zmienne jakościowe:
uporządkowane(np. poziom wykształcenia), nominalne(np. ukończenie studiów wyższych).
Zmienna binarna (zero-jedynkowa, indykatorowa):
przyjmuje wartość 1 jeżeli jednostka spełnia warunek/posiada daną cechę oraz 0 w przeciwnym przypadku (w.p.p.).
Model probitowy
Zmienna jakościowa
Zmienna ilościowa
może zostać zmierzona w skali.
Zmienna jakościowa
to zmienna, która jest niemierzalna ilościowo i której pomiar polega na przypisaniu do grupy z daną cechą.
Zmienne jakościowe:
uporządkowane(np. poziom wykształcenia), nominalne(np. ukończenie studiów wyższych).
Zmienna binarna (zero-jedynkowa, indykatorowa):
Model probitowy
Zmienna jakościowa
Zmienna ilościowa
może zostać zmierzona w skali.
Zmienna jakościowa
to zmienna, która jest niemierzalna ilościowo i której pomiar polega na przypisaniu do grupy z daną cechą.
Zmienne jakościowe:
uporządkowane(np. poziom wykształcenia), nominalne(np. ukończenie studiów wyższych).
Zmienna binarna (zero-jedynkowa, indykatorowa):
przyjmuje wartość 1 jeżeli jednostka spełnia warunek/posiada daną cechę oraz 0 w przeciwnym przypadku (w.p.p.).
Model probitowy
Zmienna jakościowa jako zmienna objaśniająca (przykład z PoE).
PRICE = f (SQFT , D, ε) (1)
gdzie PRICE to cena domu, SQFT to powierzchnia domu a zmienna D:
D =
n 1 jeżeli dom leży w pożądanej okolicy,
0 jeżeli dom leży wniepożądanej okolicy. (2) Grupą referencyjna odnosi się do przypadku D = 0.
Model probitowy
Zmienna jakościowa jako zmienna objaśniająca (przykład z PoE).
PRICE = f (SQFT , D, ε) (1)
gdzie PRICE to cena domu, SQFT to powierzchnia domu a zmienna D:
D =
n 1 jeżeli dom leży w pożądanej okolicy,
0 jeżeli dom leży wniepożądanej okolicy. (2) Grupą referencyjna odnosi się do przypadku D = 0.
Przypadek # 1:
PRICE = β0+ β1SQFT +β2D + ε wtedy:
E (PRICE) =
n β
0+ β1SQFT +β2 dla D = 1, β0+ β1SQFT dla D = 0.
PRICE
SQFT
β0 β0 + β2
β2
Model probitowy
Zmienna jakościowa jako zmienna objaśniająca (przykład z PoE).
PRICE = f (SQFT , D, ε) (1)
gdzie PRICE to cena domu, SQFT to powierzchnia domu a zmienna D:
D =
n 1 jeżeli dom leży w pożądanej okolicy,
0 jeżeli dom leży wniepożądanej okolicy. (2) Grupą referencyjna odnosi się do przypadku D = 0.
Przypadek # 2:
PRICE = β0+ β1SQFT +β2DSQFT + ε wtedy:
E (PRICE) =
n β
0+ (β1+β2)SQFT dla D = 1, β0+ β1SQFT dla D = 0.
PRICE
β2
Model probitowy
Zmienna jakościowa jako zmienna objaśniająca (przykład z PoE).
PRICE = f (SQFT , D, ε) (1)
gdzie PRICE to cena domu, SQFT to powierzchnia domu a zmienna D:
D =
n 1 jeżeli dom leży w pożądanej okolicy,
0 jeżeli dom leży wniepożądanej okolicy. (2) Grupą referencyjna odnosi się do przypadku D = 0.
Przypadek # 3:
PRICE = β0+ β1SQFT +β2+β3DSQFT + ε wtedy:
E (PRICE) =
=
n β
0+β2+ (β1+β3)SQFT dla D = 1,
β0+ β1SQFT dla D = 0.
PRICE
SQFT
β0
β0 + β2 β2
β3
Model probitowy
Zmienna indykatorowe a szeregi czasowe
Częstotliwość roczna: wykorzystanie zmiennych indykatorowych w celu identyfikacji/
kontrolowania okresów o szczególnym charakterze.
Przykład:
yt= β0+ β1DCrisist +
k
X
i=2
βixi,t
| {z }
pozostałe zmienne egzogeniczne
+εt (3)
gdzie:
DCrisist =
n 1 dla okresów kryzysu, 0 w.p.p.
Częstotliwość miesięczna/kwartalna: podobnie jak w przypadku częstotliwości rocz- nej oraz kontrola sezonowości:
Przykład:
yt= β0+ β1DQ1t + β2DtQ2+ β3DQ3t +
k
X
i=4
βixi,t+ εt (4)
gdzie:
Model probitowy
Zmienna indykatorowe a szeregi czasowe
Częstotliwość roczna: wykorzystanie zmiennych indykatorowych w celu identyfikacji/
kontrolowania okresów o szczególnym charakterze.
Przykład:
yt= β0+ β1DCrisist +
k
X
i=2
βixi,t
| {z }
pozostałe zmienne egzogeniczne
+εt (3)
gdzie:
DCrisist =
n 1 dla okresów kryzysu, 0 w.p.p.
Częstotliwość miesięczna/kwartalna: podobnie jak w przypadku częstotliwości rocz- nej oraz kontrola sezonowości:
Przykład:
yt= β0+ β1DQ1t + β2DtQ2+ β3DQ3t +
k
X
i=4
βixi,t+ εt (4)
gdzie:
DtQ1=
n 1 dla obserwacji w I kw., 0 w.p.p.
Interpretacja zmienncyh indykatorowych powinna się odwoływać do okresu referencyjnego.
Uwaga o współliniowości.
Model probitowy
Zmienna indykatorowe a szeregi czasowe
Częstotliwość roczna: wykorzystanie zmiennych indykatorowych w celu identyfikacji/
kontrolowania okresów o szczególnym charakterze.
Przykład:
yt= β0+ β1DCrisist +
k
X
i=2
βixi,t
| {z }
pozostałe zmienne egzogeniczne
+εt (3)
gdzie:
DCrisist =
n 1 dla okresów kryzysu, 0 w.p.p.
Częstotliwość miesięczna/kwartalna: podobnie jak w przypadku częstotliwości rocz- nej oraz kontrola sezonowości:
Przykład:
yt= β0+ β1DQ1t + β2DtQ2+ β3DQ3t +
k
X
i=4
βixi,t+ εt (4)
gdzie:
Model probitowy
Zmienna indykatorowe a szeregi czasowe
Częstotliwość roczna: wykorzystanie zmiennych indykatorowych w celu identyfikacji/
kontrolowania okresów o szczególnym charakterze.
Przykład:
yt= β0+ β1DCrisist +
k
X
i=2
βixi,t
| {z }
pozostałe zmienne egzogeniczne
+εt (3)
gdzie:
DCrisist =
n 1 dla okresów kryzysu, 0 w.p.p.
Częstotliwość miesięczna/kwartalna: podobnie jak w przypadku częstotliwości rocz- nej oraz kontrola sezonowości:
Przykład:
yt= β0+ β1DQ1t + β2DtQ2+ β3DQ3t +
k
X
i=4
βixi,t+ εt (4)
gdzie:
DtQ1=
n 1 dla obserwacji w I kw., 0 w.p.p.
Interpretacja zmienncyh indykatorowych powinna się odwoływać do okresu referencyjnego.
Uwaga o współliniowości.
Model probitowy
Zmienna binarna jako zmienna objaśniana
W regresji liniowej zainteresowanie badawcze skupia się narozkładzie wa- runkowym średniej wartości zmiennej objaśnianej względem zmiennych ob- jaśniających.
Specyfika zmiennej binarnej uniemożliwia powyższe podejście.
W modelach zmiennej binarnej, zainteresowanie koncentruje się naprawdo- podobieństwie wystąpienia zdarzenia.
Standardowe modele pozwalające wytłumaczyć prawdopodobieństwo:
Liniowy model prawdopodobieństwa.
Model logitowy.
Model probitowy.
Model probitowy
Zmienna binarna jako zmienna objaśniana
W regresji liniowej zainteresowanie badawcze skupia się narozkładzie wa- runkowym średniej wartości zmiennej objaśnianej względem zmiennych ob- jaśniających.
Specyfika zmiennej binarnej uniemożliwia powyższe podejście.
W modelach zmiennej binarnej, zainteresowanie koncentruje się naprawdo- podobieństwie wystąpienia zdarzenia.
Standardowe modele pozwalające wytłumaczyć prawdopodobieństwo:
Liniowy model prawdopodobieństwa.
Model logitowy.
Model probitowy.
Model probitowy
Zmienna binarna jako zmienna objaśniana
W regresji liniowej zainteresowanie badawcze skupia się narozkładzie wa- runkowym średniej wartości zmiennej objaśnianej względem zmiennych ob- jaśniających.
Specyfika zmiennej binarnej uniemożliwia powyższe podejście.
W modelach zmiennej binarnej, zainteresowanie koncentruje się naprawdo- podobieństwie wystąpienia zdarzenia.
Standardowe modele pozwalające wytłumaczyć prawdopodobieństwo:
Liniowy model prawdopodobieństwa.
Model logitowy.
Model probitowy.
Model probitowy
Liniowy model prawdopodobieństwa
Zmienna objaśnina y jako suma wartości oczekiwanej oraz składnika loso- wego:
y = E (y) + ε = p + ε (5)
Prawdopodobieństwo zdarzenia y = 1:
E (y) = p = β0+ β1x1+ β2x2+ . . . + βkxk (6) Liniowy model prawdopodobieństwa:
y = β0+ β1x1+ β2x2+ . . . + βkxk+ ε (7) Parametry β0, β1, . . . , βk mogą zostać oszacowane MNK (lub UMNK).
Interpretacjaoszacowań parametrów strukturalnych odwołuje się do praw- dopodobieństwa.
Przykład: wzrost x1 o jednostkę zwiększa prawdopodobieństwa wystąpienia zdarzenia skfantyfikowanego jako y o ceteris paribus β1.
Punkty procentowe a procenty.
Model probitowy
Liniowy model prawdopodobieństwa
Wartości teoretyczne, tj. prognozy in-sample, mogą być poza przedziałem (0, 1).
Ilustracja
Brak interpretacji miar dopasowań modelu do danych, np. współczynnika R2.
Problem heterogeniczności składnika losowego.
Brak normalności składnika losowego.
Model probitowy
Przykład empiryczny: Cola czy Pepsi?
Specyfikacja modelu:
coke = β0+ β1pratio + β2disp_coke + β3disp_pepsi + ε. (8)
Zmienna objaśniana:
coke =
1 jeżeli klient wybrał Colę,
0 jeżeli klient wybrał Pepsi. (9)
Zmienne objaśniające:
pratio - cena relatywna Coli względem Pepsi, disp_coke:
disp_coke =
n 1 jeżeli Cola jest reklamowana w czasie zakupu,
0 w przeciwnym przypadku. (10)
disp_pepsi:
disp_pepsi =
n 1 jeżeli Pepsi jest reklamowana w czasie zakupu,
0 w przeciwnym przypadku. (11)
Model probitowy
Przykład empiryczny: Cola czy Pepsi?
Specyfikacja modelu:
coke = β0+ β1pratio + β2disp_coke + β3disp_pepsi + ε. (8)
Zmienna objaśniana:
coke =
1 jeżeli klient wybrał Colę,
0 jeżeli klient wybrał Pepsi. (9)
Zmienne objaśniające:
pratio - cena relatywna Coli względem Pepsi, disp_coke:
disp_coke =
n 1 jeżeli Cola jest reklamowana w czasie zakupu,
0 w przeciwnym przypadku. (10)
Model probitowy
Przykład empiryczny: Cola czy Pepsi?
Specyfikacja modelu:
coke = β0+ β1pratio + β2disp_coke + β3disp_pepsi + ε. (8)
Zmienna objaśniana:
coke =
1 jeżeli klient wybrał Colę,
0 jeżeli klient wybrał Pepsi. (9)
Zmienne objaśniające:
pratio - cena relatywna Coli względem Pepsi, disp_coke:
disp_coke =
n 1 jeżeli Cola jest reklamowana w czasie zakupu,
0 w przeciwnym przypadku. (10)
disp_pepsi:
disp_pepsi =
n 1 jeżeli Pepsi jest reklamowana w czasie zakupu,
0 w przeciwnym przypadku. (11)
Model probitowy
Przykład empiryczny
Wyniki oszacowań parametrów liniowego modelu prawdopodobieństwa.
Zmienna objaśniana: coke βˆi se ˆβi
statystyka t Pr (|βi| 6= 0)
pratio −0.401 0.061 −6.53 0.000
disp_pepsi −0.166 0.036 −4.65 0.000
disp_coke 0.077 0.034 2.24 0.025
const 0.890 0.065 13.59 0.000
Dodatkowe informacje:
Średnia artmetyczna zmiennej objaśnianej: 0.447 Statystyka F (3, 1136): 51.67 [0.000]
Model probitowy
Przykład empiryczny
Wyniki oszacowań parametrów liniowego modelu prawdopodobieństwa.
Zmienna objaśniana: coke βˆi se ˆβi
statystyka t Pr (|βi| 6= 0)
pratio −0.401 0.061 −6.53 0.000
disp_pepsi −0.166 0.036 −4.65 0.000
disp_coke 0.077 0.034 2.24 0.025
const 0.890 0.065 13.59 0.000
Dodatkowe informacje:
Średnia artmetyczna zmiennej objaśnianej: 0.447 Statystyka F (3, 1136): 51.67 [0.000]
Współczynnik determinacji R2: 0.12
Model probitowy
Rozkład logistyczny
Funkcja gęstości prawdopodobieństwa:
f (x, µ, s) = exp −(x−µ)s s
1 + exp −(x−µ)s 2, (12) gdzie x ∈ (−∞, ∞) oraz:
µ ∈ R - parametr położenia, s ∈ R - parametr skali.
Dystrybuanta:
F (x, µ, s) = 1
1 + exp −(x−µ)s , (13) Wartość oczekiwana:
Model probitowy
Rozkład logistyczny
Gęstość pradopodobieństwa
−4 −2 0 2 4
0.000.050.100.150.200.25
x
f(x)
f (x) = exp(−x)
(1 + exp(−x))2 (15)
Dystrybuanta rozkładu logistycznego
−4 −2 0 2 4
0.00.20.40.60.81.0
x
F(x)
F (x) = 1
(1 + exp(−x)) (16)
Model probitowy
Rozkład logistyczny
Gęstość pradopodobieństwa
−6 −4 −2 0 2 4 6
0.00.10.20.30.40.5
f(x)
Dystrybuanta rozkładu logistycznego
−4 −2 0 2 4
0.00.20.40.60.81.0
F(x)
Model probitowy
Rozkład logistyczny
Gęstość pradopodobieństwa
−4 −2 0 2 4
0.000.050.100.150.200.25
x
f(x)
Dystrybuanta rozkładu logistycznego
−4 −2 0 2 4
0.00.20.40.60.81.0
x
F(x)
(i) µ = 0 oraz s = 1, (ii) µ = −1 oraz s = 1, (iii) µ = 1 oraz s = 1.
Model probitowy
Model logitowy
Prawdopodobieństwo p:
p = exp (β0+ β1x1+ . . . + βkxk)
1 + exp (β0+ β1x1+ . . . + βkxk). (15) Prawdopodobieństwo zdarzenia przeciwnego, tj. 1 − p:
1 − p = 1
1 + exp (β0+ β1x1+ . . . + βkxk). (16)
Logit, czyli logarytm naturalny ilorazu p i 1 − p:
ln
p 1 − p
= βo+ β1x1+ . . . + βkxk. (17)
Model probitowy
Model logitowy
Prawdopodobieństwo p:
p = exp (β0+ β1x1+ . . . + βkxk)
1 + exp (β0+ β1x1+ . . . + βkxk). (15) Prawdopodobieństwo zdarzenia przeciwnego, tj. 1 − p:
1 − p = 1
1 + exp (β0+ β1x1+ . . . + βkxk). (16)
Logit, czyli logarytm naturalny ilorazu p i 1 − p:
ln
p 1 − p
= βo+ β1x1+ . . . + βkxk. (17) p ∈ (0, 1)
Ilustracja
Model probitowy
Metoda Największej Wiarygodności
Funkcja wiarygodności:
L (x1, . . . , xn, θ1, . . . , θk) =
n
Y
i=1
f (xi, θ1, . . . , θk) (18)
gdzie
x1, . . . , xn - obserwacje zmiennych, θ1, . . . , θk - szacowane parametry, f (xi, θ1, . . . , θk) - funkcja gęstości.
Rozwiązanie układu równań:
∀i∈{1,...,k}
∂ ln L
∂xi
= 0. (19)
Model probitowy
Model logitowy - iloraz szans
Iloraz szans (odds ratio):
odds ratio: = Pr[y = 1|∆xi= 1]
Pr[y = 0|∆xi= 1]
| {z }
iloraz szans po zwiększeniu xio 1
Pr[y = 1|∆xi= 0]
Pr[y = 0|∆xi= 0]
| {z }
iloraz szans
−1
=exp(βi)
(20)
Interpretacja: wzrost xi o jednostkę zwiększa (zmniejsza) ceteris paribus iloraz szans do exp(βi) [(exp(βi) − 1) · 100%].
Model probitowy
Model logitowy - efekty krańcowe
Efekt krańcowy:
∂pj
∂xj,i
= βipj(1 − pj) = βi
exp (β0+ β1x1,j+ . . . + βkxk,j)
[1 + exp (β0+ β1x1,j+ . . . + βkxk,j)]2. (21) Indeks j odpowiada jednostce.
Efekt krańcowy zależy od wartości : (i) prawdopodobieństwa (pj), (ii) zmiennej objaśnianej (xj,i), (iii) parametru strukturalnego (βi).
Efekty krańcowe są najczęśniej liczone dla średnich wartości zmiennych obja- śnianych.
Model probitowy
Test ilorazu wiarygodności i pseudo R
2Test ilorazu wiarygodności:
H0: β1= β2= . . . = βk= 0. (22) Statystyka testu:
2 (ln LMP− ln LMZ) , (23)
ma rozkład χ2 z k stopniami swobowy. Ponadto:
ln LMP - logarytm wiarygodności modelu logitowego,
ln LMZ - logarytm wiarygodności modelu logitowego, ale tylko z wyrazem wolnym.
Pseudo-R2 McFaddena:
pseudo-R2= 1 −ln LMP
ln LMZ
, (24)
gdzie ln LMP oraz ln LMZ j.w.
Model probitowy
Prognoza ex post
Wartość teoretyczna w modelu objaśniającym zmienną jakościową (binarną) jestprognozą prawdopodobieństwa.
Standardowa zasada:
Próba zbilansowana:
ˆ y =
n 1 jeżeli ˆp > 0.5,
0 jeżeli ˆp < 0.5. (25)
Zasada optymalnej wartości granicznej:
Próba niezbilansowana:
Udział obserwacji y = 1 w próbie wynosiδ, ˆ
y =
n 1 jeżeli p >ˆ δ,
0 jeżeli p <ˆ δ. (26)
Model probitowy
Prognoza ex post
Wartość teoretyczna w modelu objaśniającym zmienną jakościową (binarną) jestprognozą prawdopodobieństwa.
Standardowa zasada:
Próba zbilansowana:
ˆ y =
n 1 jeżeli ˆp > 0.5,
0 jeżeli ˆp < 0.5. (25)
Zasada optymalnej wartości granicznej:
Próba niezbilansowana:
Udział obserwacji y = 1 w próbie wynosiδ, ˆ
y =
n 1 jeżeli p >ˆ δ,
0 jeżeli p <ˆ δ. (26)
Model probitowy
Prognoza ex post
Wartość teoretyczna w modelu objaśniającym zmienną jakościową (binarną) jestprognozą prawdopodobieństwa.
Standardowa zasada:
Próba zbilansowana:
ˆ y =
n 1 jeżeli ˆp > 0.5,
0 jeżeli ˆp < 0.5. (25)
Zasada optymalnej wartości granicznej:
Próba niezbilansowana:
Udział obserwacji y = 1 w próbie wynosiδ, ˆ
y =
n 1 jeżeli p >ˆ δ,
0 jeżeli p <ˆ δ. (26)
Model probitowy
Tablica trafności i zliczeniowy R
2Tablica trafności:
Prognozowane
Razem y = 1 y = 0
Empiryczne y = 1 n11 n10 n1.
y = 0 n01 n00 n0.
Razem n.1 n.0 n
Liczba przypadków:
Trafnej predykcji (prognozy): n11+ n00, Błędnej predykcji (prognozy): n10+ n01. Zliczeniowy R2:
zliczeniowy R2= n11+ n00
n (27)
Model probitowy
Tablica trafności i zliczeniowy R
2Tablica trafności:
Prognozowane
Razem y = 1 y = 0
Empiryczne y = 1 n11 n10 n1.
y = 0 n01 n00 n0.
Razem n.1 n.0 n
Liczba przypadków:
Trafnej predykcji (prognozy): n11+ n00, Błędnej predykcji (prognozy): n10+ n01. Zliczeniowy R2:
zliczeniowy R2= n11+ n00
(27)
Model probitowy
Tablica trafności i zliczeniowy R
2Tablica trafności:
Prognozowane
Razem y = 1 y = 0
Empiryczne y = 1 n11 n10 n1.
y = 0 n01 n00 n0.
Razem n.1 n.0 n
Liczba przypadków:
Trafnej predykcji (prognozy): n11+ n00, Błędnej predykcji (prognozy): n10+ n01. Zliczeniowy R2:
zliczeniowy R2= n11+ n00
n (27)
Model probitowy
Przykład empiryczny - model logitowy
Wyniki oszacowań parametrów logitowego Zmienna objaśniana: coke βˆi se ˆβi
statystyka z Pr (|βi| 6= 0)
pratio −1.996 0.315 −6.34 0.000
disp_coke 0.352 0.159 2.22 0.027
disp_pepsi−0.731 0.168 −4.36 0.000
cons 1.923 0.325 5.90 0.000
Model probitowy
Przykład empiryczny - model logitowy
Wyniki oszacowań parametrów logitowego Zmienna objaśniana: coke βˆi se ˆβi
statystyka z Pr (|βi| 6= 0) AME (¯x)
pratio −1.996 0.315 −6.34 0.000 − 0.433
disp_coke 0.352 0.159 2.22 0.027 0.076
disp_pepsi−0.731 0.168 −4.36 0.000 − 0.158
cons 1.923 0.325 5.90 0.000
gdzie AME(¯x) to efekt krańcowy dla średnich wartości zmiennych objaśniających
Model probitowy
Przykład empiryczny - model logitowy
Wyniki oszacowań parametrów logitowego Zmienna objaśniana: coke βˆi se ˆβi
statystyka z Pr (|βi| 6= 0) AME (¯x)
pratio −1.996 0.315 −6.34 0.000 − 0.433
disp_coke 0.352 0.159 2.22 0.027 0.076
disp_pepsi−0.731 0.168 −4.36 0.000 − 0.158
cons 1.923 0.325 5.90 0.000
gdzie AME(¯x) to efekt krańcowy dla średnich wartości zmiennych objaśniających Dodatkowe informacje:
Statystyka testu ilorazu warygodności χ2(3): 148.83 [0.000]
2
Model probitowy
Przykład empiryczny - model logitowy - efekty krańcowe
Efekty krańcowe w modelu logitowym
p pratio disp_coke disp_pepsi
xi 0.435 1.027 0.379 0.364
∂p/∂xi −0.433∗∗∗ 0.076∗∗ −0.159∗∗∗
(0.064) (0.034) (0.035)
xi 0.482 1 0 0
∂p/∂xi −0.498∗∗∗ 0.088∗∗ −0.183∗∗∗
(0.079) (0.039) (0.042)
xi 0.389 1 1 1
∂p/∂xi −0.426∗∗∗ 0.075∗∗∗ −0.156∗∗∗
(0.084) (0.031) (0.028)
Legenda: ∂p/∂xioznacza efekt krańcowy dla zmiennej xi, błędy standardowe umieszczone w nawiasach,∗∗∗,∗∗,∗oznaczają odrzucenia hipotezy zerowej o nieistotności efektów krańcowych przy poziomie istosności równym odpowiednio 0.01, 0.05 oraz 0.1.
Model probitowy
Efekty krańcowe (cd.) - wrażliwość na zmianę pratio
ˆ p
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0 0.5 1 1.5 2 2.5 3
∂ˆp/∂disp_coke
0.06 0.08 0.1 0.12 0.14 0.16 0.18
∂ˆp/∂pratioi
-0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0
0 0.5 1 1.5 2 2.5 3
∂ˆp/∂disp_pepsi
-0.2 -0.15 -0.1 -0.05 0
0 0.5 1 1.5 2 2.5 3
Model probitowy
Przykład empiryczny (cd.)
Tablica trafności:
Prognozowane
Razem y = 1 y = 0
Empiryczne y = 1 247 263 510
y = 0 123 507 630
Razem 370 770 1140
Model probitowy
Przykład empiryczny (cd.)
Tablica trafności:
Prognozowane
Razem y = 1 y = 0
Empiryczne y = 1 247 263 510
y = 0 123 507 630
Razem 370 770 1140
Liczba przypadków:
Trafnej predykcji (prognozy): 754(247 + 507), Błędnej predykcji (prognozy): 386(123 + 263).
Zliczeniowy R2:
zliczeniowy R2= 754
≈ 66.14% (28)
Model probitowy
Model probitowy
Prawdopodobieństwo p jest wartością dystrybuanty rozkładu normalnego N (0, 1):
p = Φ(z) =
Z z
−∞
1 (2π)12
exp
u
2
du, (29)
gdzie z jest kombinacją liniową zmiennych objaśniających, tj.:
z = β0+ β1x1+ . . . + βkxk. (30)
Efekty krańcowe:
∂pj
∂xj,i
= βiφ (z) , (31)
gdzie φ (z) jest funkcją gęstości rozkładu normalnego.
Wybrane charakterystyki:
p ∈ (0, 1): Ilustracja
Metoda estymacji: Metoda Największej Wiarygodności.
Intepretacja oszacowań: efekty krańcowe.
Miary dopasowania: pseudo R2, test ilorazu wiarygodności, tabela trafności oraz zliczeniowe R2.
Model probitowy
Model probitowy
Prawdopodobieństwo p jest wartością dystrybuanty rozkładu normalnego N (0, 1):
p = Φ(z) =
Z z
−∞
1 (2π)12
exp
u
2
du, (29)
gdzie z jest kombinacją liniową zmiennych objaśniających, tj.:
z = β0+ β1x1+ . . . + βkxk. (30)
Efekty krańcowe:
∂pj
∂xj,i
= βiφ (z) , (31)
gdzie φ (z) jest funkcją gęstości rozkładu normalnego.
Wybrane charakterystyki:
p ∈ (0, 1): Ilustracja
Model probitowy
Model probitowy
Prawdopodobieństwo p jest wartością dystrybuanty rozkładu normalnego N (0, 1):
p = Φ(z) =
Z z
−∞
1 (2π)12
exp
u
2
du, (29)
gdzie z jest kombinacją liniową zmiennych objaśniających, tj.:
z = β0+ β1x1+ . . . + βkxk. (30)
Efekty krańcowe:
∂pj
∂xj,i
= βiφ (z) , (31)
gdzie φ (z) jest funkcją gęstości rozkładu normalnego.
Wybrane charakterystyki:
p ∈ (0, 1): Ilustracja
Metoda estymacji: Metoda Największej Wiarygodności.
Intepretacja oszacowań: efekty krańcowe.
Miary dopasowania: pseudo R2, test ilorazu wiarygodności, tabela trafności oraz zliczeniowe R2.
Model probitowy
Przykład empiryczny - model probitowy
Wyniki oszacowań parametrów modelu probitowego Zmienna objaśniana: coke
βˆi se ˆβi
statystyka z Pr (|βi| 6= 0)
pratio −1.146 0.181 −6.34 0.000
disp_coke 0.217 0.097 2.25 0.025
disp_pepsi−0.447 0.101 −4.41 0.000
cons 1.108 0.190 5.83 0.000
Model probitowy
Przykład empiryczny - model probitowy
Wyniki oszacowań parametrów modelu probitowego Zmienna objaśniana: coke
βˆi se ˆβi
statystyka z Pr (|βi| 6= 0) AME (¯x)
pratio −1.146 0.181 −6.34 0.000 − 0.410
disp_coke 0.217 0.097 2.25 0.025 0.077
disp_pepsi−0.447 0.101 −4.41 0.000 − 0.160
cons 1.108 0.190 5.83 0.000
gdzie AME(¯x) to efekt krańcowy dla średnich wartości zmiennych objaśniających
Model probitowy
Przykład empiryczny - model probitowy
Wyniki oszacowań parametrów modelu probitowego Zmienna objaśniana: coke
βˆi se ˆβi
statystyka z Pr (|βi| 6= 0) AME (¯x)
pratio −1.146 0.181 −6.34 0.000 − 0.410
disp_coke 0.217 0.097 2.25 0.025 0.077
disp_pepsi−0.447 0.101 −4.41 0.000 − 0.160
cons 1.108 0.190 5.83 0.000
gdzie AME(¯x) to efekt krańcowy dla średnich wartości zmiennych objaśniających Dodatkowe informacje:
Statystyka testu ilorazu warygodności χ2(3): 145.82 [0.000]
Pseudo-R2: 0.093
Model probitowy
Porównanie oszacowań parametrów
Zestawienie oszacowań parametrów modeli zmiennej jakościowej Zmienna objaśniana: coke
LMP Logit Probit
pratio −0.401∗∗∗ −1.996∗∗∗ −1.146∗∗∗
(0.061) (0.315) (0.181)
disp_coke 0.077∗∗ 0.352∗∗ 0.217∗∗
(0.034) (0.159) (0.097)
disp_pepsi −0.166∗∗∗ −0.731∗∗∗ −0.447∗∗∗
(0.036) (0.168) (0.101)
const 0.890∗∗∗ 1.923∗∗∗ 1.108∗∗∗
(0.065) (0.326) (0.190)
Legenda: błędy standardowe w nawiasach,∗∗∗dla p < 0.01,∗∗dla p < 0.05,∗dla p < 0.1.
Model probitowy
Porównanie oszacowań parametrów
Zestawienie oszacowań parametrów modeli zmiennej jakościowej Zmienna objaśniana: coke
LMP Logit Probit
pratio −0.401∗∗∗ −1.996∗∗∗ −1.146∗∗∗
(0.061) (0.315) (0.181)
disp_coke 0.077∗∗ 0.352∗∗ 0.217∗∗
(0.034) (0.159) (0.097)
disp_pepsi −0.166∗∗∗ −0.731∗∗∗ −0.447∗∗∗
(0.036) (0.168) (0.101)
const 0.890∗∗∗ 1.923∗∗∗ 1.108∗∗∗
(0.065) (0.326) (0.190)
Legenda: błędy standardowe w nawiasach,∗∗∗dla p < 0.01,∗∗dla p < 0.05,∗dla p < 0.1.
βLMP ≈ 0.25βLogit (32)
0 1 2 3 4 5
0.00.20.40.60.81.0
x
y
Legenda: obserwacje y.
0.00.20.40.60.81.0
y
0 1 2 3 4 5
0.00.20.40.60.81.0
x
y
Legenda: obserwacje y,wartości teoretyczne LMP, LMP .
0 1 2 3 4 5
0.00.20.40.60.81.0
y
0 1 2 3 4 5
0.00.20.40.60.81.0
x
y
Legenda: obserwacje y,wartości teoretyczne LMP,wartości teoretyczne logitu, wartości teoretyczne probitu, LMP , logit , probit .