Budowa i weryfikacja modelu - treść przykładu
W wyniku systematycznych badań popytu na warzywa w pewnym mieście, otrzymano następujące szeregi czasowe:
— przyrost (zmiany) popytu na warzywa (w zł. na osobę): 2 3 4 1 1 4 6 2 4 3 (zmienna y)
— przyrost (zmiany) dochodu (w setkach zł. na osobę): 1 1 1 1 1 2 2 2 2 2 (zmienna x
2)
— przyrost (zmiany) ceny warzyw (w zł.): 0 0 0 1 1 0 0 1 1 1 (zmienna x
3)
Polecenia:
1. Oszacuj parametry modelu popytu na warzywa postaci y = α
1+ α
2x
2+ α
3x
3+ ε 2. Zweryfikuj model pod względem statystycznym:
a. Oszacuj i zinterpretuj miary dopasowania modelu:
— średni błąd
— średni błąd procentowy modelu
— współczynnik determinacji
b. Zbadaj autokorelację składnika losowego:
— oblicz współczynnik autokorelacji reszt
— zweryfikuj hipotezę o braku autokorelacji
c. Zbadaj jakość oszacowań parametrów strukturalnych:
— oszacuj błędy średnie ocen parametrów
— zweryfikuj hipotezy o istotności ocen parametrów 3. Zweryfikuj model pod względem merytorycznym:
— oceń sensowność znaków oszacowanych parametrów
— zinterpretuj wartości oszacowanych parametrów i oceń ich sensowność 4. Sporządź prognozę przyrostów popytu na warzywa dla kolejnych trzech
okresów wiedząc, że:
Rozwiązanie
Model teoretyczny przyjmuje następującą postać:
ε α
α
α + + +
=
1 2x
2 3x
3y
gdzie:
y
t ― przyrost popytu na warzywa w okresie w okresiet
t2
x
― przyrost dochodu na osobę w okresiet
t3
x
― przyrost cen warzyw w okresiet
3 2 1
, α , α
α
― parametry strukturalne modeluε
― składnik losowyModel empiryczny można zapisać następująco:
3 3 2 2
1
ˆ ˆ
ˆ
tˆ x
tx
ty = α + α + α
gdzie:
3 2 1
, ˆ , ˆ ˆ α α
α
― oszacowania parametrów strukturalnych
=
3 2 1
ˆ ˆ ˆ ˆ
α α α
α
- wektor oszacowań parametrów strukturalnychad 1)
Ponieważ model teoretyczny jest liniowy względem parametrów, można dokonać oszacowania wielkości jego parametrów strukturalnych
α
za pomocą MNK. Estymator tego wektora dany jest następującym wzorem:α ˆ = ( X
TX )−1X
TY
. Informacje liczbowe (dane empiryczne) zawarte w
treści zadania zapiszemy w postaci macierzowej
=
3 4 2 6 4 1 1 4 3 2
Y
,
=
1 2 1
1 2 1
1 2 1
0 2 1
0 2 1
1 1 1
1 1 1
0 1 1
0 1 1
0 1 1
X
Wykorzystując powyższe dane wykonujemy następujące obliczenia cząstkowe:
=
5 8 5
8 25 15
5 15 10 X
X
T ,
−
−
−
−
−
−
−
=
4166 , 0 083 , 0 083 , 0
083 , 0 4166 , 0 583 , 0
083 , 0 583 , 0 0167 , 1 )
( X
TX
1 ,
= 11 49 30 Y X
Ti otrzymujemy ostatecznie oszacowanie parametrów modelu:
( ) =
= X X
−X Y α ˆ
T 1 T
−
−
−
−
−
−
4166 , 0 083 , 0 083 , 0
083 , 0 4166 , 0 583 , 0
083 , 0 583 , 0 0167 , 1
11 49 30
=
− 2 2 1
Ostatecznie mamy więc oszacowany model popytu na warzywa postaci:
3
2
2
2
ˆ
t1 x
tx
ty = + −
Ad 2a)
W celu dokonania weryfikacji statystycznej, wykorzystując oszacowany w punkcie 1 model, należy obliczyć miedzy innymi miary dopasowania modelu do danych empirycznych. Bazują one na odchyleniach wartości empirycznych (
y
) i teoretycznych (yˆ
) zmiennej objaśnianej dla przedziału próby. Aby je obliczyć, trzeba najpierw wyznaczyć wartości teoretyczne zmianTe, a także szereg innych obliczeń związanych z weryfikacją modelu, można przeprowadzić w postaci tabelarycznej ― por. Tabela 1.
Tabela 1. Obliczenia robocze do przykładu
Numer obser- wacji (t)
wyraz
wolny
x
t,2 xt,3y
ty
t2yˆ
tt t t
y y e
− ˆ
=
2
e
te
t−1e
te
t−11
− −
=
t t
t
e e de
2
det
1 1 1 0 2 4 3 -1 1 - - - -
2 1 1 0 3 9 3 0 0 -1 0 1 1
3 1 1 0 4 16 3 1 1 0 0 1 1
4 1 1 1 1 1 1 0 0 1 0 -1 1
5 1 1 1 1 1 1 0 0 0 0 0 0
6 1 2 0 4 16 5 -1 1 0 0 -1 1
7 1 2 0 6 36 5 1 1 -1 -1 2 4
8 1 2 1 2 4 3 -1 1 1 -1 -2 4
9 1 2 1 4 16 3 1 1 -1 -1 2 4
10 1 2 1 3 9 3 0 0 1 0 -1 1
Razem
10 15 5 30 112 30 0 6 0 -3 1 17
Teraz można obliczyć odchylenia wartości empirycznych i teoretycznych w próbie
e
t (błędy modelu, reszty) wg formuły:t t
t
y y
e = − ˆ
np.
e
1= y
1− ˆy
1 (wszystkie wyniki obliczeń można znaleźć w tabeli 1).Mając obliczone wielkości błędów w przedziale próby można przystąpić do obliczenia miar dopasowania modelu do danych empirycznych. W pierwszej kolejności obliczymy sumę kwadratów reszt:
2
6
=
= ∑
t
e
tS
Na jej podstawie trudno wyciągnąć wnioski o jakości dopasowania modelu, bo jest to miara nieunormowana i nie poddająca się merytorycznej interpretacji. Jest za to podstawą do obliczenia średniego błędu modelu, zwanego także odchyleniem standardowym reszt lub średnim błędem szacunku.
Średni błąd modelu
93 , 0 926 , 0 857 , 3 0 10
6 = = ≈
= −
= −
k n
S
eS
zł.W powyższym wzorze
n
oznacza liczbę obserwacji, na podstawie których dokonano oszacowania parametrów modelu (liczebność próby), która wynosi w naszym przykładzie 10. Wielkośćk
oznacza liczbę szacowanych w modelu parametrów, czyli w naszym przykładzie będzie to 3.
Warto zauważyć, że różnica
n-k
określana jest jako liczba stopni swobody oraz, że niektóre programy komputerowe wyliczają średni błąd modelu w odmienny sposób, tj.:n
S
e= S
, co nie zmienia interpretacji tej wielkości.Interpretacja: obliczona wartość średniego błędu modelu oznacza, że przewidywania zmian popytu na warzywa (tj. zmiennej objaśnianej przez model) sporządzane dla przedziału próby na podstawie oszacowanego modelu różnią się średnio od wartości empirycznych tej zmiennej o 0,93 zł.
Średni błąd procentowy modelu
% 9 , 30
% 100
% = ⋅ =
Y V
SS
ee
Interpretacja: przewidywania zmian popytu na warzywa sporządzane na podstawie
oszacowanego modelu dla przedziału próby różnią się średnio od wartości empirycznych o 30,9% średniej wartości zmian popytu na warzywa.
Współczynnik determinacji
∑
∑ ( y
t− y )
2= y
t2− n y
2Interpretacja: zmiany dochodów i cen (model) w 73% objaśniają wahania zmian popytu na warzywa (zmiennej objaśnianej).
Ad 2b)
Przyczyny występowania autokorelacji składnika losowego:
— pominięcie istotnej zmiennej objaśniającej,
— dłuższe niż 1 okres działanie czynników przypadkowych,
— przyjęcie niewłaściwych opóźnień zmiennych objaśniających,
— przyjęcie niewłaściwej postaci funkcyjnej.
Współczynnik autokorelacji reszt
6 , 5 0
3 )
( ) , ˆ cov(
2 2 2
1
1 2
1
− = −
=
=
=
∑
∑
=
=
−
−
−
n
t t n
t t t
t t t
e e e y
D y ρ y
Test Durbina–Watsona
Stawiamy hipotezę zerową mówiącą o braku autokorelacji składników losowych w modelu, podczas gdy hipoteza alternatywna stwierdza, że występuje autokorelacja ujemna (ze względu na współczynnik autokorelacji obliczonego na podstawie próby).
0 :
0 :
1 0
<
= ρ
ρ H
H
Zweryfikujemy hipotezę zerową za pomocą testu Durbina–Watsona na poziomie istotności 0,05.
Sprawdzianem w tym teście jest statystyka DW:
( )
83 , 6 2
2
17
2 1
=
=
−
=
∑
=
−
S e e DW
n t
t t
Wartości krytyczne
dl
idu
odczytujemy z tablic rozkładu DW, której fragment pokazuje tabela 2, a na ich podstawie obliczamy wartościdl ' = 4 − dl
orazdu ' = 4 − du
, otrzymując:dl=0,697; du=1,641 du'=2,359 dl'=3,303
.Zauważmy, że na poziomie istotności 0,05 wartość sprawdzianu z próby wynosząca 2,83 znalazła się pomiędzy wartościami
du’
idl’
.'
' DW dl
du < <
czyli w obszarze niekonkluzywności. Oznacza to, że na podstawie tego testu nie można podjąć decyzji o występowaniu bądź braku autokorelacji w rozważanym modelu.
Tabela 2. Wartości krytyczne statystyki Durbina-Watsona (
α = 0 , 05
)(
k
― liczba szacowanych parametrów,n
― liczba obserwacji)k
=2k
=3n dl du dl du
6 0,61 1,40 - -
7 0,70 1,36 0,47 1,90 8 0,73 1,33 0,56 1,78 9 0,82 1,32 0,63 1,70 10 0,88 1,32 0,70 1,64 11 0,93 1,32 0,76 1,60 12 0,97 1,33 0,81 1,58 13 1,01 1,34 0,86 1,56 14 1,04 1,35 0,91 1,55 15 1,08 1,36 0,95 1,54 Źródło: www.stanford.edu/~clint/bench/dwcrit.htm
Ad 2c)
Średnie błędy ocen parametrów
Średnie błędy ocen parametrów wyznacza się według wzoru:
jj
e
c
S S
αˆj=
gdzie
[ ] cij = ( X
TX )
−1, co oznacza, że wielkości c
jj to kolejne elementy głównej przekątnej macierzy( XTX )
−1. Średni błąd dla oszacowania parametru α
0 wynosi więc:934 , 0 0166 , 1 926 ,
11
0
ˆ1
= S c = ⋅ =
S
α ea dla pozostałych parametrów odpowiednio
0 , 5976
ˆ2
=
S
α i0 , 5976
ˆ3
= S
αTest istotności ocen parametrów
Test przeprowadzamy oddzielnie dla każdego z parametrów według następującego schematu:
0
0
:
j=
H α
0
1
:
j≠
H α
Hipotezę zerową zweryfikujemy na poziomie istotności 0,05 przy dwustronnym obszarze odrzucenia (co wynika z postaci hipotezy alternatywnej). Sprawdzianem w tym teście jest statystyka postaci:
j
j
S
t
jα α
α
ˆ ˆ
= ˆ
,która ma rozkład t-Studenta o
n − k = 10 − 3 = 7
stopniach swobody.Wartość krytyczna odczytana z tablic rozkładu t-Studenta dla 7 stopni swobody wynosi
365 ,
05
2
,
0
=
t
.Obliczamy wartość sprawdzianu w próbie dla parametru
α
1:071 , 934 1 , 0 ˆ 1
1 1
ˆ
ˆ
=
1= =
α α
α t S
Dla pozostałych parametrów wartości sprawdzianu wynoszą odpowiednio
3 , 347
ˆ2
= t
α347 ,
3
3
ˆ
= −
t
α .Porównując wartość sprawdzianu dla parametru
α
1 z wartością krytyczną zauważamy, że365 , 2 071 , 1 bo
05
,
ˆ1
< t
0<
t
αStwierdzamy więc, że na poziomie istotności 0,05 nie ma podstaw do odrzucenia hipotezy zerowej mówiącej o tym, że parametr
α
1 w badanym modelu jest nieistotny pod względem statystycznym (wyraz wolny nie jest istotny).W przypadku parametrów
α
2 iα
3między wartościami sprawdzianów a wartością krytyczną zachodzą następujące relacje:05 ,
2
t
0t
α>
oraz 0,053
t
t
α>
bo3 , 347 > 2 , 365
Zarówno w przypadku parametru
α
2 jak iα
3 stwierdzamy więc, że na poziomie istotności 0,05 odrzucamy hipotezy zerowe i przyjmujemy hipotezy alternatywne, mówiące o tym, żeparametry
α
2 iα
3 w badanym modelu są istotne pod względem statystycznym, a to oznacza, że zmienne z nimi związane, tj. zmiany dochodów i zmiany cen są istotne.Ad 3)
Ocena znaków parametrów przy zmiennych objaśniających:
— dodatni znak przy dochodach oznacza, że wzrost dochodu powoduje wzrost popytu na warzywa; reakcja popytu na zmianę dochodów odzwierciedlona w modelu jest więc zgodna z teorią ekonomii;
— ujemny znak przy cenie oznacza, że wzrost ceny powoduje spadek popytu na warzywa;
reakcja popytu na zmianę ceny odzwierciedlona w modelu jest więc zgodna z teorią ekonomii.
Interpretacja parametrów modelu.
Oszacowany model ma postać liniową, a więc parametry stojące przy poszczególnych zmiennych interpretuje się jako zmiany krańcowe.
— wzrost dochodów na osobę o 100 zł. powoduje wzrost popytu na warzywa o 2 zł. na osobęł
— wzrost ceny warzyw o 1 zł. powoduje spadek popytu na warzywa o 2 zł. na osobę.
Wyraz wolny interpretuje się jako wartość zmiennej objaśnianej przy założeniu, że wszystkie zmienne są równe 0. Nie w każdym modelu przyjęcie takiego założenia ma sens. Ponieważ zmienne objaśniające naszego modelu zdefiniowane są jako zmiany dochodów i zmiany cen, można powiedzieć, że jeśli dochody i ceny nie zmieniają (tj. jeśli ich zmiany wynoszą 0) to popyt na warzywa rośnie (z okresu na okres) o 1 zł. na osobę.
Ad 4)
Założenia prognozowania na podstawie modelu ekonometrycznego.
— znana i stabilna postać rozkładu składnika losowego (struktury stochastycznej modelu);
— znana i stabilna postać analityczna modelu i jego parametrów;
— znane wartości zmiennych objaśniających w okresie prognozowanym (z planów, z ekstrapolacji trendów, z innych modeli).
Na podstawie modelu przewidujemy, że przyrost popytu na warzywa w badanej populacji będzie wynosić 7 zł na osobę. Wyniki obliczeń dla wszystkich okresów prognozowanych okresów
przedstawia poniższa tabela:
Tabela 3. Obliczenia robocze do przykładu Wartości zmiennych
objaśniających Numer
okresu
Dochód (
x
2) Cena (x
3)Prognoza popytu
( ) yˆ
11 3 0 7
12 4 2 5
13 5 4 3