Mariusz Plich Konspekty wykładów z ekonometrii

(1)

Budowa i weryfikacja modelu - treść przykładu

W wyniku systematycznych badań popytu na warzywa w pewnym mieście, otrzymano następujące szeregi czasowe:

— przyrost (zmiany) popytu na warzywa (w zł. na osobę): 2 3 4 1 1 4 6 2 4 3 (zmienna y)

— przyrost (zmiany) dochodu (w setkach zł. na osobę): 1 1 1 1 1 2 2 2 2 2 (zmienna x

₂

)

— przyrost (zmiany) ceny warzyw (w zł.): 0 0 0 1 1 0 0 1 1 1 (zmienna x

3

)

Polecenia:

1. Oszacuj parametry modelu popytu na warzywa postaci y = α

₁

+ α

₂

x

₂

+ α

₃

x

₃

+ ε 2. Zweryfikuj model pod względem statystycznym:

a. Oszacuj i zinterpretuj miary dopasowania modelu:

— średni błąd

— średni błąd procentowy modelu

— współczynnik determinacji

b. Zbadaj autokorelację składnika losowego:

— oblicz współczynnik autokorelacji reszt

— zweryfikuj hipotezę o braku autokorelacji

c. Zbadaj jakość oszacowań parametrów strukturalnych:

— oszacuj błędy średnie ocen parametrów

— zweryfikuj hipotezy o istotności ocen parametrów 3. Zweryfikuj model pod względem merytorycznym:

— oceń sensowność znaków oszacowanych parametrów

— zinterpretuj wartości oszacowanych parametrów i oceń ich sensowność 4. Sporządź prognozę przyrostów popytu na warzywa dla kolejnych trzech

okresów wiedząc, że:

(2)

Rozwiązanie

Model teoretyczny przyjmuje następującą postać:

ε α

α

α + + +

=

₁ ₂

x

₂ ₃

x

₃

y

gdzie:

y

t ― przyrost popytu na warzywa w okresie w okresie

t

t2

x

― przyrost dochodu na osobę w okresie

t

t3

x

― przyrost cen warzyw w okresie

t

3 2 1

, α , α

α

― parametry strukturalne modelu

ε

― składnik losowy

Model empiryczny można zapisać następująco:

3 3 2 2

1

ˆ ˆ

ˆ

_t

ˆ x

_t

x

_t

y = α + α + α

gdzie:

3 2 1

, ˆ , ˆ ˆ α α

α

― oszacowania parametrów strukturalnych

 







 







=

3 2 1

ˆ ˆ ˆ ˆ

α α α

α

- wektor oszacowań parametrów strukturalnych

ad 1)

Ponieważ model teoretyczny jest liniowy względem parametrów, można dokonać oszacowania wielkości jego parametrów strukturalnych

α

za pomocą MNK. Estymator tego wektora dany jest następującym wzorem:

α ˆ = ( X

^T

X )

⁻¹

X

^T

Y

. Informacje liczbowe (dane empiryczne) zawarte w treści zadania zapiszemy w postaci macierzowej

(3)



 









 







=

3 4 2 6 4 1 1 4 3 2

Y

^,



 









 







=

1 2 1

0 2 1

1 1 1

0 1 1

X

Wykorzystując powyższe dane wykonujemy następujące obliczenia cząstkowe:

 







 







=

5 8 5

8 25 15

5 15 10 X

X

^T ^,

 







 







−

=

4166 , 0 083 , 0 083 , 0

083 , 0 4166 , 0 583 , 0

083 , 0 583 , 0 0167 , 1 )

( X

^T

X

¹ ^,

 







 







= 11 49 30 Y X

^T

i otrzymujemy ostatecznie oszacowanie parametrów modelu:

( ) ⁼

= X X

⁻

X Y α ˆ

^T ¹ ^T

 







 







−

4166 , 0 083 , 0 083 , 0

083 , 0 4166 , 0 583 , 0

083 , 0 583 , 0 0167 , 1

 







 







11 49 30

=

 







 







− 2 2 1

Ostatecznie mamy więc oszacowany model popytu na warzywa postaci:

3

2

2 ˆ

_t

1 x

_t

x

_t

y = + −

Ad 2a)

W celu dokonania weryfikacji statystycznej, wykorzystując oszacowany w punkcie 1 model, należy obliczyć miedzy innymi miary dopasowania modelu do danych empirycznych. Bazują one na odchyleniach wartości empirycznych (

y

) i teoretycznych (

yˆ

) zmiennej objaśnianej dla przedziału próby. Aby je obliczyć, trzeba najpierw wyznaczyć wartości teoretyczne zmian

(4)

Te, a także szereg innych obliczeń związanych z weryfikacją modelu, można przeprowadzić w postaci tabelarycznej ― por. Tabela 1.

Tabela 1. Obliczenia robocze do przykładu

Numer obser- wacji (t)

wyraz

wolny

x

t,2 x_t_,₃

y

_t

y

_t²

yˆ

t

t t t

y y e

− ˆ

=

2

e

t

e

t−1

e

_t

e

_t₋₁

1

− −

=

t t

t

e e de

2

det

1 1 1 0 2 4 3 -1 1 - - - -

2 1 1 0 3 9 3 0 0 -1 0 1 1

3 1 1 0 4 16 3 1 1 0 0 1 1

4 1 1 1 1 1 1 0 0 1 0 -1 1

5 1 1 1 1 1 1 0 0 0 0 0 0

6 1 2 0 4 16 5 -1 1 0 0 -1 1

7 1 2 0 6 36 5 1 1 -1 -1 2 4

8 1 2 1 2 4 3 -1 1 1 -1 -2 4

9 1 2 1 4 16 3 1 1 -1 -1 2 4

10 1 2 1 3 9 3 0 0 1 0 -1 1

Razem

10 15 5 30 112 30 0 6 0 -3 1 17

Teraz można obliczyć odchylenia wartości empirycznych i teoretycznych w próbie

e

_t (błędy modelu, reszty) wg formuły:

t t

t

y y

e = − ˆ

np.

e

₁

= y

₁

− ˆy

₁ (wszystkie wyniki obliczeń można znaleźć w tabeli 1).

Mając obliczone wielkości błędów w przedziale próby można przystąpić do obliczenia miar dopasowania modelu do danych empirycznych. W pierwszej kolejności obliczymy sumę kwadratów reszt:

2

6 =

= ∑

t

e

t

S

Na jej podstawie trudno wyciągnąć wnioski o jakości dopasowania modelu, bo jest to miara nieunormowana i nie poddająca się merytorycznej interpretacji. Jest za to podstawą do obliczenia średniego błędu modelu, zwanego także odchyleniem standardowym reszt lub średnim błędem szacunku.

(5)

Średni błąd modelu

93 , 0 926 , 0 857 , 3 0 10

6 = = ≈

= −

k n

S

_e

S

zł.

W powyższym wzorze

n

oznacza liczbę obserwacji, na podstawie których dokonano oszacowania parametrów modelu (liczebność próby), która wynosi w naszym przykładzie 10. Wielkość

k

oznacza liczbę szacowanych w modelu parametrów, czyli w naszym przykładzie będzie to 3.

Warto zauważyć, że różnica

n-k

określana jest jako liczba stopni swobody oraz, że niektóre programy komputerowe wyliczają średni błąd modelu w odmienny sposób, tj.:

n

S

_e

= S

, co nie zmienia interpretacji tej wielkości.

Interpretacja: obliczona wartość średniego błędu modelu oznacza, że przewidywania zmian popytu na warzywa (tj. zmiennej objaśnianej przez model) sporządzane dla przedziału próby na podstawie oszacowanego modelu różnią się średnio od wartości empirycznych tej zmiennej o 0,93 zł.

Średni błąd procentowy modelu

% 9 , 30

% 100

% = ⋅ =

Y V

_S

S

^e

e

Interpretacja: przewidywania zmian popytu na warzywa sporządzane na podstawie

oszacowanego modelu dla przedziału próby różnią się średnio od wartości empirycznych o 30,9% średniej wartości zmian popytu na warzywa.

Współczynnik determinacji

∑

∑ ( y

t

⁻ y )

²

⁼ y

t²

⁻ n y

²

(6)

Interpretacja: zmiany dochodów i cen (model) w 73% objaśniają wahania zmian popytu na warzywa (zmiennej objaśnianej).

Ad 2b)

Przyczyny występowania autokorelacji składnika losowego:

— pominięcie istotnej zmiennej objaśniającej,

— dłuższe niż 1 okres działanie czynników przypadkowych,

— przyjęcie niewłaściwych opóźnień zmiennych objaśniających,

— przyjęcie niewłaściwej postaci funkcyjnej.

Współczynnik autokorelacji reszt

6 , 5 0

3 )

( ) , ˆ cov(

2 2 2

1

1 2

1

− = −

=

∑

=

−

n

t t n

t t t

e e e y

D y ρ y

Test Durbina–Watsona

Stawiamy hipotezę zerową mówiącą o braku autokorelacji składników losowych w modelu, podczas gdy hipoteza alternatywna stwierdza, że występuje autokorelacja ujemna (ze względu na współczynnik autokorelacji obliczonego na podstawie próby).

0 :

1 0

<

= ρ

ρ H

H

Zweryfikujemy hipotezę zerową za pomocą testu Durbina–Watsona na poziomie istotności 0,05.

Sprawdzianem w tym teście jest statystyka DW:

( )

83 , 6 2

2

17

2 1

=

−

=

∑

=

−

S e e DW

n t

t t

Wartości krytyczne

dl

i

du

odczytujemy z tablic rozkładu DW, której fragment pokazuje tabela 2, a na ich podstawie obliczamy wartości

dl ' = 4 − dl

oraz

du ' = 4 − du

, otrzymując:

dl=0,697; du=1,641 du'=2,359 dl'=3,303

.

Zauważmy, że na poziomie istotności 0,05 wartość sprawdzianu z próby wynosząca 2,83 znalazła się pomiędzy wartościami

du’

ⁱ

dl’

^.

'

' DW dl

du < <

(7)

czyli w obszarze niekonkluzywności. Oznacza to, że na podstawie tego testu nie można podjąć decyzji o występowaniu bądź braku autokorelacji w rozważanym modelu.

Tabela 2. Wartości krytyczne statystyki Durbina-Watsona (

α = 0 , 05

⁾

(

k

― liczba szacowanych parametrów,

n

― liczba obserwacji)

k

=2

k

=3

n dl du dl du

6 0,61 1,40 - -

7 0,70 1,36 0,47 1,90 8 0,73 1,33 0,56 1,78 9 0,82 1,32 0,63 1,70 10 0,88 1,32 0,70 1,64 11 0,93 1,32 0,76 1,60 12 0,97 1,33 0,81 1,58 13 1,01 1,34 0,86 1,56 14 1,04 1,35 0,91 1,55 15 1,08 1,36 0,95 1,54 Źródło: www.stanford.edu/~clint/bench/dwcrit.htm

Ad 2c)

Średnie błędy ocen parametrów

Średnie błędy ocen parametrów wyznacza się według wzoru:

jj

e

c

S S

_α_ˆj

=

gdzie

[ ] c

ij

⁼ ( X

^T

X )

⁻¹, co oznacza, że wielkości

c

_jj to kolejne elementy głównej przekątnej macierzy

( X

^T

X )

⁻¹. Średni błąd dla oszacowania parametru

α

₀ wynosi więc:

934 , 0 0166 , 1 926 ,

11

0

ˆ₁

= S c = ⋅ =

S

_α _e

a dla pozostałych parametrów odpowiednio

0 , 5976

ˆ2

=

S

α i

0 , 5976

ˆ3

= S

α

Test istotności ocen parametrów

Test przeprowadzamy oddzielnie dla każdego z parametrów według następującego schematu:

(8)

0

:

_j

=

H α

0

1

:

_j

≠

H α

Hipotezę zerową zweryfikujemy na poziomie istotności 0,05 przy dwustronnym obszarze odrzucenia (co wynika z postaci hipotezy alternatywnej). Sprawdzianem w tym teście jest statystyka postaci:

j

S

t

^j

α α

α

ˆ ˆ

= ˆ

,

która ma rozkład t-Studenta o

n − k = 10 − 3 = 7

stopniach swobody.

Wartość krytyczna odczytana z tablic rozkładu t-Studenta dla 7 stopni swobody wynosi

365 ,

05

2

,

0

=

t

.

Obliczamy wartość sprawdzianu w próbie dla parametru

α

₁^:

071 , 934 1 , 0 ˆ 1

1 1

ˆ

=

1

= =

α α

α t S

Dla pozostałych parametrów wartości sprawdzianu wynoszą odpowiednio

3 , 347

ˆ2

= t

α

347 ,

3

ˆ

= −

t

α .

Porównując wartość sprawdzianu dla parametru

α

₁ z wartością krytyczną zauważamy, że

365 , 2 071 , 1 bo

05

,

ˆ₁

< t

0

<

t

_α

Stwierdzamy więc, że na poziomie istotności 0,05 nie ma podstaw do odrzucenia hipotezy zerowej mówiącej o tym, że parametr

α

₁ w badanym modelu jest nieistotny pod względem statystycznym (wyraz wolny nie jest istotny).

W przypadku parametrów

α

₂ⁱ

α

₃między wartościami sprawdzianów a wartością krytyczną zachodzą następujące relacje:

05 ,

2

t

0

t

_α

>

oraz ₀_,₀₅

3

t

_α

>

bo

3 , 347 > 2 , 365

Zarówno w przypadku parametru

α

₂ jak i

α

₃ stwierdzamy więc, że na poziomie istotności 0,05 odrzucamy hipotezy zerowe i przyjmujemy hipotezy alternatywne, mówiące o tym, że

(9)

parametry

α

₂ i

α

₃ w badanym modelu są istotne pod względem statystycznym, a to oznacza, że zmienne z nimi związane, tj. zmiany dochodów i zmiany cen są istotne.

Ad 3)

Ocena znaków parametrów przy zmiennych objaśniających:

— dodatni znak przy dochodach oznacza, że wzrost dochodu powoduje wzrost popytu na warzywa; reakcja popytu na zmianę dochodów odzwierciedlona w modelu jest więc zgodna z teorią ekonomii;

— ujemny znak przy cenie oznacza, że wzrost ceny powoduje spadek popytu na warzywa;

reakcja popytu na zmianę ceny odzwierciedlona w modelu jest więc zgodna z teorią ekonomii.

Interpretacja parametrów modelu.

Oszacowany model ma postać liniową, a więc parametry stojące przy poszczególnych zmiennych interpretuje się jako zmiany krańcowe.

— wzrost dochodów na osobę o 100 zł. powoduje wzrost popytu na warzywa o 2 zł. na osobęł

— wzrost ceny warzyw o 1 zł. powoduje spadek popytu na warzywa o 2 zł. na osobę.

Wyraz wolny interpretuje się jako wartość zmiennej objaśnianej przy założeniu, że wszystkie zmienne są równe 0. Nie w każdym modelu przyjęcie takiego założenia ma sens. Ponieważ zmienne objaśniające naszego modelu zdefiniowane są jako zmiany dochodów i zmiany cen, można powiedzieć, że jeśli dochody i ceny nie zmieniają (tj. jeśli ich zmiany wynoszą 0) to popyt na warzywa rośnie (z okresu na okres) o 1 zł. na osobę.

Ad 4)

Założenia prognozowania na podstawie modelu ekonometrycznego.

— znana i stabilna postać rozkładu składnika losowego (struktury stochastycznej modelu);

— znana i stabilna postać analityczna modelu i jego parametrów;

— znane wartości zmiennych objaśniających w okresie prognozowanym (z planów, z ekstrapolacji trendów, z innych modeli).

(10)

Na podstawie modelu przewidujemy, że przyrost popytu na warzywa w badanej populacji będzie wynosić 7 zł na osobę. Wyniki obliczeń dla wszystkich okresów prognozowanych okresów

przedstawia poniższa tabela:

Tabela 3. Obliczenia robocze do przykładu Wartości zmiennych

objaśniających Numer

okresu

Dochód (

x

₂) Cena (

x

₃)

Prognoza popytu

( ) yˆ

11 3 0 7

12 4 2 5

13 5 4 3