Materiały z ekonometrii, KE UŁ w Kutnie (11/2003) opracowanie: Jakub Boratyński
Zadanie 1
Oszacuj parametry liniowego modelu opisującego wydatki na odzież w gospodarstwach domowych. Zweryfikuj wyniki pod kątem merytorycznym i statystycznym.
i yi x2i x3i
1 921 8 21
2 1221 16 28
3 579 10 55
4 1650 20 33 5 1079 16 41
6 864 11 45
7 507 11 61
8 1721 18 25
9 579 10 55
10 1293 15 31
i – numer gospodarstwa domowego,
yi – wydatki na odzież w zł na osobę rocznie, x2i – dochód w tys. zł na osobę rocznie, x3i – średni wiek dorosłych członków gospodarstwa domowego.
Rozwiązanie
Model rozważanej zależności można zapisać następująco:
i i i
i x x
y =α1 +α2 2 +α3 3 +ε
Szacujemy parametry modelu w oparciu o wzór a=
(
XTX)
−1XTy.
=
31 15 1
55 10 1
25 18 1
61 11 1
45 11 1
41 16 1
33 20 1
55 10 1
28 16 1
21 8 1
X ,
=
1293 579 1721
507 864 1079 1650 579 1221
921
y
=
17377 5113
395
5113 1967
135
395 135
10 X
XT ,
( )
−
−
−
−
− =
000694 ,
0 001054 ,
0 041640 ,
0
001054 ,
0 008522 ,
0 156679 ,
0
041640 ,
0 156679 ,
0 859961 ,
3 X 1
XT
=
368823 154202 10414 y
XT ,
( )
−
=
= −
15 71 680
1X y X X
a T T
Na podstawie otrzymanych oszacowań zapisujemy parametry modelu:
i i
i x x
yˆ =680+71 2 −15 3
1
Materiały z ekonometrii, KE UŁ w Kutnie (11/2003) opracowanie: Jakub Boratyński
Aby ocenić przydatność modelu do wyjaśnienia kształtowania się wydatków na odzież oraz do prognozowania tych wydatków w poszczególnych gospodarstwach, należy przeprowadzić merytoryczną i statystyczną ocenę wyników.
1) Ocena merytoryczna modelu.
Dodatni znak parametru a2 wskazuje, że wraz ze wzrostem dochodu w gospodarstwie domowym rosną wydatki na odzież. Z kolei ujemny znak parametru a3 oznacza, że wydatki te maleją wraz ze wzrostem przeciętnego wieku członków gospodarstwa. Oba zjawiska można uznać za uzasadnione, a model – za poprawny pod względem merytorycznym.
2) Ocena dopasowania wartości teoretycznych do danych empirycznych.
Na tym etapie można posłużyć się miarami średniego błędu szacunku (Se) oraz współczynnika determinacji (R2). Należy w tym celu wykonać odpowiednie obliczenia w tablicy:
i yi x2i x3i yˆ i ei ei2 yi − y
(
yi −y)
21 921 8 21 933 -12 144 -120 14400
2 1221 16 28 1396 -175 30625 180 32400
3 579 10 55 565 14 196 -462 213444
4 1650 20 33 1605 45 2025 609 370881
5 1079 16 41 1201 -122 14884 38 1444
6 864 11 45 786 78 6084 -177 31329
7 507 11 61 546 -39 1521 -534 285156
8 1721 18 25 1583 138 19044 680 462400
9 579 10 55 565 14 196 -462 213444
10 1293 15 31 1280 13 169 252 63504
SUMA 10414 74888 1688402
UWAGA – dla ułatwienia przyjęto zaokrąglenia do liczb całkowitych:
Liczba obserwacji - 10
Liczba parametrów modelu – 3 3 103
74888 ≈10
= − Se
Interpretacja: teoretyczne (przewidywane) wydatki na odzież różnią się od empirycznych (faktycznych) średnio o 103 zł na osobę rocznie (lub: szacując wydatki na odzież na podstawie modelu mylimy się średnio o 103 zł).
10 1041 10414 ≈
= y
96 , 1688402 0
74888
2 =1− ≈
R
Interpretacja: różnice w wydatkach na odzież w poszczególnych gospodarstwach domowych można w około 96 procentach wytłumaczyć różnicami dochodów i wieku w tych gospodarstwach (inaczej: model tłumaczy około 96% zmienności wydatków na odzież).
3) Ocena istotności parametrów. Test t-Studenta.
Przyjmując poziom istotności testu np. 0,05 można odczytać z tablic wartość krytyczną testu t0,05 = 2,365 - odczytujemy tą wartość dla liczby stopni swobody równej 7 (10 obserwacji minus 3 parametry).
2
Materiały z ekonometrii, KE UŁ w Kutnie (11/2003) opracowanie: Jakub Boratyński
Aby obliczyć wartości statystyk t, znajdujemy najpierw średnie błędy ocen parametrów:
( )
a1 =103⋅ 3,859961≈202,395 S( )
a2 =103⋅ 0,008522 ≈9,476 S( )
a3 =103⋅ 0,000694 ≈2,678 SNastępnie obliczamy wartości statystyk t:
( )
a1 =680 202,395≈3,360 t( )
a2 =719,476≈7,493 t( )
a3 =−15 2,678≈−5,601 tDla poszczególnych parametrów stawiamy następujące hipotezy:
H0: α1 = 0 H1: α1 ≠ 0
Ponieważ zachodzi relacja:
( )
a1 ≈ 3603, >2,365 tzatem odrzucamy hipotezę zerową H0 na rzecz hipotezy alternatywnej H1. Oznacza to, że wyraz wolny jest istotny w specyfikacji modelu.
H0: α2 = 0 H1: α2 ≠ 0
Ponieważ zachodzi relacja:
( )
a2 ≈ 4937, >2,365 tzatem odrzucamy hipotezę H0 na rzecz hipotezy alternatywnej H1. Z prawdopodobieństwem 95% (= 1 - 0,05) występuje zależność między dochodami gospodarstw domowych a wydatkami na odzież.
H0: α3 = 0 H1: α3 ≠ 0
( )
a3 ≈ 6015, >2,365 tzatem odrzucamy hipotezę H0 na rzecz hipotezy alternatywnej H1. Z prawdopodobieństwem 95% występuje zależność między średnim wiekiem członków gospodarstwa domowego a wydatkami na odzież w tych gospodarstwach.
Podsumowanie
Model jest zadowalający pod względem merytorycznym i statystycznym. Biorąc to pod uwagę można na jego podstawie podać następujące wnioski na temat związku dochodów i wieku z wydatkami na odzież w gospodarstwach domowych:
Wśród gospodarstw charakteryzujących się takim samym średnim wiekiem, wraz ze wzrostem dochodów o 1 tys. zł na osobę rocznie przeciętne wydatki na odzież rosną średnio o 71 złotych na osobę rocznie.
Wraz ze wzrostem średniego wieku gospodarstwa domowego o 1 rok, wydatki na odzież maleją przeciętnie o 15 zł na osobę rocznie, przy założeniu, że dochód gospodarstwa pozostaje nie zmieniony.
3
Materiały z ekonometrii, KE UŁ w Kutnie (11/2003) opracowanie: Jakub Boratyński
Przykładowa prognoza
Wyznaczymy prognozę wydatków na odzież w gospodarstwie osiągającym dochody 17 000 zł na osobę rocznie. Średni wiek osób w gospodarstwie wynosi 30 lat.
1437 30
15 17 71
ˆ =680+ ⋅ − ⋅ = y
Przewidywane wydatki na odzież w tym gospodarstwie wynoszą 1437 zł na osobę rocznie.
Wartości krytyczne rozkładu t-Studenta
poziom istotności stopnie swobody
0,1 0,05 0,01 0,001 1 6,314 12,706 63,656 636,578 2 2,920 4,303 9,925 31,600 3 2,353 3,182 5,841 12,924 4 2,132 2,776 4,604 8,610 5 2,015 2,571 4,032 6,869 6 1,943 2,447 3,707 5,959 7 1,895 2,365 3,499 5,408 8 1,860 2,306 3,355 5,041 9 1,833 2,262 3,250 4,781 10 1,812 2,228 3,169 4,587 11 1,796 2,201 3,106 4,437 12 1,782 2,179 3,055 4,318 13 1,771 2,160 3,012 4,221 14 1,761 2,145 2,977 4,140 15 1,753 2,131 2,947 4,073 16 1,746 2,120 2,921 4,015 17 1,740 2,110 2,898 3,965 18 1,734 2,101 2,878 3,922 19 1,729 2,093 2,861 3,883 20 1,725 2,086 2,845 3,850 21 1,721 2,080 2,831 3,819 22 1,717 2,074 2,819 3,792 23 1,714 2,069 2,807 3,768 24 1,711 2,064 2,797 3,745 25 1,708 2,060 2,787 3,725 26 1,706 2,056 2,779 3,707 27 1,703 2,052 2,771 3,689 28 1,701 2,048 2,763 3,674 29 1,699 2,045 2,756 3,660 30 1,697 2,042 2,750 3,646 31 1,696 2,040 2,744 3,633 32 1,694 2,037 2,738 3,622 33 1,692 2,035 2,733 3,611 34 1,691 2,032 2,728 3,601 35 1,690 2,030 2,724 3,591
4