Praca domowa #2 z SAD
Zadanie 1:
Na podstawie próby liczącej 49 obserwacji oszacowano parametry modelu regresji:
y = β0+ β1x1+ β2x2+ β3x3+ ε
i uzyskano R2 = 0.2. Następnie dodano do modelu jedną obserwację, leżącą na oszacowanej prostej regresji.
W efekcie dodania obserwacji całkowita suma kwadratów modelu zwiększyła się o 4 procent.
• Jak dodanie obserwacji wpłynęło na R2 i R2adj (R2 skorygowane)? Odpowiedź uzasadnić.
• Oblicz R2 oraz R2adj dla modelu z dodatkową obserwacją. (Wskazówka: R2adj = 1 −N −KN −1(1 − R2), gdzie N – liczba obserwacji, K – liczba parametrów do oszacowania w modelu.)
Zadanie 2:
Na podstawie n = 10 elementowej próby, szacowany jest model yi = β0+ β1xi+ εi.
• Wyznacz wartości estymatora ˆβ uzyskane Metodą Najmniejszych Kwadratów, wiedząc, że Pni=1xiyi= 350, Pni=1xi = 40, Pni=1yi= 98a Pni=1x2i = 250.
• Mamy dane wektory yT = [5, 3, 1, 1] oraz xT = [2, 1, x3, x4]. Oszacowano MNK model yi = β0+ β1xi + εi i uzyskano wektor reszt eT = [0.5, −0.5, e3, e4]. Znaleźć x3, x4, e3, e4. (Wskazówka:
skorzystaj z właściwości hiperpłaszczyzny regresji: XTe = 0 – wektor reszt jest ortogonalny do macierzy X; w modelu ze stałą PN
i=1= 0.)
Zadanie 3:
Oszacowano model y = Xβ + ε. Następnie stworzono macierz X∗ = AX, gdzie A jest pewną macierzą nieosobliwą.
• Udowodnić, że jeśli oszacujemy regresję y = X∗β∗+ ε∗, to ˆβ∗ = A−1βˆ, gdzie ˆβ jest oszacowaniem współczynników z regresji y na X.
• Policzyć Var( ˆβ∗).
Zadanie 4:
Mając obserwacje xT = [1, 2, −1, 4, −1]oraz yT = [7, 2, 1, 10, −3] policzyć:
• estymator ˆβ metodą najmniejszych kwadratów w modelu yi = β0+ β1xi+ εi;
• ˆy, e, R2, nieobciążony estymator wariancji dla składnika losowego.
1
Zadanie 5:
Dany jest model regresji liniowej:
y = β0+ β1x1+ β2x2+ β3x3+ ε ,
gdzie ε ∼ N(0, σ2In), dla którego na próbie n = 120 obserwacji otrzymano następujące oszacowania współczynników:
βˆT = [2, −1.1, 5, −1.5]
oraz oszacowanie macierzy wariancji-kowariancji dla estymatora MNK Var( ˆβ):
Var ˆβ =
0.04
−1.12 1.21
−0.45 2.8 6.25 3.25 −7.68 0.71 0.09
• Które z oszacowań są statystycznie istotne na poziomie istotności 1%?
• Zinterpretuj istotne statystycznie na poziomie istotności 5% oszacowania parametrów.
Zadanie 6:
Rozkład miesięcznych wydatków na książki studentów I roku ma rozkład normalny. W wylosowanej próbie 16 studentów średnia wynosiła 150 zł, zaś wariancja wyznaczona na podstawie tej próby wynosiła 1600 zł. Przypuszczamy, że studenci I roku wydają przeciętnie 200 zł. Czy dysponując opisaną próbą możemy odrzucić to założenie? Przyjąć poziom istotności α = 0.1.
Zadanie 7:
W pewnym browarze zainstalowane są dwa automaty do napełniania butelek. Ilość piwa dozowana przez pierwszy jest zmienną losową o rozkładzie N(m1, 112), a ilość piwa dozowana przez drugi jest zmienną losową o rozkładzie N(m2, 132). Pobrano niezależnie 10-elementowe próbki losowe butelek napełnianych przez każdy z automatów. Średnia z próby dla pierwszego automatu wyniosła 501 ml, a dla drugiego 498 ml. Na poziomie istotności α = 0.05 zweryfikuj hipotezę, że automaty dozują przeciętnie po tyle samo piwa.
2