• Nie Znaleziono Wyników

Obliczyć i zinterpretować współczynnik korelacji wielorakiej między zmienną Y a zmiennymi X1 i X2

N/A
N/A
Protected

Academic year: 2021

Share "Obliczyć i zinterpretować współczynnik korelacji wielorakiej między zmienną Y a zmiennymi X1 i X2"

Copied!
3
0
0

Pełen tekst

(1)

Ekonometria Lista 2 Z2ZF01

Lista zadań obejmuje następujące zagadnienia:

• Współczynnik korelacji liniowej Pearsona

• Współczynnik korelacji wielorakiej

• Wybrane metody doboru zmiennych do modelu liniowego

1

Na podstawie 50 obserwacji oszacowano proste regresji zmiennych X i Y : y = −0.45x + 15.43,b x = −2.184y + 33.88. Sprawdzić na poziomie istotności 5%, czy współczynnik korelacji liniowejb między zmiennymi:

a) jest statystycznie istotnie różny od zera;

b) jest statystycznie istotnie ujemny.

2

Dana jest macierz:

R =

1 0.8 x

0.8 1 −0.4

x −0.4 1

.

Dla jakich wartości x podana macierz może być macierzą korelacyjną?

3

Współczynniki korelacji liniowej między zmiennymi Y , X1 oraz X2 łączonymi w pary wynoszą:

r1 = 0.8, r2 = 0.7, r12 = 0.9. Obliczyć i zinterpretować współczynnik korelacji wielorakiej między zmienną Y a zmiennymi X1 i X2.

4

Macierz R zawiera współczynniki korelacji między zmiennymi X1, X2, X3, X4.

R =

1 0.53 −0.3 0.57 1 −0.92 0.99 1 −0.9 1

a) Jaka jest siła zależności zmiennej X2 od X1 i X4 jednocześnie?

b) Obliczyć współczynnik korelacji wielorakiej dla modelu bX3= a0+ a1X1+ a2X4. 5

Dany jest wektor współczynników korelacji R0 zmiennej objaśnianej Y z potencjalnymi zmien- nymi objaśniającymi X1, X2, X3, X4 oraz macierz korelacji zmiennych X1, X2, X3, X4.

R0 =

 0.6

−0.7

−0.8 0.5

, R =

 1

−0.6 1

−0.8 0.5 1

0.3 −0.2 −0.7 1

 .

Która z kombinacji zmiennych objaśniających: C1 = {X1, X3} czy C2 = {X2, X3}, jest lepsza ze względu na współczynnik korelacji wielorakiej?

1

(2)

Ekonometria Lista 2 Z2ZF01

6

Dla danych z zadania 5 dobrać zmienne objaśniające metodą analizy współczynników korelacji.

Liczba obserwacji wynosiła 25. Przyjąć poziom istotności 5%.

7

Dla danych z zadania 5 dobrać zmienne objaśniające metodą grafową. Przyjąć krytyczny współczynnik korelacji oparty na regule minimaksowej.

8

Dla danych z zadania 5 sprawdzić, która spośród dwuelementowych kombinacji potencjalnych zmiennych objaśniających jest lepsza w sensie metody pojemności informacji.

9

Współczynnik korelacji zmiennych X1 i X2 wynosi (−0.25). Ile wynosi pojemność integralna kombinacji {X1, X2}, jeżeli pojemność integralna kombinacji {X1} wynosi 0.64, a pojemność integralna kombinacji {X2} jest równa 0.36?

10

Rozpatrywane są potencjalne zmienne objaśniające X1 i X2. R0 = [r1 0.8]T, r12 = 0.9. Dla jakiego r1 kombinacja {X1} jest najlepsza w sensie metody pojemności informacyjnej?

11

Rozpatrywanych jest m potencjalnych zmiennych objaśniających i jedna zmienna objaśniana.

a) Wyprowadzić liczbę wszystkich możliwych kombinacji zmiennych objaśniających.

b) Wyjaśnić, dlaczego dla dużego m przegląd wszystkich możliwych kombinacji w celu wybra- nia najlepszego modelu (np. za pomocą wskaźników pojemności informacji) staje się kłopotliwy?

Forward stepwise selection method

Zamiast przeszukiwać wszystkie możliwe podzbiory zbioru potencjalnych zmiennych obja- śniających, można wykorzystać algorytm lokalnie optymalny. Popularnym algorytmem jest forward stepwise selection method. W algorytmie tym punktem wyjścia jest zdegenerowany model zawierający wyłącznie wyraz wolny. Do modelu są następnie dodawane sekwencyjnie zmienne objaśniające, które w największym stopniu poprawiają jego dopasowanie do danych.

Niech w danym kroku model obejmuje k zmiennych objaśniających (k < m), a odpowiedni wektor ocen parametrów to α. Następnie dodawana jest jedna z pozostałych zmiennychb objaśniających (wówczas otrzymywany jest wektor α). Do pomiaru poprawy dopasowaniae związanego z dodaniem zmiennej służy statystyka F , określona wzorem:

F = RSS(α) − RSS(b α)e RSS(α)/(n − k − 2)e ,

gdzie n to liczba obserwacji, RSS — suma kwadratów reszt modelu (residual sum of squares).

Typowa strategia polega na dodaniu w danym kroku tej zmiennej, która daje największą wartość statystyki F (w największym stopniu poprawia dopasowanie modelu). Działanie algo- rytmu zatrzymywane jest w sytuacji, gdy żadna z pozostałych zmiennych nie daje wartości em- pirycznej statystyki F większej od wybranego, wysokiego kwantylu (np. 90%, 95%) rozkładu F1,n−k−2.

2

(3)

Ekonometria Lista 2 Z2ZF01

12

Za pomocą metody forward stepwise selection uzyskano model objemujący 12 spośród 15 poten- cjalnych zmiennych objaśniających. Suma kwadratów reszt modelu zawierającego 12 zmiennych objaśniających wyniosła 161.8. Zbiór danych, na podstawie których estymowano model, liczył 140 obserwacji. W tabeli zestawiono sumy kwadratów reszt modeli, powstałych po włączeniu do obecnego modelu jednej z pozostałych zmiennych:

RSS(α)e X2 158.2 X5 158.8 X12 159.9

Która z pozostałych zmiennych zostanie włączona do modelu w kolejnym kroku algorytmu?

Przyjąć jako krytyczny 95 percentyl rozkładu. Kwantyl 95% rozkładu statystyki F wynosi F0.95;1,126= 3.9163.

3

Cytaty

Powiązane dokumenty

Zobacz ( Zieliński R., Zieliński W. Tablice statystyczne str. 406 -Uwaga u Zielińskich obserwacje są rangowane w kolumnach -macierz obserwacji jest wiec transpozycją macierzy

W dowolnej macierzy maksymalna ilo±¢ liniowo niezale»nych wierszy jest równa maksymalnej ilo±ci liniowo niezale»nych

Obszar pod hiperbolą dzielimy na krzywoliniowe prostokąty, których jeden z boków leży na osi OX i łączy dwa kolejne punkty ciągu 1, α, α 2 ,.. Jak zmieni się pole

(Kolejność występujących elementów nie jest tutaj istotna, ale istotne jest ile razy dany element się powtarza.) Proszę wypisać w ten sposób wszystkie kombinacje 5-elementowe

[r]

[r]

Niech X, Y b¸ed¸a jednowymiarowymi

Idea zastosowania korelacji kanonicznej do wyboru optymalnego zbioru zmiennych objaśniających do modelu ekonometrycznego.. Идея применения