• Nie Znaleziono Wyników

Odległość Cooka.

N/A
N/A
Protected

Academic year: 2021

Share "Odległość Cooka."

Copied!
1
0
0

Pełen tekst

(1)

Wartości wpływowe i odstające – interpretacja

W regresji prostej obserwacja posiadająca nietypową wartośd Yi dla danej wartości Xi posiada wysoką odmiennośd (discrepancy). Natomiast obserwacja posiadająca typową wartośd Yi (małe wartości reszt ei) i nietypową wartośd Xi posiada wysoką dźwignię (leverage).

Często odmienne obserwacje mają duże wartości pozostałości regresji ei ale nie zawsze.

Obserwacja posiadająca wysoką dźwignię może mied małą wartośd ei, ponieważ przyciąga linię (płaszczyznę w regresji wielokrotnej) regresji blisko Yi. W konsekwencji, wpływ danej obserwacji na współczynniki regresji jest wyrażany jako funkcja odmienności i dźwigni tej obserwacji.

WPŁYW_OBSERWACJI = DŹWIGNIA X ODMIENNOŚD

Diagnostyka wpływu obserwacji na wyniki analizy regresji sprowadza się do analizy odmienności i dźwigni tych obserwacji, lub bezpośredniej oceny wpływu obserwacji na współczynniki testowanego modelu regresji.

Najczęściej stosowaną miarą dźwigni danej obserwacji i jest tzw. wartośd hi (hat-value) tej obserwacji. W regresji prostej, wartośd hi mierzy dystans danej obserwacji od średniej wartości zmiennej X:

Odległość Cooka. Jest to miara stopnia zmiany współczynników regresji, gdyby dany przypadek pominąć w obliczeniach współczynników. O ile odległości Mahalanobisa mierzą odległość przypadku od środka ciężkości wyznaczonego przez zmienne niezależne, a reszty standaryzowane - od linii regresji, o tyle odległości Cooka łączą te dwie odległości i przez to

są łączną miarą wpływu poszczególnych obserwacji na linię regresji.

Wszystkie wartości dla danej odległości powinny być tego samego rzędu. Jeśli tak nie jest, to prawdopodobnie dany przypadek ma istotnie duży wpływ na obciążenie równania regresji.

Potwierdza to nasz przykład. Odległość Cooka dla przypadku 10. wybija się wyraźnie spośród pozostałych wartości. Jeszcze wyraźniej widać to dla usuniętych wartości resztowych.

Przypadek 10. ma tę wartość 10-krotnie większą od pozostałych; wniosek jest prosty.

Przeglądając wartości podanych statystyk, szukamy tych przypadków, dla których wartości te

wyraźnie "wybijają się" spośród pozostałych.

Cytaty

Powiązane dokumenty

Następnie stosując znane Ci z zajęć i wykładu funkcje biblioteki car wskaż identyfikatory tych obiektów które są obserwacjami wpływowymi i tych które są

[r]

Może się bowiem okazać, że wśród  tych wszystkich oszustów, którzy  twierdzą, że mają wrodzoną moc 

Ponieważ jednak od wyda- nia Nauki jako obiektu kultu… upłynęło już nieco czasu, uzasadnione wydaje się pytanie, czy poruszanie tematu odnoszenia się człowieka do otaczającej go

Bardzo popularną metodą identyfikacji obserwacji nietypowych w analizie regresji wielorakiej jest metoda wykorzystująca odległość Cooka, która to odle- głość porównuje

[r]

Na stan zdrowia dziecka ma wpływ zdrowie jego matki przed ciążą i podczas ciąży oraz odpowiedni poziom opieki profilaktyczne» - leczniczej.. Pojawiają się oznaki,

Czy więc możliwe jest przyświadczenie realne tej Istocie, która jest Bogiem, o której intelekt wie tyle, że nie może Go ani zobaczyć, ani dotknąć, ani sobie wyobrazić..