• Nie Znaleziono Wyników

Miary dobroci dopasowania funkcji regresji do danych empirycznych

W dokumencie Podstawy statystyki (Stron 107-111)

D o b ro ć dopasow ania rów nania regresji do danych empirycznych oceniam y na podstaw ie następujących m iar40:

a) w ariancja składnika resztow ego,

b) odchylenie standardow e składnika resztow ego (średni błąd szacunku), c) współczynnik zm ienności przypadkow ej (resztow ej),

d) współczynnik braku determ inacji (zbieżności), e) współczynnik determ inacji.

Przedstaw im y je teraz kolejno.

M iary te są zdefiniow ane na podstaw ie różnicy pom iędzy empirycznymi i teo re­ tycznym w artościam i zm iennej objaśnianej ( Y ). W artości teoretyczne są obliczane na podstaw ie funkcji regresji. O znaczają one w artości, jakie przyjęłaby zm ienna obja­ śniana, gdyby była ona funkcją tylko od zm iennej objaśniającej. O dchylenia teo re­ tyczne i em piryczne zostały przedstaw ione na rysunku 4.13. Linie pom iędzy p un kta­ m i em pirycznym i (x„ y,) a o dpow iadającym i im p u n k tam i teoretycznym i (*,, y ) znajdującym i się na linii regresji obrazują poszczególne odchylenia, które sumarycznie ujm ujem y za pom ocą wariancji i odchylenia standardow ego składnika resztowego.

Rys. 4.13. Odchylenia wartości empirycznych i teoretycznych obliczonych na podstawie funkcji regresji

40 Por. też: S. Ostasiewicz, Z. Rusnak, U. Siedlecka, op. cit.\ M. Woźniak (red.), op. cit., A. Zeliaś, Metody statystyczne, op. cit. ; W. Starzyńska, Statystyka praktyczna, Warszawa 2000.

a) W a ria n c ja s k ła d n ik a resztow ego zdefiniow ana jest jako:

(4 .2 0 )

Mierzy ona rozproszenie empirycznych w artości zm iennej Y w okół funkcji regresji. Im w ariancja jest większa tym gorsze jest dopasow anie funkcji re ­ gresji. W m ianowniku wyrażenia (4.20) występuje liczba stopni swobody ozna­ czona jako n - k . U stalam y ją, pom niejszając liczebność populacji (n ) o licz­ bę param etrów funkcji regresji (k). W przypadku liniowej regresji dwóch zmiennych k — 2. W ariancję składnika resztow ego pozostaw iam y bez in ter­ pretacji. Jest to m iara m ianow ana, a jednostką jest kw adrat jed no stki w ja ­ kiej wyrażona jest zm ienna objaśniana,

b) O d c h y le n ie s ta n d a rd o w e s k ła d n ik a reszto w eg o zdefiniow ane wzorem :

inform uje, o ile, średnio rzecz biorąc, wartości em piryczne (y,) zm iennej Y odchylają się od jej wartości teoretycznych (y,) obliczonych na podstaw ie funk­ cji regresji. Im większą w artość przyjm uje ta m iara, tym gorsze jest d op aso ­ wanie funkcji regresji. O dchylenie standardow e składnika resztow ego jest m iarą mianowaną o m ianie zgodnym z m ianem zm iennej objaśnianej Y. c) W sp ó łc z y n n ik z m ie n n o śc i p rz y p ad k o w ej (reszto w ej) oblicza się na p o d ­

stawie następującego wzoru:

Inform uje on, jaki procent średniej w artości zm iennej objaśnianej stanowi odchylenie standardow e składnika resztowego. Jest m iarą niem ianow aną, a jej wartość podajem y w procentach.

W przypadku idealnego dopasow ania funkcji regresji do danych empirycz­ nych współczynnik zmienności resztowej osiąga w artość 0. D latego im lepsze dopasowanie, tym m iara ta przyjmuje mniejszą wartość. W praktyce ustala się pewną wartość progową współczynnika Vc' (np. na poziom ie V ’ - 30%), której przekroczenie pow oduje odrzucenie funkcji regresji, ze względu na zbyt wysoki udział czynników przypadkowych41. Dążymy zatem do uzyskania:

(4 .2 1 )

I 'e = 4-7-100%, y * 0 . (4 .2 2 ) v

(4.23)

d) W sp ó łcz y n n ik b ra k u d e te rm in a c ji (zbieżności) wskazuje, jaka część zm ien­ ności zm iennej objaśnianej Y nie jest wyjaśniona przez zm ienność zmiennej objaśniającej X . D la u łatw ienia in terp retacji wyrażam y go w procentach i wówczas dostarcza inform acji o tym, jaki p ro cent zm ienności zm iennej ob­ jaśnianej Y nie je st wyjaśniony przez zm ienność zm iennej objaśniającej X. M iara jest zdefiniow ana wzorem :

Z (v , - v , ) 2

‘P2 =JT,---• (4-24) ! ( > ’, - y ) 2

1=1

Współczynnik braku determ inacji (zbieżności) jest m iarą unorm owaną, a m ia­ nowicie:

0 < c p 2 < 1 .

Im cp2 jest bliższe 0, tym dopasow anie funkcji regresji jest lepsze. e) W sp ó łc z y n n ik d e te rm in a c ji i w sp ó łc z y n n ik k o re la c ji w ielo rak iej

W spółczynnik determ inacji jest dopełnieniem do jedności współczynnika bra­ ku determ inacji, a zatem :

R 2 = 1-cp2, (4 .2 5 )

0 < R 2 <1.

W yrażony w pro cen tach wskazuje, jaka część zm ienności zm iennej objaśnia­ nej Y jest w yjaśniona przez zm ienność zm iennej objaśniającej X .

W artości w spółczynnika determ inacji zaw ierają się w przedziale [0; 1]. Przy czym w artość rów na 1 oznacza, że zm ienność zm iennej objaśnianej jest w pełni w yjaśniona (w 100% ) przez zm ienność zm iennej objaśniającej. W p rz y p ad k u liniow ej fu nkcji reg resji dw óch zm iennych współczynnik determ inacji jest równy kw adratow i współczynnika korelacji liniowej

Pear-42

sona .

P rz y k ła d 4.7

O cenim y teraz dopasow anie do danych em pirycznych funkcji regresji z przykła­ du 4.6. dotyczącego zależności przychodów od zatrud nienia w placów kach banku. Każdej em pirycznej w artości (y,) zm iennej Y przyporządkow ujem y jej wartość teore­ tyczną (y,) obliczoną na podstaw ie funkcji o postaci:

% = 2,111 + 0,108x..

O dpow iednie obliczenia pom ocnicze przedstaw iam y w tablicy 4.10.

Tablica 4.10. Obliczenia pomocnicze od uzyskanych miar dopasowania funkcji regresji do danych empirycznych Nr i Zatrudnienie x, Przychody y t 9t y ,~ 9i ( y , - y , ) 2 y t - y ( j i - y ) 2 1 15 2,3 3,73 -1,43 2,05 -4,45 19,80 2 21 4,6 4,38 0,22 0,05 -2,15 4,62 3 52 6,6 7,73 -1,13 1,27 -0,15 0,02 4 31 7,2 5,46 1,74 3,03 0,45 0,20 5 46 7,9 7,08 0,82 0,67 1,15 1,32 6 23 4,5 4,60 -0,10 0,01 -2,25 5,06 7 61 8,8 8,70 0,10 0,01 2,05 4,20 8 55 8,2 8,05 0,15 0,02 1,45 2,10 9 73 9,6 10,00 -0,40 0,16 2,85 8,12 10 54 7,8 7,94 -0,14 0,02 1,05 1,10 Razem 431 67,5 67,66 X 7,29 X 46,57 Źródło: dane umowne.

W pierwszej kolejności obliczamy w artości teo re ty czn e j,, podstaw iając do funk­ cji regresji liniowej kolejne w a rto ścije,-. N a przykład d lax , = 15 mamy:

y, = 2,111 + 0 ,1 0 8 -1 5 = 3,73.

W artości poszczególnych m iar zgodnie z podanym i w zoram i i wynikam i obliczeń podanym i w tablicy 4.9 uzyskujem y jako:

• wariancje składnika resztow ego 7 79

,sr2 = — ---- = 0,911 [min zł2]. £ 1 0 - 2

W artość tę pozostaw iam y bez interpretacji. • odchylenie standardow e składnika resztowego

Ss = \ K > ? 2 = ^ TT = ° ’954 [mln Zł]'

Rzeczywiste przychody placów ek banku różnią się od w artości teoretycznych obliczonych na podstawie rów nania regresji średnio o 954 tysiące złotych. Sza­

cując przychody placów ek banku na podstaw ie funkcji regresji, musimy liczyć się ze średnim błędem oszacowania równym 0,954 m iliona złotych.

• współczynnik zm ienności przypadkow ej (resztow ej) 0 954

Ve = - --- 100% = 14,1%.

6,75

Przyjmijmy w artość progow ą na poziom ie VŻ 30%.

O dchylenie standardow e składnika resztow ego stanow i 14,1% przeciętnego przychodu oddziału banku, co świadczy o tym, że uzyskaną funkcję regresji m ożem y uznać za dobrze opisującą badany związek z punktu w idzenia przy­ ję te g o kryterium .

• w spółczynnik braku determ inacji

2 7-29 n , ^ a r = ---= 0,156,

46.57 cp: -100% = 15,6%.

Z m ien ność przychodów oddziałów banku w 15,6% jest niewyjaśniona przez zm ienność wielkości zatrudnienia.

• współczynnik determ inacji

R 2 = 1 -0 ,1 5 6 = 0,844,

R 2 -100% = 84,4%.

Z m ien ność przychodów oddziałów banku jest wyjaśniona w 84,4% zm iennością zatrud nienia.

N a podstaw ie uzyskanych w artości m iar m ożem y uznać dopasow anie funkcji re ­ gresji do danych em pirycznych za zadowalające.

W dokumencie Podstawy statystyki (Stron 107-111)