D o b ro ć dopasow ania rów nania regresji do danych empirycznych oceniam y na podstaw ie następujących m iar40:
a) w ariancja składnika resztow ego,
b) odchylenie standardow e składnika resztow ego (średni błąd szacunku), c) współczynnik zm ienności przypadkow ej (resztow ej),
d) współczynnik braku determ inacji (zbieżności), e) współczynnik determ inacji.
Przedstaw im y je teraz kolejno.
M iary te są zdefiniow ane na podstaw ie różnicy pom iędzy empirycznymi i teo re tycznym w artościam i zm iennej objaśnianej ( Y ). W artości teoretyczne są obliczane na podstaw ie funkcji regresji. O znaczają one w artości, jakie przyjęłaby zm ienna obja śniana, gdyby była ona funkcją tylko od zm iennej objaśniającej. O dchylenia teo re tyczne i em piryczne zostały przedstaw ione na rysunku 4.13. Linie pom iędzy p un kta m i em pirycznym i (x„ y,) a o dpow iadającym i im p u n k tam i teoretycznym i (*,, y ) znajdującym i się na linii regresji obrazują poszczególne odchylenia, które sumarycznie ujm ujem y za pom ocą wariancji i odchylenia standardow ego składnika resztowego.
Rys. 4.13. Odchylenia wartości empirycznych i teoretycznych obliczonych na podstawie funkcji regresji
40 Por. też: S. Ostasiewicz, Z. Rusnak, U. Siedlecka, op. cit.\ M. Woźniak (red.), op. cit., A. Zeliaś, Metody statystyczne, op. cit. ; W. Starzyńska, Statystyka praktyczna, Warszawa 2000.
a) W a ria n c ja s k ła d n ik a resztow ego zdefiniow ana jest jako:
(4 .2 0 )
Mierzy ona rozproszenie empirycznych w artości zm iennej Y w okół funkcji regresji. Im w ariancja jest większa tym gorsze jest dopasow anie funkcji re gresji. W m ianowniku wyrażenia (4.20) występuje liczba stopni swobody ozna czona jako n - k . U stalam y ją, pom niejszając liczebność populacji (n ) o licz bę param etrów funkcji regresji (k). W przypadku liniowej regresji dwóch zmiennych k — 2. W ariancję składnika resztow ego pozostaw iam y bez in ter pretacji. Jest to m iara m ianow ana, a jednostką jest kw adrat jed no stki w ja kiej wyrażona jest zm ienna objaśniana,
b) O d c h y le n ie s ta n d a rd o w e s k ła d n ik a reszto w eg o zdefiniow ane wzorem :
inform uje, o ile, średnio rzecz biorąc, wartości em piryczne (y,) zm iennej Y odchylają się od jej wartości teoretycznych (y,) obliczonych na podstaw ie funk cji regresji. Im większą w artość przyjm uje ta m iara, tym gorsze jest d op aso wanie funkcji regresji. O dchylenie standardow e składnika resztow ego jest m iarą mianowaną o m ianie zgodnym z m ianem zm iennej objaśnianej Y. c) W sp ó łc z y n n ik z m ie n n o śc i p rz y p ad k o w ej (reszto w ej) oblicza się na p o d
stawie następującego wzoru:
Inform uje on, jaki procent średniej w artości zm iennej objaśnianej stanowi odchylenie standardow e składnika resztowego. Jest m iarą niem ianow aną, a jej wartość podajem y w procentach.
W przypadku idealnego dopasow ania funkcji regresji do danych empirycz nych współczynnik zmienności resztowej osiąga w artość 0. D latego im lepsze dopasowanie, tym m iara ta przyjmuje mniejszą wartość. W praktyce ustala się pewną wartość progową współczynnika Vc' (np. na poziom ie V ’ - 30%), której przekroczenie pow oduje odrzucenie funkcji regresji, ze względu na zbyt wysoki udział czynników przypadkowych41. Dążymy zatem do uzyskania:
(4 .2 1 )
I 'e = 4-7-100%, y * 0 . (4 .2 2 ) v
(4.23)
d) W sp ó łcz y n n ik b ra k u d e te rm in a c ji (zbieżności) wskazuje, jaka część zm ien ności zm iennej objaśnianej Y nie jest wyjaśniona przez zm ienność zmiennej objaśniającej X . D la u łatw ienia in terp retacji wyrażam y go w procentach i wówczas dostarcza inform acji o tym, jaki p ro cent zm ienności zm iennej ob jaśnianej Y nie je st wyjaśniony przez zm ienność zm iennej objaśniającej X. M iara jest zdefiniow ana wzorem :
Z (v , - v , ) 2
‘P2 =JT,---• (4-24) ! ( > ’, - y ) 2
1=1
Współczynnik braku determ inacji (zbieżności) jest m iarą unorm owaną, a m ia nowicie:
0 < c p 2 < 1 .
Im cp2 jest bliższe 0, tym dopasow anie funkcji regresji jest lepsze. e) W sp ó łc z y n n ik d e te rm in a c ji i w sp ó łc z y n n ik k o re la c ji w ielo rak iej
W spółczynnik determ inacji jest dopełnieniem do jedności współczynnika bra ku determ inacji, a zatem :
R 2 = 1-cp2, (4 .2 5 )
0 < R 2 <1.
W yrażony w pro cen tach wskazuje, jaka część zm ienności zm iennej objaśnia nej Y jest w yjaśniona przez zm ienność zm iennej objaśniającej X .
W artości w spółczynnika determ inacji zaw ierają się w przedziale [0; 1]. Przy czym w artość rów na 1 oznacza, że zm ienność zm iennej objaśnianej jest w pełni w yjaśniona (w 100% ) przez zm ienność zm iennej objaśniającej. W p rz y p ad k u liniow ej fu nkcji reg resji dw óch zm iennych współczynnik determ inacji jest równy kw adratow i współczynnika korelacji liniowej
Pear-42
sona .
P rz y k ła d 4.7
O cenim y teraz dopasow anie do danych em pirycznych funkcji regresji z przykła du 4.6. dotyczącego zależności przychodów od zatrud nienia w placów kach banku. Każdej em pirycznej w artości (y,) zm iennej Y przyporządkow ujem y jej wartość teore tyczną (y,) obliczoną na podstaw ie funkcji o postaci:
% = 2,111 + 0,108x..
O dpow iednie obliczenia pom ocnicze przedstaw iam y w tablicy 4.10.
Tablica 4.10. Obliczenia pomocnicze od uzyskanych miar dopasowania funkcji regresji do danych empirycznych Nr i Zatrudnienie x, Przychody y t 9t y ,~ 9i ( y , - y , ) 2 y t - y ( j i - y ) 2 1 15 2,3 3,73 -1,43 2,05 -4,45 19,80 2 21 4,6 4,38 0,22 0,05 -2,15 4,62 3 52 6,6 7,73 -1,13 1,27 -0,15 0,02 4 31 7,2 5,46 1,74 3,03 0,45 0,20 5 46 7,9 7,08 0,82 0,67 1,15 1,32 6 23 4,5 4,60 -0,10 0,01 -2,25 5,06 7 61 8,8 8,70 0,10 0,01 2,05 4,20 8 55 8,2 8,05 0,15 0,02 1,45 2,10 9 73 9,6 10,00 -0,40 0,16 2,85 8,12 10 54 7,8 7,94 -0,14 0,02 1,05 1,10 Razem 431 67,5 67,66 X 7,29 X 46,57 Źródło: dane umowne.
W pierwszej kolejności obliczamy w artości teo re ty czn e j,, podstaw iając do funk cji regresji liniowej kolejne w a rto ścije,-. N a przykład d lax , = 15 mamy:
y, = 2,111 + 0 ,1 0 8 -1 5 = 3,73.
W artości poszczególnych m iar zgodnie z podanym i w zoram i i wynikam i obliczeń podanym i w tablicy 4.9 uzyskujem y jako:
• wariancje składnika resztow ego 7 79
,sr2 = — ---- = 0,911 [min zł2]. £ 1 0 - 2
W artość tę pozostaw iam y bez interpretacji. • odchylenie standardow e składnika resztowego
Ss = \ K > ? 2 = ^ TT = ° ’954 [mln Zł]'
Rzeczywiste przychody placów ek banku różnią się od w artości teoretycznych obliczonych na podstawie rów nania regresji średnio o 954 tysiące złotych. Sza
cując przychody placów ek banku na podstaw ie funkcji regresji, musimy liczyć się ze średnim błędem oszacowania równym 0,954 m iliona złotych.
• współczynnik zm ienności przypadkow ej (resztow ej) 0 954
Ve = - --- 100% = 14,1%.
6,75
Przyjmijmy w artość progow ą na poziom ie VŻ 30%.
O dchylenie standardow e składnika resztow ego stanow i 14,1% przeciętnego przychodu oddziału banku, co świadczy o tym, że uzyskaną funkcję regresji m ożem y uznać za dobrze opisującą badany związek z punktu w idzenia przy ję te g o kryterium .
• w spółczynnik braku determ inacji
2 7-29 n , ^ a r = ---= 0,156,
46.57 cp: -100% = 15,6%.
Z m ien ność przychodów oddziałów banku w 15,6% jest niewyjaśniona przez zm ienność wielkości zatrudnienia.
• współczynnik determ inacji
R 2 = 1 -0 ,1 5 6 = 0,844,
R 2 -100% = 84,4%.
Z m ien ność przychodów oddziałów banku jest wyjaśniona w 84,4% zm iennością zatrud nienia.
N a podstaw ie uzyskanych w artości m iar m ożem y uznać dopasow anie funkcji re gresji do danych em pirycznych za zadowalające.