• Nie Znaleziono Wyników

Analiza regresji

W dokumencie Podstawy statystyki (Stron 101-107)

A n a liz a re g re sji polega na badaniu związku m iędzy zm iennym i wyrażonymi za pom ocą funkcji o określonej postaci analitycznej. Z ajm iem y się związkiem między dw iem a zm iennym i, który m ożna przedstaw ić za pom ocą funkcji liniowej. W tym celu musimy ściśle określić z m ie n n ą o b ja śn ia n ą (Y) o raz z m ie n n ą o b jaśn iając ą (X ). R ozróżnienie to nie było konieczne w przypadku analizy korelacji. M ożemy również rozważać nieliniow e pow iązania. Tym problem em nie będziem y się jed n ak tutaj zaj­ mować.

Liniowy związek m iędzy zm iennym i przedstaw iam y w postaci:

y = a + bx + e, (4 .1 1 ) gdzie:

a, b - p aram etry funkcji regresji, y - zm ienna objaśniana, x - zm ienna objaśniająca, e - składnik przypadkowy.

M ożemy tutaj wyróżnić dwa składniki:

1) wyrażający związek między zm ienną objaśnianą Y i zm ienną objaśniającą X , przy założeniu, że nie występują inne uw arunkow ania zapisany jako:

y — a + bx, (4 -1 2 )

2) określony m ianem składnika przypadkow ego (e), ujm ujący oddziaływ anie na zm ienną Y wszystkich innych uwarunkow ań.

Podstawowym zadaniem analizy regresji jest znalezienie nieznanych w artości p a ­ ram etrów funkcji regresji39 (a i b). W tym celu m usim y przeprow adzić obserw ację interesujących nas zm iennych w badanej populacji. Jak o przykład rozważymy zwią­ zek między wydatkam i na żywność (Y) oraz dochodam i gospodarstw dom owych (Z).

Uzyskane rezultaty obserwacji przedstaw iono na rysunku 4.10.

dochody [w zł]

Rys. 4.10. Diagram korelacyjny wydatków na żywność względem wysokości dochodów w gospodarstwach domowych

39 Por. też: S. Ostasiewicz, Z. Rusnak, U. Siedlecka,op. cit., Wroclaw 1999; M. Woźniak (red.),

Z aobserw ow ane w artości zm iennych A' oraz Y oznaczymy jako (xny ) . K ażdem u go­ spodarstw u dom ow em u przypisujem y zatem zaobserw ow aną wysokość wydatków na żywność (y.) oraz uzyskany dochód (x), gdzie i = 1, 2 , n. Symbol n oznacza liczeb­ ność populacji.

U kład punktów sugeruje, że badany związek m oże być opisany za pom ocą funk­ cji o postaci liniowej. W związku z tym należy zastanow ić się, w jaki sposób do danych em pirycznych dopasow ać odpow iednią funkcję, której odpow iada prosta na rysunku

Je d n ą z najczęściej stosowanych w tym celu p ro ced u r jest m e to d a n ajm n iejszy ch k w a d ra tó w . Polega o n a na wyznaczeniu takich w artości a i b, aby funkcja:

O k reślenie m inim um funkcji oznacza poszukiw anie ekstrem um funkcji polega­ jące w naszym przypadku na ustaleniu miejsc zerowych pierwszych pochodnych cząst­ kowych odpow iednio ze względu na a oraz na b. O trzym ujem y zatem :

W wyniku odpow iednich przekształceń otrzym ujem y u k ła d ró w n a ń n o rm aln y c h o postaci:

U kład rów nań m ożem y rozwiązać, stosując wzory C ram era. U stalam y w tym celu w artość następujących wyznaczników:

4.10. V = Z (v , - y ,) 2 = Z[(v, - 0 + bx,)j2 = m in. n n (4 .1 3 ) 1=1 8\1/ n n — = -2*Z v* - n c i - b Y x i = 0 da ,=f /=! n n Z.VV = <7-« + i-Z.Yi 77 77 71 (4 .1 4 ) Z.xi -y i = a-I.X i + b -'Z x r 1=1 f=l 7— 1

n n T y i Z x , Z x, ■ V, 1=1 1=1 (4 .1 7 ) (4 .1 8 ) (4 .1 9 )

W artość p aram etru a m ożem y zinterpretow ać jako oszacow anie w artości zm ien­ nej Y przy założeniu, że zm ienna o b ja śn ia ją c a ^ p rz y jm ie w artość rów ną zeru. W tym miejscu należy zwrócić uwagę na to, że p a ra m e tr ten nie zawsze m usi m ieć in te rp re ­ tację. Z sytuacją taką m ożem y m ieć do czynienia, gdy na przykład badam y związek między wysokością wydatków gospodarstw domowych i liczbą osób w rodzinie. Nie istnieje bowiem gospodarstw o, jeśli b rak w nim jakiejkolw iek osoby.

P aram etr b funkcji regresji nazywamy w sp ó łc z y n n ik ie m reg resji. Przyjm uje on wartości z przedziału ( - » ; +oo). Z n ak współczynnika regresji wskazuje n a kierun ek związku między zmiennymi. Jeśli b e ( - oo; 0), to oznacza to, że jeśli w artość zm iennej objaśniającej X wzrośnie o jednostk ę, to w artość zm iennej objaśnianej zm niejszy się średnio o b jednostek. Jeśli n atom iast (0; +oo), to jeśli w artość zm iennej objaśniającej

X wzrośnie o jednostkę, to w artość zm iennej objaśnianej zwiększy się śred nio o b

jednostek. Jeżeli b e - 0, to znaczy, że między zm iennym iX i Y związek nie w ystępu­ je, bowiem zm ienna Y nie reaguje na zm iany zm iennej X .

P rz y k ła d 4.6

D e p artam en t K adr otrzym ał od Z arząd u B anku polecenie zbadan ia związku między generowanym i przychodam i a wielkością zatru d n ien ia w placów kach d e ta ­ licznych banku.

D o k o n a n o losowego w yboru 10 oddziałów , otrzy m u jąc d an e p rz ed staw io n e w tablicy 4.9. Należy zbadać związek m iędzy tymi zm iennym i, wykorzystując m eto d ę analizy regresji. W tym przypadku zm ienną objaśnianą (Y) są przychody banków , a zm ienną objaśniająca (X) wielkość zatrudnienia.

W pierwszej kolejności sporządzam y diagram korelacyjny (rysunek 4.11). Z układu punktów m ożem y odczytać, że związek m iędzy zm iennym i m a ch a rak ­ ter liniowy, dzięki czem u m ożem y go opisać przez liniową funkcję regresji.

Po wykonaniu niezbędnych obliczeń otrzym ujem y następujący u kład rów nań normalnych:

f 67,5=10</ + 43 \b [3274,2 = 43 \a + 21967&

Tablica 4.9. Zatrudnienie i wielkość przychodów w placówkach banku oraz obliczenia pomocnicze L.p. Zatrudnienie x,-Przychody y, Xf x ,y i 1 15 2,3 225 34,5 2 21 4,6 441 96,6 3 52 6,6 2704 343,2 4 31 7,2 961 223,2 5 46 7,9 2116 363,4 6 23 4,5 529 103,5 7 61 8,8 3721 536,8 8 55 8,2 3025 451,0 9 73 9,6 5329 700,8 10 54 7,8 2916 421,2 Razem 431 67,5 21967 3274,2

Źródło: dane umowne.

zatrudnienie [osob.] *>

Rys. 4.11. Diagram korelacyjny przychodów względem zatrudnienia w placówkach banku

U stalam y w artość odpow iednich wyznaczników, posługując się wzoram i (4.15)— (4.17):

M=

10 431 431 219671 \M = 67,5 431 3274,2 219671 = 2 1 9670-185761 = 33909, = 1482773-1411180 == 71592,3, Uzi 10 67,5 431 3274.2 = 3 2 7 4 2 -2 9 0 9 2 ,5 = 3649,5,

a następnie, zgodnie ze w zoram i (4.18) i (4.19), ustalam y w artości param etrów :

W Z J 5 9 J 3 L

\A\ 33909 \A\ 33909 = 0,108.

Funkcja regresji opisująca związek przychodów i zatrudnienia w placówkach banku ma postać:

y = 2,111 + 0,108r.

W ykres tej funkcji um ieszczam y na sporządzonym wcześniej diagram ie k o re la­ cyjnym, który przedstaw iono na rysunku 4.12. N a podstaw ie otrzym anych rezultatów m ożna stwierdzić, że jeśli w placówce banku Z zwiększymy zatrud nienie o je d n ą oso­ bę, to należy oczekiwać, że przychody w zrosną średnio o 0,108 m iliona złotych. W y­ raz wolny „a” pozostaje bez interpretacji.

12 10 8 6 4 2 Ą 0 Ti E, >• T 3 20 40 60 80 zatrudnienie [osob.]

Rys. 4.12. Związek między wysokością przychodów i wielkością zatrudnienia w placówkach detalicznych banku

Po wyznaczeniu rów nania regresji przystępujem y d o oceny dobroci jego d o p aso ­ wania do danych empirycznych. Posługujem y się w tym celu odpow iednim i m iaram i.

4.7. Miary dobroci dopasowania funkcji regresji

W dokumencie Podstawy statystyki (Stron 101-107)