• Nie Znaleziono Wyników

Miary współzależności i dynamiki zjawisk w statystyce opisowej : przykłady i zadania

N/A
N/A
Protected

Academic year: 2022

Share "Miary współzależności i dynamiki zjawisk w statystyce opisowej : przykłady i zadania"

Copied!
105
0
0

Pełen tekst

(1)

Miary współzależności i dynamiki zjawisk

w statystyce opisowej

Przykłady i zadania

Barbara Łapkowska-Baster

WYDAWNICTWO UNIWERSYTETU JAGIELLOŃSKIEGO

(2)

RECENZENT

PROJEKT OKŁADKI

REDAKTOR

KOREKTA

SKŁAD I ŁAMANIE Barbara Kerschner

© Copyright by Barbara Łapkowska-Baster & Wydawnictwo Uniwersytetu Jagiellońskiego Wydanie I, Kraków 2009

All rights reserved

Książka, ani żaden jej fragment, nie może być przedrukowywana bez pisemnej zgody Wydawcy.

W sprawie zezwoleń na przedruk należy zwracać się do Wydawnictwa Uniwersytetu Jagiellońskiego.

ISBN 978-83-233-

www.wuj.pl

Wydawnictwo Uniwersytetu Jagiellońskiego Redakcja: ul. Michałowskiego 9/2, 31-126 Kraków tel. 012-631-18-81, tel./fax 012-631-18-83 Dystrybucja: ul. Wrocławska 53, 30-011 Kraków tel. 012-631-01-97, tel./fax 012-631-01-98 tel. kom. 0506-006-674, e-mail: sprzedaz@wuj.pl

Konto: PEKAO SA, nr 80 1240 4722 1111 0000 4856 3325

(3)

Wprowadzenie ... 7

1. ANALIZA WSPÓŁZALEŻNOŚCI ZJAWISK ... 9

1.1. Istota współzależności ... 9

1.2. Wstępna ocena rodzaju korelacji ... 10

1.3. Współczynnik korelacji liniowej Pearsona ... 12

1.4. Współczynnik korelacji rang Spearmana ... 16

1.5. Liniowa funkcja regresji ... 19

1.6. Miary stopnia dopasowania funkcji regresji do danych empirycznych ... 28

1.7. Tablice korelacyjne ... 32

1.8. Analiza współzależności liniowej trzech cech ... 37

1.8.1. Macierze: obserwacji, kowariancji i korelacji ... 38

1.8.2. Współczynnik korelacji cząstkowej ... 42

1.8.3. Współczynnik korelacji wielorakiej ... 45

1.8.4. Liniowa funkcja regresji wielorakiej ... 48

2. ANALIZA DYNAMIKI ZJAWISK ... 51

2.1. Pojęcia wstępne ... 51

2.2. Metody indeksowe ... 54

2.2.1. Przyrosty absolutne i względne ... 55

2.2.2. Indywidualne indeksy dynamiki ... 58

2.2.3. Średnie tempo zmian zjawiska w czasie ... 61

2.2.4. Przekształcanie indeksów indywidualnych ... 63

2.2.5. Indeksy agregatowe ... 66

2.3. Elementarne metody analiz szeregu czasowego ... 72

2.3.1. Metody wyodrębniania trendu ... 74

2.3.2. Pomiar wahań sezonowych ... 84

2.3.3. Wyodrębnianie wahań przypadkowych ... 88

ZADANIA ... 93

Odpowiedzi do zadań ...103

LITERATURA ...107

(4)
(5)

Po napisaniu przeze mnie podręcznika pt. Miary struktury zbiorowości w statystyce opiso- wej. Przykłady i zadania spotkałam się z licznymi prośbami i zachętą ze strony studentów, aby przedstawić w podobny, przystępny dla nich sposób miary współzależności i dynami- ki zjawisk. Tym samym prezentowana praca oraz poprzednia uzupełniają się wzajemnie i obejmują podstawowe treści programowe ze statystyki opisowej.

Celem tego podręcznika jest dostarczenie pomocnego materiału dydaktycznego dla tych wszystkich studentów, którzy mają trudności w zrozumieniu treści dostępnych podręczni- ków ze statystyki. Publikacja ta jest praktycznym uzupełnieniem wiedzy zawartej w facho- wych tego typu pozycjach. Podręcznik jest przeznaczony dla studentów zarządzania o róż- nych specjalnościach, a także dla kierunków nieekonomicznych. Adresuję go również do tych studentów, którzy samodzielnie (bez uczęszczania na zajęcia) uzupełniają przedmiot statystyki opisowej w ramach tzw. różnic programowych.

Analizę współzależności i dynamiki zjawisk przeprowadzono na elementarnych pod- stawach teoretycznych (pojęcia i wzory) oraz przykładach zadań wraz z rozwiązaniami.

Przykłady te charakteryzują się dużą różnorodnością: oparte zostały na danych umow- nych oraz zaczerpniętych z roczników statystycznych. Techniczna strona obliczania miar w przykładach zadań pozwala studentowi samodzielnie dochodzić do ostatecznych wy- ników i właściwie je interpretować. Znajomość interpretacji miar jest niezbędna w dobie używania programów komputerowych.

Podręcznik składa się z dwóch części. W pierwszej części zaprezentowano podstawy analizy korelacji i regresji. Opisano elementarne miary zależności liniowej dwóch oraz trzech cech ilościowych. W części drugiej przedstawiono metody analizy dynamiki zjawisk za pomocą przyrostów i indeksów (indywidualnych i agregatowych) oraz sposób wyodręb- niania elementów szeregu czasowego ( trendu, wahań sezonowych i przypadkowych).

Każda z zamieszczonych miar i zależności jest opisana co najmniej jednym wzorem, przykładem, a niekiedy niezbędnym wykresem. W publikacji zamieszczono 33 przykła- dy rozwiązywania zadań oraz dołączono na końcu 30 zadań do samodzielnego rozwiąza- nia wraz z odpowiedziami, aby umożliwić studentowi kontrolę poprawności uzyskanych wyników.

Oddając do rąk Czytelników ten podręcznik, żywię nadzieję, że spełni on oczekiwania tych wszystkich, dla których analiza współzależności i dynamiki zjawisk przestanie być trudna.

Serdecznie dziękuję dr. hab. Profesorowi UJ Tomaszowi Tokarskiemu za szczegó- łowe sugestie i wskazówki, które pomogły mi w opracowaniu tej publikacji.

(6)
(7)

1.1. Istota współzależności

Obok badań struktury zjawiska często istnieje potrzeba analizy zbiorowości statystycz- nej z punktu widzenia kilku cech, które pozostają z sobą w pewnym związku. Celem takiej analizy jest wykazanie, czy cechy statystyczne (dwie lub więcej) charakteryzujące badaną zbiorowość są z sobą związane, oraz określenie siły, kierunku i charakteru tego związku.

Badaniem związków między cechami zajmuje się teoria współzależności, która jest częś- cią statystyki opisowej i matematycznej.

W teorii współzależności zjawisk możemy mieć do czynienia z zależnością funkcyjną i stochastyczną. Zależność funkcyjna polega na tym, że zmiana wartości jednej zmiennej powoduje ściśle określoną zmianę drugiej zmiennej. Jeżeli symbolem X oznaczymy zmien- ną niezależną, a symbolem Y zmienną zależną, to w związku funkcyjnym oznacza to, że określonej wartości zmiennej X odpowiada ściśle określona wartość zmiennej Y. Zależ- ność funkcyjna realizuje się tak samo w każdym pojedynczym przypadku i występuje czę- sto w naukach ścisłych, np. matematyce czy fi zyce. Zależność stochastyczna defi niowana jest za pomocą pojęć z zakresu rachunku prawdopodobieństwa. Jest to zależność między dwiema zmiennymi polegająca na tym, że wraz ze zmianą jednej zmiennej zmienia się roz- kład prawdopodobieństwa drugiej zmiennej. Zależność stochastyczna ujawnić się może w masie obserwacji i może nie znaleźć potwierdzenia w pojedynczym przypadku. Wystę- puje ona np. w naukach społecznych. Zależność korelacyjna, zwana również statystycz- ną, jest szczególnym wariantem zależności stochastycznej. Występuje ona wówczas, gdy określonym wartościom jednej zmiennej odpowiadają określone wartości średnie drugiej zmiennej. Można więc ustalić, jak zmieni się średnio wartość zmiennej zależnej Y w zależ- ności od wartości zmiennej niezależnej X. Na przykład nie wszyscy konsumenci, których dochód miesięczny wzrósł o 200 zł, zwiększają swoje wydatki na usługi kulturalne o jedna- kową kwotę. Niektórzy z nich mogą nie zwiększać wydatków na kulturę, inni mogą zwięk- szać te wydatki, a jeszcze inni zmniejszać zakup tych usług. Jednakże średnie wydatki na usługi kulturalne wśród konsumentów, których dochód wzrósł o 200 zł, są zwykle wyższe od wydatków osób, których dochód nie zmienił się, albo zmalał. Gdyby między wielkością dochodów a wydatkami konsumentów na usługi istniał związek funkcyjny, to przy okre- ślonym poziomie dochodów wielkość wydatków na usługi byłaby każdorazowo jednako- wa. W rzeczywistości tak nie jest, ponieważ poziom większości wydatków (w tym na różne usługi) nie jest wyłącznie uzależniony od dochodów konsumentów. Zależy on również od innych czynników, np. cen, upodobań, statusu społecznego czy wieku kupujących. Badanie zależności korelacyjnej jest uzasadnione wtedy, gdy między zmiennymi istnieje logiczny

(8)

związek przyczynowo-skutkowy. Po ustaleniu takiego związku konieczne jest udzielenie odpowiedzi na następujące pytania:

a) Jak duży jest stopień powiązań między zmiennymi?

b) Jaki wpływ wywiera cecha traktowana jako zmienna niezależna na cechę traktowa- ną jako zmienną zależną?

Odpowiedzi na pierwsze pytanie można uzyskać, obliczając współczynnik korelacji, a na drugie, analizując regresję. Oba typy miar uzupełniają się wzajemnie, chociaż odpo- wiadają na różne pytania.

Dalsze rozważania będą dotyczyły analizy współzależności między dwiema cechami ilościowymi danej zbiorowości statystycznej, a następnie zostanie omówiony związek trzech cech ilościowych.

1.2. Wstępna ocena rodzaju korelacji

Aby stwierdzić, czy istnieje związek korelacyjny między dwiema badanymi zmiennymi, najprościej jest zestawić dwa szeregi statystyczne zawierające wartości obu cech dla bada- nej zbiorowości. Wówczas zbiorowość jest badana ze względu na zmienną X i zmienną Y.

Dysponując danymi empirycznymi, staramy się je przedstawić w układzie współrzędnych w tzw. diagramie korelacyjnym (punktowym).

W prostokątnym układzie współrzędnych na osi odciętych zaznaczamy wartości tej ce- chy, którą określamy jako zmienną niezależną, a na osi rzędnych wartości cechy okre- ślonej jako zmienną zależną. Punkty, które odpowiadają poszczególnym wartościom cech z dwóch szeregów, tworzą mniej lub bardziej wyraźny rozrzut, co daje możliwość wstęp- nej oceny kierunku zależności, a także jej siły.

Przykład 1.1

W dziesięciu przedsiębiorstwach branży A uzyskano informacje o wysokości obrotów w mln zł (zmienna X) i poziomie kosztów zmiennych w mln zł (zmienna Y) w ciągu stycz- nia 2009 roku. Należy przedstawić punktowy diagram korelacyjny i wstępnie ocenić kie- runek zależności.

Ta b l i c a 1 Przedsiębiorstwa branży A według obrotów i kosztów zmiennych w mln zł w styczniu 2009 r.

Przedsiębiorstwo A B C D E F G H I J

Obroty (X) 21 23 24 25 26 27 29 30 32 35

Koszty (Y) 10 12 13 15 14 17 19 19 20 24

Źródło: Opracowanie własne

(9)

Rys. 1. Diagram korelacyjny (punktowy) dla przykładu 1.1 Źródło: Tablica 1

Z układu punktów empirycznych na wykresie wynika, że wraz ze wzrostem obrotów zwiększają się koszty zmienne w wybranych przedsiębiorstwach. Mamy tu do czynienia ze związkiem korelacyjnym dodatnim, liniowym. Punkty leżą dość blisko teoretycznej linii prostej i dlatego możemy tu oczekiwać znaczącej korelacji między wielkością obro- tów a kosztami.

Posługując się metodą grafi czną oceny związku między zmiennymi możemy stwier- dzić, czy korelacja jest liniowa czy krzywoliniowa, a jeśli liniowa, to czy o nachyleniu do- datnim, czy też ujemnym. Możliwy jest również brak korelacji między badanymi cechami.

Najczęściej spotykane obrazy współzależności przedstawia rysunek 2.

Rys. 2. Przykłady diagramów korelacyjnych 23

21 19 17 15 13 11

a) korelacja liniowa dodatnia b) korelacja liniowa ujemna y

y y

y

x x

x x

c) brak korelacji d) korelacja krzywoliniowa

(10)

Korelację liniową dodatnią (rys. 2a) poznaliśmy już na przykładzie. Występuje wów- czas, gdy wraz ze wzrostem wartości jednej zmiennej rosną wartości drugiej albo gdy spad- kowi wartości jednej cechy odpowiada spadek wartości drugiej cechy.

Korelacja liniowa ujemna (rys. 2b) ma miejsce wówczas, gdy rosnącym wartościom jednej zmiennej odpowiadają malejące wartości drugiej zmiennej.

Gdy rozrzut punktów jest nieregularny na polu wykresu (rys. 2c) i nie widać wyraź- nej smugi punktów wzdłuż linii prostej lub innej krzywej (np. hiperboli lub paraboli), mó- wimy o braku korelacji. Jeżeli natomiast punkty empiryczne ułożone są wzdłuż krzywej (rys. 2d), świadczy to o korelacji krzywoliniowej.

Niekiedy dla zbyt małej liczby obserwacji na wykresie nie można zauważyć wyraźne- go związku korelacyjnego. Dopiero zwiększenie liczby badanych jednostek statystycznych może pokazać ten związek. Na rysunku 3 pokazano taki przypadek.

Rys. 3. Korelacja liniowa dodatnia uwidoczniona przy wiekszej liczbie obserwacji

Zaznaczony w polu koła rozrzut punktów wskazywał na brak korelacji. Zwiększe- nie liczby obserwacji pokazuje nam jednak, że smuga punktów powyżej koła układa się wzdłuż linii prostej. Dalej przedstawiono miary liniowej zależności korelacyjnej dla cech ilościowych.

1.3. Współczynnik korelacji liniowej Pearsona

Gdy związek badanych dwóch cech ilościowych jest liniowy i cechy te są mierzalne, to najczęściej stosowaną miarą współzależności jest współczynnik korelacji liniowej Pearsona oznaczany przez rxy, który wylicza się według następującego wzoru defi nicyj- nego:

y

x

(11)

, (1.1) gdzie:

cov(X,Y) – kowariancja badanych cech X, Y;

sx – odchylenie standardowe cechy X;

sy – odchylenie standardowe cechy Y.

Kowariancja wskazuje tylko kierunek współzależności i nie można na jej podstawie określić siły związku. Obliczana jest z poniższego wzoru:

cov(X, Y = 1

(xi – x®)(yi – y®), (1.2) n

n

gdzie:

n – liczba obserwacji od i = 1,2... n;

xi – wartości cechy X;

yi – wartości cechy Y;

x®® – średnia arytmetyczna dla cechy X;

y® – średnia arytmetyczna dla cechy Y.

Jeżeli: cov(X,Y) = 0 – brak związku korelacyjnego;

cov(X,Y) < 0 – związek korelacyjny ujemny;

cov(X,Y) > 0 – związek korelacyjny dodatni.

Współczynnik korelacji liniowej Pearsona przyjmuje wartości z przedziału – 1

rxy

1 i jest miarą siły związku liniowego między cechami. Jeżeli rxy = 1, lub rxy = –1 (korelacja doskonała), wówczas mamy do czynienia z zależnością funkcyjną. Na wykresie punk- ty empiryczne leżą dokładnie wzdłuż linii prostej. Im wartość bezwzględna współczynni- ka korelacji jest bliższa jedności, tym zależność korelacyjna między cechami jest silniej- sza. Interpretując konkretną wartość bezwzględną współczynnika rxy przyjmuje się często, że jeżeli wynosi on:

a) od 0 do 0,2, to nie ma związku liniowego między badanymi cechami;

b) od 0,2 do 0,4, to zależność niska, ale wyraźna;

c) od 0,4 do 0,7, to zależność umiarkowana;

d) od 0,7 do 0,9, to zależność znacząca;

e) powyżej 0,9 – zależność bardzo silna.

Przykład 1.2

W badaniach nad zależnością między wielkością produkcji w tys. sztuk (X) a jednostko- wymi kosztami produkcji w euro (Y) w losowo wybranych siedmiu fi rmach branży S uzy- skano wyniki przedstawione w tablicy 2.

rxy = cov (X, Y) sxsy

i=1

(12)

Ta b l i c a 2 Firmy branży S według wielkości produkcji i kosztów jednostkowych

Firma 1 2 3 4 5 6 7

Wielkość produkcji w tys. szt. 23 30 41 45 50 51 54

Koszt jednostkowy w euro 50 38 34 30 28 24 20

Źródło: Opracowanie własne

Na podstawie danych sporządzić diagram korelacyjny, a następnie za pomocą współ- czynnika korelacji ustalić kierunek i siłę współzależności między badanymi cechami.

Na wstępie sporządzamy diagram punktowy, który przedstawia rysunek 4.

Rys. 4. Diagram korelacyjny (punktowy) dla przykładu 1.2 Źródło: Tablica 2

Rozrzut punktów empirycznych na rysunku 4 wskazuje, że wraz ze wzrostem wielko- ści produkcji maleje koszt jednostkowy. Wyraźnie widać, że występuje tu ujemna korelacja liniowa. Można więc zastosować wzór (1.2). Obliczenia pomocnicze dla współczynnika korelacji przedstawiono w tablicy 3.

50

40

30

20

10

0 10 20 30 40 50

koszt jednostkoy w euro

wielkość produkcji

(13)

Ta b l i c a 3 Obliczenia pomocnicze dla przykładu 1.2

Lp. xi yi xi – x ¯ yi – y ¯ (xi – x ¯)) (yi – y ¯) (xi – x ¯)) 2 (yi – y ¯)2 1

2 3 4 5 6 7

23 30 41 45 50 51 54

50 38 34 30 28 24 20

–19 –12 –1 3 8 9 12

18 6 2 –2 –4 –8 –12

–342 –72

–2 –6 –32 –72 –144

361 144 1 9 64 81 144

324 36 4 4 16 64 144

X 294 224 0 0 –670 804 592

Źródło: Tablica 2 i obliczenia własne

Dla wyliczenia rxy, kolejno obliczamy: średnie arytmetyczne dla obu cech: x ¯ , y ¯ , cov(X,Y), wariancje i odchylenia standardowe.

x ¯ = 296

= 42 tys. sztuk, 7

y ¯ = 224

= 32 euro, 7

cov(X, Y) = 1 (– 670) ≈ – 95,71, 7

sx 2 = 1 (– 804) ≈ 114,86, 7

sx = 114,86 ≈ 10,72 tys. sztuk, sy 2 = 71 (– 592) ≈ 84,57,

sy = 84,57 ≈ 9,20 euro.

(14)

Współczynnik korelacji przedstawia się następująco:

rxy = – 95,71

≈ – 0,97.

10,72 · 9,20

Tak wysoka wartość współczynnika wskazuje na bardzo silną korelację ujemną. W ba- danej zbiorowości wzrost wielkości produkcji powoduje spadek kosztów jednostkowych.

Przekształcając wzór defi nicyjny (1.2), można otrzymać następującą formułę pozwala- jącą obliczyć współczynnik korelacji liniowej:

(1.3)

Wprowadzając wyniki obliczeń pomocniczych z tablicy 3 obliczamy ponownie współ- czynnik korelacji dla przykładu 1.2:

rxy = –670 = –670 = –670 ≈ – 0,97.

804 · 592 475968 689,90

Wartość obliczonego współczynnika korelacji ze wzoru (1.3) jest więc taka sama jak ze wzoru (1.2)

1.4. Współczynnik korelacji rang Spearmana

W przypadku gdy mamy ustalić występowanie lub brak współzależności między dwiema cechami (ilościowymi lub jakościowymi) w mniejszej liczbie obserwacji lub poszczegól- ne wartości obu cech ilościowych danej zbiorowości są kilkucyfrowe, możemy zastosować współczynnik korelacji rang Spearmana, który jest dość prosty do obliczenia. Oblicza- my go według wzoru:

rs = 1 – 6 d2

, (1.4)

i

n(n2 –1)

gdzie:

di – różnice między rangami odpowiadających sobie wartości cechy X i cechy Y;

n – liczba obserwacji.

(15)

Rangami są numery porządkowe nadane wartościom cechy X = xi (i = 1, 2…, n), oraz cechy Y = yi (i = 1, 2…, n) w kolejności od największej do najmniejszej (lub odwrotnie).

Sposób rangowania musi być taki sam dla obydwu zmiennych. Dla różnic między ranga- mi spełniona jest zależność:

di = (x1 – y1) = 0. (1.5)

Natomiast suma rang zmiennej yi musi się równać sumie rang zmiennej xi. Współczyn- nik korelacji rang przyjmuje wartości z przedziału – 1 ≤ rs ≤ 1 .

Przykład 1.3

W tablicy 4 przedstawiono dziewięć krajów europejskich o powierzchni powyżej 300 tys. km2 (X) i odpowiadającej tym krajom liczbie ludności w tys. osób (Y). Za pomocą współczynnika korelacji rang należy zbadać, czy istnieje zależność między liczbą ludno- ści, a powierzchnią tych krajów.

Ta b l i c a 4 Wybrane kraje Europy według powierzchni i ludności w 2005 r. oraz obliczenia pomocnicze

Kraje X Y Ranga X Ranga Y di d2

Finlandia Francja Hiszpania Niemcy Norwegia Polska Szwecja Ukraina Włochy

338,1 544,0 506,0 357,0 385,2 312,7 450,3 603,6 301,3

5244 60733 44079 82443 4617 38161 9024 47075 57989

7 2 3 6 5 8 4 1 9

8 2 5 1 9 6 7 4 3

–1 0 –2 5 –4 2 –3 –3 6

1 0 4 25 16 4 9 9 36

X X X 45 45 0 104

Źródło: Mały Rocznik Statystyczny Polski 2007, GUS, s. 527,528 oraz obliczenia własne

Najpierw porządkujemy kraje według malejących wartości cechy X (tzn. powierzchni krajów w tys. km2), a potem nadajemy rangi dla cechy Y (tj. liczby ludności w tys. osób).

I tak na przykład Ukraina o największej powierzchni (X) zajmuje pierwsze miejsce (ran- ga 1), a ze względu na liczbę ludności (Y) zajmuje czwarte miejsce (ma rangę 4). Różni- ca rang (di) w tym przypadku wynosi: 1 – 4 = –3. Podstawiając do wzoru (1.4), obliczamy współczynnik korelacji rang:

i

(16)

rs = 1– 6 · 104

= 1 – 624

= 1– 0,87 ≈ 0,13.

9 ·(92–1) 9 · 80

Otrzymany wynik wskazuje, że w badanej zbiorowości dziewięciu krajów europejskich brak współzależności między powierzchnią i liczbą ludności.

Przykład 1.4

W grudniu 2008 roku zbadano opinie krajowych i zagranicznych odbiorców na temat ja- kości wyrobów produkowanych przez dziesięć fi rm branży T. Wyniki opinii ujęto w punk- tach przyznanych przez badanych odbiorców. Należy ustalić siłę współzależności między opiniami odbiorców krajowych i zagranicznych za pomocą współczynnika korelacji rang.

Ta b l i c a 5 Firmy branży T według liczby punktów przyznanych przez odbiorców krajowych i zagranicznych

w grudniu 2008 r.

Firmy A B C D E F G H I J

Punkty uzyskane

od odb. krajowych (X) 40 26 34 32 24 46 37 52 42 34

Punkty uzyskane

od odb. zagranicznych (Y) 31 20 29 28 30 38 40 51 46 35

Źródło: Opracowanie własne

W tablicy 6 przedstawiono ranking fi rm, nadając odpowiednie rangi. W przypadku fi rm C i J wystąpiły jednakowe liczby punktów przyznanych przez odbiorców krajowych.

Wówczas przyporządkowujemy im średnią arytmetyczną z ich kolejnych rang i wynosi ona w przykładzie 6,5. W tej sytuacji kolejna ranga wyniesie 8.

Ta b l i c a 6 Obliczenia pomocnicze dla przykładu 1.4

Firmy Ranga X Ranga Y di d2i

A B C D E F G H I J

4 9 6,5 8 10 2 5 1 3 6,5

6 10 8 9 7 4 3 1 2 5

–2 –1 –1,5 –1 3 –2 2 0 1 1,5

4 1 2,25 1 9 4 4 0 1 2,25

Razem 55 55 0 28,5

Źródło: Obliczenia własne na podstawie tablicy 5

(17)

Podstawiając do wzoru (1.4) otrzymujemy:

rs = 1 – 6 · 28,5

≈ 0,83.

10(102 –1)

Uzyskany wynik wskazuje na znaczącą zbieżność opinii odbiorców krajowych i zagra- nicznych na temat jakości wyrobów w badanych fi rmach branży T.

1.5. Liniowa funkcja regresji

Współczynnik korelacji mierzy siłę i kierunek zależności między badanymi zmiennymi.

Analiza regresji oznacza badanie wpływu jednej zmiennej (niezależnej) na drugą zmien- ną (zależną) i pozostaje w ścisłym związku z analizą korelacji. Formalnym zapisem tego wpływu jest funkcja regresji. Funkcja regresji jest ilościowym wyrazem zależności mię- dzy określonymi wartościami zmiennej niezależnej i odpowiadającymi im średnimi wartoś - ciami zmiennej zależnej. Funkcję przedstawiającą wpływ zmiennej X na zmienną Y zapisu- jemy w postaci:

yÑi = f (xi), (1.6) gdzie:

yi – nieznana średnia wartość zmiennej zależnej;

xi – znana wartość zmiennej zależnej.

Natomiast funkcję pokazującą wpływ zmiennej Y na zmienną X przedstawiamy:

x Ñi = f (yi). (1.7) Analiza obu funkcji regresji jest uzasadniona wówczas, gdy między cechami występu- je związek dwustronny. Na przykład możemy zbadać wpływ wielkości zatrudnienia (X) na wielkość produkcji (Y). Ale jednocześnie możemy określić ilościowo, jak zmiana wielko- ści produkcji (Y) wpływa na wielkość zatrudnienia (X). W obu przypadkach zakładamy, że technika wytwarzania jest taka sama. Jedną funkcję regresji szacuje się wtedy, gdy związek ma wyraźnie charakter przyczynowo-skutkowy, np. wpływ liczby zarejestrowanych samo- chodów na liczbę wypadków drogowych.

Funkcja regresji jest funkcją matematyczną, która jest przybliżeniem faktycznej zależ- ności między zmiennymi. Zaobserwowane wartości zmiennej zależnej będą się odchylały od funkcji pod wpływem innych zmiennych, nieuwzględnionych w badaniu oraz na skutek działania czynników przypadkowych. Konkretną postać funkcji ustalamy na podstawie za- obserwowanych wartości zmiennej Xoraz Y. Możemy mieć do czynienia z funkcją liniową lub krzywoliniową. Nasze rozważania dotyczą liniowej funkcji regresji. Jeżeli na pod- stawie danych empirycznych przedstawimy diagram korelacyjny i smuga punktów układa

(18)

się wzdłuż linii prostej, to dopasowujemy do niej funkcję regresji Y względem X mającą postać:

yÑi = a + bxi, (1.8) gdzie:

yÑi – teoretyczne wartości zmiennej Y wyznaczone z liniowej funkcji regresji;

xi – empiryczne wartości zmiennej X;

a, b – parametry funkcji regresji, przy czym a jest wyrazem wolnym, natomiast b jest nachyleniem linii regresji.

Współczynnik regresji b odpowiada na pytanie, o ile średnio zmieni się zmienna za- leżna (tutaj ) yÑi, jeśli zmienna niezależna (tutaj xi) wzrośnie o jednostkę. W interpretacji geometrycznej parametr a oznacza rzędną punktu przecięcia się linii regresji z osią y, a pa- rametr b jest tangensem kąta β, który tworzy linia regresji z osią x (zob. rys. 5).

Rys. 5. Interpretacja geometryczna parametrów: a, b w liniowej funkcji regresji

Na rysunku 5 rozsiane punkty zaznaczono na podstawie danych empirycznych yii xi. Li- nia yÑi = a + bxi regresji została natomiast wykreślona na podstawie danych teoretycznych yÑi oraz danych empirycznych xi. Linię regresji dopasowujemy do rozsianych punktów, wy- korzystując tu metodę najmniejszych kwadratów: MNK (nie jest to jedyna metoda). Polega ona na takim oszacowaniu parametrów: a oraz b, aby spełniony był następujący warunek dla funkcji W:

W = (yi – yÑi)2 = (yi – a – bxi) = minimum, (1.9) gdzie:

yi – wartości empiryczne zmiennej Y;

yÑi – wartości teoretyczne wyznaczone na podstawie równania yÑi = a + bxi. y, yÑi

Linia regresji = yÑi = a + bxi

tgβ = współczynnik regresji β

xi

(19)

Oznacza to, że MNK pozwala tak dopasować funkcje regresji do danych empirycznych, aby suma kwadratów odchyleń poszczególnych wartości empirycznych yi od wartości teo- retycznych y^i osiągnęła minimum.

Aby znaleźć minimum funkcji W, należy obliczyć pochodne cząstkowe funkcji W ze względu na a oraz b i przyrównać je do zera. Ostatecznie po przekształceniach otrzymuje- my tzw. układ równań normalnych. W układzie tym zmienną zależną jest Y:

yi = na + b xi

xi yi = a xi + b x2i.

(1.10) Z układu równań normalnych obliczamy parametry: a oraz b dowolnym sposobem (np. metodą wyznaczników lub przeciwnych współczynników), lub za pomocą konkret- nych wzorów, które zostaną przedstawione w dalszej części rozważań.

Tok postępowania przy rozwiązywaniu równań normalnych przedstawiony jest w po- niższym przykładzie.

Przykład 1.5

Staż pracy w latach (X) i wydajność pracy szt./h (Y) dla pięciu wylosowanych pracow- ników fi rmy „Termo” przedstawia poniższe zestawienie:

xi 3 4 5 6 7

yi 3 4 3 5 5

a) Sporządzić diagram korelacyjny.

b) Wykorzystując dane z przykładu, oszacuj liniową funkcję regresji wydajności pracy względem stażu pracy na podstawie układu równań normalnych. Zinterpretuj współczyn- nik regresji.

c) Jakiej wydajności pracy można się spodziewać dla stażu pracy wynoszącego 8 lat.

d) Wylicz teoretyczne wartości yÑi i przedstaw na jednym wykresie linię regresji oraz dia- gram korelacyjny.

Ad a. Diagram korelacyjny przedstawiono na rysunku 6. Na podstawie rozrzutu punk- tów wzdłuż linii prostej możemy wykorzystać liniową funkcję regresji.

⎪⎪

⎪⎪⎨

=

= n i

n i

1

1

= n

i 1

= n

i 1

= n i 1

(20)

Rys. 6. Diagram korelacyjny dla przykładu 1.5

Ad b. Aby obliczyć parametry: a oraz b dla liniowej funkcji regresji yÑi = a + bxi z ukła- du równań normalnych dokonano obliczeń przedstawionych w tablicy 7.

Ta b l i c a 7 Obliczenia pomocnicze dla obliczenia funkcji yÑi = a + bxi z układu równań normalnych.

Lp. xi yi xi yi yÑi

1 2 3 4 5

3 4 5 6 7

3 4 3 5 5

9 16 15 30 35

9 16 25 36 49

3,0 3,5 4,0 4,5 5,0

Razem 25 20 105 135 20

Źródło: Obliczenia własne

Podstawiając wyniki obliczeń do układu równań normalnych (1.10), gdzie Y jest zmien- ną zależną, a X zmienną niezależną, otrzymujemy:

20 = 5a + 25b 105 = 25a + 135b.

Mnożąc pierwsze równanie przez –5, układ przyjmuje postać:

–100 = – 25a – 125b 105 = 25a + 135b, czyli:

5 = 10b, a stąd:

b = 0,5.

5 4 3 2 1

0 1 2 3 4 5 6 7 xi

2

xi

⎩⎨

⎩⎨

yi

(21)

Podstawiając wartość b do pierwszego równania, obliczamy parametr a:

20 = 5a + 25(0,5), a = 1,5.

Możemy więc przedstawić funkcję regresji wydajności pracy (Y) względem stażu pra- cy (X), która ma postać:

yÑi = 1,5 + 0,5xi.

Współczynnik regresji b równy 0,5 interpretuje się w ten sposób, że wzrostowi stażu pracy o 1 rok odpowiada wzrost wydajności pracy średnio o 0,5 szt./h.

Ad c. W związku z powyższym obliczamy spodziewaną wydajność pracy dla robotni- ka ze stażem pracy 8 lat:

yÑ(8) = 1,5 + 0,5 · 8 = 5,5.

Pracownik z ośmioletnim stażem pracy powinien osiągnąć wydajność 5,5 szt./h.

Ad d. Kolejnym krokiem jest wyliczenie wartości teoretycznych yÑi (patrz tab. 7). I tak dla pierwszego robotnika, który pracuje 3 lata, yÑ(3) = 1,5 + 0,5 · 3 = 3, dla drugiego o stażu 4 lata yÑ(4) = 1,5 + 0,5 · 4 = 3,5 itd. Jeżeli prawidłowo i dokładnie oszacowano parametry funkcji regresji, to zachodzi równość:

yi = yÑi . (1.11)

W tablicy 7 podsumowano obie kolumny yi oraz yÑi, których sumy są takie same. Rysu- nek 7 przedstawia linię regresji i diagram korelacyjny.

Rys. 7. Linia regresji i diagram korelacyjny dla przykładu 1.5

= n

i 1

= n i 1

yÑi = 1,5 + 0,5xi yi

(22)

Jeżeli cechę X przyjmiemy jako zmienną zależną (objaśnianą) a cechę Y jako zmien- ną niezależną (objaśniającą), to dla funkcji xÑi = a′ + b′ yi układ równań normalnych ma po- stać:

xi = na′ + b′ xi

xiyi = a′ yi +b′ y2i . (1.12) Znając współczynniki regresji z równań: yÑi = a + bxi oraz xÑ i = a′ + b′yi, możemy obli- czyć współczynnik korelacji liniowej Pearsona rxy na podstawie poniższego wzoru:

rxy = b · b′ . (1.13) gdzie:

b – współczynnik regresji dla równania yÑi = a + bxi; b′ – współczynnik regresji dla równania xÑ i = a′ + b′yi.

Współczynniki regresji b i b′mają zawsze te same znaki, a współczynnik korelacji ze wzoru (1.13) przyjmuje taki sam znak jak współczynniki regresji. Obie funkcje regre- sji można przedstawić na jednym wykresie. Są to linie proste przecinające się w punkcie o współrzędnych (yi® xi®), tj. średnich arytmetycznych zmiennych X oraz Y.

Przykład 1.6

Wykorzystując dane z przykładu 1.5:

a) Oszacuj liniową funkcję regresji stażu pracy względem wydajności pracy, stosując układ równań normalnych. Zinterpretuj współczynnik regresji.

b) Oblicz wartości teoretyczne cechy xÑ i .

c) Wylicz i oceń współczynnik korelacji liniowej ze wzoru (1.13).

d) Przedstaw na jednym wykresie obie linie regresji dla funkcji: yÑi = a + bxi oraz dla xÑ i = a′ + b′yi.

Ta b l i c a 8 Obliczenia pomocnicze dla funkcji xÑ i = a′ + b′yi wyliczonej na podstawie o układ równań normalnych

Lp. xi yi xi yi y2i xÑ i

1 2 3 4 5

3 4 5 6 7

3 4 3 5 5

12 16 15 30 35

9 16

9 25 25

3,75 5,00 3,75 6,25 6,25

Razem 25 20 105 84 25

Źródło: Obliczenia własne na podstawie tablicy 7

= n

i 1

= n

i 1

= n

i 1

= n

i 1

= n i 1

(23)

Ad a. Podstawiając wyniki obliczeń dla układu równań normalnych (1.12), gdzie cecha X jest zmienną zależną, otrzymujemy:

25 = 5a′ + 20b′

105 = 20a′ + 84b′.

Mnożąc pierwsze równanie przez -4, uzyskujemy:

100 = 20a′ – 80b′

105 = 20a′ + 84b′.

a więc:

5 = 4b′, b′ = 5 = 1,25.

4 Wyliczając a′ otrzymujemy:

25 = 5a′ – 20(1,25), 25 = 5a′ + 25,

5a′ = 0, a′ = 0.

Funkcja regresji stażu pracy względem wydajności pracy ma postać:

xÑ i = 1,25yi.

W badanej zbiorowości pracowników wzrost wydajności pracy o 1 szt./h wymaga wzro- stu stażu pracy średnio o 1,25 roku (czyli 1 rok i 3 miesiące).

Ad b. Wartości teoretyczne x Ñi obliczono w tablicy 8, a także porównano sumy wartości xÑ i oraz wartości xi. Sumy są takie same i wynoszą 25.

Ad c. Obliczając współczynnik korelacji rxy ze wzoru (1.13), podstawiamy dwa wyli- czone współczynniki regresji b = 0,5, oraz b′ = 1,25.

rxy = 0,5 · 1,25 ≈ 0,80.

Oba współczynniki regresji miały wartość dodatnią, a więc możemy stwierdzić, że za- leżność między stażem pracy a wydajnością pracy jest dodatnia i znacząca.

⎪⎩

⎪⎨

⎪⎩

⎪⎨

(24)

Ad d.

Rys. 8. Położenie teoretycznych linii regresji dla przykładów 1.5 i 1.6

Na rysunku 8 linie regresji przecinają się w punkcie K. Jest to punkt o współrzędnych (5,4), ponieważ średnia arytmetyczna dla zmiennej X wynosi 5, a dla zmiennej Y równa się 4. Im bliżej względem siebie położone są obie linie regresji (tj. im mniejszy kąt jest między nimi), tym silniejsza jest zależność korelacyjna i tym wyższa wartość współczynnika kore- lacji rxy. Jeżeli obie linie regresji pokrywałyby się, to możemy mieć do czynienia z korela- cją doskonałą, a rxy = 1, lub rxy = –1. Natomiast gdyby obie linie regresji przecinały się pod kątem prostym, to oznacza, że brak jest związku korelacyjnego między badanymi zmien- nymi (rxy = 0, ale dla korelacji liniowej).

Wartości parametrów liniowej funkcji regresji dopasowanej metodą najmniejszych kwadratów można obliczyć z pominięciem rozwiązywania układu równań normalnych.

I tak jeśli rozpatrujemy funkcję yÑi = a + bxi, to parametr b (współczynnik regresji) wyli- czamy według następującego wzoru:

b = rxy Sy

, (1.14)

Sx gdzie:

rxy – współczynnik korelacji liniowej;

sx – odchylenie standardowe dla zmiennej X;

sy – odchylenie standardowe dla zmiennej Y.

Natomiast parametr a obliczamy:

a = yi ®– b xi ®, (1.15) gdzie:

yii ®® średnia arytmetyczna dla zmiennej Y;

xi ® – średnia arytmetyczna dla zmiennej X;

b – obliczony współczynnik regresji ze wzoru (1.14).

5 4 3 2 1

00 1 2 3 4 5 6 7

yÑ i = 1,5 + 0,5xi

xÑ i = 1,2yi y i

xi

(25)

Jeżeli rozpatrujemy funkcję x Ñi = a′ + b′, opisującą zależność cechy X od cechy Y, to analogicznie wzory będą wyglądały następująco:

b′ = rxy Sx

, (1.16)

Sy oraz:

a′ = xi ®– b′yi ®. (1.17) W kolejnym przykładzie wykorzystano wyżej przedstawione wzory. W przykładzie tym będziemy analizowali związek dwustronny, tj. jak długość stażu pracy wpływa na wyso- kość wynagrodzenia, a z drugiej strony jak poziom wynagrodzenia oddziałuje na długość stażu pracy, a tym samym na stabilność zatrudnienia.

Przykład 1.7

W fi rmie usługowej „Prawnik” dyrektor analizował związek między długością sta- żu pracy w latach (X), a wysokością płacy brutto (Y) wśród zatrudnionych pracowników.

Otrzymał następujące informacje:

– średnia płaca brutto wynosiła 4 tys. zł miesięcznie, a odchylenie standardowe 1,08 tys zł.,

– średni staż pracy wynosił 5 lat, a odchylenie standardowe 1,29 lat,

– współczynnik korelacji liniowej między stażem pracy a poziomem płacy brutto wy- nosił 0,90.

a) Obliczyć liniową funkcję regresji płacy brutto względem stażu pracy. Zinterpretować współczynnik regresji i oszacować poziom płacy, gdy staż wynosi 8 lat.

b) Obliczyć liniową funkcję regresji stażu pracy względem płacy brutto. Zinterpretować współczynnik regresji i oszacować długość stażu pracy, gdy płaca brutto wynosi 7 tys. zł.

Ad a. Obliczamy parametry: b oraz a dla funkcji o postaci yÑi = a + bxi:

b = 0,90 1,08

≈ 0,75, 1,29

a = 4 – 0,75 · 5 ≈ 0,25, czyli:

yÑi = 0,25 + 0,75xi.

Współczynnik regresji b wynoszący 0,75 oznacza, że wzrost stażu pracy o 1 rok powo- duje średnio wzrost płacy brutto 0,75 tys. zł, czyli 750 złotych. Dla stażu pracy 8 lat moż- na oczekiwać płacy w wysokości 6,25 tys. zł, gdyż:

yÑ8 = 0,25 + 0,75 · 8 = 6,25.

(26)

Ad b. Badając wpływ wysokości płacy na długość stażu pracy, obliczamy parametry:

b′ oraz a′ dla funkcji o postaci: a′ + b′ yi. b′ = 0,90 1,29

≈ 1,08 1,08 oraz:

a′ = 5 – 1,08 · 4 ≈ 0,68, czyli:

x Ñi = 0,68 + 1,08 yi.

Współczynnik regresji b′ wynoszący 1,08 oznacza, że wzrost płacy brutto o 1 tys. zł wy- maga średnio wzrostu stażu pracy o 1,08 roku. Aby otrzymać płacę brutto wynoszącą 7 tys.

zł należałoby mieć staż pracy o długości 8,24 lat.

x Ñ7 = 0,68 + 1,08 · 7 = 8,24.

Dla sprawdzenia, czy współczynniki regresji zostały prawidłowo obliczone, ponownie obliczamy współczynnik korelacji liniowej ze wzoru (1.13):

rxy = 0,75 · 1,08 = 0,9.

Mamy tu do czynienia ze znaczącą korelacją dodatnią między stażem pracy a pozio- mem płacy brutto. Współczynnik rxy = 0,9 jest taki sam, jak podano w treści zadania.

1.6. Miary stopnia dopasowania funkcji regresji do danych empirycznych

Oceniając stopień dopasowania oszacowanej funkcji regresji do danych empirycznych wy- korzystujemy:

– odchylenie standardowe składnika resztowego;

– współczynnik zbieżności;

– współczynnik determinacji.

Różnice między wartościami empirycznymi a teoretycznymi (wynikającymi z oszaco- wanej funkcji regresji) nazywane są resztami εi. Dla regresji Y względem X reszty przed- stawione są wzorem:

εi = yi – yÑi. (1.18) Funkcja regresji jest poprawnie oszacowana, jeśli wartości reszt są niewielkie i mają charakter losowy (przypadkowy). Najpierw obliczamy wariancję resztową ε2i , a potem od- chylenie standardowe składnika resztowego . Wzory przedstawiają się następująco:

(27)

gdzie:

ε2i – wariancja resztowa;

yi – wartości empiryczne zmiennej zależnej Y;

yÑi – wartości teoretyczne wyznaczone z funkcji regresji yÑi = a + bxi; n – liczba obserwacji,

k – liczba szacowanych parametrów funkcji regresji (dla regresji liniowej = 2);

sε = s2ε. (1.20) Pierwiastek kwadratowy z wariancji resztowej nazywa się odchyleniem standardowym składnika resztowego, lub średnim błędem szacunku sε iokreśla, o ile średnio wartości em- piryczne odchylają się od wartości teoretycznych. Jest to miara mianowana.

Współczynnik zbieżności φ2y wyraża się wzorem:

φ2y =

(

yi – yÑi

)

2

,

(1.21)

(

yi – y®

)

2

gdzie:

yi ® – średnia arytmetyczna dla zmiennej Y;

yi yÑi – objaśnione zostały powyżej.

Współczynnik zbieżności φ2y przyjmuje wartości z przedziału (0,1) i im jego wartość jest bliższa 0, tym lepsze dopasowanie funkcji regresji do punktów empirycznych. Inter- pretując wielkości φ2y , posługujemy się procentami. Współczynnik zbieżności φ2y określa, jaki procent zmienności cechy objaśnianej Y nie został wyjaśniony w przyjętej funkcji re- gresji za pomocą cechy objaśniającej X.

Współczynnik determinacji obliczamy według wzoru:

R2y =

(

yÑi – y®

)

2. .

. (1.22)

(yi – y®)2

Współczynnik determinacji R2y możemy również obliczyć prościej, znając wartość współczynnika zbieżności φ2y:

R2y = 1 – φ2y. (1.23)

= n i 1

= n

i 1

= n i 1

(28)

Współczynnik determinacji R2y informuje, jaki procent zmienności cechy objaśnianej Y został wyjaśniony w przyjętej funkcji regresji za pomocą cechy objaśniającej X. Jak łatwo zauważyć, oba współczynniki dopełniają się do 1. Wystarczy zatem obliczyć jeden z nich.

φ2y + R2y = 1. (1.24) Im lepsze dopasowanie funkcji regresji do danych empirycznych, tym większa jest war- tość R2y i mniejsza wartość φ2y.

Należy również pamiętać, że w przypadku zależności liniowej współczynnik determi- nacji jest równy kwadratowi współczynnika korelacji liniowej:

R2y = rxy21. (1.25) Wszystkie powyższe wzory od (1.18) do (1.25) przedstawiono dla regresji cechy Y względem cechy X. Jeśli natomiast mielibyśmy funkcję regresji pokazującą wpływ Y na X, to we wzorach pojawią się wartości: xi, x Ñi , xi.®, a również zmieniają się subskrypty np. φ2y, R2y. Interpretacja miar jest analogiczna jak poprzednio. Gdy obie funkcje są liniowe, współczyn- niki zbieżności φ2y, φ2x są sobie równe. Tym samym takie same są wartości współczynni- ków determinacji R2y i R2x Ocenę dopasowania funkcji regresji rozpatrzono w poniższym przykładzie.

Przykład 1.8

Na podstawie danych z przykładu 1.5 oraz 1.6, gdzie badano związek między stażem pracy w latach i wydajnością pracy w szt./h, należy ocenić dopasowanie funkcji regresji (yÑi = 1,5 + 0,5xi oraz x Ñi = 1,25yi) oraz do danych empirycznych za pomocą odchylenia stan- dardowego składnika resztowego, współczynnika zbieżności i współczynnika determina- cji. Wyniki zinterpretować.

Ta b l i c a 9 Obliczenia pomocnicze dla miar dopasowania funkcji regresji

do danych empirycznych

Lp. xi yi yÑi yi yÑi (yi – yÑ)2 yi y ¯ (yi – y ¯)2 1

2 3 4 5

3 4 5 6 7

3 4 3 5 5

3,0 3,5 4,0 4,5 5,0

0 0,5 –1,0

0,5 0

0 0,25 1,00 0,25 0

–1 0 –1

1 1

1 0 1 1 1

Razem 25 20 20 0 1,5 0 4

Źródło: Tablica 7 oraz obliczenia własne

(29)

Pierwszym krokiem jest obliczenie wariancji resztowej:

s2ε = 1,5 = 1,5 = 0,5, 5 – 2 3 wobec tego odchylenie standardowe sε wynosi:

s2ε = 0,5 ≈ 0,71 szt/h.

Wartości empiryczne cechy yi (wydajność pracy) odchylają się średnio od wartości teo- retycznych yÑi o 0,71 szt./h. Średnia arytmetyczna dla cechy Y wynosi 4 szt./h. Współczyn- nik zbieżności φ2y obliczamy, podstawiając do wzoru (1.21):

φ2y = 1,5

= 0,375.

4

Wobec tego współczynnik determinacji wynosi:

R2y = 1 – 0,375 = 0,625.

Współczynnik determinacji można było również obliczyć, posługując się wzorami:

(1.13) i (1.25). Wiemy, że b = 0,5 oraz b′ = 1,25, a więc:

rxy 2= R2y =

(

0,3 · 1,25

)

2 = 0,625.

Wyrażając obie miary w procentach, można stwierdzić, że 62,5% zmienności wydajno- ści pracy (cecha Y) zostało wyjaśnione w przyjętej funkcji regresji za pomocą stażu pracy (cecha X), a 37,5% zmienności cechy Y nie zostało wyjaśnione w przyjętej funkcji przez cechę X, tzn. jest wynikiem działania czynników nieuwzględnionych w funkcji regresji.

Dla sprawdzenia, czy φ2y = φ2x oraz R2x + R2y obliczamy stopień dopasowania linii regresji o postaci xÑ i = 1,25yi do danych empirycznych.

Ta b l i c a 10 Obliczenia pomocnicze dla miar dopasowania funkcji regresji:

xÑi = 1,25yi do danych empirycznych

Lp. xi yi xÑi xi – xÑi (xi – xÑi)2 xi – x¯ (xi – x¯)2 1

2 3 4 5

3 4 5 6 7

3 4 3 5 5

3,75 5,00 3,75 6,25 6,25

–0,75 –1,00 1,25 –0,25 0,75

0,5625 1,0000 1,5625 0,0625 0,5625

–2 –1 0 1 2

4 1 0 1 4

Razem 25 20 25 0 3,75 0 10

Źródło: tablica 8 oraz obliczenia własne

Cytaty

Powiązane dokumenty

Powyższy układ jest układem równań liniowych Cramera, można go więc rozwiązać za pomocą macierzy odwrotnej lub korzystając ze wzorów Cramera.. wzorów Cramera

W wyniku odpowiedniego przekształcenia współczynnika korelacji Pearsona dla przypadku pary szeregów szczegółowych, o obserwacjach w postaci ciągów liczb naturalnych, uzyskuje

[r]

W pierwszym zmienną objaśniającą jest jedynie zmienna Acetic, w drugim dodatkowo zmienne H2S i Lactic?. Na podstawie załączonego wydruku odpowiedz na

(c) Porównać zmienność osiąganej prędkości maksymalnej ze zmiennością zużycia pa- liwa wiedząc, że zmienność zużycia paliwa mierzona współczynnikiem zmienności V

a) Obliczyć brakujący parametr, jeśli wiadomo, że średnia waga noworodka w próbie wyniosła 116.2 uncji, a średnia średniej liczby wypalanych papierosów wśród matek to

Przez fakt, że jest to miara relatywna, odnosząca przyrost absolutny do wielkości zrealizowanej w roku porównywanym t * pozbawiona jest

Ustalenie harmonogramu spotkań zespołu do spraw promocji i rozwoju szkoły opracowanie planu pracy: analiza podejmowanych działań i planowanie kolejnych. zespół do spraw rozwoju