• Nie Znaleziono Wyników

Analiza współzależności badanych cech

N/A
N/A
Protected

Academic year: 2021

Share "Analiza współzależności badanych cech"

Copied!
1
0
0

Pełen tekst

(1)

Analiza współzależności badanych cech

1. Test chi-kwadrat

Dla sprawdzenia przypuszczenia o współzależności między badanymi cechami wykorzystuje się nieparametryczny test niezależności chi-kwadrat (

2

). Test ten stosowany jest w badaniach, w których przynajmniej jedna z badanych cech ma charakter jakościowy. Przed przystąpieniem do realizacji poszczególnych etapów analizy współzależności dwóch cech niezbędne jest skonstruowanie tablicy dwudzielnej cech: X i Y.

yj

xi

y1 Poziom y Y2

cechy Y

yk

j

x1

n

11

n

12

... n

1k n1..

Poziom y

x2

n

21

n

22

... n

2k n2..

cechy ...

... ... ... ...

...

X ...

... ... ... ...

...

xl

n

l1

n

l2

... n

lk nl..

i n..1 n..2 ... n.k n

Krok 1

0

Przyjęcie hipotez

H

0

: cechy X i Y są niezależne. Hipoteza zerowa H

0

ma miejsce wówczas, gdy mniemamy, że pomiędzy estymatorem i parametrem lub rozkładem teoretycznym i empirycznym nie ma statystycznie istotnej różnicy.

H

1

: cechy X i Y nie są niezależne. Hipoteza alternatywna H

1

dopuszcza istnienie różnic

pomiędzy estymatorami (statystykami) i parametrami, jak też pomiędzy rozkładami z

prób i rozkładami teoretycznymi.

(2)

Krok 2

0

Statystyka testowa:

gdzie są to tak zwane liczebności teoretyczne.

n

i

– liczba elementów próby odpowiadających poziomowi x

i

cechy X, n

j

– liczba elementów próby odpowiadających poziomowi y

j

cechy Y, n

ij

- liczba elementów próby odpowiadających poziomowi x

i

cechy X i poziomowi y

j

cechy Y,

n – suma elementów próby odpowiadających poziomowi x

i

cechy X i poziomowi y

j

cechy Y,

k – liczba kolumn, l – liczba wierszy

Krok 3

0

Przyjęcie poziomu istotności

Za pomocą współczynnika ufności określa się prawdopodobieństwo, że podjęta decyzja jest decyzją słuszną. Jeżeli wartości przyjęte w hipotezie w znaczny sposób odbiegają od wyniku statystyk uzyskanych na podstawie próby, to z dużą pewnością hipotezę taką możemy odrzucić. Wówczas współczynnik ufności jest bardzo niski. Natomiast, jeżeli hipoteza jest zbliżona do wyników próby, to z coraz mniejszą pewnością można stwierdzić, że hipoteza jest fałszywa. W takim przypadku współczynnik ufności przyjmuje wartość bliską jedności.

W analizie przyjęto współczynnik ufności 1 -  = 0,90, oznacza to, że średnio w 10- ciu przypadkach na 100 popełniono błąd. Poziom istotności oznacza prawdopodobieństwo popełnienia błędu. Poziom istotności: 1 -  = 0,90   = 0,1

ˆ , ˆ

) ˆ (

1 1

2

1 1

2 2

n n n n

n n n n

n

n i j

ij l

i k

j ij

l ij i

k

j ij

ij

ij





 





nij

(3)

Krok 4

0

Wyznaczenie obszaru krytycznego:

2

wartość statystyki przy określonym poziomie istotności -  i liczbie stopni swobody - v.

Aby odczytać wyżej wymienioną wartość z tablic należy obliczyć liczbę stopni swobody, korzystając z następującego wzoru:

v = (k – 1) (l – 1) k - liczba kolumn,

l – liczba wierszy.

Obszar krytyczny wyznacza się w celu sprawdzenia czy konkretna realizacja 

2

statystyki testowej należy do obszaru.

Jeżeli po obliczeniu, 

2

nie należy do obszaru krytycznego to przyjmuje się hipotezę zerową H

0

za prawdziwą. Natomiast jeżeli 

2

należy do obszaru krytycznego odrzuca się wtedy hipotezę zerową na korzyść hipotezy alternatywnej H

1

.

Krok 5

0

Obliczenie konkretnej realizacji 

2

statystyki testowej.

Krok 6

0

Podjęcie decyzji:

jeżeli 

2

 K  odrzucamy hipotezę H

0

na korzyść hipotezy H

1

, jeżeli 

2

 K  nie ma podstaw do odrzucenia hipotezy H

0

.

Po odrzuceniu H

0

na korzyść H

1

, czyli przyjęciu, że cechy X i Y są od siebie zależne, należy obliczyć wskaźnik kontyngencji:

2

– konkretna realizacja statystyki – obliczona ze wzoru 2

0

n – suma elementów próby odpowiadających poziomowi x

i

cechy X i poziomowi y

j

cechy Y,

k – liczba kolumn, l – liczba wierszy.

Wartość C wskazuje, jak silna jest zależność badanych cech.

4.1.1 Zależność pomiędzy poglądem na temat kredytu samochodowego a wiekiem K (X2, )

C n

k k

l

l C

 

2 2

1 1

2 0 1

(4)

Celem przeprowadzonej analizy było zbadanie postawy respondentów wobec kredytu samochodowego w zależności od wieku. Do oceny współzależności badanych cech jakościowych zastosowano wyżej opisany test chi-kwadrat, opierając się o jego kolejne etapy.

Cecha X: postawa wobec kredytu samochodowego.

Cecha Y: wiek respondentów.

yj Poziom cechy Y

j

P xi < 25 26 - 40 41 - 60 >60

o

z Tak 2 13 5 4 24

i

o Raczej tak 1 9 20 10 40

m Trudno

powiedzieć 0 10 13 17 40

ce- ch y

Raczej nie 1 14 18 28 61

X Nie 4 8 16 7 35



i 8 54 72 66 200

Tab. 4.2.

10

H0: cechy X i Y są niezależne.

Postawa wobec kredytu samochodowego jest niezależna od wieku respondentów.

H1: cechy X i Y nie są niezależne.

Postawa wobec kredytu samochodowego nie jest niezależna od wieku respondentów.

20

Statystyka testowa:

30

Przyjęcie poziomu istotności: 1 -  = 0,90   = 0,1

40

Wyznaczenie obszaru krytycznego:

Obliczenie liczby stopni swobody:

v = (k – 1) (l – 1) k = 4 l = 5 v = (4 – 1) (5 – 1) = 12

)

; 55 , 18 ( 55

,

2 18

12

; 1 ,

0 K 

X

2

2

1 1

2

1 1

 

 

 

   

(nij nn )ij

 

nn n n n nn ,

j ij l

i

k ij

j ij l

i k

ij

i j

(5)

50

Obliczenie konkretnej realizacji 2 statystyki testowej. (Wykorzystano wzór 20).

Ze względu na zbyt dużą liczbę danych, w powyższym obliczeniu zobrazowano jedynie sposób liczenia.

Uznano, że przedstawienie wszystkich rachunków jest zbyteczne, gdyż i tak do dalszych etapów wykorzystywany jest tylko wynik.

Obliczona wartość 2 jest większa od wartości odczytanej z tablicy (30>18,55), wobec tego należy do obszaru krytycznego.

Decyzja:

Decyzja:

2  K  odrzucamy H0 na korzyść H1. Wniosek:

Postawa wobec kredytu jest zależna od wykształcenia respondentów.

Ponieważ 2  K przystąpiono do obliczenia wskaźnika kontyngencji:

Wskaźnik kontyngencji wynosi 0,257; wskazuje to na słabą zależność między cechami. Można stąd wysnuć wniosek, że negatywne bądź pozytywne podejście do kredytu nie jest bardzo mocno związane z posiadanym wykształceniem.

30 200 230 200

200 66 35

7 200

72 35

16 200

8 40

1

200 66 24

4 200

72 24

5 200

54 24

13 200

8 24

2

2 2 2

2 2 2 2

2

   

 

 

 

 

 

 

 

 

 

 

 

 

 



C n

k k

l

l C

 

2 2

1 1

2 0 1

1 0

257 , 2 0

5 1 5 4

1 4 200 30

30

2

2   

 

  C

C

(6)

Wniosek:

Pogląd na temat kredytu samochodowego jest zależny od wieku respondentów. Na tym poziomie istotności między omawianymi cechami istnieje powiązanie choć nie jest ono bardzo silne.

4.1.2 Zależność preferowanych atrybutów samochodowych od płci badanych

Celem analizy było zbadanie, czy wybór atrybutów samochodowych zależy od płci badanych. Jako instrument pomiaru zastosowano test chi-kwadrat oceny współzależności cech X i Y.

Cecha X: atrybuty samochodowe.

Cecha Y: płeć respondentów.

yj Poziomy y1

kobieta

cechy Y y2

mężczyzna j

xi

x1 Wygląd samochodu i jego elegancja 83 80 163

x2 Wierność firmie 18 21 39

x3 Korzystna cena 73 63 136

x4 Komfort jazdy 75 71 146

x5 Osiągi trakcyjne 40 53 93

P x6 Niski poziom hałasu 37 44 81

o x7 Obszerne wnętrze 51 63 114

z x8 Bezpieczeństwo 85 74 159

i x9 Pojemność bagażnika 26 18 44

o x10 Pojemność baku 12 15 27

m x11 Instalacja gazowa 1 12 13

y x12 Wtrysk paliwa 9 35 44

x13 Felgi aluminiowe 10 23 33

c x14 Wspomaganie kierownicy 62 64 126

e x15 ABS 54 64 118

c x16 Automatyczna skrzynia biegów 19 10 29

h x17 Poduszka powietrzna dla kierowcy 58 61 119

y x18 Poduszka powietrzna dla pasażera 43 42 85

x19 Poduszki powietrzne boczne 24 17 41

X x20 Fabryczne zabezpieczenia przeciwkradzieżowe 37 33 70

x21 Klimatyzacja 46 47 93

x22 Szyberdach 12 15 27

x23 Elektrycznie opuszczane szyby 19 24 43

x24 Elektrycznie regulowane lusterka 9 9 18

x25 Centralny zamek 51 61 112

x26 Komputer pokładowy 6 21 27

(7)

i 960 1040 2000 Tab. 4.3.

10

H0: cechy X i Y są niezależne.

Preferowane atrybuty samochodów są niezależne od płci respondentów.

H1: cechy X i Y nie są niezależne.

Preferowane atrybuty samochodów nie są niezależne od płci respondentów.

20

Statystyka testowa:

30

Przyjęcie poziomu istotności: 1 -  = 0,90   = 0,1

40

Wyznaczenie obszaru krytycznego:

Obliczenie liczby stopni swobody:

v = (k – 1) (l – 1) k = 2 l = 26 v = (2 – 1) (26 – 1) = 25

50

Obliczenie konkretnej realizacji 2 statystyki testowej. (Wykorzystano wzór 20).

X0 1 252, ; 34,38K(34,38;)

37, 49 2000 37, 2049 2000

2000 1040 27

21 2000

960 27

6 2000

960 136

73

2000 1040 39

21 2000

960 39

18 2000

1040 163

80 2000

960 163

83

2 2 2

2 2 2 2

2

   

 

 

 

 

 

 

 

 

 

 

 

 

 



2

2

1 1

2

1 1

 

 

 

   

(nij nn )ij

 

nn n n n nn ,

ij j

l

i

k ij

ij j

l

i k

ij

i j

(8)

Ze względu na zbyt dużą liczbę danych, w powyższym obliczeniu zobrazowano jedynie sposób liczenia.

Uznano, że przedstawienie wszystkich rachunków jest zbyteczne, gdyż i tak do dalszych etapów wykorzystywany jest tylko wynik.

60

Obliczona wartość 2 jest większa od wartości odczytanej z tablicy (49,37>34,38), wobec tego należy do obszaru krytycznego.

Decyzja:

2  K  odrzucamy H0 na korzyść H1. Wniosek:

Gama preferowanych atrybutów jest zależna od płci respondentów.

Ponieważ 2  K przystąpiono do obliczenia wskaźnika kontyngencji:

Wskaźnik kontyngencji wynosi 0,878; wskazuje to na silną zależność między cechami. Można stąd wysnuć wniosek, że preferencje kobiet w zakresie atrybutów samochodowych znacznie się różnią od upodobań mężczyzn.

4.1.3 Zależność preferowanych atrybutów samochodowych od wieku respondentów

Celem analizy było zbadanie, czy wybór atrybutów samochodowych zależy od wieku badanych. Jako instrument pomiaru zastosowano test chi-kwadrat oceny współzależności cech X i Y.

Cecha X: atrybuty samochodowe.

C n

k k

l

l C

 

2 2

1 1

2 0 1

1 0

878 , 2 0

26 1 26 2

1 2

2000 37

, 49

37 , 49

2

2

C

C

(9)

Cecha Y: wiek respondentów.

yj

y1

wiek <25 Poziomy

y2

26-40

Cechy Y y3

41-60

y4

>60 j

xi

x1 Wygląd i elegancja samochodu 56 58 45 4 163

x2 Wierność firmie 10 15 10 4 39

x3 Korzystna cena 49 47 36 4 136

x4 Komfort jazdy 46 56 38 6 146

x5 Osiągi trakcyjne 33 28 26 6 93

P x6 Niski poziom hałasu 33 26 20 2 81

o x7 Obszerne wnętrze 28 44 39 3 114

z x8 Bezpieczeństwo 51 59 41 8 159

i x9 Pojemność bagażnika 12 20 12 0 44

o x10 Pojemność baku 5 14 8 0 27

m x11 Instalacja gazowa 3 5 5 0 13

y x12 Wtrysk paliwa 8 19 15 2 44

x13 Felgi aluminiowe 12 13 6 2 33

c x14 Wspomaganie kierownicy 44 41 35 6 126

e x15 ABS 43 38 30 7 118

c x16 Automatyczna skrzynia biegów 5 18 6 0 29

h x17 Poduszka powietrzna kierowcy 42 40 31 6 119

y x18 Poduszka powietrzna pasażera 28 31 22 4 85

x19 Poduszki powietrzne boczne 13 11 15 2 41

X x20 Fabryczne zabezpieczenia

przeciwkradzieżowe 20 29 19 2 70

x21 Klimatyzacja 31 30 30 2 93

x22 Szyberdach 11 11 4 1 27

x23 Elektrycznie opuszczane szyby 21 13 8 1 43

x24 Elektrycznie regulowane lusterka 5 9 4 0 18

x25 Centralny zamek 40 38 28 6 112

x26 Komputer pokładowy 11 7 7 2 27

i 660 720 540 80 2000 Tab. 4.4.

10

H0: cechy X i Y są niezależne.

Preferowane atrybuty samochodów są niezależne od wieku respondentów.

H1: cechy X i Y nie są niezależne.

Preferowane atrybuty samochodów nie są niezależne od wieku respondentów.

20

Statystyka testowa:

80

2

2 2

 

 

 

   

k l (nij nn )ij

k

l nnij n nij ni nnj,

(10)

30

Przyjęcie poziomu istotności: 1 -  = 0,90   = 0,1 40

Wyznaczenie obszaru krytycznego:

Obliczenie liczby stopni swobody:

v = (k – 1) (l – 1) k = 4 l = 26 v = (4 – 1) (26 – 1) = 75

50

Obliczenie konkretnej realizacji 2 statystyki testowej. (Wykorzystano wzór 20).

Ze względu na zbyt dużą liczbę danych, w powyższym obliczeniu zobrazowano jedynie sposób liczenia.

Uznano, że przedstawienie wszystkich rachunków jest zbyteczne, gdyż i tak do dalszych etapów wykorzystywany jest tylko wynik.

60

Obliczona wartość 2 jest mniejsza od wartości odczytanej z tablicy (64,51<85,53), wobec tego nie należy do obszaru krytycznego.

Decyzja:

2  K  nie ma podstaw do odrzucenia H0. Wniosek:

Pogląd na temat preferowanych atrybutów samochodowych nie jest zależny od wieku respondentów. Na tym poziomie istotności różnica między omawianymi cechami jest nieistotna i spowodowana losowym charakterem próby.

51, 64 2000 51, 2064 2000

2000 80 27

2 2000

540 27

7 2000

660 39

10

2000 80 163

4 2000

540 163

45 2000

720 163

58 2000

660 163

56

2 2 2

2 2 2 2

2

   

 

 

 

 

 

 

 

 

 

 

 

 

 



X0 1 752, ; 85 53, K(85 53, ;)

(11)

4.2 Analiza wariancji

Analiza wariancji pomaga udzielić odpowiedzi na pytanie o wpływ zmiennej eksperymentalnej na zmienne zależne. Metoda ta jest techniką statystyczną pozwalającą badaczowi na określenie problemu, czy różnice między średnimi z prób są większe niż oczekiwane, spowodowane błędem próby. Analiza znalazła zastosowanie przede wszystkim do testowania eksperymentów przeprowadzonych za pomocą kwadratu łacińskiego, modelu czynnikowego lub eksperymentu całkowicie losowego.

Aby przeprowadzić badanie tą metoda analizy należy wykonać następujące kroki23: 10

Skonstruować tabelę zawierającą bezwzględne wielkości badanych zmiennych otrzymane z pomiarów.

Wzór tabeli prezentuje rys 4.3.

yj

xi

y1 Poziom y Y2

cechy Y

yk

j xl

x1 n11 n12 ... n1k n1..

n1..k Poziom

y

x2 n21 n22 ... n2k n2..

n2..k

cechy ... ... ... ... ... ...

X ... ... ... ... ... ...

xl nl1 nl2 ... nlk nl..

nl..k

i n..1 n..2 ... n.k n

xk

n.1l

n..2l

n..k l

Rys. 4.5

20

Następnie na podstawie otrzymanych danych w tabeli formułowane są pytania, czy wynikające różnice są rezultatem rzeczywistych preferencji ankietowanych, czy też wynikają z różnic w preferencjach określonych drugą zmienną. Innym możliwym wyjaśnieniem może być założenie, że ze względu na próby losowe różnice mogą być spowodowane błędem wynikającym z doboru próby. Na podstawie tych pytań konstruowane są dwie hipotezy zerowe.

30

Kolejnym proceduralnym krokiem, jaki należy zrobić w obliczeniach, jest budowa tablicy roboczej umożliwiającej wyodrębnienie rodzajów informacji, jakie należy zebrać do obliczeń. Ponadto tablica ta zawiera

23 Opracowanie własne na podstawie: S. Kaczmarczyk Badania marketingowe PWE Warszawa’95

(12)

instrukcje obliczenia wskaźnika F. Wskaźnik F służy do analizy wartości krytycznej rozkładu F dla stopnia swobody liczonego dla danego licznika i mianownika przy określonym poziomie istotności

. Obliczona wartość wskaźnika jest podstawą do przyjęcia którejś z postawionych hipotez za prawdziwą.

Rodzaj

zależności Suma kwadratów Stopnie

swobody Średni kwadrat (SK) Wskaźnik F Zależność

między rozkładem

pierwszej zmiennej

Suma kwadratów zmiennych eksperymentalnych

(SK1); suma kwadratów w

wierszach

l – 1 (liczba wierszy minus 1)

) 1 1 (

1 SK SK

lSK 

( )

) 1 (

CSK SK

SK SK

Zależność między rozkładem drugiej zmiennej

Suma kwadratów (SK2); suma kwadratów w

kolumnach

k – 1 (liczba kolumn minus 1)

) 2 1 (

2 SK SK k

SK

( )

) 2 (

CSK SK

SK SK

Błąd średniego kwadratu

Cząstkowe sumy

kwadratów (CSK) (k-1)(l-1) (kCSK1)(l1) SK(CSK) Ogólna suma

kwadratów OSK kl-1

Tab. 4.6

40

Następnie można przystąpić do obliczania wartości liczbowych określonych w powyższej tablicy na podstawie empirycznych danych zawartych w tablicy zmiennych( tab 4.1). Należy ustalić wartość dwóch wskaźników F dla poszczególnych zmiennych. W tym celu korzystamy z następujących wzorów:

1.

  

   

  2

1 k 1 x x

SK li

n

i

gdzie:

SK1 - suma kwadratów pierwszej zmiennej eksperymentalnej,

xli - średnia elementów próby odpowiadająca poszczególnym wierszom,

x - średnia ogólna liczona z wzoru:

) /(lk n x

gdzie: n - suma elementów próby odpowiadających poziomowi zmiennej xi i poziomowi zmiennej yj

l - liczba wierszy, k - liczba kolumn.

2.

(13)

  

   

  2

2 l 1 x x

SK k ki

i

gdzie:

SK2 - suma kwadratów drugiej zmiennej eksperymentalnej,

xki- średnia elementów próby odpowiadająca poszczególnym kolumnom,

x - średnia ogólna l - liczba wierszy, k - liczba kolumn

3.

2 1

1

( n x ) OSK

k ij

j l

i

 

gdzie:

OSK -ogólna suma kwadratów,

nij- liczba elementów próby odpowiadających poziomowi zmiennej xi i poziomowi zmiennej yj x - średnia ogólna liczona z wzoru:

l - liczba wierszy, k - liczba kolumn

4.

) 2 1 (SK SK OSK

CSK

gdzie:

CSK – cząstkowe sumy kwadratów OSK - ogólna suma kwadratów,

SK1 - suma kwadratów pierwszej zmiennej eksperymentalnej, SK2 - suma kwadratów drugiej zmiennej eksperymentalnej.

50

Po obliczeniu wskaźników F dla zmiennej eksperymentalnej i drugiej zmiennej należy porównać otrzymane wartości w wartością krytyczną rozkładu F. Wartość ta zależy od stopnia swobody zarówno w liczniku (n), jak i w mianowniku (m) wskaźnika F i od przyjętego poziomu ufności. Wzory do ustalenia wartości liczebników i mianownika są następujące:

(14)

n1 = (l - 1)

n1 - liczebnik dla pierwszej zmiennej l - liczba wierszy

n2 = k -1

n2 - liczebnik dla drugiej zmiennej k - liczba kolumn

m = (k - 1)(l - 1) m – mianownik l - liczba wierszy k - liczba kolumn

4.2.1 Zależność preferowanych atrybutów samochodowych od wykształcenia badanych

Celem przeprowadzonej analizy było zbadanie, czy wybór atrybutów samochodowych zależy od wykształcenia badanych. Oto tabela zawierająca wartości otrzymanych pomiarów.

1

0

Wykształcenie Atrybuty yj

Podstawo-

we zawodowe średnie wyższe

Średnie (w wier- szach)

samochodowe xi xl

Wygląd samochodu i jego

elegancja 3 14 87 59 163 41

Wierność firmie 0 4 16 19 39 10

Korzystna cena 4 9 79 44 136 34

Komfort jazdy 5 11 70 60 146 37

Osiągi trakcyjne 2 5 43 43 93 23

Niski poziom hałasu 3 10 42 26 81 20

Obszerne wnętrze 4 13 50 47 114 29

Bezpieczeństwo 4 15 82 58 159 40

Pojemność bagażnika 1 1 22 20 44 11

Pojemność baku 1 4 13 9 27 7

(15)

Instalacja gazowa 0 3 6 4 13 3

Wtrysk paliwa 1 12 19 12 44 11

Felgi aluminiowe 2 7 15 9 33 8

Wspomaganie kierownicy 5 10 64 47 126 32

ABS 5 13 64 36 118 30

Automatyczna skrzynia biegów 1 2 16 10 29 7

Poduszka powietrzna dla kierowcy 5 12 61 41 119 30

Poduszka powietrzna dla pasażera 4 7 52 22 85 21

Poduszki powietrzne boczne 1 8 23 9 41 10

Fabryczne zabezpieczenia

przeciwkradzieżowe 5 8 34 23 70 18

Klimatyzacja 2 8 54 29 93 23

Szyberdach 0 2 13 12 27 7

Elektrycznie opuszczane szyby 3 4 21 15 43 11

Elektrycznie regulowane lusterka 0 2 13 3 18 5

Centralny zamek 7 10 50 45 112 28

Komputer pokładowy 2 6 11 8 27 7

70 200 1020 710 2000

Średnie (w kolumnach) xk 3 8 39 27

Tab. 4.7

20

Testowane są więc dwie hipotezy zerowe:

1. H0: Każdy atrybut samochodowy jest jednakowo preferowany przez ankietowanych.

2. H0: Każdy atrybut samochodowy jest jednakowo preferowany przez ankietowanych z wykształceniem wyższym, średnim, zawodowym i podstawowym.

30

Wykonanie tablicy roboczej zawierającej dane wymagające obliczeń..

Rodzaj zależności

Suma kwadratów Stopnie swobody

Średni kwadrat (SK) Wskaźnik F Zależność

między preferowanymi

atrybutami samochodowymi

Suma kwadratów zmiennych eksperymentalnych

(SKA); suma kwadratów w wierszach

l – 1 (liczba wierszy minus 1)

) 1 SK(SKA SKA l

( )

) (

CSK SK

SKA SK

Zależność między wykształceniem

Suma kwadratów (SKW); suma kwadratów w kolumnach

k – 1 (liczba kolumn minus 1)

) 1 SK(SKW SKW k

( )

) (

CSK SK

SKW SK

Błąd średniego kwadratu

Cząstkowe sumy

kwadratów (CSK) (k-1)(l-1) (kCSK1)(l1) SK(CSK) Ogólna suma

kwadratów OSK kl-1

Tablica 4.8

(16)

40

Po określeniu odpowiednich wzorów można przystąpić do ich obliczeń:

1. Ogólna średnia:

) /(lk n x

x2000/ (264)19

2. Suma kwadratów zmiennych eksperymentalnych (SKA); suma kwadratów w wierszach (wzór nr 1).

  

   

  2 1 x x k SKA n li

i

 

SKA4 41 19 2 10 19 2 34 19 2  7 19 2 14428

3. Suma kwadratów (SKW); suma kwadratów w kolumnach (wzór nr 2).

  

   

  2 1 x x l

SKW k ki

i

 

SKW26 3 19 2 8 19 2 39 19 2 27 19 2 21866

4. Ogólna suma kwadratów.

2 1

1

( n x ) OSK

k ij

j l

i

 

       

OSK 3 19 2 14 19 2 87 19 2   8 19 2 47638

5. Cząstkowe sumy kwadratów (CSK).

) (SKA SKW OSK

CSK

 

CSK 47638 14428 21866 11344

(17)

Otrzymane dane umieszczamy we wcześniej przygotowanej tablicy roboczej i obliczamy wskaźniki F.

Rodzaj zależności Suma

kwadratów Stopnie

swobody Średni kwadrat

(SK) Wskaźnik F

Zależność między

preferowanymi atrybutami samochodowymi

14428 25 14428

25 577 12, 577 12

151 25, 3 82

, ,

Zależność między

wykształceniem 21866 3 21866

3 7288 66, 7288 66

151 25, 48 19

, ,

Błąd średniego kwadratu

11344 75 11344

75 151 25,

Ogólna suma kwadratów

47638 103

Tab. 4.9

50

Dla wskaźnika pierwszej zmiennej o wartości 3,82 obliczamy stopień swobody zarówno w liczniku jak i w mianowniku według wzorów:

n1 = (l - 1); n1 = (26-1) = 25 m = (k - 1)(l - 1); m = (4-1)(26-1) = 75

Wartość krytyczna rozkładu F dla stopnia swobody w liczniku 25 i mianowniku 75 przy poziomie istotności

= 0,01 wynosi 2,07.

Obliczona wartość 3,82 jest większa od wartości odczytanej z tablicy (3,82>2,07), wobec tego odrzucamy pierwsza hipotezę zerową dla zmiennej eksperymentalnej.

Wniosek:

Zidentyfikowane różnice w wyborze atrybutów samochodowych są istotne statystycznie ze względu na rzeczywiste różnice w preferencjach konsumentów.

Dla wskaźnika drugiej zmiennej o wartości 48,19 obliczamy stopień swobody zarówno w liczniku jak i w mianowniku według wzorów:

n2 = (k - 1); n2 = (4-1) = 3

(18)

m = (k - 1)(l - 1); m = (4-1)(26-1) = 75

Wartość krytyczna rozkładu F dla stopnia swobody w liczniku 3 i mianowniku 75 przy poziomie istotności

= 0,01 wynosi 4,09.

Obliczona wartość 48,19 jest większa od wartości odczytanej z tablicy (48,19>4,09), wobec tego odrzucamy drugą hipotezę zerową.

Wniosek:

Istnieją istotne różnice miedzy osobami z różnym wykształceniem ze względu na ich preferencje w zakresie atrybutów samochodowych

Analiza wariancji wykazała, że różnice w preferencjach atrybutów samochodowych wśród ankietowanych zależą istotnie od samych cech opisujących samochody jak i od poziomu wykształcenia.

4.3 Test Kołmogorowa - Smirnowa

Przy analizowaniu otrzymanych wyników z ankiety, weryfikacji wymaga często istotność różnic między rozkładem empirycznym, otrzymanym z pomiaru porządkowego, a rozkładem oczekiwanym. Narzędziem służącym tej weryfikacji jest m.in. test Kołmogorowa - Smirnowa (test K-S).

W pierwszej kolejności należy skonstruować hipotezę zerową, która zakłada, że nie ma istotnych różnic między rozkładem otrzymanym z próby, a oczekiwanym rozkładem. Weryfikacja hipotezy obejmuje trzy etapy:

Etap I.

Obliczenie skumulowanego rozkładu częstości otrzymanych z pomiaru próby, po przeliczeniu wartości bezwzględnych, na wartości względne.

Etap II.

Obliczenie skumulowanego rozkładu częstości wynikającego z hipotezy H0. Jeżeli hipoteza zakłada brak istotnych różnic między otrzymanymi wynikami z ankiety wówczas proporcje między poszczególnymi kategoriami skali są sobie równe (suma proporcji zawsze równa 1).

Etap III.

Określenie największej różnicy między wartościami skumulowanego rozkładu empirycznego, a wartościami skumulowanego rozkładu hipotetycznego. Największa różnica jest określana jako wartość D Kołmogorowa - Smirnowa. Wartość ta odnajdujemy w tablicy dla odpowiedniej liczebności próby oraz poziomu istotności24.

Wszystkie wyniki liczbowe otrzymane z realizowania kolejnych etapów zapisuje się w specjalnie sporządzonej w tym celu tabeli.

24 Opracowanie własne na podstawie: S. Kaczmarczyk Badania marketingowe PWE Warszawa’95

(19)

4.3.1 Czy najlepszą porą na zakup samochodu jest wiosna?

Hipoteza zerowa zakłada, że określenie wiosny jako najlepszej pory na zakup samochodu osobowego nie powoduje istotnego zróżnicowania opinii respondentów.

Weryfikacja hipotezy obejmująca trzy etapy dała następujące wyniki.

Kategorie skali Liczba

odpowiedziProporcje

Proporcje skumulo-

wane

Proporcje według

Ho

Skumulo- wane proporcje

Ho

Absolutne różnice proporcji empirycznych i skumulowanych

według Ho

Tak 53 0,265 0,265 0,2 0,2 0,065

Raczej tak 53 0,265 0,53 0,2 0,4 0,13

Trudno

powiedzieć 52 0,26 0,79 0,2 0,6 0,19

Raczej nie 30 0,15 0,94 0,2 0,8 0,14

Nie 12 0,06 1 0,2 1 0

RAZEM 200 1 X 1 X X

Tab. 4.10

Największa różnica między wartościami skumulowanego rozkładu empirycznego, a wartościami skumulowanego rozkładu hipotetycznego wynosi 0,19. Z tablicy rozkładu wartości D Kołmogorowa – Smirnowa odczytujemy, że dla n = 200 oraz przy poziomie ufności

= 0,01 jest to liczba

1153 , 0 200 63

,

1 . Ponieważ D = 0,19 > 0,1153 dla

= 0,01, są podstawy do odrzucenia hipotezy zerowej.

Wniosek:

Wybór wiosny jako najlepszej pory na zakup samochodu osobowego powoduje istotne zróżnicowania opinii respondentów. Jest to różnica wyraźnie statystyczna jaki rzeczywista.

4.3.2 Czy kredytowa forma kupna samochodu jest szczególnie atrakcyjna?

Hipoteza zerowa zakłada, że określenie kredytu jako szczególnie atrakcyjnej formy zapłaty za samochód nie powoduje istotnego zróżnicowania opinii respondentów.

Weryfikacja hipotezy obejmująca trzy etapy dała następujące wyniki.

(20)

Kategorie skali Liczba

odpowiedziProporcje

Proporcje skumulo-

wane

Proporcje według

Ho

Skumulo- wane proporcje

Ho

Absolutne różnice proporcji empirycznych i skumulowanych

według Ho

Tak 24 0,12 0,12 0,2 0,2 0,08

Raczej tak 40 0,2 0,32 0,2 0,4 0,08

Trudno

powiedzieć 40 0,2 0,52 0,2 0,6 0,08

Raczej nie 61 0,305 0,825 0,2 0,8 0,025

Nie 35 0,175 1 0,2 1 0

RAZEM 200 1 X 1 X X

Tab. 4.11

Największa różnica między wartościami skumulowanego rozkładu empirycznego, a wartościami skumulowanego rozkładu hipotetycznego wynosi 0,08. Z tablicy rozkładu wartości D Kołmogorowa – Smirnowa odczytujemy, że dla n = 200 oraz przy poziomie ufności

= 0,01 jest to liczba

1153 , 0 200 63

,

1 . Ponieważ D = 0,08 < 0,1153 dla

= 0,01, nie ma podstaw do odrzucenia hipotezy zerowej.

Wniosek:

Wybór kredytu jako szczególnie atrakcyjnej formy zapłaty za samochód nie powoduje istotnego zróżnicowania opinii respondentów. Nie ma więc istotnych różnic między rozkładem otrzymanym z próby, a oczekiwanym rozkładem.

4.3.3 Czy najlepiej kupić nowe auto z salonu samochodowego?

Hipoteza zerowa zakłada, że chęć zakupu nowego samochodu osobowego z salonu nie powoduje istotnego zróżnicowania opinii respondentów.

Weryfikacja hipotezy obejmująca trzy etapy dała następujące wyniki.

Kategorie skali Liczba

odpowiedziProporcje

Proporcje skumulo-

wane

Proporcje według

Ho

Skumulo- wane proporcje

Ho

Absolutne różnice proporcji empirycznych i skumulowanych

według Ho

Tak 60 0,3 0,3 0,2 0,2 0,1

Raczej tak 61 0,305 0,605 0,2 0,4 0,205

Trudno 34 0,17 0,775 0,2 0,6 0,175

(21)

powiedzieć

Raczej nie 33 0,165 0,94 0,2 0,8 0,14

Nie 12 0,06 1 0,2 1 0

RAZEM 200 1 X 1 X X

Tab. 4.12

Największa różnica między wartościami skumulowanego rozkładu empirycznego, a wartościami skumulowanego rozkładu hipotetycznego wynosi 0,205. Z tablicy rozkładu wartości D Kołmogorowa – Smirnowa odczytujemy, że dla n = 200 oraz przy poziomie ufności

= 0,01 jest to liczba

1153 , 0 200 63

,

1 . Ponieważ D = 0,205 > 0,1153 dla

= 0,01, są podstawy do odrzucenia hipotezy zerowej.

Wniosek:

Wybór między samochodem nowym, a używanym powoduje istotne zróżnicowania opinii respondentów. Jest to różnica wyraźnie statystyczna jaki rzeczywista.

Cytaty

Powiązane dokumenty

Równania dodane w gazodynamice.. Z liniowego równania falowego wynika, że małe zaburzenia propagują się w gazie ze stałą prędkością.. Parametry spiętrzenia Jeżeli gaz

Równania dodane w gazodynamice.. Z liniowego równania falowego wynika, że małe zaburzenia propagują się w gazie ze stałą prędkością.. Parametry spiętrzenia Jeżeli gaz

Podczas pobytu na obszarze pojezierza turyœci kieruj¹ siê do ro¿nych miejsc i obiektów, g³ównie tych polecanych przez przewodniki turystyczne oraz przyjació³, znajomych, a

Cyclic sedimentation of organic and mineral matter is a characteristic pattern in Lake Veetka and several other lakes in southern Estonia.. Cy- clicity is

Osadzić olbrzymi dorobek Stanisława Pigonia w historii historii literatury polskiej — takie było zadanie grud- niowej sesji; dzięki zespołowej pracy zostało ono

Dlatego, gdy mamy do czynienia z rozkładem ciągłym, powinniśmy unikać stoso- wania tego testu [...] Dopiero, gdy próba losowa jest bardzo liczna i hi- stogram sporządzony na

Znaczenie poznawcze funkcji regresji jest tym większe, im silniejsza jest korelacja między badanymi zmiennymi. Silny związek oznacza bowiem, że zmienna niezależna determinuje

miary uzależniony jest od: rodzaju cech statystycznych, kształtu zależności między badanymi cechami, wielkości tablicy. korelacyjnej lub tablicy kontyngencji (liczby kolumn