Analiza współzależności badanych cech
1. Test chi-kwadrat
Dla sprawdzenia przypuszczenia o współzależności między badanymi cechami wykorzystuje się nieparametryczny test niezależności chi-kwadrat (
2). Test ten stosowany jest w badaniach, w których przynajmniej jedna z badanych cech ma charakter jakościowy. Przed przystąpieniem do realizacji poszczególnych etapów analizy współzależności dwóch cech niezbędne jest skonstruowanie tablicy dwudzielnej cech: X i Y.
yj
xi
y1 Poziom y Y2
cechy Y
… yk
j
x1
n
11n
12... n
1k n1..Poziom y
x2
n
21n
22... n
2k n2..cechy ...
... ... ... ...
...X ...
... ... ... ...
...xl
n
l1n
l2... n
lk nl..i n..1 n..2 ... n.k n
Krok 1
0Przyjęcie hipotez
H
0: cechy X i Y są niezależne. Hipoteza zerowa H
0ma miejsce wówczas, gdy mniemamy, że pomiędzy estymatorem i parametrem lub rozkładem teoretycznym i empirycznym nie ma statystycznie istotnej różnicy.
H
1: cechy X i Y nie są niezależne. Hipoteza alternatywna H
1dopuszcza istnienie różnic
pomiędzy estymatorami (statystykami) i parametrami, jak też pomiędzy rozkładami z
prób i rozkładami teoretycznymi.
Krok 2
0Statystyka testowa:
gdzie są to tak zwane liczebności teoretyczne.
n
i– liczba elementów próby odpowiadających poziomowi x
icechy X, n
j– liczba elementów próby odpowiadających poziomowi y
jcechy Y, n
ij- liczba elementów próby odpowiadających poziomowi x
icechy X i poziomowi y
jcechy Y,
n – suma elementów próby odpowiadających poziomowi x
icechy X i poziomowi y
jcechy Y,
k – liczba kolumn, l – liczba wierszy
Krok 3
0Przyjęcie poziomu istotności
Za pomocą współczynnika ufności określa się prawdopodobieństwo, że podjęta decyzja jest decyzją słuszną. Jeżeli wartości przyjęte w hipotezie w znaczny sposób odbiegają od wyniku statystyk uzyskanych na podstawie próby, to z dużą pewnością hipotezę taką możemy odrzucić. Wówczas współczynnik ufności jest bardzo niski. Natomiast, jeżeli hipoteza jest zbliżona do wyników próby, to z coraz mniejszą pewnością można stwierdzić, że hipoteza jest fałszywa. W takim przypadku współczynnik ufności przyjmuje wartość bliską jedności.
W analizie przyjęto współczynnik ufności 1 - = 0,90, oznacza to, że średnio w 10- ciu przypadkach na 100 popełniono błąd. Poziom istotności oznacza prawdopodobieństwo popełnienia błędu. Poziom istotności: 1 - = 0,90 = 0,1
ˆ , ˆ
) ˆ (
1 1
2
1 1
2 2
n n n n
n n n n
n
n i j
ij l
i k
j ij
l ij i
k
j ij
ij
ij
nij
Krok 4
0Wyznaczenie obszaru krytycznego:
2
wartość statystyki przy określonym poziomie istotności - i liczbie stopni swobody - v.
Aby odczytać wyżej wymienioną wartość z tablic należy obliczyć liczbę stopni swobody, korzystając z następującego wzoru:
v = (k – 1) (l – 1) k - liczba kolumn,
l – liczba wierszy.
Obszar krytyczny wyznacza się w celu sprawdzenia czy konkretna realizacja
2statystyki testowej należy do obszaru.
Jeżeli po obliczeniu,
2nie należy do obszaru krytycznego to przyjmuje się hipotezę zerową H
0za prawdziwą. Natomiast jeżeli
2należy do obszaru krytycznego odrzuca się wtedy hipotezę zerową na korzyść hipotezy alternatywnej H
1.
Krok 5
0Obliczenie konkretnej realizacji
2statystyki testowej.
Krok 6
0Podjęcie decyzji:
jeżeli
2 K odrzucamy hipotezę H
0na korzyść hipotezy H
1, jeżeli
2 K nie ma podstaw do odrzucenia hipotezy H
0.
Po odrzuceniu H
0na korzyść H
1, czyli przyjęciu, że cechy X i Y są od siebie zależne, należy obliczyć wskaźnik kontyngencji:
2– konkretna realizacja statystyki – obliczona ze wzoru 2
0n – suma elementów próby odpowiadających poziomowi x
icechy X i poziomowi y
jcechy Y,
k – liczba kolumn, l – liczba wierszy.
Wartość C wskazuje, jak silna jest zależność badanych cech.
4.1.1 Zależność pomiędzy poglądem na temat kredytu samochodowego a wiekiem K (X2, )
C n
k k
l
l C
2 2
1 1
2 0 1
Celem przeprowadzonej analizy było zbadanie postawy respondentów wobec kredytu samochodowego w zależności od wieku. Do oceny współzależności badanych cech jakościowych zastosowano wyżej opisany test chi-kwadrat, opierając się o jego kolejne etapy.
Cecha X: postawa wobec kredytu samochodowego.
Cecha Y: wiek respondentów.
yj Poziom cechy Y
jP xi < 25 26 - 40 41 - 60 >60
o
z Tak 2 13 5 4 24
i
o Raczej tak 1 9 20 10 40
m Trudno
powiedzieć 0 10 13 17 40
ce- ch y
Raczej nie 1 14 18 28 61
X Nie 4 8 16 7 35
i 8 54 72 66 200Tab. 4.2.
10
H0: cechy X i Y są niezależne.
Postawa wobec kredytu samochodowego jest niezależna od wieku respondentów.
H1: cechy X i Y nie są niezależne.
Postawa wobec kredytu samochodowego nie jest niezależna od wieku respondentów.
20
Statystyka testowa:
30
Przyjęcie poziomu istotności: 1 - = 0,90 = 0,1
40
Wyznaczenie obszaru krytycznego:
Obliczenie liczby stopni swobody:
v = (k – 1) (l – 1) k = 4 l = 5 v = (4 – 1) (5 – 1) = 12
)
; 55 , 18 ( 55
,
2 18
12
; 1 ,
0 K
X
2
2
1 1
2
1 1
(nij nn )ij
nn n n n nn ,j ij l
i
k ij
j ij l
i k
ij
i j
50
Obliczenie konkretnej realizacji 2 statystyki testowej. (Wykorzystano wzór 20).
Ze względu na zbyt dużą liczbę danych, w powyższym obliczeniu zobrazowano jedynie sposób liczenia.
Uznano, że przedstawienie wszystkich rachunków jest zbyteczne, gdyż i tak do dalszych etapów wykorzystywany jest tylko wynik.
Obliczona wartość 2 jest większa od wartości odczytanej z tablicy (30>18,55), wobec tego należy do obszaru krytycznego.
Decyzja:
Decyzja:
2 K odrzucamy H0 na korzyść H1. Wniosek:
Postawa wobec kredytu jest zależna od wykształcenia respondentów.
Ponieważ 2 K przystąpiono do obliczenia wskaźnika kontyngencji:
Wskaźnik kontyngencji wynosi 0,257; wskazuje to na słabą zależność między cechami. Można stąd wysnuć wniosek, że negatywne bądź pozytywne podejście do kredytu nie jest bardzo mocno związane z posiadanym wykształceniem.
30 200 230 200
200 66 35
7 200
72 35
16 200
8 40
1
200 66 24
4 200
72 24
5 200
54 24
13 200
8 24
2
2 2 2
2 2 2 2
2
C n
k k
l
l C
2 2
1 1
2 0 1
1 0
257 , 2 0
5 1 5 4
1 4 200 30
30
2
2
C
C
Wniosek:
Pogląd na temat kredytu samochodowego jest zależny od wieku respondentów. Na tym poziomie istotności między omawianymi cechami istnieje powiązanie choć nie jest ono bardzo silne.
4.1.2 Zależność preferowanych atrybutów samochodowych od płci badanych
Celem analizy było zbadanie, czy wybór atrybutów samochodowych zależy od płci badanych. Jako instrument pomiaru zastosowano test chi-kwadrat oceny współzależności cech X i Y.
Cecha X: atrybuty samochodowe.
Cecha Y: płeć respondentów.
yj Poziomy y1
kobieta
cechy Y y2
mężczyzna j
xi
x1 Wygląd samochodu i jego elegancja 83 80 163
x2 Wierność firmie 18 21 39
x3 Korzystna cena 73 63 136
x4 Komfort jazdy 75 71 146
x5 Osiągi trakcyjne 40 53 93
P x6 Niski poziom hałasu 37 44 81
o x7 Obszerne wnętrze 51 63 114
z x8 Bezpieczeństwo 85 74 159
i x9 Pojemność bagażnika 26 18 44
o x10 Pojemność baku 12 15 27
m x11 Instalacja gazowa 1 12 13
y x12 Wtrysk paliwa 9 35 44
x13 Felgi aluminiowe 10 23 33
c x14 Wspomaganie kierownicy 62 64 126
e x15 ABS 54 64 118
c x16 Automatyczna skrzynia biegów 19 10 29
h x17 Poduszka powietrzna dla kierowcy 58 61 119
y x18 Poduszka powietrzna dla pasażera 43 42 85
x19 Poduszki powietrzne boczne 24 17 41
X x20 Fabryczne zabezpieczenia przeciwkradzieżowe 37 33 70
x21 Klimatyzacja 46 47 93
x22 Szyberdach 12 15 27
x23 Elektrycznie opuszczane szyby 19 24 43
x24 Elektrycznie regulowane lusterka 9 9 18
x25 Centralny zamek 51 61 112
x26 Komputer pokładowy 6 21 27
i 960 1040 2000 Tab. 4.3.
10
H0: cechy X i Y są niezależne.
Preferowane atrybuty samochodów są niezależne od płci respondentów.
H1: cechy X i Y nie są niezależne.
Preferowane atrybuty samochodów nie są niezależne od płci respondentów.
20
Statystyka testowa:
30
Przyjęcie poziomu istotności: 1 - = 0,90 = 0,1
40
Wyznaczenie obszaru krytycznego:
Obliczenie liczby stopni swobody:
v = (k – 1) (l – 1) k = 2 l = 26 v = (2 – 1) (26 – 1) = 25
50
Obliczenie konkretnej realizacji 2 statystyki testowej. (Wykorzystano wzór 20).
X0 1 252, ; 34,38K(34,38;)
37, 49 2000 37, 2049 2000
2000 1040 27
21 2000
960 27
6 2000
960 136
73
2000 1040 39
21 2000
960 39
18 2000
1040 163
80 2000
960 163
83
2 2 2
2 2 2 2
2
2
2
1 1
2
1 1
(nij nn )ij
nn n n n nn ,ij j
l
i
k ij
ij j
l
i k
ij
i j
Ze względu na zbyt dużą liczbę danych, w powyższym obliczeniu zobrazowano jedynie sposób liczenia.
Uznano, że przedstawienie wszystkich rachunków jest zbyteczne, gdyż i tak do dalszych etapów wykorzystywany jest tylko wynik.
60
Obliczona wartość 2 jest większa od wartości odczytanej z tablicy (49,37>34,38), wobec tego należy do obszaru krytycznego.
Decyzja:
2 K odrzucamy H0 na korzyść H1. Wniosek:
Gama preferowanych atrybutów jest zależna od płci respondentów.
Ponieważ 2 K przystąpiono do obliczenia wskaźnika kontyngencji:
Wskaźnik kontyngencji wynosi 0,878; wskazuje to na silną zależność między cechami. Można stąd wysnuć wniosek, że preferencje kobiet w zakresie atrybutów samochodowych znacznie się różnią od upodobań mężczyzn.
4.1.3 Zależność preferowanych atrybutów samochodowych od wieku respondentów
Celem analizy było zbadanie, czy wybór atrybutów samochodowych zależy od wieku badanych. Jako instrument pomiaru zastosowano test chi-kwadrat oceny współzależności cech X i Y.
Cecha X: atrybuty samochodowe.
C n
k k
l
l C
2 2
1 1
2 0 1
1 0
878 , 2 0
26 1 26 2
1 2
2000 37
, 49
37 , 49
2
2
C
C
Cecha Y: wiek respondentów.
yj
y1
wiek <25 Poziomy
y2
26-40
Cechy Y y3
41-60
y4
>60 j
xi
x1 Wygląd i elegancja samochodu 56 58 45 4 163
x2 Wierność firmie 10 15 10 4 39
x3 Korzystna cena 49 47 36 4 136
x4 Komfort jazdy 46 56 38 6 146
x5 Osiągi trakcyjne 33 28 26 6 93
P x6 Niski poziom hałasu 33 26 20 2 81
o x7 Obszerne wnętrze 28 44 39 3 114
z x8 Bezpieczeństwo 51 59 41 8 159
i x9 Pojemność bagażnika 12 20 12 0 44
o x10 Pojemność baku 5 14 8 0 27
m x11 Instalacja gazowa 3 5 5 0 13
y x12 Wtrysk paliwa 8 19 15 2 44
x13 Felgi aluminiowe 12 13 6 2 33
c x14 Wspomaganie kierownicy 44 41 35 6 126
e x15 ABS 43 38 30 7 118
c x16 Automatyczna skrzynia biegów 5 18 6 0 29
h x17 Poduszka powietrzna kierowcy 42 40 31 6 119
y x18 Poduszka powietrzna pasażera 28 31 22 4 85
x19 Poduszki powietrzne boczne 13 11 15 2 41
X x20 Fabryczne zabezpieczenia
przeciwkradzieżowe 20 29 19 2 70
x21 Klimatyzacja 31 30 30 2 93
x22 Szyberdach 11 11 4 1 27
x23 Elektrycznie opuszczane szyby 21 13 8 1 43
x24 Elektrycznie regulowane lusterka 5 9 4 0 18
x25 Centralny zamek 40 38 28 6 112
x26 Komputer pokładowy 11 7 7 2 27
i 660 720 540 80 2000 Tab. 4.4.
10
H0: cechy X i Y są niezależne.
Preferowane atrybuty samochodów są niezależne od wieku respondentów.
H1: cechy X i Y nie są niezależne.
Preferowane atrybuty samochodów nie są niezależne od wieku respondentów.
20
Statystyka testowa:
80
2
2 2
k l (nij nn )ij
k
l nnij n nij ni nnj,30
Przyjęcie poziomu istotności: 1 - = 0,90 = 0,1 40
Wyznaczenie obszaru krytycznego:
Obliczenie liczby stopni swobody:
v = (k – 1) (l – 1) k = 4 l = 26 v = (4 – 1) (26 – 1) = 75
50
Obliczenie konkretnej realizacji 2 statystyki testowej. (Wykorzystano wzór 20).
Ze względu na zbyt dużą liczbę danych, w powyższym obliczeniu zobrazowano jedynie sposób liczenia.
Uznano, że przedstawienie wszystkich rachunków jest zbyteczne, gdyż i tak do dalszych etapów wykorzystywany jest tylko wynik.
60
Obliczona wartość 2 jest mniejsza od wartości odczytanej z tablicy (64,51<85,53), wobec tego nie należy do obszaru krytycznego.
Decyzja:
2 K nie ma podstaw do odrzucenia H0. Wniosek:
Pogląd na temat preferowanych atrybutów samochodowych nie jest zależny od wieku respondentów. Na tym poziomie istotności różnica między omawianymi cechami jest nieistotna i spowodowana losowym charakterem próby.
51, 64 2000 51, 2064 2000
2000 80 27
2 2000
540 27
7 2000
660 39
10
2000 80 163
4 2000
540 163
45 2000
720 163
58 2000
660 163
56
2 2 2
2 2 2 2
2
X0 1 752, ; 85 53, K(85 53, ;)
4.2 Analiza wariancji
Analiza wariancji pomaga udzielić odpowiedzi na pytanie o wpływ zmiennej eksperymentalnej na zmienne zależne. Metoda ta jest techniką statystyczną pozwalającą badaczowi na określenie problemu, czy różnice między średnimi z prób są większe niż oczekiwane, spowodowane błędem próby. Analiza znalazła zastosowanie przede wszystkim do testowania eksperymentów przeprowadzonych za pomocą kwadratu łacińskiego, modelu czynnikowego lub eksperymentu całkowicie losowego.
Aby przeprowadzić badanie tą metoda analizy należy wykonać następujące kroki23: 10
Skonstruować tabelę zawierającą bezwzględne wielkości badanych zmiennych otrzymane z pomiarów.
Wzór tabeli prezentuje rys 4.3.
yj
xi
y1 Poziom y Y2
cechy Y
… yk
j xl
x1 n11 n12 ... n1k n1..
n1..k Poziom
y
x2 n21 n22 ... n2k n2..
n2..k
cechy ... ... ... ... ... ... …
X ... ... ... ... ... ... …
xl nl1 nl2 ... nlk nl..
nl..k
i n..1 n..2 ... n.k n
xk
n.1l
n..2l …
n..k l
Rys. 4.5
20
Następnie na podstawie otrzymanych danych w tabeli formułowane są pytania, czy wynikające różnice są rezultatem rzeczywistych preferencji ankietowanych, czy też wynikają z różnic w preferencjach określonych drugą zmienną. Innym możliwym wyjaśnieniem może być założenie, że ze względu na próby losowe różnice mogą być spowodowane błędem wynikającym z doboru próby. Na podstawie tych pytań konstruowane są dwie hipotezy zerowe.
30
Kolejnym proceduralnym krokiem, jaki należy zrobić w obliczeniach, jest budowa tablicy roboczej umożliwiającej wyodrębnienie rodzajów informacji, jakie należy zebrać do obliczeń. Ponadto tablica ta zawiera
23 Opracowanie własne na podstawie: S. Kaczmarczyk Badania marketingowe PWE Warszawa’95
instrukcje obliczenia wskaźnika F. Wskaźnik F służy do analizy wartości krytycznej rozkładu F dla stopnia swobody liczonego dla danego licznika i mianownika przy określonym poziomie istotności
. Obliczona wartość wskaźnika jest podstawą do przyjęcia którejś z postawionych hipotez za prawdziwą.Rodzaj
zależności Suma kwadratów Stopnie
swobody Średni kwadrat (SK) Wskaźnik F Zależność
między rozkładem
pierwszej zmiennej
Suma kwadratów zmiennych eksperymentalnych
(SK1); suma kwadratów w
wierszach
l – 1 (liczba wierszy minus 1)
) 1 1 (
1 SK SK
lSK
( )
) 1 (
CSK SK
SK SK
Zależność między rozkładem drugiej zmiennej
Suma kwadratów (SK2); suma kwadratów w
kolumnach
k – 1 (liczba kolumn minus 1)
) 2 1 (
2 SK SK k
SK
( )
) 2 (
CSK SK
SK SK
Błąd średniego kwadratu
Cząstkowe sumy
kwadratów (CSK) (k-1)(l-1) (kCSK1)(l1) SK(CSK) Ogólna suma
kwadratów OSK kl-1
Tab. 4.6
40
Następnie można przystąpić do obliczania wartości liczbowych określonych w powyższej tablicy na podstawie empirycznych danych zawartych w tablicy zmiennych( tab 4.1). Należy ustalić wartość dwóch wskaźników F dla poszczególnych zmiennych. W tym celu korzystamy z następujących wzorów:
1.
2
1 k 1 x x
SK li
n
i
gdzie:
SK1 - suma kwadratów pierwszej zmiennej eksperymentalnej,
xli - średnia elementów próby odpowiadająca poszczególnym wierszom,
x - średnia ogólna liczona z wzoru:
) /(lk n x
gdzie: n - suma elementów próby odpowiadających poziomowi zmiennej xi i poziomowi zmiennej yj
l - liczba wierszy, k - liczba kolumn.
2.
2
2 l 1 x x
SK k ki
i
gdzie:
SK2 - suma kwadratów drugiej zmiennej eksperymentalnej,
xki- średnia elementów próby odpowiadająca poszczególnym kolumnom,
x - średnia ogólna l - liczba wierszy, k - liczba kolumn
3.
2 1
1
( n x ) OSK
k ijj l
i
gdzie:
OSK -ogólna suma kwadratów,
nij- liczba elementów próby odpowiadających poziomowi zmiennej xi i poziomowi zmiennej yj x - średnia ogólna liczona z wzoru:
l - liczba wierszy, k - liczba kolumn
4.
) 2 1 (SK SK OSK
CSK
gdzie:
CSK – cząstkowe sumy kwadratów OSK - ogólna suma kwadratów,
SK1 - suma kwadratów pierwszej zmiennej eksperymentalnej, SK2 - suma kwadratów drugiej zmiennej eksperymentalnej.
50
Po obliczeniu wskaźników F dla zmiennej eksperymentalnej i drugiej zmiennej należy porównać otrzymane wartości w wartością krytyczną rozkładu F. Wartość ta zależy od stopnia swobody zarówno w liczniku (n), jak i w mianowniku (m) wskaźnika F i od przyjętego poziomu ufności. Wzory do ustalenia wartości liczebników i mianownika są następujące:
n1 = (l - 1)
n1 - liczebnik dla pierwszej zmiennej l - liczba wierszy
n2 = k -1
n2 - liczebnik dla drugiej zmiennej k - liczba kolumn
m = (k - 1)(l - 1) m – mianownik l - liczba wierszy k - liczba kolumn
4.2.1 Zależność preferowanych atrybutów samochodowych od wykształcenia badanych
Celem przeprowadzonej analizy było zbadanie, czy wybór atrybutów samochodowych zależy od wykształcenia badanych. Oto tabela zawierająca wartości otrzymanych pomiarów.
1
0
Wykształcenie Atrybuty yj
Podstawo-
we zawodowe średnie wyższe
Średnie (w wier- szach)
samochodowe xi xl
Wygląd samochodu i jego
elegancja 3 14 87 59 163 41
Wierność firmie 0 4 16 19 39 10
Korzystna cena 4 9 79 44 136 34
Komfort jazdy 5 11 70 60 146 37
Osiągi trakcyjne 2 5 43 43 93 23
Niski poziom hałasu 3 10 42 26 81 20
Obszerne wnętrze 4 13 50 47 114 29
Bezpieczeństwo 4 15 82 58 159 40
Pojemność bagażnika 1 1 22 20 44 11
Pojemność baku 1 4 13 9 27 7
Instalacja gazowa 0 3 6 4 13 3
Wtrysk paliwa 1 12 19 12 44 11
Felgi aluminiowe 2 7 15 9 33 8
Wspomaganie kierownicy 5 10 64 47 126 32
ABS 5 13 64 36 118 30
Automatyczna skrzynia biegów 1 2 16 10 29 7
Poduszka powietrzna dla kierowcy 5 12 61 41 119 30
Poduszka powietrzna dla pasażera 4 7 52 22 85 21
Poduszki powietrzne boczne 1 8 23 9 41 10
Fabryczne zabezpieczenia
przeciwkradzieżowe 5 8 34 23 70 18
Klimatyzacja 2 8 54 29 93 23
Szyberdach 0 2 13 12 27 7
Elektrycznie opuszczane szyby 3 4 21 15 43 11
Elektrycznie regulowane lusterka 0 2 13 3 18 5
Centralny zamek 7 10 50 45 112 28
Komputer pokładowy 2 6 11 8 27 7
70 200 1020 710 2000
Średnie (w kolumnach) xk 3 8 39 27
Tab. 4.7
20
Testowane są więc dwie hipotezy zerowe:
1. H0: Każdy atrybut samochodowy jest jednakowo preferowany przez ankietowanych.
2. H0: Każdy atrybut samochodowy jest jednakowo preferowany przez ankietowanych z wykształceniem wyższym, średnim, zawodowym i podstawowym.
30
Wykonanie tablicy roboczej zawierającej dane wymagające obliczeń..
Rodzaj zależności
Suma kwadratów Stopnie swobody
Średni kwadrat (SK) Wskaźnik F Zależność
między preferowanymi
atrybutami samochodowymi
Suma kwadratów zmiennych eksperymentalnych
(SKA); suma kwadratów w wierszach
l – 1 (liczba wierszy minus 1)
) 1 SK(SKA SKA l
( )
) (
CSK SK
SKA SK
Zależność między wykształceniem
Suma kwadratów (SKW); suma kwadratów w kolumnach
k – 1 (liczba kolumn minus 1)
) 1 SK(SKW SKW k
( )
) (
CSK SK
SKW SK
Błąd średniego kwadratu
Cząstkowe sumy
kwadratów (CSK) (k-1)(l-1) (kCSK1)(l1) SK(CSK) Ogólna suma
kwadratów OSK kl-1
Tablica 4.8
40
Po określeniu odpowiednich wzorów można przystąpić do ich obliczeń:
1. Ogólna średnia:
) /(lk n x
x2000/ (264)19
2. Suma kwadratów zmiennych eksperymentalnych (SKA); suma kwadratów w wierszach (wzór nr 1).
2 1 x x k SKA n li
i
SKA4 41 19 2 10 19 2 34 19 2 7 19 2 14428
3. Suma kwadratów (SKW); suma kwadratów w kolumnach (wzór nr 2).
2 1 x x l
SKW k ki
i
SKW26 3 19 2 8 19 2 39 19 2 27 19 2 21866
4. Ogólna suma kwadratów.
2 1
1
( n x ) OSK
k ijj l
i
OSK 3 19 2 14 19 2 87 19 2 8 19 2 47638
5. Cząstkowe sumy kwadratów (CSK).
) (SKA SKW OSK
CSK
CSK 47638 14428 21866 11344
Otrzymane dane umieszczamy we wcześniej przygotowanej tablicy roboczej i obliczamy wskaźniki F.
Rodzaj zależności Suma
kwadratów Stopnie
swobody Średni kwadrat
(SK) Wskaźnik F
Zależność między
preferowanymi atrybutami samochodowymi
14428 25 14428
25 577 12, 577 12
151 25, 3 82
, ,
Zależność między
wykształceniem 21866 3 21866
3 7288 66, 7288 66
151 25, 48 19
, ,
Błąd średniego kwadratu
11344 75 11344
75 151 25,
Ogólna suma kwadratów
47638 103
Tab. 4.9
50
Dla wskaźnika pierwszej zmiennej o wartości 3,82 obliczamy stopień swobody zarówno w liczniku jak i w mianowniku według wzorów:
n1 = (l - 1); n1 = (26-1) = 25 m = (k - 1)(l - 1); m = (4-1)(26-1) = 75
Wartość krytyczna rozkładu F dla stopnia swobody w liczniku 25 i mianowniku 75 przy poziomie istotności
= 0,01 wynosi 2,07.
Obliczona wartość 3,82 jest większa od wartości odczytanej z tablicy (3,82>2,07), wobec tego odrzucamy pierwsza hipotezę zerową dla zmiennej eksperymentalnej.
Wniosek:
Zidentyfikowane różnice w wyborze atrybutów samochodowych są istotne statystycznie ze względu na rzeczywiste różnice w preferencjach konsumentów.
Dla wskaźnika drugiej zmiennej o wartości 48,19 obliczamy stopień swobody zarówno w liczniku jak i w mianowniku według wzorów:
n2 = (k - 1); n2 = (4-1) = 3
m = (k - 1)(l - 1); m = (4-1)(26-1) = 75
Wartość krytyczna rozkładu F dla stopnia swobody w liczniku 3 i mianowniku 75 przy poziomie istotności
= 0,01 wynosi 4,09.
Obliczona wartość 48,19 jest większa od wartości odczytanej z tablicy (48,19>4,09), wobec tego odrzucamy drugą hipotezę zerową.
Wniosek:
Istnieją istotne różnice miedzy osobami z różnym wykształceniem ze względu na ich preferencje w zakresie atrybutów samochodowych
Analiza wariancji wykazała, że różnice w preferencjach atrybutów samochodowych wśród ankietowanych zależą istotnie od samych cech opisujących samochody jak i od poziomu wykształcenia.
4.3 Test Kołmogorowa - Smirnowa
Przy analizowaniu otrzymanych wyników z ankiety, weryfikacji wymaga często istotność różnic między rozkładem empirycznym, otrzymanym z pomiaru porządkowego, a rozkładem oczekiwanym. Narzędziem służącym tej weryfikacji jest m.in. test Kołmogorowa - Smirnowa (test K-S).
W pierwszej kolejności należy skonstruować hipotezę zerową, która zakłada, że nie ma istotnych różnic między rozkładem otrzymanym z próby, a oczekiwanym rozkładem. Weryfikacja hipotezy obejmuje trzy etapy:
Etap I.
Obliczenie skumulowanego rozkładu częstości otrzymanych z pomiaru próby, po przeliczeniu wartości bezwzględnych, na wartości względne.
Etap II.
Obliczenie skumulowanego rozkładu częstości wynikającego z hipotezy H0. Jeżeli hipoteza zakłada brak istotnych różnic między otrzymanymi wynikami z ankiety wówczas proporcje między poszczególnymi kategoriami skali są sobie równe (suma proporcji zawsze równa 1).
Etap III.
Określenie największej różnicy między wartościami skumulowanego rozkładu empirycznego, a wartościami skumulowanego rozkładu hipotetycznego. Największa różnica jest określana jako wartość D Kołmogorowa - Smirnowa. Wartość ta odnajdujemy w tablicy dla odpowiedniej liczebności próby oraz poziomu istotności24.
Wszystkie wyniki liczbowe otrzymane z realizowania kolejnych etapów zapisuje się w specjalnie sporządzonej w tym celu tabeli.
24 Opracowanie własne na podstawie: S. Kaczmarczyk Badania marketingowe PWE Warszawa’95
4.3.1 Czy najlepszą porą na zakup samochodu jest wiosna?
Hipoteza zerowa zakłada, że określenie wiosny jako najlepszej pory na zakup samochodu osobowego nie powoduje istotnego zróżnicowania opinii respondentów.
Weryfikacja hipotezy obejmująca trzy etapy dała następujące wyniki.
Kategorie skali Liczba
odpowiedziProporcje
Proporcje skumulo-
wane
Proporcje według
Ho
Skumulo- wane proporcje
Ho
Absolutne różnice proporcji empirycznych i skumulowanych
według Ho
Tak 53 0,265 0,265 0,2 0,2 0,065
Raczej tak 53 0,265 0,53 0,2 0,4 0,13
Trudno
powiedzieć 52 0,26 0,79 0,2 0,6 0,19
Raczej nie 30 0,15 0,94 0,2 0,8 0,14
Nie 12 0,06 1 0,2 1 0
RAZEM 200 1 X 1 X X
Tab. 4.10
Największa różnica między wartościami skumulowanego rozkładu empirycznego, a wartościami skumulowanego rozkładu hipotetycznego wynosi 0,19. Z tablicy rozkładu wartości D Kołmogorowa – Smirnowa odczytujemy, że dla n = 200 oraz przy poziomie ufności
= 0,01 jest to liczba1153 , 0 200 63
,
1 . Ponieważ D = 0,19 > 0,1153 dla
= 0,01, są podstawy do odrzucenia hipotezy zerowej.Wniosek:
Wybór wiosny jako najlepszej pory na zakup samochodu osobowego powoduje istotne zróżnicowania opinii respondentów. Jest to różnica wyraźnie statystyczna jaki rzeczywista.
4.3.2 Czy kredytowa forma kupna samochodu jest szczególnie atrakcyjna?
Hipoteza zerowa zakłada, że określenie kredytu jako szczególnie atrakcyjnej formy zapłaty za samochód nie powoduje istotnego zróżnicowania opinii respondentów.
Weryfikacja hipotezy obejmująca trzy etapy dała następujące wyniki.
Kategorie skali Liczba
odpowiedziProporcje
Proporcje skumulo-
wane
Proporcje według
Ho
Skumulo- wane proporcje
Ho
Absolutne różnice proporcji empirycznych i skumulowanych
według Ho
Tak 24 0,12 0,12 0,2 0,2 0,08
Raczej tak 40 0,2 0,32 0,2 0,4 0,08
Trudno
powiedzieć 40 0,2 0,52 0,2 0,6 0,08
Raczej nie 61 0,305 0,825 0,2 0,8 0,025
Nie 35 0,175 1 0,2 1 0
RAZEM 200 1 X 1 X X
Tab. 4.11
Największa różnica między wartościami skumulowanego rozkładu empirycznego, a wartościami skumulowanego rozkładu hipotetycznego wynosi 0,08. Z tablicy rozkładu wartości D Kołmogorowa – Smirnowa odczytujemy, że dla n = 200 oraz przy poziomie ufności
= 0,01 jest to liczba1153 , 0 200 63
,
1 . Ponieważ D = 0,08 < 0,1153 dla
= 0,01, nie ma podstaw do odrzucenia hipotezy zerowej.Wniosek:
Wybór kredytu jako szczególnie atrakcyjnej formy zapłaty za samochód nie powoduje istotnego zróżnicowania opinii respondentów. Nie ma więc istotnych różnic między rozkładem otrzymanym z próby, a oczekiwanym rozkładem.
4.3.3 Czy najlepiej kupić nowe auto z salonu samochodowego?
Hipoteza zerowa zakłada, że chęć zakupu nowego samochodu osobowego z salonu nie powoduje istotnego zróżnicowania opinii respondentów.
Weryfikacja hipotezy obejmująca trzy etapy dała następujące wyniki.
Kategorie skali Liczba
odpowiedziProporcje
Proporcje skumulo-
wane
Proporcje według
Ho
Skumulo- wane proporcje
Ho
Absolutne różnice proporcji empirycznych i skumulowanych
według Ho
Tak 60 0,3 0,3 0,2 0,2 0,1
Raczej tak 61 0,305 0,605 0,2 0,4 0,205
Trudno 34 0,17 0,775 0,2 0,6 0,175
powiedzieć
Raczej nie 33 0,165 0,94 0,2 0,8 0,14
Nie 12 0,06 1 0,2 1 0
RAZEM 200 1 X 1 X X
Tab. 4.12
Największa różnica między wartościami skumulowanego rozkładu empirycznego, a wartościami skumulowanego rozkładu hipotetycznego wynosi 0,205. Z tablicy rozkładu wartości D Kołmogorowa – Smirnowa odczytujemy, że dla n = 200 oraz przy poziomie ufności
= 0,01 jest to liczba1153 , 0 200 63
,
1 . Ponieważ D = 0,205 > 0,1153 dla
= 0,01, są podstawy do odrzucenia hipotezy zerowej.Wniosek:
Wybór między samochodem nowym, a używanym powoduje istotne zróżnicowania opinii respondentów. Jest to różnica wyraźnie statystyczna jaki rzeczywista.