Metody analizy danych empirycznych na potrzeby marketingu i logistyki
3.1. Współzależność zmiennych i metody pomiaru cech
3.1.1. Jednowymiarowa analiza danych marketingowo-logistycznych
E fektem prowadzonych badań jest znaczny zbiór danych empirycznych, któ
re trzeba przygotować, uporządkować i przeanalizować. Takie informacje mogą dopiero służyć za podstawę podejmowania decyzji. Zatem do podsta
wowych zadań etapu badawczego związanego z opracowaniem danych nale
ży286:
• opracowanie planu wartościowania danych niezależnego od postawionych na w stępie celów badawczych - określenie i strukturyzacja podlegających badaniu zależności i związków występujących między poszczególnymi zmiennymi;
• określenie i wybór podstawowych metod analitycznych, które zasadniczo dzielą się na analizy jednowymiarowe, przydatne do badania zależności i związków występujących między jedną lub dwiema zmiennymi oraz na analizy wielowymiarowe, umożliwiające badanie szerokiego spektrum zależ
ności występujących między wieloma zmiennymi;
• interpretacja i ocena uzyskanych wyników.
286 H. M e f f e r t, Marketingforschung..., op. cit., s. 243.
R o z d z i a ł 3. M etody analizy danych empirycznych na potrzeby m arketingu i logistyki 115
W dalszej części niniejszego opracowania przedstawione zostaną jedynie nie
które metody badawcze, a ich charakterystyka obejmować będzie procedury analityczne oraz praktyczne wskazania możliwości ich zastosowania.
Aby łatwiej było zrozumieć omawiane metody analityczne, posłużmy się hi
potetycznym przykładem: jakimi motywami kierują się nabywcy, dokonując zakupu luksusowego samochodu - badaniami objęto 150 respondentów od
wiedzających salon samochodowy X; ze względu na różnorodne wymagania jakościowe i kryterium wiekowe dobór próby badawczej był reprezentatyw ny. Na podstawie badań udało się wyłonić kilka podstawowych motywów za
kupów, które zaprezentowane są w tab. 3.1.1. Na rysunku 3.1.1. zaznaczono również przeciętne oceny przyznane poszczególnym motywom przez wszy
stkich respondentów.
Rys. 3.1.1. Znaczenie podstawowych motywów jako determ inanta zakupu luksusowego samochodu
Ź r ó d ł o : Opracowanie własne.
Jeżeli w przeprowadzanych analizach skoncentrujem y się na badaniu zależ
ności występujących między jedną lub dwiema zmiennymi, w tedy zastosowa
nie znajdują, jak już wspomniano, analizy jednowym iarowe287.
Analizami jednowymiarowymi posługujemy się w badaniach wpływu jednej zmiennej na wszystkie badane obiekty. Tego typu analizy należą do podsta
wowych narzędzi badawczych, przy czym wybór poszczególnych m etod jest uzależniony m.in. od zastosowanej skali pomiaru zm iennych288.
Kiedy zm ienne zostały wyskalowane, np. za pomocą skali nominalnej, wów
czas analiza danych ogranicza się, z reguły, do określenia względnej i bez
względnej częstotliwości występowania badanej zmiennej. W przypadku zaś
287 J. B 1 e y m ii 11 e r, G. G e h 1 e r t, H. G ii n 1 i c h e r, Statistik..., op. cit., s. 24.
288 M. W a 1 e s i a k, Metody..., op. cit., s. 49.
116 C Z Ę Ś Ć I. Podstawow e informacje o badaniach w dziedzinie m arketingu i logistyki
zastosowania skal bardziej złożonych, określić można wartość środkową, do
m inantę i odchylenie standardowe.
Posługując się teraz zaprezentowanym na początku przykładem, można określić częstotliwość występowania motywu, jakim jest np. chęć samorealizacji. Uzyska
ne z badań informacje wykażą częstotliwość występowania jak w tab. 3.1.1 T a b e l a 3.1.1 samorealizacji jest motywem stosunkowo mało istotnym, gdyż jedynie 21,2%
respondentów określiło go jako ważny bądź bardzo ważny, podczas gdy aż 54,2% uznało ten motyw za mało czy w ogóle nieistotny.
Z zaprezentowanej tabeli 3.1.1 wynika, że najliczniejsza jest grupa respon
dentów, na którą nie wpływa motyw samorealizacji przy zakupie samochodu luksusowego. Interesującym zagadnieniem z punktu widzenia przedsiębior
stwa byłoby także określenie, dla której grupy wiekowej ten motyw posiada najmniejsze znaczenie. W tym celu należy określić dominantę, która jest ka
tegorią zm iennej najczęściej występującej (tab. 3.1.2). Ponieważ na 150 naby
wców 81 (najliczniejsza grupa) nie motywowało decyzji zakupu samochodu samorealizacją, rozpatrywać można jedynie tę grupę.
T a b e l a 3.1.2
R o z d z i a ł 3. M etody analizy danych em pirycznych na potrzeby m arketingu i logistyki 117
Klasę dom inanty stanowi 45 nabywców; jej wartość wynosi 46,2 i wynika ze wzoru 289.
L/j - dolna granica przedziału, w którym znajduje się dominanta,
di - różnica w liczbie nabywców między klasą dom inanty a przedziałem ją poprzedzającym,
d? - różnica w liczbie nabywców między klasą dom inanty a przedziałem po niej następującym ,
Wi) - rozpiętość przedziału dominanty.
Analiza wyniku dominanty wskazuje, że najliczniejszą grupę, której motywy samorealizacji nie dotyczą, stanowią respondenci w wieku 46,2 lat.
Często stosowanym instrum entem analitycznym jest również odchylenie standardowe, które wskazuje różnicę między średnią wartością badanej zmiennej a średnią arytmetyczną całej badanej zbiorowości (im większe wew
nętrzne zróżnicowanie badanej zbiorowości, tym większe jest odchylenie standardowe). O dchylenie standardowe charakteryzuje się kilkoma podsta
wowymi cechami, m.in.290:
• niezmiennością - kiedy do każdej wartości zm iennej dodamy pewną war
tość stałą (ze zbioru liczb rzeczywistych);
• n-krotną zmianą - w przypadku przem nożenia jego wartości przez dodatnią liczbę n, należącą do zbioru liczb rzeczywistych;
• niemożnością jego obliczenia - w sytuacji otwartości przedziałów szeregu rozdzielczego;
• uzależnieniem od wszystkich obserwacji;
• utratą znaczenia - w sytuacji rozkładów silnie asymetrycznych.
Odchylenie standardowe oblicza się według wzoru:
d, d . ~v d
gdzie:
2
\ /
gdzie:
S 2 - odchylenie standardowe, n0 - liczebność próby,
x - średnia arytm etyczna zm iennej w badanej zbiorowości.
289 Ibidem , s. 50.
290 Ibidem , s. 54.
118 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki
Z deskrypcyjną analizą częstotliwości występowania badanej cechy ściśle związana jest również tabulacja krzyżowa, która umożliwia dwuwymiarową analizę częstotliwości. Tablice takie określane są jako tabele wielodzielcze.
Sprawdźmy zatem, jaki jest związek między standardem i jakością nabywa
nych samochodów (w klasie samochodów luksusowych) a dochodami osiąga
nymi przez nabywców (tab. 3.1.3).
Na podstawie sporządzonej tablicy wielodzielczej (kontyngencji) mamy moż
liwość określenia tzw. współczynnika wielodzielczości, który określa miary zależności statystycznych występujące między dwiema badanymi zm ienny
mi.
T a b e l a 3.1.3 Przykład tabulacji wielodzielczej
Standard sam ochodu Wysokość dochodów [tys. zł]
Razem
3 -5 6-8 9-11 12 i więcej
Luksusow y szt. 7 9 13 18 47
N (12,22)* (11,8) (11,5) (11,9)
Standardow y szt. 15 13 11 9 48
N (12,48) (11,52) (11,84) (12,16)
T ani szt. 17 14 13 11 55
N (14,3) (13,2) (13,56) (13,93)
Razem 39 36 37 38 150
W artość została policzona ze wzoru na liczebność hipotetyczną N:
39-47
=
12,22
N hy = -150
Ź r ó d ł o : Opracowanie własne.
Prawidłowo skonstruowana miara zależności przyjmować powinna wartości z przedziału 0-1. Jeżeli współczynnik osiągnie wartość 0, wówczas można po
wiedzieć o całkowitej niezależności badanych zmiennych, wartość 1 będzie świadczyć o całkowitej zależności zmiennych. Do pomiaru siły związku między dwiema zmiennymi stosuje się najczęściej miary oparte na statystyce do których zaliczyć możemy: współczynnik średniej kwadratowej, współczynnik Pearsona, współczynnik Czuprowa oraz współczynnik Cramera291.
Tablica kontyngencji jest podstawą do weryfikacji nieparametrycznej hipote
zy zerowej: pobrana próba statystyczna pochodzi z populacji generalnej, w której w ystępuje niezależność badanych zmiennych. W teście niezależno
291 S. K a c z m a r c z y k, Badania..., op. cit., s. 347 i nn.
R o z d z i a ł 3. M etody analizy danych empirycznych na potrzeby m arketingu i logistyki 119
ści y f formułuje się hipotezę zerową H 0 i hipotezę alternatywną ///. H ipotezy te brzmią:
• hipoteza zerowa - badane zm ienne są od siebie niezależne,
• hipoteza alternatywna - badane zm ienne są od siebie zależne.
Do sprawdzenia prawidłowości hipotezy zerowej najczęściej wykorzystuje się statystykę X2', która określana jest wzorem:292
n M. - liczebność w otrzym anym rozkładzie empirycznym, N u - - liczebność hipotetyczna w rozkładzie oczekiwanym.
Przy założeniu, że hipoteza zerowa jest prawdziwa, liczebności hipotetyczne określa się ze wzoru:
Dodać jednocześnie należy, że statystyka chi-kwadrat ma - przy założeniu prawdziwości hipotezy zerowej - rozkład y f z (h'-l) (h-1) stopniami swobody.
Wartość krytyczną będącą wartością statystyki odpowiadającej danem u pozio
mowi istotności / 2a odczytuje się z tablic rozkładu ^ d l a ustalonego poziomu istotności a oraz (h-1) (h'-l) poziomu stopni swobody. H ipotezę zerową odrzu
cić należy wówczas, gdy zachodzi zależność j 2 — x l - W przypadku zaś wystąpienia sytuacji odwrotnej nie ma powodu, aby hipotezę zerową odrzucić.
Wróćmy zatem do przykładu zaprezentowanego w tabeli 3.1.3 i postarajmy się określić, jaka jest zależność między obydwiema badanymi zmiennymi. Aby można było obliczyć statystykę x 2, należy najpierw określić liczebności hipote
tyczne N d\a. każdej wartości zm iennej (wartości te podane są w nawiasach).
Wartość statystyki ^ w y n o s i 9,35. H ipotezę zerową mówiącą o niezależności dochodów od standardu i jakości nabywanych samochodów luksusowych moż
na uznać za prawdziwą, ponieważ, dla przyjętego poziomu istotności a = 0,05 oraz (3-1) (4-1) = 6 stopni swobody, wartość statystyki empirycznej jest m niej
sza od wartości statystyki teoretycznej, wynoszącej 12,59.
gdzie:
n
’92 M. W a 1 e s i a k, Metody..., op. cit., s. 61.
120 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki
Teraz możemy przystąpić do obliczenia sity związku między badanymi zm ienny
mi. W tym celu wykorzystamy współczynnik Pearsona, który przybiera postać293:
p z _ X
n+X 2
W naszym przypadku współczynnik ten wynosi 0,08, co świadczy o prawie całkowitej niezależności dochodów od standardu nabywanych samochodów luksusowych.