Metody analizy danych empirycznych na potrzeby marketingu i logistyki
3.1.3. Analiza regresji i korelacji
Celem analiz regresji jest zbadanie zależności występujących między zmienną zależną a jedną lub kilkoma zmiennymi niezależnymi315. W przypadku zmiennych niezależnych najbardziej interesujące jest stwierdzenie rodzaju i siły powiązań mię
dzy poszczególnymi czynnikami. Podziału na zmienne zależne i zmienne niezależ
ne dokonuje się na podstawie występujących związków logicznych, a niestałość zmiennych, określanych mianem niezależnych w czasie i przestrzeni, pozwala określić ich udział w wyjaśnianiu zm iennej zależnej. Analiza regresji zakłada jednocześnie także kierunek zależności, który nie podlega zmianom.
Znaczenie analiz regresji w badaniach marketingowych jest bardzo istotne, ponieważ właśnie w tej sferze znajomość zależności przyczynowo-skutko
wych, które za pomocą tego badania mogą zostać wykazane, jest niezbędna.
Na podstawie analiz regresji można bowiem znaleźć odpowiedzi m.in. na na
stępujące pytania316:
• Jak silny jest wpływ instrum entów marketingowych na wielkość sprzedaży, image produktu oraz stopień jego znajomości?
• Jak zmienia się zm ienna zależna, jaką jest np. wielkość sprzedaży, pod wpływem zmian zastosowanego instrum entarium marketingowego?
• Jak zmienia się wielkość zmiennej zależnej w czasie, jeżeli zastosowane in
strum entarium ma stałą postać?
Punktem wyjścia prostych analiz regresji jest badanie wzajemnych zależności między dwoma zmiennymi, przy czym badania związków i zależności prowa
dzone są na podstawie pewnej liczby obiektów badawczych.
Zestawienie par punktów przypadających na każdy badany obiekt w układzie dwuwymiarowym, którego osie opisane są przez badane zm ienne, prowadzi do powstania wykresu dyspersji. Układ i zagęszczenie punków znajdujących się w przestrzeni dwuwymiarowej uzależnione są od rodzaju i przedm iotu ba
dania. Wykresy dyspersji przedstawiać mogą występowanie równych zależno
ści między zmiennymi (rys. 3.1.3).
Posługując się analizami regresji wytyczymy proste lub krzywe między zazna
czonymi na wykresie punktam i oraz przebieg funkcji (tzn. zależność między zmiennymi zależnymi i niezależnymi), a także jej opis matematyczny.
Na podstawie zaprezentowanych na rys. 3.1.3 wykresów dyspersji stwierdzić mo
żna, że w przypadku I i II istnieją pewne zależności między analizowanymi
315 J. B 1 e y m U 11 e r, G. G e h 1 e r t, H. G ii n 1 i c h e r, Statistik..., op. cit., s. 139 i nn.
316 K. B a c k h a u s, et. al., Multivariante Analysemethoden, 6. Aufl., Berlin 1990, s. 4.
128 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki
zmiennymi. W przypadku zaś wykresu III zależności takich potw ierdzić nie można.
I II III
A i k. A
---► X --- ► X
x = zm ienna niezależna; y = zm ienna zależna.
Rys. 3.1.3. Diagram rozproszenia
Ź r ó d ł o : H. M e f f e r t , Marketingforschung und Ktiuferuerhalten, 2. Aufl., W iesbaden 1992, s. 228.
Zatem - co potwierdzają wykresy - można uznać, że nie istnieje jedna prosta funkcja, którą można by opisać wszystkie możliwe kombinacje zależności między zm iennymi x i y. Toteż najczęściej posługujemy się pewnymi typami funkcji, które w sposób jak najdokładniejszy opisują zależności występujące między badanymi zmiennymi, tzn. tymi, które najlepiej dopasowują się do uzyskanego na wykresie dyspersji empirycznego rozkładu punktów 317.
Zasadniczo rozróżnić można liniowe i nieliniowe typy funkcji, które mogą być je d n o -ja k i wielowymiarowe (tab. 3.1.4)318.
T a b e l a 3.1.4 Typy funkcji stosowane w analizie regresji
~~ — --- — Przebieg funkcji
Liczba analizowanych zmiennvcli Liniowy Nieliniowy
Jedna y = b i+ b 2X y = b,xi‘:
W iele y=bi+b2x2+bixf y - b , +b,x? +btx /
Ź r ó d ł o: H. M e f f e r t , Marketingforschung und Kdufemerhalten, 2. Aufl., Wiesbaden 1992,s. 249.
W badaniach marketingowych i logistycznych najczęstsze zastosowanie znaj
dują funkcje liniowe, w szczególności ze względu na fakt, że319:
• znaczna większość zależności daje się opisać w sposób liniowy;
317 H. M e f f e r t, Marketingforschung..., op. cit., s. 249.
318 W pracy tej omówiono tylko jednowym iarowe analizy regresji.
319 E. S c h a i c h, Schatz- und Testmethoden fu r Sozialwissenschaften, M iinchen 1977, s. 98.
R o z d z i a ł 3. M etody analizy danych empirycznych na potrzeby m arketingu i logistyki 129
• wiele funkcji nieliniowych można sprowadzić do postaci liniowej (np. przez zlogarytmowanie);
• funkcje liniowe są rachunkowo łatwiejsze.
y
Rys. 3.1.4. Liniowy model regresji
Ź r ó d ł o : H. M e f f e r t , Marketingforschung und Kduferuerhalten, 2. Aufl., Wiesbaden 1992, s. 250.
W przypadku wykorzystania funkcji liniowych (rys. 3.1.4) położenie krzy
wych opisują dwa parametry:
• składnik
bi
opisuje wartość parametruy
dla wartościx
=0;
• miara wzrostu
b?
określa n a ch y len ie krzyw ej (b ęd ąc ej ta n g e n se m a, kształtującym wraz z osiąx
krzywą regresji).W związku z tym ogólna funkcja regresji może przyjmować postać320:
y - b, +b2x, y - b , +b2xn
gdzie:
y, - jest funkcją oszacowaną na podstawie estymacji regresji, y - określany jest jako wartość funkcji regresji,
x, - zm ienne niezależne, b i K b z - współczynniki regresji.
320 H. M e f f e r t, Marketingforschung..., op. cit., s. 250.
9 -B a d a n ia ...
130 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki
Odchylenia wartości empirycznych od wartości centralnej są najprawdopodo
bniej wynikiem nieuwzględnienia niektórych czynników albo błędów pomia
ru321. Powstałe różnice między wartościami rzeczywistymi (zaobserwowany
mi) y a wartościami oszacowanymi ytokreślane są mianem odchyleń, oznacza
nych symbolem et.
Bardzom ważne jest oszacowanie parametrów krzywej regresji, aby rozprosze
nie wartości empirycznych wokół niej było jak najmniejsze. W tym celu mini
malizuje się sumy kwadratów najmniejszych odchyleń. Wynika stąd, że para
m etry funkcji regresji szacuje się na podstawie danych statystycznych, z użyciem m etody najmniejszych kwadratów322.
Na podstawie równań uzyskanych m etodą najmniejszych kwadratów mogą zostać określone - dla wspomnianych już badań związanych z zakupem lu
ksusowych samochodów - różnorodne proste funkcje regresji. M odele regre
sji mogą przyczynić się np. do uzyskania odpowiedzi na pytanie: czy prestiż - związany z posiadaniem samochodu luksusowego - wywiera wpływ na wiel
kość zasobów finansowych, którą nabywcy gotowi są wydać na zakup samo
chodu.
W naszym przypadku obliczymy regresję dla motywu, jakim jest prestiż, będącą zm ienną niezależną, a wysokością najwyższych środków finansowych (235 400 zł), które wydane zostały na zakup samochodu. Na podstawie da
nych (pochodzących z badań) podstawionych do wzorów na oszacowanie pa
rametrów bt i b? można napisać równanie regresji:
y = 235 400 - 31 540 x w którym:
y —szacowana wartość najwyższych wydatków na samochód, x - ocena m otywu prestiżu na pięciostopniowej skali ocen.
Funkcja regresji może potwierdzić hipotezę, że gotowość wydatkowania znacz
nych funduszy jest tym wyższa, im większe jest znaczenie motywu prestiżu przy zakupie samochodu. Dla respondenta, u którego motyw prestiżu jest bardzo wysoki, tzn. x=l , szacowana wysokość wydatku maksymalnego wyno
si 203 860 zł (235 400 - 31 540 x=l). Jeżeli motyw prestiżu jako determ inanta zakupu nie ma znaczenia w ogóle, czyli x=5, respondent gotowy jest wydać jedynie 77 700 zł (235 400 - 31 540 x=5). Dodać należy, że wartości szacunko
we funkcji, a także ich niezawodność, uzależnione są od zgodności (siły zależ
ności) między zm iennymi xi y 323.
321 J. B 1 e y m u 11 e r, G. G e h 1 e r t, H. G u n 1 i c h e r, Statistik..., op. cit., s. 143 i nn.
322 M. W a 1 e s i a k, Metody..., op. cit., s. 76.
323 K. B a c k h a u s, et. al., Multwariante..., op. cit., s. 3.
R o z d z i a ł 3. M etody analizy danych empirycznych na potrzeby m arketingu i logistyki 131
W ścisłym związku z analizami regresji pozostają również analizy korelacji324.
Podstawową różnicą między omawianymi analizami jest to, że w rachunku kore
lacyjnym wszystkie badane wielkości są zmiennymi losowymi, czyli punktem ciężkości analiz korelacji nie są analizy zależności, ale związki między dw ie
ma zm iennym i325.
Rachunek korelacyjny wykorzystywany jest najczęściej do ustalania wpływu wybranych czynników na popyt, cenę i inne elem enty oraz oddziaływania tych wielkości na sprzedaż i zyski generowane przez przedsiębiorstwo. M ier
nikiem siły i kierunku zależności występujących między zmiennymi jest współ
czynnik korelacji. Kiedy badane są zależności jedynie między dwiema zmienny
mi, wtedy można mówić o korelacji prostej, jeżeli zaś badane zależności między wieloma zmiennymi - wówczas jest to korelacja wielowymiarowa326.
Pod kątem zależności korelacyjnych zbadane mogą zostać dane mierzone na ska
lach metrycznych i niemetrycznych. Jeżeli dane mają charakter metryczny, wów
czas zastosowanie znajduje współczynnik korelacji Pearsona, ponadto różnorodne współczynniki rangowe, jak np. współczynnik Spearmana327 czy Kendalla.
Wspólną cechą wszystkich współczynników korelacji są ich wartości, które zawsze mieszczą się w przedziale -1-1, gdzie 1 oznacza całkowitą zgodność (w sensie pozytywnym i negatywnym) uporządkowań. Wartość 0 świadczy 0 braku zgodności między uporządkowaniami, a wartość -1 o całkowitej prze- ciwstawności. Zatem: im mniejsza jest zgodność badanych zm iennych, tym wartość współczynnika korelacji jest bliższa O328.
Wróćmy do poprzedniego przykładu: jeżeli obliczony dla zm iennych - presti
żu i maksymalnego wydatku na samochód - współczynnik korelacji wyniósłby +0,25, to można by stwierdzić pozytywną zależność między zmiennymi; cho
ciaż występujące między nimi związki nie są szczególnie silne.
Jeżeli współzależność występującą między zmiennymi można wyrazić linią prostą, to jej siłę oblicza się za pomocą współczynnika korelacji prostoliniowej 1 zapis wygląda tak329:
324 M. H ii 11 n e r, Infonnationen undMarketing-Entscheidungen, M unchen 1979, s. 214.
321 Badania marketingowe..., op. cit., s. 166.
326 H. M e f f e r t, Marketingforschung..., op. cit., s. 252.
327 W spółczynnik rang Spearm ana omówiono w podrozdz. 6.3 . 328 Badania marketingowe..., op. cit., s. 167.
329 H. M e f f e r t, Marketingforschung..., op. cit., s. 253.
132 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki
Ze wzoru na współczynnik korelacji wynika, że określany jest on jako zależ
ność występująca między kowariancją a ilorazem odchyleń standardowych obydwu zmiennych.
Innym sposobem obliczenia wskaźnika korelacji może być również oblicze
nie wskaźnika i2. W tym przypadku współczynnik korelacji określany jest przez dopasowanie oszacowanych wartości funkcji regresji do wartości em pi
rycznych. Wówczas współczynnik przybiera postać330:
2 i-1
r =—
y * - y r
y . - y
W spółczynnik ten może przyjmować jedynie wartości z przedziału 0-1, czyli tym większe, im mniejsze będzie rozproszenie punktów wokół krzywej re
gresji. G dyby obliczony dla naszego przykładu współczynnik r wynosił np.
0,048 (co odpowiada 4,8%), wówczas jedynie 4,8% ogółu zmiennych zależ
nych objaśnianych - wysokość maksymalnych wydatków na samochód - może zostać przypisana motywowi prestiżu. Pozostała część zmiennych zależ
nych, tj. 95,2% wyjaśniona powinna być innymi motywami, nie uwzględnio
nymi w krzywej regresji zmiennych.
Jeżeli otrzymaną wartość współczynnika r 2 spierwiastkujemy, wówczas otrzy
mamy współczynnik korelacji, który, w tym przypadku, wynosi 0,22.