Analiza regresji i korelacji - Metody analizy danych empirycznych na potrzeby marketingu

Metody analizy danych empirycznych na potrzeby marketingu i logistyki

3.1.3. Analiza regresji i korelacji

Celem analiz regresji jest zbadanie zależności występujących między zmienną zależną a jedną lub kilkoma zmiennymi niezależnymi315. W przypadku zmiennych niezależnych najbardziej interesujące jest stwierdzenie rodzaju i siły powiązań mię

dzy poszczególnymi czynnikami. Podziału na zmienne zależne i zmienne niezależ

ne dokonuje się na podstawie występujących związków logicznych, a niestałość zmiennych, określanych mianem niezależnych w czasie i przestrzeni, pozwala określić ich udział w wyjaśnianiu zm iennej zależnej. Analiza regresji zakłada jednocześnie także kierunek zależności, który nie podlega zmianom.

Znaczenie analiz regresji w badaniach marketingowych jest bardzo istotne, ponieważ właśnie w tej sferze znajomość zależności przyczynowo-skutko

wych, które za pomocą tego badania mogą zostać wykazane, jest niezbędna.

Na podstawie analiz regresji można bowiem znaleźć odpowiedzi m.in. na na

stępujące pytania316:

• Jak silny jest wpływ instrum entów marketingowych na wielkość sprzedaży, image produktu oraz stopień jego znajomości?

• Jak zmienia się zm ienna zależna, jaką jest np. wielkość sprzedaży, pod wpływem zmian zastosowanego instrum entarium marketingowego?

• Jak zmienia się wielkość zmiennej zależnej w czasie, jeżeli zastosowane in

strum entarium ma stałą postać?

Punktem wyjścia prostych analiz regresji jest badanie wzajemnych zależności między dwoma zmiennymi, przy czym badania związków i zależności prowa

dzone są na podstawie pewnej liczby obiektów badawczych.

Zestawienie par punktów przypadających na każdy badany obiekt w układzie dwuwymiarowym, którego osie opisane są przez badane zm ienne, prowadzi do powstania wykresu dyspersji. Układ i zagęszczenie punków znajdujących się w przestrzeni dwuwymiarowej uzależnione są od rodzaju i przedm iotu ba

dania. Wykresy dyspersji przedstawiać mogą występowanie równych zależno

ści między zmiennymi (rys. 3.1.3).

Posługując się analizami regresji wytyczymy proste lub krzywe między zazna

czonymi na wykresie punktam i oraz przebieg funkcji (tzn. zależność między zmiennymi zależnymi i niezależnymi), a także jej opis matematyczny.

Na podstawie zaprezentowanych na rys. 3.1.3 wykresów dyspersji stwierdzić mo

żna, że w przypadku I i II istnieją pewne zależności między analizowanymi

315 J. B 1 e y m U 11 e r, G. G e h 1 e r t, H. G ii n 1 i c h e r, Statistik..., op. cit., s. 139 i nn.

316 K. B a c k h a u s, et. al., Multivariante Analysemethoden, 6. Aufl., Berlin 1990, s. 4.

128 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki

zmiennymi. W przypadku zaś wykresu III zależności takich potw ierdzić nie można.

I II III

A i k. A

---► X --- ► X

x = zm ienna niezależna; y = zm ienna zależna.

Rys. 3.1.3. Diagram rozproszenia

Ź r ó d ł o : H. M e f f e r t , Marketingforschung und Ktiuferuerhalten, 2. Aufl., W iesbaden 1992, s. 228.

Zatem - co potwierdzają wykresy - można uznać, że nie istnieje jedna prosta funkcja, którą można by opisać wszystkie możliwe kombinacje zależności między zm iennymi x i y. Toteż najczęściej posługujemy się pewnymi typami funkcji, które w sposób jak najdokładniejszy opisują zależności występujące między badanymi zmiennymi, tzn. tymi, które najlepiej dopasowują się do uzyskanego na wykresie dyspersji empirycznego rozkładu punktów 317.

Zasadniczo rozróżnić można liniowe i nieliniowe typy funkcji, które mogą być je d n o -ja k i wielowymiarowe (tab. 3.1.4)318.

T a b e l a 3.1.4 Typy funkcji stosowane w analizie regresji

~~ — --- — Przebieg funkcji

Liczba analizowanych zmiennvcli Liniowy Nieliniowy

Jedna y = b i+ b 2X y = b,xi‘:

W iele y=bi+b2x2+bixf y - b , +b,x? +btx /

Ź r ó d ł o: H. M e f f e r t , Marketingforschung und Kdufemerhalten, 2. Aufl., Wiesbaden 1992,s. 249.

W badaniach marketingowych i logistycznych najczęstsze zastosowanie znaj

dują funkcje liniowe, w szczególności ze względu na fakt, że319:

• znaczna większość zależności daje się opisać w sposób liniowy;

317 H. M e f f e r t, Marketingforschung..., op. cit., s. 249.

318 W pracy tej omówiono tylko jednowym iarowe analizy regresji.

319 E. S c h a i c h, Schatz- und Testmethoden fu r Sozialwissenschaften, M iinchen 1977, s. 98.

R o z d z i a ł 3. M etody analizy danych empirycznych na potrzeby m arketingu i logistyki 129

• wiele funkcji nieliniowych można sprowadzić do postaci liniowej (np. przez zlogarytmowanie);

• funkcje liniowe są rachunkowo łatwiejsze.

Rys. 3.1.4. Liniowy model regresji

Ź r ó d ł o : H. M e f f e r t , Marketingforschung und Kduferuerhalten, 2. Aufl., Wiesbaden 1992, s. 250.

W przypadku wykorzystania funkcji liniowych (rys. 3.1.4) położenie krzy

wych opisują dwa parametry:

• składnik

bi

opisuje wartość parametru

y

dla wartości

x

0;

• miara wzrostu

b?

określa n a ch y len ie krzyw ej (b ęd ąc ej ta n g e n se m a, kształtującym wraz z osią

x

krzywą regresji).

W związku z tym ogólna funkcja regresji może przyjmować postać320:

y - b, +b2x, y - b , +b2xn

gdzie:

y, - jest funkcją oszacowaną na podstawie estymacji regresji, y - określany jest jako wartość funkcji regresji,

x, - zm ienne niezależne, b i K b z - współczynniki regresji.

320 H. M e f f e r t, Marketingforschung..., op. cit., s. 250.

9 -B a d a n ia ...

130 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki

Odchylenia wartości empirycznych od wartości centralnej są najprawdopodo

bniej wynikiem nieuwzględnienia niektórych czynników albo błędów pomia

ru321. Powstałe różnice między wartościami rzeczywistymi (zaobserwowany

mi) y a wartościami oszacowanymi ytokreślane są mianem odchyleń, oznacza

nych symbolem et.

Bardzom ważne jest oszacowanie parametrów krzywej regresji, aby rozprosze

nie wartości empirycznych wokół niej było jak najmniejsze. W tym celu mini

malizuje się sumy kwadratów najmniejszych odchyleń. Wynika stąd, że para

m etry funkcji regresji szacuje się na podstawie danych statystycznych, z użyciem m etody najmniejszych kwadratów322.

Na podstawie równań uzyskanych m etodą najmniejszych kwadratów mogą zostać określone - dla wspomnianych już badań związanych z zakupem lu

ksusowych samochodów - różnorodne proste funkcje regresji. M odele regre

sji mogą przyczynić się np. do uzyskania odpowiedzi na pytanie: czy prestiż - związany z posiadaniem samochodu luksusowego - wywiera wpływ na wiel

kość zasobów finansowych, którą nabywcy gotowi są wydać na zakup samo

chodu.

W naszym przypadku obliczymy regresję dla motywu, jakim jest prestiż, będącą zm ienną niezależną, a wysokością najwyższych środków finansowych (235 400 zł), które wydane zostały na zakup samochodu. Na podstawie da

nych (pochodzących z badań) podstawionych do wzorów na oszacowanie pa

rametrów bt i b? można napisać równanie regresji:

y = 235 400 - 31 540 x w którym:

y —szacowana wartość najwyższych wydatków na samochód, x - ocena m otywu prestiżu na pięciostopniowej skali ocen.

Funkcja regresji może potwierdzić hipotezę, że gotowość wydatkowania znacz

nych funduszy jest tym wyższa, im większe jest znaczenie motywu prestiżu przy zakupie samochodu. Dla respondenta, u którego motyw prestiżu jest bardzo wysoki, tzn. x=l , szacowana wysokość wydatku maksymalnego wyno

si 203 860 zł (235 400 - 31 540 x=l). Jeżeli motyw prestiżu jako determ inanta zakupu nie ma znaczenia w ogóle, czyli x=5, respondent gotowy jest wydać jedynie 77 700 zł (235 400 - 31 540 x=5). Dodać należy, że wartości szacunko

we funkcji, a także ich niezawodność, uzależnione są od zgodności (siły zależ

ności) między zm iennymi xi y 323.

321 J. B 1 e y m u 11 e r, G. G e h 1 e r t, H. G u n 1 i c h e r, Statistik..., op. cit., s. 143 i nn.

322 M. W a 1 e s i a k, Metody..., op. cit., s. 76.

323 K. B a c k h a u s, et. al., Multwariante..., op. cit., s. 3.

R o z d z i a ł 3. M etody analizy danych empirycznych na potrzeby m arketingu i logistyki 131

W ścisłym związku z analizami regresji pozostają również analizy korelacji324.

Podstawową różnicą między omawianymi analizami jest to, że w rachunku kore

lacyjnym wszystkie badane wielkości są zmiennymi losowymi, czyli punktem ciężkości analiz korelacji nie są analizy zależności, ale związki między dw ie

ma zm iennym i325.

Rachunek korelacyjny wykorzystywany jest najczęściej do ustalania wpływu wybranych czynników na popyt, cenę i inne elem enty oraz oddziaływania tych wielkości na sprzedaż i zyski generowane przez przedsiębiorstwo. M ier

nikiem siły i kierunku zależności występujących między zmiennymi jest współ

czynnik korelacji. Kiedy badane są zależności jedynie między dwiema zmienny

mi, wtedy można mówić o korelacji prostej, jeżeli zaś badane zależności między wieloma zmiennymi - wówczas jest to korelacja wielowymiarowa326.

Pod kątem zależności korelacyjnych zbadane mogą zostać dane mierzone na ska

lach metrycznych i niemetrycznych. Jeżeli dane mają charakter metryczny, wów

czas zastosowanie znajduje współczynnik korelacji Pearsona, ponadto różnorodne współczynniki rangowe, jak np. współczynnik Spearmana327 czy Kendalla.

Wspólną cechą wszystkich współczynników korelacji są ich wartości, które zawsze mieszczą się w przedziale -1-1, gdzie 1 oznacza całkowitą zgodność (w sensie pozytywnym i negatywnym) uporządkowań. Wartość 0 świadczy 0 braku zgodności między uporządkowaniami, a wartość -1 o całkowitej prze- ciwstawności. Zatem: im mniejsza jest zgodność badanych zm iennych, tym wartość współczynnika korelacji jest bliższa O328.

Wróćmy do poprzedniego przykładu: jeżeli obliczony dla zm iennych - presti

żu i maksymalnego wydatku na samochód - współczynnik korelacji wyniósłby +0,25, to można by stwierdzić pozytywną zależność między zmiennymi; cho

ciaż występujące między nimi związki nie są szczególnie silne.

Jeżeli współzależność występującą między zmiennymi można wyrazić linią prostą, to jej siłę oblicza się za pomocą współczynnika korelacji prostoliniowej 1 zapis wygląda tak329:

324 M. H ii 11 n e r, Infonnationen undMarketing-Entscheidungen, M unchen 1979, s. 214.

321 Badania marketingowe..., op. cit., s. 166.

326 H. M e f f e r t, Marketingforschung..., op. cit., s. 252.

327 W spółczynnik rang Spearm ana omówiono w podrozdz. 6.3 . 328 Badania marketingowe..., op. cit., s. 167.

329 H. M e f f e r t, Marketingforschung..., op. cit., s. 253.

132 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki

Ze wzoru na współczynnik korelacji wynika, że określany jest on jako zależ

ność występująca między kowariancją a ilorazem odchyleń standardowych obydwu zmiennych.

Innym sposobem obliczenia wskaźnika korelacji może być również oblicze

nie wskaźnika i2. W tym przypadku współczynnik korelacji określany jest przez dopasowanie oszacowanych wartości funkcji regresji do wartości em pi

rycznych. Wówczas współczynnik przybiera postać330:

2 i-1

r =—

y * - y r

y . - y

W spółczynnik ten może przyjmować jedynie wartości z przedziału 0-1, czyli tym większe, im mniejsze będzie rozproszenie punktów wokół krzywej re

gresji. G dyby obliczony dla naszego przykładu współczynnik r wynosił np.

0,048 (co odpowiada 4,8%), wówczas jedynie 4,8% ogółu zmiennych zależ

nych objaśnianych - wysokość maksymalnych wydatków na samochód - może zostać przypisana motywowi prestiżu. Pozostała część zmiennych zależ

nych, tj. 95,2% wyjaśniona powinna być innymi motywami, nie uwzględnio

nymi w krzywej regresji zmiennych.

Jeżeli otrzymaną wartość współczynnika r 2 spierwiastkujemy, wówczas otrzy

mamy współczynnik korelacji, który, w tym przypadku, wynosi 0,22.

W dokumencie Badania rynkowe w sferze marketingu i logistyki (Stron 128-133)