• Nie Znaleziono Wyników

Analiza regresji i korelacji

Metody analizy danych empirycznych na potrzeby marketingu i logistyki

3.1.3. Analiza regresji i korelacji

Celem analiz regresji jest zbadanie zależności występujących między zmienną zależną a jedną lub kilkoma zmiennymi niezależnymi315. W przypadku zmiennych niezależnych najbardziej interesujące jest stwierdzenie rodzaju i siły powiązań mię­

dzy poszczególnymi czynnikami. Podziału na zmienne zależne i zmienne niezależ­

ne dokonuje się na podstawie występujących związków logicznych, a niestałość zmiennych, określanych mianem niezależnych w czasie i przestrzeni, pozwala określić ich udział w wyjaśnianiu zm iennej zależnej. Analiza regresji zakłada jednocześnie także kierunek zależności, który nie podlega zmianom.

Znaczenie analiz regresji w badaniach marketingowych jest bardzo istotne, ponieważ właśnie w tej sferze znajomość zależności przyczynowo-skutko­

wych, które za pomocą tego badania mogą zostać wykazane, jest niezbędna.

Na podstawie analiz regresji można bowiem znaleźć odpowiedzi m.in. na na­

stępujące pytania316:

• Jak silny jest wpływ instrum entów marketingowych na wielkość sprzedaży, image produktu oraz stopień jego znajomości?

• Jak zmienia się zm ienna zależna, jaką jest np. wielkość sprzedaży, pod wpływem zmian zastosowanego instrum entarium marketingowego?

• Jak zmienia się wielkość zmiennej zależnej w czasie, jeżeli zastosowane in­

strum entarium ma stałą postać?

Punktem wyjścia prostych analiz regresji jest badanie wzajemnych zależności między dwoma zmiennymi, przy czym badania związków i zależności prowa­

dzone są na podstawie pewnej liczby obiektów badawczych.

Zestawienie par punktów przypadających na każdy badany obiekt w układzie dwuwymiarowym, którego osie opisane są przez badane zm ienne, prowadzi do powstania wykresu dyspersji. Układ i zagęszczenie punków znajdujących się w przestrzeni dwuwymiarowej uzależnione są od rodzaju i przedm iotu ba­

dania. Wykresy dyspersji przedstawiać mogą występowanie równych zależno­

ści między zmiennymi (rys. 3.1.3).

Posługując się analizami regresji wytyczymy proste lub krzywe między zazna­

czonymi na wykresie punktam i oraz przebieg funkcji (tzn. zależność między zmiennymi zależnymi i niezależnymi), a także jej opis matematyczny.

Na podstawie zaprezentowanych na rys. 3.1.3 wykresów dyspersji stwierdzić mo­

żna, że w przypadku I i II istnieją pewne zależności między analizowanymi

315 J. B 1 e y m U 11 e r, G. G e h 1 e r t, H. G ii n 1 i c h e r, Statistik..., op. cit., s. 139 i nn.

316 K. B a c k h a u s, et. al., Multivariante Analysemethoden, 6. Aufl., Berlin 1990, s. 4.

128 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki

zmiennymi. W przypadku zaś wykresu III zależności takich potw ierdzić nie można.

I II III

A i k. A

---► X --- ► X

x = zm ienna niezależna; y = zm ienna zależna.

Rys. 3.1.3. Diagram rozproszenia

Ź r ó d ł o : H. M e f f e r t , Marketingforschung und Ktiuferuerhalten, 2. Aufl., W iesbaden 1992, s. 228.

Zatem - co potwierdzają wykresy - można uznać, że nie istnieje jedna prosta funkcja, którą można by opisać wszystkie możliwe kombinacje zależności między zm iennymi x i y. Toteż najczęściej posługujemy się pewnymi typami funkcji, które w sposób jak najdokładniejszy opisują zależności występujące między badanymi zmiennymi, tzn. tymi, które najlepiej dopasowują się do uzyskanego na wykresie dyspersji empirycznego rozkładu punktów 317.

Zasadniczo rozróżnić można liniowe i nieliniowe typy funkcji, które mogą być je d n o -ja k i wielowymiarowe (tab. 3.1.4)318.

T a b e l a 3.1.4 Typy funkcji stosowane w analizie regresji

~~ — --- — Przebieg funkcji

Liczba analizowanych zmiennvcli Liniowy Nieliniowy

Jedna y = b i+ b 2X y = b,xi‘:

W iele y=bi+b2x2+bixf y - b , +b,x? +btx /

Ź r ó d ł o: H. M e f f e r t , Marketingforschung und Kdufemerhalten, 2. Aufl., Wiesbaden 1992,s. 249.

W badaniach marketingowych i logistycznych najczęstsze zastosowanie znaj­

dują funkcje liniowe, w szczególności ze względu na fakt, że319:

• znaczna większość zależności daje się opisać w sposób liniowy;

317 H. M e f f e r t, Marketingforschung..., op. cit., s. 249.

318 W pracy tej omówiono tylko jednowym iarowe analizy regresji.

319 E. S c h a i c h, Schatz- und Testmethoden fu r Sozialwissenschaften, M iinchen 1977, s. 98.

R o z d z i a ł 3. M etody analizy danych empirycznych na potrzeby m arketingu i logistyki 129

• wiele funkcji nieliniowych można sprowadzić do postaci liniowej (np. przez zlogarytmowanie);

• funkcje liniowe są rachunkowo łatwiejsze.

y

Rys. 3.1.4. Liniowy model regresji

Ź r ó d ł o : H. M e f f e r t , Marketingforschung und Kduferuerhalten, 2. Aufl., Wiesbaden 1992, s. 250.

W przypadku wykorzystania funkcji liniowych (rys. 3.1.4) położenie krzy­

wych opisują dwa parametry:

• składnik

bi

opisuje wartość parametru

y

dla wartości

x

=

0;

• miara wzrostu

b?

określa n a ch y len ie krzyw ej (b ęd ąc ej ta n g e n se m a, kształtującym wraz z osią

x

krzywą regresji).

W związku z tym ogólna funkcja regresji może przyjmować postać320:

y - b, +b2x, y - b , +b2xn

gdzie:

y, - jest funkcją oszacowaną na podstawie estymacji regresji, y - określany jest jako wartość funkcji regresji,

x, - zm ienne niezależne, b i K b z - współczynniki regresji.

320 H. M e f f e r t, Marketingforschung..., op. cit., s. 250.

9 -B a d a n ia ...

130 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki

Odchylenia wartości empirycznych od wartości centralnej są najprawdopodo­

bniej wynikiem nieuwzględnienia niektórych czynników albo błędów pomia­

ru321. Powstałe różnice między wartościami rzeczywistymi (zaobserwowany­

mi) y a wartościami oszacowanymi ytokreślane są mianem odchyleń, oznacza­

nych symbolem et.

Bardzom ważne jest oszacowanie parametrów krzywej regresji, aby rozprosze­

nie wartości empirycznych wokół niej było jak najmniejsze. W tym celu mini­

malizuje się sumy kwadratów najmniejszych odchyleń. Wynika stąd, że para­

m etry funkcji regresji szacuje się na podstawie danych statystycznych, z użyciem m etody najmniejszych kwadratów322.

Na podstawie równań uzyskanych m etodą najmniejszych kwadratów mogą zostać określone - dla wspomnianych już badań związanych z zakupem lu­

ksusowych samochodów - różnorodne proste funkcje regresji. M odele regre­

sji mogą przyczynić się np. do uzyskania odpowiedzi na pytanie: czy prestiż - związany z posiadaniem samochodu luksusowego - wywiera wpływ na wiel­

kość zasobów finansowych, którą nabywcy gotowi są wydać na zakup samo­

chodu.

W naszym przypadku obliczymy regresję dla motywu, jakim jest prestiż, będącą zm ienną niezależną, a wysokością najwyższych środków finansowych (235 400 zł), które wydane zostały na zakup samochodu. Na podstawie da­

nych (pochodzących z badań) podstawionych do wzorów na oszacowanie pa­

rametrów bt i b? można napisać równanie regresji:

y = 235 400 - 31 540 x w którym:

y —szacowana wartość najwyższych wydatków na samochód, x - ocena m otywu prestiżu na pięciostopniowej skali ocen.

Funkcja regresji może potwierdzić hipotezę, że gotowość wydatkowania znacz­

nych funduszy jest tym wyższa, im większe jest znaczenie motywu prestiżu przy zakupie samochodu. Dla respondenta, u którego motyw prestiżu jest bardzo wysoki, tzn. x=l , szacowana wysokość wydatku maksymalnego wyno­

si 203 860 zł (235 400 - 31 540 x=l). Jeżeli motyw prestiżu jako determ inanta zakupu nie ma znaczenia w ogóle, czyli x=5, respondent gotowy jest wydać jedynie 77 700 zł (235 400 - 31 540 x=5). Dodać należy, że wartości szacunko­

we funkcji, a także ich niezawodność, uzależnione są od zgodności (siły zależ­

ności) między zm iennymi xi y 323.

321 J. B 1 e y m u 11 e r, G. G e h 1 e r t, H. G u n 1 i c h e r, Statistik..., op. cit., s. 143 i nn.

322 M. W a 1 e s i a k, Metody..., op. cit., s. 76.

323 K. B a c k h a u s, et. al., Multwariante..., op. cit., s. 3.

R o z d z i a ł 3. M etody analizy danych empirycznych na potrzeby m arketingu i logistyki 131

W ścisłym związku z analizami regresji pozostają również analizy korelacji324.

Podstawową różnicą między omawianymi analizami jest to, że w rachunku kore­

lacyjnym wszystkie badane wielkości są zmiennymi losowymi, czyli punktem ciężkości analiz korelacji nie są analizy zależności, ale związki między dw ie­

ma zm iennym i325.

Rachunek korelacyjny wykorzystywany jest najczęściej do ustalania wpływu wybranych czynników na popyt, cenę i inne elem enty oraz oddziaływania tych wielkości na sprzedaż i zyski generowane przez przedsiębiorstwo. M ier­

nikiem siły i kierunku zależności występujących między zmiennymi jest współ­

czynnik korelacji. Kiedy badane są zależności jedynie między dwiema zmienny­

mi, wtedy można mówić o korelacji prostej, jeżeli zaś badane zależności między wieloma zmiennymi - wówczas jest to korelacja wielowymiarowa326.

Pod kątem zależności korelacyjnych zbadane mogą zostać dane mierzone na ska­

lach metrycznych i niemetrycznych. Jeżeli dane mają charakter metryczny, wów­

czas zastosowanie znajduje współczynnik korelacji Pearsona, ponadto różnorodne współczynniki rangowe, jak np. współczynnik Spearmana327 czy Kendalla.

Wspólną cechą wszystkich współczynników korelacji są ich wartości, które zawsze mieszczą się w przedziale -1-1, gdzie 1 oznacza całkowitą zgodność (w sensie pozytywnym i negatywnym) uporządkowań. Wartość 0 świadczy 0 braku zgodności między uporządkowaniami, a wartość -1 o całkowitej prze- ciwstawności. Zatem: im mniejsza jest zgodność badanych zm iennych, tym wartość współczynnika korelacji jest bliższa O328.

Wróćmy do poprzedniego przykładu: jeżeli obliczony dla zm iennych - presti­

żu i maksymalnego wydatku na samochód - współczynnik korelacji wyniósłby +0,25, to można by stwierdzić pozytywną zależność między zmiennymi; cho­

ciaż występujące między nimi związki nie są szczególnie silne.

Jeżeli współzależność występującą między zmiennymi można wyrazić linią prostą, to jej siłę oblicza się za pomocą współczynnika korelacji prostoliniowej 1 zapis wygląda tak329:

324 M. H ii 11 n e r, Infonnationen undMarketing-Entscheidungen, M unchen 1979, s. 214.

321 Badania marketingowe..., op. cit., s. 166.

326 H. M e f f e r t, Marketingforschung..., op. cit., s. 252.

327 W spółczynnik rang Spearm ana omówiono w podrozdz. 6.3 . 328 Badania marketingowe..., op. cit., s. 167.

329 H. M e f f e r t, Marketingforschung..., op. cit., s. 253.

132 C Z Ę Ś Ć I. Podstaw ow e informacje o badaniach w dziedzinie m arketingu i logistyki

Ze wzoru na współczynnik korelacji wynika, że określany jest on jako zależ­

ność występująca między kowariancją a ilorazem odchyleń standardowych obydwu zmiennych.

Innym sposobem obliczenia wskaźnika korelacji może być również oblicze­

nie wskaźnika i2. W tym przypadku współczynnik korelacji określany jest przez dopasowanie oszacowanych wartości funkcji regresji do wartości em pi­

rycznych. Wówczas współczynnik przybiera postać330:

2 i-1

r =—

y * - y r

y . - y

W spółczynnik ten może przyjmować jedynie wartości z przedziału 0-1, czyli tym większe, im mniejsze będzie rozproszenie punktów wokół krzywej re­

gresji. G dyby obliczony dla naszego przykładu współczynnik r wynosił np.

0,048 (co odpowiada 4,8%), wówczas jedynie 4,8% ogółu zmiennych zależ­

nych objaśnianych - wysokość maksymalnych wydatków na samochód - może zostać przypisana motywowi prestiżu. Pozostała część zmiennych zależ­

nych, tj. 95,2% wyjaśniona powinna być innymi motywami, nie uwzględnio­

nymi w krzywej regresji zmiennych.

Jeżeli otrzymaną wartość współczynnika r 2 spierwiastkujemy, wówczas otrzy­

mamy współczynnik korelacji, który, w tym przypadku, wynosi 0,22.