Przeprowadzić w swojej grupie ćwiczeniowej badanie dotyczące kwestii posiadania, częstości korzystania oraz wad i zalet korzystania

z kuchenki mikrofalowej. Zaproponować sposób pomiaru. Dokonać analizy i interpretacji uzyskanych wyników.

145

11. ANALIZA I INTERPRETACJA DANYCH – ANALIZA KORELACJI I REGRESJI

11.1. Analiza korelacji

Badając zjawiska, czasami stwierdzić można, że konkretne zjawisko jest przyczynowo uwarunkowane innym (lub innymi). Stwierdzenie istnienia współzależności zjawisk odnosi się do sytuacji, w której zmiany natężenia jednego zjawiska wywołują zmiany w natężeniu drugiego zjawiska. Uwzględniając liczbę zmiennych oraz skalę ich pomiaru można dokonać podziału metod analizy korelacji jak na poniższym rysunku.

Rys. 23. Podział metod analizy korelacji

Źródło: S. Mynarski, Metody ilościowe i jakościowe badań rynkowych i marketingowych, http://www.statsoft.pl/czytelnia (12.03.2010 r.)

Zazwyczaj na przedmiocie „statystyka opisowa” studenci rozpoczy-nają analizę zależności od sporządzenia korelacyjnego wykresu rozrzutu (o ile jest to możliwe). W prostokątnym układzie współrzędnych na osi odciętych zaznaczamy wartości tej cechy, którą określamy jako zmienną niezależną (inaczej zmienną objaśniającą). Na osi rzędnych zaznaczamy wartości cechy określanej mianem zmiennej zależnej (zmienna obja-śniana). Korelacja dodatnia występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada wzrost średnich wartości drugiej cechy. Korelacja

Yule’a Q Kendalla C Pearsona V Cramera T Czuprowa Goldmana Kruskala KORELACJE S K A L E DWIE ZMIENNE PRZEDZIAŁOWA I ILORAZOWA PORZĄDKOWA NOMINALNA

TRZY i WIĘCEJ ZMIENNYCH

PORZĄDKOWA PRZEDZIAŁOWA I ILORAZOWA τ Kendalla Spearmana R Pearsona η (stosunek korelacyjny) Współczynnik wielorakiej korelacji rangowej Kendalla Współczynnik korelacji cząstkowej Kendalla Współczynnik korelacji wielorakiej R Pearsona Współczynnik korelacji cząstkowej Pearsona

146

ujemna występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada spadek średnich wartości drugiej cechy.

Najliczniejszą grupę metod analizy korelacji stanowią miary korelacji dla dwóch zmiennych nominalnych. W grupie tej znajdują zastosowanie

proste współczynniki: Yule'a, Q-Kendalla, T-Czuprowa, V-Cramera czy C-Pearsona. W przypadku mierzonych przynajmniej na skali porządkowej

(rangowej) najczęściej wykorzystywaną miarą korelacji jest współczynnik korelacji rang Kendalla oraz współczynnik korelacji rang R Spearmana. Współczynnik ten może być z powodzeniem wykorzystywany do badania profilów zbudowanych na zasadzie dyferencjału semantycznego, tj. tam, gdzie można uporządkować natężenie cechy (od najmniejszego do maksy-malnego). Gdy dwie zmienne mierzone są na skali przedziałowej lub ilorazowej najczęściej wykorzystywaną miarą korelacji jest współczynnik korelacji liniowej r-Pearsona oraz stosunek korelacyjny . Jeśli z kolei trzy i więcej zmiennych jest mierzonych na skali przedziałowej lub ilorazowej,

wówczas znajdują zastosowanie współczynniki korelacji wielorakiej R-Pearsona i współczynniki korelacji cząstkowej Pearsona.

11.2. Współczynniki korelacji – dwie zmienne nominalne

Zakładając, że współzależność badanych zmiennych jest statystycznie istotna, można określić siłę tej zależności za pomocą miar wyprowadzonych ze statystyki χ2 (np. za pomocą współczynnika zbieżności T-Czuprowa). Zaletą współczynnika zbieżności T-Czuprowa jest to, że może on być stosowany zarówno do mierzenia korelacji zmiennych mierzalnych jak i niemierzalnych. Wadą współczynnika zbieżności T-Czuprowa jest to, że nie mierzy kierunku korelacji, bowiem bez względu na to, czy korelacja jest dodatnia czy ujemna, współczynnik ten jest liczbą z przedziału <0,1>. Więcej informacji na temat współczynnika zbieżności T-Czuprowa znajduje się w podrozdziale 13.4 poświęconemu testowi niezależności.

11.3. Współczynniki korelacji – dwie zmienne mierzone na skali porządkowej

Załóżmy, że mamy n jednostek (obiektów) opisanych za pomocą dwóch cech. Jednostki można uporządkować ze względu na wartości każdej cechy oddzielnie. Numery określające miejsce jednostki w uporządkowaniu nazywa się rangami, a procedurę nadawania rang – rangowaniem. Dla uproszczenia przyjmijmy, że porządkujemy jednostki malejąco. W przy-padku mierzonych przynajmniej na skali porządkowej (rangowej) naj-częściej wykorzystywaną miarą korelacji jest współczynnik korelacji rang Kendalla oraz współczynnik korelacji rang R Spearmana.

147

)

1 (

6

1

₂¹ 2

−

= ∑

n

d

r

n i i s

Współczynnik korelacji rang Spearmana wyznacza się ze wzoru:

gdzie di – różnice między rangami odpowiadających sobie wartości cechy xi i cechy yi (i=1, …, n). W sytuacji, gdy wystąpią jednakowe wartości cechy dla różnych jednostek, przypisuje się tym jednostkom wartości równe średniej arytmetycznej z kolejnych rang.

Współczynnik korelacji rang Spearmana służy do opisu siły korelacji dwóch cech w przypadku gdy:

• cechy są mierzalne, a badana zbiorowość jest nieliczna,

• cechy mają charakter jakościowy i istnieje możliwość ich uporząd-kowania.

Współczynnik korelacji rang Spearmana przyjmuje wartości z przedziału <-1, 1>. Znak współczynnika korelacji informuje o kierunku korelacji („+” oznacza korelację dodatnią, a „–” korelację ujemną). Wartość

bez-względna współczynnika korelacji informuje o sile związku – im bliżej r_s jest liczby 1, tym silniejsza jest badana zależność. Wartość współczynnika korelacji rang bliska zera (r_XY≈0) oznacza brak zależności.

Współczynnik korelacji rang

τ

Kendalla daje ocenę podobieństwa uporządkowań zbioru danych dla dwóch zmiennych mierzonych na skali

porządkowej. Współczynnik Kendalla przyjmuje wartości z przedziału <-1,1>. Wartość 1 oznacza pełną zgodność uporządkowań, wartość 0 brak

zgodności, a wartość -1 pełną ich przeciwstawność. Współczynnik korelacji rang τ Kendalla zostanie wyznaczony według następującej procedury. Najpierw próbę należy uporządkować w taki sposób, aby rangi jednej z cech (np. X) ustawione były w kolejności naturalnej (1, 2, 3, ..., n), a rangi drugiej cechy (np. Y) odpowiadały rangom pierwszej cechy z pierwszego ułożenia. Następnie oblicza się różnice pomiędzy kolejnymi rangami.

Współczynnik korelacji rang τ Kendalla występuje w trzech wariantach: •

τ

_a dla rang niepowiązanych

•

τ

_b dla rang powiązanych

•

τ

_c dla rang powiązanych w układzie tablicowym116.

116 S. Mynarski, Praktyczne metody analizy danych rynkowych i marketingowych, Kantor Zakamycze, Zakamycze 2000, s. 136.

148

Współczynnik korelacji rang τ Kendalla oblicza się według następującego wzoru: 2 ) 1 ( − − = n n Q P a

τ

W dokumencie Podstawy statystyczne badań marketingowych : skrypt dla studentów (Stron 143-148)