z kuchenki mikrofalowej. Zaproponować sposób pomiaru. Dokonać analizy i interpretacji uzyskanych wyników.
145
11. ANALIZA I INTERPRETACJA DANYCH – ANALIZA KORELACJI I REGRESJI
11.1. Analiza korelacji
Badając zjawiska, czasami stwierdzić można, że konkretne zjawisko jest przyczynowo uwarunkowane innym (lub innymi). Stwierdzenie istnienia współzależności zjawisk odnosi się do sytuacji, w której zmiany natężenia jednego zjawiska wywołują zmiany w natężeniu drugiego zjawiska. Uwzględniając liczbę zmiennych oraz skalę ich pomiaru można dokonać podziału metod analizy korelacji jak na poniższym rysunku.
Rys. 23. Podział metod analizy korelacji
Źródło: S. Mynarski, Metody ilościowe i jakościowe badań rynkowych i marketingowych, http://www.statsoft.pl/czytelnia (12.03.2010 r.)
Zazwyczaj na przedmiocie „statystyka opisowa” studenci rozpoczy-nają analizę zależności od sporządzenia korelacyjnego wykresu rozrzutu (o ile jest to możliwe). W prostokątnym układzie współrzędnych na osi odciętych zaznaczamy wartości tej cechy, którą określamy jako zmienną niezależną (inaczej zmienną objaśniającą). Na osi rzędnych zaznaczamy wartości cechy określanej mianem zmiennej zależnej (zmienna obja-śniana). Korelacja dodatnia występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada wzrost średnich wartości drugiej cechy. Korelacja
Yule’a Q Kendalla C Pearsona V Cramera T Czuprowa Goldmana Kruskala KORELACJE S K A L E DWIE ZMIENNE PRZEDZIAŁOWA I ILORAZOWA PORZĄDKOWA NOMINALNA
TRZY i WIĘCEJ ZMIENNYCH
PORZĄDKOWA PRZEDZIAŁOWA I ILORAZOWA τ Kendalla Spearmana R Pearsona η (stosunek korelacyjny) Współczynnik wielorakiej korelacji rangowej Kendalla Współczynnik korelacji cząstkowej Kendalla Współczynnik korelacji wielorakiej R Pearsona Współczynnik korelacji cząstkowej Pearsona
146
ujemna występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada spadek średnich wartości drugiej cechy.
Najliczniejszą grupę metod analizy korelacji stanowią miary korelacji dla dwóch zmiennych nominalnych. W grupie tej znajdują zastosowanie
proste współczynniki: Yule'a, Q-Kendalla, T-Czuprowa, V-Cramera czy C-Pearsona. W przypadku mierzonych przynajmniej na skali porządkowej
(rangowej) najczęściej wykorzystywaną miarą korelacji jest współczynnik korelacji rang Kendalla oraz współczynnik korelacji rang R Spearmana. Współczynnik ten może być z powodzeniem wykorzystywany do badania profilów zbudowanych na zasadzie dyferencjału semantycznego, tj. tam, gdzie można uporządkować natężenie cechy (od najmniejszego do maksy-malnego). Gdy dwie zmienne mierzone są na skali przedziałowej lub ilorazowej najczęściej wykorzystywaną miarą korelacji jest współczynnik korelacji liniowej r-Pearsona oraz stosunek korelacyjny . Jeśli z kolei trzy i więcej zmiennych jest mierzonych na skali przedziałowej lub ilorazowej,
wówczas znajdują zastosowanie współczynniki korelacji wielorakiej R-Pearsona i współczynniki korelacji cząstkowej Pearsona.
11.2. Współczynniki korelacji – dwie zmienne nominalne
Zakładając, że współzależność badanych zmiennych jest statystycznie istotna, można określić siłę tej zależności za pomocą miar wyprowadzonych ze statystyki χ2 (np. za pomocą współczynnika zbieżności T-Czuprowa). Zaletą współczynnika zbieżności T-Czuprowa jest to, że może on być stosowany zarówno do mierzenia korelacji zmiennych mierzalnych jak i niemierzalnych. Wadą współczynnika zbieżności T-Czuprowa jest to, że nie mierzy kierunku korelacji, bowiem bez względu na to, czy korelacja jest dodatnia czy ujemna, współczynnik ten jest liczbą z przedziału <0,1>. Więcej informacji na temat współczynnika zbieżności T-Czuprowa znajduje się w podrozdziale 13.4 poświęconemu testowi niezależności.
11.3. Współczynniki korelacji – dwie zmienne mierzone na skali porządkowej
Załóżmy, że mamy n jednostek (obiektów) opisanych za pomocą dwóch cech. Jednostki można uporządkować ze względu na wartości każdej cechy oddzielnie. Numery określające miejsce jednostki w uporządkowaniu nazywa się rangami, a procedurę nadawania rang – rangowaniem. Dla uproszczenia przyjmijmy, że porządkujemy jednostki malejąco. W przy-padku mierzonych przynajmniej na skali porządkowej (rangowej) naj-częściej wykorzystywaną miarą korelacji jest współczynnik korelacji rang Kendalla oraz współczynnik korelacji rang R Spearmana.
147
)
1
(
6
1
21 2−
−
= ∑
=n
n
d
r
n i i sWspółczynnik korelacji rang Spearmana wyznacza się ze wzoru:
gdzie di – różnice między rangami odpowiadających sobie wartości cechy xi i cechy yi (i=1, …, n). W sytuacji, gdy wystąpią jednakowe wartości cechy dla różnych jednostek, przypisuje się tym jednostkom wartości równe średniej arytmetycznej z kolejnych rang.
Współczynnik korelacji rang Spearmana służy do opisu siły korelacji dwóch cech w przypadku gdy:
• cechy są mierzalne, a badana zbiorowość jest nieliczna,
• cechy mają charakter jakościowy i istnieje możliwość ich uporząd-kowania.
Współczynnik korelacji rang Spearmana przyjmuje wartości z przedziału <-1, 1>. Znak współczynnika korelacji informuje o kierunku korelacji („+” oznacza korelację dodatnią, a „–” korelację ujemną). Wartość
bez-względna współczynnika korelacji informuje o sile związku – im bliżej rs jest liczby 1, tym silniejsza jest badana zależność. Wartość współczynnika korelacji rang bliska zera (rXY≈0) oznacza brak zależności.
Współczynnik korelacji rang
τ
Kendalla daje ocenę podobieństwa uporządkowań zbioru danych dla dwóch zmiennych mierzonych na skaliporządkowej. Współczynnik Kendalla przyjmuje wartości z przedziału <-1,1>. Wartość 1 oznacza pełną zgodność uporządkowań, wartość 0 brak
zgodności, a wartość -1 pełną ich przeciwstawność. Współczynnik korelacji rang τ Kendalla zostanie wyznaczony według następującej procedury. Najpierw próbę należy uporządkować w taki sposób, aby rangi jednej z cech (np. X) ustawione były w kolejności naturalnej (1, 2, 3, ..., n), a rangi drugiej cechy (np. Y) odpowiadały rangom pierwszej cechy z pierwszego ułożenia. Następnie oblicza się różnice pomiędzy kolejnymi rangami.
Współczynnik korelacji rang τ Kendalla występuje w trzech wariantach: •
τ
a dla rang niepowiązanych•
τ
b dla rang powiązanych•
τ
c dla rang powiązanych w układzie tablicowym116.
116 S. Mynarski, Praktyczne metody analizy danych rynkowych i marketingowych, Kantor Zakamycze, Zakamycze 2000, s. 136.
148
Współczynnik korelacji rang τ Kendalla oblicza się według następującego wzoru: 2 ) 1 ( − − = n n Q P a