• Nie Znaleziono Wyników

Miary siły zależności oparte na chi-kwadrat

Test Browna-Forsythe’a i test Welcha

6. Ocena zależności między dwiema zmiennymi

6.1. Badanie zależności między dwiema zmiennymi jakościowymi

6.1.3. Miary siły zależności oparte na chi-kwadrat

Jak dotąd zajmowaliśmy się wnioskowaniem statystycznym – posługiwaliśmy się te-stem χ2 lub dokładnym testem Fishera, by ustalić, czy między badanymi cechami ist-nieje w populacji zależność. Powtórzmy przy okazji, że wnioskowanie statystyczne przeprowadzamy tylko wtedy, gdy o doborze jednostek do badania decyduje mecha-nizm losowy – tylko wtedy bowiem zasadne jest uogólnienie wyników poza przeba-daną próbę. Jeżeli chodzi o kwestię tego, jak bardzo silna jest zależność między zmien-nymi, to zwykle tym ustaleniem interesujemy się w drugiej kolejności (Szwed, 2008, s. 330–331). Nie trzeba jednak traktować tego jako wiążącej reguły, gdyż do mierni-ków siły związku możemy też podejść jak do statystyk opisowych, traktując uzyska-ny wynik jako odnoszący się jedynie do przebadauzyska-nych jednostek. Tylko do nich się odniesiemy, jeśli próba nie będzie pozwalała na uogólnienia na populację, albo gdy przebadano całą populację. Natomiast w tych przypadkach, w których przeprowa-dzenie wnioskowania statystycznego jest zasadne, zainteresowanie kwestią siły związ-ku jest między innymi potrzebne dlatego, że może się okazać, że choć zależność jest istotna statystycznie, to związek jest bardzo słaby – różnice w proporcjach są na tyle małe, że pozbawione praktycznego znaczenia. Miary te odpowiadają więc (pod wzglę-dem celu ich zastosowania) metodom oceny wielkości efektu w analizie wariancji.

Opracowano wiele mierników siły związku dla zmiennych nominalnych oraz dla zmiennych porządkowych. Dużo możliwości w tym zakresie oferuje IBM SPSS Statistics. Wielość miar wynika po części z tego, że każda z nich ma swoje ograni-czenia i nie spełnia wszystkich oczekiwań dobrego miernika siły związku. W tym podręczniku poprzestaniemy na przedstawieniu współczynników opartych na χ2, które stosuje się w badaniu zależności między dwiema zmiennymi mierzonymi na skali nominalnej bądź między zmiennymi, z których jedna mierzona jest na ska-li nominalnej, a druga na porządkowej19.

19 Oprócz tych miar IBM SPSS Statistics udostępnia także mierniki proporcjonalnej redukcji błędu (PRE) – współczynnik tau Goodmana i Kruskala, lambda, współczynnik niepewności,

Badanie zależności między dwiema zmiennymi jakościowymi 149 Jak już widzieliśmy, wysokie wartości statystyki χ2 sprzyjają niskim wartościom

p i odrzuceniu hipotezy zerowej. W takim razie może powstać pytanie, czy sam

współczynnik χ2 mógłby informować o sile związku. Odpowiedź jest negatywna, gdyż wartość χ2 zależy nie tylko od siły związku, ale także od liczebności próby. Zwróćmy bowiem uwagę, że gdybyśmy porównywali proporcje 51/100 i 49/100, to χ2 = 0,08, a p = 0,7773. Natomiast dla pary proporcji 510/1000 i 490/1000 war-tość χ2 = 0,8, a p = 0,3711. W obu przypadkach rozkłady procentowe są identyczne. Przykład pokazuje, że mimo iż siła związku jest taka sama, statystyka χ2 reaguje na wielkość próby, a co za tym idzie – zmienia się również wartość p. Miara φ [czytaj: fi] przezwycięża ten problem w następujący sposób:

2 .

n χ

φ= (30)

To rozwiązanie powoduje, że wartości miernika leżą w zakresie [0, 1], niemniej jest to prawdą tylko dla tabel 2 × 2. W tabelach większych – r × c – miara może przekroczyć 1, co czyni ją nieużyteczną do stosowania. Miara φ ma tę ważną włas-ność, że odpowiada modułowi wartości współczynnika korelacji r Pearsona (ko-relacji między dwiema zmiennymi dychotomicznymi). Stąd φ2 będzie informować o tym, jaką część zróżnicowania jednej zmiennej można wyjaśnić za pomocą dru-giej zmiennej (Blalock, 1975, s. 258).

Miernik V Cramèra przyjmuje wartości z zakresu [0, 1] niezależnie od rozmia-ru tabeli. Wzór na V wygląda następująco:

( )

2 , 1 V n k χ = − (31)

gdzie k to liczba kolumn bądź wierszy, w zależności od tego, która jest mniejsza. Konstrukcja miary wykorzystuje fakt, że maksymalna wartość, jaką może przyjąć

χ2, równa jest n(k – 1), a zatem, jeśli χ2 = n(k – 1), to V = 1 (Hershberger, Fisher, 2005, s. 1183–1192). Zauważmy, że dla tabel 2 × 2 φ=V .

jak również metody oceny siły związku dla skali porządkowej – gamma, współczynnik d--Sommersa, współczynnik tau-b Kendalla, współczynnik tau-c Kendalla. Z tego poziomu możliwe jest również wyznaczenie współczynnika eta czy też ryzyka względnego. Mierniki te nie zostaną w tym miejscu scharakteryzowane. Bardzo dobre i przystępne omówienie wszystkich miar proponowanych przez SPSS Czytelnik znajdzie w książce Górniaka i Wach-nickiego (2000).

150 Ocena zależności między dwiema zmiennymi

Jeszcze inny pomysł przezwyciężenia ograniczenia φ przedstawia miernik C, czyli współczynnik kontyngencji, który jest określony wzorem:

2 2 . C n χ χ = + (32)

Rozwiązanie to powoduje, że wprawdzie w tabeli r × c miernik ten nie przekro-czy 1, ale – jak pokazuje konstrukcja mianownika – nigdy też nie osiągnie 1, gdyż

n ≠ 0. W efekcie jego wartości leżą w zakresie [0, 1). Drugim ograniczeniem

współ-czynnika kontyngencji jest to, że jego wartości zależą od liczby kolumn i wierszy w tabeli r × c. Zgodnie ze wzorem:

max k 1

C

k

= (33)

maksymalna wartość C w tabeli, w której minimum z liczby kolumn i wierszy wynosi 2 (a więc w tabeli 2 × 2, tabeli 2 × 3 itd.) to 0,707. Z kolei Cmax w tabeli 3 × 3, tabeli 3 × 4 itd. wynosi 0,816. Tę niedogodność można przezwyciężyć, stosując następującą korektę: max . skoryg C C C = (34)

Korekta ta powoduje, że w przypadku idealnej zależności Cskoryg = 1 (Hershber-ger, Fisher, 2005, s. 1183–1192).

Dodajmy, że wszystkie omówione tu miary są symetryczne. To znaczy, że na ich wartość nie wpływa to, czy będziemy rozpatrywać wariant, w którym Y zależy od X, czy wariant, w którym X zależy od Y. Siła związku między X i Y jest taka sama jak między Y i X. Pozostaje jeszcze kwestia interpretacji otrzymanego rezultatu. Wpraw-dzie wiadomo, że zero świadczy o braku związku, jedność o związku pełnym, ale jak oceniać wartości pośrednie? Tu pomocnych wskazówek dostarczył Cohen (1988), który wprowadził w jako uniwersalny miernik wielkości efektu, który również opar-ty jest na χ2. Cohen przypisał następujące interpretacje wartościom w:

w = 0,1 – mała wielkość efektu, w = 0,3 – średnia wielkość efektu, w = 0,5 – duża wielkość efektu.

Badanie zależności między dwiema zmiennymi jakościowymi 151 Cohen zdefiniował relację między w a każdą z miar opartą na χ2:

dla φ: w=φ, (35) dla C: 22, 1 C w C = − (36) dla V: w V= × k−1. (37)

Maksymalna wartość, jaką może przyjąć w, wynosi k−1, przy czym k – przy-pomnijmy – to liczba wierszy bądź kolumn, w zależności od tego, która jest mniej-sza (Cohen, 1988, s. 222–227). Powyższe przekształcenie pokazuje, że wartość współczynnika V Cramèra rzędu – przykładowo – 0,2 w tabeli 2 × 2, 2 × 3, 2 × 4 itd. powinna być interpretowana inaczej niż dla tabel 5 × 5, 5 × 6, 5 × 7 itd. W pierw-szym przypadku wielkość efektu jest bowiem równa w = 0,2, a w drugim przypad-ku w = 0,4 (efekt jest silniejszy). Dodajmy, że zaproponowane przez Cohena inter-pretacje wielkości efektu powinniśmy traktować jako orientacyjne, a ostateczną ocenę uzależnić od kontekstu. Ten kontekst może być nadany przez problem, któ-ry badamy, czy przez oczekiwania, jakie wynikają z poprzednich badań w danej dziedzinie.

Przykład 6.4

Wróćmy do przykładu, w którym interesowaliśmy się zależnością między deklaracją uczestnictwa w wyborach i płcią. Sprawdźmy siłę związku między tymi zmiennymi. Rozwiązanie

Korzystając z polecenia Tabele krzyżowe, wybierzmy ponownie przycisk Statystyki, by zaznaczyć interesujące nas miary siły związku – w bloku Nominalne zaznaczamy

Współczynnik kontyngencji i Phi i V-Cramèra (rysunek 6.15). Wyniki zestawiono na

152 Ocena zależności między dwiema zmiennymi

Rysunek 6.15. Wyznaczanie współczynników zależności opartych na statystyce chi-kwadrat

Miary symetryczne

Wartość

Istotność przybliżona

Nominalna przez Nominalna Phi 0,029 0,241

V Kramera 0,029 0,241

Współczynnik kontyngencji 0,029 0,241

N ważnych obserwacji 1582

Rysunek 6.16. Wartości miar siły związku dla zmiennych gndr oraz vote

Zwróćmy na początek uwagę, że wartość p jest taka sama dla wszystkich mierników i odpowiada wielkością wartości p, jaką uzyskaliśmy, poddając testowi hipotezę o nieza-leżności zmiennych (rysunek 6.3). Jest to zrozumiałe, bo wszystkie uwzględnione miary siły związku są oparte na χ2. Ta wysoka wartość p nie pozwoliła nam uznać, że w popu-lacji istnieje związek między tymi zmiennymi. Przyjrzyjmy się teraz wynikom miar siły związku. Mamy do czynienia z tabelą 2 × 2, a więc każda z omówionych miar może być zastosowana. Każda zresztą daje ten sam rezultat. Wynik jest bliski zera, co świadczy o bardzo słabym związku. To ustalenie współgra z naszym wcześniejszym ustaleniem będącym efektem porównania rozkładów warunkowych (rysunek 6.4.). Jak pamiętamy,

φ po podniesieniu do kwadratu umożliwia interpretację mówiącą, jaki procent

zmien-ności pierwszej zmiennej można wyjaśnić zmienzmien-nością drugiej zmiennej. W naszym przypadku φ2 = 0,0292 = 0,000868, co oznacza, że zmienna płeć wyjaśnia niespełna 0,1% zmienności zmiennej vote.

Badanie zależności między dwiema zmiennymi ilościowymi 153

Przykład 6.5

Wróćmy do przykładu, w którym badaliśmy relację między wielkością miejscowości zamieszkania (trzy warianty) a doświadczeniem napadu lub włamania (dwa warianty). Sprawdźmy siłę związku między tymi zmiennymi.

Rozwiązanie

Dane analizowaliśmy w tabeli 2 × 3 (rysunek 6.9), właściwą miarą siły związku będzie zatem miernik V lub C. Wartości tych mierników są bardzo podobne (rysunek 6.17). Wy-bierając ostatecznie V jako miernik siły związku do analizowanych tu danych, otrzymu-jemy w V= × k− =1 0,145× 2 1 0,145− = , co pozwala nam zinterpretować efekt wpływu miejscowości zamieszkania na doświadczenie napadu lub włamania jako słaby.

Rysunek 6.17. Wartości miar siły związku dla zmiennych crmvct i domicil_recode

Odnosząc się jeszcze do przykładu 6.3, dodajmy, że problematyczne jest zastosowanie miar opartych na χ2 w sytuacji, gdy zależność bada się za pomocą dokładnego testu Fishera (Szymczak, 2018, s. 152).

6.2. Badanie zależności między dwiema