Testy statystyczne — teoria przygotowanie: dr A. Goroncy, dr J. Karłowska-Pik Niech

(1)

Testy statystyczne — teoria

przygotowanie: dr A. Goroncy, dr J. Karłowska-Pik

Niech X₁, . . . , X_n będzie próbą losową prostą z rozkładu P_θ, θ ∈ Θ oraz niech α ∈ (0, 1) będzie poziomem istotności (najczęściej 0,1, 0,05, czy 0,01).

Oznaczenia: Φ — dystrybuanta rozkładu N (0, 1), t_1−α = Φ⁻¹(1 − α),

F_t(n−1) — dystrybuanta rozkładu t-Studenta z n − 1 stopniami swobody, z_1−αⁿ⁻¹= F_t(n−1)⁻¹ (1 − α),

n_i, nij — liczebności empiryczne (zaobserwowane), n⁰_i, n⁰_ij — liczebności teoretyczne,

F_χ²_(k−1) — dystrybuanta rozkładu χ² z k − 1 stopniami swobody, u^k−1_1−α = F_χ⁻¹2(k−1)(1 − α),

Jeżeli statystyka testowa należy do obszaru krytycznego, to hipotezę zerową odrzucamy i przyj- mujemy hipotezę alternatywną. Jeżeli statystyka testowa nie należy do obszaru krytycznego, to nie ma podstaw do odrzucenia hipotezy zerowej.

W programie IBM SPPS Statistics zadeklarowany poziom istotności należy porównać z istotnością wyliczaną przez program (tzw. p-wartość). Jest to minimalny próg odrzucenia bądź nie hipotezy zerowej. W związku z tym hipotezę zerową odrzucamy, gdy p-wartość jest mniejsza niż deklarowany przez nas poziom istotności, a nie mamy podstaw do odrzucenia, gdy jest większa.

1. Test Studenta dla jednej średniej.

Hipoteza zerowa: Średnia wartość zmiennej jest równa określonej wartości a₀ (a = a₀).

Hipoteza alternatywna 1.: Średnia wartość zmiennej jest różna od określonej wartości a₀ (a 6= a₀).

Hipoteza alternatywna 2.: Średnia wartość zmiennej jest mniejsza od określonej wartości a₀ (a < a₀).

Hipoteza alternatywna 3.: Średnia wartość zmiennej jest większa od określonej wartości a₀ (a > a₀).

a) X ma rozkład normalny o znanej wariancji σ². Statystyka testowa: T_n=√

nx − a¯ ₀ σ .

Obszar krytyczny 1.: K = (−∞, −t_1−α/2) ∪ (t_1−α/2, +∞), Obszar krytyczny 2.: K = (−∞, −t_1−α),

Obszar krytyczny 3.: K = (t_1−α, +∞).

b) X ma rozkład normalny o nieznanej wariancji σ². Statystyka testowa: T_n=√

nx − a¯ ₀ s .

Obszar krytyczny 1.: K = (−∞, −z_1−α/2ⁿ⁻¹ ) ∪ (z_1−α/2ⁿ⁻¹ , +∞) dla n ¬ 30, K = (−∞, −t_1−α/2) ∪ (t_1−α/2, +∞) dla n > 30, Obszar krytyczny 2.: K = (−∞, −z_1−αⁿ⁻¹) dla n ¬ 30,

K = (−∞, −t_1−α) dla n > 30, Obszar krytyczny 3.: K = (z_1−αⁿ⁻¹, +∞) dla n ¬ 30,

K = (t_1−α, +∞) dla n > 30.

(2)

c) X ma rozkład dowolny, istnieje D²X, n > 30.

Statystyka testowa: T_n=√

nx − a¯ ₀

σ₀ lub T_n =√

nx − a¯ ₀

s , lub T_n=√

nx − a¯ ₀ ˆ s ,

gdzie σ₀ jest odchyleniem standardowym rozkładu przy założeniu prawdziwości hipotezy zerowej, o ile wariancja rozważanego rozkładu jest funkcją jego wartości oczekiwanej (np. w rozkładzie

”0-1”, dwumianowym, Poissona, geometrycznym itp.).

2. Test dla dwóch średnich i prób niezależnych

Hipoteza zerowa: Średnie wartości zmiennej są takie same w dwóch różnych populacjach (a₁ = a₂).

Hipoteza alternatywna 1.: Średnie wartości zmiennej są różne w badanych populacjach (a₁ 6= a₂).

Hipoteza alternatywna 2.: Średnia wartość zmiennej w pierwszej populacji jest mniejsza od średniej wartości zmiennej w drugiej populacji (a₁ < a₂).

Hipoteza alternatywna 3.: Średnia wartość zmiennej w pierwszej populacji jest większa od średniej wartości zmiennej w drugiej populacji (a₁ > a₂).

a) X ma w obu populacjach rozkład normalny o znanych wariancjach σ₁² i σ₂². Statystyka testowa: Tn= x¯₁− ¯x₂

sσ₁² n₁ +σ₂²

n₂ .

b) X ma w obu populacjach rozkład normalny o nieznanych, ale równych wariancjach σ²₁ i σ₂². Statystyka testowa: T_n= x¯₁ − ¯x₂

s(n₁ − 1)s²₁+ (n₂− 1)s²₂

n₁+ n₂− 2 · n₁ + n₂ n₁n₂

.

Obszar krytyczny 1.: K = (−∞, −z_1−α/2ⁿ¹⁺ⁿ²⁻²) ∪ (z_1−α/2ⁿ¹⁺ⁿ²⁻², +∞), Obszar krytyczny 2.: K = (−∞, −z_1−αⁿ¹⁺ⁿ²⁻²),

Obszar krytyczny 3.: K = (z_1−αⁿ¹⁺ⁿ²⁻², +∞).

c) X ma w obu populacjach rozkład normalny o nieznanych wariancjach σ₁² i σ²₂. Statystyka testowa: C_n= x¯1− ¯x2

ss²₁ n₁ + s²₂

n₂

(statystyka Cochrana i Coxa).

Obszar krytyczny 1.: K = (−∞, −cⁿ_1−α/2¹^,n² ) ∪ (cⁿ_1−α/2¹^,n² , +∞), Obszar krytyczny 2.: K = (−∞, −cⁿ_1−α¹^,n²),

Obszar krytyczny 3.: K = (cⁿ_1−α¹^,n², +∞),

(3)

gdzie

cⁿ_1−α¹^,n² ≈ s²₁

n₁z_1−αⁿ¹⁻¹+ s²₂ n₂zⁿ_1−α²⁻¹

!

: s²₁ n₁ + s²₂

n₂

!

.

d) X ma w obu populacjach rozkład o nieznanych wariancjach σ²₁ i σ₂², próby mają liczebności większe bądź równe 100.

Statystyka testowa: T_n= x¯₁− ¯x₂

ss²₁ n₁ + s²₂

n₂ .

3. Test dla dwóch średnich i prób zależnych

Hipoteza zerowa: Dwie zmienne zależne (o rozkładach normalnych) mają jednakowe średnie (inaczej: różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią równą 0).

Hipoteza alternatywna 1.: Zmienne zależne mają różne średnie (inaczej: różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią różną od 0).

Hipoteza alternatywna 2.: Pierwsza ze zmiennych ma średnią mniejszą niż druga (inaczej:

różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią ujemną).

Hipoteza alternatywna 3.: Pierwsza ze zmiennych ma średnią większą niż druga (inaczej:

różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią dodatnią).

Statystyka testowa: Tn = d¯ s_d

√n.

Obszar krytyczny 1.: K = (−∞, −z_1−α/2ⁿ⁻¹ ) ∪ (z_1−α/2ⁿ⁻¹ , +∞) dla n ¬ 30, K = (−∞, −t_1−α/2) ∪ (t_1−α/2, +∞) dla n > 30, Obszar krytyczny 2.: K = (−∞, −z_1−αⁿ⁻¹) dla n ¬ 30,

K = (−∞, −t_1−α) dla n > 30, Obszar krytyczny 3.: K = (z_1−αⁿ⁻¹, +∞) dla n ¬ 30,

K = (t_1−α, +∞) dla n > 30.

4. Test chi-kwadrat zgodności

Założenia testu: Zmienna ma rozkład dyskretny, przyjmuje tylko wartości l₁, . . . , lk z prawdo- podobieństwami odpowiednio p⁰₁, . . . , p⁰_k, które nie są znane.

Hipoteza zerowa: Zmienna ma rozkład dyskretny z określonymi prawdopodobieństwami p⁰₁, . . . , p⁰_k. Hipoteza alternatywna: Zmienna ma rozkład z innymi prawdopodobieństwami niż zadane.

Statystyka testowa: χ² =^P^k_i=1(n_i− n⁰_i)²

n⁰_i =^P^k_i=1(n_i− np⁰_i)² np⁰_i . Obszar krytyczny: K = (u^k−1_1−α, +∞).

Uwagi:

• Jeżeli rozkład teoretyczny zależy od d nieznanych parametrów, to parametry te wyznaczamy metodą największej wiarogodności, a liczbę stopni swobody zmniejszamy o d.

• Przybliżenie rozkładem chi-kwadrat uznajemy za dopuszczalne, gdy np⁰_i  5, i = 1, . . . , k, a za dobre, gdy np⁰_i  10, i = 1, . . . , k. Jeśli liczba kategorii jest duża (> 6), to zgadzamy się stosować przybliżenie rozkładem chi-kwadrat także wtedy, gdy dla jednej lub dwóch kategorii

(4)

1 ¬ np⁰_i < 5. Mało liczne kategorie można również łączyć z kategoriami sąsiednimi, redukując wówczas odpowiednio liczbę stopni swobody.

• W przypadku zmiennej o rozkładzie z ciągłą dystrybuantą dane grupujemy w k (10k ¬ n) klas. Prawdopodobieństwa teoretyczne wyliczamy z dystrybuanty. Klasy staramy się dobrać tak, aby prawdopodobieństwa znalezienia się w klasie były równe 1/k, a liczebności teore- tyczne były co najmniej równe 5. Testujemy wówczas hipotezę zerową: Zmienna ma rozkład o podanej dystrybuancie.

5. Test Kołmogorowa

Hipoteza zerowa: Zmienna ma rozkład o zadanej dystrybuancie F .

Hipoteza alternatywna: Zmienna ma rozkład o innej niż zadana dystrybuancie.

Wymagania testu: Ciągłość dystrybuanty.

a) n ¬ 100

Statystyka testu: D_n = max{D⁺_n, D_n⁻}, gdzie D_n⁺= max_1¬i¬n

i

n − F (x_(i))

, D⁻_n = max_1¬i¬n

F (x_(i)) −i − 1 n

.

Obszar krytyczny: (d_n(1−α), 1] (odczytujemy z tablic Kołmogorowa -Smirnowa, jest to taka wartość, dla której P (D_n d_n(1 − α)) = α).

b) n > 100.

Statystyka testu: √

nD_n=√

n max{D⁺_n, D_n⁻} (czasem (√

n + 0, 12 + 0, 11/√

n)D_n), gdzie D_n⁺= max_1¬i¬n

i

n − F (x_(i))

, D⁻_n = max_1¬i¬n

F (x_(i)) −i − 1 n

.

Obszar krytyczny: (λ1−α, +∞), gdzie λ1−α jest kwantylem rzędu 1 − α granicznego rozkładu Kołmogorowa.

Uwaga: W przypadku danych zgrupowanych w klasy bierzemy pod uwagę prawy koniec każdej z klas i zamiast podanych statystyk wyznaczamy wartość maksymalną statystyki |Fn(xi) − F (xi)|, gdzie F_n jest dystrybuantą empiryczną.

6. Test chi-kwadrat niezależności

Założenia testu: Cechy X, Y są jakościowe (nominalne lub o wartościach uporządkowanych).

Hipoteza zerowa: X, Y są zmiennymi niezależnymi.

Hipoteza alternatywna: X, Y są zależne.

Statystyka testowa: χ² = ^P^k

j=1 r

P

i=1

(n_ij − n⁰_ij)²

n⁰_ij , gdzie

r — liczba kategorii zmiennej X (liczba wierszy w tablicy kontyngencji), k — liczba kategorii zmiennej Y (liczba kolumn w tablicy kontyngencji), nij — liczba wystąpień w próbie par obserwacji (xi, yj),

n⁰_ij =

k

P

j=1

n_ij · ^P^r

i=1

n_ij

n ,

n =

r

X

i=1 k

X

j=1

n_ij.

Obszar krytyczny: K = (u^{(r−1)(k−1)}_1−α , +∞).

Uwagi:

(5)

• Podobnie jak w teście chi-kwadrat zgodności, przybliżenie statystyki testowej rozkładem chi- kwadrat stosujemy, gdy liczebności teoretyczne prób w wierszach (kolumnach) są stosunkowo duże (n⁰_ij  5).

• Gdy tablica kontyngencji ma rozmiar 2 × 2 i liczebności próby w wierszach (kolumnach) są zbyt małe, można oprzeć się na tzw. dokładnym teście Fishera (którego tu nie będziemy omawiać).

• W przypadku pary cech o uporządkowanych kategoriach test niezależności może okazać się zwodniczy. Może wówczas zajść potrzeba wprowadzenia odpowiedniej miary zależności mię- dzy cechami (tego nie będziemy tu omawiać).

7. Test znakowanych rang Wilcoxona

Model: Dysponujemy ciągiem par obserwacji: (X₁, Y₁), . . . , (X_n, Y_n). Można sobie wyobrazić, że pary te reprezentują obserwacje „przed kuracją” i „po kuracji”.

Założenia: Pary zmiennych losowych są niezależne, natomiast Xi, Yi mogą być zależne.

Definiujemy niezależne różnice Z_i = Y_i− X_i, i = 1 . . . , n. Każda zmienna Z_i, i = 1, . . . , n pochodzi z tego samego rozkładu ciągłego o dystrybuancie F_i, symetrycznego względem wspólnej mediany θ (może być ona interpretowana jako „efekt kuracji”), tzn.

∀_t∈R F_i(θ + t) + F_i(θ − t) = 1, i = 1, . . . , n.

Hipoteza zerowa: θ = 0 (brak „efektu kuracji”, tzn. każdy rozkład Fi, i = 1, . . . , n jest syme- tryczny względem 0, czyli ∀_t∈R F_i(t) = 1 − F_i(−t), i = 1, . . . , n).

Hipoteza alternatywna 1: θ 6= 0 (jest jakiś „efekt kuracji”).

Hipoteza alternatywna 2: θ > 0 („efekt kuracji” jest dodatni).

Hipoteza alternatywna 3: θ < 0 („efekt kuracji” jest ujemny).

Statystyka testowa: Jest to statystyka znakowanych rang Wilcoxona, czyli suma rang wartości bezwzględnych różnic odpowiadających różnicom dodatnim:

T⁺= ^X

Zi>0

r(|Z_i|),

gdzie

r(|Z_i|) — ranga |Z_i|, i = 1, . . . , n, (r(X_i) = j ∈ {1, . . . , n} ⇐⇒ X_i = X_j:n).

Obszar krytyczny 1: K = −∞,n(n + 1)

2 − w_1−α/2

#

∪^hw_1−α/2, ∞, Obszar krytyczny 2: K = [w_1−α, +∞).

Obszar krytyczny 3: K = −∞,n(n + 1)

2 − w_1−α

#

.

gdzie wa jest kwantylem rozkładu statystyki znakowanych rang Wilcoxona (przy założeniu praw- dziwości hipotezy zerowej) rzędu a (w tablicach).

Uwagi:

• Test znakowanych rang Wilcoxona jest nieparametryczną alternatywą dla testu t-Studenta w przypadku dwóch próbek dających się połączyć w pary. Różnica między tymi testami jest taka, że test t-Studenta testuje równość średnich arytmetycznych, a test Wilcoxona testuje

(6)

mediany. Test Wilcoxona nie wymaga założeń dotyczących rozkładu próby, może być więc używany, gdy założenia testu t-Studenta nie są spełnione.

• W praktyce (w wyniku zaokrąglania) mogą pojawić się tzw. węzły, czyli grupy obserwacji o jednakowej wartości bezwzględnej. Postępowanie w przypadku, gdy

(a) n < 25

- odrzucamy wszystkie Z_i takie, że Z_i = 0 i odpowiednio zmniejszamy n, - uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite), - stosujemy test dokładny ze zmodyfikowanymi rangami;

(b) n 25

- odrzucamy wszystkie Zi takie, że Zi = 0 i odpowiednio zmniejszamy n, - uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite), - stosujemy test asymptotyczny ze modyfikowaną statystyką testową T^∗:

T˜^∗ = T^∗ = T⁺−ⁿ⁽ⁿ⁺¹⁾₄

s

n(n + 1)(2n + 1)/24 −¹₂ ^P^N

j=1

(t²_j − 1)t_j ,

gdzie:

N — liczba grup węzłów (również jednoelementowych), t_j — liczba węzłów w j-tej grupie, j = 1, . . . , N .

• Test asymptotyczny. Jeżeli n jest duże (w praktyce dla n 25), używa się statystyki testowej postaci

T^∗ = T⁺− ⁿ⁽ⁿ⁺¹⁾₄

qn(n + 1)(2n + 1)/24 ,

i wówczas obszary krytyczne są postaci:

Obszar krytyczny 1: K =−∞, −t_1−α/2ⁱ∪^ht_1−α/2, ∞. Obszar krytyczny 2: K = [t_1−α, +∞).

Obszar krytyczny 3: K = (−∞, −t_1−α].