Testowanie hipotez
Niech X = (X1, . . . , Xn) będzie próbą losową na przestrzeni X , zaś P = {Pθ, θ ∈ Θ}
rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X .
Definicja 1. Hipotezą zerową Θ0 ⊂ Θ nazywamy hipotezę, której prawdziwość chcemy zweryfikować na podstawie obserwacji. Hipoteza alternatywna jest postaci Θ1 = Θ\Θ0.
Hipoteza prosta zawiera jeden element, np. H0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H0 : θ > 4.
Definicja 2. Obszar krytyczny testu jest to obszar odrzucenia hipotezy zerowej. Naj- częściej ma on postać K = {X : T (X) > c}, gdzie c jest poziomem krytycznym testu, wyznaczonym przez kwantyl rozkładu, z jakiego pochodzi statystyka testowa przy zało- żeniu prawdziwości hipotezy zerowej (zależy on od przyjętego poziomu istotności testu).
Definicja 3. Test można identyfikować z jego obszarem krytycznym K lub funkcją kry- tyczną ϕ : X −→ {0, 1} postaci
ϕ(X) = 1K(X) = 1, gdy X ∈ K, 0, gdy X /∈ K,
Definicja 4. Prawdopodobieństwo błędu pierwszego rodzaju to prawdopodobieństwo od- rzucenia hipotezy zerowej, gdy jest ona prawdziwa:
αI(θ) = Pθ(X ∈ K), θ ∈ Θ0.
Definicja 5. Prawdopodobieństwo błędu drugiego rodzaju to prawdopodobieństwo przy- jęcia hipotezy zerowej, gdy jest ona fałszywa:
αII(θ) = Pθ(X ∈ Kc) = 1 − Pθ(X ∈ K), θ ∈ Θ1. Definicja 6. Funkcją mocy testu nazywamy β : Θ −→ [0, 1] postaci
β(θ) = Pθ(X ∈ K) = Eθϕ(X).
Z reguły bada się moc testu na alternatywie, czyli θ = θ1.
Definicja 7. Test o funkcji krytycznej ϕ (o obszarze krytycznym K) jest testem na poziomie istotności α ∈ (0, 1), jeżeli
∀θ∈Θ0 Eθϕ(X) = Pθ(X ∈ K) = β(θ) ≤ α.
Definicja 8. Rozmiarem testu o funkcji krytycznej ϕ (obszarze krytycznym K) nazywamy wielkość
β = sup
θ∈Θ0
Eθϕ(X) = sup
θ∈Θ0
β(θ).
Definicja 9. Test ϕ∗ (K∗) na poziomie istotności α jest testem jednostajnie najmocniej- szym (JNM) w klasie testów Φ (K) na poziomie α, jeżeli
∀ϕ∈Φ ∀θ∈Θ1 β∗(θ) ≥ β(θ).
Twierdzenie (podstawowy lemat Neymana-Pearsona) Niech P0 i P1 będą rozkła- dami prawdopodobieństwa i niech f0 i f1 będą gęstościami tych rozkładów (względem pewnej ustalonej miary µ). Niech α ∈ (0, 1) będzie ustaloną liczbą.
(a) (istnienie testu) Istnieją stałe c i γ > 0 takie, że ϕ(x) =
1, gdy f1(x) > cf0(x), γ, gdy f1(x) = cf0(x), 0, gdy f1(x) < tf0(x),
jest testem hipotezy H0 : P0 przeciwko H1 : P1 na poziomie istotności α, tzn.
E0ϕ(X) = α. (1)
(b) (dostateczność) Jeżeli test ϕ spełnia warunek (1) i dla pewnego c warunek ϕ(x) = 1, gdy f1(x) > cf0(x),
0, gdy f1(x) < tf0(x), (2) to ϕ jest testem najmocniejszym dla testowania H0przeciwko H1na poziomie istotności α.
(c) (konieczność) Jeżeli φ jest testem najmocniejszym na poziomie istotności α dla testowania H0 przeciwko H1, to dla pewnego c spełnia on warunek (2).
Podsumowując, test statystyczny składa się z:
1. Hipotezy zerowej H0 i hipotezy alternatywnej H1, 2. Statystyki testowej T (X),
3. Obszaru krytycznego K.
4. Poziomu istotności α,
Decyzja: jeżeli T (X) ∈ K, to odrzucamy hipotezę H0, jeżeli T (X) /∈ K, to nie mamy podstaw do odrzucenia hipotezy zerowej.
Definicja 10. P-wartość (p-value) to graniczny poziom istotności - najmniejszy, przy któ- rym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej.
Jest to więc taki poziom istotności, przy którym zmienia się decyzja testu (zaczynając od lewej - od małego poziomu α, kiedy to nie mamy podstaw do odrzucenia H0, po przekroczeniu p-wartości zaczynamy odrzucać H0).
P-wartość pozwala bezpośrednio ocenić wiarygodność hipotezy. Im p-wartość jest większa, tym bardziej hipoteza H0 jest prawdziwa. Mała p-wartość świadczy przeciwko hipotezie zerowej.
Znajomość p-wartości pozwala przeprowadzić testowanie dla dowolnego poziomu istot- ności:
-odrzucamy hipotezę zerową H0, gdy
p-wartość ≤ α,
-nie mamy podstaw do odrzucenia hipotezy zerowej H0, gdy p-wartość > α.
Test Chi-kwadrat zgodności
nr klasy 1 2 3 4 5 ...
liczebności empiryczne n1 n2 n3 n4 n5 ...
• Hipotezy
H0 : X ∼ F, H1 : X F, F jest dowolnym rozkładem prawdopodobieństwa.
• Statystyka testowa
χ2 =
k
X
i=1
(ni− nti)2 nti , gdzie
k - liczba klas,
ni - liczebności empiryczne (zaobserwowane), nti = n · pti - liczebności teoretyczne,
pti = PF(Xprzyjeła wartosc z klasy i) - prawdopodobieństwa teoretyczne.
Przy założeniu prawdziwości hipotezy zerowej statystyka χ2 ma rozkład chi-kwadrat z (k − r − 1) stopniami swobody (r jest liczbą nieznanych parametrów hipotetycz- nego rozkładu F ).
• Obszar krytyczny
K = (Fχ−12 k−1
(1 − α), +∞), gdzie Fχ−12
k−1
(1 − α) jest kwantylem rzędu 1 − α rozkładu chi-kwadrat z (k − r − 1) stopniami swobody.
Test Chi-kwadrat niezależności Tablica kontyngencji:
Cecha 1 Cecha 2 1 2 . . . k
1 n11 n12 . . . n1k 2 n21 n22 . . . n23 . . . . r nr1 nr2 . . . nrk
• Hipotezy
H0 : X, Y są niezależne, vs H1 : X, Y są zależne
• Statystyka testowa
χ2 =
k
X
j=1 r
X
i=1
(nij− ntij)2 ntij , gdzie
k - liczba kolumn w tablicy kontyngencji, r - liczba wierszy w tablicy kontyngencji, nij - liczebności empiryczne (zaobserwowane), ntij - liczebności teoretyczne, dane wzorem
ntij =
k
P
j=1
nij ·
r
P
i=1
nij
n ,
gdzie n =
k
P
j=1 r
P
i=1
nij .
Przy założeniu prawdziwości hipotezy zerowej statystyka χ2 ma rozkład chi-kwadrat z (k − 1)(r − 1) stopniami swobody.
• Obszar krytyczny
K = (Fχ−12 (k−1)(r−1)
(1 − α), +∞), gdzie Fχ−12
k−1
(1 − α) jest kwantylem rzędu 1 − α rozkładu chi-kwadrat z (k − r − 1) stopniami swobody.
Test Kołmogorowa
Test Kołmogorowa testuje zgodność z rozkładem F dla jednej próby (Test Kołmogorowa - Smirnowa dla dwóch prób testuje zgodność rozkładów w obu próbach).
• Hipotezy
H0 : X ∼ F, H1 : X F, gdzie F jest ciągłym rozkładem prawdopodobieństwa.
1. n ≤ 100
• Statystyka testowa
Dn= sup
x∈R
|F (x) − Fn(x)| = max
1≤i≤n
max
F (Xi:n) − i − 1 n
,
i
n − F (Xi:n)
,
• Obszar krytyczny
K = (FD−1
n(1 − α), 1],
gdzie FD−1n(1−α) jest kwantylem rzędu 1−α rozkładu statystyki Kołmogorowa (Dn).
2. n > 100
• Statystyka testowa √
nDn,
• Obszar krytyczny
K = (λ1−α, +∞),
gdzie λ1−α jest kwantylem rzędu 1 − α granicznego rozkładu statystyki Kołmogo- rowa (√
nDn).
Test Shapiro-Wilka Jest to test normalności rozkładu.
• Hipotezy
H0 : X ∼ N, H1 : X N
• Statystyka testowa
W =
n P
i=1
aixi:n
2 n
P
i=1
(xi− x)2 ,
gdzie stałe ai są dane wzorem
(a1, . . . , an) = m>V−1
√m>V−1V−1m,
gdzie m = (m1, . . . , mn)>, są wartościami oczekiwanymi statystyk pozycyjnych z pochodzących z próby iid z rozkładu standardowego normalnego a V jest ich ma- cierzą kowariancji (stablicowane).
• Obszar krytyczny
K = (Wn(1 − α), +∞),
gdzie Wn(1 − α) jest kwantylem rzędu 1 − α rozkładu statystyki Shapiro-Wilka W .
Test t-studenta
Jest to test parametryczny dla jednej lub dwóch prób, polegający na testowaniu równości wartości oczekiwanych (test istotności). Zakładamy, że pomiary podlegają rozkładowi normalnemu, oraz że wariancje w próbach nie różnią się od siebie istotnie.
1. Test t dla jednej próby
• Hipotezy
H0 : µ = µ0,
H1 : µ > µ0, (3)
µ < µ0, (4)
µ 6= µ0 (5)
• Statystyka testowa
T =√ n
X − µ¯ 0
sX , gdzie s2X = n−11
n
P
i=1
(Xi− ¯X)2 to próbkowe odchylenie standardowe. Statystyka te- stowa T ma rozkład t-studenta o (n − 1) stopniach swobody.
• Obszar krytyczny
Zależy od postaci hipotezy alternatywnej w następujący sposób:
K1 = (Ft−1n−1(1 − α), +∞), K2 = (−∞, −Ft−1n−1(1 − α)),
K3 = (−∞, −Ft−1n−1(1 −α2)) ∪ (Ft−1n−1(1 −α2), +∞),
gdzie Ft−1n−1(a) to kwantyl rzędu a rozkładu t-studenta z (n − 1) stopniami swobody.
Jeżeli wariancja rozkładu jest znana, wówczas sX zastępujemy przez odchylenie standardowe rozkładu, zaś Ft−1n−1(a) zastępujemy przez Φ−1(a).
2. Test t dla dwóch prób niezależnych
• Hipotezy
H0 : µ1 = µ2, H1 : µ1 6= µ2
• Statystyka testowa
T =
X¯1− ¯X2 SX¯1− ¯X2
, gdzie
SX¯1− ¯X2 = s
(n1− 1)s21+ (n2− 1)s22 n1+ n2− 2
1 n1 + 1
n2
,
s1, s2 to nieznane odchylenia standardowe z próbek, zaś n1, n2 to liczebności próbek.
Statystyka testowa T ma rozkład t-studenta o (n1+ n2− 2) stopniach swobody.
• Obszar krytyczny
K = (−∞, −Ft−1
n1+n2−2(1 −α
2)) ∪ (Ft−1
n1+n2−2(1 −α
2), +∞) 3. Test dla dwóch prób zależnych
• Hipotezy
H0 : µ1 = µ2, H1 : µ1 6= µ2
• Statystyka testowa
T = d¯ Sd¯
, gdzie
d =¯ 1 n
n
X
i=1
di,
di = x1i− x2i, i = 1, . . . , n,
Sd¯= v u u t
1 n − 1
n
X
i=1
(di− ¯d)2,
zaś x1i, x2i oznaczają wartości cechy X dla i-tego obiektu w pierwszym i drugim badaniu. Statystyka testowa T ma rozkład t-studenta o (n − 1) stopniach swobody.
• Obszar krytyczny
K = (−∞, −Ft−1
n−1(1 −α
2)) ∪ (Ft−1
n−1(1 −α
2), +∞)
UWAGA: Gdy liczebność próby jest duża (n > 30, n1+ n2 > 30), to kwantyl rozkładu t-studenta zastępujemy przez kwantyl rozkładu standardowego normalnego (Ft−1n ' Φ).