• Nie Znaleziono Wyników

Testowanie hipotez

N/A
N/A
Protected

Academic year: 2021

Share "Testowanie hipotez"

Copied!
7
0
0

Pełen tekst

(1)

Testowanie hipotez

Niech X = (X1, . . . , Xn) będzie próbą losową na przestrzeni X , zaś P = {Pθ, θ ∈ Θ}

rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X .

Definicja 1. Hipotezą zerową Θ0 ⊂ Θ nazywamy hipotezę, której prawdziwość chcemy zweryfikować na podstawie obserwacji. Hipoteza alternatywna jest postaci Θ1 = Θ\Θ0.

Hipoteza prosta zawiera jeden element, np. H0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H0 : θ > 4.

Definicja 2. Obszar krytyczny testu jest to obszar odrzucenia hipotezy zerowej. Naj- częściej ma on postać K = {X : T (X) > c}, gdzie c jest poziomem krytycznym testu, wyznaczonym przez kwantyl rozkładu, z jakiego pochodzi statystyka testowa przy zało- żeniu prawdziwości hipotezy zerowej (zależy on od przyjętego poziomu istotności testu).

Definicja 3. Test można identyfikować z jego obszarem krytycznym K lub funkcją kry- tyczną ϕ : X −→ {0, 1} postaci

ϕ(X) = 1K(X) = 1, gdy X ∈ K, 0, gdy X /∈ K,

Definicja 4. Prawdopodobieństwo błędu pierwszego rodzaju to prawdopodobieństwo od- rzucenia hipotezy zerowej, gdy jest ona prawdziwa:

αI(θ) = Pθ(X ∈ K), θ ∈ Θ0.

Definicja 5. Prawdopodobieństwo błędu drugiego rodzaju to prawdopodobieństwo przy- jęcia hipotezy zerowej, gdy jest ona fałszywa:

αII(θ) = Pθ(X ∈ Kc) = 1 − Pθ(X ∈ K), θ ∈ Θ1. Definicja 6. Funkcją mocy testu nazywamy β : Θ −→ [0, 1] postaci

β(θ) = Pθ(X ∈ K) = Eθϕ(X).

Z reguły bada się moc testu na alternatywie, czyli θ = θ1.

Definicja 7. Test o funkcji krytycznej ϕ (o obszarze krytycznym K) jest testem na poziomie istotności α ∈ (0, 1), jeżeli

θ∈Θ0 Eθϕ(X) = Pθ(X ∈ K) = β(θ) ≤ α.

Definicja 8. Rozmiarem testu o funkcji krytycznej ϕ (obszarze krytycznym K) nazywamy wielkość

β = sup

θ∈Θ0

Eθϕ(X) = sup

θ∈Θ0

β(θ).

Definicja 9. Test ϕ (K) na poziomie istotności α jest testem jednostajnie najmocniej- szym (JNM) w klasie testów Φ (K) na poziomie α, jeżeli

ϕ∈Φθ∈Θ1 β(θ) ≥ β(θ).

(2)

Twierdzenie (podstawowy lemat Neymana-Pearsona) Niech P0 i P1 będą rozkła- dami prawdopodobieństwa i niech f0 i f1 będą gęstościami tych rozkładów (względem pewnej ustalonej miary µ). Niech α ∈ (0, 1) będzie ustaloną liczbą.

(a) (istnienie testu) Istnieją stałe c i γ > 0 takie, że ϕ(x) =

1, gdy f1(x) > cf0(x), γ, gdy f1(x) = cf0(x), 0, gdy f1(x) < tf0(x),

jest testem hipotezy H0 : P0 przeciwko H1 : P1 na poziomie istotności α, tzn.

E0ϕ(X) = α. (1)

(b) (dostateczność) Jeżeli test ϕ spełnia warunek (1) i dla pewnego c warunek ϕ(x) = 1, gdy f1(x) > cf0(x),

0, gdy f1(x) < tf0(x), (2) to ϕ jest testem najmocniejszym dla testowania H0przeciwko H1na poziomie istotności α.

(c) (konieczność) Jeżeli φ jest testem najmocniejszym na poziomie istotności α dla testowania H0 przeciwko H1, to dla pewnego c spełnia on warunek (2).

Podsumowując, test statystyczny składa się z:

1. Hipotezy zerowej H0 i hipotezy alternatywnej H1, 2. Statystyki testowej T (X),

3. Obszaru krytycznego K.

4. Poziomu istotności α,

Decyzja: jeżeli T (X) ∈ K, to odrzucamy hipotezę H0, jeżeli T (X) /∈ K, to nie mamy podstaw do odrzucenia hipotezy zerowej.

Definicja 10. P-wartość (p-value) to graniczny poziom istotności - najmniejszy, przy któ- rym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej.

Jest to więc taki poziom istotności, przy którym zmienia się decyzja testu (zaczynając od lewej - od małego poziomu α, kiedy to nie mamy podstaw do odrzucenia H0, po przekroczeniu p-wartości zaczynamy odrzucać H0).

P-wartość pozwala bezpośrednio ocenić wiarygodność hipotezy. Im p-wartość jest większa, tym bardziej hipoteza H0 jest prawdziwa. Mała p-wartość świadczy przeciwko hipotezie zerowej.

Znajomość p-wartości pozwala przeprowadzić testowanie dla dowolnego poziomu istot- ności:

-odrzucamy hipotezę zerową H0, gdy

p-wartość ≤ α,

-nie mamy podstaw do odrzucenia hipotezy zerowej H0, gdy p-wartość > α.

(3)

Test Chi-kwadrat zgodności

nr klasy 1 2 3 4 5 ...

liczebności empiryczne n1 n2 n3 n4 n5 ...

• Hipotezy

H0 : X ∼ F, H1 : X  F, F jest dowolnym rozkładem prawdopodobieństwa.

• Statystyka testowa

χ2 =

k

X

i=1

(ni− nti)2 nti , gdzie

k - liczba klas,

ni - liczebności empiryczne (zaobserwowane), nti = n · pti - liczebności teoretyczne,

pti = PF(Xprzyjeła wartosc z klasy i) - prawdopodobieństwa teoretyczne.

Przy założeniu prawdziwości hipotezy zerowej statystyka χ2 ma rozkład chi-kwadrat z (k − r − 1) stopniami swobody (r jest liczbą nieznanych parametrów hipotetycz- nego rozkładu F ).

• Obszar krytyczny

K = (Fχ−12 k−1

(1 − α), +∞), gdzie Fχ−12

k−1

(1 − α) jest kwantylem rzędu 1 − α rozkładu chi-kwadrat z (k − r − 1) stopniami swobody.

Test Chi-kwadrat niezależności Tablica kontyngencji:

Cecha 1 Cecha 2 1 2 . . . k

1 n11 n12 . . . n1k 2 n21 n22 . . . n23 . . . . r nr1 nr2 . . . nrk

• Hipotezy

H0 : X, Y są niezależne, vs H1 : X, Y są zależne

(4)

• Statystyka testowa

χ2 =

k

X

j=1 r

X

i=1

(nij− ntij)2 ntij , gdzie

k - liczba kolumn w tablicy kontyngencji, r - liczba wierszy w tablicy kontyngencji, nij - liczebności empiryczne (zaobserwowane), ntij - liczebności teoretyczne, dane wzorem

ntij =

k

P

j=1

nij ·

r

P

i=1

nij

n ,

gdzie n =

k

P

j=1 r

P

i=1

nij .

Przy założeniu prawdziwości hipotezy zerowej statystyka χ2 ma rozkład chi-kwadrat z (k − 1)(r − 1) stopniami swobody.

• Obszar krytyczny

K = (Fχ−12 (k−1)(r−1)

(1 − α), +∞), gdzie Fχ−12

k−1

(1 − α) jest kwantylem rzędu 1 − α rozkładu chi-kwadrat z (k − r − 1) stopniami swobody.

Test Kołmogorowa

Test Kołmogorowa testuje zgodność z rozkładem F dla jednej próby (Test Kołmogorowa - Smirnowa dla dwóch prób testuje zgodność rozkładów w obu próbach).

• Hipotezy

H0 : X ∼ F, H1 : X  F, gdzie F jest ciągłym rozkładem prawdopodobieństwa.

1. n ≤ 100

• Statystyka testowa

Dn= sup

x∈R

|F (x) − Fn(x)| = max

1≤i≤n

 max



F (Xi:n) − i − 1 n

,

i

n − F (Xi:n)



,

(5)

• Obszar krytyczny

K = (FD−1

n(1 − α), 1],

gdzie FD−1n(1−α) jest kwantylem rzędu 1−α rozkładu statystyki Kołmogorowa (Dn).

2. n > 100

• Statystyka testowa √

nDn,

• Obszar krytyczny

K = (λ1−α, +∞),

gdzie λ1−α jest kwantylem rzędu 1 − α granicznego rozkładu statystyki Kołmogo- rowa (√

nDn).

Test Shapiro-Wilka Jest to test normalności rozkładu.

• Hipotezy

H0 : X ∼ N, H1 : X  N

• Statystyka testowa

W =

 n P

i=1

aixi:n

2 n

P

i=1

(xi− x)2 ,

gdzie stałe ai są dane wzorem

(a1, . . . , an) = m>V−1

√m>V−1V−1m,

gdzie m = (m1, . . . , mn)>, są wartościami oczekiwanymi statystyk pozycyjnych z pochodzących z próby iid z rozkładu standardowego normalnego a V jest ich ma- cierzą kowariancji (stablicowane).

• Obszar krytyczny

K = (Wn(1 − α), +∞),

gdzie Wn(1 − α) jest kwantylem rzędu 1 − α rozkładu statystyki Shapiro-Wilka W .

(6)

Test t-studenta

Jest to test parametryczny dla jednej lub dwóch prób, polegający na testowaniu równości wartości oczekiwanych (test istotności). Zakładamy, że pomiary podlegają rozkładowi normalnemu, oraz że wariancje w próbach nie różnią się od siebie istotnie.

1. Test t dla jednej próby

• Hipotezy

H0 : µ = µ0,

H1 : µ > µ0, (3)

µ < µ0, (4)

µ 6= µ0 (5)

• Statystyka testowa

T =√ n

X − µ¯ 0

sX , gdzie s2X = n−11

n

P

i=1

(Xi− ¯X)2 to próbkowe odchylenie standardowe. Statystyka te- stowa T ma rozkład t-studenta o (n − 1) stopniach swobody.

• Obszar krytyczny

Zależy od postaci hipotezy alternatywnej w następujący sposób:

K1 = (Ft−1n−1(1 − α), +∞), K2 = (−∞, −Ft−1n−1(1 − α)),

K3 = (−∞, −Ft−1n−1(1 −α2)) ∪ (Ft−1n−1(1 −α2), +∞),

gdzie Ft−1n−1(a) to kwantyl rzędu a rozkładu t-studenta z (n − 1) stopniami swobody.

Jeżeli wariancja rozkładu jest znana, wówczas sX zastępujemy przez odchylenie standardowe rozkładu, zaś Ft−1n−1(a) zastępujemy przez Φ−1(a).

2. Test t dla dwóch prób niezależnych

• Hipotezy

H0 : µ1 = µ2, H1 : µ1 6= µ2

• Statystyka testowa

T =

1− ¯X2 SX¯1− ¯X2

, gdzie

SX¯1− ¯X2 = s

(n1− 1)s21+ (n2− 1)s22 n1+ n2− 2

 1 n1 + 1

n2

 ,

s1, s2 to nieznane odchylenia standardowe z próbek, zaś n1, n2 to liczebności próbek.

Statystyka testowa T ma rozkład t-studenta o (n1+ n2− 2) stopniach swobody.

(7)

• Obszar krytyczny

K = (−∞, −Ft−1

n1+n2−2(1 −α

2)) ∪ (Ft−1

n1+n2−2(1 −α

2), +∞) 3. Test dla dwóch prób zależnych

• Hipotezy

H0 : µ1 = µ2, H1 : µ1 6= µ2

• Statystyka testowa

T = d¯ Sd¯

, gdzie

d =¯ 1 n

n

X

i=1

di,

di = x1i− x2i, i = 1, . . . , n,

Sd¯= v u u t

1 n − 1

n

X

i=1

(di− ¯d)2,

zaś x1i, x2i oznaczają wartości cechy X dla i-tego obiektu w pierwszym i drugim badaniu. Statystyka testowa T ma rozkład t-studenta o (n − 1) stopniach swobody.

• Obszar krytyczny

K = (−∞, −Ft−1

n−1(1 −α

2)) ∪ (Ft−1

n−1(1 −α

2), +∞)

UWAGA: Gdy liczebność próby jest duża (n > 30, n1+ n2 > 30), to kwantyl rozkładu t-studenta zastępujemy przez kwantyl rozkładu standardowego normalnego (Ft−1n ' Φ).

Cytaty

Powiązane dokumenty

Zdecydowanie najwięcej pojawiało się analiz ekonomicznych, koncentrują ­ cych się wokół wydatków militarnych (częsty powód upadku byłych imperiów), ale nie brakowało

Pow ołując się n a wagę owych wydarzeń, stwierdza: „(...) kryzysy te oraz sposoby ich rozwiązywania stanow ią zasadnicze m om enty zwrotne w historii

Praca własna: Wykonaj trzy przykłady (jeden wiersz)

Utrwalanie wiadomości dzieci na temat zwyczajów i symboliki Świąt Wielkanocnych Zachęcanie dzieci do podejmowania aktywności językowych, plastycznych, ruchowych. Otwieramy

Na podstawie tych danych, na poziomie istotności 0, 01, prze- testować hipotezę, że odsetek dorosłych Polaków, którzy nie przeczytali w ubiegłym miesiącu żadnej książki

przyjąć H 1 : na podstawie obserwacji nie możemy stwierdzić, że nowa technologia zmniejsza poziom

przyjąć H 1 : na podstawie obserwacji nie możemy stwierdzić, że nowa technologia zmniejsza poziom zanieczyszczeń.. Chcielibyśmy stwierdzić, że nowa

Produkt biopodobny jest wytwarzany z wy- korzystaniem budowy lub funkcji leku referencyjnego, jednak różnice pomiędzy biologicznym produktem re- ferencyjnym a biopodobnym są