0. Przypomnienie potrzebnych definicji 1. Porównywanie testów

(1)

Statystyka Matematyczna

Anna Janicka

wykład X, 9.05.2016

TESTOWANIE HIPOTEZ STATYSTYCZNYCH II:

PORÓWNYWANIE TESTÓW

(2)

Plan na dzisiaj

0. Przypomnienie potrzebnych definicji 1. Porównywanie testów

2. Test jednostajnie najmocniejszy

3. Test ilorazowy dla hipotez prostych:

lemat Neymana-Pearsona

4. Przykłady testów dla hipotez prostych (i

uogólnienia)

(3)

Definicje – przypomnienie

Testujemy H

₀

: θ ∈ Θ

₀

przeciw H

₁

: θ ∈ Θ

₁

K – obszar krytyczny testu, zbiór wyników, przy których odrzucamy H

₀

, K = {x ∈ X : δ ^{(x) = 1}}

Test jest na poziomie istotności α , jeśli dla każdego θ ∈ Θ

₀

mamy P

_θ

(K) ≤ α ^.

P

_θ

(K) dla θ ∈ Θ

₁

– moc testu (przy hipotezie alternatywnej)

decyzja

Stan faktyczny

H₀prawdziwa H₀fałszywa odrzucić H₀ błąd I-go

rodzaju

OK

nie odrzucać H₀ OK błąd II-go

rodzaju

(4)

Przypomnienie:

interpretacja graficzna

rozkłady statystyki testowej przy założeniu prawdziwości hipotezy zerowej i alternatywnej

c

θ = θ₀ θ = θ₁

błąd I-go rodzaju błąd II-go rodzaju

moc testu dla hipotezy

alternatywnej

(5)

Przykład złego testu

c θ = θ₀

θ = θ₁

błąd I-go rodzaju błąd II-go rodzaju

rozkłady statystyki testowej przy założeniu prawdziwości hipotezy zerowej i alternatywnej

moc testu dla hipotezy alternatywnej

(6)

Porównywanie testów

Jak wybrać najlepszy test?

dla ustalonych hipotez zerowej i alternatywnej dla ustalonego poziomu istotności

(„konserwatyzmu badacza”)

→ lepszy jest test, który jest mocniejszy

(7)

Porównywanie mocy testów

X ~ P _θ , {P _θ : θ ∈ Θ} – rodzina rozkładów Testujemy H ₀ : θ ∈ Θ ₀ przeciw H

₁

: θ ∈ Θ ₁

t. że Θ ₀ ∩ Θ ₁ = ∅

dwoma testami o obszarach krytycznych K ₁ i K ₂ ; oba na poziomie istotności α .

Test o obszarze krytycznym K ₁ jest

mocniejszy niż test o obszarze krytycznym K ₂ , jeśli

) (

: oraz

) (

:

2 1

1 1

2 1

1

K P K

P

K P

θ θ

>

Θ

∈

∃

≥ Θ

∈

∀

(8)

Test jednostajnie najmocniejszy

Dla ustalonych H ₀ : θ ∈ Θ ₀ i H

₁

: θ ∈ Θ ₁ :

δ * jest testem jednostajnie najmocniejszym (TJNM) na poziomie istotności α , jeśli

1) δ * jest testem na poziomie istotności α ,

2) dla każdego testu δ na poziomie istotności α , mamy, dla każdego θ ∈ Θ ₁ :

P _θ ( δ (X)=1) ≥ P _θ ( δ (X)=1)*

tzn. moc testu δ* jest niemniejsza niż moc każdego

innego testu tych samych hipotez, dla dowolnego θ ∈ Θ₁ jeśli Θ₁jest jednoelementowy, niepotrzebne jest słowo

„jednostajnie”

(9)

Test jednostajnie najmocniejszy –

sformułowanie z obszarem krytycznym

Dla ustalonych H

₀

: θ ∈ Θ

₀

i H

₁

: θ ∈ Θ

₁

:

**Test o obszarze krytycznym K* jest testem jednostajnie najmocniejszym (TJNM) na** poziomie istotności α ^{, jeśli}

1) Test o obszarze krytycznym K jest testem na* poziomie istotności α ^{, tzn.}

dla każdego θ ∈ Θ

₀

: P

_θ

(K) ≤* α ,

2) dla każdego testu o obszarze krytycznym K na poziomie istotności α , mamy dla każdego θ ∈ Θ

₁

:

P

_θ

(K) ≥ P*

_θ

(K)

(10)

Testowanie hipotez prostych

Obserwujemy X. Chcemy testować H ₀ : θ = θ ₀ przeciw H

₁

: θ = θ ₁ .

(dwie hipotezy proste)

Możemy zapisać to jako:

H ₀ : X ~ f ₀ przeciw H

₁

: X ~ f ₁ ,

gdzie f ₀ i f ₁ to gęstości rozkładów opisanych

przez θ ₀ i θ ₁ (tj. P ₀ i P ₁ )

(11)

Test ilorazowy dla hipotez prostych.

Lemat Neymana-Pearsona

Niech t. że

Wówczas dla dowolnego zbioru K ⊆ X : jeśli P ₀ (K) ≤ α , to P ₁ (K) ≤ 1– β .

(tzn. test o obszarze krytycznym K jest testem (jednostajnie)* najmocniejszym do testowania hipotezy H

₀

przeciw H

₁

)

Często łatwiej obszar krytyczny zapisać jako

K = {x: lnf*

₁

(x) – lnf

₀

(x) > c

₁

}

Test ilorazowy (ilorazu funkcji wiarogodności): przyrównujemy iloraz szans do pewnej stałej, jeśli „zły” to odrzucamy H

₀

β

α = −

=

 



 

 ∈ >

=

1 *) (

i

*) (

) (

) : (

*

1 0

0 1

K P

x c f

x x f

K X

(12)

Lemat Neymana-Pearsona – Przykład 1

Model normalny: X

₁

, X

₂

, ..., X

_n

są próbą IID z rozkładu N( µ , σ ² ), przy czym σ ² jest znane Test najmocniejszy dla

H ₀ : µ = 0 przeciw H

₁

: µ = 1.

Rozw: na poziomie istotności α :

Np. dla obs. 1,37; 0,21; 0,33; -0,45; 1,33; 0,85; 1,78; 1,21; 0,72 z N(µ, 1) mamy, dla α = 0,05 :

→ odrzucamy H₀

µ

₀

< µ

₁

 



 

 >

=

⁻

n X u

x x

x

K

_n ₁ _α

σ

2

1

, ,..., ) : (

*

54 , 9 0

1 645 ,

82 1 ,

0 > ⋅ ≈

≈

X

(13)

Lemat Neymana-Pearsona – Przykład 1 cd.

Moc testu dla hipotezy alternatywnej

Gdy zmieniamy α , µ ₁ , n – moc testu....

 

 



 − ⋅

Φ

−

=

 =



 



 > =

=

µ σ σ µ

n X n

P K

P

1 1

645 ,

1 1

....

645 1 ,

*) 1 (

≈ 0,91

(14)

Lemat Neymana-Pearsona:

Uogólnienie przykładu 1

Ten sam test jest TJNM dla H

₁

: µ > 0 oraz dla H ₀ : µ ≤ 0 przeciw H

₁

: µ > 0

ogólniej: przy pewnych dodatkowych założeniach dot.

rodziny rozkładów, analogiczna postać testu jest TJNM dla testów jednostronnych

H

₀

: µ ≤ µ

₀

przeciw H

₁

: µ > µ

₀

Uwaga: zmiana kierunku nierówności w obszarze krytycznym gdy testujemy

H

₀

: µ ≥ µ

₀

^{przeciw H}

₁

^: µ ^< µ

₀

(15)

Lemat Neymana-Pearsona – Przykład 2

Model wykładniczy: X

₁

, X

₂

, ..., X

_n

są próbą IID z rozkładu exp( λ ), n = 10.

Test najmocniejszy dla

H ₀ : λ = ½ przeciw H

₁

: λ = ¼.

Rozw: na poziomie istotności α = 0,05:

Np. dla danych: 2; 0,9; 1,7; 3,5; 1,9; 2,1; 3,7; 2,5; 3,4; 2,8:

Σ = 24,5 → nie ma podstaw do odrzucenia H

₀

.

{ ⁽ ^, ^,..., ⁾ ^: ³¹ ^, ⁴¹ }

* = ^x

₁

^x

₂

^x

₁₀

∑ ^x

ⁱ

>

K

) ( )

, ( )

, (

) , ( )

, ( )

, 1 ( )

(

exp λ = Γ λ Γ

a

λ + Γ

b

λ = Γ

a

+

b

λ Γ

ⁿ₂ ¹₂

= χ

² n

(16)

Lemat Neymana-Pearsona – Przykład 2’

Model wykładniczy: X

₁

, X

₂

, ..., X

_n

są próbą IID z rozkładu exp( λ ), n = 10.

Test najmocniejszy dla

H ₀ : λ = ½ przeciw H

₁

: λ = ¾.

Rozw: na poziomie istotności α = 0,05:

Np. dla danych: 2; 0,9; 1,7; 3,5; 1,9; 2,1; 3,7; 2,5; 3,4; 2,8:

Σ = 24,5 → nie ma podstaw do odrzucenia H

₀

.

{ ⁽ ^, ^,..., ⁾ ^: ¹⁰ ^, ⁸⁵ }

* = ^x

₁

^x

₂

^x

₁₀

∑ ^x

ⁱ

<

K

) ( )

, ( )

, (

) , ( )

, ( )

, 1 ( )

(

exp λ = Γ λ Γ

a

λ + Γ

b

λ = Γ

a

+

b

λ Γ

ⁿ₂ ¹₂

= χ

² n

(17)

Przykład 2 cd.

Test

jest TJNM dla H ₀ : λ ≥ ½ przeciw H

₁

: λ < ½ Test

jest TJNM dla H ₀ : λ ≤ ½ przeciw H

₁

: λ > ½

{ ⁽ ^, ^,..., ⁾ ^: ³¹ ^, ⁴¹ }

* = ^x

₁

^x

₂

^x

₁₀

∑ ^x

ⁱ

>

K

{ ⁽ ^, ^,..., ⁾ ^: ¹⁰ ^, ⁸⁵ }

* = ^x

₁

^x

₂

^x

₁₀

∑ ^x

ⁱ

<

K

(18)

Test ilorazu wiarogodności dla hipotez złożonych

X ~ P _θ , {P _θ : θ ∈ Θ} – rodzina rozkładów Testujemy H ₀ : θ ∈ Θ ₀ przeciw H

₁

: θ ∈ Θ ₁

t. że Θ ₀ ∩ Θ ₁ = ∅, Θ ₀ ∪ Θ ₁ = Θ Niech

H ₀ : X ~ f ₀ ( θ ₀ , ⋅) dla pewnego θ ₀ ∈ Θ ₀ , H

₁

: X ~ f ₁ ( θ ₁ , ⋅) dla pewnego θ ₁ ∈ Θ ₁ ,

gdzie f ₀ i f ₁ to rodziny gęstości rozkładów (dla θ ∈ Θ ₀ oraz θ ∈ Θ ₁ , odpowiednio)

Jak w lemacie N-P, ale modele są statystyczne – zawierają nieznane parametry. Postępujemy jednak podobnie...

(19)

Test ilorazu wiarogodności dla hipotez złożonych – cd.

Statystyka testowa:

lub inaczej

gdzie są estymatorami NW odpowiednio w modelu opisanym przez hipotezę zerową

oraz hipotezę alternatywną

Odrzucamy H ₀ jeśli λ > c dla pewnej stałej c (wyznaczonej odpowiednio do poz. istotności)

) ,

( sup

) ,

( sup

0 0

1 1

0 0

1 1

X f

θ λ θ

θ θ

Θ

∈ Θ

=

∈

) ˆ ,

(

) ˆ ,

(

0 0

1 1

X f

θ λ = θ

1 0

, ˆ

ˆ θ

θ

(20)

Test ilorazu wiarogodności dla hipotez złożonych – uzasadnienie

Podobnie jak w tw. Neymana-Pearsona,

porównujemy „największą szansę otrzymania obserwacji X, gdy prawdziwa jest hipoteza

alternatywna” do „największej szansy

otrzymania obserwacji X, gdy prawdziwa jest hipoteza zerowa”; odrzucamy hipotezę

zerową na rzecz alternatywnej, gdy ten

stosunek jest bardzo niekorzystny dla

hipotezy zerowej.

(21)

Test ilorazu wiarogodności dla hipotez złożonych – wersja alternatywna

Statystyka testowa:

lub inaczej

gdzie są estymatorami NW odpowiednio w modelu bez ograniczeń oraz w modelu

opisanym przez hipotezę zerową

Odrzucamy H ₀ jeśli dla pewnej stałej .

) ,

( sup

) ,

(

~ sup

0

0 0

0

f X

X f

θ λ θ

θ θ

Θ

∈ Θ

=

∈

) ˆ ,

(

) ˆ ,

~ (

0

X

f

X f

θ λ = θ

ˆ

0

ˆ , θ θ

~ > c~

λ c~

wersja wygodniejsza, jeśli hipoteza zerowa jest prosta albo jeśli mamy do czynienia z modelami zagnieżdżonymi

(22)

Test ilorazu wiarogodności dla hipotez złożonych – własności

Dla niektórych modeli z hipotezami złożnymi TJNM nie istnieje (więc test ilorazu wiarogodności nie

będzie na pewno TJNM bo takiego nie ma)

np. testowanie H

₀

: θ = θ

₀

przeciw H

₁

: θ ≠ θ

_0,

jeżeli rodzina spełnia warunek monotonicznego ilorazu wiarogodności, tj.

f

₁

(x)/f

₀

(x) jest rosnącą funkcją pewnej statystyki T(x) dla każdych f

₀

i f

₁

odpowiadających parametrom θ

₀

< θ

₁

.

Żeby mieć TJNM H

₀

: θ = θ

₀

przeciw H

₁

: θ < θ

₀

należałoby

mieć obszar krytyczny postaci T(x)>c, a żeby test był TJNM

dla H

₀

: θ = θ

₀

przeciw H

₁

: θ > θ

₀

obszar krytyczny musi być

postaci T(x)<c, a zatem nie da się ustalić TJNM dla hipotezy

H

₁

: θ ≠ θ

_0,

.

(23)

0. Przypomnienie potrzebnych definicji 1. Porównywanie testów

Statystyka Matematyczna

Anna Janicka

Plan na dzisiaj