• Nie Znaleziono Wyników

0. Test ilorazowy – przypomnienie 1. Przykłady testów ilorazowych:

N/A
N/A
Protected

Academic year: 2021

Share "0. Test ilorazowy – przypomnienie 1. Przykłady testów ilorazowych:"

Copied!
30
0
0

Pełen tekst

(1)

Statystyka Matematyczna

Anna Janicka

wykład XI, 16.05.2016

TESTOWANIE HIPOTEZ STATYSTYCZNYCH III:

TESTY ISTOTNOŚCI

(2)

Plan na dzisiaj

0. Test ilorazowy – przypomnienie 1. Przykłady testów ilorazowych:

Model I: Porównanie średniej z normą w modelu normalnym:

wersje jedno- i dwustronne, σ2 znane

Model II: Porównanie średniej z normą w modelu normalnym:

wersje jedno- i dwustronne, σ2 nieznane

+ Porównanie wariancji z normą w modelu normalnym: wersje jedno- i dwustronne

Model III: Porównanie średniej z normą, duże próby

Model IV: Porównanie wsp. struktury z normą, duże próby

2. Asymptotyczne własności testu ilorazowego 3. Testy randomizowane

4. Testy parametryczne dla więcej niż jednej populacji

(3)

Test ilorazowy dla hipotez prostych.

Lemat Neymana-Pearsona – przypomnienie

Testujemy H

0

: X ~ f

0

przeciw H

1

: X ~ f

1

Niech

t. że

Wówczas dla dowolnego zbioru K ⊆ X : jeśli P

0

(K) ≤ α , to P

1

(K) ≤ 1– β .

(tzn. test o obszarze krytycznym K* jest testem (jednostajnie) najmocniejszym do testowania hipotezy H

0

przeciw H

1

)

β

α = −

=

 

 

 ∈ >

=

1

*) (

*) (

) (

) : (

X

*

1 0

0 1

K P

i K

P

x c f

x x f

K

(4)

Test ilorazu wiarogodności dla hipotez złożonych – przypomnienie

H

0

: X ~ f

0

( θ

0

, ⋅) dla pewnego θ

0

∈ Θ

0

, H

1

: X ~ f

1

( θ

1

, ⋅) dla pewnego θ

1

∈ Θ

1

, Statystyka testowa: lub

gdzie są estymatorami ENW odpowiednio w modelu bez ograniczeń, opisanym przez hipotezę zerową oraz hipotezę alternatywną

Odrzucamy H

0

jeśli λ > c lub (stałe

wyznaczone odpowiednio do poz. istotności)

) ˆ ,

(

) ˆ ,

(

0 0

1 1

X f

X f

θ λ = θ

1 0

, ˆ , ˆ

ˆ θ θ θ

) ˆ ,

(

) ˆ ,

~ (

0

0

X

f

X f

θ λ = θ

~ > c~

λ

(5)

Test ilorazu wiarogodności:

szczególne przypadki

Konkretna postać testu zależy od rozkładów.

Często wyznaczenie rozkładu statystyki testowej jest trudne/żmudne (w wielu przypadkach korzysta się z

asymptotycznych własności testu

ilorazowego)

(6)

Uwaga na notację:

x

coś

zawsze oznacza kwantyl rzędu coś

(7)

Model I: porównanie z normą

Model normalny: X

1

, X

2

, ..., X

n

są próbą IID z rozkładu N( µ , σ

2

), przy czym σ

2

jest znane H

0

: µ = µ

0

Statystyka testowa:

H

0

: µ = µ

0

przeciw H

1

: µ > µ

0

zbiór krytyczny

H

0

: µ = µ

0

przeciw H

1

: µ < µ

0

zbiór krytyczny

H

0

: µ = µ

0

przeciw H

1

: µ ≠ µ

0

zbiór krytyczny

) 1 , 0 (

0

~

N X n

U σ

µ

= −

} )

( :

{

* = x U x > u

1α

K

} )

( :

{

* = x U x < u

α

= − u

1α

K

}

| ) ( :|

{

* = x U x > u

1α /2

K

(8)

Model I: przykład

Niech X

1

, X

2

, ..., X

10

będą próbą IID z rozkładu N( µ , 1):

-1,21 -1,37 0,51 0,37 -0,75 0,44 1,20 -0,96 -1,14 -1,40

Czy µ =0? (dla α = 0,05)

W próbie: średnia = -0,43, wariancja = 0,92 Statystyka testowa:

H

0

: µ = 0 przeciw H

1

: µ ≠ 0, u

0,975

≈1,96 (p-value ≈ 0,172)

H

0

: µ = 0 przeciw H

1

: µ < 0, u

0,95

≈ -1,64 (p-value ≈ 0,086)

H

0

: µ = 0 przeciw H

1

: µ > 0, u

0,95

≈1,64 (p-value ≈ 0,914)

→ w żadnym przypadku nie ma podstaw do

odrzucenia H

0

(dla α = 0,05; dla α = 0,1 byłyby) 36 , 1 1 10

0 43

,

0 − ≈ −

= −

U

(9)

Model II: porównanie z normą (średnia)

Model normalny: X

1

, X

2

, ..., X

n

są próbą IID z rozkładu N( µ , σ

2

), przy czym σ

2

jest nieznane H

0

: µ = µ

0

Statystyka testowa:

H

0

: µ = µ

0

przeciw H

1

: µ > µ

0

zbiór krytyczny

H

0

: µ = µ

0

przeciw H

1

: µ < µ

0

zbiór krytyczny

H

0

: µ = µ

0

przeciw H

1

: µ ≠ µ

0

zbiór krytyczny

) 1 (

0

~ −

= − n t n

S

T X µ

)}

1 (

) ( :

{

* = x T x > t

1

n

K

α

)}

1 (

) ( :

{

* = x T x < t n

K

α

)}

1 (

| ) ( :|

{

* = x T x > t

1 / 2

n

K

α

) 1 (

) 1

(n − = −t1 n

tα α

(10)

Model II: przykład (średnia)

Niech X

1

, X

2

, ..., X

10

będą próbą z rozkładu N( µ , σ

2

):

-1,21 -1,37 0,51 0,37 -0,75 0,44 1,20 -0,96 -1,14 -1,40

Czy µ =0? (dla α = 0,05)

W próbie: średnia = -0,43, wariancja = 0,92 Statystyka testowa:

H

0

: µ = 0 przeciw H

1

: µ ≠ 0, t

0,975

≈2,26 (p-value ≈ 0,207)

H

0

: µ = 0 przeciw H

1

: µ < 0, u

0,95

≈ -1,83 (p-value ≈ 0,103)

H

0

: µ = 0 przeciw H

1

: µ > 0, u

0,95

≈1,83 (p-value ≈ 0,897)

→ w żadnym przypadku nie ma podstaw do odrzucenia H

0

(dla α = 0,05)

36 , 1 92 10

, 0

0 43

,

0 − ≈ −

= −

U

(11)

Model II: porównanie z normą (wariancja)

Model normalny: X

1

, X

2

, ..., X

n

są próbą IID z rozkładu N( µ , σ

2

), przy czym σ

2

jest nieznane H

0

: σ = σ

0

Statystyka testowa:

H

0

: σ = σ

0

przeciw H

1

: σ > σ

0

zbiór krytyczny

H

0

: σ = σ

0

przeciw H

1

: σ < σ

0

zbiór krytyczny

H

0

: σ = σ

0

przeciw H

1

: σ ≠ σ

0

zbiór krytyczny

) 1 (

) ~ 1

(

2

2 0

2

2

− −

= n S n

σ χ χ

)}

1 (

) ( :

{

* = x

2

x >

12

n

K χ χ

α

)}

1 (

) ( :

{

* = x

2

x <

2

n

K χ χ

α

)}

1 (

) (

) 1 (

) ( :

{

*

2

2 / 1 2

2 2 / 2

>

<

=

n

x

n x

x K

α α

χ χ

χ

χ

(12)

Model II: przykład (wariancja)

Niech X

1

, X

2

, ..., X

10

będą próbą z rozkładu N( µ , σ

2

):

-1,21 -1,37 0,51 0,37 -0,75 0,44 1,20 -0,96 -1,14 -1,40

Czy σ

2

=1? (dla α = 0,05)

W próbie: wariancja = 0,92 Statystyka testowa:

H

0

: σ = 1 przeciw H

1

: σ > 1 H

0

: σ = 1 przeciw H

1

: σ < 1 H

0

: σ = 1 przeciw H

1

: σ ≠ 1

→ w żadnym przypadku nie ma podstaw do odrzucenia H

0

(dla α = 0,05)

28 , 1 8

92 , 0

2

9 ⋅ ≈

χ =

92 ,

2

16

95 ,

0

χ

33 ,

2

3

05 ,

0

χ

02 , 19

; 70 ,

2

02,975

2 025 ,

0

≈ χ ≈

χ

(13)

Model III: porównanie z normą

Model asymptotyczny: X

1

, X

2

, ..., X

n

są próbą IID z rozkładu mającego średnią ( µ ) oraz wariancję

(nieznaną), n – duże.

H

0

: µ = µ

0

Statystyka testowa:

ma dla dużych n w przybliżeniu rozkład N(0,1) H

0

: µ = µ

0

przeciw H

1

: µ > µ

0

zbiór krytyczny

H

0

: µ = µ

0

przeciw H

1

: µ < µ

0

zbiór krytyczny

H

0

: µ = µ

0

przeciw H

1

: µ ≠ µ

0

zbiór krytyczny

S n T X − µ

0

=

} )

( :

{

* = x T x > u

1α

K

} )

( :

{

* = x T x < u

α

= − u

1α

K

}

| ) ( :|

{

* = x T x > u

1α /2

K

(14)

Model IV: porównanie z normą

Model asymptotyczny: X

1

, X

2

, ..., X

n

są próbą IID z rozkładu dwupunktowego, n – duże.

H

0

: p = p

0

Statystyka testowa:

ma w przybliżeniu rozkład N(0,1) H

0

: p = p

0

przeciw H

1

: p > p

0

zbiór krytyczny

H

0

: p = p

0

przeciw H

1

: p < p

0

zbiór krytyczny

H

0

: p = p

0

przeciw H

1

: p p

0

zbiór krytyczny

) 0 (

1 )

1

( X = = p = − P X =

P

p p

p n p

p n p

p p

p U X

) 1

( ˆ )

1

* (

0 0

0 0

0

0

= −

= −

} )

( :

{

* = x U x > u

1α

K

} )

( :

{

* = x U x < u

α

= − u

1α

K

}

| ) ( :|

{

* = x U x > u

1α /2

K

(15)

Model IV: przykład

Rzucamy 400 razy monetą. Wypada 180 orłów. Czy moneta jest symetryczna?

H

0

: p = ½

dla α = 0,05 i H

1

: p ≠ ½ mamy u

0,975

=1,96 → odrzucamy H

0

dla α = 0,01 i H

1

: p ≠ ½ mamy u

0,995

=2,58

→ nie odrzucamy H

0

dla α = 0,01 i H

1

: p < ½ mamy u

0,01

= -u

0,99

=-2,33

→ nie odrzucamy H

0

p-wartość dla H

1

: p ≠ ½: 0,044 p-wartość dla H

1

: p < ½: 0,022

2 ) 400

2 / 1 1

( 2 / 1

) 2 / 1 400

/ 180

* ( = −

= −

U

(16)

Asymptotyczne własności testu ilorazowego

Rozpatrujemy dwa modele zagnieżdżone, testujemy H

0

: h( θ ) = 0 przeciw H

1

: h( θ ) ≠ 0

Przy założeniu, że

h jest dostatecznie porządna Θ jest zbiorem d-wymiarowym

Θ

0

= { θ : h( θ ) = 0} jest zbiorem o wymiarze d – p Tw. Jeśli H

0

prawdziwa, to przy n→∞ rozkład

statystyki zmierza do rozkładu chi-kwadrat z p stopniami swobody

λ ~ ln 2

liczba stopni swobody = liczba ograniczeń

(17)

Asymptotyczne własności testu ilorazowego – przykład.

Model wykładniczy: X

1

, X

2

, ..., X

n

są próbą IID z rozkładu wykładniczego Exp( θ ).

Testujemy H

0

: θ = 1 przeciw H

1

: θ ≠ 1

dalej:

z tw.:

dla poziomu istotności α =0,05 mamy a więc odrzucimy H

0

na rzecz H

1

gdy

X ENW ( θ ) = θ ˆ = 1 /

( ( 1 ) )

1 exp )

exp(

) exp(

) (

)

~ (

1 1

1

ˆ

= −

Σ

Σ

= − Π

= Π n X

X x

x x

f

x f

n i

X i X

i

i n

λ

θ

) 1 ( )

ln )

1 ((

~ 2 ln

2 λ = n X − − X  →

D

χ

2

c

c ~ 2 ln ~

ln

~ 2

~ > ⇔ λ >

λ

c~

ln 2 84

, 3 )

1

2

(

95 ,

0

≈ ≈

χ

2 / 84 ,

~

3

> e

λ

(18)

Randomizacja testu

Czasem może nie być testu o poziomie istotności równym dokładnie α (np. dla zmiennych o rozkładach dyskretnych).

Wówczas rozwiązaniem jest randomizacja.

(TJNM, o ile jest, musi być zrandomizowany).

np. liczba orłów w 8 rzutach, H

0

: p = ½, H

1

: p <½, α=0,05:

X≤1 odrzucamy, X>2 OK, X=2: p=1/11 odrzucamy

xi 0 1 2 3 4 5 6 7 8

pi 0,004 0,03 0,11 0,22 0,27 0,22 0,11 0,03 0,004 suma pi 0,004 0,04 0,15 0,36 0,64 0,86 0,97 0,996 1,000

(19)

Porównywanie dwóch i więcej populacji

Zastanawiamy się, czy populacje są pod pewnymi względami „takie same”:

testy parametryczne: badamy równość konkretnych parametrów rozkładów

testy nieparametryczne: sprawdzamy, czy

rozkłady są takie same

(20)

Model I: porównanie średnich, poziom istotności α

Model normalny: X

1

, X

2

, ..., X

nX

są próbą IID z

rozkładu N( µ

X

, σ

X2

), Y

1

, Y

2

, ..., Y

nY

są próbą IID z rozkładu N( µ

Y

, σ

Y2

), σ

X2

, σ

Y2

znane , próby nzal.

H

0

: µ

x

= µ

Y

Statystyka testowa:

H

0

: µ

x

= µ

Y

przeciw H

1

: µ

x

> µ

Y

zbiór krytyczny

H

0

: µ

x

= µ

Y

przeciw H

1

: µ

x

≠ µ

Y

zbiór krytyczny

) 1 , 0 (

2

~

2

Y N

U X

Y Y X

X

n n

σ σ

+

= −

} )

( :

{

* = x U x > u

1α

K

}

| ) ( :|

{

* = x U x > u

1α /2

K

przy założeniu prawdziwości H0

(21)

Model I – porównanie średnich. Przykład

X

1

, X

2

, ..., X

10

są próbą IID z rozkładu N( µ

X

, 11

2

), Y

1

, Y

2

, ..., Y

10

są próbą IID z rozkładu N( µ

Y

, 13

2

) Na podstawie próby:

Czy średnie są równe, na poziomie istotności 0,05?

H

0

: µ

x

= µ

Y

przeciw H

1

: µ

x

≠ µ

Y

mamy: u

0,975

≈ 1,96.

|0,557| < 1,96 → nie ma podstaw

do odrzucenia H

0

o równości średnich

498 ,

501 =

= Y

X

557 ,

498 0 501

10 11 10

132 2

+ ≈

= −

U

(22)

Model II: porównanie średnich, wariancje

nieznane, wariancje równe, poziom istotności α

Model normalny: X

1

, X

2

, ..., X

nX

są próbą IID z rozkładu N( µ

X

, σ

2

), Y

1

, Y

2

, ..., Y

nY

są próbą IID z rozkładu N( µ

Y

, σ

2

) przy czym σ

2

nieznane , próby nzal

H

0

: µ

x

= µ

Y

Statystyka testowa:

H

0

: µ

x

= µ

Y

przeciw H

1

: µ

x

> µ

Y

zbiór krytyczny

H

0

: µ

x

= µ

Y

przeciw H

1

: µ

x

≠ µ

Y

zbiór krytyczny

)}

2 (

) ( :

{

* = x T x > t

1

n

x

+ n

y

K

α

)}

2 (

| ) ( :|

{

* = x T x > t

1 /2

n

x

+ n

y

K

α

przy założeniu prawdziwości H0

2 1 1

2 1 2 1 1

2 1

) (

, )

(

= =

=

= Y

Y X

X

n

i i

Y n n

i i

X n X X S Y Y

S

) 2 (

~ ) 2 (

) 1 (

) 1

(

2 2

− +

− + +

− +

= −

X Y X Y

Y X

Y X Y

Y X

x

n n

t n

n n n

n n S

n S

n

Y

T X

(23)

Model II: porównanie średnich, wariancje nieznane, wariancje równe, cd.

można też zapisać jako

gdzie

jest estymatorem wariancji σ

2

opartym na obu próbach

) 2 (

~ ) 2 (

) 1 (

) 1

(

2 2

− +

− + +

− +

= −

X Y X Y

Y X

Y X Y

Y X

x

n n

t n

n n n

n n S

n S

n

Y T X

) 2 (

1 ~

1 + −

+

= −

Y X

Y X

n n

t n

S n

Y T X

2 ) 1 (

) 1

(

2 2

2

− +

− +

= −

y x

Y Y

X x

n n

S n

S

S n

(24)

Model II: porównanie wariancji, poziom istotności α

Model normalny: X

1

, X

2

, ..., X

nX

są próbą IID z

rozkładu N( µ

X

, σ

X2

), Y

1

, Y

2

, ..., Y

nY

są próbą IID z

rozkładu N( µ

Y

, σ

Y2

), σ

X2

, σ

Y2

nieznane , próby nzal H

0

: σ

X

= σ

Y

Statystyka testowa:

H

0

: σ

X

= σ

Y

przeciw H

1

: σ

X

> σ

Y

zbiór krytyczny

H

0

: σ

X

= σ

Y

przeciw H

1

: σ

X

≠ σ

Y

zbiór krytyczny

) 1 ,

1 (

2

~

2

=

X Y

Y

X

F n n

S F S

)}

1 ,

1 (

) ( :

{

* = x F x > F

1

n

X

n

Y

K

α

)}

1 ,

1 (

) (

) 1 ,

1 (

) ( : {

*

2 / 1

2 /

>

<

=

X Y

Y X

n n

F x

F

n n

F x

F x

K

α α

przy założeniu prawdziwości H0

2 1 1

2 1 2 1 1

2 1

) (

, )

(

= =

=

= Y

Y X

X

n

i i

Y n n

i i

X n X X S Y Y

S

(25)

Model II: porównanie średnich, wariancje nieznane i nie zakładamy ich równości

Model normalny: X

1

, X

2

, ..., X

nX

są próbą IID z

rozkładu N( µ

X

, σ

X2

), Y

1

, Y

2

, ..., Y

nY

są próbą IID z

rozkładu N( µ

Y

, σ

Y2

), σ

X2

, σ

Y2

nieznane , próby nzal.

H

0

: µ

x

= µ

Y

Statystyka testowa bardzo prosta:

nie da się wyznaczyć statystyki testowej tak, żeby jej rozkład nie zależał od konkretnych wartości σ

X2

, σ

Y2

...

2 1 1

2 1 2 1 1

2 1

) (

, )

(

= =

=

= Y

Y X

X

n

i i

Y n n

i i

X n X X S Y Y

S

?

2

~

2

Y Y X

X

n S n

S

Y X

+

(26)

Model III: porównanie średnich dla dużych prób, poziom istotności α

Model asymptotyczny: X

1

, X

2

, ..., X

nX

są próbą IID z rozkładu mającego średnią µ

X

, Y

1

, Y

2

, ..., Y

nY

są próbą IID z rozkładu mającego średnią µ

Y

, oba rozkłady mają nieznaną wariancję, próby niezależne, n

X

, n

Y

– duże.

H

0

: µ

x

= µ

Y

Statystyka testowa:

H

0

: µ

x

= µ

Y

przeciw H

1

: µ

x

> µ

Y

zbiór krytyczny

H

0

: µ

x

= µ

Y

przeciw H

1

: µ

x

≠ µ

Y

zbiór krytyczny

) 1 , 0 (

2

~

2

Y N

U X

Y Y X

X

n S n

S

+

= −

przy założeniu prawdziwości H0, w przybliżeniu dla dużych prób

} )

( :

{

* = x U x > u

1α

K

}

| ) ( :|

{

* = x U x > u

1α /2

K

(27)

Model III – przykład (równość średnich ocen?)

167 studentów zdaje egzamin z RP w I terminie. Czy uczestnictwo w wykładach się opłacało? ( α = 0,05) W grupie osób, które były 3 razy (93 osoby):

średnia = 3, wariancja = 0,70;

W grupie osób, które były mniej niż 3 razy (74 osoby):

średnia = 2,72, wariancja = 0,69.

Wartość statystyki testowej

3 2,72 0,70 93 0,69

74

2,13

p-value testu jednostronnego: 0,017 → odrzucamy

hipotezę o równości średnich

(28)

Model IV: porównanie parametrów struktury, na poziomie istotności α

Model asymptotyczny: dwie próby IID z rozkładów

dwupunktowych. X – liczba sukcesów w n

X

próbach z p-stwem sukcesu p

X

, Y – liczba sukcesów w n

Y

próbach z p-stwem

sukcesu p

Y

. p

X

i p

Y

nieznane, n

X

i n

Y

duże.

H

0

: p

X

= p

Y

Statystyka testowa:

gdzie

H

0

: p

X

= p

Y

przeciw H

1

: p

X

> p

Y

zbiór krytyczny

H

0

: p

X

= p

Y

przeciw H

1

: p

X

p

Y

zbiór krytyczny

( ) ~ ( 0 , 1 )

) 1

* (

1

1

N

p p

n Y n

X U

Y

X n

n Y X

+

=

} )

( :

{

* = x U

x > u

1α

K

}

| ) ( :|

{

* = x U

x > u

1α /2

K

przy założeniu prawdziwości H0, w przybliżeniu dla dużych prób

y

x n

n

Y p X

+

= +

(29)

Model III – przykład (p-stwo zdania?)

167 studentów zdaje egzamin z RP w I terminie. Czy uczestnictwo w wykładach się opłacało? ( α = 0,05) W grupie osób, które były 3 razy (93 osoby):

zdały: 64 osoby (68,8%);

W grupie osób, które były mniej niż 3 razy (74 osoby):

zdało:36 osób (48,6%).

Wartość statystyki testowej

0,688 0,486 100 167 ∙ 67

167 ∙ 1

93 1

74

2,55

p-value testu jednostronnego: 0,005 → odrzucamy

hipotezę o równości prawdopodobieństw

(30)

Cytaty

Powiązane dokumenty

[r]

Wyznacz 95% przedziały ufności dla drugiej i trzeciej wartości własnej i sprawdź czy można przyjąć hipotezę, że te wartości są równe

otrzymania obserwacji X, gdy prawdziwa jest hipoteza zerowa”; odrzucamy hipotezę. zerową na rzecz alternatywnej, gdy ten stosunek jest bardzo niekorzystny dla

Wykazać, że funkcja charakterystyczna zbioru liczb wymiernych nie jest całkowal- na na [0, 1]..

Sprawdź, czy średnia arytmetyczna jest zgodnym estymatorem wartości oczekiwanej..

Ponieważ wszystkie wnioski PA s¸ a spełnione w (N, +, ·, &lt;, 0, 1), powyższe oznacza, że T h(N ) składa si¸e ze wszystkich wniosków

Zdziwiło go, że w każdej jest inna liczba ziarenek (mimo że są od jednego producenta!). Zweryfikuj hipotezę, że przeciętna liczba ziarenek ryżu w torebce to 8980... •

Wariacją n–elementową bez powtórzeń ze zbioru m–elementowego nazywamy uporząd- kowany zbiór (n–wyrazowy ciąg) składający się z n różnych elementów wybranych z