TESTOWANIE HIPOTEZ

(1)

TESTOWANIE HIPOTEZ

Hipoteza statystyczna jest to przypuszczenie dotyczące nieznanej własności rozkładu prawdopodobieństwa

badanej cechy populacji.

Przykłady

 (a) Producent opon twierdzi, że nowy typ opony ma trwałość większą niż 60000 km. Jeśli ^ (km) oznacza wartość średnią trwałości opon, to hipotezą producenta jest ^H^:^^⁶⁰⁰⁰⁰

 (b) Socjolog twierdzi, że dzieci w miastach mają lepsze wyniki w nauce niż dzieci poza ośrodkami miejskimi. Niech ^p¹ (^p²) oznacza proporcję dzieci w miastach (poza miastami) o średnich ocenach rocznych co najmniej dobrych. Hipotezą socjologa jest ^H^:^p¹^ ^p²

(2)

 (c) Producent twierdzi, że średni czas bezawaryjnej pracy drukarki to 200 godzin. Wówczas

^H^:^ ^²⁰⁰

 (d) Fizycy przypuszczają, że ilość cząstek emitowanych przez substancję radioaktywną w przedziałach czasu o danej długości jest zmienną losową o rozkładzie Poissona. Wówczas

^H^:^X ^~^P⁽^^),^ ^⁰^.

 (e) Sprzedawca przypuszcza, że miesięczna wartość sprzedaży ma rozkład normalny. Wówczas

^H^:^X ^~^N⁽^^,^^), ^^^^^^^, ⁰^^ ^^.

Hipotezę nazywamy parametryczną, jeśli jest stwierdzeniem dotyczącym nieznanego parametru

liczbowego lub wektorowego rozkładu cechy populacji, np. hipotezy (a), (b), (c).

W przeciwnym przypadku hipoteza jest nieparametryczną, np. hipotezy (d), (e).

(3)

W zadaniach testowania hipotez występują 2 hipotezy:

Hipoteza zerowa – hipoteza testowana celem ewentualnego odrzucenia, oznaczana przez ^H⁰.

Hipoteza alternatywna – hipoteza, która będzie

przyjęta, jeśli odrzucimy hipotezę zerową, oznaczana przez ^H¹.

Hipotezy wykluczają się: nie mogą być jednocześnie prawdziwe, np. niech ^p^⁽⁰^,¹⁾ oznacza

prawdopodobieństwo sukcesu w doświadczeniu Bernoulli’ego. Możliwe są hipotezy:

2 : 1

0 p

H ^H¹^: ^p ^¹₂ lub

2 : 1

0 p

H , ^H¹^: ^p^₂¹, ale niemożliwe jest sytuacja gdy

(4)

2 : 1

0 p

H , ^H¹^: ^p^₃¹, bo wartość ^p ^ ₂¹ jest parametrem z zakresu ^H⁰ i ^H¹ jednocześnie. Zbiory parametrów wymieniane w obu hipotezach nie są rozłączne.

Rola hipotez ^H⁰ i ^H¹ nie jest symetryczna:

Hipoteza alternatywna, to ta którą zaakceptujemy, jeśli próbka dostarczy nam dostatecznych dowodów jej

prawdziwości, ta o której sądzimy, że jest prawdziwa i szukamy potwierdzenia w próbce, to ta na której nam zależy aby była prawdziwa.

Hipoteza zerowa to ta co do której prawdziwości nie jesteśmy przekonani w sytuacji gdy nie możemy

zaakceptować na podstawie próbki hipotezy

alternatywnej, ta którą poddajemy w wątpliwość.

Przykład. Załóżmy, że skuteczność pewnej terapii medycznej wynosi ^p¹^¹⁰⁰^%. Zaproponowano nową terapię, której nieznana skuteczność ^p²^¹⁰⁰^% nie jest

(5)

gorsza, tzn. wiemy, że ^p² ^ ^p¹. Nowa terapia będzie

szeroko stosowana, jeśli będziemy mieli po badaniach wstępnych dostatecznie dużą „pewność”, że ^p² ^ ^p¹. Wówczas

2 1

0:p p

H  , ^H¹^:^p² ^ ^p¹ .

Przykład. Nowa technologia produkcji może zmniejszyć dobowy poziom emisji zanieczyszczeń do atmosfery.

Chcielibyśmy wiedzieć, czy zmniejsza ona poziom zanieczyszczeń? Wówczas:

0:

H Nowa technologia nie zmniejsza dobowego poziomu emisji zanieczyszczeń atmosfery, tzn. nie jest lepsza od starej technologii.

H1 : Nowa technologia zmniejsza dobowy poziom emisji zanieczyszczeń atmosfery, tzn. jest lepsza.

Zadanie testowania powyższych hipotez polega na podjęciu poniższych decyzji, na podstawie obserwacji dobowych poziomów emisji zanieczyszczeń,:

Możliwe decyzje:

(6)

 Nie ma dostatecznych dowodów aby odrzucić ^H⁰ , tzn. przyjąć ^H¹: na podstawie obserwacji nie możemy stwierdzić, że nowa technologia zmniejsza poziom zanieczyszczeń.

 Obserwacje dostarczają dostatecznych dowodów, aby przyjąć ^H¹ , równoważnie odrzucić ^H⁰ , tzn.

stwierdzamy, iż można uznać, że nowa technologia zmniejsza poziom zanieczyszczeń.

Model matematyczny:

Załóżmy, że

 (a) ^⁰ = znany średni poziom dobowy emisji przy starej technologii

 (b) ^ = nieznany średni poziom dobowy emisji przy nowej technologii

 (c) wiemy, że ^{ }^⁰. Chcielibyśmy

stwierdzić, że nowa technologia zmniejsza poziom emisji. Zatem:

(7)

0 0: 

H , ^H¹^:^{ }^⁰

 (d) w ciągu n losowo wybranych dni obserwujemy dobowe poziomy emisji przy nowej

technologii: ^X¹^,^X²^,...,^Xⁿ

 (e) zmienne losowe ^X¹^,^X²^,...,^Xⁿ są niezależne o jednakowym rozkładzie ^N⁽^^,^⁾, gdzie ^ jest znane

Decyzję: „ przyjąć ^H¹ ” lub „ nie można odrzucić ^H⁰ ” rozsądnie jest oprzeć na podstawie realizacji średniej z próby losowej ^X , tzn. średniej z próbki ^x.

Uzasadnienie:

Rozkładem ^X jest rozkład ^N⁽^^, ^_n⁾ skoncentrowany

wokół ^. Zatem dostatecznie małe wartości ^X sugerują, że ^H¹^:^{ }^⁰ jest prawdziwa, ponieważ

(8)

 (1) jeśli ^H⁰^:^{ }^⁰ jest prawdziwa, to wartości ^X skupiają się wokół ^⁰, statystyka

n Z X

/

0





  ^{~ N}⁽⁰^,¹⁾

 (2) jeśli ^H¹^:^{ }^⁰ jest prawdziwa: ^^^¹^^⁰, to wartości ^X skupiają się wokół ^¹.

Wówczas Z jest sumą zmiennej o rozkładzie ^N⁽⁰^,¹⁾ oraz stałej ujemnej:

n n

Z X

/ /

0 1

1 





  

  .

(1) i (2) sugerują sposób testowania: niech c będzie odpowiednio dobraną stałą, a ^x wartością ^X obliczoną dla próbki, wówczas

(i) jeśli ^z^_^x^_/ ^_n⁰ ^^c, to przyjmujemy ^H¹.

(ii) jeśli ^z^_^x^_/ ^_n⁰ ^^c, to nie ma podstaw do

(9)

odrzucenia ^H⁰.

Wybór c: Niech ^ będzie małą liczbą z (0,1), np.

^ ^⁰^,⁰⁵ lub 0, 01 lub 0,1, ...

Niech ^c^ ^z^ ^^^z¹^^. Wówczas jeśli ^H⁰^:^{ }^⁰ prawdziwa, to

 

 )

0(Z z

P_H .

Stąd ^ jest prawdopodobieństwem błędnej decyzji (przyjęcia ^H¹) w przypadku gdy hipoteza ^H⁰ jest

prawdziwa. ^ = prawdopodobieństwo błędu I rodzaju, nazywane poziomem istotności testu.

(10)

Zbiór ^C^^{^z^:^z^^z^^} nazywamy zbiorem krytycznym, bo jest to zbiór wartości statystyki testowej Z dla których odrzucamy ^H⁰ na korzyść ^H¹.

Błędy testowania

Podjęta decyzja

Stan natury

Akceptacja ^H⁰ ( ^H⁰ ? nie odrzucamy ^H⁰)

Odrzucenie ^H⁰ (Akceptacja ^H¹)

H0 prawdziwa Decyzja prawidłowa

Błąd I rodzaju

H1 prawdziwa Błąd II rodzaju (? )

Decyzja prawidłowa

(11)

I. Testowanie hipotez o wartości średniej

rozkładu normalnego, gdy znana jest wariancja

Niech ^X¹^,^X²^,...,^Xⁿ będzie prostą próbą losowa z rozkładu

) , ( 

N , ^ - znane.

0 0: 

H .

Statystyka testowa:

n Z X

/

 0



 = _^X_/^^_n^_^^_/ ^_n⁰.

Jeśli ^H⁰ prawdziwa, to ZZZ ^{~ N}⁽⁰^,¹⁾.

(12)

Model 1. ^H⁰^:^^^⁰ ^H¹^:^^^⁰ .

Wówczas przyjmujemy C = ^{^z^:^z^{ z}¹^^^} = obszar

krytyczny testu hipotezy ^H⁰ przeciw ^H¹ na poziomie istotności ^, gdzie

 





 ) ( _ )

( ₀ ₁

0 Z C P Z z

P_H _H .

Model 2. ^H⁰^:^^^⁰ ^H¹^:^^^⁰

Wówczas przyjmujemy C = ^{^z^:^z^{ z}^ ¹^^^} - obszar krytyczny, gdzie

 







 ) ( _ )

( ₀ ₁

0 Z C P Z z

P_H _H .

Model 3. ^H⁰^:^^^⁰ ^H¹^:^^^⁰

(13)

Wówczas

C =^{^z^: ^z ^{ z}¹^^^/²^} - obszar krytyczny, gdzie

2 / ) ( ₁ _/₂

0 Z z__ 

P_H



 





 ) ( _ )

( ₀ ₁ _/₂

0 Z C P Z z

P_H _H

Zadanie. Dotychczasowa dzienna wartość sprzedaży pewnego artykułu miała rozkład normalny o średniej 1000 ($) i standardowym odchyleniu 100 ($). Po serii reklam telewizyjnych w ciągu 9 losowo wybranych dni uzyskano następujące wartości sprzedaży:

1280, 1250, 990, 1100, 880, 1300, 1100, 950, 1050.

Czy, na poziomie istotności ^ ^⁰^,⁰¹, można twierdzić, że reklamy spowodowały zwiększenie sprzedaży, jeśli można założyć, że wartości dziennych sprzedaży są niezależnymi zmiennymi losowymi o jednakowym rozkładzie normalnym ?

Rozwiązanie:

1. ^H⁰^:^ ^¹⁰⁰⁰

(14)

2. ^H¹^:^ ^¹⁰⁰⁰

3. Statystyka testowa: ^Z ^ ^X_^_/¹⁰⁰⁰_n

4. ^ ^⁰^,⁰¹, ¹^^ ^⁰^,⁹⁹, ^z⁰^,⁹⁹ = 2,33.

Obszar krytyczny C = ^{^z^:^z ^²^,³³^}

5. ^ ^¹⁰⁰, ⁿ^⁹, z obliczeń ^x ^¹¹⁰⁰, stąd wartość statystyki testowej

3 3 / 100

1000 1100

/

1000  

 

n z x

 .

6. ³^ ²^,³³, więc odrzucamy ^H⁰.

Odpowiedź: Na poziomie istotności ^ ^⁰^,⁰¹

stwierdzamy, że średnia wartość sprzedaży wzrosła po serii reklam.

II. Testowanie hipotez o wartości średniej rozkładu normalnego, gdy nieznana jest wariancja

(15)

) , ( 

N , ^ - nieznane.

0 0:

H .

n S T X

/

0

  = _S^X_/^^_n^ ^_S_/^^_n⁰.

Jeśli ^H⁰ prawdziwa, to ^T ^~^tⁿ^¹.

Model 1. ^H⁰^:^{ }^⁰ ^H¹^:^{ }^⁰

Wówczas przyjmujemy C = ^{^t^:^t ^^t¹^^^,ⁿ^¹^} = obszar

krytyczny testu hipotezy ^H⁰ przeciw ^H¹ na poziomie istotności ^, gdzie

 





 ) ( _ _ )

( ₀ ₁ _, ₁

0 H n

H Z C P T t

P ,

1 , 1 n

t _ = kwantyl rzędu ¹^^ rozkładu t – Studenta z

1

n stopniami swobody.

Model 2. ^H⁰^:^{ }^⁰ ^H¹^:^{ }^⁰

(16)

Wówczas C = ^{^t^:^t ^^^t¹^^^,ⁿ^¹^} - obszar krytyczny, gdzie

 



 _ _ )

( ₁ _, ₁

0 n

H T t

P .

Model 3. ^H⁰^:^{ }^⁰ ^H¹^:^^^⁰ Wówczas

C = ^{^t^:^t ^^t¹^^^/²^,ⁿ^¹^} - obszar krytyczny, gdzie

2 / ) ( ₁ _/₂_, ₁

0  __ _n_ 

H T t

P



^P^H⁰⁽^T ^^t¹^^^/²^,ⁿ^¹⁾^^

Zadanie. Producent twierdzi, że jego nowy model samochodu ma wartość średnią przebiegu nie

wymagającą żadnej interwencji 12000 (mil). W teście dla 4 losowo wybranych samochodów uzyskano

następujące przebiegi nie wymagające żadnego serwisu:

11000, 12000, 11800, 11200. Czy można zaprzeczyć twierdzeniu producenta, przyjmując ^ ^⁰^,⁰⁵ oraz rozkład normalny przebiegu.

(17)

Rozwiązanie:

1. ^H⁰^:^ ^¹²⁰⁰⁰ 2. ^H¹^:^ ^¹²⁰⁰⁰

3.Statystyka testowa: ^T ^ ^X_S^_/¹²⁰⁰⁰_n

4. ^ ^⁰^,⁰⁵, ¹^^ ^⁰^,⁹⁵, liczba stopni swobody = ⁿ^¹^⁴^¹^³,

3 , 95 ,

t0 = 2,353.

Obszar krytyczny C = ^{^t^:^t^^²^,³⁵³^}.

5. ⁿ^⁴, z obliczeń ^x^¹¹⁵⁰⁰, ^s² ^⁶⁸⁰⁰⁰⁰₄_₁ ^²²⁶⁶⁶⁷, stąd wartość statystyki testowej

10 , 4 2 / 226667

12000 11500

/ 12000



 

 s n

t x .

(18)

6. ^²^,¹⁰^ ^²^,³⁵³, więc nie ma podstaw do odrzucenia ^H⁰ na poziomie istotności 0,05.

Odpowiedź: Na poziomie istotności ^ ^⁰^,⁰⁵

stwierdzamy, że nie można odrzucić twierdzenia producenta.

Definicja.

Najmniejszy poziom istotności, przy którym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej nazywamy p-wartością przeprowadzonego testu.

Np. w ostatnim zadaniu

10 ,

2



t , ^P^H⁰⁽^T ^^^t¹^^^,ⁿ^¹⁾^^

(19)





 2,10)

0(T

P_H 0,063.

Im mniejsza jest p-wartość, tym mocniejsze staje się przekonanie testującego o fałszywości hipotezy zerowej i prawdziwości hipotezy alternatywnej.

III. Testowanie hipotez o wariancji rozkładu normalnego, gdy nieznana jest wartość średnia

) , ( 

N , ^,^ - nieznane.

02 0:2

H .

(20)

02 2 ( 1) 2

  ⁿ^ ^S = ²

0 2 2

) 2

1 (



 ^

 S n

Jeśli ^H⁰ prawdziwa, to ^² ^~^ⁿ²^¹.

Model 1. ^H⁰^:^²^^⁰² ^H¹^:^²^^⁰²

Wówczas przyjmujemy C = ^{ ^:⁽ ¹²⁾ ¹² ^, ¹^}

0 2 2



 



n obl

s

n  

  = obszar

krytyczny testu hipotezy ^H⁰ przeciw ^H¹ na poziomie istotności ^, gdzie





  ) (  __ _ ) ( ² ₀ ² ₁² _, ₁

0 H n

H C P

P ,

2 , 1

1 n

 = kwantyl rzędu ¹^^ rozkładu ^ⁿ²^¹.

Model 2. ^H⁰^:^²^^⁰² ^H¹^:^²^^⁰²

(21)

Wówczas C = ^{ ^:⁽ ¹²⁾ ²^, ¹^}

0 2 2

 



n

obl n s



  - obszar krytyczny, gdzie





  ) (  _ _ )

( ² ² ²_, ₁

0

0 H n

H C P

P .

Model 3. ^H⁰^:^²^^⁰² ^H¹^:^²^^⁰²

Wówczas obszar krytyczny C = ^{ ^:⁽ ¹²⁾ ²^/²^}

0 2 2



 n s 

obl

)1 } :(

{ ₂ ₁² _2/

0 2 2

  ^

 n s  _

obl ,

gdzie ^^²^/² ^^^²^/²^,ⁿ^¹, ^¹²^^^/² ^^¹²^^^/²^,ⁿ^¹.

Zadanie. Zmierzono czas życia 15 losowo wybranych żarówek z bieżącej produkcji. Policzono standardowe odchylenie próbkowe ^s ^¹³ (godz. ). Czy na poziomie istotności ^ ^⁰^,⁰⁵ ( 5%) można twierdzić, że odchylenie standardowe czasu życia losowo wybranej żarówki jest różne od 10 ( godz.)

Rozwiązanie.

(22)

1. ^H⁰ ^:^ ^¹⁰

2. ^H¹^:^ ^¹⁰

3. Statystyka testowa: 2 2 2

10 ) 1 (n S

 

4. ^ ^⁰^,⁰⁵, ^^/²^⁰^,⁰²⁵, ¹^^^/²^⁰^,⁹⁷⁵,

ⁿ^¹⁵, liczba stopni swobody ⁿ^¹^¹⁵^¹^¹⁴, ^^²^/²^,ⁿ^¹ ^^⁰²^,⁰²⁵^,¹⁴ ^⁵^,⁶²⁹,

^¹²^^^/²^,ⁿ^¹^ ^⁰²^,⁹⁷⁵^,¹⁴ ^²⁶^,¹¹⁹.

Reguła decyzyjna ( na podstawie obszaru krytycznego ):

odrzuć ^H⁰, jeśli obliczona wartość statystyki

obl2

 5,629 lub ^^obl² ^ ²⁶^,¹¹⁹.

5. s =13, stąd wartość statystyki testowej

obl2

 = ⁽ⁿ₁₀₀^{ s}¹⁾ ² ^ ⁽¹⁴₁₀₀⁾⁽¹³²⁾ ^²³^,⁶⁶.

6. ⁵^,⁶²⁹^²³^,⁶⁶^²⁶^,¹¹⁹, więc nie ma podstaw do odrzucenia

H0.

Odpowiedź. Na poziomie istotności 0,05, brak jest dostatecznych dowodów aby twierdzić, że

 

^10.

IV. Testy o różnicy wartości średnich dwóch rozkładów normalnych

(23)

Niech ^X¹^,^X²^,...,^Xⁿ¹ oraz ^Y¹^,^Y²^,...,^Yⁿ² będą dwiema

niezależnymi prostymi próbami losowymi z rozkładów normalnych ^N⁽^¹^,^¹⁾ oraz ^N⁽^²^,^²⁾, odpowiednio.

Model 1. ( znane odchylenia standardowe ^¹^,^² )

2 1 0: 

H ,

lub równoważnie

0 : ₁ ₂

0   

H .

Konstrukcja oparta na analizie ^X ^^Y .

Statystka ^X ^^Y ma rozkład normalny o wartości średniej ^¹^^² i wariancji

2 22

1 12

n n



  ( gdyż

średnie z obu prób losowych ^{X ,}^Y są niezależnymi zmiennymi losowymi o rozkładach normalnych

) , (

1 1 n1

N   , ^N⁽^²^, ^_n²₂⁾ , odpowiednio ). Stąd, po standaryzacji mamy

2 2 2 2 1

1

2 1

/ /

) (

n n

Y Z X









  ~ ^N⁽⁰^,¹⁾.

(24)

(a) ^H⁰^:^¹^^² ^⁰ , ^H¹^:^¹^^²^⁰ .

Jeśli ^H⁰ prawdziwa, to

2 2 2 2 1

1 /n /n

Y Z X



 

  ~ ^N⁽⁰^,¹⁾.

Przyjmujemy C = ^{^z^:^z^{ z}¹^^^} = obszar krytyczny testu hipotezy ^H⁰ przeciw ^H¹ na poziomie istotności ^, gdzie ^P^H⁰⁽^Z^^C⁾^ ^P^H⁰⁽^Z ^^z¹^^⁾^^,





z1 = kwantyl rzędu ¹^^ rozkładu ^N⁽⁰^,¹⁾. (b) ^H⁰^:^¹^^² ^⁰ , ^H¹^:^¹^^² ^⁰ .

Przyjmujemy C = ^{^z^:^z^^z^^} = obszar krytyczny.

(c) ^H⁰^:^¹^^² ^⁰ , ^H¹^:^¹^^² ^⁰

Przyjmujemy C = ^{^z^: ^z ^{ z}¹^^^/²^} = obszar krytyczny.

Przykład. Średnia waga losowo wybranych 15

Europejczyków wyniosła ^x= 154 (funty), podczas gdy dla próbki 18 Amerykanów otrzymano ^y = 162 (funty).

Z poprzednich badań wiadomo, że wariancje wag losowo wybranego Europejczyka i Amerykanina wynoszą, odpowiednio: ^¹² ^¹⁰⁰ i ^²² ^¹⁶⁹. Czy można

(25)

twierdzić, że średnie wagi w populacji Europejczyków i Amerykanów są różne? Przyjąć ^ ^⁰^,⁰⁵ oraz rozkład normalny wag.

1. ^H⁰^:^¹^^² ^⁰. 2. ^H¹^:^¹^^² ^⁰

3. Statystyka testowa: ^Z^ _₁²_/^X_n₁^_^Y_₂²_/_n₂

4. ^ ^⁰^,⁰⁵, ¹^^^/²^⁰^,⁹⁷⁵, ^z⁰^,⁹⁷⁵ ^¹^,⁹⁶. Obszar krytyczny C = ^{^z^: ^z ^¹^,⁹⁶^}.

5. Mamy^x=154, ^y=162, ^¹² ^¹⁰⁰, ^²² ^¹⁶⁹, ⁿ¹ ^¹⁵, ⁿ² ^¹⁸. Stąd wartość statystyki testowej

 

 

2 2 2 2 1

1 /n /n

y z x



056 , 16

8 18

/ 169 15 / 100

162

154  



 = - 2.

6. ^² ^²^¹^,⁹⁶, więc odrzucamy ^H⁰.

Odpowiedź: Na poziomie istotności ^ ^⁰^,⁰⁵

stwierdzamy, że średnia waga Europejczyka różni się od średniej wagi Amerykanina, przy czym dane sugerują, że średnio Amerykanie ważą więcej niż Europejczycy.

Model 2. ( nieznane odchylenia standardowe ^¹^,^² )

(26)

Założenie dodatkowe: ^¹^^² ^^, ^ - nieznane.

2 1 0: 

H ,

lub równoważnie

0 : 1 2

0   

H .

Jeśli ^H⁰ prawdziwa, to

2 2 2 2 1

1 /n /n

Y Z X



 

  = _ ₁_/^X_n₁^_^Y₁_/_n₂ ~ ^N⁽⁰^,¹⁾. Var(^X ^^Y ) = ^_^ ^ ^_^

2 1

2 1 1

n

 n ,

Niech

 

 

 1 1

2 1

12 ( )

1 1 ⁿ

i Xi X

S n , ^ _ ^_²₁ ^ ²

2

22 ( )

1 1 ⁿ

i Yi Y

S n -

nieobciążone estymatory ^².

Estymatorem nieobciążonym ^², opartym na dwu próbach łącznie, jest statystyka

2 ) 1 ( ) 1 (

2 1

22 2 2

1 2 1









 

n n

S n S

S_p n .

Wówczas we wzorze na Z podstawiając ^S^p ^ ^S²^p zamiast ^ otrzymujemy statystykę

2 1

1 1

n S n

Y T X

p 

 

~ ^tⁿ¹^n²^².