• Nie Znaleziono Wyników

TESTOWANIE HIPOTEZ

N/A
N/A
Protected

Academic year: 2021

Share "TESTOWANIE HIPOTEZ"

Copied!
1
0
0

Pełen tekst

(1)

TESTOWANIE HIPOTEZ

Hipoteza statystyczna jest to przypuszczenie dotyczące nieznanej własności rozkładu prawdopodobieństwa

badanej cechy populacji.

Przykłady

 (a) Producent opon twierdzi, że nowy typ opony ma trwałość większą niż 60000 km. Jeśli (km) oznacza wartość średnią trwałości opon, to hipotezą producenta jest H:60000

 (b) Socjolog twierdzi, że dzieci w miastach mają lepsze wyniki w nauce niż dzieci poza ośrodkami miejskimi. Niech p1 (p2) oznacza proporcję dzieci w miastach (poza miastami) o średnich ocenach rocznych co najmniej dobrych. Hipotezą socjologa jest H:p1 p2

(2)

 (c) Producent twierdzi, że średni czas bezawaryjnej pracy drukarki to 200 godzin. Wówczas

H: 200

 (d) Fizycy przypuszczają, że ilość cząstek emitowanych przez substancję radioaktywną w przedziałach czasu o danej długości jest zmienną losową o rozkładzie Poissona. Wówczas

H:X ~P(), 0.

 (e) Sprzedawca przypuszcza, że miesięczna wartość sprzedaży ma rozkład normalny. Wówczas

H:X ~N(,), , 0 .

Hipotezę nazywamy parametryczną, jeśli jest stwierdzeniem dotyczącym nieznanego parametru

liczbowego lub wektorowego rozkładu cechy populacji, np. hipotezy (a), (b), (c).

W przeciwnym przypadku hipoteza jest nieparametryczną, np. hipotezy (d), (e).

(3)

W zadaniach testowania hipotez występują 2 hipotezy:

Hipoteza zerowa – hipoteza testowana celem ewentualnego odrzucenia, oznaczana przez H0.

Hipoteza alternatywna – hipoteza, która będzie

przyjęta, jeśli odrzucimy hipotezę zerową, oznaczana przez H1.

Hipotezy wykluczają się: nie mogą być jednocześnie prawdziwe, np. niech p(0,1) oznacza

prawdopodobieństwo sukcesu w doświadczeniu Bernoulli’ego. Możliwe są hipotezy:

2 : 1

0 p

H H1: p 12 lub

2 : 1

0 p

H , H1: p21, ale niemożliwe jest sytuacja gdy

(4)

2 : 1

0 p

H , H1: p31, bo wartość p 21 jest parametrem z zakresu H0 i H1 jednocześnie. Zbiory parametrów wymieniane w obu hipotezach nie są rozłączne.

Rola hipotez H0 i H1 nie jest symetryczna:

Hipoteza alternatywna, to ta którą zaakceptujemy, jeśli próbka dostarczy nam dostatecznych dowodów jej

prawdziwości, ta o której sądzimy, że jest prawdziwa i szukamy potwierdzenia w próbce, to ta na której nam zależy aby była prawdziwa.

Hipoteza zerowa to ta co do której prawdziwości nie jesteśmy przekonani w sytuacji gdy nie możemy

zaakceptować na podstawie próbki hipotezy

alternatywnej, ta którą poddajemy w wątpliwość.

Przykład. Załóżmy, że skuteczność pewnej terapii medycznej wynosi p1100%. Zaproponowano nową terapię, której nieznana skuteczność p2100% nie jest

(5)

gorsza, tzn. wiemy, że p2 p1. Nowa terapia będzie

szeroko stosowana, jeśli będziemy mieli po badaniach wstępnych dostatecznie dużą „pewność”, że p2 p1. Wówczas

2 1

0:p p

H , H1:p2 p1 .

Przykład. Nowa technologia produkcji może zmniejszyć dobowy poziom emisji zanieczyszczeń do atmosfery.

Chcielibyśmy wiedzieć, czy zmniejsza ona poziom zanieczyszczeń? Wówczas:

0:

H Nowa technologia nie zmniejsza dobowego poziomu emisji zanieczyszczeń atmosfery, tzn. nie jest lepsza od starej technologii.

H1 : Nowa technologia zmniejsza dobowy poziom emisji zanieczyszczeń atmosfery, tzn. jest lepsza.

Zadanie testowania powyższych hipotez polega na podjęciu poniższych decyzji, na podstawie obserwacji dobowych poziomów emisji zanieczyszczeń,:

Możliwe decyzje:

(6)

Nie ma dostatecznych dowodów aby odrzucić H0 , tzn. przyjąć H1: na podstawie obserwacji nie możemy stwierdzić, że nowa technologia zmniejsza poziom zanieczyszczeń.

 Obserwacje dostarczają dostatecznych dowodów, aby przyjąć H1 , równoważnie odrzucić H0 , tzn.

stwierdzamy, iż można uznać, że nowa technologia zmniejsza poziom zanieczyszczeń.

Model matematyczny:

Załóżmy, że

 (a) 0 = znany średni poziom dobowy emisji przy starej technologii

 (b) = nieznany średni poziom dobowy emisji przy nowej technologii

 (c) wiemy, że  0. Chcielibyśmy

stwierdzić, że nowa technologia zmniejsza poziom emisji. Zatem:

(7)

0 0: 

H , H1: 0

 (d) w ciągu n losowo wybranych dni obserwujemy dobowe poziomy emisji przy nowej

technologii: X1,X2,...,Xn

 (e) zmienne losowe X1,X2,...,Xn są niezależne o jednakowym rozkładzie N(,), gdzie jest znane

Decyzję: „ przyjąć H1 ” lub „ nie można odrzucić H0 ” rozsądnie jest oprzeć na podstawie realizacji średniej z próby losowej X , tzn. średniej z próbki x.

Uzasadnienie:

Rozkładem X jest rozkład N(, n) skoncentrowany

wokół . Zatem dostatecznie małe wartości X sugerują, że H1: 0 jest prawdziwa, ponieważ

(8)

(1) jeśli H0: 0 jest prawdziwa, to wartości X skupiają się wokół 0, statystyka

n Z X

/

0

~ N(0,1)

 (2) jeśli H1: 0 jest prawdziwa: 10, to wartości X skupiają się wokół 1.

Wówczas Z jest sumą zmiennej o rozkładzie N(0,1) oraz stałej ujemnej:

n n

Z X

/ /

0 1

1

.

(1) i (2) sugerują sposób testowania: niech c będzie odpowiednio dobraną stałą, a x wartością X obliczoną dla próbki, wówczas

(i) jeśli zx/ n0 c, to przyjmujemy H1.

(ii) jeśli zx/ n0 c, to nie ma podstaw do

(9)

odrzucenia H0.

Wybór c: Niech będzie małą liczbą z (0,1), np.

0,05 lub 0, 01 lub 0,1, ...

Niech c z z1. Wówczas jeśli H0: 0 prawdziwa, to

)

0(Z z

PH .

Stąd jest prawdopodobieństwem błędnej decyzji (przyjęcia H1) w przypadku gdy hipoteza H0 jest

prawdziwa. = prawdopodobieństwo błędu I rodzaju, nazywane poziomem istotności testu.

(10)

Zbiór C{z:zz} nazywamy zbiorem krytycznym, bo jest to zbiór wartości statystyki testowej Z dla których odrzucamy H0 na korzyść H1.

Błędy testowania

Podjęta decyzja

Stan natury

Akceptacja H0 ( H0 ? nie odrzucamy H0)

Odrzucenie H0 (Akceptacja H1)

H0 prawdziwa Decyzja prawidłowa

Błąd I rodzaju

H1 prawdziwa Błąd II rodzaju (? )

Decyzja prawidłowa

(11)

I. Testowanie hipotez o wartości średniej

rozkładu normalnego, gdy znana jest wariancja

Niech X1,X2,...,Xn będzie prostą próbą losowa z rozkładu

) , (

N , - znane.

0 0: 

H .

Statystyka testowa:

n Z X

/

0

= X/n/ n0.

Jeśli H0 prawdziwa, to ZZZ ~ N(0,1).

(12)

Model 1. H0:0 H1:0 .

Wówczas przyjmujemy C = {z:z z1} = obszar

krytyczny testu hipotezy H0 przeciw H1 na poziomie istotności , gdzie

) ( )

( 0 1

0 Z C P Z z

PH H .

Model 2. H0:0 H1:0

Wówczas przyjmujemy C = {z:z z 1} - obszar krytyczny, gdzie

) ( )

( 0 1

0 Z C P Z z

PH H .

Model 3. H0:0 H1:0

(13)

Wówczas

C ={z: z  z1/2} - obszar krytyczny, gdzie

2 / ) ( 1 /2

0 Z z

PH

) ( )

( 0 1 /2

0 Z C P Z z

PH H

Zadanie. Dotychczasowa dzienna wartość sprzedaży pewnego artykułu miała rozkład normalny o średniej 1000 ($) i standardowym odchyleniu 100 ($). Po serii reklam telewizyjnych w ciągu 9 losowo wybranych dni uzyskano następujące wartości sprzedaży:

1280, 1250, 990, 1100, 880, 1300, 1100, 950, 1050.

Czy, na poziomie istotności 0,01, można twierdzić, że reklamy spowodowały zwiększenie sprzedaży, jeśli można założyć, że wartości dziennych sprzedaży są niezależnymi zmiennymi losowymi o jednakowym rozkładzie normalnym ?

Rozwiązanie:

1. H0: 1000

(14)

2. H1: 1000

3. Statystyka testowa: Z X/1000n

4. 0,01, 1 0,99, z0,99 = 2,33.

Obszar krytyczny C = {z:z 2,33}

5. 100, n9, z obliczeń x 1100, stąd wartość statystyki testowej

3 3 / 100

1000 1100

/

1000

n z x

.

6. 3 2,33, więc odrzucamy H0.

Odpowiedź: Na poziomie istotności 0,01

stwierdzamy, że średnia wartość sprzedaży wzrosła po serii reklam.

II. Testowanie hipotez o wartości średniej rozkładu normalnego, gdy nieznana jest wariancja

(15)

Niech X1,X2,...,Xn będzie prostą próbą losowa z rozkładu

) , (

N , - nieznane.

0 0:

H .

Statystyka testowa:

n S T X

/

0

= SX/n S/n0.

Jeśli H0 prawdziwa, to T ~tn1.

Model 1. H0: 0 H1: 0

Wówczas przyjmujemy C = {t:t t1,n1} = obszar

krytyczny testu hipotezy H0 przeciw H1 na poziomie istotności , gdzie

) ( )

( 0 1 , 1

0 H n

H Z C P T t

P ,

1 , 1 n

t = kwantyl rzędu 1 rozkładu t – Studenta z

1

n stopniami swobody.

Model 2. H0: 0 H1: 0

(16)

Wówczas C = {t:t t1,n1} - obszar krytyczny, gdzie

)

( 1 , 1

0 n

H T t

P .

Model 3. H0: 0 H1:0 Wówczas

C = {t:t t1/2,n1} - obszar krytyczny, gdzie

2 / ) ( 1 /2, 1

0 n

H T t

P

PH0(T t1/2,n1)

Zadanie. Producent twierdzi, że jego nowy model samochodu ma wartość średnią przebiegu nie

wymagającą żadnej interwencji 12000 (mil). W teście dla 4 losowo wybranych samochodów uzyskano

następujące przebiegi nie wymagające żadnego serwisu:

11000, 12000, 11800, 11200. Czy można zaprzeczyć twierdzeniu producenta, przyjmując 0,05 oraz rozkład normalny przebiegu.

(17)

Rozwiązanie:

1. H0: 12000 2. H1: 12000

3.Statystyka testowa: T XS/12000n

4. 0,05, 1 0,95, liczba stopni swobody = n1413,

3 , 95 ,

t0 = 2,353.

Obszar krytyczny C = {t:t2,353}.

5. n4, z obliczeń x11500, s2 68000041 226667, stąd wartość statystyki testowej

10 , 4 2 / 226667

12000 11500

/ 12000

s n

t x .

(18)

6. 2,10 2,353, więc nie ma podstaw do odrzucenia H0 na poziomie istotności 0,05.

Odpowiedź: Na poziomie istotności 0,05

stwierdzamy, że nie można odrzucić twierdzenia producenta.

Definicja.

Najmniejszy poziom istotności, przy którym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej nazywamy p-wartością przeprowadzonego testu.

Np. w ostatnim zadaniu

10 ,

2

t , PH0(T t1,n1)

(19)

2,10)

0(T

PH 0,063.

Im mniejsza jest p-wartość, tym mocniejsze staje się przekonanie testującego o fałszywości hipotezy zerowej i prawdziwości hipotezy alternatywnej.

III. Testowanie hipotez o wariancji rozkładu normalnego, gdy nieznana jest wartość średnia

Niech X1,X2,...,Xn będzie prostą próbą losowa z rozkładu

) , (

N , , - nieznane.

02 0:2

H .

Statystyka testowa:

(20)

02 2 ( 1) 2

n S = 2

0 2 2

) 2

1 (

 S n

Jeśli H0 prawdziwa, to 2 ~n21.

Model 1. H0:202 H1:202

Wówczas przyjmujemy C = { :( 12) 12 , 1}

0 2 2

n obl

s

n

= obszar

krytyczny testu hipotezy H0 przeciw H1 na poziomie istotności , gdzie

) ( ) ( 2 0 2 12 , 1

0 H n

H C P

P ,

2 , 1

1 n

= kwantyl rzędu 1 rozkładu n21.

Model 2. H0:202 H1:202

(21)

Wówczas C = { :( 12) 2, 1}

0 2 2

n

obl n s

- obszar krytyczny, gdzie

) ( )

( 2 2 2, 1

0

0 H n

H C P

P .

Model 3. H0:202 H1:202

Wówczas obszar krytyczny C = { :( 12) 2/2}

0 2 2

n s

obl

)1 } :(

{ 2 12 2/

0 2 2

 

n s

obl ,

gdzie 2/2 2/2,n1, 12/2 12/2,n1.

Zadanie. Zmierzono czas życia 15 losowo wybranych żarówek z bieżącej produkcji. Policzono standardowe odchylenie próbkowe s 13 (godz. ). Czy na poziomie istotności 0,05 ( 5%) można twierdzić, że odchylenie standardowe czasu życia losowo wybranej żarówki jest różne od 10 ( godz.)

Rozwiązanie.

(22)

1. H0 : 10

2. H1: 10

3. Statystyka testowa: 2 2 2

10 ) 1 (n S

4. 0,05, /20,025, 1/20,975,

n15, liczba stopni swobody n115114, 2/2,n1 02,025,14 5,629,

12/2,n1 02,975,14 26,119.

Reguła decyzyjna ( na podstawie obszaru krytycznego ):

odrzuć H0, jeśli obliczona wartość statystyki

obl2

5,629 lub obl2 26,119.

5. s =13, stąd wartość statystyki testowej

obl2

= (n100 s1) 2 (14100)(132) 23,66.

6. 5,62923,6626,119, więc nie ma podstaw do odrzucenia

H0.

Odpowiedź. Na poziomie istotności 0,05, brak jest dostatecznych dowodów aby twierdzić, że

 

10.

IV. Testy o różnicy wartości średnich dwóch rozkładów normalnych

(23)

Niech X1,X2,...,Xn1 oraz Y1,Y2,...,Yn2 będą dwiema

niezależnymi prostymi próbami losowymi z rozkładów normalnych N(1,1) oraz N(2,2), odpowiednio.

Model 1. ( znane odchylenia standardowe 1,2 )

2 1 0: 

H ,

lub równoważnie

0 : 1 2

0

H .

Statystyka testowa:

Konstrukcja oparta na analizie X Y .

Statystka X Y ma rozkład normalny o wartości średniej 12 i wariancji

2 22

1 12

n n

( gdyż

średnie z obu prób losowych X ,Y są niezależnymi zmiennymi losowymi o rozkładach normalnych

) , (

1 1 n1

N , N(2, n22) , odpowiednio ). Stąd, po standaryzacji mamy

2 2 2 2 1

1

2 1

/ /

) (

) (

n n

Y Z X

~ N(0,1).

(24)

(a) H0:12 0 , H1:120 .

Jeśli H0 prawdziwa, to

2 2 2 2 1

1 /n /n

Y Z X

~ N(0,1).

Przyjmujemy C = {z:z z1} = obszar krytyczny testu hipotezy H0 przeciw H1 na poziomie istotności , gdzie PH0(ZC) PH0(Z z1),

z1 = kwantyl rzędu 1 rozkładu N(0,1). (b) H0:12 0 , H1:12 0 .

Przyjmujemy C = {z:zz} = obszar krytyczny.

(c) H0:12 0 , H1:12 0

Przyjmujemy C = {z: z  z1/2} = obszar krytyczny.

Przykład. Średnia waga losowo wybranych 15

Europejczyków wyniosła x= 154 (funty), podczas gdy dla próbki 18 Amerykanów otrzymano y = 162 (funty).

Z poprzednich badań wiadomo, że wariancje wag losowo wybranego Europejczyka i Amerykanina wynoszą, odpowiednio: 12 100 i 22 169. Czy można

(25)

twierdzić, że średnie wagi w populacji Europejczyków i Amerykanów są różne? Przyjąć 0,05 oraz rozkład normalny wag.

1. H0:12 0. 2. H1:12 0

3. Statystyka testowa: Z 12/Xn1Y22/n2

4. 0,05, 1/20,975, z0,975 1,96. Obszar krytyczny C = {z: z 1,96}.

5. Mamyx=154, y=162, 12 100, 22 169, n1 15, n2 18. Stąd wartość statystyki testowej

2 2 2 2 1

1 /n /n

y z x

056 , 16

8 18

/ 169 15 / 100

162

154

= - 2.

6. 2 21,96, więc odrzucamy H0.

Odpowiedź: Na poziomie istotności 0,05

stwierdzamy, że średnia waga Europejczyka różni się od średniej wagi Amerykanina, przy czym dane sugerują, że średnio Amerykanie ważą więcej niż Europejczycy.

Model 2. ( nieznane odchylenia standardowe 1,2 )

(26)

Założenie dodatkowe: 12 , - nieznane.

2 1 0:

H ,

lub równoważnie

0 : 1 2

0

H .

Statystyka testowa:

Jeśli H0 prawdziwa, to

2 2 2 2 1

1 /n /n

Y Z X

= 1/Xn1Y1/n2 ~ N(0,1). Var(X Y ) =  

2 1

2 1 1

n

n ,

Niech

1 1

2 1

12 ( )

1 1 n

i Xi X

S n , 21 2

2

22 ( )

1 1 n

i Yi Y

S n -

nieobciążone estymatory 2.

Estymatorem nieobciążonym 2, opartym na dwu próbach łącznie, jest statystyka

2 ) 1 ( ) 1 (

2 1

22 2 2

1 2 1

n n

S n S

Sp n .

Wówczas we wzorze na Z podstawiając Sp S2p zamiast otrzymujemy statystykę

2 1

1 1

n S n

Y T X

p

~ tn1n22.

Cytaty

Powiązane dokumenty

Zakładając, że rozkład wykonania normy jest w obu zakładach zbliżony do rozkładu normalnego i wiedząc, że test równości wariancji wykonany dla powyższych próbek nie pozwolił

Za pomocą testu chi-kwadrat niezależności, przyjmując poziom istotności 0,05, zbadaj czy płeć telewidza i rodzaj seriali przez niego oglądanych są niezależne..

Jest to więc taki poziom istotności, przy którym zmienia się decyzja testu (zaczynając od lewej - od małego poziomu α, kiedy to nie mamy podstaw do odrzucenia H 0 , po

• Zaobserwowano 7 osób u których lek okazał się nieskuteczny Albo - Przypuszczenie jest słuszne i próba „pechowa” Albo - Próba jest „dobra”, a przypuszczenie

testowa wartość krytyczna p-value poz... testowa wartość krytyczna

Jeśli H 0 jest prawdziwa, to wartość u # powinna znajdować się blisko wartości średniej EU (albo modalnej MoU), bo zakładamy, że próba jest próbą typową (a

[r]

przyjąć H 1 : na podstawie obserwacji nie możemy stwierdzić, że nowa technologia zmniejsza poziom zanieczyszczeń.. Chcielibyśmy stwierdzić, że nowa