TESTOWANIE HIPOTEZ
Hipoteza statystyczna jest to przypuszczenie dotyczące nieznanej własności rozkładu prawdopodobieństwa
badanej cechy populacji.
Przykłady
(a) Producent opon twierdzi, że nowy typ opony ma trwałość większą niż 60000 km. Jeśli (km) oznacza wartość średnią trwałości opon, to hipotezą producenta jest H:60000
(b) Socjolog twierdzi, że dzieci w miastach mają lepsze wyniki w nauce niż dzieci poza ośrodkami miejskimi. Niech p1 (p2) oznacza proporcję dzieci w miastach (poza miastami) o średnich ocenach rocznych co najmniej dobrych. Hipotezą socjologa jest H:p1 p2
(c) Producent twierdzi, że średni czas bezawaryjnej pracy drukarki to 200 godzin. Wówczas
H: 200
(d) Fizycy przypuszczają, że ilość cząstek emitowanych przez substancję radioaktywną w przedziałach czasu o danej długości jest zmienną losową o rozkładzie Poissona. Wówczas
H:X ~P(), 0.
(e) Sprzedawca przypuszcza, że miesięczna wartość sprzedaży ma rozkład normalny. Wówczas
H:X ~N(,), , 0 .
Hipotezę nazywamy parametryczną, jeśli jest stwierdzeniem dotyczącym nieznanego parametru
liczbowego lub wektorowego rozkładu cechy populacji, np. hipotezy (a), (b), (c).
W przeciwnym przypadku hipoteza jest nieparametryczną, np. hipotezy (d), (e).
W zadaniach testowania hipotez występują 2 hipotezy:
Hipoteza zerowa – hipoteza testowana celem ewentualnego odrzucenia, oznaczana przez H0.
Hipoteza alternatywna – hipoteza, która będzie
przyjęta, jeśli odrzucimy hipotezę zerową, oznaczana przez H1.
Hipotezy wykluczają się: nie mogą być jednocześnie prawdziwe, np. niech p(0,1) oznacza
prawdopodobieństwo sukcesu w doświadczeniu Bernoulli’ego. Możliwe są hipotezy:
2 : 1
0 p
H H1: p 12 lub
2 : 1
0 p
H , H1: p21, ale niemożliwe jest sytuacja gdy
2 : 1
0 p
H , H1: p31, bo wartość p 21 jest parametrem z zakresu H0 i H1 jednocześnie. Zbiory parametrów wymieniane w obu hipotezach nie są rozłączne.
Rola hipotez H0 i H1 nie jest symetryczna:
Hipoteza alternatywna, to ta którą zaakceptujemy, jeśli próbka dostarczy nam dostatecznych dowodów jej
prawdziwości, ta o której sądzimy, że jest prawdziwa i szukamy potwierdzenia w próbce, to ta na której nam zależy aby była prawdziwa.
Hipoteza zerowa to ta co do której prawdziwości nie jesteśmy przekonani w sytuacji gdy nie możemy
zaakceptować na podstawie próbki hipotezy
alternatywnej, ta którą poddajemy w wątpliwość.
Przykład. Załóżmy, że skuteczność pewnej terapii medycznej wynosi p1100%. Zaproponowano nową terapię, której nieznana skuteczność p2100% nie jest
gorsza, tzn. wiemy, że p2 p1. Nowa terapia będzie
szeroko stosowana, jeśli będziemy mieli po badaniach wstępnych dostatecznie dużą „pewność”, że p2 p1. Wówczas
2 1
0:p p
H , H1:p2 p1 .
Przykład. Nowa technologia produkcji może zmniejszyć dobowy poziom emisji zanieczyszczeń do atmosfery.
Chcielibyśmy wiedzieć, czy zmniejsza ona poziom zanieczyszczeń? Wówczas:
0:
H Nowa technologia nie zmniejsza dobowego poziomu emisji zanieczyszczeń atmosfery, tzn. nie jest lepsza od starej technologii.
H1 : Nowa technologia zmniejsza dobowy poziom emisji zanieczyszczeń atmosfery, tzn. jest lepsza.
Zadanie testowania powyższych hipotez polega na podjęciu poniższych decyzji, na podstawie obserwacji dobowych poziomów emisji zanieczyszczeń,:
Możliwe decyzje:
Nie ma dostatecznych dowodów aby odrzucić H0 , tzn. przyjąć H1: na podstawie obserwacji nie możemy stwierdzić, że nowa technologia zmniejsza poziom zanieczyszczeń.
Obserwacje dostarczają dostatecznych dowodów, aby przyjąć H1 , równoważnie odrzucić H0 , tzn.
stwierdzamy, iż można uznać, że nowa technologia zmniejsza poziom zanieczyszczeń.
Model matematyczny:
Załóżmy, że
(a) 0 = znany średni poziom dobowy emisji przy starej technologii
(b) = nieznany średni poziom dobowy emisji przy nowej technologii
(c) wiemy, że 0. Chcielibyśmy
stwierdzić, że nowa technologia zmniejsza poziom emisji. Zatem:
0 0:
H , H1: 0
(d) w ciągu n losowo wybranych dni obserwujemy dobowe poziomy emisji przy nowej
technologii: X1,X2,...,Xn
(e) zmienne losowe X1,X2,...,Xn są niezależne o jednakowym rozkładzie N(,), gdzie jest znane
Decyzję: „ przyjąć H1 ” lub „ nie można odrzucić H0 ” rozsądnie jest oprzeć na podstawie realizacji średniej z próby losowej X , tzn. średniej z próbki x.
Uzasadnienie:
Rozkładem X jest rozkład N(, n) skoncentrowany
wokół . Zatem dostatecznie małe wartości X sugerują, że H1: 0 jest prawdziwa, ponieważ
(1) jeśli H0: 0 jest prawdziwa, to wartości X skupiają się wokół 0, statystyka
n Z X
/
0
~ N(0,1)
(2) jeśli H1: 0 jest prawdziwa: 10, to wartości X skupiają się wokół 1.
Wówczas Z jest sumą zmiennej o rozkładzie N(0,1) oraz stałej ujemnej:
n n
Z X
/ /
0 1
1
.
(1) i (2) sugerują sposób testowania: niech c będzie odpowiednio dobraną stałą, a x wartością X obliczoną dla próbki, wówczas
(i) jeśli zx/ n0 c, to przyjmujemy H1.
(ii) jeśli zx/ n0 c, to nie ma podstaw do
odrzucenia H0.
Wybór c: Niech będzie małą liczbą z (0,1), np.
0,05 lub 0, 01 lub 0,1, ...
Niech c z z1. Wówczas jeśli H0: 0 prawdziwa, to
)
0(Z z
PH .
Stąd jest prawdopodobieństwem błędnej decyzji (przyjęcia H1) w przypadku gdy hipoteza H0 jest
prawdziwa. = prawdopodobieństwo błędu I rodzaju, nazywane poziomem istotności testu.
Zbiór C{z:zz} nazywamy zbiorem krytycznym, bo jest to zbiór wartości statystyki testowej Z dla których odrzucamy H0 na korzyść H1.
Błędy testowania
Podjęta decyzja
Stan natury
Akceptacja H0 ( H0 ? nie odrzucamy H0)
Odrzucenie H0 (Akceptacja H1)
H0 prawdziwa Decyzja prawidłowa
Błąd I rodzaju
H1 prawdziwa Błąd II rodzaju (? )
Decyzja prawidłowa
I. Testowanie hipotez o wartości średniej
rozkładu normalnego, gdy znana jest wariancja
Niech X1,X2,...,Xn będzie prostą próbą losowa z rozkładu
) , (
N , - znane.
0 0:
H .
Statystyka testowa:
n Z X
/
0
= X/n/ n0.
Jeśli H0 prawdziwa, to ZZZ ~ N(0,1).
Model 1. H0:0 H1:0 .
Wówczas przyjmujemy C = {z:z z1} = obszar
krytyczny testu hipotezy H0 przeciw H1 na poziomie istotności , gdzie
) ( )
( 0 1
0 Z C P Z z
PH H .
Model 2. H0:0 H1:0
Wówczas przyjmujemy C = {z:z z 1} - obszar krytyczny, gdzie
) ( )
( 0 1
0 Z C P Z z
PH H .
Model 3. H0:0 H1:0
Wówczas
C ={z: z z1/2} - obszar krytyczny, gdzie
2 / ) ( 1 /2
0 Z z
PH
) ( )
( 0 1 /2
0 Z C P Z z
PH H
Zadanie. Dotychczasowa dzienna wartość sprzedaży pewnego artykułu miała rozkład normalny o średniej 1000 ($) i standardowym odchyleniu 100 ($). Po serii reklam telewizyjnych w ciągu 9 losowo wybranych dni uzyskano następujące wartości sprzedaży:
1280, 1250, 990, 1100, 880, 1300, 1100, 950, 1050.
Czy, na poziomie istotności 0,01, można twierdzić, że reklamy spowodowały zwiększenie sprzedaży, jeśli można założyć, że wartości dziennych sprzedaży są niezależnymi zmiennymi losowymi o jednakowym rozkładzie normalnym ?
Rozwiązanie:
1. H0: 1000
2. H1: 1000
3. Statystyka testowa: Z X/1000n
4. 0,01, 1 0,99, z0,99 = 2,33.
Obszar krytyczny C = {z:z 2,33}
5. 100, n9, z obliczeń x 1100, stąd wartość statystyki testowej
3 3 / 100
1000 1100
/
1000
n z x
.
6. 3 2,33, więc odrzucamy H0.
Odpowiedź: Na poziomie istotności 0,01
stwierdzamy, że średnia wartość sprzedaży wzrosła po serii reklam.
II. Testowanie hipotez o wartości średniej rozkładu normalnego, gdy nieznana jest wariancja
Niech X1,X2,...,Xn będzie prostą próbą losowa z rozkładu
) , (
N , - nieznane.
0 0:
H .
Statystyka testowa:
n S T X
/
0
= SX/n S/n0.
Jeśli H0 prawdziwa, to T ~tn1.
Model 1. H0: 0 H1: 0
Wówczas przyjmujemy C = {t:t t1,n1} = obszar
krytyczny testu hipotezy H0 przeciw H1 na poziomie istotności , gdzie
) ( )
( 0 1 , 1
0 H n
H Z C P T t
P ,
1 , 1 n
t = kwantyl rzędu 1 rozkładu t – Studenta z
1
n stopniami swobody.
Model 2. H0: 0 H1: 0
Wówczas C = {t:t t1,n1} - obszar krytyczny, gdzie
)
( 1 , 1
0 n
H T t
P .
Model 3. H0: 0 H1:0 Wówczas
C = {t:t t1/2,n1} - obszar krytyczny, gdzie
2 / ) ( 1 /2, 1
0 n
H T t
P
PH0(T t1/2,n1)Zadanie. Producent twierdzi, że jego nowy model samochodu ma wartość średnią przebiegu nie
wymagającą żadnej interwencji 12000 (mil). W teście dla 4 losowo wybranych samochodów uzyskano
następujące przebiegi nie wymagające żadnego serwisu:
11000, 12000, 11800, 11200. Czy można zaprzeczyć twierdzeniu producenta, przyjmując 0,05 oraz rozkład normalny przebiegu.
Rozwiązanie:
1. H0: 12000 2. H1: 12000
3.Statystyka testowa: T XS/12000n
4. 0,05, 1 0,95, liczba stopni swobody = n1413,
3 , 95 ,
t0 = 2,353.
Obszar krytyczny C = {t:t2,353}.
5. n4, z obliczeń x11500, s2 68000041 226667, stąd wartość statystyki testowej
10 , 4 2 / 226667
12000 11500
/ 12000
s n
t x .
6. 2,10 2,353, więc nie ma podstaw do odrzucenia H0 na poziomie istotności 0,05.
Odpowiedź: Na poziomie istotności 0,05
stwierdzamy, że nie można odrzucić twierdzenia producenta.
Definicja.
Najmniejszy poziom istotności, przy którym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej nazywamy p-wartością przeprowadzonego testu.
Np. w ostatnim zadaniu
10 ,
2
t , PH0(T t1,n1)
2,10)
0(T
PH 0,063.
Im mniejsza jest p-wartość, tym mocniejsze staje się przekonanie testującego o fałszywości hipotezy zerowej i prawdziwości hipotezy alternatywnej.
III. Testowanie hipotez o wariancji rozkładu normalnego, gdy nieznana jest wartość średnia
Niech X1,X2,...,Xn będzie prostą próbą losowa z rozkładu
) , (
N , , - nieznane.
02 0:2
H .
Statystyka testowa:
02 2 ( 1) 2
n S = 2
0 2 2
) 2
1 (
S n
Jeśli H0 prawdziwa, to 2 ~n21.
Model 1. H0:202 H1:202
Wówczas przyjmujemy C = { :( 12) 12 , 1}
0 2 2
n obl
s
n
= obszar
krytyczny testu hipotezy H0 przeciw H1 na poziomie istotności , gdzie
) ( ) ( 2 0 2 12 , 1
0 H n
H C P
P ,
2 , 1
1 n
= kwantyl rzędu 1 rozkładu n21.
Model 2. H0:202 H1:202
Wówczas C = { :( 12) 2, 1}
0 2 2
n
obl n s
- obszar krytyczny, gdzie
) ( )
( 2 2 2, 1
0
0 H n
H C P
P .
Model 3. H0:202 H1:202
Wówczas obszar krytyczny C = { :( 12) 2/2}
0 2 2
n s
obl
)1 } :(
{ 2 12 2/
0 2 2
n s
obl ,
gdzie 2/2 2/2,n1, 12/2 12/2,n1.
Zadanie. Zmierzono czas życia 15 losowo wybranych żarówek z bieżącej produkcji. Policzono standardowe odchylenie próbkowe s 13 (godz. ). Czy na poziomie istotności 0,05 ( 5%) można twierdzić, że odchylenie standardowe czasu życia losowo wybranej żarówki jest różne od 10 ( godz.)
Rozwiązanie.
1. H0 : 10
2. H1: 10
3. Statystyka testowa: 2 2 2
10 ) 1 (n S
4. 0,05, /20,025, 1/20,975,
n15, liczba stopni swobody n115114, 2/2,n1 02,025,14 5,629,
12/2,n1 02,975,14 26,119.
Reguła decyzyjna ( na podstawie obszaru krytycznego ):
odrzuć H0, jeśli obliczona wartość statystyki
obl2
5,629 lub obl2 26,119.
5. s =13, stąd wartość statystyki testowej
obl2
= (n100 s1) 2 (14100)(132) 23,66.
6. 5,62923,6626,119, więc nie ma podstaw do odrzucenia
H0.
Odpowiedź. Na poziomie istotności 0,05, brak jest dostatecznych dowodów aby twierdzić, że
10.IV. Testy o różnicy wartości średnich dwóch rozkładów normalnych
Niech X1,X2,...,Xn1 oraz Y1,Y2,...,Yn2 będą dwiema
niezależnymi prostymi próbami losowymi z rozkładów normalnych N(1,1) oraz N(2,2), odpowiednio.
Model 1. ( znane odchylenia standardowe 1,2 )
2 1 0:
H ,
lub równoważnie
0 : 1 2
0
H .
Statystyka testowa:
Konstrukcja oparta na analizie X Y .
Statystka X Y ma rozkład normalny o wartości średniej 12 i wariancji
2 22
1 12
n n
( gdyż
średnie z obu prób losowych X ,Y są niezależnymi zmiennymi losowymi o rozkładach normalnych
) , (
1 1 n1
N , N(2, n22) , odpowiednio ). Stąd, po standaryzacji mamy
2 2 2 2 1
1
2 1
/ /
) (
) (
n n
Y Z X
~ N(0,1).
(a) H0:12 0 , H1:120 .
Jeśli H0 prawdziwa, to
2 2 2 2 1
1 /n /n
Y Z X
~ N(0,1).
Przyjmujemy C = {z:z z1} = obszar krytyczny testu hipotezy H0 przeciw H1 na poziomie istotności , gdzie PH0(ZC) PH0(Z z1),
z1 = kwantyl rzędu 1 rozkładu N(0,1). (b) H0:12 0 , H1:12 0 .
Przyjmujemy C = {z:zz} = obszar krytyczny.
(c) H0:12 0 , H1:12 0
Przyjmujemy C = {z: z z1/2} = obszar krytyczny.
Przykład. Średnia waga losowo wybranych 15
Europejczyków wyniosła x= 154 (funty), podczas gdy dla próbki 18 Amerykanów otrzymano y = 162 (funty).
Z poprzednich badań wiadomo, że wariancje wag losowo wybranego Europejczyka i Amerykanina wynoszą, odpowiednio: 12 100 i 22 169. Czy można
twierdzić, że średnie wagi w populacji Europejczyków i Amerykanów są różne? Przyjąć 0,05 oraz rozkład normalny wag.
1. H0:12 0. 2. H1:12 0
3. Statystyka testowa: Z 12/Xn1Y22/n2
4. 0,05, 1/20,975, z0,975 1,96. Obszar krytyczny C = {z: z 1,96}.
5. Mamyx=154, y=162, 12 100, 22 169, n1 15, n2 18. Stąd wartość statystyki testowej
2 2 2 2 1
1 /n /n
y z x
056 , 16
8 18
/ 169 15 / 100
162
154
= - 2.
6. 2 21,96, więc odrzucamy H0.
Odpowiedź: Na poziomie istotności 0,05
stwierdzamy, że średnia waga Europejczyka różni się od średniej wagi Amerykanina, przy czym dane sugerują, że średnio Amerykanie ważą więcej niż Europejczycy.
Model 2. ( nieznane odchylenia standardowe 1,2 )
Założenie dodatkowe: 12 , - nieznane.
2 1 0:
H ,
lub równoważnie
0 : 1 2
0
H .
Statystyka testowa:
Jeśli H0 prawdziwa, to
2 2 2 2 1
1 /n /n
Y Z X
= 1/Xn1Y1/n2 ~ N(0,1). Var(X Y ) =
2 1
2 1 1
n
n ,
Niech
1 1
2 1
12 ( )
1 1 n
i Xi X
S n , 21 2
2
22 ( )
1 1 n
i Yi Y
S n -
nieobciążone estymatory 2.
Estymatorem nieobciążonym 2, opartym na dwu próbach łącznie, jest statystyka
2 ) 1 ( ) 1 (
2 1
22 2 2
1 2 1
n n
S n S
Sp n .
Wówczas we wzorze na Z podstawiając Sp S2p zamiast otrzymujemy statystykę
2 1
1 1
n S n
Y T X
p
~ tn1n22.