6. W eryfikacja hipotez statystycznych
6.2. Weryfikacja hipotez parametrycznych dotyczących istotności różnicy między
wartością oczekiwaną zmiennej losowej
a ustaloną wartością
Załóżmy, że zbiorowość generalna charakteryzow ana jest za pom ocą zm iennej losowej: X ~ N ( (j; o). H ipotezę zerow ą i odpow iednią hipotezę alternatyw ną k o n struujemy dla p aram etru p. H ipoteza zerow a może być hipotezą p ro stą typu:
H 0: n = |jfl, (6.23)
lub jedną z hipotez złożonych postaci:
H 0: n < no, (6.24)
lub
Ho. (i > |Xo- (6.25)
Z aprzeczeniem hipotezy zerowej jest hipoteza alternatyw na, o postaci:
(6.26)
H \ \ \ x > no, (6.27)
lub
P odobnie jak w rozw ażaniach ogólnych, każda z tych trzech hipotez alterna tywnych m oże być zaprzeczeniem hipotezy zerowej prostej (6.23). Jeżeli natomiast hipoteza zerow a będzie złożona i będzie m iała postać (6.24) lub (6.25), to wówczas m ożna jej przyporządkow ać tylko jed n ą hipotezą alternatyw ną. I tak hipotezie ze rowej (6.24) odpow iada hipoteza alternatyw na (6.27), natom iast hipotezie zerowej (6.25), hipoteza alternatyw na (6.28).
Podczas budowy testu istotności dla w artości oczekiwanej m ożna wyróżnić trzy m odele sytuacyjne (porów naj z estym acją przedziałow ą wartości oczekiwanej):
1) m odel I. Z m ien n a losowa X opisująca populację m a rozkład norm alny lub
zbliżony do norm alnego, z nieznaną wartością oczekiwaną (i i znanym od chyleniem standardow ym o,
2) m od el II. Z m ienna losowa A" opisująca populację ma rozkład norm alny lub zbliżony do norm alnego, z nieznaną wartością oczekiwaną n i nieznanym odchyleniem standardow ym o,
3) m odel ID. Zm ienna losowa A' opisująca populację ma nieznany rozkład, z nie znaną wartością oczekiwaną n i nieznanym odchyleniem standardowym o.
M odel I. Jeżeli zm ienna losowa opisująca populację m a rozkład normalny
o znanym i stałym odchyleniu standardowym o, to wówczas bez względu na liczebność próby, do opisu próby losowej używa się statystyki z próby postaci (zob. wzór 5.61):
U = — —^ (6.29)
a o w artościach
u 0 = J7i. (6.30)
o
Jeżeli prawdziwa jest hipoteza zerow a, to wówczas statystyka U m a rozkład norm alny o p aram etrach n = 0 i o = 1. Dzięki tem u do konstrukcji przedziałów krytycznych i przedziałów r|( wykorzystujemy tablice dystrybuanty rozkładu nor m alnego standaryzow anego. Postać przedziału krytycznego jest zależna od postaci hipotezy alternatyw nej. Jeżeli hipoteza alternatyw na ma postać: (6.26), to wówczas przedział krytyczny będzie mial postać:
r|k = ( - * : -Ma/z] u +°o). (6.31)
W artości -« a,2 i iia/2 wyznaczane są w taki sposób, aby
P { U < - u aj2) = a/2, (6.32)
oraz
P( U > Uaji) = a/2. (6.33)
W przypadku, gdy hipoteza alternatywna jest postaci (6.27), to wówczas przedział krytyczny przedstaw ia się następująco:
przy czym
P ( U > и„) = a . (6.35)
Jeżeli hipoteza alternatyw na przedstaw iana jest w zorem (6.28), to wówczas przedział krytyczny jest określony jako:
TU = (-oo; -м„]. (6.36)
W artość graniczna - u a jest określana w ten sposób, aby spełniona była relacja:
P ( U < - u a) = a. (6.37)
Ogólna reguła decyzyjna jest taka, że w przypadku, gdy w artość obliczonej sta tystyki Mo zawiera się w wyznaczonym przedziale krytycznym r^ , to wówczas należy odrzucić hipotezę zerow ą na korzyść hipotezy alternatyw nej. Jeżeli natom iast obli czona w artość statystyki uq będzie leżeć poza przedziałem krytycznym, to wówczas, należy sformułować wniosek, że b rak jest podstaw (powodów), aby odrzucić hipotezę zerową. Szczegółowe reguły postępow ania zostały zam ieszczone w tablicy 6.1.
Tablica 6.1. Zasady podejmowania decyzji3
Hipotezy
H0
: Ц = M-oH0 :
|і < цоHo :
Ц > HoDecyzja
H\ :
н*ИоH\:
н > HoH\ :
Ц < Ho| Mo | ? U a]2 |м0|> м а |M o| > Ma
Odrzucić
Ho
na korzyść
H]
(Mo > Mo/2 lub Mo < —Wa/2) (мо > Ma) (Mo < - M a )(6.38) (6.40) (6.42)
|ио| < U a j l |m o| < Ma |M o | < Ma
Brak podstaw
do odrzucenia
Ho
( —Mo/2 < Mo < Uaji) (Mo < Ma ) (M O > - M a )(6.39) (6.41) (6.43)
Źródło: opracowanie własne.
Zasady podejm owania decyzji przedstaw ione w tablicy 6.1, m ożna transform ow ać do nieco odm iennej postaci. Ich opis zam ieszczono w tablicy 6.24.
3 Dla większej przejrzystości w nagłówku tablicy umieszczono najczęściej spotykane postacie hipotez Ho i H\. (Zob. wzory 6.23-6.28).
4 Forma podejmowania decyzji przedstawiona w tablicy 6.2 jest charakterystyczna dla tzw. kart kontrolnych Shewharta, które należą do podstawowych narzędzi wykorzystywanych w statystycznej kontroli jakości. Szerzej zob. np. A. Iwasiewicz: Zarządzanie jakoś cią, PWN, W arszawa-Kraków 1999, rozdz. 8. Zob także: idem: Zarządzanie jakością w przykładach i zadaniach, Śląskie Wydawnictwo Naukowe Wyższej Szkoły Zarządzania i Nauk Społecznych, Tychy 2005, s. 273.
Tablica 6.2. Zmodyfikowane zasady podejmowania decyzji - Hipotezy Decyzja Ho: (X = Mo H\ : | i * no H0: (X < Ho H\. |i > ho H0:u > |io H\ :n < no Odrzucić Ho na korzyść H\ i „ _ ^ = ^ 0- u a/2-^= •Jn lub *„>*. = HO + “a “7= ■Jn (6.44) 'Jn (6.46) xg = n0- u a- ■Jn (6.48) Brak podstaw do odrzucenia Ho xd<x,,<xg, gdzie X g — Ho + Ma/2 1—1 ■Jn Mo _ ^a/2 [— yin (6.45) x„< xg= n0+ua~ ■Jn (6.47) > Xg ~ Mo“ Ua~~r- yln (6.49)
Źródło: opracowanie własne.
Zauważmy, że obecnie do podjęcia decyzji wystarczy porów nać wartość średniej z próby z odpow iednią w artością krytyczna (wartościami krytycznymi). Wartości kry tyczne x d i xg otrzym uje się poprzez przekształcenie funkcji (6.30) i ustalenie wartości Mo na poziom ie ua lub Ua/2- W przypadku wyznaczania dolnej granicy, przed przekształ ceniem wyrażenia (6.30) jego praw ą stronę należy przem nożyć przez (-1).
M odel II. Załóżm y, że populacja jest opisywana za pom ocą zm iennej losowej a), przy czym nieznana jest rzeczywista w artość p aram etru o.
Proces weryfikacji hipotez odbywa się z wykorzystaniem statystyki
= (6.50)
s s
przyjm ującej wartości:
t t . l ę l i j ; . (6,51)
s s
Statystyka łr m a rozkład S tudenta o r = n -1 stopniach swobody.
W sytuacji, gdy prawdziwa jest hipoteza zerow a (6.23) - (6.25), to wówczas do jej weryfikacji wykorzystuje się spraw dzian fr,o postaci:
, _ | _ “ Mu I Z C x
I, i,--- v/i — 1 — ■Jn. (6.51a)
.V s
Przedział krytyczny konstruujem y, w podobny sposób jak w m odelu I, korzystając z tablic rozkładu Studenta. W przypadku testu dw ustronnego przedział krytyczny m a postać:
przy czym
P(tr < - tr.a/2) = P(tr > tr.ajl) = a/2. (6.53)
Jeżeli test jest prawostronny, to wówczas przedział krytyczny będzie przedstawiał się następująco:
>1* = + * ) , (6.54)
przy czym
P ( U > t r,a) = a.
N atom iast w przypadku testu lew ostronnego przedział krytyczny będzie p o sta
ły = (-'»; - &-.«]■ (6.55)
przy czym P(tr < - tr,a) =
a-Zasady podejm ow ania decyzji są analogiczne jak opisane w tablicy 6.1. Podobnie jak wcześniej ujmiemy je tabelarycznie (zob. tablica 6.3):
Tablica 6.3. Zasady podejmowania decyzji w modelu II
Hipotezy
Ha:
n = nuHo:
|i • udH0:
> noDecyzja
H
i: (i * |ioH\\
n > |inH\:
u < Ho| Ir.0 1 > Ir,aJ2 M - Ir.u \tr.o\>trM
Odrzucić Hu
na korzyść H\ (tr,(1 ' tr.njllub tr,0 * - tr.ail) (tr,0 tr.a) (tr.0 < - tr,u)
(6 .5 6 ) (6 .5 8 ) (6 .6 0 )
| <r,0 | < tr,aj2 |/r,o| < tr,a kr.ol < tr.u
Brak podstaw
do odrzucenia Ha (-tr.a.2
<
tr.0 < tr.ajl) (trfi<
I,,,) (tr.O> ~
tr.a)(6 .5 7 ) (6 .5 9 ) (6 .6 1 )
Źródło', opracowanie własne.
Oczywiście w podobny sposób m ożna dokonać transform acji zasad p o d ejm o wania decyzji do formy przedstaw ionej w tablicy 6.1. Wystarczy tylko w miejsce odchylenia standardow ego o podstawić wartość estym atora S * lub S. B udując tablicę 6.4. założono, że estym atorem odchylenia standardow ego populacji jest odchylenie standardow e z próby S*.
Tablica 6.4. Zmodyfikowane zasady podejmowania decyzji w modelu II \ Hipotezy Decyzja Ho : H = Ho H\ : |x * |io Ho : u < no Hy.|i > Ho H0 : H > Ho Hu h < Ho Odrzucić Ho na korzyść Hi ^ — \1q + frlCt/2 1— ■Jn lub — %d ~~ №o~tr,a!2 I—ł •Jn (6.62) x„ >i g=^, + /r,a^ = ■Jn (6.64) *„<** = Ho-'r „4=■Jn (6.66) Brak podstaw do odrzucenia Ho xd<xn<xg, gdzie - _ s‘ Xg tr.a/2~T=rJ ■Jn . S xd—fx0~ tr.ai2~r= ■Jn (6.63) < *, = HO + 'r,a 4 - ■Jn (6.65) MO“ 'r.a 4 = ■Jn (6.67)
Źródło-, opracowanie wtasne.
M odel III. W przypadku braku znajom ości postaci rozkładu zbiorowości ge n eraln ej, do w iarogodnej weryfikacji w ym agana jest duża liczebność próby. Do oszacow ania w artości oczekiwanej populacji należy użyć średniej arytmetycznej z próby X„. Jeżeli p ró b a losowa, wzrasta do nieskończoności, to zgodnie z centralnym tw ierdzeniem granicznym , rozkład z próby średnich zbliża się do rozkładu norm al nego ze średnią n i odchyleniem standardow ym -j=. Gdy znana jest rzeczywista
yln
w artość odchylenia standardow ego o, to wówczas w procesie weryfikacji należy skorzystać ze statystyki Un (6.29) i postępow ać identycznie jak w m odelu I. Jeżeli natom iast nie znamy w artości p aram etru a , to przy dużej próbie m ożna przyjąć, że w przybliżeniu jest on równy szacunkowi otrzym anem u przy użyciu estym atora 5 (s = o) i skorzystać ze statystyki:
U= A'n ~ M" Vn, (6.68)
która w przypadku prawdziwości hipotezy zerowej ma rozkład N(0,1).
P rz y k ła d 6.2
W ykorzystując d an e i założenia z przykładu 5.5 oraz zakładając współczynnik ufności a = 0,05, zweryfikować hipotezę zerową, głoszącą, że średnia liczba punktów otrzym anych z egzam inu z „Z arządzania jakością” równa się 30, wobec hipotezy alternatyw nej głoszącej, że średnia liczba punków jest istotnie różna od 30.
Przypomnijmy, że rozkład punktów z egzam inu jest w przybliżeniu norm alny z odchyleniem standardow ym wynoszącym o = 6,4, oraz średnia liczba punktów w badanej próbie (n = 25) wynosiła *25 =30,5.
Stawiamy hipotezę zerową:
Ho: |i = 30, wobec hipotezy alternatywnej:
30.
Ponieważ znamy w artość odchylenia standardow ego populacji o oraz wiemy, że zm ienna losowa AT oznaczająca liczbę punktów ma w przybliżeniu rozkład norm alny, dlatego do zweryfikowania hipotezy zerowej m ożna wykorzystać statystykę (6.29) z m odelu I.
Po podstaw ieniu danych do wzoru otrzymamy: 3 0 5 - 3 0 ^
6,4 Przedział krytyczny jest postaci:
r|fc = (-c o ; -1,96] u [1,96; +00).
Ponieważ 10 ,3 9 1 < ua/2 = 1,96, dlatego brak jest podstaw do o drzucenia hipotezy zerowej, głoszącej, że średnia liczba punktów w całej populacji jest rów na 30.
Powyższe zagadnienie m ożna rozwiązać w inny sposób, wykorzystując relację (6.44).
W artość średniej z próby porów nujem y z w artościam i xd i x g. W naszym przy
padku: f- ,
x d= x „ - u a~-^= =30,5 -1 ,9 6 - ^ = « 2 8 ;
" V« -v/25
x e = x,.+ u aą-^= =30,5 + 1,96 =33 .
■Jn yj 25
Ponieważ w artość średniej z próby leży pom iędzy w artościam i xd i xg, dlatego brak jest powodów, aby odrzucić hipotezę Ho- {kp}
P rz y k ła d 6.3
Załóżmy, obecnie, że utrzym ując założenia z przykładu 6.2, sprawdzam y praw dziwość hipotezy zerowej postaci:
H 0: |i = 30, wobec hipotezy alternatyw nej:
Naszym zadaniem jest ustalenie praw dopodobieństw a popełnienia błędu drugie go rodzaju oraz mocy testu, zakładając, że praw dopodobieństw o popełnienia błędu pierw szego rodzaju wynosi a = 0,05.
Ponieważ |io < |ii musimy zastosow ać przedział krytyczny jednostronny (p ra w ostronny).
Z akładając poziom istotności a = 0,05, obliczamy w artość krytyczną: x g— |i0 + u a = 30 + 1,64
■Jn v 25 > 32,1.
Błąd pierw szego rodzaju popełniam y, gdy prawdziwa będzie hipoteza zerowa i x 25 > x g. P raw dopodobieństw o tego błędu zostało ustalone a priori na poziom ie a = 0,01 (P( x25> x g\Ha:[i = |i0)= 0 ,0 1 ). Błąd drugiego rodzaju popełnimy, gdy x 25 < x g, a prawdziwa będzie hipoteza alternatyw na. Praw dopodobieństw o popełnienia tego b łędu wynosi: N _ P f*25~Hl P ^ P ( x 25<'xs \ H ] :n = n l) = P — rp , , 32,1-35 / 6 ,4 /7 2 5 al-Jn a/yfn —P ( U <-2,266) = <£(-2,266) = 1 - 0(2,266) = 1 - 0,9884 = 0,0116. Z atem , m oc testu wyniesie 1 - (i = 1 - 0,0116 = 0,9884. {kp}
P rz y k ła d 6.4
Wykorzystując dane z przykładu 6.2, uchylmy założenie o znajomości odchylenia standardow ego populacji a. Załóżm y, natom iast, że w artość odchylenia stand ar dowego została oszacow ana, na podstaw ie próby za pom ocą statystyki S i wynosi s = 6,5. Przyjm ując ryzyko popełnien ia błędu pierw szego rodzaju na poziom ie 0,01, zweryfikujmy hipotezę zerow ą postaci:
Hn\ [i < 30, w obec hipotez alternatyw nej H\\ (i > 30.
Z uwagi na b rak znajom ości odchylenia standardow ego oraz m ałą liczebność próby, do weryfikacji należy wykorzystać sprawdzian (6.50). Po podstawieniu war tości otrzymamy:
?240 = 30’ 5~ 30 7 2 4 = 0 ,3 7 7 . 6,5
W artość obliczonej statystyki porów nujem y z przedziałem krytycznym: r\k = [tr = 24,a = o.oi; +'*:) = [2,492; +oc).
Ponieważ ?24,o = 0,377 < 2,492, to nie m a powodów do odrzucenia hipotezy zerowej m ówiącej, że średnia liczba punktów nie przekracza 30. {kp}
P rz y k ła d 6.5
W przykładzie tym wykorzystamy dane, z przykładu 5.7 (zobacz także M. M ajor, J. Niezgoda: Elementy..., op. cit. przykład 2.2), przedstaw iające liczbę osób korzy stających z Biblioteki Miejskiej w jednym z m iast województwa podkarpackiego. D ane te potraktujem y jako losowy podzbiór większej zbiorow ości generalnej. Przy pomnijmy, że obserwację liczby osób odwiedzających bibliotekę prow adzono w ciągu n = 100 dni roboczych i otrzym ano średnią arytm etyczną x 100 = 76,1 oraz odchylenie standardow e z próby i = 18,74. Naszym zadaniem jest weryfikacja hipotezy zerowej głoszącej, że średnia dzienna liczba osób odwiedzających bibliotekę jest większa lub równa 81 osób (Hu: (i *81). Podczas weryfikacji założymy, że poziom istotności a = 0,01. W stosunku do tak sform ułow anej hipotezy zerowej stawiamy hipotezę alternatywną: H\ \ u < 81. Ponieważ próba losowa jest duża i nie znana jest rzeczywista wartość odchylenia standardow ego populacji, dlatego do wyznaczenia przedziału ufności należy wykorzystać procedury opisane w m odelu III (wzór 6.62). W artość obliczonej statystyki wyniesie:
Przedział krytyczny m a postać (-oo; -2,33]. Ponieważ wartość obliczonej statystyki Mo = -2,6 < -2,33 (lub inaczej | uo |= 2,08 > u a = 2,33), dlatego z praw do po do bieństwem błędu nie większym niż 0,01, należy odrzucić hipotezę zerow ą i przyjąć hipotezę alternatyw ną, głoszącą, że średnia dzienna liczna osób odwiedzających bibliotekę jest mniejsza niż 81 osób. {kp}
Załóżmy, że badana zmienna losowa X opisująca populację m a rozkład N ( |i; o). Z populacji tej p obrano próbę prostą o liczności n, na podstaw ie której należy zwe ryfikować jed n ą z następujących hipotez zerowych: