• Nie Znaleziono Wyników

Rozdział 7 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

N/A
N/A
Protected

Academic year: 2021

Share "Rozdział 7 TESTOWANIE HIPOTEZ STATYSTYCZNYCH"

Copied!
21
0
0

Pełen tekst

(1)

Rozdział 7 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych jest drugą (i ostatnią), po estymacji statystycz- nej, częścią klasycznej statystyki matematycznej. Testowanie dostarcza metod oceny prawdziwości postawionej hipotezy dających informacje, na podstawie których badacz podejmuje decyzję o akceptacji hipotezy lub jej odrzuceniu. Każda taka decyzja może być błędna, ale statystyka matematyczna – w odróżnieniu metod deter- ministycznych – uwzględnia takie ryzyko i pozwala je w pewien sposób minima- lizować.

7.1 IDEA TESTOWANIA HIPOTEZY STATYSTYCZNEJ I POJĘCIA ZWIĄZANE

Definicja hipotezy statystycznej. Hipotezą statystyczną nazywamy dowolne założenie dotyczące nieznanego rozkładu prawdopodobieństwa. Najczęściej dotyczy ono nieznanej wartości (np. EX, varX itp.) lub nieznanej funkcji (z reguły funkcji rozkładu prawdopodobieństwa FX(x)).

Idea testowania hipotezy statystycznej. Zasadnicza myśli testowania staty- stycznego przebiega mniej więcej w ten sposób. Niech testowana hipoteza dotycząca nieznanej wartości g ma postać H0(g=g0), co czytamy „hipoteza zerowa, że g=g0”.

Symbol g0 oznacza liczbę, która – jak się przypuszcza w stawianej ramach hipotezy – jest równa wartości g. Liczba g0 pochodzi spoza statystyki i jest efektem pewnej teorii, stąd mówi się czasami że g0 to „wartość teoretyczna”.

Aby móc testować H0 musimy posiadać jakąś informację o parametrze g. Infor- macji takiej dostarcza po prostu pomiar wielkości g, czyli – w języku statystyki – estymacja statystyczna, np. w postaci wartości ĝ estymatora parametru g. A więc, jeśli prawdą jest, że g=g0 to powinno być również prawdą, że ĝ.g0, albo inaczej, że ĝ-g0.0 (lub ĝ/g0.1) i wtedy bylibyśmy skłonni przyjąć, że H0 jest hipotezą prawdziwą. Jeśli natomiast g…g0, to stąd powinno wynikać że ĝ≈ g0 (czyli ĝ-g0≈ 0 lub ĝ/g0≈ 1). To z kolei oznacza, że rozbieżność pomiędzy modelem (g=g0), a posiadaną informacją ĝ ≈ g0 jest tak duża, że jesteśmy skłonni uważać ją za argument przeciwko H0.

(2)

Pojawia się teraz nowy problem: „Co to znaczy w przybliżeniu równy?” i w jaki sposób ustalić granicę, poniżej której będziemy uważać, że ĝ.g0, a powyżej której mamy już ĝ≈ g0.

Idea testowania bardziej szczegółowo. W celu testowania przyjętej hipotezy statystycznej H0, wykorzystujemy pewną sta-

tystykę U(Ĝ,g) – zwaną statystyką testową – będącą funkcją estymatora Ĝ parametru g oraz parametru g oraz związaną z H0 w ten sposób, że gdy H0 = prawda, to U posiada rozkład prawdopodobieństwa o znanej dys- trybuancie FU(u):

(

ˆ 0

)

( ) P ( , ) |

F uU = U G g <u H (7.1) Statystyka U jest zwykle proporcjonalna albo do różnicy Ĝ–g albo ilorazu Ĝ/g – sta- nowi więc miarę rozbieżności pomiędzy tym, co twierdzi hipoteza, a tym, co mówi pomiar.

Na podstawie posiadanej próby losowej {xi}, i=1, 2,...,n, obliczamy konkretną war- tość u# charakterystyki U. Jeśli H0 jest prawdziwa, to wartość u# powinna znajdować się blisko wartości średniej EU (albo modalnej MoU), bo zakładamy, że próba jest próbą typową (a więc przeciętną). Duża rozbieżność pomiędzy u# a EU (albo MoU) świadczy albo

(1) o fałszywości hipotezy H0, albo (2) o wyjątkowości zestawu danych {xi}.

Prowadzący badania musi wówczas podjąć decyzję, czy rozbieżność ta jest losowa (zachodzi przypadek (2)), czy też trzeba odrzucić testowaną hipotezę H0 (zachodzi przypadek (1)). Ponieważ zakładamy typowość próby, to przyjętym podejś- ciem jest odrzucenie badanej hipotezy przy założonym ryzyku popełnie- nia błędu.

Istotnym problemem jest ustalenie znaczenia terminu duża rozbieżność. Zachodzi bowiem pytanie, czy istnieje ona już dla u* z rys. 7.1, czy dopiero dla wartości u**? A może muszą to być wartości jeszcze większe?

Obszar krytyczny Skryt, obszar akceptacji i poziom αααα istotności testu.

Rozwiązanie powyższego problemu polega na utworzeniu pewnego obszaru Skryt war- tości zmiennej U, tzw. obszaru krytycznego, określonego poprzez przyjęcie konkretnej wartości prawdopodobieństwa α, nazywanego poziomem istotności testu, takiego, że

(

0

)

P USkryt|H =α (7.2)

oraz przyjęciu następującego postępowania:

Rys. 7.1. Jeśli hipoteza H0 jest słuszna, to statystyka U ma rozkład fU(u*H0) i większość wyników doświadczenia losowego znajdzie się w pobliżu EU. Czy u* znajduje się w pobliżu EU? Czy u** znajduje się daleko od EU?

u* u**

u fU(u|H0)

EU

(3)

1. Jeśli obliczona na podstawie próby wartość u# znajdzie się w obszarze Skryt (jak np. u** na rys. 7.1), to hipotezę odrzucamy na poziomie istotności α. Musimy jednak być świadomi tego, że z prawdopodobieństwem α możemy popełnić błąd polegający na odrzuceniu słusznej hipotezy. Dzieje

się tak dlatego, że na 100 takich samych testów danej hipotezy przeciętnie α⋅100%

to przypadki, gdy hipoteza jest prawdzi- wa, a testujący ją odrzuca. Mówimy wów- czas o nietypowości próby, tzn. że dana próba nie jest przeciętna). Jednakże zało- żenie o przeciętności próby jest warun- kiem sine qua non dalszego badania – musimy więc tak postępować. Staramy się jedynie, aby wartość α – prawdopodo- bieństwo otrzymania nieprzeciętnej pró- by, czyli jednocześnie prawdopodobień- stwo odrzucenia słusznej hipotezy – była

mała. Zwykle przyjmujemy wartości α=0.01 lub α=0.05 (czyli α=1% lub α=5%).

2. Jeśli obliczona na podstawie próby wartość u# znajdzie się poza obszarem krytycznym Skryt (jak u* na rys. 7.1) – obszar ten jest nazywany jest czasami obszarem akceptacji hipotezy H0 – to hipotezę przyjmujemy na poziomie istotności α, jakkolwiek otrzymaliśmy tylko to, co spodziewaliśmy się otrzymać zakładając słuszność badanej hipotezy. Akceptacja hipotezy opiera się na braku argumentów przeciwko niej, a nie na istnieniu argumentów za prawdziwością H0.

Dwa możliwe wnioski wynikające z testu. Tak więc wprowadzenie pojęcia obszaru krytycznego Skryt, oznacza, że mogą zajść dwa przypadki, które w języku sta- tystyki formułujemy następująco:

(1) jeśli obliczona wartość u# statystyki testowej U należy do obszaru krytycznego Skryt testowanej hipotezy, u# 0 Skryt, to istnieją podstawy do odrzucenia H0. Zwy- kle hipotezę tę odrzucamy.

(2) jeśli obliczona wartość u# statystyki testowej U nie należy do obszaru krytycznego Skryt testowanej hipotezy, u# ó Skryt, to nie ma podstaw do odrzucenia testowanej hipotezy. Zwykle hipotezę tę przyjmujemy.

Jeszcze raz test a prawdziwość hipotezy. Pragnę zwrócić uwagę Czytelnika na sformułowania (1) i (2) w poprzednim akapicie: na pytanie o prawdziwość badanej hipotezy test statystyczny nie daje odpowiedzi „tak, hipoteza ta jest prawdziwa” albo

„nie, hipoteza ta jest fałszywa” – informuje jedynie o pewnych wątpliwościach lub ich braku, a decyzję musi podjąć badacz. Mówiąc obrazowo, odpowiedzi są typu: „chyba tak” lub: „raczej nie”, gdzie sens słów „chyba” i „raczej” jest dobrze określony.

Rys. 7.2. (Dwustronny) obszar krytyczny to suma dwu przedziałów zaznaczonych grubymi strzałka- mi; sumaryczne pole pomiędzy obszarem krytycz- nym a funkcją gęstości statystyki testowej wynosi α.

fU(u|H0)

u* u**

u EU

P(U∈Skryt|H0)=α

Skryt

(4)

Błędy I i II rodzaju. Jeśli nie ma podstaw do odrzucenia H0, akceptujemy tę hipotezę pomimo że może ona być nieprawdziwa. Błąd taki – przyjęcia hipotezy fał- szywej – nazywamy błędem II rodzaju. W drugim przypadku – gdy istnieją podstawy do odrzucenia H0 – odrzucamy ją. Możemy tu również popełnić błąd – błąd I rodzaju – polegający na odrzuceniu prawdziwej hipotezy. Może się to zdarzyć w sytuacji (2) – wyjątkowego zestawu danych {xi}. Prawdopodobieństwo zajścia takiego zdarzenia (tj.

popełnienia błędu I ro- dzaju) wynosi α.

Trzy rodzaje obszaru krytycznego. Równanie (7.2) nie definiuje jednoznacz- nie obszaru krytycznego Skryt i dlatego możliwych jest ich wiele (nawet nieskończenie wiele gdy U jest ciągłą zmienną). W praktyce stosowane są trzy rodzaje obszaru krytycznego przedstawione symbo-

licznie na rys. 7.3. Są one zdefinio- wane przez tzw. hipotezę alternatyw- ną, zwykle oznaczaną symbolem H1, tj.

taką hipotezę, którą jesteśmy skłonni przyjąć w przypadku odrzucenia hipotezy H0. Mamy do wyboru następujące hipotezy alternatywne:

(1) H1(g…g0). Oznacza ona, że zbyt duże lub zbyt małe wartości ĝ (w stosunku do g0) są dla testującego nie do przyjęcia. Obszarem kry- tycznym będzie w tym przypadku obszar dwustronny: Skryt = (U<u1)

∪ (U>u2 ) (rys. 7.3A).

(2) H1(g<g0). W tym przypadku od- rzucać będziemy H0, gdy ĝ będzie zbyt małe w stosunku do g0. Ob.- szarem krytycznym będzie w tym przypadku obszar lewostronny (rys. 7.3B), gdy U(Ĝ,g) jest funkcją rosnącą Ĝ lub prawostronny (rys.

7.3C), gdy U(Ĝ,g) jest funkcją ma- lejącą Ĝ.

(3) H1(g>g0). Przypadek analogiczny

do (2). Teraz będziemy odrzucać H0, gdy ĝ będzie zbyt duże w stosunku do g0. Rys. 7.3. Trzy stosowane obszary krytyczne: A – dwustronny, B – lewostronny i C – prawostronny.

Wartości u1 i u2 to wartości krytyczne statystyki testowej U.

H0 prawdziwa H0 fałszywa przyjmujemy H0 decyzja trafna błąd II rodzaju

odrzucamy H0 błąd I rodzaju decyzja trafna

fU(u|H0)

fU(u|H0)

fU(u|H0)

1-α α/2

α/2

P(u1<U<u2)=1-α

P(u1<U)=1-α

α 1-α

1-α α

P(U<u2)=1-α u1

u2

u1 u2

(A)

(B)

(C)

(5)

Obszarem krytycznym będzie w tym przypadku obszar prawostronny (rys. 7.3C), gdy U(Ĝ,g) jest funkcją rosnącą Ĝ lub lewostronny (rys. 7.3B), gdy U(Ĝ,g) jest funkcją malejącą Ĝ.

Wartości krytyczne. Wartości u1 i u2 zilustrowane na rys. 7.3 noszą nazwę wartości krytycznych. Są to odpowiednie kwantyle rozkładu zmiennej U, wyznaczone przez podanie poziomu istotności α testu i rodzaj hipotezy alternatywnej. I tak w przypadku dwustronnego obszaru krytycznego Skryt = (-4, u1) c (u2,+4) wartości te są określone równaniami:

1

2

( ) 2 ( ) 1

2

U

U

F u F u

α α

=

= −

(7.3)

Wartość krytyczna u1 jest więc w dwustronnym teście kwantylem (α/2)@100% procen- towym, a u2 – kwantylem (1-α/2)@100% procentowym. Jeśli funkcja gęstości fU(u) jest symetryczna względem prostej u=0 (jak np. w przypadku rozkładów N(0,1) i Stu- denta), to wtedy

1 2 1 / 2

ozn

u u uα

− = = (7.4)

Lewostronny obszar krytyczny Skryt = (-4, u1) jest zdefiniowany równaniem:

( )1

F uU =α (7.5)

Wartość krytyczna u1 jest tutaj kwantylem α@100% procentowym: u1 = uα@100%.

Prawostronny obszar krytyczny Skryt = (u2,+4) jest ograniczony z lewej strony kwantylem (1-α)@100% procentowym u2 = u(1-α)@100%.:

( 2) 1

F uU = − α (7.6)

Trzy związane ze sobą obiekty testowania hipotez statystycznych: g, ĝ i g0. W całej teorii i praktyce testowania hipotez statystycznych występuje trzy rodzaje obiektów ściśle związanych ze sobą: nieznany parametr populacji g, empiryczna informacja o g w postaci próby losowej, na podstawie której znajdujemy empiryczną reprezentację (oszacowanie) parametru g czyli estymator ĝ oraz teoretyczna (pozasta- tystyczna) informacja o parametrze g w postaci wartości g0, tj. wartość postulowana przez hipotezę H0, zwana też wartością teoretyczną.

Procedura testowania – podsumowanie. Dana jest prosta próba losowa po- brana z populacji jedno- czy więcejwymiarowej. Mamy (pozastatystyczne) powody sądzić, że g=g0, gdzie g0 jest znaną nam wartością, a g oznacza interesujący nas parametr populacji. Procedura weryfikacji obejmuje następujące kroki:

(6)

(1) postawić hipotezę H0(g=g0) wobec jednej z trzech hipotez alternatywnych:

H1(g≠g0) albo H1(g>g0) albo też H1(g<g0) (na ogół przyjmujemy H1(g≠g0));

(2) obliczyć wartość u odpowiedniej statystyki testowej U. Jeśli hipoteza H0 jest słuszna, to statystyka U podlega określonemu rozkładowi FU(u);

(3) przyjąć poziom istotności α i wiedząc, jaka jest hipoteza alternatywna H1, obliczyć jedną lub dwie wartości krytyczne (rys. 7.3) definiujące α·100% obszar krytyczny Skryt;

(4) jeśli obliczona z próby wartość u∈Skryt, to na poziomie istotności α są podstawy do odrzucenia testowanej hipotezy H0 i przyjęcia konkurencyjnej hipotezy H1. Jeśli u∉Skryt, to nie ma podstaw do odrzucenia H0, i zwykle jest ona przyjmowana za prawdziwą.

Rodzaje testów. Istnieje wiele testów statystycznych. Zasadniczo wyróżnia się dwie grupy:

(1) testy parametryczne oraz

(2) testy nieparametryczne (lub: zgodności).

Pierwsze z nich dotyczą hipotez określających jedynie wartości nieznanych para- metrów (rozkładu) zmiennej losowej; jeżeli natomiast specyfikujemy funkcję rozkładu badanej zmiennej, to mamy do czynienia z drugim przypadkiem.

7.2 PARAMETRYCZNE TESTY ISTOTNOŚCI

Dana jest prosta próba losowa {xi}, i=1,2,...,n. Wysuwamy hipotezę H0(g=g0), gdzie g jest badanym parametrem (cechy X) populacji, a g0 – postulowaną przez hipotezę wartością. Znajdujemy statystykę testową U(Ĝ,g) i na podstawie danej próby losowej obliczamy wartość u tej statystyki. Znajomość wartości u pozwala z kolei obliczyć wartość ĝ przybliżającą nieznaną wartość g, która według naszej hipotezy wynosi g0. Absolutna wartość różnicy ĝ-g0 powinna być oczywiście mała (tj. bliska zeru) albo mała (bliska jedynce) powinna być wartość ilorazu ĝ/g0, gdyż przeciwny przypadek jest argumentem przeciwko H0. Celem ustalenia, czy różnica ta jest duża, czy mała, należy wybrać przedział krytyczny Skryt dla statystyki U i stwierdzić, czy obliczona na podstawie próby wartość u do niego należy lub nie. Wybór przedziału krytycznego dokonywany jest na podstawie

(1) założonego poziomu istotności α testu i (2) postawionej hipotezy alternatywnej H1.

Po znalezieniu Skryt, co sprowadza się do znalezienia wartości krytycznych, sprawdza- my czy u należy do Skryt czy też nie i podejmujemy odpowiednią decyzję co do akcep- tacji H0.

Kolejne podrozdziały zawierają omówienie kilku ważniejszych testów parame- trycznych dla populacji jedno- i dwuwymiarowych.

(7)

7.2.1 Populacja jednowymiarowa. Testy dotyczące wartości średniej EX=µ: H0(µ=µ0)

Dana jest prosta próba losowa {xi}, i=1,2,...,n, pobrana z badanej populacji opisanej zmienną losową X. Testujemy hipotezę, że wartość średnia EX, oznaczana często literą µ, jest równa zadanej (znanej spoza statystyki) wartości µ0: H0(µ=µ0).

Populacja normalna N(µ,σ), σ znane. Badana populacja ma rozkład nor- malny N(µ,σ) ze znaną wartością σ. Do testowania hipotezy H0(µ=µ0) stosowana jest wtedy statystyka

X 0

U µ n

σ

= − (7.7)

podlegająca rozkładowi normalnemu N(0,1).

Przykład 7.1. Na torebce z cukrem znajdujemy napis: Masa(1000±5)g, co możemy interpretować jako twierdzenie producenta, że średnia

masa cukru w 1 torebce wynosi 1000 g z odchyleniem standardowym 5 g, co z kolei możemy opisać statystycz- nie np. w ten sposób, że maszyna rozważająca cukier do torebek robi to według rozkładu normalnego N(1000, 5).

Przyjmując to rozumowanie za poprawne, w celu zweryfikowania hipotezy H0(µ=1000 g) zważono na bar- dzo dokładnej wadze n=20 losowo wybranych torebek cukru i otrzymano średnią x = 996.2 g. Zadanie: Zwe- ryfikować H0(µ=1000 g) przyjmując poziom istotności α=5%.

Rozwiązanie. Ze wzoru (7.7) dostajemy wartość sta- tystyki testowej U wynosi u = (996.2-1000)/(5 20) = - 3.40. Przyjmując hipotezę alternatywną H1(µ ≠1000 g) (tzn., że będziemy odrzucać H0 jeśli wartość statystyki testowej będzie za duża lub za mała) otrzymujemy dwu- stronny 5% obszar krytyczny (por. rysunek górny na rys.

7.4) z ukryt(α=5%)=1.96. Ponieważ -3.40<-1.96 mamy podstawy do odrzucenia H0 na zadanym poziomie istot- ności α=5%. Wniosek: Na poziomie istotności α=5%

odrzucamy twierdzenie producenta.

Populacja normalna N(µ,σ), σ nieznane. Badana populacja ma rozkład normalny N(µ,σ) z nieznaną wartością σ. Stosujemy wtedy statystykę

0 1

t X n

S µ

= − − (7.8)

Rys. 7.4. Trzy rodzaje 5% obszaru krytycznego w rozkładzie normalnym N(0,1)

(8)

podlegającą rozkładowi t Studenta z ν=n-1 stopniami swobody.

Przykład 7.2. Na torebce z cukrem znajdujemy napis: Masa(1000±5)g, co możemy interpretować jako twierdzenie producenta, że średnia

masa cukru w 1 torebce wynosi 1000 g z błędem 5 g (nie wiadomo, czy 5 g to wartość odchylenia standardowego).

Interpretację tę możemy opisać statystycznie np. w ten sposób, że maszyna rozważająca cukier do torebek robi to według rozkładu normalnego N(1000, σ), gdzie σ nie jest znane. W celu zweryfikowania hipotezy H0(µ=1000 g) zważono na bardzo dokładnej wadze n=20 losowo wy- branych torebek cukru i na tej podstawie otrzymano średnią x = 996.2 g oraz odchylenie standardowe sX = 8.5 g. Zadanie: Zweryfikować H0(µ=1000 g) przyjmu- jąc poziom istotności α=5%.

Rozwiązanie. Ponieważ nie znamy σ, stosujemy wzór (7.8), skąd dostajemy wartość statystyki testowej t = (996.2-1000)/(8.5 19) = -1.95. Przyjmując hipotezę alternatywną H1(µ ≠1000 g) i poziom istotności α=5%, otrzymujemy 5% dwustronny obszar krytyczny (por.

rysunek górny na rys. 7.5) z tkryt(α=5%)=2.09. Ponieważ t=-1.95>-tkryt(α=5%)=-2.09 (czyli wartość statystyki testowej nie należy do obszaru krytycznego), nie mamy podstaw do odrzucenia H0 na zadanym poziomie istot-

ności α=5%. Wniosek: Na poziomie istotności α=5% przyjmujemy twierdzenie producenta.

Uwaga: Przyjęcie lewostronnego 5% obszaru krytycznego (co oznacza przyjęcie hipotezy alternatywnej H1(µ <1000 g), czyli – mówiąc kolokwialnie – że maszyna nie doważa) dałoby podstawę do innego wniosku, bo wartość krytyczna wyniosłaby tym razem tkryt(α=5%)=-1.725 (por. rysunek środkowy na rys. 7.5) a otrzymane t = -1.95 jest mniejsze od tkryt(α=5%).

Populacja o nieznanym rozkładzie, próba duża. Badana populacja ma nie- znany rozkład, a próba jest duża (najlepiej n=100 i więcej). Możemy wtedy użyć sta- tystyki

X 0

U n

S µ

= − (7.9)

która ma asymptotyczny rozkład normalny N(0,1).

Przykład 7.3. Na torebce z cukrem znajdujemy napis: Masa(1000±5)g, co możemy interpretować jako twierdzenie producenta, że średnia masa cukru w 1 torebce wynosi 1000 g z błędem 5 g. Interpretację tę możemy opisać statystycznie np. w ten sposób, że maszyna Rys. 7.5. Trzy rodzaje 5% obszaru krytycznego w rozkładzie Studenta (lss oznacza liczbę stopni swobody)

(9)

rozważająca cukier do torebek robi to według pewnego nieznanego rozkładu (producent nic na ten temat nie pisze). W celu zweryfikowania hipotezy H0(µ=1000 g), gdzie µ oznacza wartość oczekiwaną EX (X jest zbiorem możliwych rozważeń maszyny rozważająca cukier) zważono na bardzo dokładnej wadze n=100 losowo wybranych torebek cukru i na tej podstawie otrzymano średnią x = 997.9 g oraz odchylenie standardowe sX = 7.5 g. Zada- nie: Zweryfikować H0(µ=1000 g) przyjmując poziom istotności α=5%.

Rozwiązanie. Ze wzoru (7.9) dostajemy, że u = (997.9-1000)/(7.5 100) = -2.80. Przyjmu- jąc hipotezę alternatywną H1(µ ≠1000 g) dostajemy dwustronny obszar krytyczny (por. rysu- nek górny na rys. 7.4) z ukryt(α=5%)=1.96. Ponieważ -2.80<-1.96 mamy podstawy do odrzu- cenia H0 na zadanym poziomie istotności α=5%. Wniosek: Na poziomie istotności α=5%

odrzucamy twierdzenie producenta.

7.2.2 Populacja jednowymiarowa. Testy dotyczące wariancji σ2: H0202)

Populacja normalna. Badana populacja ma rozkład normalny N(µ,σ). Wtedy statystyka

2 2

2 0

χ nS

= σ (7.10)

podlega rozkładowi χ2 z n-1 stopniami swobody.

Przykład 7.4. Na torebce z cukrem znajdujemy napis:

Masa(1000±5)g, co możemy interpretować jako twier- dzenie producenta, że średnia masa cukru w 1 torebce wynosi 1000 g z błędem 5 g. Interpretację tę możemy opisać statystycznie np. w ten sposób, że maszyna rozważająca cukier do torebek robi to według rozkładu normalnego N(µ, σ), gdzie µ i σ nie są znane. W celu zwe- ryfikowania hipotezy H0(σ=5 g) zważono na bardzo dokładnej wadze n=20 losowo wybranych torebek cukru i na tej podstawie otrzymano odchylenie standardowe sX = 7.5 g. Zadanie: Zweryfikować H0(σ=5 g) przyjmując po- ziom istotności α=5%.

Rozwiązanie. Oczywiście, hipoteza H0(σ=5 g) jest rów- noważna hipotezie H02=52 g2)1, co pozwala stosować wzór (7.10), skąd (i z danych) dostajemy wartość statys- tyki testowej χ2 = (20⋅7.52)/52 = 45.0. Przyjmując hipotezę alternatywną H12≠52 g2), otrzymujemy z rozkładu χ2 o n-1 = 19 stopniach swobody dwustronny obszar krytyczny

1 To „oczywiście” jest na wyrost, bo w ogólności tak nie musi być.

Rys. 7.6. Trzy rodzaje 5% obszaru krytycznego w rozkładzie χ2 (lss oznacza liczbę stopni swobody)

(10)

Skryt= (-∞,8.9) ∪ (32.9,∞) (por. rysunek górny na rys. 7.6), gdzie 8.9 to 2.5% kwantyl w roz- kładzie χ2 z 19 stopniami swobody, a 32.9 to 97.5% kwantyl w tymże rozkładzie. Ponieważ 45.0>32.9 (χ2∈Skryt czyli wartość statystyki testowej należy do obszaru krytycznego), mamy podstawy do odrzucenia H0 na zadanym poziomie istotności α=5%. Wniosek: Na poziomie istotności α=5% σ ≠5 g (błąd rozważania cukru nie wynosi 5 g).

Populacja o nieznanym rozkładzie, próba duża. Badana populacja ma nieznany rozkład, a próba jest duża (n=100 i więcej [Krysicki i inni (*)]). Możemy wtedy użyć statystyki

2 2

1 0

2

0 2

Sn n

U σ

σ

= (7.11)

mającej asymptotyczny rozkład normalny N(0,1). Symbol Sn21oznacza wariancję w próbie liczoną ze współczynnikiem 1/(n-1).

Przykład 7.5. Na torebce z cukrem znajdujemy napis: Masa(1000±5)g, co możemy interpretować jako twierdzenie producenta, że średnia masa cukru w 1 torebce wynosi 1000 g z błędem 5 g. Interpretację tę możemy opisać statystycznie np. w ten sposób, że maszyna rozważająca cukier do torebek robi to według nieznanego rozkładu. W celu zweryfikowania hipotezy H0(σ=5 g) (gdzie σ jest odchyleniem standardowym) zważono na bardzo dokładnej wadze n=100 losowo wybranych torebek cukru i na tej podstawie otrzymano odchylenie stan- dardowe sn-1 = 6.5 g. Zadanie: Zweryfikować H0(σ=5 g) przyjmując poziom istotności α=5%.

Rozwiązanie. Przyjmijmy, że hipoteza H0(σ=5 g) jest równoważna hipotezie H02=52 g2), co pozwala stosować wzór (7.11), skąd (i z danych) dostajemy wartość statystyki testowej U = [(6.52-52)/52](100/2)1/2= 4.88. Przyjmując hipotezę alternatywną H12≠52 g2) (będziemy więc mieć dwustronny obszar krytyczny) i α=5% poziom istotności otrzymujemy z rozkładu N(0,1) ukryt(α=5%)=1.96. Ponieważ 4.88>1.96 (czyli wartość statystyki testowej należy do obszaru krytycznego), mamy podstawy do odrzucenia H0 na zadanym poziomie istotności α=5%. Wniosek: Na poziomie istotności α=5% σ ≠5 g (błąd rozważania cukru nie wynosi 5 g)

7.2.3 Populacja dwuwymiarowa. Testy równości średnich dwu populacji H012)

Populacje normalne ze znanymi odchyleniami standardowymi. Mamy dwie populacje normalne: N(µ11) i N(µ22) ze znanymi odchyleniami standardo- wymi, odpowiednio σ1 i σ2. Interesuje nas problem równości średnich badanych populacji – stawiamy hipotezę H01= µ2). Użyteczną jest w tym przypadku statystyka

(11)

1 2

2 2

1 2

1 2

X X U

n n

σ σ

= − +

(7.12)

o rozkładzie normalnym N(0,1). Liczby n1 i n2 są liczebnościami dwu danych prostych prób.

Przykład 7.6. Mamy dwie wagi ważące z różnymi dokładnościami: σ1 = 5 g i σ2=6 g.

Podejrzewamy, że waga 2 nieco przeważa. Aby to sprawdzić, wykonujemy dwie serie ważeń tej samej masy: pierwszą serię o liczebności n1=30 za pomocą wagi 1 oraz drugą serię o liczebności n1=50 za pomocą wagi 1 i dostajemy wyniki odpowiednio średnie: m1 = 425.7 g oraz m2 = 428.5 g. Zadanie: Zweryfikować hipotezę H01 = µ2) wobec hipotezy alternatyw- nej H11 < µ2) przyjmując poziom istotności α=5%.

Rozwiązanie. Przyjmijmy, że rozkład wyników ważenia przez pierwszą i drugą wagę podlega rozkładom normalnym spełniającym założenia potrzebne do stosowania wzoru (7.12) Podstawiając do niego posiadane dane dostajemy wartość statystyki testowej U = (425.7–

428.5)/(52/30+62/50)1/2= -2.25. Przyjęcie hipotezy alternatywnej H11 < µ2) i poziomu istot- ności α=5% oznacza przyjęcie jednostronnego obszaru krytycznego Skryt = (-∞, -1.645) (por.

rysunek środkowy na rys. 7.4). Ponieważ –2.25<-1.645 (czyli wartość statystyki testowej należy do obszaru krytycznego), mamy podstawy do odrzucenia H0 na zadanym poziomie istotności α=5%. Wniosek: Waga 2 przeważa (na poziomie istotności α=5%).

Populacje normalne z nieznanym identycznym odchyleniem standar- dowym. Jeśli populacje, z których pochodzą n1 i n2-elementowe proste próby mają rozkłady normalne, odpowiednio: N(µ1, σ) i N(µ2, σ), z nieznaną wspólną wartością σ, to do testowania hipotezy H012) służy statystyka

1 2

2 2

1 1 2 2

1 2 1 2

1 1

2 X X U

n S n S

n n n n

= −

 

+  + 

+ −  

(7.13)

o rozkładzie Studenta z ν = n1+n2-2 stopniami swobody.

Przykład 7.7. Zweryfikować na poziomie istotności α=5% hipotezę, że długość pewnego elementu nie uległa zmianie po obróbce, jeśli wiemy, że 10 pomiarów długości tego elementu przed obróbką dały wyniki: x1=15.0 mm, s1=0.54 mm, natomiast odpowiednie wartości obli- czone na podstawie 12 pomiarów wyniosły odpowiednio x2=15.2 mm, s2=0.48 mm. Wiado- mo też, że wszystkie pomiary wykonano tym samym przyrządem o nieznanej dokładności (niestety, tylko taki był do dyspozycji).

Rozwiązanie. Przyjmijmy hipotezę alternatywną H11≠µ2). Ponieważ pomiary wykonano tym samym przyrządem, możemy przyjąć, że w obu przypadkach (przed i po obróbce) σ jest

(12)

taka sama. Przyjmijmy też, że rozkład wyników pomiaru przez przyrząd podlega rozkładowi normalnemu z parametrem µ zależnym od wielkości mierzonej i drugim parametrem σ.

Możemy więc stosować wzór (7.13). Podstawiając do niego posiadane dane dostajemy wartość statystyki testowej U = (15.0-15.2)/[(10⋅0.542+12⋅0.482/12)(1/10+1/12)/(10+12-2)]1/2= -0.88.

Przyjęcie hipotezy alternatywnej H11≠µ2) i poziomu istotności α=5% oznacza przyjęcie dwustronnego obszaru krytycznego Skryt = (-∞,-2.09)∪(2.09,∞) (por. rysunek górny na rys.

7.5). Ponieważ -2.09<0.88<2.09 (czyli wartość statystyki testowej nie należy do obszaru krytycznego), nie mamy podstaw do odrzucenia H0 na zadanym poziomie istotności α=5%.

Wniosek: Długość mierzonego elementu nie zmieniła się po obróbce (na poziomie istotności α=5%).

Populacje normalne z nieznanymi odchyleniami standardowymi. Jeśli populacje, z których pochodzą n1 i n2-elementowe proste próby mają rozkłady normalne, odpowiednio: N(µ11) i N(µ22), z nieznanymi wartościami σ1 i σ2, to kolejność postępowania jest następująca:

(1) testujemy hipotezę o równości wariancji F1=F2 (patrz rozdział następny (7.2.4));

(2) jeśli test wypadnie pozytywnie, tzn. możemy przyjąć równość F1=F2, to wyko- rzystujemy równanie (7.13);

(3) jeśli natomiast test równości wariancji σ12 wypadnie negatywnie, to sytuacja się bardzo komplikuje.U niektórych autorów problem ten nie jest w ogóle porusza- ny; inni, jak np. de Groot [6], uważają, że problem ten nie ma na razie rozwiązania, gdyż proponowane wyjścia są zbyt dyskusyjne. Natomiast Zieliński i Zieliński [34] zamieszczają stosowny test bez żadnego ostrzeżenia.

7.2.4 Populacja dwuwymiarowa. Testy równości wariancji dwu populacji H012 = σ ) 22

Jeśli populacje, z których pochodzą n1 i n2-elementowe proste próby, mają rozkłady normalne, odpowiednio: N(µ1, σ) i N(µ2, σ), z nieznaną wspólną wartością σ, to do testowania hipotezy o równości wariancji obu populacji, H01222), służy statystyka

2 1

2 2

F S

= S%

% (7.14)

o rozkładzie F Snedecora z (n1-1, n2-1) stopniami swobody. Użyte powyżej symbole oznaczają

2 2 2 2

1 2

, 1, 2, 1

i

i i

i

S n S i S S

= n = >

% − % %

(7.15) Wartości krytyczne rozkładu F dla wybranych par stopni swobody są zamieszczone w Dodatku A (tabela 5).

(13)

Przykład 7.8. Zweryfikować na poziomie istotności α=5% hipotezę, że dokładność pew- nego termometru zmieniła się po upływie 1 roku, jeśli wiadomo, że przed rokiem odchylenie standardowe, obliczone na podstawie 10 pomiarów temperatury wynosiło s% =0.09°C, a po 1 roku s% =0.11°C (15 pomiarów). 2

Rozwiązanie. Przyjmijmy hipotezę alternatywną H112≠σ22). Przyjmijmy też, że rozkład wyników pomiaru przez przyrząd podlega rozkładowi normalnemu z parametrem µ zależnym od wielkości mierzonej i drugim parametrem σ. Możemy więc stosować wzór (7.14). Podsta- wiając do niego posiadane dane dostajemy wartość statystyki testowej (7.14): F = (s% /1 s% )2 2 = (0.09/0.11)2 = 0.669. Przyjęcie hipotezy alternatywnej H1 i poziomu istotności α=5% oznacza przyjęcie dwustronnego obszaru krytycznego Skryt = (0,Fkryt(97.5%|n1=10-1)) ∪ (Fkryt(2.5%|n2=15-1), ∞) = (0;0.263) ∪( 2.209,∞). Ponieważ 0.263<0.669<3.209 (czyli war- tość statystyki testowej nie należy do obszaru krytycznego), nie mamy podstaw do odrzucenia H0 na zadanym poziomie istotności α=5%. Wniosek: Dokładność badanego termometru nie zmieniła się po upływie 1 roku (na poziomie istotności α=5%).

7.2.5 Populacja dwuwymiarowa. Test istotności współczynnika korelacji H0(ρ=0)

Dana jest dwuwymiarowa prosta próba losowa {xi,yi}, i=1,2,...,n, pobrana z dwu- wymiarowej populacji normalnej (X,Y). Interesuje nas, czy zmienne te są skorelo- wane, czyli czy możemy uważać, że współczynnik korelacji pomiędzy tymi zmiennymi ρ…0, czy też możemy uważać, że zmienne te są nieskorelowane: ρ=0. W tym celu:

(A) stawiamy hipotezę H0(ρ=0) wobec hipotezy alternatywnej H1 (na ogół H1(ρ…0)), (B) obliczamy współczynnik korelacji z próby:

1

1 ( )( )

n

i i

i

X Y

x x y y r n

s s

=

− −

=

(7.16) Jeśli hipoteza H jest słuszna, to, jak wiemy z rozdziału 5.3.6, statystyka t:

2 2

1

t R n

R

= −

− (7.17)

podlega rozkładowi t Studenta o n-2 stopniach swobody.

(C) zakładamy poziom istotności α i stosując definicję obliczamy wartości krytyczne t1 i t2, które są w tym przypadku równe co do wartości bezwzględnej: -t1=t2, gdyż rozkład t jest symetryczny względem wartości t=0. Oznaczmy t2 symbolem tkryt(α,n-2), wskazującym że wartość ta zależy od poziomu istotności α oraz parametru n-2 rozkładu t. Jeśli nasza hipoteza jest słuszna, to powinna zachodzić nierówność:

(14)

| |t <tkryt( ,α n−2) (7.18) gdzie t jest obliczone wzorem (7.17). Nierówność jest równoważna innej nierówności:

| |r <rkryt( ,α n−2) (7.19) którą możemy łatwo otrzymać przez odpowiednią kombinację wzorów (7.17) i (7.18). Wartość rkryt(α, n-2) jest krytyczną wartością współczynnika korelacji.

(D) jeśli nierówność (7.18) lub (7.19) nie zachodzi, to uważamy, że na poziomie istotności " nie możemy zaakceptować hipotezy zerowej, czyli że ρ…0, a więc istnieje korelacja pomiędzy badanymi zmiennymi X i Y.

Jest to najczęstsza metoda badania współzależności zmiennych losowych. (Patrz też rozdział 7.2.6: test istotności współczynnika regresji liniowej pomiędzy zmiennymi losowymi (X,Y)).

7.2.6 Populacja dwuwymiarowa. Test istotności współczynnika regresji liniowej α pomiędzy zmiennymi losowymi (X,Y): H0(α=0).

Jeżeli populacja, z której pobrano próbę, podlega dwuwymiarowemu rozkładowi normalnemu o (prawdziwej nieznanej) funkcji regresji E(Y|x) = αx+β, z której wyzna- czono funkcję regresji z próby Yśr = Ax+B, to do testowania hipotezy H0(α=0) możemy stosować statystykę

2

2 1

X

Y

S n t A

S R

= ⋅ −

− (7.20)

podlegającą rozkładowi Studenta o n-2 stopniach swobody. A jest kierunkowym współczynnikiem z próby: A=R·SY/SX, R współczynnikiem korelacji z próby (5.32), a SX i SY są odchyleniami standardowymi z próby (5.17) odpowiednio zmiennych X i Y. Test ten możemy stosować w charakterze testu niezależności liniowej zmiennych X i Y, gdyż przyjęcie hipotezy α=0 oznacza brak statystycznej współzależności (liniowej) pomiędzy zmiennymi.

7.3 TESTY ZGODNOŚCI

Dana jest prosta próba losowa {xi}, i=1,2,...,n. Stawiamy hipotezę H0: Prawdziwy (nieznany) rozkład F(x) zmiennej losowej X ma postać Fteor(x), co w skrócie zapi- sujemy: H0(F(x)/Fteor(x)), gdzie funkcja Fteor, zwana rozkładem teoretycznym, jest dana. Aby zweryfikować H0 na danym poziomie istotności α (z reguły α=0.05 albo 0.01) budujemy statystykę U będącą miarą rozbieżności pomiędzy rozkładem z próby (np. dystrybuantą empiryczną) a rozkładem przyjętym w hipotezie, tzw. rozkładem teoretycznym, (np. dystrybuantą teoretyczną). Jeśli badana hipoteza jest słuszna, to

(15)

statystyka U, będąca miarą tej rozbieżności, powinna przyjąć wartość bliską zeru. Gdy wartość ta jest dużo większa od zera, to uważamy ten fakt za przesłankę fałszywości hipotezy.

Statystyka testowa U ma znany rozkład dokładny albo asymptotyczny (tzn. obli- czony, gdy liczebność próby n64) – na tej podstawie dla zadanego α (poziomu istot- ności testu) wyznaczamy wartość krytyczną ukryt(α) statystyki U definiującą obszar krytyczny. Dalej należy postępować jak to opisano na końcu rozdziału 7.1, tzn. jeśli obliczona z próby wartość u# statystyki U jest mniejsza od ukryt(α), to nie mamy podstaw na poziomie istotności α do odrzucenia hipotezy; gdy jest przeciwnie, hipotezę odrzucamy.

7.3.1 Test λλλλ Kołmogorowa

Dana jest prosta próba losowa {xi}, i=1,2,...,n. Stawiamy hipotezę H0(F(x) / Fteor(x)). Wykreślamy na jednym wykre- sie dystrybuantę empiryczną Femp i dystry- buantę założonego rozkładu („teoretyczne- go”) Fteor(x) (rys. 7.7). Obliczamy dla każdego punktu xi (lub, jeśli próba jest uporządkowana, to x(i)) próby losowej wartość bezwzględną różnicy powyższych dystrybuant i znajdujemy największą taką różnicę Dmax:

max ( ) ( )

i

max emp i teor i

x

D = F xF x (7.21)

Znaleziono dokładny rozkład tej statystyki; tablice z wartościami krytycznymi podane są w każdych większych tablicach statystycznych (np. Zieliński i Zieliński [34]).

Często korzysta się z granicznego rozkładu statystyki U zdefiniowanej następującym wzorem:

n Dmax

λ= ⋅ (7.22)

Rozkład tej statystyki nazywa się – od nazwiska jego autora – rozkładem Kołmogoro- wa. Najczęściej stosowane krytyczne (asymptotyczne) wartości λkryt(") wynoszą dla α

= 0.05 i α = 0.01 odpowiednio: λkryt = 1.36 i λkryt = 1.63. Liczby te mogą być stosowane dla dużych n (Cox i Lewis [4] podają, że wartości tych można używać dopiero dla n>100). W praktyce asymptotyczny rozkład Kołmogorowa stosuje się dla mniejszych liczebności

Ważna uwaga. Wszystkie omówione testy zgodności oparte są na założeniu, że hipoteza zerowa określa całkowicie badany rozkład prawdopodobieństwa, tzn. poda-

Rys. 7.7. Statystyka Dmax testu zgodności λ Kołmo- gorowa

Fteor(x) Femp(x)

(16)

jemy nie tylko funkcję Fteor, ale także wartości liczbowe jej parametrów (przypadek A).

Praktyka wygląda inaczej: parametry tej funkcji zwykle estymujemy (przypadek B).

Oznacza to, że testowanie takie nie jest całkiem poprawne (pewnym wyjątkiem jest tutaj test zgodności χ2 dla poziomów istotności α=5% i 1%).

W ostatnich latach, korzystając z możliwości, jakie stwarza komputer, bada się empirycznie wpływ estymacji parametrów rozkładu na wartości krytyczne statystyk testowych. Okazuje się, że różnice pomiędzy wartościami teoretycznymi, otrzy- manymi w przypadku (A), a wartościami krytycznymi, otrzymanymi dla przypadku (B), są często znaczące. Przykład takich różnic oparty na pracy Węglarczyka (1993) podany został w tabeli 7.1.

Tabela 7.1. Obniżenie wartości krytycznych statystyki (7.22) testu Kołmogorowa wskutek estymacji parametrów rozkładu (za: Węglarczyk (1993))

Wartości krytyczne λn(α) testu Kołmogorowa parametry

rozkładu znane

parametry rozkładu estymowane (metoda największej wiarygodności)

Poziom istotności α testu

Kołmogorowa

rozkład dowolny rozkład

lognormalny rozkład gamma

0.10 1.22 0.80 ± 0.01 0.81 ± 0.03

0.05 1.36 0.87 ± 0.02 0.88 ± 0.03

0.01 1.63 1.00 ± 0.03 1.03 ± 0.04

Przykład 7.9. Wykorzystanie testu Kołmogorowa. Zweryfikować na poziomie istotności α=5% hipotezę, że rozkład długości X cyklu liczby plam słonecznych jest rozkładem normalnym: H0(FX(x)=N(µ,σ), gdzie

parametry µ i σ rozkładu wyznaczone są z próby danej w tabeli 7.2.

Rozwiązanie. Estymatorami para- metrów µ i σ są wartość średnia z próby,

x, i odchylenie standardowe z próby, s.

Korzystając z danych zawartych w tabeli 7.2. otrzymujemy x=11.06 lat i s = 1.51 lat. Wykorzystując te wartości i tablicę 1A (Dodatek A) wartości Φ(u) dystrybuanty standaryzowanego rozkładu normalnego, możemy obliczyć wszystkie różnice |i/n- FX(x; x, s)| i |(i-1)/n-FX(x; x, s)|, i=1,2, ...,n, których maksimum Dmax służy do obliczenia wartości statystyki testowej λ =

Rys. 7.8. Dystrybuanty: teoretyczna (rozkład normal- ny) i empiryczna długości cyklu liczby plam słonecz- nych i maksymalna odległość Dmax pomiędzy nimi.

(17)

Dmaxn.

Inny sposób, często szybszy, jest zilustrowany na rys. 7.8: wykreślamy obie dystrybuanty:

dystrybuantę empiryczną i dystrybuantę rozkładu normalnego FX(x; x, s) w zakresie zmienności [8,15] zmiennej X obejmującym dane i z wykresu znajdujemy Dmax = 0.104, skąd mamy λ = 0.605. Jeśli – jak to się na ogół stosuje – do znalezienia wartości krytycznej λkryt

przyjmiemy asymptotyczny rozkład Kołmogorowa, to otrzymamy, λkryt = 1.36. Ponieważ 0.605<1.36, nie ma podstaw do odrzucenia H0, co sprowadza się do ostatecznej konkluzji:

rozkład długości X cyklu liczby plam słonecznych jest na poziomie istotności 5% rozkładem normalnym o parametrach µ =x = 11.06 lat i σ = s = 1.51 lat.

Tabela 7.2. Zmierzone długości cyklu liczby plam słonecznych w latach 1615-1980

(Minima und Maxima der Sonnenfleckenzyklen 1610 bis 1989)

Lp rok

maksimum

długość cyklu,

lata Lp rok

maksimum

długość

cyklu, lata Lp rok maksimum

długość cyklu, lata

1 1615.5 8.2 13 1750.3 10.2 25 1883.9 10.7

2 1626.0 15.0 14 1761.5 11.3 26 1894.1 12.1

3 1639.5 11.0 15 1769.7 9.0 27 1907.0 11.9

4 1649.0 10.0 16 1778.4 9.2 28 1917.6 10.0

5 1660.0 11.0 17 1788.1 13.6 29 1928.4 10.2

6 1675.0 13.5 18 1805.2 12.3 30 1937.4 10.4

7 1685.0 10.0 19 1816.4 12.7 31 1947.5 10.1

8 1693.0 8.5 20 1829.9 10.6 32 1957.9 10.6

9 1705.5 14.0 21 1837.2 9.6 33 1968.9 11.6

10 1718.2 11.5 22 1848.1 12.5 34 1979.9 10.3

11 1727.5 10.5 23 1860.1 11.2

12 1738.7 11.0 24 1870.6 11.7

7.3.2 Test χ2 Pearsona

Idea testu. Dana jest prosta próba losowa {xi}, i=1,2,...,n. Stawiamy hipotezę H0(F(x)/Fteor(x)). Cały obszar zmienności zmiennej losowej X dzielony jest na r przedziałów ∆xj = (ξj – ξj-1), j=1,2, ..., r (ξ0 może być równe -4, a ξr

+4). Każdy z tych przedziałów zawiera mj, j=1,2,...,r, punktów próby losowej {xi} (rys. 7.9). Jeśli hipoteza H0 jest prawdziwa, to możemy obliczyć prawdopodobieństwo πj

Rys. 7.9. Ilustracja testu χ2 Pearsona dla 10- elementowej próby losowej.

π4=1 π3=1/

π2=1/

m2=4 m3=1 m4=3 m1=2

(18)

P( ) ( ) ( 1), 1, 2,...

πj= X∈ ∆xj =Fteor ξjFteor ξj j= r (7.23) że zmienna losowa przyjmie jedną wartość z danego przedziału ∆xj, j=1,2,...,r. W j- tym przedziale powinno znajdować się średnio n⋅πj punktów. Z drugiej strony wiemy, że znajduje się tam mj wartości z próby. Możemy więc obliczyć r różnic mj – n⋅πj. Im bardziej są one bliskie zera tym lepiej dla prawdziwości H0. Statystyka testowa U, oznaczana symbolem χ2, jest właśnie funkcją tych różnic:

2 2

1

( )

ozn r

i i

i i

m n

U n

χ π

= π

= =

(7.24)

i – w przypadku idealnym – zeruje się jeśli wszystkie różnice mj – n⋅πj są jednocześnie równe zero. Statystyka χ2 ma graniczny rozkład χ2 z ilością stopni swobody ν równą ν

= r-1-c, gdzie c jest liczbą estymowanych parametrów rozkładu Fteor(x). Jeśli zadamy poziom istotności testu, α, to możemy obliczyć wartość krytyczną χ2(α,ν) (np.

Dodatek A, tabela 4). Jeśli obliczona wartość χ2 jest taka, że χ2 < χ2kryt, to akceptujemy badaną hipotezę; w przypadku przeciwnym – odrzucamy ją.

Dwa sposoby definiowania przedziałów ∆xi. Istnieją dwa sposoby definio- wania przedziałów ∆xi:

(1) sposób bezpośredni, polegający na tym, że testujący sam definiuje te przedziały.

Jest przy tym zalecane, aby były one (poza może skrajnymi) równe, a liczba punktów z próby w każdym z nich nie powinna być mniejsza od 5 – 10 (liczba ta trochę zależy od cytowanego autora).

(2) sposób pośredni, według identycznych prawdopodobieństw: testujący ustala liczbę przedziałów na osi prawdopodobieństw, a stąd wyznacza dalej przedziały

∆x (p. rys. 7.9). Ten sposób ma pewną przewagę nad (1): minimalna dopuszczalna liczebność punktów empirycznych w danym przedziale może wynosić nawet 1 (Fisz [11]).

Uproszczony wzór na statystykę testową w przypadku podziału według równych prawdopodobieństw. Jeśli podział zakresu zmienności zmiennej X na przedziały jest dokonywany według równych prawdopodobieństw, to wzór można uprościć. Mamy bowiem

1, 1, 2,...,

i i r

π = r = (7.25)

skąd (i z (7.24)) dostajemy dalej:

2 2 2

2 2

2

1 1 1

2 2 2

1 1 1 1 1

( ) ( / )

/ 2

2 2

r r r

i i i

i i

i i i i

r r r r r

i i i i

i i i i i

m n m n r r n n

m m

n n r n r r

r n r r

m m m n n m n

n r n n

χ π

= π = =

= = = = =

 

− −

= = =  − + 

 

= − + = − + = −

∑ ∑ ∑

∑ ∑ ∑ ∑ ∑

(7.26)

(19)

Przykład 7.10. Wykorzystanie testu χ2 Pearsona. Zadanie identyczne, jak w przykładzie 7.9: zweryfikować na poziomie istotności α=5% hipotezę, że rozkład długości X cyklu liczby plam słonecznych jest rozkładem normalnym: H0(FX(x)=N(µ,F), gdzie parametry µ i σ rozkładu wyznaczone są z próby danej w tabeli 7.2. Przyjąć metodę dzielenia zakresu zmiennej X według równych prawdopodobieństwa i niech liczba przedziałów r = 5.

Rozwiązanie. Punkty podziału za- kresu zmienności zmiennej X według równych prawdopodobieństw to kwan- tyle ξ20%, ξ 40%, ξ 60% i ξ 80% (bo πi = 1/r = 1/5 = 0.2) rozkładu normalnego FX(x;x ,s). Są to liczby 9.785, 10.676, 11.442 oraz 12.332 lat (rys. 7.10). Zli- czamy liczby mi, i=1,2,...,r, punktów xj, j=1,2,...,n, próby losowej w kolejnych przedziałach (ξ i-1, ξ i) (ξ0=0 z definicji, jako długość) i dostajemy wartości: 5, 11, 6, 6, 6. Mamy teraz już wszystkie dane do wykorzystania wzoru (7.26), skąd dostajemy P2 = 3.353. Z tablic

wartości krytycznych rozkładu χ2 (Dodatek A, tabela 4) odczytujemy χ2kryt(α=5%,<=r-1-c, c=liczba parametrów rozkładu estymowanych z próby=2) = χ2kryt("=5%,<=r-1-2) = χ2kryt(α=5%,<=2) = 5.991. Ponieważ 3.353 < 5.991, nie ma podstaw do odrzucenia H0, co sprowadza się do ostatecznej konkluzji: rozkład długości X cyklu liczby plam słonecznych jest na poziomie istotności 5% rozkładem normalnym o parametrach µ = x= 11.06 lat i σ = s = 1.51 lat.

Uwaga do przykładów 7.9 i 7.10. W powyższym przykładzie otrzymaliśmy wynik taki sam jak w przykładzie z testem Kołmogorowa. Wydawać by się mogło, że jest to oczywiste: jeśli posiadane dane wskazują w jakimś sensie na prawdziwość testowanej hipotezy, to wskazują na tę prawdziwość także w innym sensie. Tym- czasem jest to prawda tylko w jednym wypadku: jeśli stosowane testy są równoważne (tzn. jeśli oba są czułe w ten sam sposób na odstępstwa od testowanej hipotezy). W praktyce oczywiście jest inaczej i choć należy spodziewać się identycznych wyników w przypadku stosowania kilku testów zgodności, to jednak wcale tak być nie musi.

7.3.3 Test ω2 Craméra-von Misesa

Jeśli Fteor(x) jest założoną dystrybuantą teoretyczną, proponowaną przez testującego (rys. 7.11), to w przypadku testu ω2 miara rozbieżności pomiędzy nią a rzeczywistością reprezentowaną przez prostą próbę losową ma następującą, trochę skomplikowaną, postać:

Rys. 7.10. Test χ2 Pearsona: podział zakresu zmiennej X według równych prawdopodobieństw

(20)

2 2

2 ( ) 1

1 1 2 1

( )

12 2

n

teor i i

F x i

n n n

ω

=

 − 

= +  − 

 

(7.27)

gdzie x(i) jest i-tym elementem uporządkowanej rosnąco próby losowej, a stosowana statystyka testowa U

U =nω2 (7.28) jest statystyką bezparametrową (tzn. jej rozkład nie posiada żadnych parametrów, podobnie jak asymptotyczny rozkład Koł- mogorowa) i jej (asymptotycz- ne) wartości krytyczne są nastę- pujące: ukryt(α=5%) = 0.4614 i ukryt(α=1%) = 0.7435. Ponieważ wartości ukryt liczone były dla asymptotycznego rozkładu zmiennej U, test powyższy po-

winien być stosowany dla dużych n, praktycznie dla n>20 [4].

Przykład 7.11. Wykorzystanie testu ω2 Craméra-von Misesa. Dla tego samego zadania i tych samych danych, jak w obu przykładach poprzednich, dostajemy, że wartość ω2

= 0.0020, skąd mamy u = n@ω2 = 0.0679, co jest wartością mniejszą od ukryt(α=5%) = 0.4614.

Wynik testu jest więc taki sam, jak w obu poprzednich przykładach: nie ma podstaw do odrzucenia H0.

7.4 PORÓWNANIE JAKOŚCI DOPASOWANIA WIELU FUNKCJI ROZKŁADU

Problematyka tego podrozdziału wiąże się problemem poszukiwania rozkładu prawdopodobieństwa badanej zmiennej losowej na podstawie danej próby losowej.

Jeśli przyjęliśmy jeden rozkład teoretyczny, to po estymacji jego parametrów i pozytywnym przetestowaniu testem zgodności rozkład ten akceptujemy. Gdy test zgodności daje podstawy do odrzucenia proponowanego rozkładu, musimy zacząć od początku.

W sytuacji, gdy dla danej zmiennej losowej poszukujemy rozkładu spośród pewnej grupy rozkładów i test(y) zgodności pozostawił(y) więcej niż jeden rozkład, istnieje

Rys. 7.11. Ilustracja testu zgodności ω2 Craméra-von Misesa (liczby 1,2,...,10 na osi x są numerami i kolejnych wartości x(i)).

Rys. 7.12.

Fteor(x)

Femp(x)

2 1 2 8 1 15

0.75

2 2 10 20

i n

⋅ −

= = =

(21)

potrzeba porównania jakości tych rozkładów celem wybrania najlepszego spośród nich.

Jeśli ilość parametrów rozkładów jest taka sama, możemy porównywać wartości funkcji wiarygodności tych rozkładów (Kaczmarek [15]). Gdy tak nie jest – możemy użyć kryterium Akaike minimum informacji (Woolhiser i Roldan [29]).

7.4.1 Porównanie wartości funkcji wiarygodności

Jeśli mamy dane dwa rozkłady o funkcjach gęstości f1(x;g1,g2, ..., gp) i f2(x;h1,h2,...,hq) o równej liczbie parametrów, p=q, to liczymy dla nich wartość funkcji wiarygodności Li, lub ich logarytmy lnLi, i=1,2, i porównujemy je ze sobą. Jeśli np.

L2>L1, to przyjmujemy rozkład nr 2 za rozkład lepiej od rozkładu nr 1 odwzorowujący nieznany prawdziwy rozkład zmiennej losowej X.

Przykład 7.12.

7.4.2 Kryterium minimum informacji Akaike

W sytuacji, gdy ilość parametrów stosowanych funkcji rozkładu f1(x;g1,g2, ..., gp) i f2(x;h1,h2,...,hq) nie jest taka sama (p≠q), kryterium poprzednie nie jest stosowalne.

Bardzo użyteczne jest wtedy kryterium minimum informacji Akaike, AIC, które dla potrzeb praktycznych można zapisać następująco:

(

ˆ1 ˆ2 ˆ

)

2 ln , ,..., 2

i i ki i

AIC = − L g g g + k (7.29)

gdzie Li jest wartością funkcji wiarygodności danego i-go rozkładu, a ki – liczbą jego parametrów. Ten rozkład jest najlepszy z punktu widzenia tego kryterium, którego wartość AIC jest najmniejsza. Kryterium to bierze pod uwagę liczbę parametrów estymowanego rozkładu w ten sposób, że jeśli dwa rozkłady mają dla danej próby prawie identyczne wartości funkcji wiarygodności, to lepszy jest rozkład z mniejszą liczbą parametrów.

Przykład 7.13.

Cytaty

Powiązane dokumenty

Zakładając, że rozkład wykonania normy jest w obu zakładach zbliżony do rozkładu normalnego i wiedząc, że test równości wariancji wykonany dla powyższych próbek nie pozwolił

Za pomocą testu chi-kwadrat niezależności, przyjmując poziom istotności 0,05, zbadaj czy płeć telewidza i rodzaj seriali przez niego oglądanych są niezależne..

W rezultacie, jeśli przed T nie było ani jednego „zdarzenia”, to sztucznie przyjmujemy że momentem ostatniego zdarzenia było

testowa wartość krytyczna p-value poz... testowa wartość krytyczna

Zbiór funkcji nieparzystych oznaczymy literą N, natomiast zbiór funkcji parzystych - literą P..

zyka niż człowieka, wtedy jednak powoływałoby się do istnienia nową total ­ ność, na gruncie której możliwa byłaby ciągła historia, historia dyskursu jako nauka

13. Mamy 2n kartek ponumerowanych liczbami od 1 do 2n oraz 2n podobnie ponumerowanych kopert. Wkładamy losowo po jednej kartce do każdej koperty. Jakie jest prawdopodobieństwo tego,

Proszę rozważyć jednostajnie przyspieszoną cząstkę, która porusza się w płaszczyźnie (t, x) w przestrzeni Minkowskiego, tzn.. Proszę znaleźć pęd fotonu