p-wartość
Idea
Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy
weryfikowali hipotezę mówiącą, że jego „prawdziwa” wartość nie różni się istotnie od zadanej wartości, co zapisujemy:
θ = θ 0 ,
gdzie θ 0 jest ustalone. Poza samą hipotezą (nazywać ją będziemy
hipotezą zerową) musimy jeszcze podać hipotezę alternatywną,
czyli ustalić jaka jest nasza decyzja w przypadku odrzucenia
hipotezy zerowej. Przykładowo, dla hipotezy zerowej H 0 : θ = θ 0 ,
możliwe są następujące alternatywy: H 1 : θ ∕= θ 0 , H 1 : θ > θ 0 lub
H 1 : θ < θ 0 .
p-wartość
Przykładowe układy hipotez
1
Hipoteza zerowa: wartość oczekiwana (średnia) badanej cechy nie różni się istotnie od 2. Hipoteza alternatywna: wartość oczekiwana (średnia) badanej cechy jest istotnie większa od 2.
2
Hipoteza zerowa: wartości oczekiwane (średnie) badanej cechy w dwóch grupach nie różnią się istotnie. Hipoteza
alternatywna: wartości oczekiwane (średnie) badanej cechy w dwóch grupach różnią się istotnie.
3
Hipoteza zerowa: nie ma istotnej zależności pomiędzy dwoma
badanymi cechami. Hipoteza alternatywna: istnieje istotna
zależność pomiędzy dwoma badanymi cechami.
p-wartość
Konstruując procedurę testową wyznaczamy tzw. obszar krytyczny (obszar odrzuceń hipotezy zerowej). Najbardziej typowym jest prawostronny obszar krytyczny postaci:
R = {xxx : T (xxx) k},
gdzie T jest statystyką testową, a k oznacza wartość krytyczną.
Stąd jeśli wartość statystyki testowej jest duża (przekracza wartość krytyczną), to odrzucamy hipotezę zerową.
Inne postaci obszarów krytycznych:
Lewostronny obszar krytyczny:
R = {xxx : T (xxx) k}.
Dwustronny obszar krytyczny:
R = {xxx : T (xxx) k 1 lub T (xxx) k 2 }.
p-wartość
Błędy przy testowaniu hipotez
Przyjmując lub odrzucając hipotezę zerową podejmujemy decyzję, która może być poprawna lub błędna. Podczas testowania hipotezy zerowej możemy popełnić jeden z dwóch błędów:
1
Odrzucamy hipotezę zerową, gdy jest ona prawdziwa – błąd I rodzaju.
2
Przyjmujemy hipotezę zerową, gdy jest ona fałszywa – błąd II
rodzaju.
p-wartość
Błędy przy testowaniu hipotez
p-wartość
Wynik testowania hipotez
Ponieważ decyzja przyjęcia hipotezy zerowej może pociągnąć za sobą popełnienie błędu II rodzaju (prawdopodobieństwo tego błędu nie jest kontrolowane i nawet w najlepszych testach może być bardzo duże), to wynikiem testowania hipotez statystycznych jest jedna z dwóch decyzji:
1
„Odrzucamy hipotezę zerową”, tzn. stwierdzamy
występowanie istotnych statystycznie różnic (zależności), na poziomie istotności α,
2
„Nie ma podstaw do odrzucenia hipotezy zerowej”, tzn.
stwierdzamy brak istotnych statystycznie różnic (zależności),
na poziomie istotności α.
p-wartość
p-wartość
Definicja
p–wartość jest najmniejszym poziomem istotności testu, przy którym odrzucamy hipotezę zerową.
1
Jeżeli p-wartość jest mniejsze bądź równa α, to odrzucamy H 0 .
2
Jeżeli p-wartość jest większa od α, to nie ma podstaw do
odrzucenia H 0 .
p-wartość
p-wartość
Sposób obliczania p–wartości:
1
Prawostronny obszar krytyczny:
P 0 (T T (xxx)).
2
Lewostronny obszar krytyczny:
P 0 (T T (xxx)).
3
Dwustronny obszar krytyczny:
2 min{P 0 (T T (xxx), P 0 (T T (xxx))}.
Testy ilorazu wiarogodności
Załóżmy, że dysponujemy n-elementową próbą, a θ oznacza parametr modelu statystycznego. Rozważamy zagadnienie testowania układu hipotez:
H 0 : θ ∈ Θ 0 , H 1 : θ ∈ Θ 1 ,
gdzie Θ 0 ∪ Θ 1 = Θ oraz Θ 0 ∩ Θ 1 = ∅. Ponadto załóżmy, że populacja, z której pochodzi nasza próba ma rozkład absolutnie ciągły.
Testem ilorazu wiarogodności nazywamy test z obszarem krytycznym postaci:
R = {xxx : sup θ ∈Θ L(θ; xxx)
sup θ ∈Θ0L(θ; xxx) k α },
gdzie wartość k α wyznaczamy tak, aby prawdopodobieństwo błędu
pierwszego rodzaju było równe α.
Przykład
Załóżmy, że dysponujemy n-elementową próbą prostą X
X X = (X 1 , X 2 , . . . , X n ), n > 1 z populacji o rozkładzie normalnym z nieznanymi parametrami µ i σ 2 . Obszar krytyczny testu ilorazu wiarogodności dla układu hipotez:
H 0 : µ = µ 0 H 1 : µ < µ 0 ma następującą postać:
R = {xxx : x ¯ − µ 0
s
√ n t(α, n − 1)}.
Przykład
W modelu jednej próby prostej z populacji o rozkładzie normalnym funkcja wiarogodności ma postać:
L(µ, σ 2 ; xxx) = (2π) −n/2 (σ 2 ) −n/2 exp
− 1 2σ 2
n i=1
(x i − ¯x) 2
.
Ponadto, estymatorami największej wiarogodności parametrów µ i σ 2 są odpowiednio statystyki:
ˆ µ = ¯ X , ˆ
σ 2 = ˜ S 2 = 1 n
n i=1
(X i − ¯ X ) 2 .
Przykład
1
Test t dla jednej próby.
2
Test t da dwóch prób niezależnych.
3
Test t dla dwóch prób zależnych.
4
Test istotności dla współczynnika korelacji.
5