• Nie Znaleziono Wyników

Test t-Studenta dla jednej średniej Hipoteza zerowa:

N/A
N/A
Protected

Academic year: 2021

Share "Test t-Studenta dla jednej średniej Hipoteza zerowa:"

Copied!
10
0
0

Pełen tekst

(1)

Test t-Studenta dla jednej średniej

Hipoteza zerowa: Średnia wartość zmiennej w populacji jest równa okre- ślonej wartości a0 (a = a0).

Hipoteza alternatywna 1.: Średnia wartość zmiennej w populacji jest róż- na od określonej wartości a0 (a 6= a0).

Hipoteza alternatywna 2.: Średnia wartość zmiennej w populacji jest mniejsza od określonej wartości a0 (a < a0).

Hipoteza alternatywna 3.: Średnia wartość zmiennej w populacji jest większa od określonej wartości a0 (a > a0).

Założenia: Zmienna ma rozkład normalny o nieznanej wariancji σ2. Statystyka testowa:

Tn=

nx − a¯ 0

s

ma rozkład t-Studenta z n − 1 stopniami swobody (dla dużych n (n ­ 30) rozkład ten jest zbliżony do standardowego rozkładu normalnego).

Obszar krytyczny 1.: K = (−∞, −tn−11−α/2) ∪ (tn−11−α/2, +∞) Obszar krytyczny 2.: K = (−∞, −tn−11−α)

Obszar krytyczny 3.: K = (tn−11−α, +∞)

gdzie tn−11−α jest kwantylem rzędu 1 − α rozkładu t-Studenta z n − 1 stopniami swobody.

p-wartość 1.: ˜α = 2 (1 − Fn−1(|Tn|)) p-wartość 2. i 3.: ˜α = 1 − Fn−1(|Tn|)

gdzie Fn−1jest dystrybuantą rozkładu t-Studenta z n−1 stopniami swobody.

Uwagi:

• Ponieważ przy n → ∞, niezależnie od wyjściowego rozkładu badanej zmiennej, statystyka Tn ma standardowy rozkład normalny i jest to rozkład graniczny rozkładu t-Studenta, to test t-Studenta może być stosowany dla zmiennych o dowolnym rozkładzie (dla którego istnieje wariancja), jeśli tylko próba jest dość liczna (n ­ 30 i rozkład jest w przybliżeniu jednomodalny i symetryczny lub n ­ 40, gdy rozkład jest wyraźnie skośny [3], choć czasami podawany jest warunek n ­ 25 [7]). W próbie nie powinny występować wartości odstające.

• W przypadku rozkładu dwupunktowego, tj. zmiennej losowej X, która przyjmuje wartości 1 i 0 z prawdopodobieństwami odpowiednio p i 1−p, wartość średnia wynosi

EX = 1 · p + 0 · (1 − p) = p,

jest więc równa prawdopodobieństwu wystąpienia 1. Oznacza to, że te- stem t-Studenta można testować hipotezę dotyczącą odsetka elementów

(2)

populacji posiadających pewną własność. Zaleca się stosować ten test, jeśli nˆp ­ 5 i n(1 − ˆp) ­ 5 (gdzie ˆp oznacza prawdopodobieństwo obser- wowane), czyli liczba elementów, które mają pewną własność i liczba tych, które jej nie mają, wynoszą co najmniej 5. [3]

Test t-Studenta dla dwóch średnich i prób niezależnych

Hipoteza zerowa: Średnie wartości zmiennej są takie same w dwóch różnych populacjach (a1 = a2).

Hipoteza alternatywna 1.: Średnie wartości zmiennej są różne w badanych populacjach (a1 6= a2).

Hipoteza alternatywna 2.: Średnia wartość zmiennej w pierwszej popula- cji jest mniejsza od średniej wartości zmiennej w drugiej populacji (a1 < a2).

Hipoteza alternatywna 3.: Średnia wartość zmiennej w pierwszej popula- cji jest większa od średniej wartości zmiennej w drugiej populacji (a1 > a2).

Założenia: Zmienna ma w obu populacjach rozkład normalny o nieznanych wariancjach.

a) Zmienna ma w obu populacjach rozkład normalny o nieznanych, ale rów- nych wariancjach.

Statystyka testowa:

Tn= x¯1 − ¯x2

s(n1 − 1)s21+ (n2 − 1)s22

n1+ n2− 2 · n1 + n2 n1n2

ma rozkład t-Studenta z n1+ n2 − 2 stopniami swobody.

Obszar krytyczny 1.: K = (−∞, −tn1−α/21+n2−2) ∪ (tn1−α/21+n2−2, +∞) Obszar krytyczny 2.: K = (−∞, −tn1−α1+n2−2)

Obszar krytyczny 3.: K = (tn1−α1+n2−2, +∞)

gdzie tn1−α1+n2−2 oznacza kwantyl rzędu 1 − α z rozkładu t-Studenta z n1+ n2 − 2 stopniami swobody.

p-wartość 1.: ˜α = 2 (1 − Fn1+n2−2(|Tn|)) p-wartość 2. i 3.: ˜α = 1 − Fn1+n2−2(|Tn|)

gdzie Fn1+n2−2 jest dystrybuantą rozkładu t-Studenta z n1+ n2− 2 stop- niami swobody.

(3)

b) Zmienna ma w obu populacjach rozkład normalny o nieznanych i różnych wariancjach.

Statystyka testowa:

Cn= x¯1− ¯x2

ss21 n1 + s22

n2 (statystyka Cochrana i Coxa).

Obszar krytyczny 1.: K = (−∞, −cn1−α/21,n2 ) ∪ (cn1−α/21,n2 , +∞) Obszar krytyczny 2.: K = (−∞, −cn1−α1,n2)

Obszar krytyczny 3.: K = (cn1−α1,n2, +∞) gdzie

cn1−α1,n2 s21

n1tn1−α1−1+ s22 n2tn1−α2−1

!

: s21 n1 + s22

n2

!

.

Uwagi:

• Test t-Studenta dla dwóch średnich i prób niezależnych może być rów- nież używany w przypadku zmiennej, która nie posiada w badanych populacjach rozkładu normalnego. Wymagana jest wówczas duża li- czebność obu prób (co najmniej po 30 obserwacji), symetria i brak obserwacji odstających.

• W idealnych warunkach obiekty powinny być losowo przypisane do dwóch grup, tak aby każda różnica ich reakcji była wynikiem oddziaływania (lub braku oddziaływania) tylko jednego czynnika. Nie jest tak w przypadku porównywania średniego dochodu mężczyzn i kobiet. Płeć badanych nie jest przypisywana losowo. W takich przypadkach należy zadbać o to, żeby różnice innych czynników nie pomniejszały, ani nie powiększały, znaczącej różnicy średnich. Na różnice średniego dochodu mogą mieć także wpływ takie czynniki jak wykształcenie (a nie tylko płeć). [Pomoc IBM SPSS Statistics]

Test t-Studenta dla dwóch średnich i prób zależnych

Hipoteza zerowa: Dwie zmienne zależne mają jednakowe średnie (inaczej:

różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią równą 0).

Hipoteza alternatywna 1.: Zmienne zależne mają różne średnie (inaczej:

różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią różną od 0).

(4)

Hipoteza alternatywna 2.: Pierwsza ze zmiennych ma średnią mniejszą niż druga (inaczej: różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią ujemną).

Hipoteza alternatywna 3.: Pierwsza ze zmiennych ma średnią większą niż druga (inaczej: różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią dodatnią).

Statystyka testowa:

Tn= d¯ sd

√n

ma rozkład t-Studenta z n − 1 stopniami swobody.

Obszar krytyczny 1.: K = (−∞, −tn−11−α/2) ∪ (tn−11−α/2, +∞) Obszar krytyczny 2.: K = (−∞, −tn−11−α)

Obszar krytyczny 3.: K = (tn−11−α, +∞)

gdzie tn−11−α jest kwantylem rzędu 1 − α rozkładu t-Studenta z n − 1 stopniami swobody.

p-wartość 1.: ˜α = 2 (1 − Fn−1(|Tn|)) p-wartość 2. i 3.: ˜α = 1 − Fn−1(|Tn|)

gdzie Fn−1jest dystrybuantą rozkładu t-Studenta z n−1 stopniami swobody.

Uwagi: Ponieważ test ten jest w praktyce testem t-Studenta dla jednej śred- niej (dla zmiennej D = X − Y ), to należy sprawdzić, czy różnica zmiennych spełnia wymagania testu dla jednej średniej, tj. ma rozkład normalny lub ma rozkład odbiegający od normalnego (ale bez wartości odstających), ale liczebność próby jest odpowiednio duża.

Test chi-kwadrat zgodności

Założenia: Zmienna ma rozkład dyskretny, przyjmuje tylko wartości l1, . . . , lk z prawdopodobieństwami odpowiednio p1, . . . , pk, które nie są znane.

Hipoteza zerowa: Zmienna ma rozkład dyskretny z określonymi prawdo- podobieństwami p01, . . . , p0k.

Hipoteza alternatywna: Zmienna ma rozkład z innymi prawdopodobień- stwami niż zadane.

Statystyka testowa:

χ2 =

k

X

i=1

(ni− n0i)2 n0i =

k

X

i=1

(ni− np0i)2 np0i ,

gdzie nioznaczają liczebności obserwowane, n0i – oczekiwane, ma w przybliżeniu rozkład chi-kwadrat z k − 1 stopniami swobody.

Obszar krytyczny: K = (uk−11−α, +∞),

(5)

gdzie uk−11−αoznacza kwantyl rzędu 1−α rozkładu chi-kwadrat z k−1 stopniami swobody.

p-wartość: ˜α = 1 − Fχk−12 2),

gdzie Fχk−12 jest dystrybuantą rozkładu chi-kwadrat z k − 1 stopniami swobo- dy.

Uwagi:

• Jeżeli rozkład teoretyczny zależy od d nieznanych parametrów, to pa- rametry te wyznaczamy metodą największej wiarogodności, a liczbę stopni swobody zmniejszamy o d.

• Statystyka χ2 ma tylko w przybliżeniu (asymptotycznie) rozkład chi- kwadrat. Przybliżenie rozkładem chi-kwadrat uznajemy za dopuszczal- ne, gdy np0i ­ 5, i = 1, . . . , k, a za dobre, gdy np0i ­ 10, i = 1, . . . , k.

Jeśli liczba kategorii jest duża (> 6), to zgadzamy się stosować przy- bliżenie rozkładem chi-kwadrat także wtedy, gdy dla jednej lub dwóch kategorii 1 ¬ np0i < 5 [3]. Mało liczne kategorie można również łączyć z kategoriami sąsiednimi, redukując wówczas odpowiednio liczbę stopni swobody.

• W przypadku zmiennej o rozkładzie z ciągłą dystrybuantą dane grupu- jemy w k (10k ¬ n) klas. Prawdopodobieństwa teoretyczne wyliczamy z dystrybuanty. Klasy staramy się dobrać tak, aby prawdopodobieństwa znalezienia się w klasie były równe 1/k, a liczebności teoretyczne były co najmniej równe 5. Testujemy wówczas hipotezę zerową: Zmienna ma rozkład o podanej dystrybuancie.

Łatwo zauważyć, że testowanie zgodności z zadanym rozkładem ciągłym za pomocą testu chi-kwadrat jest przedsięwzięciem kontrowersyjnym, ponieważ punktem wyjścia do konstrukcji testu jest świadoma utrata informacji związana z koniecznością dokonania dyskretyzacji. Dlatego, gdy mamy do czynienia z rozkładem ciągłym, powinniśmy unikać stoso- wania tego testu [...] Dopiero, gdy próba losowa jest bardzo liczna i hi- stogram sporządzony na jej podstawie przypomina gładki rozkład ciągły, zastosowanie testu chi-kwadrat przestaje być ryzykowne. Inna sprawa, że test ten może być jedynym dającym się zastosować w danej kon- kretnej sytuacji. Tak jest np. wtedy, gdy dane, którymi dysponujemy, pochodzą wprawdzie z rozkładu ciągłego, ale są już zdyskretyzowane. [3, str. 372]

• Jeśli założenia testu nie są spełnione, można wykonać tzw. test dokład- ny, który nie korzysta z rozkładu granicznego statystyki testowej tylko z jej właściwego rozkładu.

(6)

Test chi-kwadrat niezależności

Hipoteza zerowa: Zmienne losowe X i Y są niezależne.

Hipoteza alternatywna: X i Y są zależne.

Założenia: Cechy X, Y są jakościowe (nominalne lub o wartościach upo- rządkowanych).

Statystyka testowa:

χ2 =

k

X

j=1 r

X

i=1

(nij − n0ij)2 n0ij ,

gdzie

r — liczba kategorii zmiennej X (liczba wierszy w tablicy kontyngencji), k — liczba kategorii zmiennej Y (liczba kolumn w tablicy kontyngencji), nij — liczba wystąpień w próbie par obserwacji (xi, yj),

n0ij =

k

P

j=1

nij · Pr

i=1

nij

n ,

n =

r

X

i=1 k

X

j=1

nij.

Dla zmiennych X i Y przyjmujących tylko po 2 wartości stosuje się statystykę

χ2 =

k

X

j=1 r

X

i=1

(|nij − n0ij| − 1/2)2 n0ij ,

co zawiera tzw. poprawkę Yatesa na ciągłość poprawiającą jakość przybliże- nia. [6]

Obszar krytyczny: K = (u(r−1)(k−1)1−α , +∞),

gdzie u(r−1)(k−1)1−α jest kwantylem rzędu 1 − α rozkładu chi-kwadrat z (r − 1)(k − 1) stopniami swobody.

p-wartość: ˜α = 1 − Fχ(r−1)(k−1)2 2),

gdzie Fχ(r−1)(k−1)2 jest dystrybuantą rozkładu chi-kwadrat z (r − 1)(k − 1) stopniami swobody.

Uwagi:

• Podobnie jak w teście chi-kwadrat zgodności, przybliżenie statystyki testowej rozkładem chi-kwadrat stosujemy, gdy liczebności teoretyczne prób w wierszach (kolumnach) są stosunkowo duże (n0ij ­ 5).

(7)

• Gdy tablica kontyngencji ma rozmiar 2 × 2 i liczebności próby w wier- szach (kolumnach) są zbyt małe, można oprzeć się na tzw. dokładnym teście Fishera.

• W przypadku pary cech o uporządkowanych kategoriach test niezależ- ności może okazać się zwodniczy. Może wówczas zajść potrzeba wpro- wadzenia odpowiedniej miary zależności między cechami.

– Miara gamma – miara zależności monotonicznej, dodatniej, gdy γ > 0 i ujemnej, gdy γ < 0. Zasadniczo γ ∈ [−1, 1]. p-wartość po- dawana przy tym współczynniku dotyczy testu hipotezy zerowej o niezależności zmiennych przy hipotezie alternatywnej orzekają- cej ich dodatnią (lub ujemną) zależność.

– d Sommersa i τ −b Kendalla – używane, gdy liczba par związanych jest duża.

Test Kołmogorowa

Hipoteza zerowa: Zmienna ma rozkład o zadanej dystrybuancie F .

Hipoteza alternatywna: Zmienna ma rozkład o innej niż zadana dystry- buancie.

Statystyka testowa: Dn= max{Dn+, Dn} gdzie Dn+= max1¬i¬n

i

n − F (x(i))

, Dn= max1¬i¬n

F (x(i)) − i − 1 n

Obszar krytyczny: (dn(1 − α), 1]

odczytujemy z tablic kwantyli statystyki Kołmogorowa, jest to taka wartość, dla której P (Dn ­ dn(1 − α)) = α).

Uwagi:

• W przypadku danych zgrupowanych w klasy bierzemy pod uwagę pra- wy koniec każdej z klas i zamiast podanych statystyk wyznaczamy war- tość maksymalną statystyki |Fn(xi)−F (xi)|, gdzie Fnjest dystrybuantą empiryczną.

• Dla dużych prób (n > 100) używa się statystyki

nDn, a obszar kry- tyczny wyznacza, używając kwantyli granicznego rozkładu Kołmogo- rowa.

• W przypadku testowania zgodności z rozkładem normalnym zaleca się stosowanie testu Kołmogorowa z poziomem istotności Lillieforsa oraz testu Shapiro-Wilka (najbardziej polecany dla prób o liczebności nie- przekraczającej 2000).

(8)

Test Wilcoxona znakowanych rang

Założenia: Dysponujemy ciągiem par obserwacji: (X1, Y1), . . . , (Xn, Yn). Pa- ry zmiennych losowych są niezależne, natomiast Xi, Yi mogą być zależne. De- finiujemy niezależne różnice Zi = Yi − Xi, i = 1 . . . , n. Każda zmienna Zi, i = 1, . . . , n pochodzi z tego samego rozkładu ciągłego o dystrybuancie Fi, symetrycznego względem wspólnej mediany θ (może być ona interpretowana jako „efekt kuracji”).

Hipoteza zerowa: θ = 0 (brak „efektu kuracji”)

Hipoteza alternatywna 1.: θ 6= 0 (jest jakiś „efekt kuracji”).

Hipoteza alternatywna 2.: θ > 0 („efekt kuracji” jest dodatni).

Hipoteza alternatywna 3.: θ < 0 („efekt kuracji” jest ujemny).

Statystyka testowa: Jest to statystyka znakowanych rang Wilcoxona, czyli suma rang wartości bezwzględnych różnic odpowiadających różnicom dodat- nim:

T+ = X

Zi>0

r(|Zi|), gdzie

r(|Zi|) — ranga |Zi|, i = 1, . . . , n, (r(Xi) = j ∈ {1, . . . , n} ⇐⇒ Xi = Xj:n).

Obszar krytyczny 1.: K = −∞,n(n + 1)

2 − w1−α/2

#

hw1−α/2, ∞, Obszar krytyczny 2.: K = [w1−α, +∞)

Obszar krytyczny 3.: K = −∞,n(n + 1)

2 − w1−α

#

gdzie wa jest kwantylem rozkładu statystyki znakowanych rang Wilcoxona (przy założeniu prawdziwości hipotezy zerowej) rzędu a (w tablicach).

Uwagi:

• Test znakowanych rang Wilcoxona jest nieparametryczną alternatywą dla testu t-Studenta w przypadku dwóch próbek dających się połączyć w pary. Różnica między tymi testami jest taka, że test t-Studenta testu- je równość średnich arytmetycznych, a test Wilcoxona testuje mediany.

Test Wilcoxona nie wymaga założeń dotyczących rozkładu próby, może być więc używany, gdy założenia testu t-Studenta nie są spełnione.

• Test dla jednej próby jest odpowiednikiem testu dla dwóch prób, w któ- rym drugą z prób zastąpiono stałą równą wartości testowanej mediany.

• Jeżeli n jest duże (w praktyce dla n ­ 25), stosuje się tzw. test asymp- totyczny, tj. używa się statystyki testowej postaci

T = T+ n(n+1)4

qn(n + 1)(2n + 1)/24 ,

(9)

i obszarów krytycznych

Obszar krytyczny 1.: K =−∞, −z1−α/2ihz1−α/2, ∞ Obszar krytyczny 2.: K = [z1−α, +∞)

Obszar krytyczny 3.: K = (−∞, −z1−α]

gdzie z1−α jest kwantylem rzędu 1 − α standardowego rozkładu normal- nego.

• W praktyce (w wyniku zaokrąglania) mogą pojawić się tzw. węzły, czyli grupy obserwacji o jednakowej wartości bezwzględnej. Postępowanie w przypadku, gdy

1. n < 25

- odrzucamy wszystkie Zi takie, że Zi = 0 i odpowiednio zmniej- szamy n,

- uśredniamy rangi dla pozostałych węzłów (mogą być one niecał- kowite),

- stosujemy test dokładny ze zmodyfikowanymi rangami;

2. n ­ 25

- odrzucamy wszystkie Zi takie, że Zi = 0 i odpowiednio zmniej- szamy n,

- uśredniamy rangi dla pozostałych węzłów (mogą być one niecał- kowite),

- stosujemy test asymptotyczny ze modyfikowaną statystyką te- stową T:

T˜ = T = T+n(n+1)4

s

n(n + 1)(2n + 1)/24 −481 PN

j=1

(t2j − 1)tj ,

gdzie:

N — liczba grup węzłów (również jednoelementowych), tj — liczba węzłów w j-tej grupie, j = 1, . . . , N .

(10)

Bibliografia

[1] Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K.: Staty- styka w zadaniach. Część II: Statystyka matematyczna. Warszawa, Wy- dawnictwa Naukowo-Techniczne, 2001.

[2] Harnett D. L., Soni A. K.: Statistical Methods for Business and Economics. Addison-Wesley Publishing Company, 1991.

[3] Koronacki J., Mielniczuk J.: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa, WNT, 2006.

[4] Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasi- lewski M.: Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach. Część II: Statystyka matematyczna. Warszawa, PWN, wyd.

VIII, 2006.

[5] Plucińska A., Pluciński E.: Probabilistyka. Warszawa, Wydawnic- twa Naukowo-Techniczne, 2000.

[6] Rees D.G.: Essential Statistics. London, Chapman&Hall, 1995.

[7] Sheskin D.J.: Handbook of Parametric and Nonparametric Statistical Procedures. Boca Raton, Chapman&Hall/CRC, 2000.

Cytaty

Powiązane dokumenty

• Hipoteza zerowa jest jedną wyróżnioną hipotezą, która podlega weryfikacji, pozostałe hipotezy ze zbioru hipotez dopuszczalnych stanowią zbiór hipotez alternatywnych..

Jaką drogę przebędzie on do chwili zatrzymania się, jeśli współczynnik tarcia krążka o lód wynosi f=0,1?.

Następnie prosi ich, aby wynotowali na karteczkach skojarzenia z hasłem „ojczyzna”, a sam zapisuje na tablicy, w centralnym miejscu, słowo kluczowe1. Po krótkiej

Oblicz, ile samochodów każdego rodzaju zostało sprzedanych, jeżeli Opli Corsa sprzedano 510 sztuk.

Oczywiście, jeśli jest jakiś problem z innego przedmiotu możecie też- i wiele osób tak robi, zgłaszać do mnie i ja przekażę do nauczyciela, który także łączy się z

Czy nie zachodzi błąd materialny (przesłanka jest fałszywa) bądź błąd bezpodstawności (przesłanka trudna do weryfikacji)B. Czy nie zostały wzięte pod uwagę

Udowodni¢, »e je±li M jest projektywny, to M jest

P odczas zajêæ z technologii betonu, prefabrykacji i innych pokrewnych dziedzin, traktowaliœmy beton prawie wy³¹cz- nie jako materia³ konstrukcyjny, od którego wymagaliœmy