• Nie Znaleziono Wyników

Rozwiązanie: Skorzystamy z testu χ2 zgodności rozkładu

N/A
N/A
Protected

Academic year: 2021

Share "Rozwiązanie: Skorzystamy z testu χ2 zgodności rozkładu"

Copied!
3
0
0

Pełen tekst

(1)

Zadanie 1: Zadanie 8

Według teorii Profesora Genka, komórki macierzyste pewnego organizmu różnicują się na 5 typów dojrzałych komórek, z prawdopodobieństwami: p1 = 7/16, p2 = 1/4, p3 = p4 = 1/8, p5 = 1/16. Przeprowadzono 496 niezależnych powtórzeń eksperymentu różnicowania i w 212 powtórzeniach powstała komórka typu 1, w 123 powstała komórka typu 2, w 62 typu 3, w 45 typu 4, oraz w 54 powtórzeniach powstały komórki typu 5. Testem χ2 na poziomie istotności α = 0.01 zweryfikować hipotezę H0, że teoria Genka dobrze opisuje zjawisko zderzeń.

Wskazówka: χ2(0.99, 4) = 13.277.

Rozwiązanie:

Skorzystamy z testu χ2 zgodności rozkładu.

Założenia testu: wyniki próby należą do d klas o licznościach ni sumujących się do n. Spełnione, u nas d = 5, n1 = 212, n2 = 123, n3 = 62, n4 = 45, n5 = 54, n = 496. Hipoteza zerowa postaci P (Xj ∈ klasa i) = pi, i ∈ {1, ..., d}, gdzie pi – ustalone.

Budujemy tabelę, która posłuży nam do obliczenia statystyki testowej.

• Krok 1: Co mamy: z treści zadania liczebności obiektów należących do określonej klasy zaobserwowane w próbie (ni).

interpretacja symbol Klasa

1 2 3 4 5

co mamy (w treści zadania) ni 212 123 62 62 31

• Krok 2: Co powinniśmy mieć: jaki jest rozkład zjawiska (pi)

interpretacja symbol Klasa

1 2 3 4 5

co mamy (w treści zadania) ni 212 123 62 62 31 co powinniśmy mieć (rozkład) pi 7/16 1/4 1/8 1/8 1/16

• Krok 3: Co powinniśmy mieć w próbie, jeśli H0 spełniona: korzystając z rozkładu p-stwa obliczamy liczeb- ności obiektów należących do określonej klasy dla próby n = 496 (Npi).

interpretacja symbol Klasa

1 2 3 4 5

co mamy (w treści zadania)

ni 212 123 62 45 54

co powinniśmy mieć (rozkład)

pi 7/16 1/4 1/8 1/8 1/16

co powinniśmy mieć (próba)

N pi 7/16*496 =

217 1/4*496 =

124 1/8*496 =

62 1/8*496 =

62 1/16*496 =

31

Teraz mamy już wszystkie informacje potrzebne do obliczenia statystyki testowej. Statystyka: wielkość χ2 = Pk

i=1

(ni−npi)2

npi . Ma ona (asymptotyczny) rozkład χ2(d − 1). U nas d = 5, stąd będziemy używać rozkładu χ2(4). Obliczam wartość statystyki dla próby z zadania. k = Pdi=1(ni−N pN pii)2 = (212−217)217 2 + (123−124)124 2 + (62−62)62 2 +

(45−62)2

62 + (54−31)31 2 = 21.849.

Zbiór krytyczny dla testu χ2 budujemy tak samo jak dla testu z hipotezą alternatywną większościową – mimo że H1 naszego testu jest dwustronna, to badanie kwadratu sprawia, że wartości, które odrzucałyby H0 z lewej strony rozkładu nie występują, sprawdzamy tylko wartości z prawej strony. Potrzebujemy kwantyla rozkładu χ2 o d − 1stopniach swobody. Możemy znaleźć go w tablicach lub obliczyć w R (qchisq(0.99,4)). Zbiór krytyczny:

W = [χ2(1 − α, 4), ∞) = [χ2(0.99, 4), ∞) = [13.2767, ∞).

Wartość statystyki testowej k ∈ W , więc odrzucamy hipotezę zerową. Teoria Genka źle opisuje zjawisko.

Obliczenie p-value: Liczymy p-value jak w schemacie dla hipotezy większościowej: 1 − F (k), gdzie F to dystrybu- anta rozkładu χ2o 4 stopniach swobody (to jest rozkład statystyki testowej przy założeniu spełnionej H0. Możemy użyć R: 1 - pchisq(21.849, 4) ≈ 0.00. P-value jest mniejsze niż założony poziom istotności α = 0.01, więc odrzucamy H0.

1

(2)

Konkluzja na podstawie obszaru krytycznego i p-value musi być taka sama.

(Ten sam test wykorzystywany jest w zadaniu 14, kolejne przykłady w dodatkowych materiałach do laboratorium.)

Zadanie 2: Zadanie 1d

Student szuka zajęcia podczas kwarantanny. Z nudów zajął się zbieraniem danych o wszystkim, co tylko przyjdzie mu do głowy. Policzył ziarenka ryżu w 12 torbach, które kupił, robiąc zapasy. Zdziwiło go, że w każdej jest inna liczba ziarenek (mimo że są od jednego producenta!). Wyniki pomiarów zawiera tabela.

1 2 3 4 5 6 7 8 9 10 11 12

8976 8982 8970 8990 8986 9000 8971 8965 8993 8986 8982 8979

• Wyznacz przedział ufności dla średniej liczby ziarenek ryżu na poziomie ufności 0,99. Zakładamy, że liczba ziarenek ryżu pochodzi z rozkładu normalnego N(µ, σ2), z nieznanymi parametrami µ i σ2. Zweryfikuj hipotezę, że przeciętna liczba ziarenek ryżu w torebce to 8980.

• Wyznacz przedział ufności dla wariancji liczby ziarenek ryżu w torebce na poziomie ufności 0,99. Zweryfikuj hipotezę, że wariancja liczby ziarenek ryżu wynosi 100.

Rozwiązanie:

a) Będziemy korzystać z testu istotności dla średniej. Wariant dla nieznanej µ i σ2, dane pochodzą z rozkładu normalnego (podane w zadaniu). Obliczamy potrzebne wartości

Średnia ¯X = 1nPn

i=1Xi= 898123 Wariancja Sn2 = n1 Pn

i=1(Xi− ¯X)2 = 94.88 α = 0, 01

n = 12

Test istotności dla średniej:

H0 : µ = 8980przeciw: H1 : µ 6= 8980 Statystyka testowa: T = X−µ¯Sn

n − 1 = 8981

2 3−8980

94.88 ·√

11 = 0.57

Przyjęliśmy dwustronną hipotezę alternatywną. Potrzebujemy stworzyć obszar krytyczny. Potrzebujemy kwantyli rozkładu t o n − 1 stopniach swobody rzędu 1 − α/2 oraz α/2 (odcinamy z każdej strony rozkładu statystyki testowej przy założeniu prawdziwej H0 takie samo pole równe α/2). Możemy skorzystać z R (qt(0.995, 11), qt(0.005, 11)).

Obszar krytyczny:

W = (−∞, t(α2, 11)) ∪ [t(1 −α2, 11), ∞) = (−∞; −3.11] ∪ [3, 11; ∞)

Statystyka w przybliżeniu wynosi 0,57 i nie wpada do obszaru krytycznego, nie ma podstaw do odrzucenia H0. Obliczenie p-value: Korzystamy ze schematu dla hipotezy dwustronnej: 2 min(F (k), 1 − F (k)), gdzie F to dystrybuanta rozkładu t o 11 stopniach swobody (to jest rozkład statystyki testowej przy założeniu spełnionej H0). Możemy użyć R: 1 - pt(0.57, 11) ≈ 0.29; pt(0.57, 11) ≈ 0.70. 2 min(0.29, 0.70) = 0.58. P-value jest większe niż założony poziom istotności α = 0.01, więc nie ma podstaw do odrzucenia H0.

Przedział ufności dla średniej (wzory z zajęć 2):

(898123− t(1 − 0,012 , 11)

94.88

11 , 898123 + t(1 − 0,012 , 11)

94.88

11 ) = (8972.53; 8990.80)

Proszę zauważyć, że podana w H0 wartość należy do przedziału ufności. Testy istotności na poziomie istotności α możemy rozpatrywać jako sprawdzenie, czy wartość należy do przedziału ufności na poziomie ufności 1 − α.

2

(3)

b) Skorzystamy z testu istotności dla wariancji

Test istotności dla wariancji, dane pochodzą z rozkładu normalnego (podane w treści zadania):

H0 : σ2 = 100 przeciw: H1 : σ2 < 100 (postawiliśmy inną hipotezę alternatywną niż w przypadku średniej, żeby przećwiczyć liczenie p-value)

Statystyka testowa: χ2 = nSσ22n = 12·94.88100

Potrzebujemy stworzyć obszar krytyczny. Hipoteza alternatywna jest jednostronna (mniejszościowa), czyli potrze- bujemy odciąć lewy ogon rozkładu statystyki testowej o polu α. Potrzebujemy kwantyla rozkładu χ2 o n − 1 stopniach swobody rzędu α. Możemy znaleźć go w tablicach lub obliczyć w R (qchisq(0.01,11)). Zbiór kry- tyczny: W = (−∞, χ2(α, 11)] = (−∞, χ2(0.01, 11)] = (−∞, 3.05].

Statystyka χ2 wynosi w przybliżeniu 11.39 i leży poza obszarem krytycznym, nie odrzucamy zatem H0 na rzecz H1.

Obliczenie p-value: Korzystamy ze schematu dla hipotezy jednostronnej mniejszościowej: F (k), gdzie F to dys- trybuanta rozkładu χ2 o 11 stopniach swobody (to jest rozkład statystyki testowej przy założeniu spełnionej H0).

Możemy użyć R: pchisq(11.39, 11) ≈ 0.59. P-value jest większe niż założony poziom istotności α = 0.01, więc nie ma podstaw do odrzucenia H0.

Przedział ufności ze wzoru dla wariancji:

(χ212·94.88(0,995,11),χ212·94.88(0,005,11)) = (42.55; 437.95)

Gdzie z tablic: χ2(0, 995, 11) = 2, 6032 i χ2(0, 005, 11) = 26, 7569 (Test istotności dla wariancji wykorzystywany jest w zadaniu 7.)

3

Cytaty

Powiązane dokumenty

Obliczyć prawdopodobieństwo tego, że losowo wybrana osoba jest chora, jeśli test tej osoby dał wynik pozytywny.. Wybieramy jedną z tych urn, przy czym prawdopodobieństwo

Sformułuj poniższe zdania z ukrytymi kwantyfika- torami w podanej postaci symbolicznej i określ ich prawdziwość.. (a) Sześcian liczby nieparzystej jest liczbą

Niech H będzie p-podgrupą G, która jest dzielnikiem normalnym.. Udowodnić, że H jest zawarta w każdej p-podgrupie

[r]

Dla dodatniej liczby naturalnej n znaleźć wzór na największą potęgę liczby pierwszej p dzielącą n!4. Rozłożyć na czynniki pierwsze

23. Dana jest liczba rzeczywista a. Niech P będzie dowolnym punktem wewnątrz czworokąta wypukłego ABCD. Udowod- nij, że środki ciężkości trójkątów 4P AB, 4P BC, 4P CD, 4P

Punkty te połączono między sobą i z wierzchołkami trójkąta nieprzecinającymi się odcinkami tak, iż ”duży” trójkąt podzielono na mniejsze trójkąty.. Udowodnij, że

Na tych pozycjach zapisu dwójkowego, na których liczby a i b mają różne cyfry, liczba x może mieć