• Nie Znaleziono Wyników

Niech X1,Xnbędzie ciągiem niezależnych zmiennych losowych o rozkładzie Bernouliego B(1,p)

N/A
N/A
Protected

Academic year: 2021

Share "Niech X1,Xnbędzie ciągiem niezależnych zmiennych losowych o rozkładzie Bernouliego B(1,p)"

Copied!
5
0
0

Pełen tekst

(1)

Ćwiczenie 7. Formułowanie i rozwiązywanie problemów testowania hipotez

Zadanie 1

W pewnym roku na egzaminie wstępnym z matematyki na wyższą uczelnię spośród 560 absolwentów techników 240 (frakcja 0.4286) nie rozwiązało pewnego zadania. Natomiast na 1040 zdających absolwentów liceów ogólnokształcących nie rozwiązało tego zadania 380 kandydatów (frakcja 0.3654). Na poziomie istotności a=0,05 zweryfikować hipotezę o jednakowym stopniu opanowania tej partii matematyki, której dotyczyło zadanie, przez absolwentów obu typów szkół.

Uwaga:

Jest to problem testowania równości wskaźników struktury w dwóch populacjach –inaczej – problem testowania równości proporcji (prawdopodobieństw sukcesu) w dwóch rozkładach dwumianowych. Korzystając z CTG Lindeberga –Levy’ego i MPWL zaproponować asymptotyczny test hipotezy H0: p1=p2 przeciwko H1: p1¹p2.

Rozw. Niech X1,Xnbędzie ciągiem niezależnych zmiennych losowych o rozkładzie Bernouliego B(1,p). Oznaczmy

n

i i

n X

p

1

ˆ 1 częstość sukcesów w n próbach. Z CTG

wiadomo, że (0,1)

1 (1 )

1 N

n

i p p

p X n

i

. Stąd i z MPWL mamypˆ ~ N(p,pˆ(1npˆ)) dla dostatecznie dużych n. Niech będą dane dwie niezależne próby proste z rozkładów B(1,p1) i B(1,p2) o licznościach n1 i n2 odpowiednio to, ˆ ˆ ~ ( , )

2 2 2 1

1

1(1 ˆ ) ˆ (1 ˆ ) ˆ

2 1 2

1 n

p p n

p

p p

p N p

p

Przy prawdziwości H0: p1=p2 różnica częstości pˆ1 pˆ2ma dla dostatecznie dużych n1 i n2

rozkład (0, )

2 2 2 1

1

1(1 ˆ ) ˆ (1 ˆ ) ˆ

n p p n

p

N p Duże wartości |pˆ1pˆ2| świadczą przeciwko H0: p1=p2 na korzyść H1: p1≠p2. Stąd obszar odrzucenia jest dwustronny

Wykonanie: Statystyka - > Statystyki podstawowe i tabele - > Inne testy istotności. W polu Różnica między dwoma wskaźnikami struktury wpisać dane, zaznaczyć Dwustronny. Po naciśnięciu przycisku Oblicz można odczytać p-wartość.

Wsk:

Statystyka - > Statystyki podstawowe i tabele - > Inne testy istotności. W polu Różnica między dwoma wskaźnikami struktury wpisać dane, zaznaczyć Dwustronny. Po naciśnięciu przycisku Oblicz można odczytać p-wartość.

(2)

Testy oparte na statystyce c Pearsona

W wyniku pewnego eksperymentu może zajść jedno k wzajemnie wykluczających się zdarzeń A1,..., Ak przy czym P(Ai)=pi. Powtarzamy eksperyment n razy. Oczywiście

nk

k n k k

n p p

n n n n n

P ...

!

!...

) ! ,...,

( 11

1

1 ; 1

1

k

j pj , n n

k

j j

1

Chcemy testować hipotezę

H0: (p1,...,pk)(p10,...,pk0) (hipoteza prosta) przeciwko

H1: (p1,..., pk)¹(p10,...,pk0) (hipoteza złożona) Pearson udowodnił, że statystyka

k

i i

i i

np np n

1 0

2 0)

( ma graniczny rozkład ck21

Ponieważ statystyka Pearsona jest pewną miarą odstępstw liczności obserwowanych od oczekiwanych przy prawdziwości H0 , "duże" wartości statystyki Pearsona świadczą przeciwko hipotezie H0 . Wobec tego H0 należy odrzucić na poziomie a, jeżeli

k

i k

i i i

np np n

1

2 0 1

2 0

) 1 ) (

( c a , gdzie ck21(1a) oznacza kwantyl rzędu 1-a rozkładu ck21

.

Testowanie złożonej hipotezy zgodności

H0: (p1,...,pk)(p1(),..., pk()), gdzie ÎRs ; s<k-2 przeciwko H1: ~H0.

Niech ˆbędzie estymatorem największej wiarygodności parametru . Oznaczmy pˆi pi(ˆ); i=1,...,k.

Wówczas statystyka

k

i i

i i

p n

p n n

1

2

ˆ ˆ )

( ma graniczny rozkład ck21 s .

Dalsza procedura jest kopią powyższej z jedyną modyfikacją dotyczącą ilości stopni swobody granicznego rozkładu ck21 s .

Zadanie 2

Wykonano 120 razy rzut dwiema kośćmi do gry: czarną i białą:

45 razy na białej kości wypadło więcej oczek niż na czarnej 50 razy na białej kości wypadło mniej oczek niż na czarnej 25 razy na obu kościach wypadła ta sama liczba oczek

Rozważmy hipotezę zerową H0: obie kości są rzetelne i wynik rzutu kością biała jest

niezależny od wyniku rzutu kością czarną. Czy otrzymane dane dają podstawę do odrzucenia H0 na poziomie a=0.01.

(3)

Wsk:

c2obl=7/4<c22(0.01)9,21 nie ma podstaw do odrzucenia H0.

W Statistice wpisać wartości zaobserwowane i oczekiwane w dwóch zmiennych OBS i OCZ.

Następnie uruchomić Statystyka - > Statystyki nieparametryczne - > Chi^2 dla liczności obserwowanych wz. oczekiwanych.

Zadanie 3

Cechy dziedziczne są przekazywane za pomocą genów występujących parami. W najprostszym przypadku , każdy gen może mieć dwie formy (allele), które będziemy oznaczać odpowiednio literami A i a. Oznaczmy przez P(A)= nieznane

prawdopodobieństwo występowania genu A w populacji. Z teorii Mendla losowego tworzenia się genotypów potomstwa otrzymujemy następujący rozkład prawdopodobieństwa

genotypów populacji w stanie równowagi (równowaga Hardy’ego Weinberga)

AA Aa aa

p 2 2(1-) (1- )2 Zaobserwowano następujące liczności genotypów

AA Aa aa

Obserw 110 235 155

Czy na poziomie 0.05 są podstawy do odrzucenia hipotezy równowagi H-W?

Wsk:

Estymatorem NW parametru  jest ˆ 0,455

) 155 235 110 ( 2

235 110 2 2

2  

nAAnnAa

.

Nie zaobserwowano istotnych odstępstw od równowagi H-W (test c2 =1,369 p=0,24>0,05)

AA Aa aa

Oczek. 103,51 247,97 148,51

Zadanie 4

Rozkład liczby niezrealizowanych zamówień w 260 oddziałach pewnej firmy podano w następującej tabeli

Liczba niezreal. zam. 0 1 2 3 4 5 6 7 8 9

Liczba oddziałów 9 18 36 53 54 41 27 14 5 3

(4)

zamówień jest rozkładem Poissona (test zgodności c2)

Wsk:

Wyznaczyć ENW[l]=X . Dla danych zagregowanych

9

1 2601

i

ni

i

X =3,83461538462.

Rozważamy 10 kategorii dla wartości zmiennej X modyfikując kategorię 9 na ( ≥9)

Oczekiwane liczności wyznaczamy formułą =260*Poisson(i;3,834615) przy czym „i” oznacza

„Liczba niezrealizowanych zamówień”. Dla ostatniej kategorii (≥9) oczekiwaną liczność wyznaczamy formułą =260*(1-iPoisson(8;3,834615) lub od 260 należy odjąć sumę

przewidywanych liczności do kategorii 8 włącznie.

W zakładce Statystyka wybieramy Statystyki nieparametryczne/ Chi^2 dla liczności obserwowanych wz. oczekiwanych

Z uwagi na estymowany jeden parametr należy obniżyć liczbę stopni swobody o 1 czyli df=8. Aby wyznaczyć p-wartość należy wykorzystać kalkulator probabilistyczny (p= 0,795177).

Wynikcobl2 4,6409<15.5073c82(0,95) nie ma podstaw do odrzucenia hipotezy.

Zadanie 5

W latach sześćdziesiątych przeprowadzono badania wśród amerykańskiej młodzieży

szkolnej mające wyjaśnić, czy istnieje związek pomiędzy poglądami politycznymi a paleniem marihuany. Wyniki podane są w arkuszu. Na poziomie istotności a=0,05 zweryfikować hipotezę o niezależności stosunku do palenia marihuany od poglądów politycznych (test niezależności c2)

Uwaga W programie Statistica testy dotyczące tablic kontyngencyjnych mogą być przeprowadzone gdy tablice kontyngencyjne są utworzone przez program z danych surowych. Program nie akceptuje danych tablicowanych. Należy więc obliczyć oczekiwane liczności używając Statistica Visual Basic lub arkusza Excela

Poniżej jest plik z danymi surowymi do powyższej analizy

(5)

1 Marichuana

2 Poglądy 1

2 3 4 5 6 7 8 9 10 11 12 13

nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe nigdy postępowe

Otworzyć powyższy plik i z menu wybrać Statystyka/podstawowe i tabele/tabele wielodzielcze wskazując zmienne do analizy w opcjach należy zaznaczyć chi kwadrat Pearsona i NW Klikając zakładkę Więcej należy wybrać dokładne tabele dwudzielcze.

Zadanie 6

Pewien produkt można wytwarzać trzema metodami produkcji. Wysunięto hipotezę, że wadliwość nie zależy od metody produkcji. Wylosowano niezależnie 270 sztuk wyrobu. Otrzymane wyniki badania jakości podano w tabeli

Jakość Metoda I Metoda II Metoda III

dobra 40 80 60

zła 10 60 20

Na poziomie 0,05 zweryfikować hipotezę o niezależności jakości produkcji od metody produkcji (test jednorodności c2).

Wykonanie: jak poprzednio.

Wyjaśnić różnice w interpretacji testów niezależności i jednorodności opartych na tej samej statystyce c2

Cytaty

Powiązane dokumenty

będzie ciągiem nie- zależnych zmiennych losowych o

Rozkłady zmiennych

będzie ciągiem niezależnych zmiennych losowych o rozkładzie jednos- tajnym na odcinku (−1, 1). będzie ciągiem niezależnych zmiennych losowych o rozkładzie jednos- tajnym na

Nieskończone drzewo binarne jest to drzewo z korzeniem, w którym każdy wierzchołek ma 2 potomków i wszystkie wierzchołki poza korzeniem mają jed- nego rodzica.. Czy te zmienne

Pozostaje do pokazania, że możemy przejść z granicą

Jakie jest prawdopodobie«stwo tego, »e w±ród n = 10000 noworodków liczba chªopców nie przewy»szy liczby

Nieskończone drzewo binarne jest to drzewo z korzeniem, w którym każdy wierzchołek ma 2 potomków i wszystkie wierzchołki poza korzeniem mają jed- nego rodzica.. Czy te zmienne

ALGEBRAICZNE ASPEKTY KRYPTOGRAFII LISTA 9: Kody i geometria algebraiczna..