• Nie Znaleziono Wyników

Wykład 7

N/A
N/A
Protected

Academic year: 2021

Share "Wykład 7"

Copied!
11
0
0

Pełen tekst

(1)

Wykład 7

Dwie niezależne próby

• Często porównujemy wartości pewnej zmiennej w dwóch populacjach.

• Przykłady:

– Grupa zabiegowa i kontrolna – Lekarstwo a placebo

– Pacjenci biorący dwa podobne lekarstwa – Mężczyźni a kobiety

– Dwie różne linie genetyczne

Niech rozkład cechy Y w populacji 1 będzie N(

1

, 

1

). Bierzemy próbę o rozmiarze n

1

,

Niech rozkład cechy Y w populacji 2 będzie N(

2

, 

2

). Bierzemy próbę o rozmiarze n

2

,

1 1 1

1 1

, ,

n SE s

s

y 

2 2 2 2 2

, ,

n SE s

s

y 

• Podstawowe pytanie: Jaka jest różnica między średnimi w populacjach: 

1

-

2

?

• Idea: znaleźć PU dla 

1

- 

2

• jest estymatorem 

1

- 

2

i będzie środkiem przedziału ufności.

• Należy jeszcze wyznaczyć SE.

2

1

y

y 

Standardowy błąd dla różnicy dwóch średnich

• Jak policzyć SE dla ?

• Istnieją dwa sposoby: uśredniony (łączony) i nieuśredniony (niełączony) (ang. pooled, unpooled).

• W obu przypadkach SE liczone jest przy pomocy s1, s2, oraz n1, n2.

• Na ogół będziemy używać niełączonego SE.

• Metodę łączonego SE zastosujemy tylko, gdy będzie można założyć, że1=2(albo gdy o to poprosi wykładowca)

• Gdy n1= n2, to obie metody dają te same wyniki.

2

1 y

y 

(2)

Metoda zwykła (niełączona)

• Liczymy SE1 = i SE2 =

(osobno w obu próbach).

• Obliczamy nieuśrednione SE:

1 1

s n

2 2

s n

2 2 2

)

1

( N SE  SE  SE

Metoda łączona

• Znajdujemy sumę kwadratów odchyleń dla obu prób:

, uśrednioną wariancję:

sc2= ,

a następnie uśrednione (łączone) SE:

(U)SE= .

1 2

1 2

2

SS SS n n

 

2

1 2 1 2

1 1 1 1

c c

s s

n n n n

 

  

 

 

) ( , )

( ,1 12 2 ,2 2 2

1

y y SS

y y

SS i i

Przykład:

• próba 1: n1= 15, y1= 75, SS1= 600

• próba 2: n2= 10, y2= 55, SS2= 300

Uwagi:

• Wyniki obu metod nie są takie same, ale są dość podobne.

• Zauważmy, że mieliśmy tu s1= 6.55 i s2= 5.77. (Gdy s1=s2, to oba rachunki dają to samo SE i PU.)

(3)

Przedział ufności dla 1 – 2

• Skonstruujemy przedział ufności dla12

• Przypomnienie: PU dla (pojedynczego) 

y  t/2SEy= (estymator)  (kwantyl)(SE)

• Estymator dla1-2: y1-y2

• Potrzebujemy t/2: Ile użyć stopni swobody?

(Wzoru nie trzeba pamiętać, będzie podawany.)

df=

 

   

2 2 2

1 2

4 4

1 2

1 1 2 1

SE SE

SE SE

n n

• Tak wyliczona liczba stopni swobody jest nie większa niż n1+ n2– 2. W przybliżonych obliczeniach często stosujemy df = n1+ n2– 2.

• Jest tez nie mniejsza niż minimum z wartości n1–1 i n2–1.

• Jeżeli możemy założyć, że wariancje w obu grupach są równe, to stosujemy uśredniony estymator wariancji i df = n1+ n2– 2.

• Stosujemy ``nieuśredniony’’ SE, o ile w zadaniu nie będzie specjalnie wymagane użycie (U)SE.

PU na poziomie ufności (1-) dla 1-2:

y

1

-y

2

 t(df)

/2

SE

(y1-y2)

Przykład (cd)

• Skonstruuj 95% PU dla1-2

• y1–y2 = 75 – 55 = 20

• SE1= 1.690 ; SE2= 1.826

• df=

(4)

• Oblicz przedział ufności jeszcze raz

wykorzystując „uśredniony’’ SE.

Przykład 2 - 95% PU dla 

1

- 

2

• Rośliny hodowane w różnych warunkach oświetleniowych.

Ciemno Jasno

n 22 21

y 1.76 2.46

SE 0.5 0.7

• “1” – populacja/próba hodowana przy słabym oświetleniu

• “2” – populacja/próba hodowana przy mocnym oświetleniu

• Oblicz 95% PU dla1-2.

(5)

Przedziały ufności: Interpretacja

• Nasz PU zawiera wartości zarówno dodatnie jak i ujemne? Co to znaczy?

Testowanie hipotez

Idea:

• Chcemy odpowiedzieć na pytanie naukowe dotyczące populacji

• Decyzję podejmujemy w oparciu o próbę - dysponujemy informacją fragmentaryczną

• W rezultacie możemy popełnić błąd przy podejmowaniu decyzji

• Chcemy zminimalizować p-stwo błędu

Typowe są pytania o wartości parametrów:

Dla populacji o rozkładzie Bernoulliego:

Czy p-stwo sukcesu wynosi ½?

(„Czy moneta jest symetryczna/uczciwa?”)

Czy p-stwo sukcesu wynosi p0? (p0 – pewna konkretna, interesująca nas wartość)

• Pytania dla jednego rozkładu normalnego:

Czy średnia w populacji wynosi 0?

Czy średnia w populacji wynosi 93?

Czy średnia w populacji wynosi0?

• Dla dwóch populacji normalnych:

Czy średnie wartości cechy w obu populacjach są równe?

Czy różnica między średnimi w populacjach wynosi 0?

Czy różnica między średnimi wynosi0?

(6)

• Na te pytania są możliwe odpowiedzi „tak” albo

„nie” (prawda albo fałsz).

• Pytania dotyczą całej populacji, do której na ogół nie mamy dostępu. Nasza decyzja, którą podejmujemy w oparciu o próbę, jest zagrożona błędem.

Sposób formułowania ostrożnych odpowiedzi:

• Zamiast: „Prawda” mówimy: „W oparciu o tę próbę nie możemy wykluczyć postawionej hipotezy”.

• Przykład: „Przeprowadzone badania nie potwierdzają, że badane populacje mają różny średni poziom badanej cechy.” (Ale nie można wykluczyć, że jest różnica).

• Zamiast: „Nieprawda” należałoby mówić: „Jest to mało prawdopodobne” albo: „Gdyby

postawiona hipoteza była prawdziwa, to uzyskany wynik (z próby) byłby bardzo mało prawdopodobny. Dlatego odrzucamy tę hipotezę.” (Ale możemy się mylić).

• Przykład:”Przeprowadzone badanie potwierdza tezę, że badane populacje różnią się średnią wartością badanej cechy.” (Odrzucamy hipotezę o równości średnich).

• Wprowadzimy później ilościowy

usprawiedliwiania takich decyzji (p-wartość).

Analogia: czujnik dymu

• Instalujemy czujniki dymu, aby ostrzegały przed pożarem.

• Czujniki reagują na cząstki dymu w powietrzu.

• Mogą być w dwu możliwych stanach – CICHO i GŁOŚNO

• Możemy podjąć decyzje: zostać albo uciekać

• Decyzję uzależniamy od stanu wykrywaczy dymu:

CICHO – zostajemy, GŁOŚNO – uciekamy.

• Są dwie sytuacje prawidlowej reakcji i dwie sytuacje błędnej reakcji.

(7)

• Na ogół nie ma pożaru i wykrywacz jest CICHO, więc nie reagujemy (dobra decyzja).

• Czasami nie ma pożaru, a wykrywacz jest GŁOŚNO, więc uciekamy (błędna decyzja – strata czasu) – błąd I-go rodzaju.

• Czasami jest pożar, a wykrywacz jest CICHO więc zostajemy (zła decyzja –

niebezpieczeństwo) – błąd II-go rodzaju.

• Czasami jest pożar i wykrywacz jest GŁOŚNO więc uciekamy (dobra decyzja).

Notacja: Hipotezy

• Stan podstawowy, „nie ma pożaru’’, nazywamy hipotezą zerową.

• Drugi możliwy stan, „pożar’’, nazywamy hipotezą alternatywną.

• H0to skrót dla hipotezy zerowej.

• HA to skrót dla hipotezy alternatywnej.

Decyzje

• Nasze decyzje zwykle opisujemy w odniesieniu do hipotezy zerowej H0:

– Decyzja „uciekamy” jest odrzuceniem H0, tzn.

odrzucamy stanowisko, że nie ma pożaru.

– Decyzja „zostajemy” odpowiada nieodrzuceniu H0.

• Decyzję podejmujemy w oparciu o zachowanie czujnika dymu, którego rolę w dalszym ciągu przejmie statystyka testowa, czyli pewna wielkość obliczona z próby.

• Gdy wykrywacz jest GŁOŚNO, to mówimy, że wynik testu jest ``istotny’’. Definicja: Istotny wynik powoduje odrzucenie H0.

• Gdy wykrywacz jest CICHO, to wynik testu jest

``nieistotny’’ i nie odrzucamy H0.

(8)

Podsumowanie analogii

• Hipotezy: H0= nie ma pożaru, HA= pożar

• Statystyka testowa:

nieistotna=CICHO, istotna=GŁOŚNO

• Decyzja: nie odrzucamy H0= zostajemy, odrzucamy H0= uciekamy

• Błąd I rodzaju: odrzucamy H0, choć jest prawdziwa=uciekamy, choć nie ma pożaru

• Błąd II rodzaju: nie odrzucamy H0, choć

prawdziwa jest HA= zostajemy, choć jest pożar

Uwagi:

• H0 jest bardziej precyzyjna niż HA: gdy HAjest prawdziwa, to nie znana jest skala pożaru.

• Wykrywacze dymu mają pewną ustaloną czułość – reagują na określoną ilość dymu.

• Jeżeli wykrywacz jest zbyt czuły, to będzie często powodował fałszywe alarmy (błędy I-go rodzaju).

• Jeżeli nie jest dość czuły, to nie będzie się włączał, kiedy potrzeba (błędy II-go rodzaju).

• Zwiększając czułość zmniejszamy p-stwo błędu II-go rodzaju, ale też p-stwo błędu I-go rodzaju.

• Dobór czułości testu powinien zależeć od konsekwencji błędów!

Jak opisać czułość testu?

• „Poziom istotności” (α) to p-stwo błędu I-go rodzaju. Poziom istotności powinno się ustalić jeszcze przed przeprowadzeniem

Hipoteza zerowa H

0

:

• Zwykle jest prosta i specyficzna. To właśnie ją będziemy odrzucali albo nie.

• Przykłady:

 = 0

 = 0(-0= 0)

1= 2(1–2= 0)

 - = 

(9)

Hipoteza alternatywna H

A

:

• HA jest w pewnym sensie przeciwna do H0. Na ogół jest bardziej ogólna niż H0(np. nieznany jest rozmiar pożaru)

• „Odrzucenie H0" oznacza, że wierzymy w HA

• „Nieodrzucenie H0" oznacza, że nie mamy dość silnych dowodów przemawiających za HA, ale nie to samo, co udowodnienie prawdziwości H0 (tego na ogół nie potrafimy zrobić przy pomocy statystyki)

• Przykłady HA:

  0

 > 0

 < 0

1 2(1-2 0)

1> 2 (1-2> 0)

1<2 (1-2< 0)

• Rozkład statystyki testowej przy HApowinien być inny niż przy H0(wykrywacz powinien być GŁOŚNO, a nie CICHO, gdy mamy pożar).

Przykład ilustracyjny

• Załóżmy, że mamy próbę z populacji o rozkładzie normalnym. Niech (nieznane) oznacza jego średnią. Chcemy

przetestować

• H0:  = 5

przeciw alternatywie

• HA:   5

• Możemy skonstruować przedział ufności dla  w oparciu o dane. Taki przedział ufności powinien zawierać .

Stąd:

• Jeżeli przedział ufności nie zawiera 5, to odrzucimy H0na korzyść HA.

• Jeżeli przedział ufności zawiera 5, to oznacza, że nie powinniśmy odrzucać H0. Ponieważ PU zawiera także wiele innych wartości niż 5, nie mamy też dowodu, że H0jest prawdziwa.

(10)

• PU na poziomie (1-) jest dany wzorem

y  t/2SE. Sprawdzimy, kiedy zawiera on 5:

Wniosek: wystarczy wyznaczyć t=(y – 5)/SE

i sprawdzić, czy jest pomiędzy –t/2i t/2.

• Jeżeli tak, to statystyka t jest nieistotna i nie odrzucamy H0.

• Jeżeli nie to statystyka jest istotna i odrzucamy H0. Zbiór (-∞ , –t/2) U (+t/2, ∞) nazywamy obszarem krytycznym/obszarem odrzuceń (=jeżeli statystyka testowa znajdzie się w obszarze krytycznym, to odrzucamy H0).

• Zauważmy, że postać statystyki testowej zależy od H0(bo H0 specyfikuje 5).

• Statystyka testowa

przy H0ma rozkład ...

• Zwykle nie znamy σ i zastępujemy je przez s.

• Przy H0 (y-)/SE ma rozkład Studenta z n-1 stopniami swobody.

• Stąd, jeżeli H0jest prawdziwa, to  = 5 n

y

 • Co się stanie, jeżeli prawdziwa jest HA?

Wtedy  ≠ 5 i rozkład statystyki (y-5)/SE będzie skoncentrowany blisko -5 zamiast blisko 0, i na ogół będziemy otrzymywać duże (dodatnie lub ujemne) wartości statystyki. Będą one prowadzić do odrzucenia hipotezy zerowej.

(11)

Poziom istotności

• Poziom istotności - = P-stwo błędu I-go rodzaju (odrzucenie H0, gdy jest prawdziwa;

fałszywy dodatni wynik testu).

• Załóżmy, że H0 jest prawdziwa. Jakie jest p- stwo, że statystyka testowa znajdzie się w zbiorze krytycznym (-∞ , –t/2) U (+t/2,∞)?

Uwagi:

• α wybieramy przed przystąpieniem do testowania. Typowe wartości α to 0.05, 0.01 lub 0.1. Możemy jednak stosować inne wartości. Wybór α powinien zależeć od konsekwencji błędów I-go i II-go rodzaju.

• Wartość krytyczna – wartość leżąca na granicy obszaru krytycznego.

• Rozważaliśmy zbiór krytyczny

(-∞ , –t/2) i (+t/2,∞), bo HA:  ≠ 5 , jest symetryczna (niekierunkowa).

• Możemy też być zainteresowani alternatywami, jednostronnymi, np. HA:  < 5. Wtedy obszar krytyczny ma postać: (+t,∞).

• Dlaczego?

• Dla HA:  < 5, obszar krytyczny to (-∞ , –t).

Cytaty

Powiązane dokumenty

Na tem at pracy m etodą projektów istnieje na polskim rynku wydawniczym szereg publikacji [1-10], w tym dwie rekom endow ane przez MEN. W sumie dają one szeroki

Odważnym rozwiązaniem, które jednak może spotkać się z olbrzymim oporem własnego środowiska, byłoby bowiem wykorzystanie przynajmniej w pew- nym stopniu potencjału

W zamierzeniu autora tekst ma charakter wprowadzenia i jako taki może służyć studentom bez lingwistycznego przygotowania, choć nawet sam Taylor przyznaje, że nie dotyczy to

Na szczęście, współ- cześnie nie musimy się obawiać głośnego mówienia na temat możliwych negatywnych skutków psychoterapii sprowadzających się przede wszystkim do

dzy niejawnej pierwszego rodzaju (wiedzy w postaci inkorporowanych danych doświadczenia) stanowi w porządku genetycznym warunek zaistnienia wszelkiej wiedzy - zarówno

„logicznie pierwotną ”; co więcej, nie znajdziemy jej w żadnym innym punkcie dziejów filozofii. 61), nie daje się, moim zdaniem, usensownić w obrębie stanowiska

niających wszystko systemów, pytaniami egzystencjalnymi, ani moralizowa- niem. Moja rada jest, aby się nimi nie zajmować: nie buduj wszechogarniających systemów, nie staraj

Podczas gdy Immanuel Kant stawiając pytanie „czym jest człowiek?” starał się człowieka — światowego obywatela, który jest obywatelem dwóch światów, uczynić