• Nie Znaleziono Wyników

Spis tre´sci

N/A
N/A
Protected

Academic year: 2021

Share "Spis tre´sci"

Copied!
27
0
0

Pełen tekst

(1)

Spis tre´sci

Spis tre´sci

1 Weryfikacja hipotez statystycznych 1

1.1 Poj˛ecia . . . 1

2 Porównania z normami 3 2.1 Wst˛ep . . . 3

2.2 Porównanie z normami: warto´s´c ´srednia . . . 3

2.3 Porównanie z normami: wariancja . . . 6

2.4 Porównanie z normami: frakcja . . . 6

3 Porównanie populacji 7 3.1 Wst˛ep . . . 7

3.2 Testowanie hipotez: porównanie dwóch ´srednich . . . 9

3.3 Testowanie hipotez: porównanie dwóch wariancji . . . 11

3.4 Testowanie hipotez: porównanie dwóch frakcji . . . 12

3.5 Testowanie hipotez: porównanie wielu ´srednich . . . 14

4 Test chi-kwadrat niezale˙zno´sci 17

5 Testy diagnostyczne 20

1 Weryfikacja hipotez statystycznych

1.1 Poj˛ecia

Poj˛ecia

Hipoteza statystyczna

Dowolne przypuszczenie dotycz ˛ace rozkładu prawdopodobie´nstwa cechy w po- pulacji.

Oznaczenie H0

Test statystyczny

Post˛epowanie maj ˛ace na celu odrzucenie lub nie odrzucenie hipotezy statystycz- nej.

(2)

Statystyka testowa

Funkcja próby na podstawie której wnioskuje si˛e o odrzuceniu lub nie hipotezy statystycznej.

Poj˛ecia

Wnioskowanie

Rzeczywisto´s´c: Wniosek o hipotezie H0

nie odrzuca´c odrzuci´c H0prawdziwa prawidłowy nieprawidłowy H0 nieprawdziwa nieprawidłowy prawidłowy

Poj˛ecia

Wnioskowanie

Rzeczywisto´s´c: Wniosek o hipotezie H0 nie odrzuca´c odrzuci´c H0prawdziwa prawidłowy nieprawidłowy H0 nieprawdziwa nieprawidłowy prawidłowy

Poj˛ecia

Wnioskowanie

Rzeczywisto´s´c: Wniosek o hipotezie H0 nie odrzuca´c odrzuci´c H0 prawdziwa prawidłowy bł ˛ad I rodzaju H0 nieprawdziwa bł ˛ad II rodzaju prawidłowy

Poj˛ecia

Bł ˛ad I rodzaju

Bł ˛ad wnioskowania polegaj ˛acy na odrzuceniu hipotezy, gdy w rzeczywisto´sci jest ona prawdziwa.

Poziom istotno´sci

Dowolna liczba z przedziału (0, 1) okre´slaj ˛ac ˛a prawdopodobie´nstwo popełnienia bł˛edu I rodzaju.

Oznaczenie: α

(3)

Poj˛ecia

Bł ˛ad II rodzaju

Bł ˛ad wnioskowania polegaj ˛acy na nieodrzuceniu hipotezy, gdy w rzeczywisto´sci jest ona fałszywa.

Moc testu

Prawdopodobie´nstwo nie popełnienia bł˛edu II rodzaju.

Oznaczenie: 1 − β

2 Porównania z normami

2.1 Wst˛ep

Jedna populacja Wst˛ep

Analizujemy pewn ˛a cech˛e w populacji Porównania z normami obejmuj ˛a m.in.:

• porównanie poziomu cechy

• porównanie zró˙znicowania cechy

Jedna populacja Wst˛ep - cecha ci ˛agła Próba: X1, . . . , Xn

Charakterystyki próby:

X,¯ varX, s2 = varX n − 1

Jedna populacja

Wst˛ep - cecha dychotomiczne

ˆ p = k

n

(4)

2.2 Porównanie z normami: warto´s´c ´srednia

Rozkład normalny N (µ, σ2) Hipoteza H0 : µ = µ0

´Srednia µ oraz wariancja σ2s ˛a nieznane Test Studenta

Statystyka testowa

temp=

X − µ¯ 0

S

√n

Wnioskowanie

Warto´s´c krytyczna t(α; n − 1)

Je˙zeli |temp| > t(α; n − 1), to hipotez˛e H0 : µ = µ0odrzucamy Testowanie hipotezy H0 : µ = µ0

Przykład - tre´s´c

Przypuszczenie: maszyna pakuj ˛aca kostki masła nastawiona na jednostkow ˛a mas˛e 250 g uległa po pewnym czasie rozregulowaniu. W celu weryfikacji tego przy- puszczenia z bie˙z ˛acej produkcji pobrano prób˛e otrzymuj ˛ac wyniki 254, 269, 254, 248, 263, 256, 258, 261, 264, 258. Czy mo˙zna na tej podstawie s ˛adzi´c, ˙ze ma- szyna uległa rozregulowaniu?

Testowanie hipotezy H0 : µ = µ0

Przykład - rozwi ˛azanie

Populacja: paczkowane kostki masła Cecha X: masa kostki masła

Zało˙zenie: cecha X ma rozkład normalny N (µ, σ2)

Formalizacja: Rozregulowanie maszyny mo˙ze by´c interpretowane jako odej-

´scie od nominalnej wagi. Zatem nale˙zy zbada´c, czy ´srednia µ wynosi 250, czyli weryfikujemy hipotez˛e H0 : µ = 250

Technika statystyczna: test Studenta (test t) poziom istotno´sci α = 0.05

(5)

Testowanie hipotezy H0 : µ = µ0 Przykład - rozwi ˛azanie

Obliczenia

n = 10

¯

x = 258.5 s2 = 36.05 temp = 4.47

Testowanie hipotezy H0 : µ = µ0 Przykład - rozwi ˛azanie

Warto´s´c krytyczna: t(0.05; 9) = 2.2622

Odpowied´z:Poniewa˙z |temp| > t(0.05; 9), wi˛ec hipotez˛e H0 odrzucamy Wniosek: maszyna uległa rozregulowaniu

Testowanie hipotezy H0 : µ = µ0 Przykład - inne rozwi ˛azanie

Populacja: paczkowane kostki masła Cecha X: masa kostki masła

Zało˙zenie: cecha X ma rozkład normalny N (µ, σ2)

Formalizacja: Rozregulowanie maszyny mo˙ze by´c interpretowane jako odej-

´scie od nominalnej wagi. Zatem nale˙zy zbada´c, czy ´srednia µ wynosi 250, czyli weryfikujemy hipotez˛e H0 : µ = 250

Technika statystyczna: przedział ufno´sci dla ´sredniej µ poziom ufno´sci 1 − α = 0.95

Testowanie hipotezy H0 : µ = µ0 Przykład - inne rozwi ˛azanie Obliczenia

µ ∈ (254.20, 262.80)

Odpowied´z: Poniewa˙z µ0 = 250 6∈ (254.20, 262.80), wi˛ec hipotez˛e H0 odrzu- camy

Wniosek: maszyna uległa rozregulowaniu

(6)

Testowanie hipotezy H0 : µ = µ0 Przedział ufno´sci a test hipotezy

H0 nie odrzucamy na poziomie istotno´sci α m

µ0 nale˙zy do przedziału ufno´sci na poziomie ufno´sci 1 − α

2.3 Porównanie z normami: wariancja

Rozkład normalny N (µ, σ2) Hipoteza H0 : σ2 = σ02

´Srednia µ oraz wariancja σ2s ˛a nieznane Test chi-kwadrat

Statystyka testowa

χ2emp = varX σ02 Wnioskowanie

Warto´sci krytyczne χ2 1 −α2; n − 1 oraz χ2 α2; n − 1

Je˙zeli χ2emp < χ2 1 − α2; n − 1 lub χ2emp > χ2 α2; n − 1, to hipotez˛e H0 : σ2 = σ20 odrzucamy

2.4 Porównanie z normami: frakcja

Rozkład dwumianowy B(n, p) Hipoteza H0 : p = p0

k - liczba sukcesów w próbie n elementowej Test przybli˙zony („du˙ze” n)

Statystyka testowa

uemp= k − np0 pnp0(1 − p0) Wnioskowanie

Warto´s´c krytyczna u1−α/2

Je˙zeli |uemp| > u1−α/2, to H0 : p = p0 odrzucamy

(7)

Hipoteza H0 : p = p0 Przykład - tre´s´c

W swojej ofercie sprzeda˙zy stawu rybnego jego wła´sciciel podaje, i˙z w stawie

˙zyje tysi ˛ac karpi. Potencjalny nabywca zainteresowany jest sprawdzeniem praw- dziwo´sci tego twierdzenia. W tym celu wyłowiono sto karpi i po zaobr ˛aczkowaniu ich wpuszczono je z powrotem do stawu. Po jakim´s czasie ponownie odłowiono sto ryb i stwierdzono, ˙ze w´sród nich jest pi˛etna´scie zaobr ˛aczkowanych. Czy w

´swietle uzyskanych wyników mo˙zna reklam˛e uzna´c za prawdziw ˛a?

Hipoteza H0 : p = p0 Przykład - rozwi ˛azanie Populacja: ryby w stawie

Cecha X: ryba zaobr ˛aczkowana/nie zaobr ˛aczkowana Zało˙zenie: cecha X ma rozkład dwupunktowy D(p)

Formalizacja: Je˙zeli w stawie ˙zyje N ryb, to odsetek zaobr ˛aczkowanych wy- nosi 100/N . Zgodnie z twierdzeniem wła´sciciela, N = 1000, czyli odsetek ryb zaobr ˛aczkowanych wynosi 0.1

Technika statystyczna: Przybli˙zony test hipotezy H0 : p = 0.1 Poziom istotno´sci: α = 0.05

Hipoteza H0 : p = p0

Przykład - rozwi ˛azanie Obliczenia

n = 100 k = 15 uemp= k − np0

pnp0(1 − p0) = 15 − 10

√100 · 0.1 · 0.9 = 1.6667

Hipoteza H0 : p = p0 Przykład - rozwi ˛azanie

Warto´s´c krytyczna: u1−0.05/2 = u0.975 = 1.96

Odpowied´z: Poniewa˙z |uemp| < u0.975, wi˛ec hipotezy H0 nie odrzucamy Wniosek: mo˙zna uzna´c, ˙ze w stawie jest tysi ˛ac ryb

(8)

3 Porównanie populacji

3.1 Wst˛ep

Dwie populacje Wst˛ep

Analizujemy t˛e sam ˛a cech˛e w dwóch niezale˙znych od siebie populacjach Analiza porównawcza obejmuje m.in.:

• porównanie poziomu cech

• porównanie zró˙znicowania cech

Dwie populacje Wst˛ep - cechy ci ˛agłe

Próba z pierwszej populacji: X11, . . . , X1n1 Charakterystyki pierwszej próby:

1, varX1, s21 = varX1

n1− 1

Dwie populacje Wst˛ep - cechy ci ˛agłe

Próba z drugiej populacji: X21, . . . , X2n2

Charakterystyki drugiej próby:

2, varX2, s22 = varX2

n2− 1

Dwie populacje Wst˛ep - cechy ci ˛agłe Charakterystyki ł ˛aczne

Se2 = varX1+ varX2 n1+ n2− 2 Sr =

s Se2 1

n1

+ 1 n2



(9)

Dwie populacje

Wst˛ep - cechy dychotomiczne Pierwsza populacja:

ˆ p1 = k1

n1 Druga populacja:

ˆ p2 = k2

n2 Razem:

ˆ

p = k1+ k2 n1+ n2

3.2 Testowanie hipotez: porównanie dwóch ´srednich

Rozkłady normalne N (µ1, σ12) i N (µ2, σ22) Hipoteza H0 : µ1 = µ2

zało˙zenie: σ21 = σ22 Test Studenta Statystyka testowa

temp = X¯1− ¯X2 Sr Wnioskowanie

Warto´s´c krytyczna t(α; n1+ n2− 2)

Je˙zeli |temp| > t(α; n1+ n2− 1), to hipotez˛e H0 : µ1 = µ2 odrzucamy Hipoteza H0 : µ1 = µ2

Przykład - tre´s´c

Badano zawarto´s´c tłuszczu w serach ˙zółtych produkowanych zim ˛a i latem. W ka˙zdym z dwóch okresów zbadano zawarto´s´c tłuszczu w dziesi˛eciu serach. Na podstawie uzyskanych wyników stwierdzi´c, czy zawarto´s´c tłuszczu w serze ˙zół- tym zale˙zy od pory roku.

Sery produkowane zim ˛a:

Xx1i= 293.7, varx1 = 35.321

(10)

Sery produkowane latem:

Xx2i= 271.2, varx2 = 18.176

Hipoteza H0 : µ1 = µ2 Przykład - rozwi ˛azanie

Populacja 1: sery produkowane latem Populacja 2: sery produkowane zim ˛a Cecha X: zawarto´s´c tłuszczu

Zało˙zenia:

cecha X ma w populacji 1 rozkład N (µ1, σ12) cecha X ma w populacji 2 rozkład N (µ2, σ22) σ21 = σ22

Zadanie: weryfikacja hipotezy H0 : µ1 = µ2

Technika statystyczna: test Studenta porównania ´srednich poziom istotno´sci α = 0.05

Hipoteza H0 : µ1 = µ2 Przykład - rozwi ˛azanie Obliczenia

¯

x1 = 29.37, varX1 = 35.321

¯

x2 = 27.12, varX2 = 18.176 s2r = 35.321 + 18.176

18

 1 10+ 1

10



= 0.5944

Hipoteza H0 : µ1 = µ2 Przykład - rozwi ˛azanie Obliczenia

temp= x¯1 − ¯x2

sr = 29.37 − 27.12

0.771 = 2.918 t(0.05; 18) ≈ 2.1009

(11)

Hipoteza H0 : µ1 = µ2 Przykład - rozwi ˛azanie

Odpowied´z: Poniewa˙z |temp| > t(0.05; 18), wi˛ec hipotez˛e H0 : µ1 = µ2 odrzu- camy

Wniosek. ´Srednie zawarto´sci tłuszczu w serach produkowanych latem i zim ˛a nie s ˛a takie same.

Hipoteza H0 : µ1 = µ2 Przykład - dalsze wnioski

Poniewa˙z weryfikowana hipoteza została odrzucona, wi˛ec mo˙zna pokusi´c si˛e o ocen˛e ró˙znic mi˛edzy ´srednimi zawarto´sciami tłuszczu.

Skonstruowa´c przedział ufno´sci dla ró˙znicy µ1− µ2 ´srednich (poziom ufno´sci 0.95)

Z przeprowadzonych wcze´sniej oblicze´n otrzymujemy:

(29.37 − 27.12 − 2.1009 · 0.771, 29.37 − 27.12 + 2.1009 · 0.771) (0.631, 3.869).

Hipoteza H0 : µ1 = µ2 Przykład - dalsze wnioski

µ1− µ2 ∈ (0.631, 3.869).

Poniewa˙z oba ko´nce tego przedziału s ˛a dodatnie, wi˛ec mo˙zemy stwierdzi´c, ˙ze

´srednia zawarto´s´c tłuszczu w serach produkowanych latem jest wy˙zsza ni˙z ´sred- nia zawarto´s´c tłuszczu w serach produkowanych zim ˛a. Co wi˛ecej, przeci˛etnie w letnich serach jest tego tłuszczu wi˛ecej o co najmniej 0.631, ale nie wi˛ecej ni˙z 3.869 jednostek.

3.3 Testowanie hipotez: porównanie dwóch wariancji

Rozkłady normalne N (µ1, σ12) i N (µ2, σ22) Hipoteza H0 : σ12 = σ22

nieznane warto´sci ´srednie µ1 oraz µ2 Test F

(12)

Statystyka testowa

Femp = S12 S22

Rozkłady normalne N (µ1, σ12) i N (µ2, σ22) Hipoteza H0 : σ12 = σ22

nieznane warto´sci ´srednie µ1 oraz µ2

Wnioskowanie Warto´sci krytyczne

F 1 − α

2; n1− 1, n2− 1

oraz Fα

2; n1− 1, n2− 1

Je˙zeli Femp < F 1 − α2; n1− 1, n2− 1 lub Femp > F α2; n1 − 1, n2− 1, to hipotez˛e H0 : σ12 = σ22 odrzucamy

3.4 Testowanie hipotez: porównanie dwóch frakcji

Rozkłady dwumianowe B(n1, p1) i B(n2, p2) Hipoteza H0 : p1 = p2

zało˙zenie: n1 i n2„du˙ze”

Test przybli˙zony Statystyka testowa

uemp= pˆ1− ˆp2 q

ˆ

p(1 − ˆp)(n1

1 +n1

2) Wnioskowanie

Warto´s´c krytyczna u1−α/2

Je˙zeli |uemp| ≥ u1−α/2, to H0 : p1 = p2 odrzucamy

(13)

Hipoteza H0 : p1 = p2 Przykład - tre´s´c

Celem badania było porównanie przygotowania z matematyki kandydatów na stu- dia b˛ed ˛acych absolwentami liceów oraz techników. W tym celu spo´sród kandy- datów zdaj ˛acych matematyk˛e wylosowano 400 absolwentów liceów oraz 600 ab- solwentów techników. W wylosowanej grupie stwierdzono, ˙ze 385 absolwentów liceów oraz 501 absolwentów techników rozwi ˛azało test wst˛epny. Czy mo˙zna na tej podstawie s ˛adzi´c, ˙ze przygotowanie w obu grupach absolwentów jest jedna- kowe?

Hipoteza H0 : p1 = p2 Przykład - rozwi ˛azanie

Populacja 1: absolwenci liceów zdaj ˛acy egzamin wst˛epny

Populacja 2: absolwenci techników zdaj ˛acy egzamin wst˛epny Cecha X: umiej˛etno´s´c rozwi ˛azania testu (tak/nie)

Zało˙zenia:

cecha X ma w populacji 1 rozkład B(n1, p1) cecha X ma w populacji 2 rozkład B(n2, p2) Zadanie: Weryfikacja hipotezy H0 : p1 = p2

Technika statystyczna: Test przybli˙zony (poziom istotno´sci α = 0.05) Hipoteza H0 : p1 = p2

Przykład - rozwi ˛azanie Obliczenia

n1 = 400 k1 = 385 pˆ1 = 385/400 = 0.9625 n2 = 600 k2 = 501 pˆ2 = 501/600 = 0.8350

ˆ

p = (385 + 501)/(400 + 600) = 0.886 uemp= 0.9625 − 0.8350

q

0.886(1 − 0.886) 4001 +6001 

= 6.215

(14)

Hipoteza H0 : p1 = p2 Przykład - rozwi ˛azanie

Warto´s´c krytyczna u0.975 = 1.96

Odpowied´z: poniewa˙z |uemp| > u0.975, wi˛ec hipotez˛e H0 : p1 = p2 odrzu- camy

Wniosek: przygotowanie absolwentów liceów i techników z matematyki nie jest takie same

Hipoteza H0 : p1 = p2 Przykład - dalsze wnioski

Poniewa˙z weryfikowana hipoteza została odrzucona, wi˛ec mo˙zna pokusi´c si˛e o ocen˛e ró˙znic mi˛edzy odsetkami absolwentów, którzy zdaj ˛a pomy´slnie egzamin.

Skonstruowa´c przedział ufno´sci dla ró˙znicy p1− p2 ´srednich (poziom ufno´sci 0.95)

Z przeprowadzonych wcze´sniej oblicze´n otrzymujemy:

(0.9625 − 0.8350 − 1.96 · 0.0205, 0.9625 − 0.8350 + 1.96 · 0.0205) (0.0873, 0.1677).

Hipoteza H0 : p1 = p2 Przykład - dalsze wnioski

p1 − p2 ∈ (0.0873, 0.1677).

Poniewa˙z oba ko´nce tego przedziału s ˛a dodatnie, wi˛ec mo˙zemy stwierdzi´c, ˙ze absolwenci liceów s ˛a lepiej przygotowani do egzaminu ni˙z absolwenci techników.

Co wi˛ecej, odsetek absolwentów liceów pozytywnie zdaj ˛acych egzamin jest wy˙z- szy od odsetka absolwentów techników o co najmniej 8.7%, ale nie wi˛ecej ni˙z 16.8%.

3.5 Testowanie hipotez: porównanie wielu ´srednich

Kilka populacji Wst˛ep

Analizujemy t˛e sam ˛a cech˛e w kilku niezale˙znych od siebie populacjach Analiza porównawcza obejmuje m.in.:

(15)

• porównanie poziomu cech

• porównanie zró˙znicowania cech

Kilka populacji Wst˛ep - cechy ci ˛agłe

Próba z i-tej populacji: Xi1, . . . , Xini (i = 1, . . . , K) Charakterystyki i-tej próby:

i, varXi, s2i = varXi ni− 1

Kilka populacji Wst˛ep - cechy ci ˛agłe Charakterystyki ł ˛aczne

N = n1+ · · · + nK

¯¯ X = 1

N

K

X

i=1 ni

X

j=1

Xij

Se2 = varX1+ · · · + varXK N − K

Rozkłady normalne N (µi, σi2), i = 1, . . . , K Hipoteza H0 : µ1 = · · · = µK

zało˙zenie: σ21 = · · · = σK2 Test F

Statystyka testowa

Femp= PK

i=1( ¯Xi− ¯X)¯ 2/(K − 1) Se2

Wnioskowanie

Warto´s´c krytyczna F (α; K − 1, N − K)

Je˙zeli Femp > F (α; K − 1, N − K), to hipotez˛e H0 : µ1 = · · · = µK odrzu- camy

(16)

Rozkłady normalne N (µi, σi2), i = 1, . . . , K Tabela analizy wariancji

Zródło´ Stopnie Sumy ´Srednie Femp

zmienno´sci swobody kwadratów kwadraty

Czynnik k − 1 varA Sa2 = vark−1A Sa2/Se2 Bł ˛ad losowy N − k varE Se2 = N −kvarE

Ogółem N − 1 varT

Rozkłady normalne N (µi, σi2), i = 1, . . . , K Wniosek praktyczny

Przynajmniej jedna ze ´srednich µ1, . . . , µkjest inna od pozostałych.

Pytanie

Jaki jest układ ´srednich?

Grupa jednorodna

Podzbiór ´srednich, które mo˙zna uzna´c za takie same.

Rozkłady normalne N (µi, σi2), i = 1, . . . , K Procedury porówna ´n wielokrotnych

Tukeya, Scheffégo, Bonfferroniego, Duncana, Newmana–Kuelsa Ogólna idea

N IR — najmniejsza istotna ró˙znica Je˙zeli

| ¯Xi− ¯Xj| < N IR

| ¯Xi− ¯Xl| < N IR

| ¯Xl− ¯Xj| < N IR,

to uznajemy, ˙ze µi = µj = µl. ANOVA - przykład

Przykład

Przeprowadzi´c analiz˛e porównawcz ˛a wyników punktowych klasówki w grupach studenckich.

(17)

ANOVA - przykład Przykład

Populacje: dziesi˛e´c populacji indeksowanych numerami grup studenckich Badana cecha: ilo´s´c punktów uzyskanych na klasówce

Zało˙zenia:

cecha X ma w i–tej populacji rozkład N (µi, σi2) (i = 1, . . . , 10) σ21 = · · · = σ102

ANOVA - przykład Przykład

Formalizacja

weryfikacja hipotezy H0 : µ1 = · · · = µ10 Techniki statystyczne

• Jednoczynnikowa analiza wariancji

• Porównania szczegółowe Poziom istotno´sci 0.05

4 Test chi-kwadrat niezale˙zno´sci

Test chi-kwadrat niezale˙zno´sci Przykład

W celu stwierdzenia, czy podanie chorym na pewn ˛a chorob˛e nowego leku przy- nosi popraw˛e w ich stanie zdrowia wylosowano dwie grupy pacjentów w jednako- wym stopniu chorych na t˛e chorob˛e. Jednej grupie podawano nowy lek, za´s dru- giej podawano leki tradycyjne. Na podstawie zanotowanych zmian stanu zdrowia zbada´c, czy nowy lek daje inne efekty leczenia ni˙z lek tradycyjny.

lek bez wyra´zna całkowite poprawy poprawa wyleczenie

nowy 20 40 60

tradycyjny 45 20 15

(18)

Test chi-kwadrat niezale˙zno´sci Posta´c danych

Klasy Klasy cechy X

cechy Y 1 2 . . . m

1 n11 n12 . . . n1m 2 n21 n22 . . . n2m

... ... ... ... k nk1 nk2 . . . nkm

Test chi-kwadrat niezale˙zno´sci Statystyka testowa

χ2emp=

k

X

i=1 m

X

j=1

(nij − ntij)2 ntij gdzie

ntij = nn·j

N , N =

k

X

i=1 m

X

j=1

nij

n =

m

X

j=1

nij, n·j =

k

X

i=1

nij

Test chi-kwadrat niezale˙zno´sci Wnioskowanie

Je˙zeli χ2emp > χ2(α; (k − 1)(m − 1)), to hipotez˛e hipotez˛e o niezale˙zno´sci cech odrzucamy

Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie

Populacja: chorzy na pewn ˛a chorob˛e

Cechy (X, Y ): (zmiana stanu zdrowia, rodzaj leku) Zało˙zenia: cechy maj ˛a charakter jako´sciowy

Zadanie: Weryfikacja hipotezy badane cechy s ˛a niezale˙zne

Technika statystyczna: Test niezale˙zno´sci chi-kwadrat (poziom istotno´sci α = 0.05)

(19)

Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie

Obliczenia:

liczba osób, których stan zdrowia:

bez poprawy: 65 wyra´zna poprawa: 60 całkowicie wyleczonych: 75 liczba osób:

leczonych nowym lekiem: 120 leczonych tradycyjnie: 80 Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie

Gdyby stan zdrowia nie zale˙zał od leku, to powinno by´c

lek bez wyra´zna całkowite poprawy poprawa wyleczenie

nowy 39 36 45

tradycyjny 26 24 30

a jest

lek bez wyra´zna całkowite poprawy poprawa wyleczenie

nowy 20 40 60

tradycyjny 45 20 15

Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie

Warto´s´c statystyki testu chi-kwadrat niezale˙zno´sci χ2emp= 36.75 Warto´s´c krytyczna: 5.99

Stwierdzamy, ˙ze nowy lek ma inne działanie ni˙z tradycyjny.

(20)

Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie

lek bez wyra´zna całkowite poprawy poprawa wyleczenie

nowy 16.67% 33.33% 50.00%

tradycyjny 56.25% 25.00% 18.75%

32.50% 30.00% 37.50%

Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie

5 Testy diagnostyczne

Przykład Test CRP

CRP (białko C-reaktywne) jest czułym wska´znikiem ostrych i przewlekłych sta- nów zapalnych o ró˙znym pochodzeniu. Poziom CRP, jednego z tzw. białek ostrej fazy, wzrasta w surowicy i osoczu w trakcie ogólnej, niespecyficznej odpowie- dzi na infekcje (głównie bakteryjne) oraz stany zapalne bez tła infekcyjnego(...) Oznaczenie st˛e˙zenia CRP wykorzystuje si˛e w diagnostyce (...)

Fizjologiczne st˛e˙zenie CRP nie przekracza 5 mg/L, st˛e˙zenie wi˛eksze ni˙z 10 mg/L uznawane jest za patologiczne.

(21)

Poj˛ecia Wynik testu

Rzeczywisto´s´c: Wynik testu

dodatni ujemny

chory (+) prawidłowy nieprawidłowy zdrowy (-) nieprawidłowy prawidłowy

Poj˛ecia Wynik testu

Rzeczywisto´s´c: Wynik testu

dodatni ujemny

chory (+) prawidłowy nieprawidłowy zdrowy (-) nieprawidłowy prawidłowy

Poj˛ecia Wynik testu

Rzeczywisto´s´c: Wynik testu

dodatni ujemny

chory (+) prawdziwie dodatni nieprawdziwie ujemny zdrowy (-) nieprawdziwie do-

datni prawdziwie ujemny

Poj˛ecia Czuło´s´c testu

prawdopodobie´nstwo uzyskania wyniku prawdziwie dodatniego to znaczy

prawdopodobie´nstwo uzyskania wyniku dodatniego dla osoby chorej okre´sla zdolno´s´c testu do wykrywania osób chorych

(22)

Poj˛ecia

Swoisto´s´c testu

prawdopodobie´nstwo uzyskania wyniku prawdziwie ujemnego to znaczy

prawdopodobie´nstwo uzyskania wyniku ujemnego dla osoby zdrowej okre´sla zdolno´s´c testu do wykrywania osób zdrowych

Zadanie Cel

Wyznaczy´c warto´s´c krytyczn ˛a dla testu minimalizuj ˛ac ˛a prawdopodobie´nstwa bł˛e- dów.

To znaczy jak najbardziej czułego i o jak najwi˛ekszej swoisto´sci Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

(23)

Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

(24)

Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

Przykład

Zdrowi i chorzy

(25)

barierka swoisto´s´c czuło´s´c

4 15.87% 99.87%

5 50.00% 97.72%

6 84.13% 84.13%

7 97.72% 50.00%

8 99.87% 15.87%

9 100.00% 2.28%

Przykład

Krzywa ROC (odsetek wyników pozytywnych)

(26)

barierka 1-swoisto´s´c czuło´s´c

4 84.13% 99.87%

5 50.00% 97.72%

6 15.87% 84.13%

7 2.28% 50.00%

8 0.13% 15.87%

9 0.00% 2.28%

Przykład Krzywa ROC

Nieznajomo´s´c matematyki zabija Irena Cie´sli ´nska GW 21.11.2014

Zrobiłam mammografi˛e. Dostałam wynik. Pozytywny. - Czy mam raka, dokto- rze? - zapytałam.

- Czuło´s´c testu wynosi 87 proc. To nie oznacza z cał ˛a pewno´sci ˛a, ˙ze ma pani nowotwór, bo zawsze jest jeszcze szansa, ˙ze zalicza si˛e pani do 13 proc.

szcz˛e´sliwców. Radziłbym wykona´c teraz dodatkowe badania, biopsj˛e.

- Ale ryzyko, ˙ze mam raka, wynosi jakie´s 87 proc.?

- Niestety tak. Przykro mi to mówi´c.

(27)

A jak powinno by´c Czuło´s´c wynosi 87%

P {wynik pozytywny|osoba chora} = 0.87 Swoisto´s´c wynosi 93%

P {wynik pozytywny|osoba zdrowa} = 0.07

A jak powinno by´c

Cz˛esto´s´c wyst˛epowania choroby wynosi 0.7%

P {osoba chora} = 0.007 Ogólny odsetek wyników pozytywnych

P {wynik pozytywny} =

P {wynik pozytywny|osoba chora} · P {osoba chora}+

P {wynik pozytywny|osoba zdrowa} · P {osoba zdrowa} = 0.87 · 0.007 + 0.07 · 0.993 = 0.0756

A jak powinno by´c

Ryzyko choroby przy pozytywnym wyniku P {osoba chora|wynik pozytywny} =

P {wynik pozytywny|osoba chora} · P {osoba chora}

P {wynik pozytywny} =

0.87 · 0.007

0.0756 = 0.0805

Cytaty

Powiązane dokumenty

Projektowanie układów elektroniki odczytu pracuj ˛ acych w trybie zliczania pojedynczych fotonów.. Tryby pracy układów do odczytu

Omówiono w nich modele planowania produkcji wykorzystywane w zaawansowanych systemach planowania APS (Advanced Plan- nig and Scheduling), przedstawiono dwie koncepcje

Technologie realizacji agentowych systemów obliczeniowych ..... Referencyjne rozwi ˛

Badania eksperymentalne czujników jako elementów systemu pomiarowego.. Eksperymenty na stanowisku

Ogólna charakterystyka problemów transportowych i sterowania ruchem drogowym.. Definicja klasycznego

Po´srednie sterowanie polowo zorientowane – IFOC.. Struktura

TWORZENIE I DYSTRYBUCJA WARTO ´SCI W SEKTORACH PRZEMYSŁOWYCH GOSPODARKI POLSKIEJ. 75

Wyniki – regularne punkty pomiarowe, zbie˙zno´s´c do minimum lokalnego.. Wyniki – nieregularne punkty pomiarowe