Spis tre´sci
Spis tre´sci
1 Weryfikacja hipotez statystycznych 1
1.1 Poj˛ecia . . . 1
2 Porównania z normami 3 2.1 Wst˛ep . . . 3
2.2 Porównanie z normami: warto´s´c ´srednia . . . 3
2.3 Porównanie z normami: wariancja . . . 6
2.4 Porównanie z normami: frakcja . . . 6
3 Porównanie populacji 7 3.1 Wst˛ep . . . 7
3.2 Testowanie hipotez: porównanie dwóch ´srednich . . . 9
3.3 Testowanie hipotez: porównanie dwóch wariancji . . . 11
3.4 Testowanie hipotez: porównanie dwóch frakcji . . . 12
3.5 Testowanie hipotez: porównanie wielu ´srednich . . . 14
4 Test chi-kwadrat niezale˙zno´sci 17
5 Testy diagnostyczne 20
1 Weryfikacja hipotez statystycznych
1.1 Poj˛ecia
Poj˛ecia
Hipoteza statystyczna
Dowolne przypuszczenie dotycz ˛ace rozkładu prawdopodobie´nstwa cechy w po- pulacji.
Oznaczenie H0
Test statystyczny
Post˛epowanie maj ˛ace na celu odrzucenie lub nie odrzucenie hipotezy statystycz- nej.
Statystyka testowa
Funkcja próby na podstawie której wnioskuje si˛e o odrzuceniu lub nie hipotezy statystycznej.
Poj˛ecia
Wnioskowanie
Rzeczywisto´s´c: Wniosek o hipotezie H0
nie odrzuca´c odrzuci´c H0prawdziwa prawidłowy nieprawidłowy H0 nieprawdziwa nieprawidłowy prawidłowy
Poj˛ecia
Wnioskowanie
Rzeczywisto´s´c: Wniosek o hipotezie H0 nie odrzuca´c odrzuci´c H0prawdziwa prawidłowy nieprawidłowy H0 nieprawdziwa nieprawidłowy prawidłowy
Poj˛ecia
Wnioskowanie
Rzeczywisto´s´c: Wniosek o hipotezie H0 nie odrzuca´c odrzuci´c H0 prawdziwa prawidłowy bł ˛ad I rodzaju H0 nieprawdziwa bł ˛ad II rodzaju prawidłowy
Poj˛ecia
Bł ˛ad I rodzaju
Bł ˛ad wnioskowania polegaj ˛acy na odrzuceniu hipotezy, gdy w rzeczywisto´sci jest ona prawdziwa.
Poziom istotno´sci
Dowolna liczba z przedziału (0, 1) okre´slaj ˛ac ˛a prawdopodobie´nstwo popełnienia bł˛edu I rodzaju.
Oznaczenie: α
Poj˛ecia
Bł ˛ad II rodzaju
Bł ˛ad wnioskowania polegaj ˛acy na nieodrzuceniu hipotezy, gdy w rzeczywisto´sci jest ona fałszywa.
Moc testu
Prawdopodobie´nstwo nie popełnienia bł˛edu II rodzaju.
Oznaczenie: 1 − β
2 Porównania z normami
2.1 Wst˛ep
Jedna populacja Wst˛ep
Analizujemy pewn ˛a cech˛e w populacji Porównania z normami obejmuj ˛a m.in.:
• porównanie poziomu cechy
• porównanie zró˙znicowania cechy
Jedna populacja Wst˛ep - cecha ci ˛agła Próba: X1, . . . , Xn
Charakterystyki próby:
X,¯ varX, s2 = varX n − 1
Jedna populacja
Wst˛ep - cecha dychotomiczne
ˆ p = k
n
2.2 Porównanie z normami: warto´s´c ´srednia
Rozkład normalny N (µ, σ2) Hipoteza H0 : µ = µ0
´Srednia µ oraz wariancja σ2s ˛a nieznane Test Studenta
Statystyka testowa
temp=
X − µ¯ 0
S
√n
Wnioskowanie
Warto´s´c krytyczna t(α; n − 1)
Je˙zeli |temp| > t(α; n − 1), to hipotez˛e H0 : µ = µ0odrzucamy Testowanie hipotezy H0 : µ = µ0
Przykład - tre´s´c
Przypuszczenie: maszyna pakuj ˛aca kostki masła nastawiona na jednostkow ˛a mas˛e 250 g uległa po pewnym czasie rozregulowaniu. W celu weryfikacji tego przy- puszczenia z bie˙z ˛acej produkcji pobrano prób˛e otrzymuj ˛ac wyniki 254, 269, 254, 248, 263, 256, 258, 261, 264, 258. Czy mo˙zna na tej podstawie s ˛adzi´c, ˙ze ma- szyna uległa rozregulowaniu?
Testowanie hipotezy H0 : µ = µ0
Przykład - rozwi ˛azanie
Populacja: paczkowane kostki masła Cecha X: masa kostki masła
Zało˙zenie: cecha X ma rozkład normalny N (µ, σ2)
Formalizacja: Rozregulowanie maszyny mo˙ze by´c interpretowane jako odej-
´scie od nominalnej wagi. Zatem nale˙zy zbada´c, czy ´srednia µ wynosi 250, czyli weryfikujemy hipotez˛e H0 : µ = 250
Technika statystyczna: test Studenta (test t) poziom istotno´sci α = 0.05
Testowanie hipotezy H0 : µ = µ0 Przykład - rozwi ˛azanie
Obliczenia
n = 10
¯
x = 258.5 s2 = 36.05 temp = 4.47
Testowanie hipotezy H0 : µ = µ0 Przykład - rozwi ˛azanie
Warto´s´c krytyczna: t(0.05; 9) = 2.2622
Odpowied´z:Poniewa˙z |temp| > t(0.05; 9), wi˛ec hipotez˛e H0 odrzucamy Wniosek: maszyna uległa rozregulowaniu
Testowanie hipotezy H0 : µ = µ0 Przykład - inne rozwi ˛azanie
Populacja: paczkowane kostki masła Cecha X: masa kostki masła
Zało˙zenie: cecha X ma rozkład normalny N (µ, σ2)
Formalizacja: Rozregulowanie maszyny mo˙ze by´c interpretowane jako odej-
´scie od nominalnej wagi. Zatem nale˙zy zbada´c, czy ´srednia µ wynosi 250, czyli weryfikujemy hipotez˛e H0 : µ = 250
Technika statystyczna: przedział ufno´sci dla ´sredniej µ poziom ufno´sci 1 − α = 0.95
Testowanie hipotezy H0 : µ = µ0 Przykład - inne rozwi ˛azanie Obliczenia
µ ∈ (254.20, 262.80)
Odpowied´z: Poniewa˙z µ0 = 250 6∈ (254.20, 262.80), wi˛ec hipotez˛e H0 odrzu- camy
Wniosek: maszyna uległa rozregulowaniu
Testowanie hipotezy H0 : µ = µ0 Przedział ufno´sci a test hipotezy
H0 nie odrzucamy na poziomie istotno´sci α m
µ0 nale˙zy do przedziału ufno´sci na poziomie ufno´sci 1 − α
2.3 Porównanie z normami: wariancja
Rozkład normalny N (µ, σ2) Hipoteza H0 : σ2 = σ02
´Srednia µ oraz wariancja σ2s ˛a nieznane Test chi-kwadrat
Statystyka testowa
χ2emp = varX σ02 Wnioskowanie
Warto´sci krytyczne χ2 1 −α2; n − 1 oraz χ2 α2; n − 1
Je˙zeli χ2emp < χ2 1 − α2; n − 1 lub χ2emp > χ2 α2; n − 1, to hipotez˛e H0 : σ2 = σ20 odrzucamy
2.4 Porównanie z normami: frakcja
Rozkład dwumianowy B(n, p) Hipoteza H0 : p = p0
k - liczba sukcesów w próbie n elementowej Test przybli˙zony („du˙ze” n)
Statystyka testowa
uemp= k − np0 pnp0(1 − p0) Wnioskowanie
Warto´s´c krytyczna u1−α/2
Je˙zeli |uemp| > u1−α/2, to H0 : p = p0 odrzucamy
Hipoteza H0 : p = p0 Przykład - tre´s´c
W swojej ofercie sprzeda˙zy stawu rybnego jego wła´sciciel podaje, i˙z w stawie
˙zyje tysi ˛ac karpi. Potencjalny nabywca zainteresowany jest sprawdzeniem praw- dziwo´sci tego twierdzenia. W tym celu wyłowiono sto karpi i po zaobr ˛aczkowaniu ich wpuszczono je z powrotem do stawu. Po jakim´s czasie ponownie odłowiono sto ryb i stwierdzono, ˙ze w´sród nich jest pi˛etna´scie zaobr ˛aczkowanych. Czy w
´swietle uzyskanych wyników mo˙zna reklam˛e uzna´c za prawdziw ˛a?
Hipoteza H0 : p = p0 Przykład - rozwi ˛azanie Populacja: ryby w stawie
Cecha X: ryba zaobr ˛aczkowana/nie zaobr ˛aczkowana Zało˙zenie: cecha X ma rozkład dwupunktowy D(p)
Formalizacja: Je˙zeli w stawie ˙zyje N ryb, to odsetek zaobr ˛aczkowanych wy- nosi 100/N . Zgodnie z twierdzeniem wła´sciciela, N = 1000, czyli odsetek ryb zaobr ˛aczkowanych wynosi 0.1
Technika statystyczna: Przybli˙zony test hipotezy H0 : p = 0.1 Poziom istotno´sci: α = 0.05
Hipoteza H0 : p = p0
Przykład - rozwi ˛azanie Obliczenia
n = 100 k = 15 uemp= k − np0
pnp0(1 − p0) = 15 − 10
√100 · 0.1 · 0.9 = 1.6667
Hipoteza H0 : p = p0 Przykład - rozwi ˛azanie
Warto´s´c krytyczna: u1−0.05/2 = u0.975 = 1.96
Odpowied´z: Poniewa˙z |uemp| < u0.975, wi˛ec hipotezy H0 nie odrzucamy Wniosek: mo˙zna uzna´c, ˙ze w stawie jest tysi ˛ac ryb
3 Porównanie populacji
3.1 Wst˛ep
Dwie populacje Wst˛ep
Analizujemy t˛e sam ˛a cech˛e w dwóch niezale˙znych od siebie populacjach Analiza porównawcza obejmuje m.in.:
• porównanie poziomu cech
• porównanie zró˙znicowania cech
Dwie populacje Wst˛ep - cechy ci ˛agłe
Próba z pierwszej populacji: X11, . . . , X1n1 Charakterystyki pierwszej próby:
X¯1, varX1, s21 = varX1
n1− 1
Dwie populacje Wst˛ep - cechy ci ˛agłe
Próba z drugiej populacji: X21, . . . , X2n2
Charakterystyki drugiej próby:
X¯2, varX2, s22 = varX2
n2− 1
Dwie populacje Wst˛ep - cechy ci ˛agłe Charakterystyki ł ˛aczne
Se2 = varX1+ varX2 n1+ n2− 2 Sr =
s Se2 1
n1
+ 1 n2
Dwie populacje
Wst˛ep - cechy dychotomiczne Pierwsza populacja:
ˆ p1 = k1
n1 Druga populacja:
ˆ p2 = k2
n2 Razem:
ˆ
p = k1+ k2 n1+ n2
3.2 Testowanie hipotez: porównanie dwóch ´srednich
Rozkłady normalne N (µ1, σ12) i N (µ2, σ22) Hipoteza H0 : µ1 = µ2
zało˙zenie: σ21 = σ22 Test Studenta Statystyka testowa
temp = X¯1− ¯X2 Sr Wnioskowanie
Warto´s´c krytyczna t(α; n1+ n2− 2)
Je˙zeli |temp| > t(α; n1+ n2− 1), to hipotez˛e H0 : µ1 = µ2 odrzucamy Hipoteza H0 : µ1 = µ2
Przykład - tre´s´c
Badano zawarto´s´c tłuszczu w serach ˙zółtych produkowanych zim ˛a i latem. W ka˙zdym z dwóch okresów zbadano zawarto´s´c tłuszczu w dziesi˛eciu serach. Na podstawie uzyskanych wyników stwierdzi´c, czy zawarto´s´c tłuszczu w serze ˙zół- tym zale˙zy od pory roku.
Sery produkowane zim ˛a:
Xx1i= 293.7, varx1 = 35.321
Sery produkowane latem:
Xx2i= 271.2, varx2 = 18.176
Hipoteza H0 : µ1 = µ2 Przykład - rozwi ˛azanie
Populacja 1: sery produkowane latem Populacja 2: sery produkowane zim ˛a Cecha X: zawarto´s´c tłuszczu
Zało˙zenia:
cecha X ma w populacji 1 rozkład N (µ1, σ12) cecha X ma w populacji 2 rozkład N (µ2, σ22) σ21 = σ22
Zadanie: weryfikacja hipotezy H0 : µ1 = µ2
Technika statystyczna: test Studenta porównania ´srednich poziom istotno´sci α = 0.05
Hipoteza H0 : µ1 = µ2 Przykład - rozwi ˛azanie Obliczenia
¯
x1 = 29.37, varX1 = 35.321
¯
x2 = 27.12, varX2 = 18.176 s2r = 35.321 + 18.176
18
1 10+ 1
10
= 0.5944
Hipoteza H0 : µ1 = µ2 Przykład - rozwi ˛azanie Obliczenia
temp= x¯1 − ¯x2
sr = 29.37 − 27.12
0.771 = 2.918 t(0.05; 18) ≈ 2.1009
Hipoteza H0 : µ1 = µ2 Przykład - rozwi ˛azanie
Odpowied´z: Poniewa˙z |temp| > t(0.05; 18), wi˛ec hipotez˛e H0 : µ1 = µ2 odrzu- camy
Wniosek. ´Srednie zawarto´sci tłuszczu w serach produkowanych latem i zim ˛a nie s ˛a takie same.
Hipoteza H0 : µ1 = µ2 Przykład - dalsze wnioski
Poniewa˙z weryfikowana hipoteza została odrzucona, wi˛ec mo˙zna pokusi´c si˛e o ocen˛e ró˙znic mi˛edzy ´srednimi zawarto´sciami tłuszczu.
Skonstruowa´c przedział ufno´sci dla ró˙znicy µ1− µ2 ´srednich (poziom ufno´sci 0.95)
Z przeprowadzonych wcze´sniej oblicze´n otrzymujemy:
(29.37 − 27.12 − 2.1009 · 0.771, 29.37 − 27.12 + 2.1009 · 0.771) (0.631, 3.869).
Hipoteza H0 : µ1 = µ2 Przykład - dalsze wnioski
µ1− µ2 ∈ (0.631, 3.869).
Poniewa˙z oba ko´nce tego przedziału s ˛a dodatnie, wi˛ec mo˙zemy stwierdzi´c, ˙ze
´srednia zawarto´s´c tłuszczu w serach produkowanych latem jest wy˙zsza ni˙z ´sred- nia zawarto´s´c tłuszczu w serach produkowanych zim ˛a. Co wi˛ecej, przeci˛etnie w letnich serach jest tego tłuszczu wi˛ecej o co najmniej 0.631, ale nie wi˛ecej ni˙z 3.869 jednostek.
3.3 Testowanie hipotez: porównanie dwóch wariancji
Rozkłady normalne N (µ1, σ12) i N (µ2, σ22) Hipoteza H0 : σ12 = σ22
nieznane warto´sci ´srednie µ1 oraz µ2 Test F
Statystyka testowa
Femp = S12 S22
Rozkłady normalne N (µ1, σ12) i N (µ2, σ22) Hipoteza H0 : σ12 = σ22
nieznane warto´sci ´srednie µ1 oraz µ2
Wnioskowanie Warto´sci krytyczne
F 1 − α
2; n1− 1, n2− 1
oraz Fα
2; n1− 1, n2− 1
Je˙zeli Femp < F 1 − α2; n1− 1, n2− 1 lub Femp > F α2; n1 − 1, n2− 1, to hipotez˛e H0 : σ12 = σ22 odrzucamy
3.4 Testowanie hipotez: porównanie dwóch frakcji
Rozkłady dwumianowe B(n1, p1) i B(n2, p2) Hipoteza H0 : p1 = p2
zało˙zenie: n1 i n2„du˙ze”
Test przybli˙zony Statystyka testowa
uemp= pˆ1− ˆp2 q
ˆ
p(1 − ˆp)(n1
1 +n1
2) Wnioskowanie
Warto´s´c krytyczna u1−α/2
Je˙zeli |uemp| ≥ u1−α/2, to H0 : p1 = p2 odrzucamy
Hipoteza H0 : p1 = p2 Przykład - tre´s´c
Celem badania było porównanie przygotowania z matematyki kandydatów na stu- dia b˛ed ˛acych absolwentami liceów oraz techników. W tym celu spo´sród kandy- datów zdaj ˛acych matematyk˛e wylosowano 400 absolwentów liceów oraz 600 ab- solwentów techników. W wylosowanej grupie stwierdzono, ˙ze 385 absolwentów liceów oraz 501 absolwentów techników rozwi ˛azało test wst˛epny. Czy mo˙zna na tej podstawie s ˛adzi´c, ˙ze przygotowanie w obu grupach absolwentów jest jedna- kowe?
Hipoteza H0 : p1 = p2 Przykład - rozwi ˛azanie
Populacja 1: absolwenci liceów zdaj ˛acy egzamin wst˛epny
Populacja 2: absolwenci techników zdaj ˛acy egzamin wst˛epny Cecha X: umiej˛etno´s´c rozwi ˛azania testu (tak/nie)
Zało˙zenia:
cecha X ma w populacji 1 rozkład B(n1, p1) cecha X ma w populacji 2 rozkład B(n2, p2) Zadanie: Weryfikacja hipotezy H0 : p1 = p2
Technika statystyczna: Test przybli˙zony (poziom istotno´sci α = 0.05) Hipoteza H0 : p1 = p2
Przykład - rozwi ˛azanie Obliczenia
n1 = 400 k1 = 385 pˆ1 = 385/400 = 0.9625 n2 = 600 k2 = 501 pˆ2 = 501/600 = 0.8350
ˆ
p = (385 + 501)/(400 + 600) = 0.886 uemp= 0.9625 − 0.8350
q
0.886(1 − 0.886) 4001 +6001
= 6.215
Hipoteza H0 : p1 = p2 Przykład - rozwi ˛azanie
Warto´s´c krytyczna u0.975 = 1.96
Odpowied´z: poniewa˙z |uemp| > u0.975, wi˛ec hipotez˛e H0 : p1 = p2 odrzu- camy
Wniosek: przygotowanie absolwentów liceów i techników z matematyki nie jest takie same
Hipoteza H0 : p1 = p2 Przykład - dalsze wnioski
Poniewa˙z weryfikowana hipoteza została odrzucona, wi˛ec mo˙zna pokusi´c si˛e o ocen˛e ró˙znic mi˛edzy odsetkami absolwentów, którzy zdaj ˛a pomy´slnie egzamin.
Skonstruowa´c przedział ufno´sci dla ró˙znicy p1− p2 ´srednich (poziom ufno´sci 0.95)
Z przeprowadzonych wcze´sniej oblicze´n otrzymujemy:
(0.9625 − 0.8350 − 1.96 · 0.0205, 0.9625 − 0.8350 + 1.96 · 0.0205) (0.0873, 0.1677).
Hipoteza H0 : p1 = p2 Przykład - dalsze wnioski
p1 − p2 ∈ (0.0873, 0.1677).
Poniewa˙z oba ko´nce tego przedziału s ˛a dodatnie, wi˛ec mo˙zemy stwierdzi´c, ˙ze absolwenci liceów s ˛a lepiej przygotowani do egzaminu ni˙z absolwenci techników.
Co wi˛ecej, odsetek absolwentów liceów pozytywnie zdaj ˛acych egzamin jest wy˙z- szy od odsetka absolwentów techników o co najmniej 8.7%, ale nie wi˛ecej ni˙z 16.8%.
3.5 Testowanie hipotez: porównanie wielu ´srednich
Kilka populacji Wst˛ep
Analizujemy t˛e sam ˛a cech˛e w kilku niezale˙znych od siebie populacjach Analiza porównawcza obejmuje m.in.:
• porównanie poziomu cech
• porównanie zró˙znicowania cech
Kilka populacji Wst˛ep - cechy ci ˛agłe
Próba z i-tej populacji: Xi1, . . . , Xini (i = 1, . . . , K) Charakterystyki i-tej próby:
X¯i, varXi, s2i = varXi ni− 1
Kilka populacji Wst˛ep - cechy ci ˛agłe Charakterystyki ł ˛aczne
N = n1+ · · · + nK
¯¯ X = 1
N
K
X
i=1 ni
X
j=1
Xij
Se2 = varX1+ · · · + varXK N − K
Rozkłady normalne N (µi, σi2), i = 1, . . . , K Hipoteza H0 : µ1 = · · · = µK
zało˙zenie: σ21 = · · · = σK2 Test F
Statystyka testowa
Femp= PK
i=1( ¯Xi− ¯X)¯ 2/(K − 1) Se2
Wnioskowanie
Warto´s´c krytyczna F (α; K − 1, N − K)
Je˙zeli Femp > F (α; K − 1, N − K), to hipotez˛e H0 : µ1 = · · · = µK odrzu- camy
Rozkłady normalne N (µi, σi2), i = 1, . . . , K Tabela analizy wariancji
Zródło´ Stopnie Sumy ´Srednie Femp
zmienno´sci swobody kwadratów kwadraty
Czynnik k − 1 varA Sa2 = vark−1A Sa2/Se2 Bł ˛ad losowy N − k varE Se2 = N −kvarE
Ogółem N − 1 varT
Rozkłady normalne N (µi, σi2), i = 1, . . . , K Wniosek praktyczny
Przynajmniej jedna ze ´srednich µ1, . . . , µkjest inna od pozostałych.
Pytanie
Jaki jest układ ´srednich?
Grupa jednorodna
Podzbiór ´srednich, które mo˙zna uzna´c za takie same.
Rozkłady normalne N (µi, σi2), i = 1, . . . , K Procedury porówna ´n wielokrotnych
Tukeya, Scheffégo, Bonfferroniego, Duncana, Newmana–Kuelsa Ogólna idea
N IR — najmniejsza istotna ró˙znica Je˙zeli
| ¯Xi− ¯Xj| < N IR
| ¯Xi− ¯Xl| < N IR
| ¯Xl− ¯Xj| < N IR,
to uznajemy, ˙ze µi = µj = µl. ANOVA - przykład
Przykład
Przeprowadzi´c analiz˛e porównawcz ˛a wyników punktowych klasówki w grupach studenckich.
ANOVA - przykład Przykład
Populacje: dziesi˛e´c populacji indeksowanych numerami grup studenckich Badana cecha: ilo´s´c punktów uzyskanych na klasówce
Zało˙zenia:
cecha X ma w i–tej populacji rozkład N (µi, σi2) (i = 1, . . . , 10) σ21 = · · · = σ102
ANOVA - przykład Przykład
Formalizacja
weryfikacja hipotezy H0 : µ1 = · · · = µ10 Techniki statystyczne
• Jednoczynnikowa analiza wariancji
• Porównania szczegółowe Poziom istotno´sci 0.05
4 Test chi-kwadrat niezale˙zno´sci
Test chi-kwadrat niezale˙zno´sci Przykład
W celu stwierdzenia, czy podanie chorym na pewn ˛a chorob˛e nowego leku przy- nosi popraw˛e w ich stanie zdrowia wylosowano dwie grupy pacjentów w jednako- wym stopniu chorych na t˛e chorob˛e. Jednej grupie podawano nowy lek, za´s dru- giej podawano leki tradycyjne. Na podstawie zanotowanych zmian stanu zdrowia zbada´c, czy nowy lek daje inne efekty leczenia ni˙z lek tradycyjny.
lek bez wyra´zna całkowite poprawy poprawa wyleczenie
nowy 20 40 60
tradycyjny 45 20 15
Test chi-kwadrat niezale˙zno´sci Posta´c danych
Klasy Klasy cechy X
cechy Y 1 2 . . . m
1 n11 n12 . . . n1m 2 n21 n22 . . . n2m
... ... ... ... k nk1 nk2 . . . nkm
Test chi-kwadrat niezale˙zno´sci Statystyka testowa
χ2emp=
k
X
i=1 m
X
j=1
(nij − ntij)2 ntij gdzie
ntij = ni·n·j
N , N =
k
X
i=1 m
X
j=1
nij
ni· =
m
X
j=1
nij, n·j =
k
X
i=1
nij
Test chi-kwadrat niezale˙zno´sci Wnioskowanie
Je˙zeli χ2emp > χ2(α; (k − 1)(m − 1)), to hipotez˛e hipotez˛e o niezale˙zno´sci cech odrzucamy
Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie
Populacja: chorzy na pewn ˛a chorob˛e
Cechy (X, Y ): (zmiana stanu zdrowia, rodzaj leku) Zało˙zenia: cechy maj ˛a charakter jako´sciowy
Zadanie: Weryfikacja hipotezy badane cechy s ˛a niezale˙zne
Technika statystyczna: Test niezale˙zno´sci chi-kwadrat (poziom istotno´sci α = 0.05)
Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie
Obliczenia:
liczba osób, których stan zdrowia:
bez poprawy: 65 wyra´zna poprawa: 60 całkowicie wyleczonych: 75 liczba osób:
leczonych nowym lekiem: 120 leczonych tradycyjnie: 80 Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie
Gdyby stan zdrowia nie zale˙zał od leku, to powinno by´c
lek bez wyra´zna całkowite poprawy poprawa wyleczenie
nowy 39 36 45
tradycyjny 26 24 30
a jest
lek bez wyra´zna całkowite poprawy poprawa wyleczenie
nowy 20 40 60
tradycyjny 45 20 15
Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie
Warto´s´c statystyki testu chi-kwadrat niezale˙zno´sci χ2emp= 36.75 Warto´s´c krytyczna: 5.99
Stwierdzamy, ˙ze nowy lek ma inne działanie ni˙z tradycyjny.
Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie
lek bez wyra´zna całkowite poprawy poprawa wyleczenie
nowy 16.67% 33.33% 50.00%
tradycyjny 56.25% 25.00% 18.75%
32.50% 30.00% 37.50%
Test chi-kwadrat niezale˙zno´sci Przykład - rozwi ˛azanie
5 Testy diagnostyczne
Przykład Test CRP
CRP (białko C-reaktywne) jest czułym wska´znikiem ostrych i przewlekłych sta- nów zapalnych o ró˙znym pochodzeniu. Poziom CRP, jednego z tzw. białek ostrej fazy, wzrasta w surowicy i osoczu w trakcie ogólnej, niespecyficznej odpowie- dzi na infekcje (głównie bakteryjne) oraz stany zapalne bez tła infekcyjnego(...) Oznaczenie st˛e˙zenia CRP wykorzystuje si˛e w diagnostyce (...)
Fizjologiczne st˛e˙zenie CRP nie przekracza 5 mg/L, st˛e˙zenie wi˛eksze ni˙z 10 mg/L uznawane jest za patologiczne.
Poj˛ecia Wynik testu
Rzeczywisto´s´c: Wynik testu
dodatni ujemny
chory (+) prawidłowy nieprawidłowy zdrowy (-) nieprawidłowy prawidłowy
Poj˛ecia Wynik testu
Rzeczywisto´s´c: Wynik testu
dodatni ujemny
chory (+) prawidłowy nieprawidłowy zdrowy (-) nieprawidłowy prawidłowy
Poj˛ecia Wynik testu
Rzeczywisto´s´c: Wynik testu
dodatni ujemny
chory (+) prawdziwie dodatni nieprawdziwie ujemny zdrowy (-) nieprawdziwie do-
datni prawdziwie ujemny
Poj˛ecia Czuło´s´c testu
prawdopodobie´nstwo uzyskania wyniku prawdziwie dodatniego to znaczy
prawdopodobie´nstwo uzyskania wyniku dodatniego dla osoby chorej okre´sla zdolno´s´c testu do wykrywania osób chorych
Poj˛ecia
Swoisto´s´c testu
prawdopodobie´nstwo uzyskania wyniku prawdziwie ujemnego to znaczy
prawdopodobie´nstwo uzyskania wyniku ujemnego dla osoby zdrowej okre´sla zdolno´s´c testu do wykrywania osób zdrowych
Zadanie Cel
Wyznaczy´c warto´s´c krytyczn ˛a dla testu minimalizuj ˛ac ˛a prawdopodobie´nstwa bł˛e- dów.
To znaczy jak najbardziej czułego i o jak najwi˛ekszej swoisto´sci Przykład
Zdrowi i chorzy
Przykład
Zdrowi i chorzy
Przykład
Zdrowi i chorzy
Przykład
Zdrowi i chorzy
Przykład
Zdrowi i chorzy
Przykład
Zdrowi i chorzy
Przykład
Zdrowi i chorzy
Przykład
Zdrowi i chorzy
barierka swoisto´s´c czuło´s´c
4 15.87% 99.87%
5 50.00% 97.72%
6 84.13% 84.13%
7 97.72% 50.00%
8 99.87% 15.87%
9 100.00% 2.28%
Przykład
Krzywa ROC (odsetek wyników pozytywnych)
barierka 1-swoisto´s´c czuło´s´c
4 84.13% 99.87%
5 50.00% 97.72%
6 15.87% 84.13%
7 2.28% 50.00%
8 0.13% 15.87%
9 0.00% 2.28%
Przykład Krzywa ROC
Nieznajomo´s´c matematyki zabija Irena Cie´sli ´nska GW 21.11.2014
Zrobiłam mammografi˛e. Dostałam wynik. Pozytywny. - Czy mam raka, dokto- rze? - zapytałam.
- Czuło´s´c testu wynosi 87 proc. To nie oznacza z cał ˛a pewno´sci ˛a, ˙ze ma pani nowotwór, bo zawsze jest jeszcze szansa, ˙ze zalicza si˛e pani do 13 proc.
szcz˛e´sliwców. Radziłbym wykona´c teraz dodatkowe badania, biopsj˛e.
- Ale ryzyko, ˙ze mam raka, wynosi jakie´s 87 proc.?
- Niestety tak. Przykro mi to mówi´c.
A jak powinno by´c Czuło´s´c wynosi 87%
P {wynik pozytywny|osoba chora} = 0.87 Swoisto´s´c wynosi 93%
P {wynik pozytywny|osoba zdrowa} = 0.07
A jak powinno by´c
Cz˛esto´s´c wyst˛epowania choroby wynosi 0.7%
P {osoba chora} = 0.007 Ogólny odsetek wyników pozytywnych
P {wynik pozytywny} =
P {wynik pozytywny|osoba chora} · P {osoba chora}+
P {wynik pozytywny|osoba zdrowa} · P {osoba zdrowa} = 0.87 · 0.007 + 0.07 · 0.993 = 0.0756
A jak powinno by´c
Ryzyko choroby przy pozytywnym wyniku P {osoba chora|wynik pozytywny} =
P {wynik pozytywny|osoba chora} · P {osoba chora}
P {wynik pozytywny} =
0.87 · 0.007
0.0756 = 0.0805