Zadanie domowe 1
W ramach prac nad wczesnym rozpoznawaniem pewnej choroby genetycznej postawiono hipotez¦, »e jednym z jej objawów jest podwy»szony poziom fosforu we krwi. W celu zwery-
kowania tej hipotezy oznaczono st¦»enie fosforu we krwi u 100 osób, u których zdiagno- zowano t¦ chorob¦, oraz u 100 osób, u których mimo pewnych podobnych objawów chorob¦
t¦ wykluczono. Porównaj warto±¢ oczekiwan¡ st¦»enia fosforu w obu grupach za pomoc¡
odpowiedniego testu, sprawdzaj¡c jednak uprzednio, czy nie ma podstaw do twierdzenia, »e jego istotne zaªo»enia nie s¡ speªnione, i zwerykuj postawion¡ hipotez¦ badawcz¡.
Obliczenia nale»y wykona¢ w arkuszu kalkulacyjnym Gnumeric. Plik instalacyjny jed- nej z ostatnich wersji udost¦pnionych na systemy operacyjne z rodziny Windows (obecnie program ten w wersji na systemy operacyjne z rodziny Windows nie jest rozwijany) mo»na pobra¢ z nast¦puj¡cej lokalizacji: http://www.math.uni.wroc.pl/∼dyba/lz/gnumeric-1.12.17- 20140610.exe.
Rozwi¡zanie zadania powinno zawiera¢ m.in. nast¦puj¡ce elementy:
r¦czne sporz¡dzenie wykresu kwantylowo-kwantylowego przeciwko rodzinie roz- kªadów normalnych dla obu prób oraz dla porównania automatyczne sporz¡dzenie takiego wykresu,
r¦czne obliczenie kwartyli prókowych dla obu prób oraz dla porównania obliczenie ich za pomoc¡ gotowych funkcji,
automatyczne wygenerowanie wykresu pudeªkowego dla obu prób dopuszczaj¡cego oznaczanie obserwacji odstaj¡cych,
r¦czne obliczenie warto±ci statystyki testowej testu Koªmogorowa-Smirnowa z po- prawk¡ Lillieforsa dla obu prób oraz dla porównania automatyczne obliczenie tych warto±ci a nadto p-warto±ci (za pomoc¡ gotowych funkcji lub za pomoc¡ wyplujki z moduªu statystycznego),
r¦czne obliczenie warto±ci statystyki testowej testu Shapiro-Francii dla obu prób oraz dla porównania automatyczne obliczenie tych warto±ci a nadto p-warto±ci (za pomoc¡ gotowej funkcji lub za pomoc¡ wyplujki z moduªu statystycznego),
r¦czne obliczenie warto±ci statystyki testowej, r¦czne wyznaczenie obszaru kry- tycznego (nie tylko podanie odpowiedniego kwantyla) i r¦czne obliczenie p-warto±ci testu sªu»¡cego do sprawdzenia zaªo»enia o homoskedastyczno±ci danych oraz dla porównania automatyczne obliczenie tych wielko±ci (za pomoc¡ gotowej funkcji, je±li takie istniej¡, lub za pomoc¡ wyplujki z moduªu statystycznego),
r¦czne obliczenie warto±ci statystyki testowej, r¦czne wyznaczenie obszaru kry- tycznego (nie tylko podanie odpowiedniego kwantyla) i r¦czne obliczenie p-warto±ci testu Studenta dla dwóch prób niezale»nych oraz dla porównania automatyczne ob- liczenie tych wielko±ci (za pomoc¡ gotowej funkcji, je±li takie istniej¡, lub za pomoc¡
wyplujki z moduªu statystycznego). Przy stwierdzeniu, »e zaªo»enie o homoskeda- styczno±ci nie jest speªnione, nale»y wykona¢ test Welcha (obliczaj¡c r¦cznie i automatycznie wszystkie elementy wymienione dla testu Studenta dla dwóch prób niezale»nych).
Rozwi¡zanie powinno stanowi¢ logiczny opis poszczególnych kroków i ich znaczenia dla caªo±ci rozumowania (czyli nie tylko odpowied¹ na pytanie: co?, ale tak»e: po co?).
W przypadku testów statystycznych za ka»dym razem nale»y ±ci±le i przejrzy±cie zanoto- wa¢ obie testowane hipotezy a tak»e wynik testu w j¦zyku testowanego problemu (a nie tylko zdawkowe odrzucam H na rzecz K ). Nale»y te» poda¢ poziom istotno±ci, na jakim przeprowadza si¦ dany test (poziom istotno±ci mo»e by¢ ten sam dla wszystkich przepro- wadzanych testów). W przypadku wykresów nale»y przedstawi¢ pªyn¡ce z nich wnioski.
Oceniana b¦dzie nie tylko strona merytoryczna rozwi¡zania, ale tak»e przejrzysto±¢ spo- sobu zaprezentowania rozwi¡zania w arkuszu kalkulacyjnym. Dla uªatwienia sprawdzania prosi si¦ o niestosowanie komentarzy, które s¡ widoczne dopiero po najechaniu kursorem na odpowiednie znaczniki.
Jako owoc pracy nale»y przesªa¢ na adres dyba@math.uni.wroc.pl arkusz kalkulacyjny w formacie .gnumeric zawieraj¡cy wszystkie obliczenia, wykresy, komentarze i wnioski. Nie nale»y przesyªa¢ »adnych innych plików poza tym jednym. Plikowi nale»y nada¢ nazw¦
postaci: Imie_Nazwisko_1.gnumeric. Przed przyst¡pieniem do pracy nale»y koniecznie zapisa¢ dane w formacie .gnumeric, gdy» u»ycie w programie Gnumeric funkcji niedost¦p- nych w programie MS Excel i zapisanie efektów pracy w formacie innym ni» .gnumeric mo»e spowodowa¢ utrat¦ cz¦±ci owocu pracy.
Aby zobiektywizowa¢ sposób oceniania, zadanie domowe nale»y wykona¢ nie w oparciu o rzeczywiste dane, ale o dane pochodz¡ce z symulacji. Przed przyst¡pieniem do rozwi¡- zywania zadania nale»y przygotowa¢ sobie zbiór danych do pracy w oparciu o narz¦dzie dost¦pne na stronie http://www.generatedata.com. W sekcji DATA SET nale»y wypeªni¢
tabel¦ w nast¦puj¡cy sposób (na niniejszej stronie przecinek dziesi¦tny w formie kropki):
1. Column Title: Grupa badawcza, imi¦ i nazwisko (lub podobnie), Data Type: Names, Examples: Alex Smith;
2. Column Title: Grupa badawcza, st¦»enie fosforu [mmol/l] (lub podobnie), Data Type: Normal Distribution, Mean: 1.25, Deviation: 0.2.
3. Column Title: Grupa kontrolna, imi¦ i nazwisko (lub podobnie), Data Type: Names, Examples: Alex Smith;
4. Column Title: Grupa kontrolna, st¦»enie fosforu [mmol/l] (lub podobnie), Data Type: Normal Distribution, Mean: 1.2, Deviation: 0.2;
W sekcji EXPORT TYPES nale»y wybra¢ kart¦ Excel. Nast¦pnie nale»y klikn¡¢ przycisk Generate i zapisa¢ dane na swoim komputerze. Przykªadowy wygenerowany zbiór danych zamie±ciªem na swojej stronie. Ka»dy student powinien wykona¢ zadanie w oparciu o inny zbór danych. W wypadku dostarczenia przez ró»nych studentów prac ªudz¡co podobnych do siebie, osoby, które dostarczyªy takie prace, otrzymaj¡ 0 punktów.
Rozwi¡zanie zadania nale»y przesªa¢ najpó¹niej w godzinach przedpoªudniowych 18 kwietnia 2016 roku (poniedziaªek).
W razie w¡tpliwo±ci zach¦cam do kontaktu za pomoc¡ poczty elektronicznej lub w ja- kikolwiek inny sposób.
Kamil Dyba