Metody probabilistyczne i statystyka
Estymacja i testowanie hipotez statystycznych dla dwóch populacji w Ra
Szybkie wprowadzenie do R
— Do wczytania danych z pliku csv posłuż się funkcją read.csv, do której przekaż jeszcze para- metry sep=";" (średnik oddziela dane), dec="," (przecinek oddziela część całkowitą od części ułamkowej).
— Do sprawdzenia hipotezy o jednorodności wariancji w dwóch populacjach posłużą się Państwo testem Fishera — w R służy do tego funkcja var.test, która (oprócz formuły y~x) przyjmuje następujące parametry:
? data — ramka danych, skąd czerpane są dane do formuły,
? ratio — stosunek wariancji σ
2 1
σ22 w hipotezie (domyślnie 1, co oznacza równość wariancji),
? alternative — napis określający hipotezę alternatywną: dopuszczalnymi wartościami są
"two.sided", "less", "greater",
? conf.level — poziom ufności.
Funkcja zwraca obiekt klasy htest, która zawiera te same pola, co obiekt zwrócony przez funkcję t.test.
— Do sprawdzenia hipotezy o równości średnich w dwóch populacjach posłużą się Państwo znaną funkcją t.test, do której przekażecie Państwo formułę, tak jak w przypadku funkcji var.test (parametr mu w tym przypadku oznacza testowaną różnicę między średnimi — domyślnie 0 ozna- cza równość średnich). Proszę też ustawić parametr var.equal=TRUE (prawdziwe założenie o równości obu wariancji), gdy test Fishera przeszedł — w przeciwnym wypadku proszę nie ruszać tego parametru (domyślnie var.equal=FALSE).
— Do wykonania testu Shapiro-Wilka w kilku grupach można posłużyć się funkcją by, gdzie pierw- szym parametrem jest wektor z danymi (np. kolumna ze wzrostem), drugim parametrem jest zmienna grupująca (np. płeć), a trzecim funkcja (np. shapiro.test).
— Dla testu równości wskaźników struktury: prop.test(c(l1, l2), c(n1, n2))
Zadania do samodzielnego rozwiązania
1. Dla zmiennej Waga w grupie kobiet:
a) na poziomie istotności α = 0,01 sprawdzić założenie o normalności rozkładu za pomocą testu Shapiro-Wilka (użyć shapiro.test, sformułować hipotezy, podać statystykę testową, poziom p i wniosek),
b) wyznaczyć przedziały ufności dla średniej wagi w populacji wszystkich studentek I roku WI w tym roku akademickim (poziom ufności 0,98),
a Dla wszystkich testów podać hipotezy, wartości statystyk, poziom p i wnioski.
1
c) wyznaczyć przedział ufności dla odchylenia standardowego wagi w populacji studentek I roku WI (poziom ufności 0,95)
d) na poziomie istotności 0,05 zweryfikować hipotezę, że średnia waga w populacji studentek I roku WI jest mniejsza niż 70 kg (użyć t.test).
2. Na podstawie danych z ankiety proszę porównać Wzrost w grupie kobiet i mężczyzn:
a) na poziomie istotności α = 0,05 sprawdzić za pomocą testu Shapiro-Wilka założenie o nor- malności rozkładu w obu grupach,
b) na poziomie istotności α = 0,05 sprawdzić założenie o jednorodnych wariancjach w obu gru- pach testem Fishera,
c) na poziomie istotności α = 0,05 zweryfikować za pomocą testu Studenta hipotezę, że średni wzrost w populacji studentek I roku na WI jest niższy niż w populacji studentów (gdy założenie o równości wariancji nie jest spełnione zastosować korektę Welcha).
3. Na podstawie danych w pliku Ankieta 2019 używając zmiennej L.godzin porównać studentów studiów stacjonarnych oraz niestacjonarnych I roku na W:
a) na poziomie istotności α = 0,05 sprawdzić za pomocą testu Shapiro-Wilka założenie o nor- malności rozkładu w obu grupach,
b) na poziomie istotności α = 0,05 sprawdzić założenie o jednorodnych wariancjach w obu gru- pach testem Fishera,
c) na poziomie istotności α = 0,05 zweryfikować za pomocą testu Studenta hipotezę, że średnia liczba godzin spędzanych w ciągu doby przy komputerze w populacji wszystkich studentów nie zależy od formy studiów (gdy założenie o równości wariancji nie jest spełnione zastosować korektę Welcha).
4. Używając zmiennej M.zamieszk oraz funkcji table i prop.test:
a) z ufnością 0,98 wyznaczyć przedział ufności dla odsetka osób mieszkających w akademiku w populacji studentów I roku WI,
b) sprawdzić, czy odsetek osób, które mieszkają w akademiku w populacji wszystkich studentów I roku na WI jest istotnie większy niż 15% (przyjąć poziom istotności α = 0,05).
5. Sprawdzić, czy odsetek osób, które ukończyły Technikum Informatyczne dla studentów stu- diów stacjonarnych jest istotnie większy niż dla studentów studiów niestacjonarnych w populacji wszystkich studentów I roku na WI (przyjąć poziom istotności 0.05, użyć table i prop.test).
Pod koniec zajęć proszę przysłać wygenerowaną kartę odpowiedzi na adres pt.labki@gmail.com, wpisując w temacie numer grupy.
2