Podstawy statystyki praktycznej, lista zadań nr 1
Konwersatorium
1. Dla poniższych zbiorów danych:
a) 8.3; 13.0; 10.2; 9.8; 10.3; 9.5; 10.6; 6.1; 9.7; 11.1; 10.3; 9.5; 10.1; 10.3; 10.5; 10.7 b) 111; 94; 112; 105; 108; 105; 110; 105; 99; 97; 87; 111; 94; 100; 113; 125; 113; 70; 89;
101; 106; 94; 110; 87; 104
oblicz średnią próbkową, wariancję próbkową nieobciążoną, wariancję próbkową obcią- żoną, medianę próbkową, pierwszy kwartyl próbkowy i trzeci kwartyl próbkowy.
2. Dla danych z zad. 1 zgromadź wszystkie informacje potrzebne informacje, a następnie sporządź wykresy pudełkowe. Oczywiście Twoje wykresy nie muszą być dokładne; ze względu na swój brak precyzji będą jedynie szkicami, jednak istotne jest, abyś zaznaczył na osi wszystkie potrzebne liczby. Kwartyle próbkowe oblicz według innego algorytmu niż w zadaniu 1 tj. w taki sposób, jak do sporządzenia wykresu pudełkowego oblicza je R.
Laboratorium
1. Nie wykorzystując żadnych funkcji statystycznych dostępnych w R, napisz funkcje my.mean, my.var.unbias, my.var.bias.1, my.var.bias.2, my.sd, my.median, my.1st.quart i my.3rd.quart służące do wyznaczenia odpowiednio średniej próbkowej, wariancji prób- kowej nieobciążonej, wariancji próbkowej obciążonej (obliczanej według dwóch podanych na wykładzie wzorów odpowiednio), próbkowego odchylenia standardowego otrzymanego jako pierwiastek z wariancji próbkowej nieobciążonej, mediany próbkowej, pierwszego kwartyla próbkowego i trzeciego kwartyla próbkowego. Do napisania danej funkcji mo- żesz wykorzystać funkcje zdefiniowane przez siebie wcześniej.
Zastosuj te funkcje do obliczenia tychże statystyk opisowych na podstawie zbiorów danych umieszczonych w zadaniu przeznaczonym na konwersatorium. Wyniki umieść w tabeli.
Dodatkowo celem porównania umieść w tej samej tabeli analogiczne wyniki uzyskane za pomocą R-owych funkcji mean, var (bezpośrednio i po odpowiednim przeskalowaniu), sd, median i quantile. Dla przejrzystości prezentacji wyników zaokrąglij wszystkie wyniki w tabeli do czterech miejsc po przecinku.
2. Za pomocą poleceń
set.seed(100); X=rnorm(100,10,1); Z=rnorm(100,1.5,0.1)
wygeneruj wektor z danymi X oraz wektor pomocniczy Z. Dla danych z wektora X spo- rządź wykres pudełkowy za pomocą polecenia boxplot, jednak ustaw zakres osi OX na [0.5, 2]. Następnie do wykresu dorysuj zbiór punktów o pierwszych współrzędnych zawar- tych w wektorze X i drugich współrzędnych zawartych w wektorze Z. Dzięki temu obok Twojego wykresu pudełkowego pojawią się dane, za pomocą których sporządziłeś wy- kres. Korzystając z bezpośrednio lub pośrednio funkcji, które napisałeś w zad. 1, oraz nowych funkcji my.other.1st.quart i my.other.3rd.quart wyznaczających kwartyle próbkowe w taki sposób, jak czyni to R na potrzeby sporządzenia wykresu pudełkowego, oblicz wszystkie liczby potrzebne do narysowania wykresu pudełkowego: medianę prób- kową, pierwszy i trzeci kwartyl próbkowy oraz zakresy dolnego i górnego wąsa. Dorysuj do wykresu poziome proste oznaczające pięć wspomnianych wyżej wartości, tak aby pokryły się z odpowiednimi elementami wykresu pudełkowego.