Przykładowe zadania na kolokwium z przedmiotu „podstawy eksploracji danych”
Zadanie 1
Z biblioteki MASS użyjesz zbioru o nazwie „survey”. Jest tam atrybut „Height” dla którego przedstaw informacje dotyczące wartośd min, max, średniej. Narysuj wykres typu pudełkowego dla tej danych.
Dodatkowo wywołaj komendy w R które są niezbędne by sprawdzid czy punkty zaznaczone na wykresie są prawidłowe.
Podpowiedź.
Ładowanie biblioteki libr ary(MASS) Obliczenie średniej: mean(survey$Height) Wykres: poszukaj wywołania – boxplot() Zadanie 2
Dla danych z zadania 1, w środowisku R wyznacz 95% przedział ufności dla wartości „Height”.
Zadanie 3
Zainteresuj się zbiorem:
http://archive.ics.uci.edu/ml/machine-learning-databases/space-shuttle/
Opisz go w kilku zdaniach. W tym celu użyj albo Excela, albo R do wczytania pliku z danymi i przedstawienia charakterystyki danych.
Zadanie 4
Dla danych z zadania 3 znormalizuj metodą min-max dane z kolumny 3, tak by zamiast zakresu 50- 200 dane miały zakres 0-10. Narzędzie: dowolne: R albo Excel, albo inne.
Zadanie 5
Sprawdź w środowisku R korelację cechy 2 i 3 dla danych z pliku
http://archive.ics.uci.edu/ml/machine-learning-databases/iris/bezdekIris.data
i porównaj wyniki z wynikami w Excelu. Zinterpretuj wyniki.
Zadanie 6
Wczytaj zbiór http://archive.ics.uci.edu/ml/machine-learning-databases/iris/bezdekIris.data Zamieo pierwszą wartośd „5.1” na 51 i w Excelu napisz formuły do wykrywania odchyleo w danych metodą zarówno z rozstępu międzykwartylowego jak i z odchylenia standardowego. Porównaj rezultaty.