Zadania – Laboratorium 4.
Przygotowanie:
Dane: "KrukUWr2017.Rdata"
Biblioteki: mice, VIM
ZAD 0. Stwórz nową ramkę danych „events1” bazując na ramce „events”, która będzie zawierała tylko dane z pierwszego miesiąca
ZAD 1. – Rozpoznaj czy i w jakich zmiennych występują braki danych w podanych zbiorach „cases” i
„events1”. Zwróć uwagę jak są oznaczone (nie zawsze jest to NA)
ZAD 2. - Czy w podanych zbiorach danych widzisz zmienne, dla których uzupełnianie braków nie ma sensu (wręcz mogłoby być błędem) lub można je pominąć ze względu na wnoszenie zbyt małej informacji do danych?
ZAD 3. - Wskaż zmienne (pary zmiennych), dla których braki danych są ze sobą powiązane i uzasadnij swoją odpowiedź – najlepiej liczbowo i słownie
ZAD 4. - Uzupełnij braki danych dla zmiennych LoanAmount, Age i Gender poprzez uzupełnienie średnią, medianą, modą (dominantą), wartością stałą. Co zauważasz w kontekście rozkładu wskazanych zmiennych po uzupełnieniu?
ZAD 5. Uzupełnij braki danych zmiennych LoanAmount, Bailiff, Gender poprzez losowanie z ich rozkładów. Porównaj otrzymane wyniki z pierwotnymi danymi (histogram, gęstość ,boxplot lub inną metodą)
5A. Do losowania z rozkładu danej zmiennej możesz stworzyć dedykowaną funkcję z parametrami „dane” i „nazwa zmiennej”