Ćwiczenia 8 & 9 (ggplot2)

(1)

Ćwiczenia 8 & 9 (Wizualizacja i przetwarzanie danych)

Zbiory danych dla zadań 1-8 znajdują się w pakiecie PogromcyDanych (wersja angielska). 1. Dla zbioru danych cats_birds przedstaw zależność pomiędzy zmiennymi length oraz speed na wykresie rozrzutu. Dodaj trend liniowy do wykresu. Obie grupy zwierząt powinny mieć własną prostą regresji oraz typ i kolor punktów.

2. W zbiorze danych pearson mamy informacje o wysokości ojców i synów. Przedstaw zależność pomiędzy tymi cechami na wykresie rozrzutu. Dodaj trend liniowy bez przedziału ufności. 3. W zbiorze danych seriesIMDB mamy informacje o odcinkach około 200 seriali. Stwórz wykres, w którym na osi Y będzie nazwa serialu, a na osi X wykres pudełkowy ocen odcinków danego serialu. Popraw wykres tak, aby seriale były posortowane według median ocen.

4. W zbiorze danych diagnosis mamy zmienną eduk4_2013 z poziomami edukacji i zmienną gp29 z odpowiedziami na pytanie co jest najważniejsze w życiu. Stwórz wykres słupkowy. Każdy słupek odpowiada jednemu poziomowi edukacji. Każdy słupek powinien być podzielony na części wypełnione różnymi kolorami w zależności od zmiennej gp29.

5. Ze zbioru auta2012 wybierz jedynie auta Volkswagen Passat. Użyj funkcji geom_smooth(), aby przedstawić zależność pomiędzy rokiem produkcji i ceną. Spróbuj zastosować różne szablony wykresu.

6. Zmień poniższy wykres:

ggplot(cats_birds, aes(x = weight, y = speed, size = lifespan, color = lifespan)) + geom_point()

Zastąp skalę kolorów na gradient od koloru zielonego do czerwonego i zastąp kropki kwadratami. Dodaj tytuł i etykiety osi.

7. Ze zbioru danych auta2012 wybierz wszystkie samochody marki Toyota. Na wykresie koło-wym zwizualizuj liczbę pięciu najpopularniejszych modeli. Następnie te same dane przedstaw na wykresie słupkowym w kolejności malejących liczebności. Nie zapomnij o legendzie.

8. Dla wzrostu synów i ojców ze zbioru danych pearson narysuj na jednym wykresie histogram wraz z nieparametryczną oceną gęstości dla każdej cechy. Linie pomiędzy słupkami histogramu pokoloruj na biało. Oba wykresy powinny być obok siebie na jednym diagramie.

9. Dla zbioru danych iris przygotuj obrazek jak na Rysunku 1. Rozważ użycie funkcji geom_density2d() oraz theme_light().

10. Dla zbioru danych iris przygotuj obrazek jak na Rysunku 2. 11. Dla zbioru danych mtcars przygotuj obrazek jak na Rysunku 3.

12. Dla zbioru danych economics z pakietu ggplot2 przygotuj obrazek jak na Rysunku 4. Wy-korzystaj szablon theme_economist_white() z pakietu ggthemes.

(2)

ĆWICZENIA 8 & 9 (WIZUALIZACJA I PRZETWARZANIE DANYCH) 2 2.0 2.5 3.0 3.5 4.0 4.5 5 6 7 8 Sepal Length Sepal Width Species setosa versicolor virginica Iris dataset

Rysunek 1. Rysunek do Zadania 9

versicolor virginica ALL setosa 3.0 3.5 4.0 4.5 5.0 4.5 5.0 5.5 6.0 6.5 7.0 2 4 6 1.00 1.25 1.50 1.75 0.0 0.2 0.4 0.6 1.5 2.0 2.5 0.0 0.5 1.0 1.5 2.0 2.5 0.8 1.0 1.2 1.4 1.6 1.8 Petal Length Petal Width

(3)

ĆWICZENIA 8 & 9 (WIZUALIZACJA I PRZETWARZANIE DANYCH) 3 Mazda RX4 Mazda RX4 Wag Datsun 710 Hornet 4 Drive Hornet Sportabout Valiant Duster 360 Merc 240D Merc 230 Merc 280 Merc 280C Merc 450SE Merc 450SL Merc 450SLC Cadillac Fleetwood Lincoln Continental Chrysler Imperial Fiat 128 Honda Civic Toyota Corolla Toyota Corona Dodge Challenger AMC Javelin Camaro Z28 Pontiac Firebird Fiat X1-9 Porsche 914-2 Lotus Europa Ford Pantera L Ferrari Dino Maserati Bora Volvo 142E 10 20 30 40

Miles per gallon fuel consumption

Rysunek 3. Rysunek do Zadania 11

0 5 10 15 20 25 1970 1980 1990 2000 2010

Median duration of unemployment (weeks)

Median duration of unemployment (weeks)