• Nie Znaleziono Wyników

Ćwiczenia 8 & 9 (ggplot2)

N/A
N/A
Protected

Academic year: 2021

Share "Ćwiczenia 8 & 9 (ggplot2)"

Copied!
3
0
0

Pełen tekst

(1)

Ćwiczenia 8 & 9 (Wizualizacja i przetwarzanie danych)

Zbiory danych dla zadań 1-8 znajdują się w pakiecie PogromcyDanych (wersja angielska). 1. Dla zbioru danych cats_birds przedstaw zależność pomiędzy zmiennymi length oraz speed na wykresie rozrzutu. Dodaj trend liniowy do wykresu. Obie grupy zwierząt powinny mieć własną prostą regresji oraz typ i kolor punktów.

2. W zbiorze danych pearson mamy informacje o wysokości ojców i synów. Przedstaw zależność pomiędzy tymi cechami na wykresie rozrzutu. Dodaj trend liniowy bez przedziału ufności. 3. W zbiorze danych seriesIMDB mamy informacje o odcinkach około 200 seriali. Stwórz wykres, w którym na osi Y będzie nazwa serialu, a na osi X wykres pudełkowy ocen odcinków danego serialu. Popraw wykres tak, aby seriale były posortowane według median ocen.

4. W zbiorze danych diagnosis mamy zmienną eduk4_2013 z poziomami edukacji i zmienną gp29 z odpowiedziami na pytanie co jest najważniejsze w życiu. Stwórz wykres słupkowy. Każdy słupek odpowiada jednemu poziomowi edukacji. Każdy słupek powinien być podzielony na części wypełnione różnymi kolorami w zależności od zmiennej gp29.

5. Ze zbioru auta2012 wybierz jedynie auta Volkswagen Passat. Użyj funkcji geom_smooth(), aby przedstawić zależność pomiędzy rokiem produkcji i ceną. Spróbuj zastosować różne szablony wykresu.

6. Zmień poniższy wykres:

ggplot(cats_birds, aes(x = weight, y = speed, size = lifespan, color = lifespan)) + geom_point()

Zastąp skalę kolorów na gradient od koloru zielonego do czerwonego i zastąp kropki kwadratami. Dodaj tytuł i etykiety osi.

7. Ze zbioru danych auta2012 wybierz wszystkie samochody marki Toyota. Na wykresie koło-wym zwizualizuj liczbę pięciu najpopularniejszych modeli. Następnie te same dane przedstaw na wykresie słupkowym w kolejności malejących liczebności. Nie zapomnij o legendzie.

8. Dla wzrostu synów i ojców ze zbioru danych pearson narysuj na jednym wykresie histogram wraz z nieparametryczną oceną gęstości dla każdej cechy. Linie pomiędzy słupkami histogramu pokoloruj na biało. Oba wykresy powinny być obok siebie na jednym diagramie.

9. Dla zbioru danych iris przygotuj obrazek jak na Rysunku 1. Rozważ użycie funkcji geom_density2d() oraz theme_light().

10. Dla zbioru danych iris przygotuj obrazek jak na Rysunku 2. 11. Dla zbioru danych mtcars przygotuj obrazek jak na Rysunku 3.

12. Dla zbioru danych economics z pakietu ggplot2 przygotuj obrazek jak na Rysunku 4. Wy-korzystaj szablon theme_economist_white() z pakietu ggthemes.

(2)

ĆWICZENIA 8 & 9 (WIZUALIZACJA I PRZETWARZANIE DANYCH) 2 2.0 2.5 3.0 3.5 4.0 4.5 5 6 7 8 Sepal Length Sepal Width Species setosa versicolor virginica Iris dataset

Rysunek 1. Rysunek do Zadania 9

versicolor virginica ALL setosa 3.0 3.5 4.0 4.5 5.0 4.5 5.0 5.5 6.0 6.5 7.0 2 4 6 1.00 1.25 1.50 1.75 0.0 0.2 0.4 0.6 1.5 2.0 2.5 0.0 0.5 1.0 1.5 2.0 2.5 0.8 1.0 1.2 1.4 1.6 1.8 Petal Length Petal Width

(3)

ĆWICZENIA 8 & 9 (WIZUALIZACJA I PRZETWARZANIE DANYCH) 3 Mazda RX4 Mazda RX4 Wag Datsun 710 Hornet 4 Drive Hornet Sportabout Valiant Duster 360 Merc 240D Merc 230 Merc 280 Merc 280C Merc 450SE Merc 450SL Merc 450SLC Cadillac Fleetwood Lincoln Continental Chrysler Imperial Fiat 128 Honda Civic Toyota Corolla Toyota Corona Dodge Challenger AMC Javelin Camaro Z28 Pontiac Firebird Fiat X1-9 Porsche 914-2 Lotus Europa Ford Pantera L Ferrari Dino Maserati Bora Volvo 142E 10 20 30 40

Miles per gallon fuel consumption

Rysunek 3. Rysunek do Zadania 11

0 5 10 15 20 25 1970 1980 1990 2000 2010

Median duration of unemployment (weeks)

Median duration of unemployment (weeks)

Cytaty

Powiązane dokumenty

• W ostatecznej wersji dane powinny być wczytywane z pliku typu HAR (plik taki należy wcześniej przygotować za pomocą

stosowany domy ś ś lnie w GAMESS algorytm optymalizacji TS lnie w GAMESS algorytm optymalizacji TS wymaga podania. wymaga podania

Sprawdzić, że jeśli macierz M jest diagonalizowalna, to dla dowolnej liczby a ∈ R, również macierz aM

Zaproponuj wydajną implementację d-kopca w tablicy i dokonaj analizy złożoności obliczeniowych operacji kolejki priorytetowej: Ini, Min, DeleteMin, Insert i DecreaseKey.. W jaki

Dodatkowo każdy węzeł ma dodatkowy atrybut suma oznaczający sumę wartości z

Ile w tej sytuacji Ryszard by pracował i ile miał na konsumpcję? Czy oceniłby obecną sytuację jako lepszą, czy jako gorszą niż z punktu a)? Czy jest tu jakaś niejasność?. c)

Aby to uzyskać, potrzebna jest także energia elektryczna – 1 jednostka na każdą tonę wody morskiej (dostarczenie mniejszej ilości oznacza, że przetworzyć da się tylko tyle

Autorzy BIND 9.x zalecają stosowanie poleceń host oraz dig do uzyskiwania informacji po stronie klienta DNS oraz testowania poprawności działania DNS-a1. Konfiguracja klienta