Pytania otwarte…….pkt, Imię i nazwisko……….
Pytania zamknięte…….pkt Numer indeksu………..
Razem……. pkt
K O L O K W I U M
Wprowadzenie do Data Science
18 stycznia 2018 r.
Pytania otwarte (5 pkt. każde):
1. Scharakteryzuj różnice pomiędzy pojęciami data science i Big Data. Opisz koncepcję 3V, 4V etc. Przedstaw schemat przepływ danych w data science (workflow).
2. Omów pojęcie hurtowni danych. Opisz różnice pomiędzy OLTP i OLAP
3. Opisz podstawowe zadania uczenia maszynowego i podaj przykłady należących do nich metod.
Pytania zamknięte (1 pkt. każde, jedna odpowiedź prawidłowa)
Zad 1. Która z poniższych statystyk jest odporna na obserwacje odstające : (a) średnia,
(b) mediana, (c) wariancja.
Zad 2. Czy regresja logistyczna posiada jawne rozwiązanie? (a) tak,
(b) nie, (c) czasami.
Zad 3. W pewnej bazie danych znajduje się rekord zwierający pole daty „31.02.2018”. Czy jest to: (a) błąd wpisu,
(b) błąd schematu, (c) żadne z powyższych.
Zad 4. Który zestaw dobrze przedstawia właściwą hierarchię błędu percepcji (od najmniejszego po lewej do największego po prawej) wielkości prezentowanych za pomocą różnych charakterystyk: (a) pola < wysokości < kolory ,
(b) kolory < pola < wysokości, (c) wysokości < pola < kolory.
Zad 5. Ile standardowo kopii zbioru danych przechowuje się na platformie Hadoop: (a) jedną ,
(b) dwie, (c) żadnej.