Agnieszka Nowak - Brzezińska
Wykrywanie grup klientów o podobnych profilach dla wspomagania tzw.
specjalizowanego marketingu
Zalety: oszczędności, zwiększone zyski w krótkim czasie
Metody: analiza skupień
Preprocessing danych: czyszczenie danych, transformacja danych, selekcja atrybutów, dyskretyzacja atrybutów liczbowych
Zalety: ułatwia analizę dużych zbiorów danych
Metody: j.w.
Drzewa decyzyjne pozwalają na podstawie tzw. zbioru uczącego zbudować model
(drzewo klasyfikacji), które będę pozwalało na klasyfikacje nowych danych w przyszłości.
Metody: algorytmy drzew klasyfikacyjnych (ID3, CART, C4.5 i inne)
Traceis
SypinaTanagra
Weka, ANOVA
R, Rattle
Pakiet Analysis toolpack w narzędziu Microsoft
RSES
Inne.
Wpływ wykresów: pudełkowego, histogramu, rozrzutu na łatwość analizy danych
Wpływ metod analizy skupień, drzew
decyzyjnych, PCA na interpretację danych
Zalety: przy dużych zbiorach danych bez
wizualizacji tych danych ciężko o jakąkolwiek wiedzę o analizowanym świecie.
Patrz 1 wykład.
Analiza regresji liniowej pozwala na predykcję (przewidywanie wartości nowych danych na
podstawie danych już zgromadzonych).
Np. Przewidywanie wartości dochodu w
zależności od liczby przepracowanych godzin i stawki godzinowej
Patrz 1 wykład