Zadania – Laboratorium 11 – Regresja logistyczna Przygotowanie:
Dane: "sprawy.Rdata", "zdarzenia.Rdata"
Biblioteki: dplyr, InformationValue
ZAD 0. Przygotuj dane do budowy modelu, uwzględniając następujące punkty:
a) Wybierz jaką zmienną sukcesu chcesz modelować, zakoduj jako „0” i „1”
b) Usuń braki danych w cechach, w których jest to możliwe do wykonania, pamiętaj o nielosowych brakach danych – lepiej pozostaw je jako osobne kategorie
c) Usuń zmienne skorelowane
ZAD 1. Sprawdź siłę predykcyjną pozostałych cech za pomocą współczynnika IV ZAD 2. Przekoduj zmienne na WoE
ZAD 3. Zbuduj dwie wersje modelu regresji logistycznej z wagami i bez
ZAD 4. Porównaj powstałe modele za pomocą m.in. współczynnika Gini, macierzy klasyfikacji (dla wybranego punktu cut-off) i wykresu separacji dobrych i złych