Zadania – Laboratorium 3.
1. Oblicz dla każdej sprawy skuteczność obsługi w pierwszych 12 miesiącach.
Skuteczność12M=SumaWplat12M/TOA
2. Wskaż minimalną, maksymalną, średnią wartość powstałej miary; oblicz również pierwszy, drugi oraz trzeci kwartyl.
3. Narysuj wykres pudełkowy dla powstałej miary.
4. Narysuj histogram Skuteczność12M.
5. Narysuj estymator dystrybuanty rozkładu Skuteczność12M.
6. Podziel dane na trzy podzbiory – sprawy dla których M_LastPaymentToImportDate jest większe od 40, sprawy dla których M_LastPaymentToImportDate jest mniejsze od 40 oraz sprawy, dla których nie występuje informacja o M_LastPaymentToImportDate.
7. Wykonaj zadania 2-5 na powstałych podzbiorach. Zwróć uwagę na to, żeby istniała możliwość porównania otrzymanych wyników dla każdego z podzbioru (np. przedstawienie wykresów na jednej płaszczyźnie).
8. Przedstaw jakie wnioski można wyciągnąć na podstawie wykonanego zadania nr 7.
9. Oblicz wsp. korelacji Pearsona pomiędzy miarą Skutecznść12M a zmienną TOA. Oblicz wsp.
korelacji Pearsona pomiędzy Skutecznością12M a logarytmem naturalnym z TOA.
10. Narysuj wykres zależności („XY”) pomiędzy posortowaną zmienną TOA podzieloną na 100 równolicznych przedziałów a miarą Skutecznść12M obliczoną w każdym z powstałych grup spraw.
11. Powtórz zadanie 10 dla zmiennej powstałej poprzez wzięcie logarytmu z TOA.
12. Oblicz korelacje Pearsona, Spearmana pomiędzy miarą Skuteczność12M a dostępnymi zmiennymi aplikacyjnymi.
13. Narysuj wykres prezentujący korelację pomiędzy poszczególnymi zmiennymi oraz miarą Skuteczność12M.
14. Narysuj wykresy zależności („XY”) pomiędzy „pogrupowanymi” dostępnymi zmiennymi aplikacyjnymi a miarą Skutecznść12M.
15. Czy któreś ze zmiennych warto przekształcić? Jeśli tak, to w jaki sposób?
16. Powtórz zadanie 6 i 7 dla wybranej przez siebie zmiennej i wybranego podziału zbioru na 3 dowolne podzbiory.
17. Spróbuj rozwiązać powyższą listę dla innej miary niż Skuteczność12M, np.:
a. kwota wpłat 12M, b. kwota wpłat 6M,
c. liczba ugód podpisanych 12M, d. liczba ugód podpisanych 6M, e. liczba rozmów z klientem w 12M, f. czy sprawa przekazana do sądu?