dr Zuzanna Wośko
KAE, Instytut Ekonometrii
Zakład Modelowania Rynków Finansowych e-mail: zwosko@sgh.waw.pl
Zasady projektu (pracy domowej) do modułu "Ryzyko kredytowe"
w ramach przedmiotu „Ekonometria finansowa II”
Etapy:
1. Korzystając ze skryptu "00_database_generation.R" wygeneruj pliki "loans.csv" oraz
"clients.csv" .
2. Połącz te dwa pliki ze sobą za pomocą ID. Użyj pakietu "dplyr" wykorzystując jedną z funkcji typu "join". Czy pozostała jakaś część rezydualna z połączenia tych dwóch zbiorów (czy wszyscy klienci zostali zmapowani)? Sprawdź to za pomocą odpowiedniej funkcji typu „join”.
3. Wykorzystując dane klientów stwórz odpowiednie zmienne objaśniające do modelu PD.
4. Sprawdź, czy zmienne objaśniające mają dużo obserwacji nietypowych. Zmodyfikuj odpowiednio szeregi (winsoryzacja).
5. Oszacuj prawdopodobieństwa defaultu dla poszczególnych klientów za pomocą modelu logitowego. Możesz też sprawdzić, jak różne wyniki byśmy uzyskali, gdybyśmy zmienili założenie co do rozkładu składnika losowego i oszacowali model probitowy.
6. Pokaż tablicę kontyngencji („confusion matrix”, „contingency table”). Zinterpretuj wyniki.
7. Wykreśl krzywą ROC oraz policz AUC. Zinterpretuj.
8. Wyznacz bootstrapowe przedziały ufności dla AUC zakładając 90-procentowy przedział ufności.
Pracę sporządzamy w zespołach dwuosobowych. Podpisana praca domowa powinna zawierać wydruki z R z odpowiednimi komentarzami i interpretacjami.