• Nie Znaleziono Wyników

Dane symulacyjne. Opis algorytmu generowania danychgenerowania danych

wykorzystania modeli skoringowych

2.4. Dane symulacyjne. Opis algorytmu generowania danychgenerowania danych

Podstawowe idee algorytmu zostały opublikowane przez autora ni-niejszej ksi ˛a˙zki (Przanowski, 2013), a pó´zniej przez niego rozwi-ni˛ete (Przanowski, 2014a). Dane tworzone s ˛a miesi ˛ac po miesi ˛acu.

W ka˙zdym miesi˛ecznym etapie tworzenia danych s ˛a modyfikowa-ne informacje o posiadanych rachunkach klientów oraz cechy sa-mych klientów. Historia danych ka˙zdego rachunku składa si˛e z kil-ku zmiennych aktualizowanych miesi˛ecznie: liczby rat spłaconych, liczby rat opó´znionych i statusu rachunku. Ka˙zdy nowy miesi ˛ac po-winien zatem by´c dodawany przez okre´slenie tych trzech nowych warto´sci zmiennych dla ka˙zdego rachunku. Na pocz ˛atku jest oblicza-ny model skoringowy, który ka˙zdemu rachunkowi przypisuje pewn ˛a warto´s´c oceny punktowej na bazie dotychczasowej historii kredy-towej i zagregowanych danych o kliencie. Dodatkowo wykorzystuje si˛e macierz przej´s´c pomi˛edzy stanami opó´znienia (liczbami opó´znio-nych rat). Bazuj ˛ac na ocenach punktowych, mo˙zna okre´sli´c, którzy klienci w nast˛epnym miesi ˛acu spłac ˛a raty, a którzy wpadn ˛a w

wi˛ek-sze zadłu˙zenie. Mechanizm jest zatem zwi ˛azany z ła´ncuchem Mar-kowa i modelem skoringowym. Zmiany cech klienta s ˛a tak˙ze do-konywane przez odpowiednie macierze przej´s´c, które powoduj ˛a, ˙ze klientowi powi˛eksza si˛e lub zmniejsza wynagrodzenie, powi˛eksza si˛e lub zmniejsza liczba dzieci itp.

Zastosowania Credit Scoringu w procesie akceptacji kredytowej umo˙zliwiaj ˛a osi ˛aganie istotnych korzy´sci finansowych. Modele ba-zuj ˛ace na historii potrafi ˛a dobrze prognozowa´c. Mo˙zna ´smiało

zało-˙zy´c, ˙ze spłacanie kolejnego kredytu przez danego klienta jest wypad-kow ˛a jego wcze´sniejszej historii kredytowej oraz jego aktualnej sy-tuacji materialnej, zawodowej i rodzinnej, któr ˛a okre´sla we wniosku kredytowym. Nie mo˙zna jednak ka˙zdemu historycznemu rachunko-wi kredytowemu nadawa´c takiej samej wagi, inaczej w przypad-ku ka˙zdego klienta w dłu˙zszym lub krótszym czasie pojawiłyby si˛e opó´znienia i nie spłacałby kredytów. Musz ˛a zatem istnie´c priorytety, którymi kieruje si˛e klient przy spłacaniu rat. Jest powszechnie znany fakt, ˙ze klient b˛edzie starannie przestrzegał terminowo´sci spłat przy kredycie hipotecznym, a niekoniecznie przy gotówkowym czy ratal-nym na zakup ˙zelazka. Automatycznie w jego ´swiadomo´sci ujawnia-j ˛a si˛e przykre konsekwencje utraty mieszkania, znacznie bole´sniej-sze od straty ˙zelazka. Priorytety w du˙zej mierze s ˛a wi˛ec zwi ˛azane z samymi procesami kredytowymi i sposobami zabezpieczenia kre-dytów. Pojawiaj ˛a si˛e tu tak˙ze nieracjonalne upodobania i przywi ˛ a-zanie klienta do marki, do zaufanej pani w okienku i wiele innych subtelno´sci, których nie da si˛e uwzgl˛edni´c w modelowaniu. Odwo-łanie si˛e do priorytetów jest jednocze´snie jedynym słusznym rozwi ˛ a-zaniem, w przeciwnym wypadku sytuacja ta ko´nczyłaby si˛e jałowym rozwa˙zaniem – co było pierwsze: jajko czy kura? Spłacanie kredytu A nie mo˙ze zale˙ze´c od spłacania kredytu B i jednocze´snie odwrot-nie – kredytu B od kredytu A. Wszystko od wszystkiego zale˙ze´c odwrot-nie mo˙ze.

Pojawia si˛e jeszcze inny problem natury czysto algorytmicznej.

Przyjmijmy, ˙ze klient miał dwa kredyty: pierwszy, a po jego spłace-niu – drugi. Przypu´s´cmy jednak, ˙ze testowany proces akceptacji kre-dytowej dla historii tego klienta odrzuci pierwszy z jego wniosków kredytowych, gdy˙z pojawiło si˛e zbyt du˙ze prawdopodobie´nstwo nie-spłacenia. Bank zatem nie ma informacji o historii pierwszego

kre-dytu tego klienta. Drugi wniosek kredytowy zostanie zaakceptowa-ny. Czy jego spłacanie ma zale˙ze´c od historii pierwszego kredytu?

Je´sli damy odpowied´z przecz ˛ac ˛a, to nie potrafimy stworzy´c danych symulacyjnych, gdy˙z nie jeste´smy w stanie przewidzie´c akceptacji przyszłych testowanych procesów. Nale˙zy zatem sformułowa´c ko-lejne bardzo wa˙zne zało˙zenie: klient zawsze gdzie´s kredyt we´zmie.

Je´sli nie uda mu si˛e w jego ulubionym banku, to pójdzie do inne-go, je´sli tam tak˙ze jego wniosek zostanie odrzucony, to pójdzie do parabanku, a je´sli i tam mu si˛e nie uda, to po˙zyczy od znajomych lub rodziny. Mo˙zna tu pod ˛a˙za´c za my´sl ˛a klasyków ekonomii, ˙ze klient konsumuje niezale˙znie od swojego wynagrodzenia. Jego po-trzeby konsumpcyjne, a zatem tak˙ze kredytowe, s ˛a wynikiem czego´s wi˛ecej, co jest zwi ˛azane z aspiracjami, pogl ˛adami i długofalowymi planami.

Wypiszmy zatem podstawowe zało˙zenia generatora danych, ogól-nego modelu danych kredytów konsumenckich (Consumer Finance):

• Klient mo˙ze otrzyma´c dwa rodzaje kredytów: ratalny na zakup dóbr konsumpcyjnych i gotówkowy na dowolny cel.

• Kredyty ratalne rz ˛adz ˛a si˛e swoimi prawami, ich spłacanie nie jest zwi ˛azane z histori ˛a kredytow ˛a kredytów gotówkowych.

Jest to obserwowany w bankach fakt, który najprawdopodob-niej wynika z ró˙znicy profili ogółu klientów korzystaj ˛acych z kredytów ratalnych, którzy czasem godz ˛a si˛e na kredyt ze wzgl˛edu na wygod˛e finansow ˛a, np. raty z zerowym oprocento-waniem, cho´c sytuacja finansowa wcale ich do tego nie zmu-sza. Mogliby zakupi´c dany towar bez wi ˛azania si˛e z bankiem.

Kredyt gotówkowy jest wybierany przez pewien podzbiór klien-tów korzystaj ˛acych z kredytów ratalnych, jest czasem dla nich konieczno´sci ˛a i jego spłacalno´s´c jest zatem bardziej wra˙zliwa na sytuacj˛e finansow ˛a klienta.

• Ryzyko kredytów ratalnych jest znacz ˛aco mniejsze od ryzyka kredytów gotówkowych.

• Spłacalno´s´c kredytów gotówkowych zale˙zy od historii obu ro-dzajów kredytów: ratalnego i gotówkowego.

• Je´sli klient ma wiele aktywnych kredytów, to najgorzej b˛e-dzie spłacał kredyt zaci ˛agni˛ety ostatnio. Od momentu wzi˛ecia kolejnego kredytu klient staje si˛e bardziej przeci ˛a˙zony zobo-wi ˛azaniami i b˛edzie mu trudniej spłaca´c kredyty. Z przyzwy-czajenia zatem spłaca wcze´sniej zaci ˛agni˛ete, traktuj ˛ac je jako bardziej priorytetowe. Mo˙zna dyskutowa´c nad słuszno´sci ˛a te-go zało˙zenia, niemniej trzeba jako´s zró˙znicowa´c spłacalno´s´c wielu kredytów. Nie jest prawd ˛a, ˙ze klient spłaca wszystkie kredyty tak samo w tym samym czasie.

• Kredyt gotówkowy pojawia si˛e w danym miesi ˛acu tylko wte-dy, kiedy klient w tym czasie ma rachunki aktywne, czyli nie-zamkni˛ete. Zwi ˛azane jest to z procesem sprzeda˙zy krzy˙zowej (ang. cross-sell), gdy kredyt ratalny traktuje si˛e jako akwizy-cj˛e (koszt pozyskania klienta), a gotówkowy jako okazj˛e do zarobku banku, który mo˙ze organizowa´c kampanie tylko dla swoich, znanych klientów.

• Ka˙zdy kredyt ma dat˛e wymagalno´sci (ang. due date) ka˙zdego 15. dnia miesi ˛aca.

• Miesi˛eczne zobowi ˛azanie, czyli rata, mo˙ze by´c albo spłacone w cało´sci, albo wcale. Odnotowuje si˛e tylko dwa zdarzenia:

spłacenie lub niespłacenie w danym miesi ˛acu.

• Spłacenie mo˙ze jednak by´c zwi ˛azane z wpłaceniem kilku rat kredytowych.

• Identyfikowane i mierzone s ˛a tylko liczby spłaconych i nie-spłaconych rat.

• Wszystkie rozkłady charakterystyk klientów s ˛a wyznaczane na bazie ustalonych i precyzyjnie dobranych rozkładów loso-wych.

• Je´sli klient nie spłaci siedmiu rat (180 dni opó´znienia), to ra-chunek kredytowy jest zamykany ze statusem B (ang. bad sta-tus), wszystkie dalsze etapy windykacyjne s ˛a pomijane.

• Je´sli klient spłaci wszystkie raty, to rachunek jest zamykany ze statusem C (ang. closed).

• Spłacenie lub niespłacenie jest zdeterminowane przez trzy czyn-niki: ocen˛e punktow ˛a liczon ˛a na bazie wielu charakterystyk rachunku kredytowego i klienta, macierzy migracji i makro-ekonomicznej zmiennej modyfikuj ˛acej macierz migracji.

3. Model biznesowy w obszarze