• Nie Znaleziono Wyników

ZASTOSOWANIE ROZKŁADÓW UCIĘTYCH I CENZUROWANYCH W KWANTYFIKACJI RYZYKA OPERACYJNEGO. BADANIA SYMULACYJNE

N/A
N/A
Protected

Academic year: 2021

Share "ZASTOSOWANIE ROZKŁADÓW UCIĘTYCH I CENZUROWANYCH W KWANTYFIKACJI RYZYKA OPERACYJNEGO. BADANIA SYMULACYJNE"

Copied!
26
0
0

Pełen tekst

(1)

ISSN 2083-8611 Nr 264 · 2016

Tomasz Szkutnik

Uniwersytet Ekonomiczny w Katowicach Wydział Zarządzania

Katedra Ekonometrii

tomasz.szkutnik@ue.katowice.pl

ZASTOSOWANIE ROZKŁADÓW UCIĘTYCH I CENZUROWANYCH W KWANTYFIKACJI RYZYKA

OPERACYJNEGO. BADANIA SYMULACYJNE

Streszczenie: W badaniu rozpatrzone zostały różne sposoby rejestrowania zdarzeń, takie jak ucinanie i cenzurowanie danych wraz z oceną wpływu, jaki mogą wywierać na wiel- kość ryzyka szacowanego metodą LDA. Ignorowanie faktycznego ucinania danych w procesie ich rejestracji lub przyjmowanie faktu ucinania jako kompromisu pomiędzy jakością informacji a kosztami ich ewidencji zostały porównane z procesem rejestracji opartym na cenzurowaniu danych. Cenzurowanie pozwala na uzyskanie pełnej informa- cji o częstości zdarzeń oraz daje możliwość wykorzystania tych częściowych informacji w procesie estymacji. Estymacja parametrów na podstawie danych cenzurowanych, wykorzystywana w innych obszarach, może być jednym z kierunków rozwoju w przy- padku ryzyka operacyjnego w instytucjach finansowych.

Słowa kluczowe: ryzyko operacyjne, LDA, cenzurowanie danych, ucinanie danych.

Wprowadzenie

Tematyka artykułu dotyczy problemu szacowania ryzyka operacyjnego w ban- ku. Nowo tworzone rozwiązania ostrożnościowe wynikające ze zmian w środowi- sku operacyjnym banków są w głównej mierze efektem prac Komitetu Bazylejskie- go ds. Nadzoru Bankowego (BCBS – Basel Committee on Banking Supervision).

Tematem artykułu jest, proponowana przez BCBS, metoda rozkładu strat (zwana metodą LDA – Loss Distribution Approach), należąca do tzw. metod zaawanso- wanych (dalej AMA – Advanced Measurement Approach).

(2)

W ramach tej metody wielkość ryzyka wyznaczana jest na podstawie za- gregowanego rozkładu strat (opierając się na procesach częstości i dotkliwości strat), jako kwantyl odpowiedniego rzędu. W praktyce określenie rzeczywistej postaci analitycznej zagregowanego rozkładu w metodzie LDA nie zawsze jest możliwe, przez co szeroko wykorzystywane są różne formy jego aproksymacji.

Obserwując rozwój zarówno samych metod pomiaru ryzyka operacyjnego, jak i zachodzące zmiany w wytycznych BCBS, można zauważyć, że jest to w dal- szym ciągu istotny obszar badawczy.

Metoda LDA

Celem nadrzędnym w pomiarze ryzyka operacyjnego jest określenie łącznej wielkości ryzyka dla całego banku. Wiąże się to z wyznaczeniem wielkości ryzyka oddzielnie dla poszczególnych obszarów zdefiniowanych według macierzy bazylej- skiej [Szkutnik i Basiaga, 2013]. W poszczególnych elementach macierzy bazylej- skiej poziom ryzyka określany jest indywidualnie, np. za pomocą metody LDA.

W artykule skupiono uwagę głównie na problemach w szacowaniu odpo- wiednich wielkości ryzyka właśnie na poziomie samego modelu LDA. W tym zakresie prawidłowe określenie oraz rozwiązanie problemów w skali mikro, tj.

dla cząstkowych procesów częstości i dotkliwości strat, daje podstawy do dalszych rozważań. Pominięcie pewnych kluczowych wielkości na samym początku badania w praktyce może prowadzić do nieprzewidywalności wyników i nieadekwatności pomiaru stopnia narażenia na ten rodzaj ryzyka. To właśnie nieadekwatność doboru technik modelowania w odniesieniu do składowych modelu LDA, tj. dziedziny częstości oraz dziedziny dotkliwości, będzie głównym tematem badania.

Formalna konstrukcja metody LDA jest taka sama, jak w pracach: [Szkut- nik, 2012a, 2012b], dlatego nie jest w dalszej części artykułu powtarzana. Wy- znaczenie zagregowanego rozkładu strat opiera się na metodzie Monte Carlo, która wraz ze szczegółowym opisem zawarta jest w takich pracach, jak: [Shev- chenko, 2011; Szkutnik i Basiaga, 2013].

Istotnym celem badania jest ocena wpływu procesów ucinania i cenzuro- wania danych o stratach banku, na wielkości estymowanych parametrów cią- głych rozkładów prawdopodobieństwa dla dziedziny dotkliwości strat. Stosowa- nie progów raportowania ma także wpływ na proces częstości występowania strat, jednak na potrzeby badania przyjęto, że jest to jednorodny proces Poissona (z ustalonym arbitralnie parametrem ). Celem badania symulacyjnego jest po- kazanie skali potencjalnych różnic w ocenie wielkości ryzyka dla jednego tylko procesu modelowanego metodą LDA. W dalszej części badania szczególna uwaga zostanie skupiona na dziedzinie dotkliwości strat oraz sumarycznych wynikach prezentowanych koncepcji.

(3)

1. Modelowanie dotkliwości zdarzeń

Rejestrowanie zdarzeń i strat operacyjnych w bankowości oraz ich później- sze wykorzystanie jest specyficzne, bowiem w praktyce jest to proces związany z pewną formą cenzurowania danych.

Wynika to z panującego przekonania, że przy szacowaniu ryzyka powinno się zwracać uwagę w szczególności na straty o największej dotkliwości. Ponadto wymagania praktyczne, które są niewątpliwie słuszne, powodują, że często skrupulatne rejestrowanie strat poniżej określonych progów może nie być efek- tywne, a zanotowane zdarzenia mogą wydawać się dla instytucji informacjami bez większego znaczenia praktycznego.

Wpływ, jaki wywiera sam sposób obróbki i wykorzystania danych w sza- cowaniu wielkości ryzyka operacyjnego metodą LDA, powinien być analizowa- ny w dwóch wymiarach. Wykorzystanie tylko części możliwych do zarejestro- wania danych oddziałuje zarówno na proces częstości ich występowania, jak i na proces dotkliwości strat. Proces częstości występowania strat może być mode- lowany za pomocą dyskretnych rozkładów prawdopodobieństwa lub rozumiany w kategoriach procesu stochastycznego iterowanego po czasie. Nieodpowiednia identyfikacja ewentualnej dynamiki częstości występowania strat może spowo- dować błędne oszacowanie potencjalnej liczby strat. Ponadto w przypadku pro- cesu dotkliwości strat ucinanie danych powoduje, że należy uwzględnić ten fakt na etapie estymacji parametrów odpowiednich rozkładów prawdopodobieństwa.

W pewnym sensie proces raportowania, będący właściwym dla zagadnień ry- zyka operacyjnego, można utożsamiać z innymi dziedzinami badawczymi. W przy- padku badań środowiskowych, klinicznych, analizie czasu trwania czy w zagadnie- niach statystyki medycznej proces cenzurowania danych jest naturalny i wynika ze specyfiki badanych zjawisk. Wyróżnia się tam sytuacje, w których dane za- wierają obserwacje cenzurowane. Cenzurowanie informuje, że zdarzenie zaszło, lecz dokładna wielkość straty nie została zarejestrowana wcale lub częściowo.

W takich przypadkach dochodzi do pewnej utraty informacji, jednak samo zda- rzenie poddawane jest dalszej obróbce nie tylko w kategoriach częstościowych, ale może brać także udział np. w procesie estymacji parametrów ciągłych roz- kładów prawdopodobieństwa.

1.1. Klasyfikacja danych cenzurowanych

Długa historia wykorzystania danych cenzurowanych oraz wiele problemów powstających w procesach raportowania w wymienionych wcześniej obszarach powodują, że nie istnieje jeden prosty sposób podziału danych cenzurowanych.

(4)

Według S.P. Millarda [2013, s. 175] wyróżnia się 4 zasadnicze sposoby kla- syfikacji danych cenzurowanych:

− dane ucięte lub cenzurowane,

− dane lewostronnie, prawostronnie, obustronnie cenzurowane,

− pojedyncze lub wielokrotne (progresywne) cenzurowanie,

− cenzurowanie typu I lub typu II.

W najprostszym przypadku dotyczącym ryzyka operacyjnego proces cenzu- rowania może być procesem lewostronnego jednokrotnego cenzurowania typu I.

Oznacza to, że pełne raportowanie i pomiar danych następuje tylko powyżej okre- ślonego progu „c”. Poniżej tego progu informacja o stracie operacyjnej mogłaby być tylko zliczana bez pełnej informacji o zdarzeniu (w szczególności bez informacji o finansowej wielkości straty). Ponadto pojedyncze cenzurowanie oznacza, że próg

„c” jest stały podczas procesu zbierania informacji. Cenzurowanie typu I wymaga znajomości progu „c” w momencie zbierania informacji, a co za tym idzie liczba niecenzurowanych obserwacji jest wtedy zmienną losową. W przypadku cenzu- rowania typu II liczba niecenzurowanych obserwacji jest znana, a badanie koń- czy się w momencie osiągnięcia określonej liczby zdarzeń.

Rozszerzając koncepcję cenzurowania, warto nadmienić, że stały próg rapor- towania w wielu obszarach analitycznych może nie być odpowiedni dla wszystkich przypadków. W takich sytuacjach można rozważać różne progi cenzurowania da- nych w poszczególnych procesach operacyjnych generujących straty.

Z praktycznego punktu widzenia wydaje się zasadne poznanie procesu cenzu- rowania w odniesieniu do metody LDA, w szczególności przy rozpatrywaniu pro- blemu w kategoriach możliwych błędów związanych z wyborem sposobu modelo- wania oraz oceny wpływu tego procesu na wielkości szacowanego ryzyka.

1.2. Konstrukcja funkcji wiarygodności dla cenzurowanych

i uciętych obserwacji na potrzeby estymacji parametrów modelu Prezentowana budowa funkcji wiarygodności zakłada, że wielkość progu, poniżej którego dane będą poddane procesowi ucinania lub cenzurowania, jest niezależna od wartości zmiennej losowej. W celu konstrukcji funkcji wiarygod- ności w przypadku częściowych obserwacji należy ustalić, jaki jest możliwy zakres informacji, które można pozyskać na podstawie dostępnych danych.

Ogólna postać funkcji wiarygodności w omawianym przypadku wygląda nastę- pująco [Klein, 2003, s. 74]:

Π Π Π 1 Π . (1)

(5)

Relacja dana wzorem (1) przedstawia ogólny problem, jaki może być roz- patrzony dla różnych form cenzurowania lub ucinania obserwacji, gdzie:

− zbiór wielkości strat operacyjnych ;

(oraz ) − zbiór wielkości prawostronnie (lewostronnie) cenzurowanych;

− zbiór obserwacji obustronnie cenzurowanych;

− próg prawostronnego cenzurowania;

− próg lewostronnego cenzurowania;

[S(Li) – S(Ri)] − prawdopodobieństwo tego, że wielkość straty należy do prze- działu , ;

− funkcja przeżycia.

1.3. Opis badania symulacyjnego

W badaniu symulacyjnym przyjęto arbitralne założenia co do wartości pa- rametrów odpowiednich rozkładów prawdopodobieństwa. W celu uwiarygod- nienia badania przyjęto, że hipotetyczne zadanie związane z oceną skali naraże- nia banku na straty z tytułu ryzyka operacyjnego będzie wyznaczone jako empiryczny kwantyl rzędu 0,999 zagregowanego rozkładu strat z metody LDA, wyznaczonego za pomocą symulacji Monte Carlo (dalej: metoda MC). W celu zapewnienia odpowiedniego poziomu wiarygodności szacunków przy tak wyso- kiej wartości kwantyla zostało przyjęte, że liczba iteracji w metodzie MC dla zadania modelu LDA będzie wynosiła 10 (rozważania dotyczące zagadnień związanych z metodą MC dla LDA w odniesieniu do ryzyka operacyjnego oraz uwagi dotyczące liczby iteracji w metodzie MC można znaleźć m.in. w: [Shev- chenko, 2011; Szkutnik, 2011a, 2011b]).

Przyjęto, że hipotetyczny okres, z którego dostępne są obserwacje, dotyczy 4 lat. Proces częstości występowania strat w układzie rocznym został przyjęty jako rozkład Poissona z 50 (gdzie jednorodny proces Poissona określono tak jak w pracy: [Klugman, Panjer i Willmot, 2008, s. 102], ozn. ). Dla procesu dotkliwości strat przyjęto rozkład Weibulla, parametryzowany zgodnie z konstrukcją zawartą w załączniku A pracy: [Klugman, Panjer i Willmot, 2008, s. 675] (ze zmiennymi wartościami parametrów, które są podane w dalszej części badania, ozn. , , gdzie − parametr kształtu, a − parametr skali).

Motywując wybór rozkładu Weibulla jako procesu opisującego mechanizm odpowiedzialny za wielkość poszczególnych strat, można wskazać na wykorzy- stanie tego rozkładu w zagadnieniach ryzyka operacyjnego, np. w pracy: [Cher- nobai, Rachev i Fabozzi, 2007]. Rozkład Weibulla należy do rodziny transfor- mowanego rozkładu gamma z dziedziną , co oznacza, że może on opisywać

(6)

wielkości strat operacyjnych rejestrowanych na dodatniej półosi. Rozkład Wei- bulla ma także interesującą własność, związaną z funkcją ryzyka

. Zlogarytmowana funkcja jest funkcją liniową, z parametrem kierun- kowym 1. Jak wiadomo, funkcja jako dynamiczna charakterystyka rozkładu, pozwala na klasyfikację rozkładów prawdopodobieństwa ze względu na ich własności ogonowe. W przypadku rosnącej (malejącej) dla rozkładu Weibulla parametr 1 ( 1 ), rozpatrywany rozkład będzie cienkoogonowy (gruboogonowy). Dla rozkładu Weibulla przyjęto odpowiednie wartości parame- trów 4 oraz 0,5; 0,75; … ; 2 (zmienna wartość ma oddawać ewentu- alny wpływ zmian charakteru ogona rozkładu).

1.4. Symulacje procesu dotkliwości

W pierwszej kolejności należy zdefiniować sposób modelowania rozkładów dotkliwości strat. Przyjęto 3 warianty danych, uzależnione od hipotetycznego procesu cenzurowania lub ucinania obserwacji:

• Pełny – oznacza, że rejestrowany jest pełny zakres danych. Jest to proces refe- rencyjny, do którego będą się odwoływać pozostałe scenariusze symulacyjne.

• Ucięty – oznacza, że rejestrowane są tylko obserwacje powyżej znanego pro- gu „ ”. Brakuje natomiast wiedzy co do liczby obserwacji poniżej punktu progowego.

• Cenzurowany – oznacza, że sposób rejestrowania obserwacji jest uzależniony od wartości zmiennej losowej. Próg cenzurowania „c” taki sam jak dla scena- riusza uciętego oznacza, że dane powyżej progu będą rejestrowane jako pełne dane, natomiast poniżej progu – będą zliczane.

Przyjęto również, że w zależności od dostępności danych, możliwe są 4 me- tody estymacji parametrów odpowiedniego ciągłego procesu dotkliwości. Należy podkreślić, że celem będzie tu pokazanie wpływu sposobu raportowania w zależno- ści od wybranego wariantu estymacji. Warianty estymacji, w odniesieniu do charakteru posiadanych informacji, to:

• Wariant bazowy – dostępne są pełne dane; standardowa metoda estymacji, tj.

Maximum Likelihood Estimates [Klugman, Panjer i Willmot, 2008, s. 381].

• Wariant ucięty – dostępne są dane ucięte; jest to uwzględnione w procesie estymacji, tj. estymowane są dane ucięte (wariant metody danej wzorem (1)).

• Wariant naiwny – dostępne są dane ucięte, ale nie jest to uwzględnione w proce- sie estymacji; estymowana jest pełna dziedzina danych, tj. , a nie jej niewła- ściwy podzbiór.

(7)

• Wariant cenzurowany – dostępne są dane cenzurowane, tj. rozszerzone względem uciętych o dodatkową informację o częstości występowania zjawi- ska poniżej progu „c”; dobrana metoda estymacji (wariant metody danej wzorem (1)) uwzględnia fakt cenzurowania w procesie optymalizacji MLE.

Dla każdego z siedmiu możliwych wariantów rozkładu (stałe oraz zmienne ) przyjęto identyczny schemat badania symulacyjnego, które było powtórzone 10 razy (iteracji).

Pojedyncza iteracja w badaniu symulacyjnym dla wybranego wariantu roz- kładu zakłada, że dysponuje się hipotetyczną próbą losową 200 obser- wacji (4 lata, po 50 obserwacji w każdym roku). Na tej podstawie skonstruowa- no 3 warianty danych (bazowe − bez zmian, ucięte − informacja poniżej „c” jest tracona, cenzurowane − informacja poniżej „c” jest zliczana). W odniesieniu do wariantów zależnych od progu „c” liczba analizowanych przypadków rozszerzy się o liczbę różnych progów raportowania.

Za punkt „c”, tj. próg pełnego rejestrowania danych, przyjęto wartości kwantyli odpowiednich rzędów (ozn. ). Wielkości kwantyli reprezentują punkty lewostronnego cenzurowania danych i mają przedstawiać procentową hipotetyczną skalę utraty informacji w każdym z przypadków. Wielkości kwantyli będą się różniły w zależności od wariantu parametrów rozkładu (7 warian- tów). Opieranie się na ustalonych rzędach kwantyli daje możliwość porównania wyników ze względu na odsetek traconej informacji. Na potrzeby badania przyję- to, że wielkości 0; 0,05; 0,10; … ; 0,5 będą 11-elementowym wektorem, gdzie pierwszy element będzie oznaczał brak utraty informacji, a kolejne – utra- tę odpowiednio 5% , 10%, … 50% informacji.

Badanie symulacyjne dotyczące wpływu raportowania w konfrontacji ze sposobem estymacji wybranego rozkładu prawdopodobieństwa może być analizo- wane w różnych wymiarach. W celu zbiorczej prezentacji przynajmniej części wy- ników zaprezentowano wykresy w układzie , gdzie płaszczyzna OXY będzie zawsze reprezentowała siatkę utworzoną z wektora wartości parametru kształtu (wpływ zmiany charakteru ogona rozkładu) oraz wektora rzędu rozważanych kwan- tyli (wpływ utraty informacji) na różne miary prezentowane na osi pionowej OZ.

Proces raportowania danych powyżej określonego progu oraz charakter rozkładu bazowego, z którego pierwotnie pochodzą dane, wpływa na wszystkie parametry rozważanego modelu prawdopodobieństwa, stąd prezentowanych jest 6 możliwych zestawień (3 pary parametrów).

(8)

1.5. Pierwszy etap badania symulacyjnego

W pierwszej kolejności analizie poddano stopień procentowego odchylania się wielkości estymatorów (są to dwa parametry dla rozkładu ) uzyska- nych z wariantów estymacji: uciętego, naiwnego oraz cenzurowanego, w odnie- sieniu do wartości oszacowanych parametrów wariantu bazowego (estymowanego dla pełnych danych). Zestawienie to przedstawione jest na rys. 1-3 (z indeksami a oraz b, oznaczającymi zmiany w wielkościach oraz ) odpowiednio dla par:

bazowy/ucięty, bazowy/naiwny, bazowy/cenzurowany.

Określenie „Odchylenia %” (widoczne jako opis osi OZ na rys. 1-3) ozna- cza tu wielkość wyrażoną w procentach (np. wartość 10 oznacza, że nastąpiło 10-proc. odchylenie), wyznaczoną na podstawie przeprowadzonego badania symulacyjnego jako błąd MAPE (Mean Absolute Percentage Error) [Cieślak, 2005, s. 51]. Wielkością aktualną zawsze jest estymator rozkładu bazowego, natomiast wielkością porównywaną – estymator jednego z trzech pozostałych wariantów estymacji.

Rys. 1a. Różnice procentowe w wartości parametru . Porównanie: wariant bazowy do uciętego

(9)

Rys. 1b. Różnice procentowe w wartości parametru . Porównanie: wariant bazowy do uciętego

Rys. 2a. Różnice procentowe w wartości parametru . Porównanie: wariant bazowy do naiwnego

(10)

Rys. 2b. Różnice procentowe w wartości parametru . Porównanie: wariant bazowy do naiwnego

Rys. 3a. Różnice procentowe w wartości parametru . Porównanie: wariant bazowy do cenzurowanego

(11)

Rys. 3b. Różnice procentowe w wartości parametru . Porównanie: wariant bazowy do cenzurowanego

Perspektywa rzutów na rys. 1-3 przedstawia układ, gdzie lewa oś płasz- czyzny OXY dotyczy progu procentowego „q”, reprezentującego wpływ utraty odsetka najmniejszych obserwacji. Cenzurowanie lub ucinanie obserwacji ozna- cza oddalanie się od początku dla q 0 do wartości maksymalnego odrzucania przyjętego na poziomie 50%. Prawa oś płaszczyzny OXY dotyczy wartości parame- tru kształtu rozkładu , który reprezentuje przejście od cienkoogonowego rozkładu do gruboogonowego wraz ze zmierzaniem wartości od 2 0,5. Oś pionowa OZ określa wartości błędów MAPE. Porównując otrzymane wyniki, można dostrzec podobieństwo kształtu płaszczyzn pomiędzy różnymi warianta- mi estymacji w odniesieniu do wariantu bazowego w obrębie tych samych pa- rametrów. Dla wyników dotyczących zmian pomiędzy estymatorami parametru

można zauważyć brak wrażliwości ze względu na ogon rozkładu (brak znaczą- cych interakcji wzdłuż prawej osi płaszczyzny OXY). Natomiast w odniesieniu do wpływu progu raportowania (wyrażonego jako wartość kwantyla „q”) widać prawie liniową zależność pomiędzy poszczególnymi krokami dla lewej osi płaszczyzny OXY względem wartości procentowych z osi OZ. Podobieństwo

„wizualne” płaszczyzn (rys. 1a, 2a, 3a) jest niezależne od wariantu porównania.

Jedyny czynnik, który pozwala na podkreślenie różnic pomiędzy względnym

(12)

podobieństwem wyników jest skala osi OZ. Najmniejsze zmiany w odchyle- niach parametrów dotyczą porównania estymacji na podstawie cenzurowanych danych w odniesieniu do estymacji pełnego zakresu danych (różnice nie prze- kraczają 4% − por. rys 3a) i mają tendencję do wzrostu wraz ze zwiększającą się informacją o cenzurowaniu danych.

W dalszej kolejności najkorzystniejsze (tj. najmniejsze) zmiany procentowe dotyczą rozwiązań opartych na wariancie uciętym estymacji (przy największej utracie informacji można spodziewać się odchyleń na poziomie 10%−15%).

Najgorsze wyniki, tj. obarczone największą niepewnością co do stabilności wielkości uzyskanych estymatorów, dotyczą przypadku naiwnego, gdzie już przy utracie kilkunastu procent obserwacji można się spodziewać kilkuprocen- towej różnicy w wielkościach estymatorów (w najgorszym rozważanym przy- padku można zaobserwować ponad 80-proc. różnicę pomiędzy estymatorami uzyskanymi z wariantu bazowego).

Analiza zmian procentowych dla parametru wygląda podobnie, tzn.

płaszczyzny na rys. 1b, 2b, 3b wykazują podobieństwa. Zróżnicowanie widocz- ne jest − podobnie jak dla parametru − w zakresie osi OZ. W tym przypadku, w przeciwieństwie do wyników dla parametru , największych różnic można się spodziewać przy największej utracie informacji (q bliskie 50%), ale w połącze- niu z gruboogonowym charakterem rozkładu dotkliwości. Gwałtownie rosnąca płaszczyzna w tylnej części prezentowanych perspektyw, wraz z oddalaniem się wartości na płaszczyźnie OXY od punktu 0, 2 , oddaje charakter zja- wiska. Podobnie jak wcześniej, uwzględnienie cenzurowania danych powoduje maksymalne odchylenia rzędu kilku procent w najbardziej skrajnych przypad- kach. Kilkudziesięcioprocentowe odchylenia występują w przypadku wariantu uciętego, a w przypadku wariantu naiwnego różnice są ponad dwukrotne.

Przykład ten pozwala zademonstrować, w jakim stopniu wybór progu ra- portowania w połączeniu ze zmianą koncepcji modelowania pełnego zakresu danych może oddziaływać na różnie warianty praktyczne. W tym znaczeniu wydaje się istotne podkreślenie, jakie możliwości stoją za zmianą koncepcji modelowania opartą o wariant cenzurowany.

W odniesieniu do ryzyka operacyjnego, próg raportowania najczęściej nie stanowi bariery technologicznej. Możliwe jest rejestrowanie wszystkich strat.

Najważniejszy aspekt praktyczny stojący za raportowaniem powyżej ustalonego progu związany jest z wymiarem ekonomicznym, w tym z zaangażowaniem pracowników w proces raportowania straty. W celu uniknięcia zbędnych proce- dur ograniczających skalę raportowania, można zaproponować raportowanie np.

zbiorcze, w odniesieniu do zdarzeń poniżej określonego progu „c” w określo-

(13)

nych jednostkach czasu, tj. układzie tygodniowym czy miesięcznym. Uniknie się w tym przypadku konieczności pełnej rejestracji straty wraz z przypisaniem jej właściciela (działu czy jednostki organizacyjnej), natomiast sam agregat zlicza- jący wystąpienia strat będzie pozwalał na dalszą obróbkę tych informacji, za- równo w wymiarze estymacji rozkładów dotkliwości, jak i uwzględnieniu tych informacji w procesie częstości występowania strat.

Ponadto wprowadzenie cenzurowania jako możliwego wariantu w estymacji parametrów rozkładów dotkliwości może być wykorzystany w testach warunków skrajnych, których realizacja wynika częściowo z zapisów zawartych w dyrek- tywach BCBS [BIS, 2010, 2012, 2013].

Szczegółowe wyniki przeprowadzonych symulacji dostępne są w w tab. 1, gdzie przedstawiono także wartości średnie estymatorów wraz z wielkościami odchylenia standardowego.

Wnioski, jakie można wyprowadzić na podstawie wyników poprzedniego etapu, zawarte w tab. 1, opisujące uśrednione wyniki badania symulacyjnego, wskazują, że przeciętne wielkości parametrów różnią się istotnie tylko i wyłącznie dla wariantu estymacji naiwnej. Nie oznacza to, że trzy pozostałe warianty estymacji są równoważne, bowiem można doszukać się istotnych różnic w średnich pozio- mach błędów standardowych estymatorów (por. wyniki z tab. 1 – kolumna „błędy standardowe”). W stosunku do wariantów estymacji uciętej oraz cenzurowanej wy- niki te wykazują odmienne tendencje. Można wywnioskować, że praktycznie w każdym z przypadków estymacja danych uciętych wraz ze wzrostem progu rapor- towania i tym samym utratą pewnej części informacji powoduje wzrost średniego poziomu błędu estymatora w odniesieniu do wyników rozwiązania bazowego.

W przypadku wariantu estymacji cenzurowanej można zauważyć jedynie niewielką zmianę w średnich wielkościach błędów, co z kolei może świadczyć o pewnej prze- wadze wariantu estymacji cenzurowanej nad estymacją uciętą.

Do podobnych wniosków można dojść, analizując wyniki z tab. 2, zawiera- jącej wielkości odchyleń standardowych dla poszczególnych zmiennych. Ten- dencje w poziomie zróżnicowania poszczególnych estymatorów parametrów wzrastają szczególnie intensywnie dla wariantów estymacji uciętej oraz naiwnej.

W wariancie estymacji cenzurowanej można zauważyć niewielki wzrost pozio- mu zróżnicowania w odniesieniu do rozwiązania bazowego.

Uzyskane wyniki pokazują, że wariant estymacji cenzurowanej jest w mniej- szym zakresie obciążony zmiennością wyników w stosunku do wariantu estymacji uciętej, który stosowany jest często w praktyce, podobnie jak rozwiązanie naiwne.

Pomimo że średnie wielkości parametrów modeli są na zbliżonych poziomach, wyniki badania symulacyjnego pokazują znaczące zróżnicowanie w poziomie

(14)

dyspersji tych parametrów dla różnych wariantów estymacji. Odnosząc te wyni- ki do praktycznych sytuacji, można przyjąć, że w razie dysponowania danymi uciętymi, różnice w wielkościach estymatorów pomiędzy wariantem estymacji uciętej a rzeczywistymi parametrami (choć w praktyce tak naprawdę nieznany- mi) mogą być duże. W tym przypadku estymacja cenzurowana wykazuje znacz- nie silniejszą zbieżność parametrów w stosunku do rzeczywistych wartości.

2. Wpływ sposobu raportowania strat na wielkość ryzyka szacowanego metodą LDA

Wyniki z pierwszego etapu badania, dotyczącego wpływu sposobu rapor- towania na estymatory parametrów rozkładu Weibulla dla różnych wariantów estymacji, w pewnym sensie ukierunkowują dalsze badanie. W celu pokazania skrajnych różnic pomiędzy czterema możliwymi wariantami estymacji można wybrać uśrednione wielkości rozwiązania bazowego (średnie wielkości z tab. 1) oraz naiwnego – jako parametry wejściowe dla odpowiednich modeli LDA. Dwa pozostałe warianty będą zawierały się pomiędzy tymi przypadkami, gdzie wariant cenzurowania danych będzie bliższy rozwiązaniu bazowemu, a wariant ucinania danych będzie bliższy rozwiązaniu naiwnemu. Wyznaczając wielkości z mode- lu LDA, przyjęto, że wielkości opisujące częstość zjawiska, dane pierwotnie jako rozkład Poissona, będą odpowiednio zmniejszane dla tych modeli LDA, które odno- szą się do estymacji naiwnej o wielkości rzędów kwantyli . Jest to postępowanie prawidłowe, gdy przyjmie się założenie, że procesem częstości będzie jednorodny proces Poissona. Oznacza to, że jeśli określony wynik będzie dotyczył przypadku rzędu kwantyla , to w metodzie LDA pierwotna częstość będzie zastą- piona wielkością 1 . Postępowanie takie wynika z własności rozkładu Pois- sona, w szczególności z twierdzeń, takich jak twierdzenie o dodawaniu oraz twierdzenie Rajkowa [Por. Fisz, 1969, s. 103 i 157; Shevchenko, 2011, s. 181].

Najważniejsze wyniki zbiorcze prezentowane są na rys. 4-6. Podobnie jak w przypadku rys. 1-3, tak i tu opis rzutów jest identyczny w zakresie płaszczyzny OXY. Natomiast wielkości osi OZ dotyczą odpowiednio wartości miary oraz zmian procentowych. Na rys. 4 oś OZ prezentuje wartości miary 0,999 . Można zauważyć, że proces cenzurowania wyznacza precedens w określaniu wiel- kości ryzyka. Wraz z postępem utraty informacji, dochodzi do stopniowego nie- doszacowania właściwego procesu, którego skala jest uzależniona od konkretne- go wariantu. Dynamika tego niedoszacowania jest odmienna w zależności od charakteru rozkładu dotkliwości. Cienki ogon rozkładu dotkliwości powoduje

(15)

słaby, ale rozwojowy spadek wartości . W przypadku grubego ogona roz- kładu dotkliwości największy spadek związany jest z początkową utratą infor- macji, która później zaczyna się stabilizować.

Rys. 4. Wartości 0,999 przy założeniu wielkości parametrów dla procesu dotkliwości, jako średnie wielkości dla rozwiązania bazowego z tab. 1

Na rys. 5 oraz 6 została przedstawiona praktycznie ta sama informacja, co na rys. 4, tylko w układzie procentowym. Rysunki 5 oraz 6 są ekwiwalentne. Je- dyna różnica polega na pokazaniu względnego (tj. procentowego) spadku jako wartości dodatnich w przypadku rys. 5 (odchylenia w górę od płaszczyzny OXY oznaczają odpowiedni spadek o tyle procent). Natomiast rys. 6 przedstawia odchy- lenie w dół, jako odchylenie od 100%. Pomimo przedstawienia na tych rysunkach w odmienny sposób tej samej informacji, to spojrzenie na problem z różnych perspektyw daje dodatkowe pojęcie o zjawisku. Na rys. 5 oraz 6 można zaobser- wować, że pewną teoretyczną barierą jest parametr kształtu przyjmujący wartość osi OX 1. Jak już wspomniano wcześniej, przy takim parametrze rozkład Weibulla będzie w szczególności rozkładem wykładniczym, który oddziela granicę grubo- i cienkoogonowości. Wraz z oddalaniem się od granicy 1 stronę cienkiego ogona 1, można zauważyć intensyfikację niedoszacowania wiel- kości . W przypadku 0 zwiększająca się dynamika zauważalna jest na początku procesu wzrostu wartości poziomu raportowania.

(16)

Rys. 5. Procentowe odchylenia jako wartości dodatnie

Rys. 6. Procentowe odchylenia od poziomu referencyjnego 100%

(17)

Podsumowanie

Przeprowadzone badania symulacyjne dotyczyły dwóch aspektów. Pierw- szy związany był bezpośrednio z weryfikacją skali zmienności parametrów roz- kładu Weibulla, przy wykorzystaniu różnych koncepcji modelowych dotyczą- cych estymacji jego parametrów. Badanie było motywowane względami praktycznymi związanymi z procesem raportowania i rejestracji strat w odnie- sieniu do procesów występujących w banku. Rozpatrzone podejścia pozwalają na jednoznaczne stwierdzenie, że proces ucinania danych ma istotne znaczenie w procesie estymacji parametrów ciągłych rozkładów prawdopodobieństwa. Sto- sowanie podejścia naiwnego, niejednokrotnie wykorzystywanego w praktyce ban- kowej, nie pozwala na oszacowanie skali zjawiska w sposób wiarygodny. Ponadto w przypadku procesu ucinania danych znaczący wpływ na wielkości estymowa- nych parametrów będzie miał rzeczywisty procent traconych informacji. W sytu- acji dysponowania w rzeczywistości pojedynczą realizacją szeregu wielkości strat, na podstawie którego estymowane są parametry, można oczekiwać znacznych rozbieżności w przypadku wysokich progów ucinania danych, w odniesieniu do rzeczywistego procesu, który tak naprawdę będzie nieznany (brakuje w procesie ucinania danych informacji o rzeczywistym odsetku odrzuconych informacji).

Podejście wykorzystujące cenzurowanie informacji jest znacznie bardziej od- porne na zmiany progu pełnego raportowania strat. Wiąże się to w praktyce ze zmianą koncepcji rejestrowania danych i przejścia z procesu ucinania na proces cenzurowania informacji. Co prawda, pełne rejestrowanie danych byłoby wyj- ściem idealnym, ponieważ pozwalałoby na całkowitą dowolność przy obróbce danych, jednak mogłoby się to wiązać ze zbyt rozbudowanym systemem rapor- towania strat. W tym kontekście proces cenzurowania pozwala w znacznym stopniu na zachowanie pierwotnych informacji, w rozsądnych granicach cenzu- rowania, o parametrach rozkładów, gdy znany jest prawdziwy rozkład generują- cy dane dotyczące dotkliwości zdarzeń.

Należy podkreślić, że znajomość pierwotnego procesu generującego dane nie będzie dostępna w praktyce, a jedyną możliwością jest wybór właściwego rozkładu za pomocą odpowiednich testów statystycznych. Fakt ten stanowi do- datkowe utrudnienie w procesie budowy modeli dotyczących dotkliwości strat, jednak nie był on poruszany w niniejszym artykule.

Głównym celem drugiego etapu badań jest weryfikacja, w jakim stopniu samo ucinanie danych wpływa na wielkości miary 0,999 , przy założeniu stałych parametrów dla procesu dotkliwości. Z przedstawionych informacji wy- nika, że proces ucinania danych w istotny sposób zaburza wyniki nawet o kilka-

(18)

naście procent, szczególnie w odniesieniu do rozkładów gruboogonowych. W roz- ważanym przypadku są to rozkłady Weibulla z parametrem 1. Dla rozkładów cienkoogonowych wpływ ten nie ma tak gwałtownego przebiegu, co w konsekwen- cji stanowi mniejsze zagrożenie błędną oceną i niedoszacowaniem wielkości ry- zyka w takim przypadku.

Cenzurowanie danych wpływa zarówno na proces częstości, jak i proces dotkliwości. Podejście oparte na ucinaniu danych jest niebezpieczne przy roz- kładach charakteryzujących się grubymi ogonami, bowiem wpływ zaniżenia częstości względem rzeczywistej liczby zdarzeń ma najbardziej destrukcyjny wpływ na wielkość szacowanego ryzyka. W połączeniu z błędnym sposobem estymacji rozkładów dotkliwości metodą naiwną, również skala pojedynczych strat będzie mocno zaburzona. Proces estymacji rozkładów dotkliwości, zakłada- jący fakt ucinania danych, może poprawić w znacznym stopniu niedopasowanie dziedziny dotkliwości zdarzeń operacyjnych, wynikające z ograniczonej infor- macji. Jednak również w tym przypadku dziedzina częstości będzie niedoszacowa- na o zdarzenia tzw. high frequency-low severity, tj. zdarzenia o wysokiej częstości, a niskiej dotkliwości. Proces cenzurowania, jak pokazuje badanie symulacyjne, może w znacznym stopniu poprawić wiarygodność ocen parametrów w zakresie modelowania dotkliwości zdarzeń. Co najważniejsze, podejście oparte na cenzuro- waniu danych, tj. w odniesieniu do modelowania ryzyka operacyjnego metodą LDA, daje pełną wiedzę na temat częstości zachodzących zjawisk.

Zaproponowane podejście dotyczące zmiany sposobu rejestrowania strat o charakterze operacyjnym w banku musi być pogłębione pod kątem pewnych rozwiązań analitycznych. Kluczowy jest tu również aspekt dopasowywania roz- kładów uciętych i cenzurowanych do danych rzeczywistych, w przypadku te- stowania oraz oceny dobroci dopasowania rozważanych rozkładów teoretycz- nych przedstawiających pewne hipotetyczne procesy generowania zdarzeń.

(19)

Tabela 1. Uśrednione wyniki symulacji Wartości Wartości parametrówBłędy standardowe bazowy ucięty naiwnycenzurowany bazowy ucięty naiwnycenzurowany 1 2 3 4 5 6 7 8 9 1011121314151617 0.5

0,501 4,006 0,501 4,006 0,5014,0060,5014,0060,0280,596 0,028 0,596 0,0280,5960,0280,596 0,504 4,050 0,504 4,052 0,5624,8680,5044,0500,0270,585 0,035 0,660 0,0300,6490,0280,586 0,503 4,013 0,505 4,033 0,6065,6030,5034,0140,0260,567 0,040 0,725 0,0320,6970,0270,569 0,501 4,044 0,505 4,100 0,6466,4830,5014,0410,0260,560 0,044 0,817 0,0340,7640,0270,565 0,502 4,032 0,505 4,064 0,6847,3070,5024,0340,0250,546 0,048 0,906 0,0360,8210,0280,554 0,503 4,039 0,508 4,113 0,7248,2480,5034,0410,0250,535 0,053 1,015 0,0390,8860,0280,546 0,503 4,037 0,510 4,167 0,7649,2970,5034,0320,0240,524 0,058 1,140 0,0410,9630,0280,539 0,502 4,004 0,508 4,126 0,80410,4000,5024,0070,0240,512 0,063 1,277 0,0441,0450,0290,532 0,503 4,015 0,513 4,227 0,84811,6790,5034,0150,0230,503 0,069 1,444 0,0471,1380,0290,529 0,503 4,034 0,515 4,318 0,89313,1480,5044,0360,0230,496 0,075 1,642 0,0501,2480,0300,531 0,502 4,024 0,511 4,277 0,93514,8380,5014,0160,0230,488 0,083 1,863 0,0541,3890,0310,535 0.75

0,756 4,031 0,756 4,031 0,7564,0310,7564,0310,0420,397 0,042 0,397 0,0420,3970,0420,397 0,753 3,994 0,754 3,999 0,8424,5300,7523,9920,0410,386 0,053 0,437 0,0450,4040,0410,387 0,756 4,013 0,759 4,016 0,9105,0050,7564,0140,0400,377 0,060 0,483 0,0490,4150,0410,379 0,756 3,989 0,758 3,986 0,9715,4410,7563,9900,0390,367 0,066 0,535 0,0520,4260,0410,370 0,754 4,028 0,758 4,030 1,0275,9720,7554,0280,0380,363 0,072 0,604 0,0550,4460,0410,368 0,754 4,010 0,762 4,050 1,0886,4710,7544,0080,0370,355 0,079 0,676 0,0580,4630,0420,362 0,755 4,021 0,760 4,027 1,1446,9890,7554,0220,0370,348 0,086 0,759 0,0610,4830,0420,358 0,754 4,000 0,766 4,063 1,2097,5480,7554,0020,0360,340 0,094 0,854 0,0660,5030,0430,354 0,753 4,008 0,759 4,011 1,2668,1550,7544,0070,0350,335 0,103 0,968 0,0700,5310,0440,353 0,753 4,001 0,767 4,086 1,3378,8270,7543,9990,0350,329 0,113 1,094 0,0750,5600,0450,353 0,754 4,016 0,770 4,126 1,4099,5640,7544,0110,0340,324 0,124 1,244 0,0810,5940,0460,356 1 1,004 4,014 1,004 4,014 1,0044,0141,0044,0140,0550,298 0,055 0,298 0,0550,2980,0550,298 1,007 3,993 1,008 3,989 1,1244,3801,0063,9920,0540,289 0,070 0,327 0,0610,2920,0550,289 1,007 4,000 1,015 4,015 1,2164,7321,0073,9980,0530,282 0,080 0,361 0,0650,2940,0550,284 1,006 4,001 1,010 3,998 1,2935,0551,0053,9990,0520,277 0,088 0,405 0,0690,2970,0550,279 1,004 4,001 1,012 4,013 1,3705,3951,0043,9980,0510,271 0,097 0,453 0,0730,3030,0550,275 1,007 4,001 1,017 4,016 1,4515,7171,0084,0020,0500,265 0,106 0,506 0,0770,3060,0560,270 1,005 3,987 1,015 3,995 1,5286,0591,0063,9850,0490,259 0,115 0,572 0,0820,3140,0560,267

(20)

cd. tabeli 1 1 2 3 4 5 6 7 8 9 1011121314151617 1,0053,9941,0194,0051,611 6,4271,006 3,995 0,048 0,255 0,126 0,6440,087 0,322 0,057 0,265 1,0063,9891,0284,0411,700 6,8131,007 3,989 0,047 0,250 0,138 0,7240,094 0,331 0,059 0,263 1,0063,9991,0244,0201,786 7,2221,008 3,997 0,046 0,246 0,151 0,8260,100 0,343 0,060 0,264 1,0074,0041,0324,0641,882 7,6751,007 4,002 0,045 0,242 0,166 0,9380,109 0,357 0,062 0,266 1.25

1,2584,0031,2584,0031,258 4,0031,258 4,003 0,069 0,237 0,069 0,2370,069 0,237 0,069 0,237 1,2594,0031,2614,0021,406 4,3111,258 4,002 0,068 0,231 0,088 0,2620,076 0,230 0,069 0,232 1,2594,0081,2583,9951,511 4,5731,258 4,007 0,066 0,227 0,099 0,2910,081 0,228 0,069 0,228 1,2594,0011,2643,9971,616 4,8211,260 4,001 0,065 0,221 0,110 0,3230,086 0,227 0,069 0,223 1,2544,0041,2634,0071,711 5,0861,254 4,004 0,063 0,217 0,121 0,3640,091 0,228 0,069 0,220 1,2573,9861,2643,9751,811 5,3091,258 3,986 0,062 0,211 0,132 0,4080,096 0,228 0,070 0,216 1,2574,0021,2714,0051,911 5,5831,260 4,004 0,061 0,208 0,144 0,4580,102 0,231 0,071 0,214 1,2593,9971,2804,0242,017 5,8491,258 3,994 0,060 0,204 0,157 0,5150,110 0,234 0,072 0,212 1,2594,0101,2804,0162,117 6,1341,260 4,008 0,059 0,201 0,171 0,5850,117 0,239 0,073 0,211 1,2594,0131,2804,0202,228 6,4281,261 4,014 0,058 0,197 0,188 0,6650,125 0,244 0,075 0,212 1,2574,0051,2844,0222,347 6,7421,258 4,003 0,057 0,194 0,207 0,7610,135 0,251 0,077 0,213 1.5

1,5093,9981,5093,9981,509 3,9981,509 3,998 0,083 0,198 0,083 0,1980,083 0,198 0,083 0,198 1,5114,0031,5164,0041,689 4,2591,511 4,003 0,081 0,193 0,105 0,2180,091 0,189 0,083 0,193 1,5073,9891,5183,9951,820 4,4651,507 3,988 0,079 0,188 0,119 0,2420,097 0,185 0,082 0,189 1,5103,9951,5193,9961,942 4,6701,511 3,995 0,078 0,184 0,132 0,2700,103 0,183 0,083 0,186 1,5063,9831,5143,9762,055 4,8641,506 3,982 0,076 0,180 0,145 0,3040,109 0,182 0,083 0,183 1,5074,0101,5174,0012,168 5,0871,509 4,011 0,074 0,177 0,158 0,3420,115 0,182 0,083 0,181 1,5083,9951,5143,9732,286 5,2751,508 3,993 0,073 0,173 0,173 0,3870,122 0,182 0,084 0,178 1,5104,0011,5163,9772,407 5,4881,510 3,998 0,072 0,170 0,188 0,4380,130 0,184 0,086 0,177 1,5043,9981,5203,9892,531 5,7161,505 3,997 0,070 0,168 0,206 0,4970,140 0,186 0,088 0,177 1,5084,0061,5464,0322,677 5,9441,510 4,005 0,069 0,164 0,226 0,5540,150 0,188 0,090 0,176 1,5063,9821,5403,9772,822 6,1591,511 3,984 0,068 0,161 0,250 0,6420,163 0,191 0,093 0,177 1.75 1,7643,9961,7643,9961,764 3,9961,764 3,996 0,097 0,169 0,097 0,1690,097 0,169 0,097 0,169 1,7623,9991,7673,9991,969 4,2171,762 3,998 0,095 0,165 0,123 0,1870,106 0,161 0,097 0,166 1,7624,0061,7664,0022,119 4,4041,761 4,005 0,093 0,162 0,139 0,2080,113 0,157 0,096 0,163 1,7614,0011,7734,0062,263 4,5761,760 4,000 0,091 0,158 0,154 0,2310,120 0,154 0,096 0,159 1,7623,9941,7683,9862,399 4,7331,762 3,993 0,089 0,154 0,169 0,2610,127 0,152 0,097 0,156 1,7583,9971,7683,9842,531 4,9051,759 3,997 0,087 0,152 0,185 0,2940,135 0,151 0,097 0,155

Cytaty

Powiązane dokumenty

Za hipotetyczny rozkład przyjęto rozkład LN(4; 1, 5). Rysunek 1 przedsta- wia sytuację, w której dla wybranego rozkładu wygenerowano 1000 realizacji zmiennych losowych i

Fakt, że ta polemika się wywiązała, łączy się jednak nie tylko z immanentny- mi właściwościami eseju Gombrowicza. Była ona wynikiem tego, że podjęto w nim sprawę ważną

Opisano zmiany wartości reakcji w układzie podporowym, położenia środka masy układu żurawia i ładunku dla różnych warunków stateczności w zależności od: położenia

Dorota Rudnicka..

Stanowisko 5 DgBCZYNO, gm.Białogard woj.koszalińskie Stanowisko 10 patrz wczesne średniowiecze DOLICE woj.szczecińskie Stanowisko 41 DROHICZYN woj.białostockie Stanowisko XVI

W Złocie satyryczność wtapia się w poetycką tkankę tekstu, realizując się poprzez sarkastyczną ironię ewokowaną na różnych jego płaszczyznach. Efekt

Możliwe interferencje dla łącza „w dół” i moc wykorzystywana przez Common Pilot Channel (około 10% całkowitej mocy stacji bazowej) jest brana pod uwagę w maksymalne

Wydaje się to implikować konieczność zarządzenia zmianą w zdecydowanie szerszym zakresie niż tylko w odniesieniu do polityki surowcowej.. Słowa kluczowe: górnictwo,