• Nie Znaleziono Wyników

Analiza zależności ekstremalnych

N/A
N/A
Protected

Academic year: 2021

Share "Analiza zależności ekstremalnych"

Copied!
11
0
0

Pełen tekst

(1)Zeszyty Naukowe nr. 726. Akademii Ekonomicznej w Krakowie. 2006. Sławomir Śmiech Katedra Statystyki. Analiza zależności ekstremalnych 1. Wprowadzenie W dobie globalizacji gospodarki zarządzający ryzykiem w instytucjach finansowych stoją przed nowymi wyzwaniami. Kryzysy w jednych częściach świata mają negatywne i nierzadko natychmiastowe konsekwencje dla rynków w innych częściach. Załamanie kursów na giełdach w Azji może powodować spadki cen w Europie lub Ameryce. Dlatego aby zabezpieczyć się przed stratą wartości portfela, zarządzający ryzykiem nie mogą ograniczać się do wyboru instrumentów z różnych sektorów czy rynków, ale muszą również analizować, czy pomiędzy nimi nie zachodzą tzw. ekstremalne zależności, które oznaczają równoczesny ekstremalny ruch cen. W niniejszym artykule przedstawiono elementy teorii wartości ekstremalnych, które mogą być wykorzystywane w szacowaniu i analizowaniu zależności ekstremalnych. Twierdzenia przedstawione w pracy zostaną zilustrowane przykładem, w którym wykorzystano procedurę analizy ekstremalnych zależności pomiędzy indeksami giełdowymi WIG20 i Dow Jones. 2. Elementy teorii wartości ekstremalnych Teoria wartości ekstremalnych (TWE) jako gałąź statystyki opisuje graniczne własności wartości ekstremalnych. Klasyczne podejście charakteryzuje zachowanie normalizowanych maksimów zmiennych losowych i może być sformułowane w postaci niżej podanego twierdzenia [Coles 2001]. Twierdzenie 1. Niech X1, …, X n będą zmiennymi losowymi niezależnymi o takim samym rozkładzie z dystrybuantą F. Oznaczmy Mn := max(X1, …, Xn).. ZN_726.indb 91. 1/30/08 12:58:40 PM.

(2) Sławomir Śmiech. 92. Niech an, bn będą takimi ciągami, że dla pewnej dystrybuanty G zachodzi: lim P. n. M n bn an. x = G(x),. Wtedy G jest jedną z dystrybuant typu: – Frechet 0, (x) = exp x. – Weibull. (. (x) =. exp 1,. (. ( x). R.. 0. x. ),. x. x > 0,. ),. >0. (1). . x<0 0,. x. >0. (2). . (3). – Gumbel. (. ). Λ(x) = exp −x − x ,. (4). x ∈ R.. Powyższe dystrybuanty są nazywane dystrybuantami wartości ekstremalnych. Możliwe jest przedstawienie powyższych funkcji w syntetycznej postaci, zwanej dystrybuantą uogólnionego rozkładu wartości ekstremalnych (generalized extreme value distribution, GEV):. H. ,μ,. (x) =. exp. 1. ,. 0. +. exp. 1+. x μ. exp. x μ. ,. x. R ,. (5). =0. gdzie: x+ = max(x, 0). Przypadek:. 1 , α 1 ξ < 0 odpowiada rozkładowi Weibulla, gdzie ξ = − , α ξ = 0 odpowiada rozkładowi Gumbela. Modelowanie zachowania normalizowanych maksimów w praktyce realizuje się poprzez wykorzystanie maksimów zmiennych w rozłącznych przedziałach czasu (metody te są nazywane metodami blokowymi) – w kolejnych miesiącach, kwartałach czy latach. ξ > 0 odpowiada rozkładowi Frecheta, gdzie ξ =. ZN_726.indb 92. 1/30/08 12:58:43 PM.

(3) Analiza zależności ekstremalnych. 93. Podobnie jak w przypadku jednowymiarowym, wielowymiarowy rozkład wartości ekstremalnych może być opisywany metodami blokowym. Niech (X1, Y1), (X2, Y2), … oznacza ciąg niezależnych wektorów o rozkładzie z dystrybuantą F(x, y). W wypadku opisu dystrybuanty F metodami blokowymi należy oznaczyć:. (. ). M x, n = max { Xi } , M y, n = max {Yi } , M n = M x, n , M y, n . i=1, …, n. i=1, …, n. (6). Wektor Mn jest wektorem, którego składowymi są maksymalne wartości zmiennych losowych X i Y. Opis wielowymiarowego rozkładu wartości ekstremalnych jest najprostszy w przypadku, gdy rozkłady brzegowe są standaryzowanymi rozkładami Frecheta. Standaryzacji tej dokonuje się dzieląc wektor Mn przez n.. (. ). Rozważa się zatem wektor M n = M x, n n , M y, n n . Poniższe twierdzenie opisuje wielowymiarowego rozkładu wartości ekstremalnych, w przypadku gdy n → ∞. *. (. ). Twierdzenie 2 [Coles 2001]. Niech wektor M n* = M x,* n , M y,* n , gdzie (Xi, Yi ) są niezależne, będzie miał składowe brzegowe opisywane standaryzowanym rozkładem Frecheta. Wtedy, jeśli:. to. Pr((M x,* n < x, M y,* n , y) → G(x, y),. (7). G ( x, y ) = exp –V ( x, y ) , x > 0, Y > 0,. (8). {. gdzie:. 1. V (x, y) = 2 max 0. }. x 1 w , dH (w), w y. (9). a H jest dystrybuantą spełniającą warunek: 1. ∫ wdH (w) = 0, 5. 0. (10). Dystrybuanty spełniające warunek (8) są nazywane dwuwymiarowymi dystrybuantami wartości ekstremalnych. W odróżnieniu od przypadku jednowymiarowego, gdzie opis jednowymiarowej dystrybuanty ograniczał się do trzech typów (Frechet, Gumbel, Weibull) wielowymiarowy rozkład jest opisywany poprzez możliwe warianty dystrybuanty H. Dowolna dystrybuanta spełniająca warunek (10) (takich dystrybuant jest nieskończenie wiele) generuje kolejne typy funkcji G, zatem w przypadku wielowymiarowym nie ma skończonej liczby rodzin generujących wszystkie możliwe typy wielowymiarowych rozkładów wartości ekstremalnych. W praktyce postać dystrybuanty G jest szczególnym przypadkiem funkcji należą-. ZN_726.indb 93. 1/30/08 12:58:47 PM.

(4) Sławomir Śmiech. 94. cych do jednej ze znanych rodzin dystrybuant wartości ekstremalnych. Najpopularniejszą z nich jest rodzina rozkładów logistycznych dana formułą: G(x, y) = exp. x. 1. +y. 1. , x, y > 0,. (0, 1).. (11). Zaletą takiego opisu jest możliwość zaobserwowania i łatwej interpretacji zależności pomiędzy badaną parą zmiennych. W przypadku gdy α → 1, badane zmienne są niezależne, gdy α → 0, występuje przypadek dodatniej zależności pomiędzy zmiennymi. Innymi rodzinami opisującymi dystrybuantę G są: model bilogistyczny, model Dirichleta [Coles 2001, s. 147], w których nie zakłada się symetrycznej zależności pomiędzy badanymi zmiennymi. Alternatywą do stosowania wyżej przedstawionych metod modelowania wielowymiarowego rozkładu wartości ekstremalnych jest użycie funkcji połączeń (copula function). Funkcje połączeń to dystrybuanty wielowymiarowych rozkładów jednostajnych. W wypadku gdy rozważany jest wektor (X1, …, Xn ) o dystrybuancie F, to o ile wszystkie jednowymiarowe rozkłady brzegowe F1, …, Fn są ciągłe, wówczas istnieje jedyna funkcja połączeń CF rozkładu F, taka że (tw. Sklara, 1959) [Embrechets, Lindskog, McNeil 2001]: F ( x1 , …, xn ) = CF F ( x1 ) , …, F ( xn ) .. (. ). (12). Ponieważ funkcja połączeń nie zależy od rozkładów brzegowych, więc zawiera wszystkie informacje dotyczące zależności pomiędzy składnikami wektora (X1, …, Xn ). Możliwość wykorzystania funkcji połączeń w analizie wielowymiarowego rozkładu wartości ekstremalnych, w przypadku gdy rozważane są maksima blokowe, przedstawia poniższe twierdzenie [Bouye 2002].. (. ). Twierdzenie 3. Niech M n = M x1 , n , …, M xd , n =. max X1, k , …, max Xd, k ,. k=1, …, n. k=1, …, n. gdzie (X1, n, …, Xd, n ) jest wektorem losowym o rozkładzie F, dystrybuantach brzegowych F1, …, Fd oraz funkcji połączenia C. Wówczas warunek: lim P. n. M x1 , n. a1, n. b1, n. x1 , …,. M xd , n. ad, n. bd , n. xd. (x1, …, xd ) R d , a j, n > 0. = G (x1 , …, xd ),  (13).   Wykorzystanie funkcji połączeń w metodach progowych analizy wartości ekstremalnych zawiera np. praca [Yamai, Yoshiba 2002]. . ZN_726.indb 94. 1/30/08 12:58:50 PM.

(5) Analiza zależności ekstremalnych. 95. zachodzi wtedy i tylko wtedy, gdy: 1. Dla każdego j = 1, …, d istnieją aj, n, bj, n i dystrybuanta graniczna Gj , takie że: lim P. n. M x j , n b j,n a j, n. x j = G j (x j ),. x. R.. (14). 2. Istnieje funkcja połączenia C∞, taka że:. C∞ (u1 , …, ud ) = lim C n (u11/n , …, u1/n d ). n→∞. (15). Jeżeli powyższe warunki są spełnione, zachodzi równość:. G∞ (x1 , …, xd ) = C∞ ( G1 (x1 ), …, Gd (xd )) .. Funkcja połączenia, dla której spełniony jest warunek:. C(u1t , …, u Nt ) = C t (u1 , …, u N ),. (16) (17). nazywana jest funkcją połączenia dla wartości ekstremalnych (extreme value copula). Analogicznie jak w przypadku klasycznego modelowania wielowymiarowej dystrybuanty wartości ekstremalnych, nie istnieje skończona liczba rodzin funkcji połączeń dla wartości ekstremalnych. 3. Wybór optymalnej funkcji połączenia Wielowymiarowy rozkład zmiennej losowej może być reprezentowany przez dystrybuanty brzegowe oraz funkcję połączeń. Wybór odpowiedniej funkcji połączeń sprowadza się do wytypowania najlepszej funkcji spośród skończonego zbioru kandydatów S (który jest podzbiorem zbioru wszystkich możliwych funkcji połączeń). Optymalna, najlepsza funkcja to ta, której odległość, mierzona np. odległością opartą na normach L p od empirycznej funkcji połączeń, jest najmniejsza spośród wszystkich dystrybuant w zbiorze S. W celu rozpoczęcia procesu porównywania odległości pomiędzy funkcjami połączeń należy wyznaczyć empiryczną funkcję połączenia. Problem pojawiający się w tym miejscu polega na tym, że skończona próba wyznacza empiryczne dystrybuanty brzegowe będące funkcjami skokowymi, z czego wynika, że funkcja połączenia opisująca zależności pomiędzy zmiennymi brzegowymi nie jest określona w sposób jednoznaczny (tw. Sklara). Może się wiec zdarzyć, że różne funkcje połączeń brane ze zbioru kandydatów są „najbliższe” różnym empirycznym. ZN_726.indb 95. 1/30/08 12:58:52 PM.

(6) Sławomir Śmiech. 96. funkcjom połączeń. Aby ominąć tę niejednoznaczność, P. Deheuveles w 1979 r. zaproponował następującą definicję [Durrleman 2000]. Definicja 1. Niech X =. T. {( x , x )} t 1. t 2. t =1. będzie próbą pochodzącą z wektora loso-. wego (X1, X2) o dystrybuantach brzegowych odpowiednio F1, F2 i funkcją połączenia C. Dwuwymiarową empiryczną funkcją połączenia na kracie L, gdzie: t1 t2 , : t n = 0, …, T  T T. L=. nazywa się funkcję postaci:. t t 1 Cˆ (T ) 1 , 2 = T T T. T t =1. 1 xt. 1. (. x1( t ) , x2t x2(t ). (18). ,. (19). ). gdzie xi(t ) jest t-tą kolejną obserwacją w ciągu xi(1) , xi(2) , …, xi(n) , gdzie xi(k ) jest. (. ). elementem próby, dla którego ≤ ≤ , i ∈ {1, 2} . Tak zdefiniowana funkcja połączenia nie zależy od rozkładów brzegowych i jest zbieżna do dystrybuanty C Cˆ → C . xi(1). (. xi(2). (T ). … ≤ xi(n). ). 4. Szacowanie asymptotycznej zależności W celu określenia zależności w ogonie rozkładu dwuwymiarowej zmiennej losowej analizuje się tzw. współczynnik zależności górnego ogona (analogicznie bada się zależność dolnego ogona) dany jako: χ = lim Pr { F1 (X) > u | F2 (Y ) > u } u→1. lub w alternatywnej postaci: = lim 2. u. 1. log Pr ( FX (X) < u, FY (Y ) < u ) . log u. (20). (21). Współczynnik ten mierzy prawdopodobieństwo wystąpienia zdarzenia ekstremalnego jednej zmiennej pod warunkiem wystąpienia zdarzenia ekstremalnego dla drugiej.. Definicja 2. Zmienne losowe są asymptotycznie niezależne, gdy współczynnik zależności górnego ogona jest równy zeru. Zmienne losowe są asymptotycznie zależne, gdy χ > 0, a wzrost natężenia zależności jest tożsamy ze wzrostem wartości χ.. ZN_726.indb 96. 1/30/08 12:58:57 PM.

(7) Analiza zależności ekstremalnych. 97. Asymptotyczna niezależność występuje dla bogatej klasy rozkładów. Przykładem jest dwuwymiarowy rozkład normalny, którego zmienne są skorelowane, a współczynnik korelacji zawiera się w przedziale (–1, 1). Dla tego rozkładu niemożliwe jest wystąpienie skrajnie dużych wartości dla obu zmiennych brzegowych jednocześnie. Mimo to dla współczynnika korelacji, którego wartość bezwzględna jest bliska jedności, występowanie zależności można zaobserwować nie tylko w jądrze rozkładu, ale także na „umiarkowanie” ekstremalnym poziomie [Coles 2001, s. 168]. Dlatego też, aby badać natężenie zależności w klasie rozkładów asymptotycznie niezależnych, wprowadza się następujący miernik: = lim. u. 1. 2 log(1 u) 1 . log Pr(FX (X) > u, FY (Y ) > u). (22). W przypadku gdy zmienne są asymptotycznie niezależne, χ = 0, zaś χ ∈ [−1, 1) wskazuje na natężenie zależności ekstremalnej. Jeśli np. rozważany jest dwuwymiarowy rozkład normalny, wówczas wartość χ jest równa współczynnikowi korelacji pomiędzy zmiennymi brzegowymi. Dla zmiennych asymptotycznie zależnych miernik χ przyjmuje wartość 1 i natężenie zależności ekstremalnych jest wskazywane przez wartość χ. Ponieważ funkcje połączeń niosą ze sobą wszystkie informacje dotyczące zależności pomiędzy zmiennymi losowymi, których rozkłady opisują, można więc przy ich użyciu badać zależności asymptotyczne. Mierniki χ i χ mogą zostać wyrażone w języku funkcji połączeń w następujący sposób: = lim 2 u 1. = lim. u 1. 1 C(u, u)  1 u. ln(1 u)2 1 . ln(1 2u + C(u, u)). (23) (24). Analiza pary (χ i χ) daje pełny obraz formy i natężenia asymptotycznej zależności. 5. Przykład empiryczny W niniejszym przykładzie elementy TWE i analiza funkcji połączeń zostaną wykorzystane w celu określenia formy i oszacowania natężenia zależności ekstremalnych. Dane użyte w przykładzie to logarytmiczne stopy zwrotów wartości indeksów Dow Jones i WIG20 z okresu od 3 stycznia 1995 r. do 28 listopada 2003 r. W celu uzyskania porównywalności dane zostały zestandaryzowane. Na rys. 1. ZN_726.indb 97. 1/30/08 12:59:00 PM.

(8) Sławomir Śmiech. 98. b). 600. –10 –5 0. 1400. 5 10. 2200. a). 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004. d) –6 –4 –2 0 2 4 6. 4000 6000 8000. 1100. c). 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004. 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004. 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004. Rys. 1. a) Wartość indeksu WIG20 na zamknięciu w badanym okresie, b) Logarytmiczne standaryzowane stopy zwrotu indeksu WIG20, c) Wartość indeksu Dow Jones na zamknięciu w badanym okresie, b) Logarytmiczne standaryzowane stopy zwrotu indeksu Dow Jones Źródło: opracowanie własne.. przedstawiono wykresy wartości badanych indeksów, a także analizowane logarytmiczne standaryzowane stopy zwrotów. Parametry rozkładu ogonów zmiennych losowych opisujących ujemne zmiany wartości indeksów (oznaczone symbolem „min”) oszacowano metodą największej wiarygodności przy użyciu metody blokowej. Obserwacje zostały podzielone na 107 podokresów, odpowiadających kolejnym miesiącom. Wyniki estymacji parametrów uogólnionej dystrybuanty wartości ekstremalnych (wzór (5)) przedstawia tabela 1. Tabela 1. Wyniki estymacji parametrów uogólnionej dystrybuanty wartości ekstremalnych dla badanej pary indeksów WIG20 min. Dow Jones min. 2,581. 1,5419. σˆ. 1,263. 0,7863. ξˆ. 0,1397. 0,1141. Parametr μˆ. Źródło: obliczenia własne.. ZN_726.indb 98. 1/30/08 12:59:06 PM.

(9) Analiza zależności ekstremalnych. 99. Parametr kształtu ξ uogólnionej dystrybuanty wartości ekstremalnych dla badanych spadków indeksów jest dodatni, co oznacza, że rozkłady analizowanych zmiennych mają grube ogony.. WIG20. 12. 8. 4. 0 0. 1. 2. 3 4 Dow Jones. 5. 6. 7. Rys. 2. Diagram korelacyjny maksymalnych logarytmicznych standaryzowanych zmian indeksów Dow Jones i WIG20 Źródło: opracowanie własne.. Rozkład dwuwymiarowy maksymalnych spadków badanych indeksów, które zostały przedstawione na rys. 2, zostanie opisany funkcją połączenia. Przedstawiony diagram korelacyjny wskazuje na niewielki stopień zależności, chociaż z drugiej strony, największe spadki wartości badanych indeksów występowały w tych samych okresach. W celu wybrania optymalnej funkcji połączenia stworzony został zbiór kandydatów S. Elementami zbioru S są wybrane funkcje połączeń dla wartości ekstremalnych oraz (dla porównania) funkcja połączenia normalnego (niespełniająca warunku (17)). Nazwy funkcji połączeń, których parametry będą oszacowane, są przedstawione wraz z ich dystrybuantami w tabeli 2. Oceny parametrów funkcji połączeń otrzymane metodą największej wiarygodności zostały przedstawione w tabeli 3. W celu wybrania najlepszej dystrybuanty oszacowane funkcje zostały porównane do empirycznej funkcji połączenia zdefiniowanej na następującej kracie: i j L= , : i, j {1, …, 107} . Odległość użyta do porównania (oparta na 107 107 normie L2 w dyskretnej wersji) ma następującą postać:. ZN_726.indb 99. 1/30/08 12:59:08 PM.

(10) Sławomir Śmiech. 100. ˆ = d(Ci , C). 107 107. i j Ci , 107 107. Cˆ. i=1 j=1. gdzie: Ci – funkcja połączenia należąca do zbioru S, Cˆ – empiryczna funkcja połączenia.. 2. i j , 107 107. ,. (25). Tabela 2. Dystrybuanty funkcji połączeń – elementy zbioru kandydatów S Funkcja połączenia. C(u, v) exp. (u. uv exp. (u. Gumbel Galambos exp. bb5. u +v. C⊥. (u. ). +v. 1. +v. ). 1. ). +v. 1. 1. uv. (. Φβ Φ −1 (u), Φ −1 (v). Normalna. ). Źródło: opracowanie własne.. Tabela 3. Oceny parametrów funkcji połączeń i odległości dystrybuant od empirycznej funkcji połączeń Funkcja połączenia. Gumbel. Galambos. bb5 C⊥. Normalna. Parametry 1,287 0,559. (1, 0,55) – 0,338. Odległość 1,844. 1,840. 1,840. 12,254 2,737. Źródło: obliczenia własne.. Odległość dystrybuant kandydatów od dystrybuanty empirycznej podano w tabeli 3. Wyniki przedstawione w tabeli dowodzą, że dystrybuanty Gumbela, Galambosa oraz bb5 są niemal tak samo odległe od empirycznej funkcji połączenia. Większy dystans od „wzorca” dzieli dystrybuantę połączenia normalnego. Zdecydowanie najdalej od porównywanej dystrybuanty znalazła się funkcja. ZN_726.indb 100. 1/30/08 12:59:11 PM.

(11) Analiza zależności ekstremalnych. 101. połączenia odpowiadająca za przypadek niezależności zmiennych brzegowych. W interpretacji zostanie użyta dystrybuanta Galambosa. Ponieważ oszacowany parametr β jest większy od zera, należy przyjąć, że opisywane maksymalne spadki badanych indeksów są asymptotycznie zależne. Natężenie ekstremalnej zależności oszacowane zostało zatem za pomocą wzoru (23) i wyniosło 0,29. 6. Podsumowanie Określanie formy i natężenia asymptotycznej zależności pomiędzy składnikami portfela wydaje się niezbędne w bezpiecznym i skutecznym zarządzaniu ryzykiem. Metodologia przedstawiona w niniejszym artykule pozwala badać zależność w ogonach rozkładów w przypadkach występowania zależności i niezależności asymptotycznej, przez co wydaje się bardzo skuteczna w kontekście zastosowań. Literatura Bouye E. [2002], Multivariate Extremes at Work for Portfolio Risk Management, preprint. Coles S.G. [2001], An Introduction to Statistical Modeling of Extreme Values, Springer, London. Durrleman V., Nikeghbali A., Roncalli T. [2000], Which Copula is the Right One?, preprint. Embrechets P., Lindskog F., McNeil A. [2001], Modelling Dependence with Copulas and Applications to Risk Management, Report, ETHZ, Zurich. Statystyczne metody oceny ryzyka w działalności gospodarczej [1998], red. A. Zeliaś, Wydawnictwo AE w Krakowie, Kraków. Yamai Y., Yoshiba T. [2002], Comparative Analyses of Expected Shortfall and Value-at-Risk under Market Stress, preprint. An Analysis of Extreme Correlations Determining the form and intensity of asymptotic correlation among portfolio components is crucial to safe and effective risk management. In this article, the author reviews extreme value theory and analyses the function of connections that enable the form and intensity of correlations in distribution tails to be estimated. The author presents indicators that afford a complete description of the correlations divided into asymptotically dependent and independent distributions. The article includes a translation of the theory used to determine the extreme correlations between the WIG20 and Dow Jones stock market indices.. ZN_726.indb 101. 1/30/08 12:59:11 PM.

(12)

Cytaty

Powiązane dokumenty

Rzucamy monetą tak długo, aż nie pojawią się dwa orły lub dwie reszki z rzędu. Niech X oznacza liczbę

Niech U będzie zmienną losową o rozkładzie jednostajnym na odcinku

Ponadto, niech funkcja g(x) ma staªy znak w przedziale [a, b]. (nieujemna

Niech funkcja f okre±lona na przedziale (a, b] oraz a b¦dzie punktem osobliwym tj. funkcja b¦dzie nieograniczona na prawostronnym s¡siedztwie

b) okre±l znak drugiej pochodnej-wyznaczamy przedziaªy wkl¦sªo±ci i wypukªo±ci funkcji oraz punkty przegi¦cia funkcji,. 6) zbierz otrzymane informacje o funkcji w tabeli 7)

2) zbadaj podstawowe wªasno±ci funkcji tj. parzysto±¢, nieparzysto±¢, okresowo±¢, punkty prze- ci¦cia wykresu funkcji z osiami wspóªrz¦dnych,. 3) wyznacz asymptoty

Zmienna losowa X przyjmuje wartości równe ilości wyrzuconych orłów, natomiast zmienna losowa Y przyjmuje wartość jeden jeśli w pierwszym rzucie wypadł orzeł oraz zero w

Zmienna losowa X przyjmuje wartości równe maksimum wyrzuconych oczek.. Wyz- naczyć rozkład zmiennej