• Nie Znaleziono Wyników

Estymacja wysokich kwantyli SLAJDY XL Konferencja Zastosowa Matematyki Kocielisko 30.VIII-6.IX.2011

N/A
N/A
Protected

Academic year: 2021

Share "Estymacja wysokich kwantyli SLAJDY XL Konferencja Zastosowa Matematyki Kocielisko 30.VIII-6.IX.2011"

Copied!
52
0
0

Pełen tekst

(1)

ESTYMACJA WYSOKICH KWANTYLI

Ryszard Zieliński, IMPAN Warszawa

XL Konferencja Zastosowań Matematyki Zakopane-Kościelisko 30.VIII - 6.IX.2011

(2)

Problem szacowania wysokich kwantyli pojawia się w różnych zastosowaniach (ekonomia, finanse, VaR, ekologia).

Chodzi o kwantyle np. rzędu 0.99, rzędu 0.999, lub nawet wyższego

Później sprecyzuję pojęcie „WYSOKI RZĄD”

Dla danego zjawiska, taki kwantyl interpretowany jest jako próg, który może być przekroczony z małym prawdopodobieństwem, np. 0.01 lub 0.001.

Nasze źródło informacji (jedyne?): obserwacje historyczne danego

(3)

Problem szacowania wysokich kwantyli pojawia się w różnych zastosowaniach (ekonomia, finanse, VaR, ekologia).

Chodzi o kwantyle np. rzędu 0.99, rzędu 0.999, lub nawet wyższego

Później sprecyzuję pojęcie „WYSOKI RZĄD”

Dla danego zjawiska, taki kwantyl interpretowany jest jako próg, który może być przekroczony z małym prawdopodobieństwem, np. 0.01 lub 0.001.

Nasze źródło informacji (jedyne?): obserwacje historyczne danego

(4)

Problem szacowania wysokich kwantyli pojawia się w różnych zastosowaniach (ekonomia, finanse, VaR, ekologia).

Chodzi o kwantyle np. rzędu 0.99, rzędu 0.999, lub nawet wyższego

Później sprecyzuję pojęcie „WYSOKI RZĄD”

Dla danego zjawiska, taki kwantyl interpretowany jest jako próg, który może być przekroczony z małym prawdopodobieństwem, np. 0.01 lub 0.001.

Nasze źródło informacji (jedyne?): obserwacje historyczne danego

(5)

Problem szacowania wysokich kwantyli pojawia się w różnych zastosowaniach (ekonomia, finanse, VaR, ekologia).

Chodzi o kwantyle np. rzędu 0.99, rzędu 0.999, lub nawet wyższego

Później sprecyzuję pojęcie „WYSOKI RZĄD”

Dla danego zjawiska, taki kwantyl interpretowany jest jako próg, który może być przekroczony z małym prawdopodobieństwem, np. 0.01 lub 0.001.

Nasze źródło informacji (jedyne?): obserwacje historyczne danego

(6)

Problem szacowania wysokich kwantyli pojawia się w różnych zastosowaniach (ekonomia, finanse, VaR, ekologia).

Chodzi o kwantyle np. rzędu 0.99, rzędu 0.999, lub nawet wyższego

Później sprecyzuję pojęcie „WYSOKI RZĄD”

Dla danego zjawiska, taki kwantyl interpretowany jest jako próg, który może być przekroczony z małym prawdopodobieństwem, np. 0.01 lub 0.001.

Nasze źródło informacji (jedyne?): obserwacje historyczne danego

(7)

Cała informacja z obserwacji, którymi dysponujemy, jest zawarta w dystrybuancie empirycznej: x1:5 x2:5 x3:5 x4:5 x5:5 0.2 0.4 0.6 0.8 1 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 0 1 1

(8)

Cała informacja z obserwacji, którymi dysponujemy, jest zawarta w dystrybuancie empirycznej: x1:5 x2:5 x3:5 x4:5 x5:5 0.2 0.4 0.6 0.8 1 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 0 1 1

Przykład: oszacować kwantyl rzędu 0.9

(9)

Cała informacja z obserwacji, którymi dysponujemy, jest zawarta w dystrybuancie empirycznej: x1:5 x2:5 x3:5 x4:5 x5:5 0.2 0.4 0.6 0.8 1 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 0 1 1

Przykład: oszacować kwantyl rzędu 0.9

Ekstrapolacja EDF? Wygładzanie i ekstrapolacja?

(10)

Cała informacja z obserwacji, którymi dysponujemy, jest zawarta w dystrybuancie empirycznej: x1:5 x2:5 x3:5 x4:5 x5:5 0.2 0.4 0.6 0.8 1 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 0 1 1

Przykład: oszacować kwantyl rzędu 0.9

(11)

Typowe podejście: ekstrapolacja

Hill, B.M. (1975), A simple general approach to inference about the tail of a distribution. The Annals of Statistics 3, 5, 1163–1174

(12)
(13)

Markovich (2008):

The lack of information beyond the range of the samplecreates

the main problem in the estimation of high quantiles. Since Fn(Xn:n) = 1, it is impossible to estimate the quantiles without

knowledge of the behavior of F at infinity.The main idea behind

allestimators for high quantiles isto select first some auxiliary

pilot estimate inside the range of the sample(one can use one of

the order statistics close to the boundary as a pilot estimate) and to move this pilot estimate to the right.

Obviously,in order to extrapolate the pilot estimate beyond the sample range, one needs to use some model of the tail of the

distribution.Such models are not available in many applications.

Therefore, the asymptotic tail models based on the distribution of

(14)

Markovich (2008):

The lack of information beyond the range of the samplecreates

the main problem in the estimation of high quantiles.

Since Fn(Xn:n) = 1, it is impossible to estimate the quantiles without

knowledge of the behavior of F at infinity.The main idea behind

allestimators for high quantiles isto select first some auxiliary

pilot estimate inside the range of the sample(one can use one of

the order statistics close to the boundary as a pilot estimate) and to move this pilot estimate to the right.

Obviously,in order to extrapolate the pilot estimate beyond the sample range, one needs to use some model of the tail of the

distribution.Such models are not available in many applications.

Therefore, the asymptotic tail models based on the distribution of

(15)

Markovich (2008):

The lack of information beyond the range of the samplecreates

the main problem in the estimation of high quantiles. Since Fn(Xn:n) = 1, it is impossible to estimate the quantiles without

knowledge of the behavior of F at infinity.

The main idea behind

allestimators for high quantiles isto select first some auxiliary

pilot estimate inside the range of the sample(one can use one of

the order statistics close to the boundary as a pilot estimate) and to move this pilot estimate to the right.

Obviously,in order to extrapolate the pilot estimate beyond the sample range, one needs to use some model of the tail of the

distribution.Such models are not available in many applications.

Therefore, the asymptotic tail models based on the distribution of

(16)

Markovich (2008):

The lack of information beyond the range of the samplecreates

the main problem in the estimation of high quantiles. Since Fn(Xn:n) = 1, it is impossible to estimate the quantiles without

knowledge of the behavior of F at infinity.The main idea behind

allestimators for high quantiles isto select first some auxiliary

pilot estimate inside the range of the sample(one can use one of

the order statistics close to the boundary as a pilot estimate) and to move this pilot estimate to the right.

Obviously,in order to extrapolate the pilot estimate beyond the sample range, one needs to use some model of the tail of the

distribution.Such models are not available in many applications.

Therefore, the asymptotic tail models based on the distribution of

(17)

Markovich (2008):

The lack of information beyond the range of the samplecreates

the main problem in the estimation of high quantiles. Since Fn(Xn:n) = 1, it is impossible to estimate the quantiles without

knowledge of the behavior of F at infinity.The main idea behind

allestimators for high quantiles isto select first some auxiliary

pilot estimate inside the range of the sample(one can use one of

the order statistics close to the boundary as a pilot estimate) and to move this pilot estimate to the right.

Obviously,in order to extrapolate the pilot estimate beyond the sample range, one needs to use some model of the tail of the distribution.

Such models are not available in many applications.

Therefore, the asymptotic tail models based on the distribution of

(18)

Markovich (2008):

The lack of information beyond the range of the samplecreates

the main problem in the estimation of high quantiles. Since Fn(Xn:n) = 1, it is impossible to estimate the quantiles without

knowledge of the behavior of F at infinity.The main idea behind

allestimators for high quantiles isto select first some auxiliary

pilot estimate inside the range of the sample(one can use one of

the order statistics close to the boundary as a pilot estimate) and to move this pilot estimate to the right.

Obviously,in order to extrapolate the pilot estimate beyond the sample range, one needs to use some model of the tail of the

distribution.Such models are not available in many applications.

Therefore, the asymptotic tail models based on the distribution of

(19)

Markovich (2008):

The lack of information beyond the range of the samplecreates

the main problem in the estimation of high quantiles. Since Fn(Xn:n) = 1, it is impossible to estimate the quantiles without

knowledge of the behavior of F at infinity.The main idea behind

allestimators for high quantiles isto select first some auxiliary

pilot estimate inside the range of the sample(one can use one of

the order statistics close to the boundary as a pilot estimate) and to move this pilot estimate to the right.

Obviously,in order to extrapolate the pilot estimate beyond the sample range, one needs to use some model of the tail of the

distribution.Such models are not available in many applications.

Therefore, the asymptotic tail models based on the distribution of

(20)

Przykład 1 (p - rząd estymowanego kwantyla)

In the POT (Picks Over Threshold) estimator, the GPD (Generalized Pareto Distribution) is used as a distribution of excesses overSOME high threshold u:

CDF (x ) = 1 −  1 +γx − u σ −1/γ , γ 6= 0 = 1 − exp{−(x − u)/σ}, γ = 0 Estymator: xpPOT = u +σˆ ˆ γ  p 1 − Fn(u) −ˆγ − 1 ! ,

(21)

Przykład 2.

In Weissman (1978) the estimator xpw = Xn−k,n

 k + 1

(n + 1)p

γ

, k = 1, . . . , n

is obtained for the Pareto tail model:

CDF (x ) = 1 − exp{−x−1/γ}, γ > 0, x > 0

(22)

Przykład 2.

In Weissman (1978) the estimator xpw = Xn−k,n

 k + 1

(n + 1)p

γ

, k = 1, . . . , n

is obtained for the Pareto tail model:

CDF (x ) = 1 − exp{−x−1/γ}, γ > 0, x > 0

(23)

Przykład 3 (Markovich and Krieger (2002) xpc = Xn−k,n  −0.5 + s 0.25 + pnc(ˆγ) k   −ˆγ gdzie c(γ) = 1 + Xn−k,n−1/γ + Xn−k,n−2/γ

(24)

Przykład 3 (Markovich and Krieger (2002)

„one can expect that the statistic

xpc = Xn−k,n  −0.5 + s 0.25 + pnc(ˆγ) k   −ˆγ gdzie c(γ) = 1 + Xn−k,n−1/γ + Xn−k,n−2/γ approximates xp” a

(25)

Kwantyl Pareto: 0.99 − 100, 0.999 − 1000

(26)

Kwantyl Pareto: 0.99 − 100, 0.999 − 1000

(27)

Mój model:

F – rodzina wszystkich rozkładów

z ciągłymi i ściśle rosnącymi dystrybuantami

(28)

Mój model:

F – rodzina wszystkich rozkładów

z ciągłymi i ściśle rosnącymi dystrybuantami

(29)

Optymalny estymator kwantyla w modelu F

Klasa T estymatorów ekwiwariantnych

T ∈ T wtedy i tylko wtedy, gdy dla każdego ściśle rosnącego przekształcenia prostej g ,

T (g (x1), g (x2), . . . , g (xn)) = g (T (x1, x2, . . . , xn))

TWIERDZENIE. T jest estymatorem ekwiwariantnym wtedy

i tylko wtedy, gdy jest postaci T = XJ:n, gdzie J jest losowym

(30)

Optymalny estymator kwantyla w modelu F

Klasa T estymatorów ekwiwariantnych

T ∈ T wtedy i tylko wtedy, gdy dla każdego ściśle rosnącego przekształcenia prostej g ,

T (g (x1), g (x2), . . . , g (xn)) = g (T (x1, x2, . . . , xn))

TWIERDZENIE. T jest estymatorem ekwiwariantnym wtedy

i tylko wtedy, gdy jest postaci T = XJ:n, gdzie J jest losowym

(31)

Kryterium

medianowo nieobciążony estymator

o maksymalnej koncentracji wokół estymowanego

kwantyla

(32)

Kryterium

medianowo nieobciążony estymator

o maksymalnej koncentracji wokół estymowanego

kwantyla

(33)

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... C DF xq 0.5 x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. xq ... ... ... ... ... ... ... ... ... ...... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...... ...... ... ... ...... ...... ... ...... ... ...... ...... ...... ...... ...... ...... P DF

Estimate of xq with solid cdf and pdf

is more concentrated median-unbiased estimator of xq

than that with dashed pdf

(34)

Medianowo nieobciążony estymator kwantyla rzędu q, z próby X1, X2, . . . , Xn o liczności n, istnieje wtedy i tylko wtedy, gdy

1 − (1/2)1/n¬ q ¬ (1/2)1/n

Definicja. Dla danego n, xq jest kwantylem wysokiego rzędu, gdy

q> q(n) = (1/2)1/n.

Definicja. Dla danego q, xq jest kwantylem wysokiego rzędu, gdy

n< n(q) = −log 2/log q.

(35)

Medianowo nieobciążony estymator kwantyla rzędu q, z próby X1, X2, . . . , Xn o liczności n, istnieje wtedy i tylko wtedy, gdy

1 − (1/2)1/n¬ q ¬ (1/2)1/n

Definicja. Dla danego n, xq jest kwantylem wysokiego rzędu, gdy

q> q(n) = (1/2)1/n.

Definicja. Dla danego q, xq jest kwantylem wysokiego rzędu, gdy

n< n(q) = −log 2/log q.

(36)

Medianowo nieobciążony estymator kwantyla rzędu q, z próby X1, X2, . . . , Xn o liczności n, istnieje wtedy i tylko wtedy, gdy

1 − (1/2)1/n¬ q ¬ (1/2)1/n

Definicja. Dla danego n, xq jest kwantylem wysokiego rzędu, gdy

q> q(n) = (1/2)1/n.

Definicja. Dla danego q, xq jest kwantylem wysokiego rzędu, gdy

n< n(q) = −log 2/log q.

(37)

Table 1 n 5 10 20 50 100 q(n) 0.8706 0.9331 0.9660 0.9863 0.9931 n 200 500 1000 2000 5000 q(n) 0.9966 0.9987 0.9993 0.9997 0.99986 Table 2 q 0.9 0.95 0.99 0.999 0.9999 0.99999 n(q) 7 14 69 693 6932 69315 1 aRys

(38)

0 10 20 30 40 50 0.5 0.6 0.7 0.8 0.9 1.0

(39)
(40)

F -przekształcenie: 0.0 1.0 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... x F (x) q xq(F ) T F (T ) 1

(41)

F -przekształcenie: 0.0 1.0 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... x F (x) q xq(F ) T F (T ) ... ... ... ... ... ... ... ... ... ... 1

Jeżeli T jest estymatorem kwantyla xq rzędu q, to F (T ) jest

(42)

T jest

F -nieobciążonym estymatorem

kwantyla x

q

,

jeżeli

E

F

(F (T )) = q,

dla każdego F ∈ F

Średniokwadratowy F -błąd estymatora

T wyraża się

wzorem

E

F

(F (T ) − q)

2

(43)

T jest

F -nieobciążonym estymatorem

kwantyla x

q

,

jeżeli

E

F

(F (T )) = q,

dla każdego F ∈ F

Średniokwadratowy F -błąd estymatora

T wyraża się

wzorem

E

F

(F (T ) − q)

2

(44)

TWIERDZENIE. Dla wysokiego kwantyla, estymator

F -nieobciążony nie istnieje.

DOWÓD.Mamy EFF (XJ:n) = n X j =1 λjEUj :n= 1 n + 1 n X j =1 jλj Równanie 1 n + 1 n X j =1 jλj = q

ma rozwiązanie wtedy i tylko wtedy, gdy

1/(n + 1) ¬ q ¬ n/(n + 1). Kwantyl jest wysoki, gdy q > n(q), ale n(q) = (1/2)1/n > n/(n + 1) dla n > 1. QED

(45)

TWIERDZENIE. Dla wysokiego kwantyla, estymatorem

o jednostajnie minimalnym F -błędzie średniokwadratowym jest Xn:n.

(46)

DOWÓD.

Mamy FMSEn(q) = EF  F (XJ:n) − q 2 = E (UJ:n− q)2 = n X j =1 λjE (Uj :n− q)2 = n X j =1 λjΓ(n + 1) Γ(j )Γ(n − j + 1) Z 1 0 (x − q)2xj −1(1 − x )n−jdx = 1 (n + 1)(n + 2) n X j =1 j j + 1 − 2(n + 2)qλj+ q2 Rozkładem (λ

1, λ∗2, . . . , λ∗n), który minimalizuje ten błąd, jest

rozkład zλj ∗= 1, λj = 0, j 6= j∗, gdzie j∗ minimalizuje

j j + 1 − 2(n + 2)q

, jednostajnie względem q> q(n), czyli j∗= n.

(47)

Średniokwadratowy F -błąd optymalnego estymatora wyraża się wzorem: FMSEn(q) = nn + 1 − 2(n + 2)q (n + 1)(n + 2) + q 2, q ­ q(n)

Dla danego n, mamy FMSEn% 1 − [n(n + 3)]/[(n + 1)(n + 2)]

gdy q % 1,

Ponadto FMSEn& 0, gdy n % +∞, jednostajnie względem

q ­ q(n)

(48)

Udowodniliśmy

TWIERDZENIE. Dla wysokiego kwantyla, estymatorem

o jednostajnie minimalnym F -błędzieśredniokwadratowym

jest Xn:n.

Czy prawdziwe jest takie twierdzenie dla ryzyka przy dowolnej

wypukłejfunkcji strat? Myślę, że tak.

(49)

Udowodniliśmy

TWIERDZENIE. Dla wysokiego kwantyla, estymatorem

o jednostajnie minimalnym F -błędzieśredniokwadratowym

jest Xn:n.

Czy prawdziwe jest takie twierdzenie dla ryzyka przy dowolnej

wypukłejfunkcji strat?

Myślę, że tak.

(50)

Udowodniliśmy

TWIERDZENIE. Dla wysokiego kwantyla, estymatorem

o jednostajnie minimalnym F -błędzieśredniokwadratowym

jest Xn:n.

Czy prawdziwe jest takie twierdzenie dla ryzyka przy dowolnej

wypukłejfunkcji strat? Myślę, że tak.

(51)

Udowodniliśmy

TWIERDZENIE. Dla wysokiego kwantyla, estymatorem

o jednostajnie minimalnym F -błędzieśredniokwadratowym

jest Xn:n.

Czy prawdziwe jest takie twierdzenie dla ryzyka przy dowolnej

wypukłejfunkcji strat? Myślę, że tak.

(52)

Błąd estymacji dużych kwantyli w modelu nieparametrycznym F jest mierzony w terminach(F (T ) − q).

Ocena tego błędu w terminach(T − xq(F ))jest w tym modelu niemożliwa (?), chyba że wprowadzimy jakieś precyzyjne warunki na zachowanie się ogonów rozkładów.

Interesująco w tym kontekście wygląda problem estymacji wysokich kwantyli w mniejszych modelach

F1 = F ∩ {F : Z 1 0 |F−1(t)|dt< ∞} lub F2 = F ∩ {F : Z 1 0 (F−1(t))2dt < ∞} a

Obraz

Table 1 n 5 10 20 50 100 q(n) 0.8706 0.9331 0.9660 0.9863 0.9931 n 200 500 1000 2000 5000 q(n) 0.9966 0.9987 0.9993 0.9997 0.99986 Table 2 q 0.9 0.95 0.99 0.999 0.9999 0.99999 n(q) 7 14 69 693 6932 69315 1 a Rys

Cytaty

Powiązane dokumenty

For 2014 and 2016, the market structure is analysed and compared on the level of individual websites for the overall market perspective as well as for political

W krajobrazie płockich ulic, szczególnie Starego rynku pojawiały się orszaki pogrzebowe, czasami nawet trzy w ciągu dnia.. Głośne modlitwy i żałobne śpiewy, przy biciu

Na płaszczyźnie kulturalnej rozwój lokalny pozwala na autonomię w pozyskiwaniu wiedzy, informacji, komunikacji społecznej, sfera zaś polityczna rozwoju lokalnego

udzielane będą zasadniczo na 12 miesięcy. Komisja może przedłu­ żać termin ten do 2-ch lat, a w wyjątkowych wypadkach po stwier­ dzeniu szczególnie ciężkiej sytuacji

Związki dziennikarstwa z literaturą – a zatem dziedzin, które wyrosły, z jed- nej strony, z potrzeby zaspokojenia ludzkiej ciekawości świata, dostarczania in- formacji,

Czy czuję się uczniem prof. Bohdana Jałowieckiego? W jakimś stopniu na pewno tak. Był recen- zentem mojej pracy doktorskiej. Ale stosunkowo rzadko współpracowałem z nim

Крім традиційно загальних рис, адміністративно-правовим засобам убезпечення атмосферного повітря притаманні специфічні ознаки, серед яких слід

Indem die vielfältigen literarischen, filmischen und journali- stischen Begegnungen einer eingehenden Analyse unterzogen werden, wird das Buch also auch für die jüngste Generation