• Nie Znaleziono Wyników

Zagadnienia kalkulacji składki zaufania na podstawie łącznej wartości i liczby szkód

N/A
N/A
Protected

Academic year: 2021

Share "Zagadnienia kalkulacji składki zaufania na podstawie łącznej wartości i liczby szkód"

Copied!
31
0
0

Pełen tekst

(1)

Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2011

aktuarialne

– teoria i praktyka

pod redakcją

Walentego Ostasiewicza

(2)

Redaktor Wydawnictwa Aleksandra Śliwka Redakcja techniczna Barbara Łopusiewicz Korektor Barbara Cibis Łamanie Beata Mazur Projekt okładki Beata Dębska

Publikacja jest dostępna na stronie www.ibuk.pl

Streszczenia opublikowanych artykułów są dostępne w międzynarodowej bazie danych The Central European Journal of Social Sciences and Humanities http://cejsh.icm.edu.pl oraz w The Central and Eastern European Online Library www.ceeol.com

Informacje o naborze artykułów i zasadach recenzowania znajdują się na stronie internetowej Wydawnictwa

www.wydawnictwo.ue.wroc.pl

Kopiowanie i powielanie w jakiejkolwiek formie wymaga pisemnej zgody Wydawnictwa

© Copyright Uniwersytet Ekonomiczny we Wrocławiu Wrocław 2011

ISSN 1899-3192 ISBN 978-83-7695-186-7

Wersja pierwotna: publikacja drukowana Druk: Drukarnia TOTEM

(3)

Wstęp . . . 7

Irmina Czarna, Zbigniew Palmowski, Porównanie prawdopodobieństw

pa-ryskiej i klasycznej ruiny dla procesu ryzyka typu Lévy’ego . . . 9

Irmina Czarna, Zbigniew Palmowski, Problem wyboru optymalnej

pary-skiej dywidendy dla procesu ryzyka typu Lévy’ego – numeryczna analiza 22

Joanna Dębicka, Składki netto dla ubezpieczeń wielostanowych obciążone

kosztami zawarcia i prowadzenia umowy . . . 38

Monika Dyduch, Niekonwencjonalna metoda prognozy wartości jednostek

funduszy emerytalnych . . . 69

Stanisław Heilpern, Niestandardowe modele ryzyka – badanie wpływu

stop-nia zależności na prawdopodobieństwo ruiny . . . 79

Aleksandra Iwanicka, Wpływ zewnętrznych czynników ryzyka na

prawdo-podobieństwo ruiny w dwuwymiarowym modelu ryzyka z lekkoogono-wymi rozkładami wypłat . . . 92

Helena Jasiulewicz, Wojciech Kordecki, Składki zaufania z zastosowaniem

niesymetrycznych funkcji strat . . . 101

Kamil Jodź, Składka w modelu ryzyka indywidualnego z zależnymi

roszcze-niami opisanymi funkcjami łączącymi . . . 118

Marek Kałuszka, Michał Krzeszowiec, Własności składki mean-value przy

zniekształconym prawdopodobieństwie . . . 136

Zbigniew Michna, Procesy Lévy’ego w modelach ubezpieczeniowych . . . 149 Agnieszka Mruklik, Ubezpieczenia na życie ze stochastyczną techniczną

stopą oprocentowania – zastosowanie modelu Hulla i White’a . . . 157

Agnieszka Pobłocka, Rezerwa IBNR w ubezpieczeniach majątkowych

– praktyczne metody jej szacowania . . . 173

Agata de Sas Stupnicka, Równowaga na rynku ubezpieczeń zdrowotnych

w zależności od przyjętego sposobu rozliczania świadczeń medycznych 190

Joanna Sawicka, Zagadnienia kalkulacji składki zaufania na podstawie

łącz-nej wartości i liczby szkód . . . 202

Alicja Wolny-Dominiak, Analiza porównawcza modeli mieszanych sza-

cowania stóp taryf w ubezpieczeniach majątkowych z wykorzystaniem kroswalidacji . . . 229

(4)

Summaries

Irmina Czarna, Zbigniew Palmowski, Comparison of Parisian and classical

ruin probabilities for a Lévy risk process . . . 21

Irmina Czarna, Zbigniew Palmowski, Numerical analysis of dividend prob-Numerical analysis of dividend prob-lem with Parisian delay for a spectrally negative Lévy risk process . . . 37

Joanna Dębicka, E�pense-loaded premiums for multistate insurance con-E�pense-loaded premiums for multistate insurance con-tracts . . . 68

Monika Dyduch, Alternative method of forecast of pension funds units value 78

Stanisław Heilpern, Nonstandard risk models – study of influence of the de-gree of dependence on the probability of ruin . . . 91

Aleksandra Iwanicka, The influence of some outside risk factors on a ruin

probability in a two-dimensional risk model with light-tailed claim sizes 100

Helena Jasiulewicz, Wojciech Kordecki, Credibility premiums using asym-Credibility premiums using asym-metric loss functions . . . 117

Kamil Jodź, Insurance premium in individual risk model with dependent

claims described by copulas functions . . . 135

Marek Kałuszka, Michał Krzeszowiec, Properties of mean-value principle

under rank-dependent utility model . . . 148

Zbigniew Michna, Lévy processes in insurance models . . . 156 Agnieszka Mruklik, Life insurance with stochastic interest rate – an applica-Life insurance with stochastic interest rate – an

applica-tion of the Hull and White model . . . 172

Agnieszka Pobłocka, IBNR reserve in non-life insurance. Practical methods

of its estimation . . . 189

Agata de Sas Stupnicka, Balance on the health insurance market – the impact

of payment system . . . 201

Joanna Sawicka, Calculation of credibility premium on the basis of number

and total amount of claims . . . 228

Alicja Wolny-Dominiak, Comparative analysis of mi�ed models for

(5)

Zagadnienia aktuarialne – teoria i praktyka ISSN 1899-3192

Joanna Sawicka

Uniwersytet Warszawski

ZAGADNIENIA KALKULACJI SKŁADKI ZAUFANIA

NA PODSTAWIE ŁĄCZNEJ WARTOŚCI

I LICZBY SZKÓD

Streszczenie: W artykule zostało rozważone zagadnienie obliczania predyktora zaufania dla

łącznej wartości szkód. Przedstawiono postać składki obliczoną na podstawie łącznej warto-ści szkód, na podstawie liczby szkód oraz na podstawie łącznej wartowarto-ści i liczby szkód jedno-cześnie. Obliczone zostały także błędy średniokwadratowe zaproponowanych składek oraz rozważone zostały konsekwencje przyjęcia różnych założeń dotyczących parametrów ryzyka rozkładów wartości pojedynczej szkody i liczby szkód dla postaci składek i wielkości ich błędów średniokwadratowych. W artykule zostały także zaprezentowane przykłady nume-ryczne ilustrujące zagadnienie kalkulacji składki w tym modelu.

Słowa kluczowe: składka zaufania, liczba szkód, wartość szkód.

1. Wstęp

Niniejszy artykuł dotyczy zagadnienia optymalnej liniowej predykcji łącznej warto-ści szkód w kolejnym okresie dla niejednorodnego portfela ubezpieczonych. Kla-syczny predyktor łącznej wartości szkód (przedstawiony np. w artykule Bühlmanna [1967]) oparty jest na informacji na temat łącznych wartości szkód danego ubezpie-czonego z wcześniejszych okresów. Można jednak dokonać predykcji łącznej warto-ści szkód także na podstawie liczby szkód lub na podstawie liczby i wartowarto-ści szkód jednocześnie. W niniejszym artykule zostaną zatem wyprowadzone trzy postacie predyktorów obliczone na podstawie liczby, wartości szkód oraz obu tych informa-cji. Podobną tematykę podjęli także m.in. Goulet i in. [2006], lecz pominęli oni w swojej pracy zagadnienie predykcji na podstawie liczby szkód. W artykule zostaną ponadto obliczone błędy średniokwadratowe trzech wymienionych predyktorów, dzięki czemu będzie można wskazać najlepszy pod tym względem sposób predykcji. Zostanie także rozważona postać predyktorów możliwa do uzyskania po przyjęciu pewnych upraszczających założeń dotyczących rozkładów wartości pojedynczej szkody i liczby szkód. Na zakończenie w celu zilustrowania uzyskanych wyników zostanie zaprezentowany prosty przykład numeryczny.

(6)

2. Założenia modelu, podstawowe oznaczenia

oraz parametry rozkładów

Mamy zbiór danych zawierający informacje o liczbie i wartości szkód poniesionych przez M ubezpieczonych podczas T okresów. Oznaczmy przez Nj,t liczbę szkód

j-tego ubezpieczonego w t-tym okresie, przez Yj,t,k wartość k-tej szkody j-tego ubezpie-czonego w t-tym okresie; ,

, 1 , ,

j t N j t k j t k

X =

= Y niech oznacza łączną wartość szkód, jakie poniósł j-ty ubezpieczony w t-tym okresie. Jak widać zatem, łączna wartość szkód j-tego ubezpieczonego w t-tym okresie zależy od dwóch składników, które najczęściej uznaje się za losowe, a mianowicie od liczby szkód i od wartości pojedynczej szkody.

Podstawowym założeniem stosowanym w teorii zaufania jest przyjęcie, że ist-nieją pewne nieobserwowalne parametry ryzyka opisujące rozkład liczby i wartości pojedynczej szkody j-tego ubezpieczonego. Ponieważ populacja ubezpieczonych jest niejednorodna, zakłada się, że owe parametry ryzyka są także realizacjami zmiennych losowych. Można zatem powiedzieć, że szkody z portfela ubezpieczo-nych powstają w dwóch etapach – w pierwszym etapie losuje się wartości parame-trów ryzyka dla ubezpieczonych; w drugim etapie ubezpieczony o ustalonych war-tościach parametrów ryzyka ponosi w kolejnych latach różne liczby szkód o różnych wartościach. Aby opisać to w bardziej sformalizowany sposób, przyjmijmy następu-jące oznaczenia i założenia:

A) Założenia dotyczące parametrów ryzyka:

A1) Rozkład łącznej wartości szkód j-tego ubezpieczonego zależy od dwóch parametrów ryzyka: λj i θj, j = 1, …, M, gdzie λj jest parametrem ryzyka rozkładu liczby szkód, a θj jest parametrem ryzyka rozkładu wartości pojedynczej szkody. Przyjmujemy, że λj jest realizacją zmiennej losowej Λj, natomiast θj jest realizacją zmiennej losowej Θj. Co istotne, zakładamy, że zmienne losowe Λj i Θjniezależ-ne, j = 1, …, M.

A2) Zmienne losowe Λ1, Λ2, …, ΛM dla M ubezpieczonych są wzajemnie nieza-leżne i mają ten sam rozkład.

A3) Zmienne losowe Θ1, Θ2, …, ΘM dla M ubezpieczonych są wzajemnie nieza-leżne i mają ten sam rozkład.

B) Założenia dotyczące warunkowych rozkładów liczby szkód, wartości poje-dynczej szkody oraz łącznej wartości szkód:

B1) Przy ustalonej wartości parametru ryzyka λj liczby szkód dla j-tego ubezpie-czonego w kolejnych okresach (N Nj,1, j,2,...,Nj T, ) są warunkowo niezależne i mają

ten sam rozkład.

B2) Przy ustalonej wartości parametru ryzyka θj wartości kolejnych szkód j-tego ubezpieczonego w kolejnych okresach (Yj,1,1,Yj,1,2,...,Yj N,1, j,1,Yj,2,1,...,Yj N,2, j,2,...,Yj T N, , j T,)

są warunkowo niezależne i mają ten sam rozkład.

B3) Przy ustalonej wartości λj i θj łączne wartości szkód j-tego ubezpieczonego w kolejnych okresach

(

Xj,1,Xj,2,...,Xj T,

)

są warunkowo niezależne i mają ten sam

(7)

B4) Ponadto warunkowo niezależne (przy danych λj i θj) są także liczba szkód i łączna wartość szkód dla j-tego ubezpieczonego dla różnych okresów (warunkowa niezależność

N

,jk i

X

,jl dla k = 1, …, T, l=1,...,T i k l≠ ) oraz wartość pojedynczej szkody i łączna wartość szkód dla j-tego ubezpieczonego dla różnych okresów (warun-kowa niezależność

Y

j k s, , i

X

,jl dla

s

=

1,...,

N

j k, , k = 1, …, T, l=1,...,T i k l≠ ).

Co istotne, ponieważ parametry ryzyka są losowane niezależnie dla wszystkich ubezpieczonych w populacji, można przyjąć, że łączna wartość szkód, liczba szkód i wartości pojedynczych szkód są niezależne dla różnych ubezpieczonych we wszyst-kich okresach.

Zanim przejdziemy do zagadnienia poszukiwania najlepszego predyktora łącz-nej wartości szkód w okresie T + 1, przyjmijmy pewne założenia dotyczące momen-tów rozkładów interesujących nas zmiennych losowych, które będą wykorzystywa-ne w dalszej analizie: C1) E N

(

j t, |Λ = Λ ,j

)

j C2)

(

)

2

( )

, | j t j N j Var N Λ =σ Λ , C3)

(

(

)

)

(

2

( )

)

2 , | j t j N j N E Var N Λ =E σ Λ =s , C4) E N

( ) ( )

,jt =E Λ = Λ ,j C5)

( )

2 j Var Λ =aΛ, D1) E Y

(

j t k, , |Θ = Θ ,j

)

j D2)

(

)

2

( )

, , | j t k j Y j Var Y Θ =σ Θ , D3)

(

(

)

)

(

2

( )

)

2 , , | j t k j Y j Y E Var Y Θ =E σ Θ = ,s D4) E Y

( ) ( )

j t k, , =E Θ = Θ ,j D5)

( )

2 j Var Θ =aΘ.

Powyżej przyjęte założenia i oznaczenia wystarczą do wyprowadzenia linio-wych predyktorów, co zostanie wykonane w dalszych częściach artykułu.

Najpierw jednak w lemacie 1 podane zostaną parametry warunkowych i bezwa-runkowych rozkładów łącznej wartości szkód, a także potrzebne przy dalszych roz-ważaniach wartości wariancji i kowariancji (wszystkie wartości będą liczone dla

j-tego ubezpieczonego).

Lemat 1.

Przy założeniach A)-D) zachodzą następujące równości:

(

j t, | j, j

)

j j E X Λ Θ = Λ Θ , (1)

( )

,jt E X = ΛΘ, (2)

(

)

2

( )

2

( )

2 , | , j t j j Y j j N j j Var X Λ Θ =

σ

Θ Λ +

σ

Λ Θ  , (3)

(8)

(

)

2 2

(

2 2

)

, | , j t j j Y N E Var X Λ Θ = Λ +s s aΘ+ Θ , (4)

(

)

(

)

2 2 2 2 2 2 , | , j t j j Var E X Λ Θ =a aΛ Θ+ Θ + ΛaΛ aΘ , (5)

( )

2 2

(

2 2

)

2 2 2 2 2 2 ,jt Y N Var X = Λ +s s aΘ+ Θ +a aΛ Θ+ Θ + ΛaΛ aΘ , (6)

(

)

(

)

2 2 2 2 2 2 , 1| , , , j T j j j k Cov E X + Λ Θ X =a aΛ Θ+ Θ + ΛaΛ aΘ , (7)

(

)

2 2

(

2 2

)

2 2 2 2 2 2 ,, , j t j k t k Y N Cov X X =I= s Λ +s aΘ+ Θ +a aΛ Θ+ Θ + ΛaΛ aΘ , (8)

(

)

(

)

2 2 2 2 2 2 , 1| , , j T j j j Cov E X + Λ Θ X =a aΛ Θ+ Θ + ΛaΛ aΘ , (9)

( )

1 2 2

(

2 2

)

2 2 2 2 2 2 j Y N Var X s s a a a a a T Θ  Λ Θ Λ Θ = Λ + + Θ + + Θ + Λ , (10)

(

)

(

)

2 , 1| , , , j T j j j k Cov E X + Λ Θ N = ΘaΛ, (11)

(

)

2 2 , , , j t j k t k N Cov N N =I s= +aΛ, (12)

(

)

2 2 , , , j t j k t k N Cov N X =I= Θ + Θs aΛ, (13)

(

)

(

)

2 , 1| , , j T j j j Cov E X + Λ Θ N = ΘaΛ, (14)

( )

1 2 2 j N Var N s a T Λ = + , (15)

(

,

)

1 2 2 j j N Cov X N s a T Λ = Θ + Θ , (16)

gdzie It k= przyjmuje wartość 1, gdy t k= , oraz 0, gdy t k≠ , , 1 1 T j j t t X X T = =

oraz , 1 1 T j j t t N N T = =

. Dowód:

Równość (1) wynika z własności rozkładu złożonego oraz założeń C1) i D1), natomiast równość (2) jest bezpośrednią konsekwencją wzoru (1) w połączeniu z założeniem A1) o niezależności Λj i Θj, założeniami C4, D4) i własnością iteracyjnej wartości oczekiwanej. Równość (3) ponownie wynika z własności rozkładu złożo-nego oraz z założeń C1)-C2) i D1)-D2); wzór (4) wynika bezpośrednio ze wzoru (3) oraz z założeń A1), C3)-C4), D3)-D5). Równość (5) można uzyskać w następujący sposób, korzystając z założeń A1), C4)-C5) oraz D4)-D5):

(

)

(

)

(

)

( )

2

( )

2 2 2

, | ,

j t j j j j j j

Var E X Λ Θ =Var Λ Θ =Var Λ + Λ   Var Θ + Θ − Λ Θ =

2 2 2 2 2 2 a aΛ Θ aΛ aΘ

(9)

Bezpośrednią konsekwencją wzorów (4) i (5) oraz własności bezwarunkowej wariancji jest równość (6). Aby uzyskać równość (7), należy skorzystać z własności bezwarunkowej kowariancji oraz z wzorów (1) i (5). Równość (8) otrzymujemy, korzystając z założenia B3) oraz wzorów (1), (4) i (5) oraz z własności bezwarunko-wej kowariancji:

(

j t,, j k,

)

t k

(

(

j k, | j, j

)

)

(

j j

)

Cov X X =I= E Var X Λ Θ +Var Λ Θ =

(

)

2 2 2 2 2 2 2 2 2 2

t k Y N

I= s s aΘ  a aΛ Θ aΛ aΘ

= Λ + + Θ + + Θ + Λ .

Równość (9) można uzyskać analogicznie jak równość (5), korzystając ponadto z własności warunkowej kowariancji i wzoru (1). Wzór (10) uzyskujemy analogicz-nie jak równość (6), korzystając z założenia z założenia B3) oraz wzorów (1) i (5):

( )

2

(

,

)

(

)

1

1 T | ,

j j t j j j j

t

Var X E Var X Var

T =   = Λ Θ + Λ Θ = 

(

)

2 2 2 2 2 2 2 2 2 2 1 Y N s s a a a a a T  Θ  Λ Θ Λ Θ = Λ + + Θ + + Θ + Λ .

Równości (11)-(13) są analogiczne do wzorów (7)-(8) i wynikają z własności kowariancji bezwarunkowej oraz założeń A1), B1), B4), C1)-C5), D1) i D4), nato-miast wzór (14) można uzyskać analogicznie jak wzór (9) i (11), z wykorzystaniem własności bezwarunkowej kowariancji oraz założeń C5) i D4). Wzór (15) to ponow-nie zastosowaponow-nie własności wariancji bezwarunkowej oraz założeń B1), C1)-C3) oraz C5). I wreszcie równość (16) uzyskujemy na podstawie własności kowariancji bezwarunkowej, założenia B4) oraz wzorów (13) i (14). Zestawienie własności ite-racyjnej wartości oczekiwanej oraz bezwarunkowej wariancji i kowariancji można znaleźć np. u Jasiulewicz [2005] w dodatku A.

Po obliczeniu parametrów warunkowych i bezwarunkowych rozkładów łącznej wartości szkód, a także wybranych wartości wariancji i kowariancji przejdziemy do obliczenia najlepszych liniowych predyktorów na podstawie liczby szkód, łącznej wartości szkód oraz obu tych zmiennych.

3. Najlepszy liniowy predyktor oparty na łącznej wartości szkód

Rozpocznijmy od zagadnienia liniowej predykcji łącznej wartości szkód w okresie

T + 1 na podstawie dotychczasowych łącznych wartości szkód. Ponieważ zakładamy,

że każdy z ubezpieczonych ponosi szkody w sposób niezależny od pozostałych, pre-dyktor dla j-tego ubezpieczonego będzie oparty tylko na obserwacjach dotyczących tegoż ubezpieczonego. Co więcej, można łatwo pokazać, że przy przyjętych założe-niach (chodzi tu zwłaszcza o założenie B3)) problem predykcji łącznej wartości szkód w okresie T + 1 sprowadza się do problemu predykcji E X

(

j T, 1+ |Λ Θj, j

)

,

(10)

czyli najlepszy liniowy predyktor będzie rozwiązaniem następującego problemu mi-nimalizacji:

(

)

(

j T, 1| j, j | j

)

BLP E X + Λ Θ X =

(

)

(

)

,0 , ,0 , 2 , 1 ,0 , , ,0 , ,.., 1 ,..,

arg min | , arg min ,.., ,

j j T j j T T j T j j j j t j t j j T b b E E X + b t= b X b b S b b  =  Λ Θ − − =     

gdzie Xj=

(

Xj,1,...,Xj T,

)

, a S ⋅

( )

to funkcja, której minimum szukamy.

Twierdzenie 1.

Przy założeniach A)-D) najlepszy liniowy predyktor łącznej wartości szkód w okresie T + 1 oparty na dotychczasowych łącznych wartościach szkód jest dany na-stępującym wzorem:

(

)

(

j T, 1| j, j | j

)

(

1 X

)

X j, BLP E X + Λ Θ X = −z ΛΘ +z X (17) gdzie:

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2

,

X Y N

Ta a

Ta

Ta

z

Ta a

Ta

Ta

s

s a

Λ Θ Λ Θ Λ Θ Λ Θ Θ

+

Θ +

Λ

=

+

Θ +

Λ + Λ +

+ Θ

(18)

(

)

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2

1

X Y N

.

Y N

s

s a

z

Ta a

Ta

Ta

s

s a

Θ Λ Θ Λ Θ Θ

Λ +

+ Θ

=

+

Θ +

Λ + Λ +

+ Θ

(19) Dowód:

Aby znaleźć rozwiązanie zadanego problemu minimalizacji, policzmy pierwsze pochodne z funkcji S b

(

j,0,..,bj T,

)

po interesujących nas parametrach bj,0,...,bj T, :

(

,0 ,

)

(

)

, 1 ,0 , , 1 ,0 ,.., 2 | , T , j j T j T j j j j t j t t j S b b E E X b b X b + = ∂ = − Λ Θ − −

(

,0 ,

)

(

)

, 1 ,0 , , , 1 , ,.., 2 | , T , j j T j T j j j j t j t j k t j k S b b E E X b b X X b + = ∂ = −   Λ Θ −       ∂

k = 1, …, T.

Po przyrównaniu powyższych pochodnych do 0 otrzymamy następujący układ równań:

(

, 1

)

,0 ,

( )

, 1 0, T j T j j t j t t E X + b b E X = − −

= ,

(

)

(

, 1 ,

)

,0

( )

, ,

(

, ,

)

1 | , T 0, j T j j j k j j k j t j t j k t E E X + X b E X b E X X = Λ Θ − −

= k = 1, …, T.

(11)

Jeśli pomnożymy pierwsze z równań przez E(Xj,k) i odejmiemy je od drugiego równania, powyższy układ równań będzie można zapisać następująco:

(

, 1

)

,0 ,

( )

, 1 0, T j T j j t j t t E X + b b E X = − −

=

(

)

(

, 1 ,

)

,

(

, ,

)

1 | , , T , , j T j j j k j t j t j k t Cov E X + X b Cov X X = Λ Θ =

k = 1, …, T.

Wykorzystując obliczenia z wzorów (2), (7) i (8), możemy powyższy układ za-pisać równoważnie: ,0 , 1 0, T j j t t b b = ΛΘ − − ΛΘ

=

(

)

(

(

)

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 , , 1 , T j t j k Y N t a aΛ Θ aΛ aΘ b a aΛ Θ aΛ aΘ b s s aΘ = + Θ + Λ =

+ Θ + Λ + Λ + + Θ k = 1, …, T.

Jak widać, dla każdego k mamy taką samą postać równania, co oznacza, że para-metry bj,1= =... bj T, . Wobec tego powyższy układ równań można zapisać w

następu-jącej postaci: ,0 , 0, j j k b Tb ΛΘ − − ΛΘ =

(

)

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 , , j k Y N a aΛ Θ+ Θ + Λ =aΛ aΘ b Ta aΛ Θ+TaΛΘ +TaΘΛ + Λ +s s aΘ+ Θ k = 1, …, T,

co prowadzi do następującego rozwiązania:

(

)

2 2 2 2 2 2 , 2 2 2 2 2 2 2 2 2 2 , j k Y N a a a a b Ta a Ta Ta s s a Λ Θ Λ Θ Λ Θ Λ Θ Θ + Θ + Λ = + Θ + Λ + Λ + + Θ k = 1, …, T oraz:

(

)

2 2 2 2 2 2 ,0 , 1 2 2 2 2 2 2 2 2 2 2 j j k Y N Ta a Ta Ta b Tb Ta a Ta Ta s s a Λ Θ Λ Θ Λ Θ Λ Θ Θ  + Θ + Λ    = ΛΘ − ΛΘ = ΛΘ − = + Θ + Λ + Λ + + Θ    

(

)

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 . Y N Y N s s a Ta a Ta Ta s s a Θ Λ Θ Λ Θ Θ Λ + + Θ = ΛΘ + Θ + Λ + Λ + + Θ  Z wzoru (17) wynika zatem, że najlepszy liniowy predyktor jest ważoną sumą bezwarunkowej wartości oczekiwanej łącznej wartości szkód (ΛΘ) oraz elementu przybliżającego wartość oczekiwaną łącznej wartości szkód j-tego ubezpieczonego (Xj). Taka postać predyktora to klasyczna postać predyktora liniowego, wyprowa-dzona np. przez Bühlmanna [1967], oczywiście z uwzględnieniem faktu, że rozkład

(12)

łącznej wartości szkód zależy od dwóch parametrów ryzyka. Na podstawie wzoru (18) warto także zauważyć, że gdy historia ubezpieczonego się wydłuża, waga przy-pisywana średniej wartości ponoszonych przez niego szkód (zX) zbiega do 1. A zatem w długim okresie składka zaufania będzie równa średniej wartości szkód danego ubezpieczonego.

W kolejnym twierdzeniu podany zostanie błąd średniokwadratowy predyktora.

Twierdzenie 2.

Błąd średniokwadratowy predyktora opartego na łącznej wartości szkód jest dany następującym równaniem:

(

)

(

)

(

)

(

)

2 2 2 2 2 2 , 1| , | 1 . j T j j j X MSE BLP E X + Λ Θ X = −z a aΛ Θ+ Θ + ΛaΛ aΘ  (20) Dowód:

Wyjdźmy od następującego sposobu zapisu błędu średniokwadratowego predyk-tora:

(

)

(

)

(

j T, 1| j, j | j

)

MSE BLP E X + Λ Θ X =

(

)

(

(

)

)

(

)

2 , 1| , , 1| , | j T j j j T j j j E E X + BLP E X +  = Λ Θ − Λ Θ =  X

(

)

(

)

2

(

(

) (

)

)

2 1 j j X X j j j X j Ez z XEz X  = Λ Θ − − ΛΘ − = Λ Θ − ΛΘ − − ΛΘ =    

(

)

2

(

)(

) (

2

)

2 2 j j X j j j X j Ez X z X  = Λ Θ − ΛΘ − Λ Θ − ΛΘ − ΛΘ + − ΛΘ =  

(

)

2

(

,

)

2

( )

. j j X j j j X j

Var z Cov X z Var X

= Λ Θ − Λ Θ +

Korzystając z wzorów (5), (9) i (10), równanie na błąd średniokwadratowy mo-żemy zapisać następująco:

(

)

(

)

(

)

(

)

, 1 2 2 2 2 2 2 2 2 2 2 2 2 | , | 2 j T j j j X MSE BLP E X a a a a z a a a a + Λ Θ Λ Θ Λ Θ Λ Θ Λ Θ = = + Θ + Λ − + Θ + Λ + X

(

)

2 1 2 2 2 2 2 2 2 2 2 2 . X Y N z s s a a a a a T Θ Λ Θ Λ Θ   + Λ + + Θ + + Θ + Λ   (21)

Na podstawie równania (18) można jednak zauważyć, że:

(

)

2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 . Y N X a a a a a a a a s s a z T Λ Θ Λ Θ Λ Θ Λ Θ Θ + Θ + Λ = + Θ + Λ + Λ + + Θ   (22)

Po wstawieniu informacji z równania (22) do wzoru (21) i uproszczeniu otrzy-mujemy tezę twierdzenia.

(13)

Na zakończenie tej części artykułu warto zauważyć, że dla wydłużającej się historii danego ubezpieczonego błąd średniokwadratowy predyktora będzie zbiegał do 0, ponieważ waga zX zbiega do 1.

4. Najlepszy liniowy predyktor oparty na liczbie szkód

Zajmijmy się teraz zagadnieniem poszukiwania najlepszego liniowego predyktora łącznej wartości szkód na podstawie informacji na temat liczby szkód ubezpieczone-go. W praktyce, jeśli dane dotyczące wartości szkód spływają z opóźnieniem, obli-czenie predyktora na podstawie liczby szkód może być wygodnym rozwiązaniem. Tak jak w poprzedniej części artykułu interesuje nas znalezienie najlepszego linio-wego predyktora łącznej wartości szkód w okresie T + 1; tak jak wcześniej dzięki założeniu, że każdy z ubezpieczonych ponosi szkody w sposób niezależny od pozo-stałych, do konstrukcji predyktora dla j-tego ubezpieczonego wystarczą obserwacje dotyczące liczby szkód tegoż ubezpieczonego; także tym razem przyjęte założenia (a szczególnie założenie B4)) sprowadzają problem liniowej predykcji łącznej war-tości szkód w okresie T + 1 do problemu liniowej predykcji warunkowej warwar-tości oczekiwanej E(Xj,T+1 | Λj, Θj), który można zapisać w następujący sposób:

(

)

(

)

(

)

,0 , , 1 2 , 1 ,0 , , ,..., 1 | , | arg min | , j j T j T j j j T j T j j j j t j t c c t BLP E X E E X c c N + + = Λ Θ =   =  Λ Θ − − =     

N

(

)

,0,..., , ,0 , arg min ,..., , j j T j j T c c S c c =

gdzie Nj = (Nj,1, ..., Nj,T), a S(·) to funkcja, której minimum szukamy.

Twierdzenie 3.

Przy założeniach A)-D) najlepszy liniowy predyktor łącznej wartości szkód w okresie T + 1 na podstawie dotychczasowej liczby szkód jest dany wzorem:

(

)

(

j T, 1| j, j | j

)

(

1 N

)

N j , BLP E X + Λ Θ N = −z ΛΘ +z N Θ (23) gdzie: 2 2 2 , N N Ta z TaΛ Λs = + (24) 2 2 2 1 N . N N s z TaΛ s − = + (25)

(14)

Dowód:

Aby znaleźć rozwiązanie postawionego problemu minimalizacji, policzmy pierwsze pochodne z funkcji S c

(

j,0,...,cj T,

)

po szukanych parametrach cj,0,...,cj T, :

(

,0 ,

)

(

)

, 1 ,0 , , 1 ,0 ,..., 2 | , T , j j T j T j j j j t j t t j S c c E E X c c N c + = ∂ = − Λ Θ − −

(

,0 ,

)

(

)

, 1 ,0 , , , 1 , ,..., 2 | , T , j j T j T j j j j t j t j k t j k S c c E E X c c N N c + = ∂ = − Λ Θ − −

k = 1, …, T.

Po przyrównaniu powyższych pochodnych do 0 otrzymujemy następujący układ równań:

(

, 1

)

,0 ,

( )

, 1 0, T j T j j t j t t E X + c c E N = − −

=

(

)

(

, 1 ,

)

,0

( )

, ,

(

, ,

)

1 | , T 0, j T j j j k j j k j t j t j k t E E X + N c E N c E N N = Λ Θ − −

= k = 1, …, T. Jeśli analogicznie jak w poprzedniej części artykułu pomnożymy pierwsze z równań przez E N

( )

,jk i odejmiemy je od drugiego równania, otrzymamy następu-jący układ równań:

(

, 1

)

,0 ,

( )

, 1 0, T j T j j t j t t E X + c c E N = − −

=

(

)

(

, 1 ,

)

,

(

, ,

)

1 | , , T , , j T j j j k j t j t j k t Cov E X + N c Cov N N = Λ Θ =

k = 1, …, T. Na podstawie przyjętych oznaczeń oraz wzorów (2), (11) i (12) możemy zapisać powyższy układ równań w następującej postaci:

,0 , 1 0, T j j t t c c = ΛΘ − − Λ

= 2 2 2 , , 1 , T j t j k N t aΛ aΛ c c s = Θ =

+ k = 1, …, T.

Tak jak poprzednio dla każdego k mamy taką samą postać równania, co oznacza, że cj,1= =... cj T, . Wobec tego powyższy układ równań można zapisać w

następują-cej postaci: ,0 , 0 j j k c Tc ΛΘ − − Λ =

(

)

2 2 2 , , j k N aΛ c TaΛ s Θ = + k = 1, …, T,

(15)

co da nam następujący wynik: 2 , 2 2 , j k N a c TaΛΛ s = Θ + k = 1, …, T, oraz: 2 2 ,0 1 2 2 2 N 2 . j N N s Ta c TaΛ Λs TaΛ s   = ΛΘ − = ΛΘ + +  

Warto porównać postać predyktora z wzoru (23) z predyktorem uzyskanym w poprzedniej części artykułu (wzór (17)). Uzyskany predyktor jest ponownie ważo-ną sumą dwóch składników: bezwarunkowej wartości oczekiwanej łącznej warto-ści szkód (ΛΘ) oraz elementu

N

jΘ, który podobnie jak Xj ma przybliżać wartość

oczekiwaną łącznej wartości szkód j-tego ubezpieczonego. Tak jak w przypadku predyktora opartego na łącznej wartości szkód w miarę wzrostu T waga przypisy-wana indywidualnej historii ubezpieczonego (zN) zbiega do 1, a zatem w długim okresie predyktor będzie równy średniej liczbie szkód danego ubezpieczonego pomnożonej przez populacyjną wartość oczekiwaną wartości pojedynczej szkody (

N

jΘ). Warto także zauważyć, że uzyskany predyktor jest równy predyktorowi

liczby szkód w okresie T + 1 (obliczonemu na podstawie dotychczasowych liczb szkód) pomnożonemu przez populacyjną wartość oczekiwaną wartości pojedynczej szkody Θ.

Kolejne twierdzenie podaje wielkość błędu średniokwadratowego predyktora opartego na liczbie szkód.

Twierdzenie 4.

Błąd średniokwadratowy predyktora opartego na liczbie szkód jest równy:

(

)

(

)

(

)

2 2

(

)

2 2 2 2 , 1| , | 1 . j T j j j N MSE BLP E X + Λ Θ N =a aΛ Θ+ −z aΛΘ + ΛaΘ (26) Dowód:

Zacznijmy od zapisania błędu średniokwadratowego w następującej postaci:

(

)

(

)

(

)

(

(

)

)

2 , 1| , | 1 j T j j j j j N N j MSE BLP E X + Λ Θ N =E Λ Θ − −z ΛΘ −z N Θ =

(

) (

)

(

)

2 j j N j Ez N  = Λ Θ − ΛΘ − Θ − ΛΘ =  

(

)

2

(

)(

) (

2

)

2 2 j j N j j j N j Ez N z N  = Λ Θ − ΛΘ − Θ Λ Θ − ΛΘ − Λ + Θ − ΛΘ =  

(

)

(

)

(

)

2

( )

2 , . j j N j j j N j

Var z Cov N z Var N

(16)

Wstawiając informacje z wzorów (5), (14) i (15), otrzymamy, że:

(

)

(

)

(

, 1

)

2 2 2 2 2 2 2 2 2 2 2 2 | , | 1 2 j T j j j N N N MSE BLP E X a a a a z a z s a T + Λ Θ Λ Θ Λ Λ Λ Θ =   = + Θ + Λ − Θ + Θ +   N .

Po wstawieniu do powyższego równania wzoru (24) zapisanego w następujący sposób: 2 2 1 2 N N a a s zΛ = Λ+T (27)

i uproszczeniu otrzymamy tezę twierdzenia.

 Warto zauważyć, że wraz z wydłużaniem się historii ubezpieczonego błąd śred-niokwadratowy predyktora rozpatrywanego w tej części artykułu nie będzie zbiegał do 0, lecz utrzyma się na stałym poziomie równym a a2 2 a2 2

Λ Θ+ ΛΘ . Przemawiałoby to

zatem na niekorzyść tego sposobu predykcji w porównaniu z predykcją na podsta-wie łącznej wartości szkód, z drugiej jednak strony historia ubezpieczonych rzadko jest na tyle długa, żeby waga zX znalazła się odpowiednio blisko 1, a błąd średnio-kwadratowy w równaniu (20) stał się faktycznie bliski 0. Dokładniejsze porównanie predyktorów pod kątem błędów średniokwadratowych zostanie przeprowadzone w szóstym i siódmym punkcie artykułu, po wyprowadzeniu predyktora opartego na liczbie i wartości szkód oraz jego błędu średniokwadratowego.

5. Najlepszy liniowy predyktor oparty na łącznej wartości

i liczbie szkód

Ostatnim wyprowadzonym w niniejszym artykule predyktorem łącznej wartości szkód w okresie T + 1 będzie predyktor oparty na liczbie i łącznej wartości szkód. Tak jak w poprzednich częściach, ponieważ zakładamy, że każdy z ubezpieczonych ponosi szkody w sposób niezależny od pozostałych ubezpieczonych z portfela, pre-dyktor dla j-tego ubezpieczonego będzie oparty tylko na obserwacjach dotyczących tegoż ubezpieczonego. Ponadto, tak jak wcześniej, przyjęte założenia sprowadzają problem predykcji łącznej wartości szkód w okresie T + 1 do problemu predykcji warunkowej wartości oczekiwanej łącznej wartości szkód E X

(

j T, 1+ |Λ Θj, j

)

.

Pro-blem predykcji można zatem zapisać następująco:

(

)

(

j T, 1| j, j | j, j

)

BLP E X + Λ Θ X N =

(

, 1

)

,0 , , , , 2 , 1 1 arg min | , j j T T j T j j j j t j t j t j t t t E E X + d d X e N = =   =  Λ Θ − − − =     

d e

(

)

, arg min , j jS j j = d e d e ,

(17)

gdzie dj =

(

dj,0,...,dj T,

)

, ej=

(

ej,1,...,ej T,

)

oraz S ⋅

( )

to funkcja, której minimum

szukamy.

Twierdzenie 5.

Przy założeniach A)-D) najlepszy liniowy predyktor łącznej wartości szkód w okresie T + 1 oparty na liczbie i łącznej wartości szkód jest dany wzorem:

(

)

(

)

(

, ,

)

, , , 1| , | , 1 X N X N X N X N j T j j j j X N X j N j BLP E X + Λ Θ X N = −zz ΛΘ +z X +z N Θ, (28) gdzie: 2 2 2 2 , 2 2 2 2 2 2 2 X N X Y N Ta a Ta z Ta a Ta s s a Λ Θ Θ Λ Θ Θ Θ + Λ = + Λ + Λ + , (29)

(

)(

)

2 2 2 2 2 , 2 2 2 2 2 2 2 2 2 X N Y N N N Y N Ta s Ta s z Ta s Ta a Ta s s a Λ Θ Λ Λ Θ Θ Θ Λ − Λ = + + Λ + Λ + , (30) 2 , , 2 2 1 X N X N 1 N X N N N s z z z TaΛ s − − = − = + , (31)

a zN zostało zdefiniowane w równaniu (24).

Dowód:

Aby znaleźć rozwiązanie postawionego powyżej problemu minimalizacji, po-liczmy pierwsze pochodne z funkcji S d e

(

j, j

)

po interesujących nas parametrach

j d i ej:

(

)

(

)

, 1 ,0 , , , , 1 1 ,0 , 2 | , T T , j j j T j j j j t j t j t j t t t j S E E X d d X e N d + = = ∂    = − Λ Θ − − −

d e

(

)

(

)

, 1 ,0 , , , , , 1 1 , , 2 | , T T , j j j T j j j j t j t j t j t j k t t j k S E E X d d X e N X d + = = ∂ = − Λ Θ − − −

d e k = 1, …, T,

(

)

(

)

, 1 ,0 , , , , , 1 1 , , 2 | , T T , j j j T j j j j t j t j t j t j l t t j l S E E X d d X e N N e + = = ∂ = − Λ Θ − − −

d e l = 1, …, T.

Po przyrównaniu powyższych pochodnych do 0 otrzymujemy następujący układ równań:

(

, 1

)

,0 ,

( )

, ,

( )

, 1 1 0, T T j T j j t j t j t j t t t E X + d d E X e E N = = − −

=

(18)

(

)

(

)

( )

(

)

(

)

, 1 , ,0 , , , , , , , 1 1 | , 0, j T j j j k T T j j k j t j t j k j t j t j k t t E E X X d E X d E X X e E N X + = = Λ Θ − − −

=

k

=

1,...,

T

,

(

)

(

)

( )

(

)

(

)

, 1 , ,0 , , , , , , , 1 1 | , 0, j T j j j l j j l T T j t j t j l j t j t j l t t E E X N d E N d E X N e E N N + = = Λ Θ − − −

= l = 1, …, T.

Jeśli pomnożymy pierwsze równanie przez E X

( )

,jk i odejmiemy je od drugiego równania oraz jeśli pomnożymy pierwsze równanie przez E N

( )

,jl i odejmiemy je

od równania trzeciego, otrzymamy następujący układ równań:

(

, 1

)

,0 ,

( )

, ,

( )

, 1 1 0 T T j T j j t j t j t j t t t E X + d d E X e E N = = − −

= ,

(

)

(

)

(

)

(

)

, 1 , , , , , , , 1 1

|

,

,

,

,

j T j j j k T T j t j t j k j t j t j k t t

Cov E X

X

d Cov X X

e Cov N X

+ = =

Λ Θ

=

=

+

, k = 1, …, T,

(

)

(

)

(

)

(

)

, 1 , , , , , , , 1 1

|

,

,

,

,

j T j j j l T T j t j t j l j t j t j l t t

Cov E X

N

d Cov X N

e Cov N N

+ = =

Λ Θ

=

=

+

, l = 1, …, T.

Po wstawieniu odpowiednich wartości z wzorów (2), (7), (8), (11)-(13) otrzy-mamy: ,0 , , 1 1 0, T T j j t j t t t d d e = = ΛΘ − − ΛΘ

− Λ

=

(

)

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 , , 1 T j t j k Y N t a aΛ Θ aΛ aΘ d a aΛ Θ aΛ aΘ d s s aΘ =   + Θ + Λ =

+ Θ + Λ + Λ + + Θ + 2 2 , , 1 , T j t j k N t e aΛ e s = +

Θ + Θ k = 1, …, T, 2 2 2 2 2 , , , , 1 1 , T T j t j l N j t j l N t t aΛ d aΛ d s e aΛ e s = = Θ =

Θ + Θ +

+ l = 1, …, T.

Jak widać, dla każdego k i dla każdego l mamy taką samą postać równania, co oznacza, że parametry dj,1= =... dj T, oraz ej,1= =... ej T, . Wobec tego powyższy

układ równań można zapisać w następującej postaci:

,0 , , 0,

j j k j k

d Td Te

(19)

(

)

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ,jk Y N a aΛ Θ+ Θ + Λ =aΛ aΘ d Ta aΛ Θ+TaΛΘ +TaΘΛ + Λ +s s aΘ+ Θ +

(

2 2

)

, , j k N e T aΛ s + Θ + Θ (33)

(

)

(

)

2 2 2 2 2 , , , j k N j k N aΛ d T aΛ s e TaΛ s Θ = Θ + Θ + + (34) k = 1, …, T.

Jeśli przekształcimy równanie (34) w następujący sposób:

(

2 2

)

2 2

(

2 2 2 2

)

, ,

j k N j k N

e T aΘ + ΘΛ s = Θ aΛ−d T aΘ Λ+ Θ s (35) i wstawimy do równania (33), otrzymamy następującą postać równania:

(

)

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ,jk Y N a aΛ Θ+ Θ + Λ =aΛ aΘ d Ta aΛ Θ+TaΛΘ +TaΘΛ + Λ +s s aΘ+ Θ +

(

)

2 2 2 2 2 2 , , j k N aΛ d T aΛ s +Θ − Θ + Θ ,

co prowadzi do następującego rozwiązania dla dj,k: 2 2 2 2 , 2 2 2 2 2 2 2 j k Y N

a a

a

d

Ta a

Λ Θ

Ta

Λ ΘΘ Θ

s

s a

Θ

+ Λ

=

+

Λ + Λ +

.

Po wstawieniu powyżej obliczonej wartości dj,k do równania (34) i przekształce-niu otrzymamy rozwiązanie:

(

)(

)

2 2 2 2 2 , 2 2 2 2Y 2 N2 2 2 2 j k N Y N

a s

a s

e

Ta

s

Ta a

Ta

s

s a

Λ Θ Λ Λ Θ Θ Θ

Λ −

Λ

=

Θ

+

+

Λ + Λ +

.

Po wstawieniu powyższych rozwiązań dla dj,k i ej,k do równania (32) otrzymamy rozwiązanie dla stałej dj,0:

2 , ,0 1 , 2 2 j k N j j k N e s d Td T TaΛ s   = ΛΘ −= ΛΘ Θ +   .  Z wzoru (28) wynika, że najlepszy liniowy predyktor jest ważoną sumą bezwa-runkowej wartości oczekiwanej łącznej wartości szkód (ΛΘ), średniej wartości szkód oraz średniej liczby szkód pomnożonej przez populacyjną wartość oczekiwa-ną wartości pojedynczej szkody. Nietrudno dostrzec, że waga X N,

N

z może przyjmo-wać wartości ujemne, a dokładniej dzieje się tak, gdy:

2 2 2 2 N Y a sΘ Λ ≥a sΛ lub równoważnie:

(

)

(

)

(

(

(

(

, ,

)

)

)

)

(

(

(

(

,

)

)

)

)

, , , , | | | . | | j t k j j t j j t j j t k j j t j Var E Y Var E N E E N E Var Y E Var N Θ Λ Λ ≥ Θ Λ

(20)

Co więcej, dla rosnącej liczby okresów T waga X N,

N

z zbiega do 0, podczas gdy waga przy średniej wartości szkód X N,

X

z zbiega do 1. Warto jeszcze zauważyć, że z równania (34) wynika, że:

, ,

X N X N

N N X

z =zz , (36)

co z kolei prowadzi do wniosku, że predyktor oparty na liczbie i wartości szkód można zapisać w następującej postaci:

(

)

(

)

(

)

,

(

)

, 1| , | , 1 X N j T j j j j N N j X j j BLP E X + Λ Θ X N = −z ΛΘ +z N Θ +z XN Θ =

(

)

(

)

,

(

)

, 1| , | X N . j T j j j X j j BLP E X + z X N = Λ Θ N + − Θ (37)

Jak zatem widać, predyktor oparty na liczbie i łącznej wartości szkód to predyk-tor oparty na liczbie szkód skorygowany o ważoną różnicę między dwoma sposoba-mi przybliżania wartości oczekiwanej łącznej wartości szkód j-tego ubezpieczone-go, czyli o element X N,

(

)

X j j

z XN Θ .

Podajmy jeszcze wzór na błąd średniokwadratowy predyktora dwuczynniko-wego:

Twierdzenie 6.

Błąd średniokwadratowy predyktora opartego na liczbie i łącznej wartości szkód wynosi:

(

)

(

)

(

j T, 1| j, j | j, j

)

MSE BLP E X + Λ Θ X N =

(

1 X N,

)(

2 2 2 2

)

(

1

)

2 2 X N z a aΛ Θ aΘ z aΛ = − + Λ + − Θ = (38)

(

1 X N,

)(

2 2 2 2 2 2

)

X N, 2 2. X N z a aΛ Θ aΛ aΘ z aΛ = − + Θ + Λ − Θ (39) Dowód:

Obliczenie błędu średniokwadratowego w przypadku predyktora opartego na liczbie i wartości szkód będzie nieco bardziej żmudne niż w przypadku pozostałych predyktorów:

(

)

(

)

(

j T, 1| j, j | j, j

)

MSE BLP E X + Λ Θ X N =

(

)

(

, , , ,

)

2 1 X N X N X N X N j j X N X j N j Ez z z X z N  = Λ Θ − − − ΛΘ − − Θ =  

(

)

(

)

(

)

(

X N, X N,

)

2 j j X j N j Ez X z N  = Λ Θ − ΛΘ − − ΛΘ − Θ − ΛΘ =  

(

)

2 ,

(

)(

)

2 X N j j X j j j Ez X =  Λ Θ − ΛΘ − Λ Θ − ΛΘ − ΛΘ −

(21)

(

)(

)

( )

2

(

)

2 , , 2 X N X N N j j j X j z N z X − Λ Θ − ΛΘ Θ − ΛΘ + − ΛΘ +

(

)(

)

( )

2

(

)

2 , , , 2 X N X N X N X N j j N j z z X N z N  + − ΛΘ Θ − ΛΘ + Θ − ΛΘ =

(

)

,

(

)

,

(

)

( )

, 2

( )

2 X N , 2 X N , X N j j X j j j N j j j X j

Var z Cov X z Cov N z Var X

= Λ Θ − Λ Θ − Θ Λ Θ + +

(

)

(

)

2

( )

, , , 2 X N X N , X N . X N j j N j z z Cov X N z Var N + Θ + Θ .

Po wstawieniu wartości podanych we wzorach (5), (9), (10), (14)-(16) otrzyma-my, że błąd średniokwadratowy predyktora wynosi:

(

)

(

)

(

j T, 1| j, j | j, j

)

MSE BLP E X + Λ Θ X N =

(

)

2 2 2 2 2 2 2 X N, 2 2 2 2 2 2 2 X N, 2 2 X N a aΛ Θ aΛ aΘ z a aΛ Θ aΛ aΘ z aΛ = + Θ + Λ − + Θ + Λ − Θ +

( )

X N, 2 1 2 2

(

2 2

)

2 2 2 2 2 2 X Y N z s s a a a a a T Θ Λ Θ Λ Θ   + Λ + + Θ + + Θ + Λ +  

(

)

2 , , 2 1 2 2 , 1 2 2 2 X N X N X N . X N N N N z z s a z s a T Λ T Λ     + Θ + + Θ +     (40)

Dla uproszczenia obliczeń możemy do równania (40) wstawić informację z rów-nania (36) – po przekształceniu otrzymamy wtedy następującą postać rówrów-nania:

(

)

(

)

(

j T, 1| j, j | j, j

)

MSE BLP E X + Λ Θ X N =

(

)

2 2 2 2 2 2 2 X N, 2 2 2 2 2 2 2 X N a aΛ Θ aΛ aΘ z a aΛ Θ aΘ z aΛ = + Θ + Λ − + Λ − Θ +

( )

, 2 1 2 2 2 2 2 2 2 2 2 1 2 2 . X N X Y N N N z s s a a a a z s a T Θ Λ Θ Θ T Λ     + Λ + + + Λ + Θ +    

Po wstawieniu do powyższego równania wzoru (29) zapisanego w następującej postaci: 2 2 2 2 2 2 2 2 2 2 2 , 1 Y N X N X a a a a a a s s a z T Λ Θ Θ Λ Θ Θ Θ + Λ = + Λ + Λ + (41)

oraz po skorzystaniu z informacji zawartych w równaniu (27) i uproszczeniu otrzy-mamy tezę twierdzenia wyrażoną za pomocą wzoru (38). Aby uzyskać postać wzoru z równania (39), trzeba dodatkowo skorzystać z równości (36).

 Na zakończenie tej części artykułu warto zauważyć, że z równania (38) wynika, iż błąd średniokwadratowy predyktora dwuczynnikowego będzie zbiegał do 0, po-nieważ wagi X N,

X

(22)

6. Porównanie błędów średniokwadratowych predyktorów

Dokonajmy teraz porównania błędów średniokwadratowych obliczonych predykto-rów, aby wiedzieć, który z predyktorów jest najbardziej precyzyjny.

Twierdzenie 7.

Dla uzyskanych w twierdzeniach 1, 3 i 5 predyktorów zachodzą następujące nierówności:

(

)

(

)

(

)

(

)

(

)

(

)

, 1 , 1 | , | | , | , , j T j j j j T j j j j MSE BLP E X MSE BLP E X + + Λ Θ ≥ ≥ Λ Θ N X N , (42)

(

)

(

)

(

)

(

)

(

)

(

)

, 1 , 1 | , | | , | , . j T j j j j T j j j j MSE BLP E X MSE BLP E X + + Λ Θ ≥ ≥ Λ Θ X X N . (43) Ponadto jeśli spełniona jest nierówność:

(

)

(

)

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2

,

N Y N

a a

a

a a

a

a

Ta

s

a

a s

a s

Λ Θ Θ Λ Θ Θ Λ Λ Λ Λ Θ

+ Λ

+ Λ + Θ

+

≥ Θ Λ

Λ

(44) to zachodzi:

(

)

(

)

(

)

(

)

(

)

(

)

, 1 , 1 | , | | , | . j T j j j j T j j j MSE BLP E X MSE BLP E X + + Λ Θ ≥ ≥ Λ Θ N X (45) Dowód:

Nierówność (42) wynika z bezpośredniego porównania błędu średniokwadrato-wego predyktora opartego na liczbie szkód i predyktora opartego na liczbie i łącznej wartości szkód (równania (26) i (38)):

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 X N, 2 2 2 2 2 2.

N X N

a aΛ Θ+ Θ + Λ −aΛ aΘ z aΛΘ ≥a aΛ Θ+ Θ + Λ −aΛ aΘ z a aΛ Θ+ Λ −aΘ z aΛΘ

Nieco trudniej pokazać zachodzenie nierówności (43), którą zgodnie z równa-niami (20) i (39) można zapisać w następującej postaci:

(

)

2 2 2 2 2 2 2 2 2 2 2 2 X a aΛ Θ+ Θ + Λ −aΛ aΘ z a aΛ Θ+ Θ + Λ ≥aΛ aΘ

(

)

2 2 2 2 2 2 X N, 2 2 2 2 2 2 X N, 2 2 X N a aΛ Θ aΛ aΘ z a aΛ Θ aΛ aΘ z aΛ ≥ + Θ + Λ − + Θ + Λ − Θ ≥ ≥ ≥

(23)

lub równoważnie:

(

)

(

)

, 2 2 2 2 2 2 , 2 2 2 2 2 2 2 2 . X N X N X N X z a aΛ Θ+ Θ + Λ +aΛ aΘ z aΛΘ ≥z a aΛ Θ+ Θ + ΛaΛ aΘ . (46) Na początku warto zauważyć, że po odpowiednim przekształceniu równania (33) z wykorzystaniem definicji odpowiednich wag oraz informacji z równań (22), (27) i (36) wagę X N,

X

z można zapisać jako następującą funkcję wagi zX:

(

) (

)

2 , 2 2 2 2 2 2 2 2 2 2 2 2 , 2 . X N X N X X N X N a z a a a a z a a a a z z zΛ Λ Θ+ Θ + Λ =Λ Θ Λ Θ+ Θ + Λ −Λ Θ Θ

Wykorzystując powyższy zapis, nierówność (46) można sprowadzić do następu-jącej postaci:

(

2 2 2 2 2 2

)

X N, 2 2 X N, 2 2

(

2 2 2 2 2 2

)

, X N X N X N a z a a a a z z z a z a a a a zΛ Λ Θ+ Θ + Λ −Λ Θ Θ + ΛΘ ≥ Λ Θ+ Θ + ΛΛ Θ

co z kolei upraszcza się do:

(

)

, 0.

X N

N N X

z zz

Należy teraz sprawdzić, kiedy powyższa nierówność zachodzi. Z wcześniej-szych rozważań wiemy już, że X N, 0

N

z ≥ , jeśli zachodzi:

2 2 2 2 .

Y N

a sΛ ≥a sΘ Λ (47)

Zastanówmy się jeszcze, kiedy zNzX ≥0. Wstawiając definicję wag z równań

(18) i (24), otrzymamy, że musi zachodzić:

(

)

(

)

(

)(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Y N N Ta Ta a Ta Ta s s a Ta s Ta a Ta Ta Λ Λ Θ Λ Θ Θ Λ Λ Θ Λ Θ + Θ + Λ + Λ + + Θ ≥ ≥ + + Θ + Λ

co upraszcza się ponownie do:

2 2 2 2 .

Y N

a sΛ ≥a sΘ Λ

To kończy dowód drugiej części twierdzenia.

Postać warunku (44) dotyczącego nierówności (45) wynika z porównania błę-dów średniokwadratowych predyktora opartego na liczbie szkód oraz predyktora opartego na łącznej wartości szkód podanych w równaniach (20) i (26):

(

)

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ,

N X

a aΛ Θ+ Θ + Λ −aΛ aΘ z aΛΘ ≥a aΛ Θ+ Θ + Λ −aΛ aΘ z a aΛ Θ + Θ + ΛaΛ aΘ

co można zapisać równoważnie w następującej postaci:

(

2 2 2 2 2 2

)

2 2.

X N

z a aΛ Θ+ Θ + Λ ≥aΛ aΘ z aΛΘ (48)

Gdy wykorzystamy naszą wiedzę o postaci wag zX i zN z równań (18) i (24), nie-równość (48) możemy zapisać następująco:

(24)

(

2 2 2 2 2 2

)

2 2 1 2 N a a a a a s T Λ Θ+ Θ + ΛΛ Θ  Λ+ ≥  

( )

2 2 2 2 2 2 2 2 1 2 2

(

2 2

)

, Y N a a a a a s s a T Λ  Λ Θ Λ Θ  Θ  ≥ Θ + Θ + Λ + Λ + + Θ   (49)

co po skróceniu pewnych elementów i uporządkowaniu daje nierówność (44).  Na podstawie twierdzenia 7 możemy zatem stwierdzić, że predyktor dwu- czynnikowy jest zawsze nie gorszy niż predyktor oparty na łącznej wartości szkód. Predyktor dwuczynnikowy jest także nie gorszy niż predyktor oparty na liczbie szkód, a różnica w błędach średniokwadratowych tych dwóch predyktorów wraz ze wzrostem liczby okresów T będzie rosła, aż ustabilizuje się na poziomie

2 2 2 2 a aΛ Θ+ ΛaΘ .

W przypadku predyktorów jednoczynnikowych nie można wskazać jednoznacz-nie lepszego predyktora. Warto jednak spróbować zapisać warunek (44) w jednoznacz-nieco in-nej postaci, która pozwoliłaby w bardziej intuicyjny sposób odpowiedzieć na pyta-nie, w jakich sytuacjach lepiej posługiwać się predyktorem opartym na łącznej wartości szkód. Na wstępie zauważmy, że korzystając z równań (9), (10), (14) i (15), warunek (49) można zapisać w następującej postaci:

(

)

(

)

(

)

( )

(

(

(

( )

)

)

)

2 2 , 1| , , , 1| , , . j T j j j j T j j j j j Cov E X X Cov E X N Var X Var N + Λ Θ + Λ Θ ≥

Jeśli podzielimy obie strony nierówności przez dodatnią Var E X

(

(

j T, 1+ |Λ Θj, j

)

)

i spierwiastkujemy, otrzymamy:

(

)

(

)

(

)

(

)

( )

(

)

(

)

(

)

(

)

( )

, 1 , 1 , 1 , 1 | , , | , , , | , | , j T j j j j T j j j j T j j j j T j j j Cov E X X Cov E X N

Var E X Var X Var E X Var N

+ +

+ +

Λ Θ Λ Θ

Λ Θ Λ Θ

co oznacza, że jeśli korelacja wartości, której predykcji dokonujemy, ze średnią war-tością łącznej wartości szkód jest większa niż korelacja między warwar-tością, której predykcji dokonujemy, a średnią wartością liczby szkód, powinniśmy zastosować predyktor oparty na łącznej wartości szkód. Nietrudno także zauważyć, że warunek (44) będzie spełniony, gdy:

2 2 2 2 , N Y s a s aΛΘ Λ ≥ (50)

ponieważ lewa strona nierówności (44) jest zawsze większa od 0. Warunek (50) pojawił się już wcześniej w odwrotnej postaci jako warunek (47) – zachodzenie wa-runku w postaci z równania (50) oznacza, że waga X N, 0

N

Cytaty

Powiązane dokumenty

4) w przypadku wyczerpania możliwości rozwiązania sporu na terenie przedszkola każda ze stron ma prawo odwołać się do organu prowadzącego lub sprawującego nadzór

ƒ Pozwala to skrócić czas likwidacji szkody oraz ograniczyć konieczność osobistej obecności poszkodowanych w placówkach ubezpieczyciela... Likwidacja szkód –

Najlepszym z prognostycznego punktu widzenia modelem liczby szkód z działu II ubezpieczeń okazał się II+ zawierający trend oraz opóźnienia zmiennej objaśnianej i

Informacje o znaczących zdarzeniach, jakie nastąpiły po dniu bilansowym, a nieuwzględnionych w sprawozdaniu finansowym. 1) Dnia 6 stycznia 2008 roku Sąd Rejonowy

• Nieobecność może zostać odpracowana poprzez przygotowanie i szczegółowe rozliczenie (na konsultacjach) pracy z opuszczonych ćwiczeń, ale wyłącznie pod następującymi

W artykule zawarto analizę zagadnień związanych z występowaniem szkód górniczych w aspekcie Celów Zrów- noważonego Rozwoju (Sustainable Development Goals – SDGs) przyjętych

W art. 30 § 1 ksh można odnaleźć podstawę prawną dla wprowadzenia re- prezentacji łącznej na grunt spółek osobowych, w których modelem ustawowym jest samodzielna

Dlatego w przypadku analizy liczby szkód w zakładzie ubezpieczeń zasadniejsze wydaje się stoso- wanie zmodyfikowanej regresji Poissona, gdzie uwzględnia się dużą liczbę