RODZINA MODELI LEE-CARTERA

(1)

Uniwersytet Ekonomiczny w Katowicach

RODZINA MODELI LEE-CARTERA

Wprowadzenie

Publikacja modelu umieralności Lee-Cartera w 1992 r. zapoczątkowała po- nowne zainteresowanie prognozowaniem umieralności. Od tamtego czasu opra- cowano kilka innych metod, jednakże metodologia zaproponowana przez Lee oraz Cartera jest nadal jedną z najlepiej dostępnych i powszechnie stosowanych.

Autorzy publikacji z 1992 r. zaproponowali model opisujący zmiany w umieral- ności z uwzględnieniem zmieniającego się czasu. W metodzie tej logarytm współczynnika zgonów jest równy sumie dwóch składników, z których jeden nie zależy od czasu, a drugi jest iloczynem parametru pokazującego ogólny poziom umieralności oraz parametru, który wskazuje, jak szybko lub wolno zmienia się umieralność w danym wieku w zależności od zmian ogólnej umieralności w czasie. Parametry tego modelu są estymowane na podstawie danych historycznych.

Modyfikację do tego modelu zaproponowali m.in.: Lee i Miller [2001], Bo- oth, Maindonald i Smith [2002], Hyndman i Ullah [2005] oraz De Jong [2006].

Celem artykułu jest przedstawienie wybranych modyfikacji klasycznego modelu Lee-Cartera oraz zastosowanie ich do szacowania współczynnika zgo- nów w Polsce. Na podstawie danych o współczynnikach zgonów dla jednorocz- nych grup wiekowych kobiet i mężczyzn w latach 1990-2005 dla Polski zostaną oszacowane parametry modelu umieralności Lee-Cartera oraz wybranych modyfikacji tego modelu. Następnie zostanie oceniona dobroć dopasowania modeli, a tym samym zostanie zweryfikowana możliwość użycia tych modeli do prognozowania umieralności w Polsce.

1. Metodologia badawcza

W latach 90. Lee i Carter podjęli próbę zastosowania teorii procesu błądze- nia przypadkowego z dryfem do modelowania oraz prognozowania współczyn- ników zgonów m_x,_t w grupach wieku x i dla kolejnych lat kalendarzowych t.

Model ten ma postać [Rossa, 2009]:

(2)

Anna Ojrzyńska 100

ln m_x,t = a_x + b_xk_t + εx,t, (1) gdzie:

ax − średni poziom logarytmu współczynnika zgonów w poszczególnych grupach wieku, uśredniony względem czasu kalendarzowego,

b_x − wskazują, jak szybko logarytmy cząstkowych współczynników zgonów, tj.

lnm_x,_t, zmieniają w odpowiednich grupach wieku x,

kt − opisuje ogólną tendencję zmian umieralności w ciągu badanego okresu, traktowany jest efekt wpływu czasu kalendarzowego t na zmianę w pozio- mie cząstkowych współczynników zgonów,

εx,t − niezależne składniki losowe, o rozkładach normalnych o wartości oczekiwanej równej 0 i stałej wariancji σ².

Dla zapewnienia jednoznaczności rozwiązania Lee i Carter przyjęli dodat- kowe warunki ograniczające [Papież, 2008], tj. że suma parametrów bx dla wszystkich grup wieku jest równa 1, natomiast suma parametrów kt jest równa 0.

W propozycji Lee-Cartera szereg czasowy k_t jest traktowany jako wycinek procesu stochastycznego błądzenia przypadkowego z dryfem, opisanym formułą [Rossa, 2009]:

k_t = c + k_t−1 + e_t, (2) gdzie:

c − reprezentuje pewną stałą (dryf),

et − składnik losowy o rozkładzie normalnym z wartością oczekiwaną równą 0 i pewną skończona wariancją.

Model zaproponowany przez Lee i Millera jest modyfikacją modelu Lee- -Cartera i różni się od jego pierwotnej postaci pod trzema względami [Lee, Miller, 2001]:

1. Zakres czasowy danych, na podstawie których szacowano parametry modelu uległ skróceniu – były to lata 1950-1989.

2. Dokonano korekty parametru kt, polegającej na dopasowaniu oszacowań tego parametru do oczekiwanej długości życia noworodka w roku t (e₀ jest jednym z parametrów tablic trwania życia).

3. Do wyznaczenia prognoz wartości współczynników zgonu jako wartości teoretycznych dla ostatniego okresu szacowania przyjmuje się wartości rzeczy- wiste (empiryczne).

W ocenie autorów tej modyfikacji głównym źródłem wysokich błędów prognoz, wyznaczonych przez Lee i Cartera było duże niedopasowanie pomię- dzy wartościami teoretycznymi dla ostatniego okresu szacowania modelu (tj. dla

(3)

1989 r.) z wartościami rzeczywistymi (empirycznymi) w tym roku. W modelu Lee-Milera rozwiązaniem tego problemu jest zastosowanie dodatkowego wa- runku, iż parametr k_t przyjmuje wartość 0 w ostatnim roku szacowania modelu.

Analizując współczynniki zgonów w latach 1900-1995, autorzy zauważyli również, że wzorzec umieralności nie jest stały w czasie. W związku z tym szacowania modelu umieralności dokonano na podstawie danych z lat 1950-1989.

Model zaproponowany przez Booth-Maindonalda-Smitha również różni się od klasycznego modelu Lee-Cartera w trzech kwestiach [Booth, Maindoinald, Smith, 2002]:

1. Okres, na podstawie którego są szacowane parametry modelu jest dobierany na podstawie statystycznych kryteriów dobroci dopasowania, przy założeniu liniowości parametru kt.

2. Korekty parametru kt dokonuje się na podstawie rozkładu liczby zgonów wg wieku w poszczególnych latach, z wykorzystaniem własności rozkładu Pois- sona.

3. Nie dokonuje się żadnych zmian w wartościach teoretycznych dla ostatniego okresu szacowania.

Metoda Hyndmana i Ullaha wykorzystuje natomiast analizę funkcjonalną do modelowania logarytmów współczynników zgonów. Jest ona rozszerzeniem modelu Lee-Cartera w następujących kwestiach [Booth, Hyndman, Tickle, de Jong, 2006]:

1. Zakłada się że umieralność to gładka funkcja wieku, która jest obserwowana z błędami; gładkie współczynniki zgonów są szacowane za pomocą niepara- metrycznych metod wygładzania.

2. Wykorzystuje więcej niż jeden zestaw składników (kt, bx).

3. Do prognozowania parametrów modelu są wykorzystywane bardziej ogólne metody szeregów czasowych niż błądzenie losowe z dryfem. Do wykładni- czego wygładzania zastosowano modele przestrzeni stanów.

4. Zastosowanie odpornych metod estymacji pozwoli na dokładniejsze oszacowania współczynników zgonu dla nietypowych lat m.in. w okresach konflik- tów zbrojnych, epidemii.

5. Brak korekty parametru kt.

Podejście Hyndmana i Ullaha może być wyrażone za pomocą równania o postaci:

^t ^x^t

J

j t j j t

t

x a x k b x e x x

m _,

1 ,

, ( ) ( ) ( ) ( )

ln

∑ σ ε

=

+ +

+

= , (3)

(4)

gdzie:

a(x) − średni wzorzec umieralności w wieku x, b_j(x) − jest podstawową funkcją,

kt − parametr szeregu czasowego,

σt(x)εx,t − błąd obserwacji, wynikający z różnicy między obserwowanymi wskaźnikami a krzywymi sklejanymi,

e_t(x) − błąd szacowania, wynikający z różnicy między krzywymi sklejanymi i ich oszacowanymi odpowiednikami.

Ostatnią z przedstawionych w tym referacie modyfikacji modelu Lee- -Cartera jest podejście De Jonga i Tickle’a, które wykorzystuje metodologię przestrzeni stanów do modelowania logarytmów współczynników zgonu. Mode- le przestrzeni stanów obejmują szeroki zakres elastycznych wielowymiarowych modeli szeregów czasowych, których model Lee-Cartera jest szczególnym przy- padkiem. Ogólna metodologia dopuszcza mnóstwo specjalizacji i uogólnień oraz zawiera ocenę oszacowania nieznanych parametrów, wnioskowanie i prognozo- wanie łącznie z obliczeniem błędów prognoz. Model Lee-Cartera może być za- pisany w postaci równania:

y_t = a + bk_t + ε_t, (4) gdzie:

y_t − wektor logarytmów współczynników zgonu w każdym wieku w roku t, a i b − wektory odpowiednich parametrów modelu Lee-Cartera dla każdego wieku, kt − jest wskaźnikiem poziomu umieralności w roku t, tak jak w modelu Lee-Cartera, ε_t − wektor błędów w każdym wieku w roku t.

W 2006 r. De Jong i Tickle opracowali bardziej ogólną specyfikację [Booth, Hyndman, Tickle, de Jong, 2006]:

yt = Xa + Xbkt + εt, (5) gdzie:

X jest macierzą o liczbie wierszy większej niż liczba kolumn.

Gdy X = I, wówczas model redukuje się do postaci równania (4). Równanie (5) rozwiązuje problem modelu LC zapisanego równaniem (4), gdzie istnieje pa- rametr a i b dla każdego wieku. W modelu (5) macierz X ma mniej kolumn niż wierszy, co oznacza, że wektorów parametrów a i b jest mniej niż istniejących grup wiekowych. Efekty szeregu czasowego kt nie są niezależne we wszystkich grupach wiekowych, ale są ograniczone przez strukturę macierzy X, nakładając gładkość w każdej grupie wiekowej.

(5)

r w o

2

w w b n

M p d c t w m

R

w m

1

2

rych węz obli

2. A

wsp w l biet nato

MA poz dyfi czy tośc wzg męż

Rys.

w p męż

1 M

2 M W h o złam

iczo

Ana

B półc

atac t, ja omi D APE zwo fikac

wy ci w ględ żczy

1. Ś

Pr przy żczy

MAP MPE

W ob obow mi w one

aliz

ada czyn

ch ak i iast o o E¹ o olą p

cji yzn wsp dny yzn

Średn

rogn ypad yzn

= PE E=

becn wią w ró e prz

za

anie nni 199 dla t do

oce oraz por mo nacz półc ych n i k

nie b

noz dku n po

=m 1

∑

^m

m τ

1 nej ązuj óżn zy u

em

e um ków 90-2 a m o wy eny

z śr ówn odel

zone czyn błę kob

bezw

zy u pr

oniż

∑

^m

m τ

∑

^m ^y

τ τ

ana je f nych

uży

mpi

mie w n 201 mężc yzn

pr redn

nać lu L e pr nnik ędów

iet.

wzgl

um rogn żej

y_τP

−

P

y_τ

τ

aliz form h gr yciu

ryc

eraln natę

10.

czy nacz ogn ni b ć do Lee- rog ków w p

ędne

mier noz 20

− y

y

τ

y_τ zie m ma

rup u fil

czn

noś ężen Est yzn

zeni noz błąd okła -Ca gnoz w zg proc

e błę

raln wy 0 ro

y_τ mac

kw ach ltrow

na

ści nia tym na ia p w d pr adn arte zy p gon cent

ędy p

nośc yzn oku

cier wadr h wi wan

prz zgo macj pod prog wyko roc ność ra.

prz nu.

tow

proc

ci m acz

ży

rz X rato ieku nia

zepr onó ję p dsta gno orzy

ent ć pr Wa esz

Ry wych

cento

męż zony ycia

X je

owa u. O

Ka

row w o para awi

z or ysta owy rogn arto zaco ysun h p

owe

żcz ych a ni

est o a lo Osz alma

wadz oraz ame e la raz ano

y M noz ości owu nki prog

prog

yzn h dla

e p opa oga zaco

ana

zon z st etró at 1

we o śr MPE z otr

błę ują

1 i gnoz

gnoz

n c a ko prze

arta arytm

owa a i w

no n tanu ów

990 eryf redn

E². rzym ędó

lub i 3 z d

z wsp

cech obie ekra

na mu ania wyg

na p u lu

prz 0-2 fika ni b

Ob my ów M b nie

pre la j

półc

huje et. B acza

krz ws a m gład

pod udno zepr

005 acji bez blic ywan

MP edo ezen

edn

czyn

e w Błę ają

zyw spó mode

dzan

dsta ośc row 5. O mo zwz czon

nyc PE p osza ntuj noro

nnika

więk ędy

14 wych

ółcz elu nia.

awie ci w wadz

Okre odel zglę

ne w ch z poz acow

ją w ocz

a zgo

ksz dla 4%.

h B zynn

me

e d wedł zon es 2 lu.

ędny war z w zwo wuj war znyc

onu w

za a pr

W B-sk

nika etod

dany ług no z 200

y b rtoś wyko

lą n ją r rtoś ch g

wed

dok rogn W sta

kleja a z dą n

ych wi zaró 06-2

błąd ści

orzy nato rzec ści ś grup

dług

kład noz

arsz any

gon najw

do eku ówn 201

d pr błę ysta omi czyw

śred p w

wiek

dno um zyc

ych, nu więk

otyc u w no 0 p

roc ędu anie iast wis dnic wiek

ku m

ść mier ch g

, w mię ksze

cząc w Po dla posł

cent MA em t oc ste w

ch kow

mężc

an raln grup

któ ędz ej s

cyc olsc a ko łuży

tow APE

mo ceni war bez wyc

czyzn

niże nośc

pac ó- zy

są

ch ce o- ył

wy E o-

ić r- z- ch

n

li ci ch

(6)

1

w 4 s o - d r

R

M k d k d w

R

p d L w r 104

wie 4%

staw obli -Ma dla rzec

Rys.

MA kob dop któr dow w w

Rys.

prog dług Lee wsz rzec

ekow . Z wie iczo aind mę czyw

. 2. Ś

W APE biet paso ry z wo wiek

3. Ś

A gno g w e-M zyst czyw

wyc wy mo one don ężcz wis

Śred

W p E, sz

po owa

z pr dla ku 5

Śred

Anal ozy wiek Miler tkic wis

ch, yjąt ode e na nald

zyzn styc

dnie

przy zcz wy anie rzed a ko 5-12

dnie b

lizuj te ku.

ra d ch tr ste w

tzn kie elu atom da-S

n (r ch w

błęd

ypad zegó yżej em.

dsta obie 2, 1

bezw

ując nie Ty dla rze wsp

n. m m m Lee mia Smi rys.

wart

dy p

dku ólni 30 W awi et p

5-1

wzg

śre edos lko

kob ch półc

międ męż e-M ast itha

2), tośc

proce

u ko ie je 0 ro

mł iony pon

8, 2

lędn

edn sza o w

biet mo czy

dzy żczy Mile

na a by , m ci w

ento

obie est

ku łods

ych niżej

23-2

ne bł

nie b cow prz t w odel ynni

20- yzn era b

po yły

ożn wsp

owe

et p to życ szyc h m ej 4 26 m

łędy

błęd wuj

zyp w w

li) m iki z

-85 n w był odst

bar na z półc

prog

pro wid cia ch g mode

4 ro mod

y pro

dy p ą rz padk iek moż

zgo A

rok w wi

ły o taw rdz zauw czyn

gnoz

ogno doc

mo gru eli z oku

dele

ocent

pro zec ku ku 6

żna onu.

Anna

kiem ieku obar wie

o z waż nnik

z ws

ozy zne odel upac zap ży e Le

towe

ogno zyw pro 6-12 a za

. a Oj

m ż u 12 rczo mo zbliż

żyć ka z

spół

y um e w

l Le ch w pew ycia ee-C

e pro

oz d wist ogno

2 la obs

jrzy

życi 2 i one odel żon , że zgo

łczyn

mie w naj

ee-M wie wnia a je Car

ogno

dla tych oz at o serw

yńsk

ia, o 20 e ni

lu ne.

e cz nu

nnik

eral ajmł

Mil eku a na st n rtera

oz w

ko h w

wy oraz wow

ka

osc lat ższ Lee An zęśc we

ka zg

noś łod lera

nie ajdo nim a or

wspó

bie wart yzna z ko wać

cylu pro zym

e-C naliz ciej dłu

gonu

ści szy a ch e mo okła m m raz B

ółczy

t, m tośc aczo obie ć, iż

ują n ogn mi b

Carte zują

pro ug w

u we

są ych hara

ożn adn mod Boo

ynni

moż ci w

ony et w ż pr

nato nozy łęd era ąc ś ogn wiek

edłu

ob gru akte na je

iejs del

oth-

ka z

żna wsp ych w n rogn

omi y w dam

or śred nozy ku.

ug w

barc upac eryz edn sze Lee -Ma

zgon

zau ółc

na najst noz

iast wyzn mi M

raz dnie y te

wieku

czon ch zuje nozn pro e-M aind

nu w

uwa zyn a po tars zy t

t wo nac MAP

mo e b

nie

u mę

ne wie e si nac ogn Mile don

wedłu

aży nnik odst szym

e p okó czon

PE.

ode łęd edo

ężcz

doś eko ię n czni nozy era, nald

ug w

yć, ż ka z taw m w prze

ół p ne n

Pr elu dy p osza

zyzn

ść wy najle

ie o y, p na da-S

wieku

że c zgo wie m

wie esza

ozi na p rogn Bo prog acow

n

duż ych.

eps okre przy atom Smit

u ko

częś onu mo eku acow

om pod noz ooth

gno wuj

żym Dl zym eślić ykła mias tha.

obiet

ście we del

(dl wuj mu

d- zy

h- oz ją

mi la m ć, a- st .

t

ej e- lu la ją

(7)

R

k

n z w p

P

z P p n -

d n c

Rys.

kich

m k

niem zen wan poz

Pod

zost Pier prze na p -Ma

delu nia cia.

. 4. Ś

D h gr

mężcz kobi

O m d

tow nia ziom

ds

Pr tała rws ez L prz aind

W u L

mo Pr

Śred

oda rupa

zyźni ety

blic do d wan

um mie

um

rzep a op szym

Lee ez don Wyn

Lee- odel rzep

dnie

atko ach

i

czo dan a p mier 4,3

mow

prow part m z e i C

Lee nald

iki -Car lu d prow

błęd

owo wie

5 6

ne nych prze

raln 3%

wan

wad ta n z m Car

e i da-S bad rter do d wad

dy p

o ob ekow

B

LC 5,97%

6,34%

śre h ch ez L nośc dla

nie

dzo na t mod

rtera Mi Smi dań ra p dany

dzo

proce

blicz wyc

Błęd

%

edni hara Lee

ci w a mę

e

ona trze deli a w iler itha ń w prze

ych ona

ento

zon ch

dy pr

ie b akte i M w l ężcz

w ech

by w 19 ra. O a.

ska edst h em

ana

owe

o śr MA

rogn

M L 4, 5,

błęd eryz Mile lata zyz

tej mo yła k 992

Ost

azał taw mpi aliz

prog

redn APE

noz e

MAPE LM ,37%

,60%

dy zow era.

ach zn i

pra ode kla r. D tatn

ły, ż wion

ryc za p

gnoz

ni b

m

Et

ex p E

%

pro wała

. W 20 5,6

acy elac syc Dru nim

że z na p czny

poz

z ws

bezw ora

post

ogno a si Wyko

006 6%

pró ch n czna ugim

prz

zap prze ych zwa

spół

wzg az M

umi

B 5,9 6,3

oz ię m orzy -20 dla

óba nale a i m z

zed

prop ez L h dla la t

łczyn

ględ MP

ieral

MS 90%

31%

pot mod ystu 010, a ko

a pr eżąc

pie mo dstaw

pono Lee

a ko twie

nnik

dny

m

PEt

lnoś

twie dyfi

ując , m obie

rogn cyc erw ode wio

owa i M obie

erd

ka zg

błą

m, a

ci ko

erd ikac c w możn

et.

noz h d wotn eli b ony

ana Mile

et i dzić

gonu

ąd p a wy

obie

L -3,2 -3,7

zają cja właś na

zow do r na m

była ym

a m era

mę , że

u we

roc ynik

et i m

C 26%

75%

ą, i mo śnie spo

wani rod met a m mo

mody po ężcz

e m

edłu

ento ki p

mężc

iż n odel e ten

odz

ia w ziny todo mody odel

yfik opra zyz mod

ug w

owy przed

czyz

- -

najl lu u n m ziew

wsp y m olog yfik lem

kacj awia zn p del

wieku

y łą dsta

zn

MPE LM -2,83 -0,81

leps umi mod wać

ółcz mod

gia kacj m by

ja k a ja pow Lee

u ko

ączn awi

E M

3%

1%

szym iera del d

si

zyn deli zap ja z ył m

klas akoś wyże e-C

obiet

nie w ono

m d alno do ę b

nnik Le pro zapr mod

sycz ść d ej 3 Carte

t

we o w

B -3 -3

dop ości pro błęd

ka z ee-C opon rop del

zne dop

0 ro era

wsz tab

Tab

BMS 3,10%

3,64%

paso i za ogn

dów

zgo Car now

ono Bo

go paso

oku mo

zyst b. 1.

bela

S

%

owa apre ozo w n

nów rtera wan owa ooth

mo owa u ży ożn t-

1

a- e- o- na

w a.

na a- h-

o- a- y- na

(8)

wykorzystywać do szacowania umieralności w Polsce. Należy jednak rozważać też inne modyfikacje klasycznego modelu, które mogą dać bardziej wiarygodne wyniki prognoz umieralności.

Literatura

Booth H., Maindonald J., Smith L. (2002): Applying Lee-Carter under Conditions of Va- riable Mortality Decline. „Population Studies”, No. 56.

Booth H., Hyndman R.J., Tickle L., de Jong P. (2006): Lee-Carter Mortality Foreca- sting: A Multi-country Comparison of Variants and Extensions. „Demographic Re- search”, No. 15.

Hyndman R.J., Ullah M.S. (2005): Robust Forecasting of Morality and Fertility Rates:

A Functional Data Approach. Working paper 2105, Department of Econometrics and Business Statistics, Moriah University.

De Jong, Tickle L. (2006): Extending Lee-Carter Method for Forecasting Morality.

„Demography” 2001, 38(4).

Lee R.D., Carter L. (1992): Modelling and Forecasting US Mortality. „Journal of the American Statistical Association”, Vol. 87(419).

Lee R.D., Miller T. (2001): Evaluating the Performance of the Lee-Carter Method for Forecasting Mortality. „Demography”, 38(4).

Papież M. (2008): Możliwość wykorzystania modelu Lee-Cartera do szacowania warto- ści w dynamicznych tablicach trwania życia. Zeszyty Naukowe SAD PAN, nr 18.

Rossa A. (2009): Dynamiczne tablice trwania życia oparte na metodologii Lee-Cartera i ich zastosowanie do obliczania wysokości świadczeń emerytalnych. Acta Univer- sitatis Lodziensis. Folia Oeconomica, 231.

FAMILY OF LEE-CARTER MODELS Summary

This paper presents a proposal for the application of selected models of the group of models using the Lee and Carter methodology for forecasting mortality rates. These include the original Lee-Carter, the Lee-Miller (2001) and Booth-Maindonald-Smith (2002) variants, and the more flexible Hyndman-Ullah (2005) and de Jong (2006) extensions. Based on estimates of mortality rates derived from the selected models was veri- fied the ability to use these models to estimate mortality rates in Poland.