Uniwersytet Ekonomiczny w Katowicach
RODZINA MODELI LEE-CARTERA
Wprowadzenie
Publikacja modelu umieralności Lee-Cartera w 1992 r. zapoczątkowała po- nowne zainteresowanie prognozowaniem umieralności. Od tamtego czasu opra- cowano kilka innych metod, jednakże metodologia zaproponowana przez Lee oraz Cartera jest nadal jedną z najlepiej dostępnych i powszechnie stosowanych.
Autorzy publikacji z 1992 r. zaproponowali model opisujący zmiany w umieral- ności z uwzględnieniem zmieniającego się czasu. W metodzie tej logarytm współczynnika zgonów jest równy sumie dwóch składników, z których jeden nie zależy od czasu, a drugi jest iloczynem parametru pokazującego ogólny poziom umieralności oraz parametru, który wskazuje, jak szybko lub wolno zmienia się umieralność w danym wieku w zależności od zmian ogólnej umieralności w cza- sie. Parametry tego modelu są estymowane na podstawie danych historycznych.
Modyfikację do tego modelu zaproponowali m.in.: Lee i Miller [2001], Bo- oth, Maindonald i Smith [2002], Hyndman i Ullah [2005] oraz De Jong [2006].
Celem artykułu jest przedstawienie wybranych modyfikacji klasycznego modelu Lee-Cartera oraz zastosowanie ich do szacowania współczynnika zgo- nów w Polsce. Na podstawie danych o współczynnikach zgonów dla jednorocz- nych grup wiekowych kobiet i mężczyzn w latach 1990-2005 dla Polski zostaną oszacowane parametry modelu umieralności Lee-Cartera oraz wybranych mody- fikacji tego modelu. Następnie zostanie oceniona dobroć dopasowania modeli, a tym samym zostanie zweryfikowana możliwość użycia tych modeli do pro- gnozowania umieralności w Polsce.
1. Metodologia badawcza
W latach 90. Lee i Carter podjęli próbę zastosowania teorii procesu błądze- nia przypadkowego z dryfem do modelowania oraz prognozowania współczyn- ników zgonów mx,t w grupach wieku x i dla kolejnych lat kalendarzowych t.
Model ten ma postać [Rossa, 2009]:
Anna Ojrzyńska 100
ln mx,t = ax + bxkt + εx,t, (1) gdzie:
ax − średni poziom logarytmu współczynnika zgonów w poszczególnych gru- pach wieku, uśredniony względem czasu kalendarzowego,
bx − wskazują, jak szybko logarytmy cząstkowych współczynników zgonów, tj.
lnmx,t, zmieniają w odpowiednich grupach wieku x,
kt − opisuje ogólną tendencję zmian umieralności w ciągu badanego okresu, traktowany jest efekt wpływu czasu kalendarzowego t na zmianę w pozio- mie cząstkowych współczynników zgonów,
εx,t − niezależne składniki losowe, o rozkładach normalnych o wartości oczeki- wanej równej 0 i stałej wariancji σ2.
Dla zapewnienia jednoznaczności rozwiązania Lee i Carter przyjęli dodat- kowe warunki ograniczające [Papież, 2008], tj. że suma parametrów bx dla wszystkich grup wieku jest równa 1, natomiast suma parametrów kt jest równa 0.
W propozycji Lee-Cartera szereg czasowy kt jest traktowany jako wycinek procesu stochastycznego błądzenia przypadkowego z dryfem, opisanym formułą [Rossa, 2009]:
kt = c + kt−1 + et, (2) gdzie:
c − reprezentuje pewną stałą (dryf),
et − składnik losowy o rozkładzie normalnym z wartością oczekiwaną równą 0 i pewną skończona wariancją.
Model zaproponowany przez Lee i Millera jest modyfikacją modelu Lee- -Cartera i różni się od jego pierwotnej postaci pod trzema względami [Lee, Miller, 2001]:
1. Zakres czasowy danych, na podstawie których szacowano parametry modelu uległ skróceniu – były to lata 1950-1989.
2. Dokonano korekty parametru kt, polegającej na dopasowaniu oszacowań tego parametru do oczekiwanej długości życia noworodka w roku t (e0 jest jednym z parametrów tablic trwania życia).
3. Do wyznaczenia prognoz wartości współczynników zgonu jako wartości teo- retycznych dla ostatniego okresu szacowania przyjmuje się wartości rzeczy- wiste (empiryczne).
W ocenie autorów tej modyfikacji głównym źródłem wysokich błędów prognoz, wyznaczonych przez Lee i Cartera było duże niedopasowanie pomię- dzy wartościami teoretycznymi dla ostatniego okresu szacowania modelu (tj. dla
1989 r.) z wartościami rzeczywistymi (empirycznymi) w tym roku. W modelu Lee-Milera rozwiązaniem tego problemu jest zastosowanie dodatkowego wa- runku, iż parametr kt przyjmuje wartość 0 w ostatnim roku szacowania modelu.
Analizując współczynniki zgonów w latach 1900-1995, autorzy zauważyli również, że wzorzec umieralności nie jest stały w czasie. W związku z tym sza- cowania modelu umieralności dokonano na podstawie danych z lat 1950-1989.
Model zaproponowany przez Booth-Maindonalda-Smitha również różni się od klasycznego modelu Lee-Cartera w trzech kwestiach [Booth, Maindoinald, Smith, 2002]:
1. Okres, na podstawie którego są szacowane parametry modelu jest dobierany na podstawie statystycznych kryteriów dobroci dopasowania, przy założeniu liniowości parametru kt.
2. Korekty parametru kt dokonuje się na podstawie rozkładu liczby zgonów wg wieku w poszczególnych latach, z wykorzystaniem własności rozkładu Pois- sona.
3. Nie dokonuje się żadnych zmian w wartościach teoretycznych dla ostatniego okresu szacowania.
Metoda Hyndmana i Ullaha wykorzystuje natomiast analizę funkcjonalną do modelowania logarytmów współczynników zgonów. Jest ona rozszerzeniem modelu Lee-Cartera w następujących kwestiach [Booth, Hyndman, Tickle, de Jong, 2006]:
1. Zakłada się że umieralność to gładka funkcja wieku, która jest obserwowana z błędami; gładkie współczynniki zgonów są szacowane za pomocą niepara- metrycznych metod wygładzania.
2. Wykorzystuje więcej niż jeden zestaw składników (kt, bx).
3. Do prognozowania parametrów modelu są wykorzystywane bardziej ogólne metody szeregów czasowych niż błądzenie losowe z dryfem. Do wykładni- czego wygładzania zastosowano modele przestrzeni stanów.
4. Zastosowanie odpornych metod estymacji pozwoli na dokładniejsze oszaco- wania współczynników zgonu dla nietypowych lat m.in. w okresach konflik- tów zbrojnych, epidemii.
5. Brak korekty parametru kt.
Podejście Hyndmana i Ullaha może być wyrażone za pomocą równania o postaci:
t xt
J
j t j j t
t
x a x k b x e x x
m ,
1 ,
, ( ) ( ) ( ) ( )
ln
∑ σ ε
=
+ +
+
= , (3)
Anna Ojrzyńska 102
gdzie:
a(x) − średni wzorzec umieralności w wieku x, bj(x) − jest podstawową funkcją,
kt − parametr szeregu czasowego,
σt(x)εx,t − błąd obserwacji, wynikający z różnicy między obserwowanymi wskaźnikami a krzywymi sklejanymi,
et(x) − błąd szacowania, wynikający z różnicy między krzywymi sklejanymi i ich oszacowanymi odpowiednikami.
Ostatnią z przedstawionych w tym referacie modyfikacji modelu Lee- -Cartera jest podejście De Jonga i Tickle’a, które wykorzystuje metodologię przestrzeni stanów do modelowania logarytmów współczynników zgonu. Mode- le przestrzeni stanów obejmują szeroki zakres elastycznych wielowymiarowych modeli szeregów czasowych, których model Lee-Cartera jest szczególnym przy- padkiem. Ogólna metodologia dopuszcza mnóstwo specjalizacji i uogólnień oraz zawiera ocenę oszacowania nieznanych parametrów, wnioskowanie i prognozo- wanie łącznie z obliczeniem błędów prognoz. Model Lee-Cartera może być za- pisany w postaci równania:
yt = a + bkt + εt, (4) gdzie:
yt − wektor logarytmów współczynników zgonu w każdym wieku w roku t, a i b − wektory odpowiednich parametrów modelu Lee-Cartera dla każdego wieku, kt − jest wskaźnikiem poziomu umieralności w roku t, tak jak w modelu Lee-Cartera, εt − wektor błędów w każdym wieku w roku t.
W 2006 r. De Jong i Tickle opracowali bardziej ogólną specyfikację [Booth, Hyndman, Tickle, de Jong, 2006]:
yt = Xa + Xbkt + εt, (5) gdzie:
X jest macierzą o liczbie wierszy większej niż liczba kolumn.
Gdy X = I, wówczas model redukuje się do postaci równania (4). Równanie (5) rozwiązuje problem modelu LC zapisanego równaniem (4), gdzie istnieje pa- rametr a i b dla każdego wieku. W modelu (5) macierz X ma mniej kolumn niż wierszy, co oznacza, że wektorów parametrów a i b jest mniej niż istniejących grup wiekowych. Efekty szeregu czasowego kt nie są niezależne we wszystkich grupach wiekowych, ale są ograniczone przez strukturę macierzy X, nakładając gładkość w każdej grupie wiekowej.
r w o
2
w w b n
M p d c t w m
R
w m
1
2
rych węz obli
2. A
wsp w l biet nato
MA poz dyfi czy tośc wzg męż
Rys.
w p męż
1 M
2 M W h o złam
iczo
Ana
B półc
atac t, ja omi D APE zwo fikac
wy ci w ględ żczy
1. Ś
Pr przy żczy
MAP MPE
W ob obow mi w one
aliz
ada czyn
ch ak i iast o o E1 o olą p
cji yzn wsp dny yzn
Średn
rogn ypad yzn
= PE E=
becn wią w ró e prz
za
anie nni 199 dla t do
oce oraz por mo nacz półc ych n i k
nie b
noz dku n po
=m 1
∑
mm τ
1 nej ązuj óżn zy u
em
e um ków 90-2 a m o wy eny
z śr ówn odel
zone czyn błę kob
bezw
zy u pr
oniż
∑
mm τ
∑
m yτ τ
ana je f nych
uży
mpi
mie w n 201 mężc yzn
pr redn
nać lu L e pr nnik ędów
iet.
wzgl
um rogn żej
yτP
−
P
yτ
τ
aliz form h gr yciu
ryc
eraln natę
10.
czy nacz ogn ni b ć do Lee- rog ków w p
ędne
mier noz 20
− y
y
τ
yτ zie m ma
rup u fil
czn
noś ężen Est yzn
zeni noz błąd okła -Ca gnoz w zg proc
e błę
raln wy 0 ro
yτ mac
kw ach ltrow
na
ści nia tym na ia p w d pr adn arte zy p gon cent
ędy p
nośc yzn oku
cier wadr h wi wan
prz zgo macj pod prog wyko roc ność ra.
prz nu.
tow
proc
ci m acz
ży
rz X rato ieku nia
zepr onó ję p dsta gno orzy
ent ć pr Wa esz
Ry wych
cento
męż zony ycia
X je
owa u. O
Ka
row w o para awi
z or ysta owy rogn arto zaco ysun h p
owe
żcz ych a ni
est o a lo Osz alma
wadz oraz ame e la raz ano
y M noz ości owu nki prog
prog
yzn h dla
e p opa oga zaco
ana
zon z st etró at 1
we o śr MPE z otr
błę ują
1 i gnoz
gnoz
n c a ko prze
arta arytm
owa a i w
no n tanu ów
990 eryf redn
E2. rzym ędó
lub i 3 z d
z wsp
cech obie ekra
na mu ania wyg
na p u lu
prz 0-2 fika ni b
Ob my ów M b nie
pre la j
półc
huje et. B acza
krz ws a m gład
pod udno zepr
005 acji bez blic ywan
MP edo ezen
edn
czyn
e w Błę ają
zyw spó mode
dzan
dsta ośc row 5. O mo zwz czon
nyc PE p osza ntuj noro
nnika
więk ędy
14 wych
ółcz elu nia.
awie ci w wadz
Okre odel zglę
ne w ch z poz acow
ją w ocz
a zgo
ksz dla 4%.
h B zynn
me
e d wedł zon es 2 lu.
ędny war z w zwo wuj war znyc
onu w
za a pr
W B-sk
nika etod
dany ług no z 200
y b rtoś wyko
lą n ją r rtoś ch g
wed
dok rogn W sta
kleja a z dą n
ych wi zaró 06-2
błąd ści
orzy nato rzec ści ś grup
dług
kład noz
arsz any
gon najw
do eku ówn 201
d pr błę ysta omi czyw
śred p w
wiek
dno um zyc
ych, nu więk
otyc u w no 0 p
roc ędu anie iast wis dnic wiek
ku m
ść mier ch g
, w mię ksze
cząc w Po dla posł
cent MA em t oc ste w
ch kow
mężc
an raln grup
któ ędz ej s
cyc olsc a ko łuży
tow APE
mo ceni war bez wyc
czyzn
niże nośc
pac ó- zy
są
ch ce o- ył
wy E o-
ić r- z- ch
n
li ci ch
1
w 4 s o - d r
R
M k d k d w
R
p d L w r 104
wie 4%
staw obli -Ma dla rzec
Rys.
MA kob dop któr dow w w
Rys.
prog dług Lee wsz rzec
ekow . Z wie iczo aind mę czyw
. 2. Ś
W APE biet paso ry z wo wiek
3. Ś
A gno g w e-M zyst czyw
wyc wy mo one don ężcz wis
Śred
W p E, sz
po owa
z pr dla ku 5
Śred
Anal ozy wiek Miler tkic wis
ch, yjąt ode e na nald
zyzn styc
dnie
przy zcz wy anie rzed a ko 5-12
dnie b
lizuj te ku.
ra d ch tr ste w
tzn kie elu atom da-S
n (r ch w
błęd
ypad zegó yżej em.
dsta obie 2, 1
bezw
ując nie Ty dla rze wsp
n. m m m Lee mia Smi rys.
wart
dy p
dku ólni 30 W awi et p
5-1
wzg
śre edos lko
kob ch półc
międ męż e-M ast itha
2), tośc
proce
u ko ie je 0 ro
mł iony pon
8, 2
lędn
edn sza o w
biet mo czy
dzy żczy Mile
na a by , m ci w
ento
obie est
ku łods
ych niżej
23-2
ne bł
nie b cow prz t w odel ynni
20- yzn era b
po yły
ożn wsp
owe
et p to życ szyc h m ej 4 26 m
łędy
błęd wuj
zyp w w
li) m iki z
-85 n w był odst
bar na z półc
prog
pro wid cia ch g mode
4 ro mod
y pro
dy p ą rz padk iek moż
zgo A
rok w wi
ły o taw rdz zauw czyn
gnoz
ogno doc
mo gru eli z oku
dele
ocent
pro zec ku ku 6
żna onu.
Anna
kiem ieku obar wie
o z waż nnik
z ws
ozy zne odel upac zap ży e Le
towe
ogno zyw pro 6-12 a za
. a Oj
m ż u 12 rczo mo zbliż
żyć ka z
spół
y um e w
l Le ch w pew ycia ee-C
e pro
oz d wist ogno
2 la obs
jrzy
życi 2 i one odel żon , że zgo
łczyn
mie w naj
ee-M wie wnia a je Car
ogno
dla tych oz at o serw
yńsk
ia, o 20 e ni
lu ne.
e cz nu
nnik
eral ajmł
Mil eku a na st n rtera
oz w
ko h w
wy oraz wow
ka
osc lat ższ Lee An zęśc we
ka zg
noś łod lera
nie ajdo nim a or
wspó
bie wart yzna z ko wać
cylu pro zym
e-C naliz ciej dłu
gonu
ści szy a ch e mo okła m m raz B
ółczy
t, m tośc aczo obie ć, iż
ują n ogn mi b
Carte zują
pro ug w
u we
są ych hara
ożn adn mod Boo
ynni
moż ci w
ony et w ż pr
nato nozy łęd era ąc ś ogn wiek
edłu
ob gru akte na je
iejs del
oth-
ka z
żna wsp ych w n rogn
omi y w dam
or śred nozy ku.
ug w
barc upac eryz edn sze Lee -Ma
zgon
zau ółc
na najst noz
iast wyzn mi M
raz dnie y te
wieku
czon ch zuje nozn pro e-M aind
nu w
uwa zyn a po tars zy t
t wo nac MAP
mo e b
nie
u mę
ne wie e si nac ogn Mile don
wedłu
aży nnik odst szym
e p okó czon
PE.
ode łęd edo
ężcz
doś eko ię n czni nozy era, nald
ug w
yć, ż ka z taw m w prze
ół p ne n
Pr elu dy p osza
zyzn
ść wy najle
ie o y, p na da-S
wieku
że c zgo wie m
wie esza
ozi na p rogn Bo prog acow
n
duż ych.
eps okre przy atom Smit
u ko
częś onu mo eku acow
om pod noz ooth
gno wuj
żym Dl zym eślić ykła mias tha.
obiet
ście we del
(dl wuj mu
d- zy
h- oz ją
mi la m ć, a- st .
t
ej e- lu la ją
R
k
n z w p
P
z P p n -
d n c
Rys.
kich
m k
niem zen wan poz
Pod
zost Pier prze na p -Ma
delu nia cia.
. 4. Ś
D h gr
mężcz kobi
O m d
tow nia ziom
ds
Pr tała rws ez L prz aind
W u L
mo Pr
Śred
oda rupa
zyźni ety
blic do d wan
um mie
um
rzep a op szym
Lee ez don Wyn
Lee- odel rzep
dnie
atko ach
i
czo dan a p mier 4,3
mow
prow part m z e i C
Lee nald
iki -Car lu d prow
błęd
owo wie
5 6
ne nych prze
raln 3%
wan
wad ta n z m Car
e i da-S bad rter do d wad
dy p
o ob ekow
B
LC 5,97%
6,34%
śre h ch ez L nośc dla
nie
dzo na t mod
rtera Mi Smi dań ra p dany
dzo
proce
blicz wyc
Błęd
%
%
edni hara Lee
ci w a mę
e
ona trze deli a w iler itha ń w prze
ych ona
ento
zon ch
dy pr
ie b akte i M w l ężcz
w ech
by w 19 ra. O a.
ska edst h em
ana
owe
o śr MA
rogn
M L 4, 5,
błęd eryz Mile lata zyz
tej mo yła k 992
Ost
azał taw mpi aliz
prog
redn APE
noz e
MAPE LM ,37%
,60%
dy zow era.
ach zn i
pra ode kla r. D tatn
ły, ż wion
ryc za p
gnoz
ni b
m
Et
ex p E
%
%
pro wała
. W 20 5,6
acy elac syc Dru nim
że z na p czny
poz
z ws
bezw ora
post
ogno a si Wyko
006 6%
pró ch n czna ugim
prz
zap prze ych zwa
spół
wzg az M
umi
B 5,9 6,3
oz ię m orzy -20 dla
óba nale a i m z
zed
prop ez L h dla la t
łczyn
ględ MP
ieral
MS 90%
31%
pot mod ystu 010, a ko
a pr eżąc
pie mo dstaw
pono Lee
a ko twie
nnik
dny
m
PEt
lnoś
twie dyfi
ując , m obie
rogn cyc erw ode wio
owa i M obie
erd
ka zg
błą
m, a
ci ko
erd ikac c w możn
et.
noz h d wotn eli b ony
ana Mile
et i dzić
gonu
ąd p a wy
obie
L -3,2 -3,7
zają cja właś na
zow do r na m
była ym
a m era
mę , że
u we
roc ynik
et i m
C 26%
75%
ą, i mo śnie spo
wani rod met a m mo
mody po ężcz
e m
edłu
ento ki p
mężc
iż n odel e ten
odz
ia w ziny todo mody odel
yfik opra zyz mod
ug w
owy przed
czyz
- -
najl lu u n m ziew
wsp y m olog yfik lem
kacj awia zn p del
wieku
y łą dsta
zn
MPE LM -2,83 -0,81
leps umi mod wać
ółcz mod
gia kacj m by
ja k a ja pow Lee
u ko
ączn awi
E M
3%
1%
szym iera del d
si
zyn deli zap ja z ył m
klas akoś wyże e-C
obiet
nie w ono
m d alno do ę b
nnik Le pro zapr mod
sycz ść d ej 3 Carte
t
we o w
B -3 -3
dop ości pro błęd
ka z ee-C opon rop del
zne dop
0 ro era
wsz tab
Tab
BMS 3,10%
3,64%
paso i za ogn
dów
zgo Car now
ono Bo
go paso
oku mo
zyst b. 1.
bela
S
%
%
owa apre ozo w n
nów rtera wan owa ooth
mo owa u ży ożn t-
1
a- e- o- na
w a.
na a- h-
o- a- y- na
Anna Ojrzyńska 106
wykorzystywać do szacowania umieralności w Polsce. Należy jednak rozważać też inne modyfikacje klasycznego modelu, które mogą dać bardziej wiarygodne wyniki prognoz umieralności.
Literatura
Booth H., Maindonald J., Smith L. (2002): Applying Lee-Carter under Conditions of Va- riable Mortality Decline. „Population Studies”, No. 56.
Booth H., Hyndman R.J., Tickle L., de Jong P. (2006): Lee-Carter Mortality Foreca- sting: A Multi-country Comparison of Variants and Extensions. „Demographic Re- search”, No. 15.
Hyndman R.J., Ullah M.S. (2005): Robust Forecasting of Morality and Fertility Rates:
A Functional Data Approach. Working paper 2105, Department of Econometrics and Business Statistics, Moriah University.
De Jong, Tickle L. (2006): Extending Lee-Carter Method for Forecasting Morality.
„Demography” 2001, 38(4).
Lee R.D., Carter L. (1992): Modelling and Forecasting US Mortality. „Journal of the American Statistical Association”, Vol. 87(419).
Lee R.D., Miller T. (2001): Evaluating the Performance of the Lee-Carter Method for Forecasting Mortality. „Demography”, 38(4).
Papież M. (2008): Możliwość wykorzystania modelu Lee-Cartera do szacowania warto- ści w dynamicznych tablicach trwania życia. Zeszyty Naukowe SAD PAN, nr 18.
Rossa A. (2009): Dynamiczne tablice trwania życia oparte na metodologii Lee-Cartera i ich zastosowanie do obliczania wysokości świadczeń emerytalnych. Acta Univer- sitatis Lodziensis. Folia Oeconomica, 231.
FAMILY OF LEE-CARTER MODELS Summary
This paper presents a proposal for the application of selected models of the group of models using the Lee and Carter methodology for forecasting mortality rates. These include the original Lee-Carter, the Lee-Miller (2001) and Booth-Maindonald-Smith (2002) variants, and the more flexible Hyndman-Ullah (2005) and de Jong (2006) exten- sions. Based on estimates of mortality rates derived from the selected models was veri- fied the ability to use these models to estimate mortality rates in Poland.