modelos de supervivencia adecuados para análisis actuariales de

Anuncio
COMUNICACIÓN
XI JORNADAS ASEPUMA
Oviedo, 11 y 12 de Septiembre de 2003
TITULO:
"MODELOS DE SUPERVIVENCIA ADECUADOS PARA
ANÁLISIS ACTUARIALES DE MORTALIDAD"
“SURVIVAL MODELS IN ACTUARIAL MORTALITY
ANALYSIS”
AUTOR (ES):
SÁNCHEZ LÓPEZ, JOSÉ MARÍA
MEDINA LÓPEZ, ANA
INSTITUCION:
UNIVERSIDAD REY JUAN CARLOS
FACULTAD DE CIENCIAS JURÍDICAS Y SOCIALES
Paseo de los Artilleros s/n; 28032; Madrid
TELEFONO Y DIRECCION DE CONTACTO :
[email protected] Teléfonos: 650645297 // 913737801 // 914887851
[email protected] Teléfonos: 606694989 // 914887848
PALABRAS CLAVE:
Mortalidad actuarial, Funciones de supervivencia, Modelos tabulares, Modelos
paramétricos, Mixturas; Graduación, Rango edades, Ajuste; Proyecciones mortalidad.
KEY WORDS:
Actuarial mortality estimation, Survival functions, Tabular models, Parametric models,
Mixed models; Graduation, Age rank, Fit-testing; Mortality projections.
AREA TEMATICA: 3 (Matemática de las operaciones financieras y cálculo actuarial).
RESUMEN
En el seguro de vida, se destacará el interés de los denominados modelos o
funciones de supervivencia como instrumentos imprescindibles en distintas fases del
análisis de mortalidad. El estudio se adaptará a los mejores datos reales disponibles en
las aseguradoras respecto de la población objetivo (población asegurable): datos de
pólizas que evitan sesgos derivados del uso de tablas de población general.
Se analizará la utilidad de los modelos de supervivencia actuarial a tres niveles.
En primer lugar, se mostrará la necesidad de utilizar hipótesis de mortalidad
intraintervalo para estimar las probabilidades anuales de muerte que permitan obtener
un modelo tabular. En segundo lugar, los modelos se emplearán en la denominada
graduación paramétrica para mejorar las estimaciones iniciales incorporando
información sobre relaciones existentes en el conjunto de estimaciones y sobre
creencias previas a las observaciones. En tercer lugar, nuevos modelos serán los
instrumentos que proyecten el fenómeno de la mortalidad a futuro según la dinamicidad
del colectivo estudiado respecto a la mortalidad.
Se presentará una visión actual de las posibilidades existentes, valorando las
alternativas y trabajos empíricos ya realizados, y ofreciendo nuevas posibilidades.
ABSTRACT
In the context of life insurance, survival models will be highlighted as essential
instruments for the development of mortality analysis on its various stages.
The research will be adapted to the most reliable data obtained from insurance
companies in relation to the target population: data from policies which avoid errors that
come together by using general population tables.
Utility of actuarial survival models will be analysed in three stages:
First of all, the use of between-the-integral-ages assumptions is necessary in order to
make an estimation of the annual mortality probabilities which allow to obtain a table
model.
Secondly, models will be used in parametric graduation to improve initial estimations
adding the information available about the beliefs previous to observations.
On third place, new models will arise to project the mortality phenomenon to the future
by following the mortality pattern drawn by the collective dynamic previously studied.
It will be presented a new vision for possibilities having to do with mortality.
The analysis is based on empirical works and it offers new ways of projecting mortality.
1.- PLANTEAMIENTO.
La obtención de modelos paramétricos a partir de los datos brutos (dato incompleto)
suministrados por las compañías aseguradoras puede conseguirse desde dos
planteamientos distintos: uno es directo, el otro es indirecto.
El planteamiento directo parte de los datos con los que efectúa una estimación directa
del modelo de supervivencia. El planteamiento directo se critica en cuanto a su utilidad
en el seguro de vida y se basa en la dificultad de encontrar una función para todo el
rango de edades que explique los datos sólo en base a una única variable (incluso dentro
de un grupo homogéneo previamente elegido). También se debe atender a unas
muestras con diferente tamaño para las distintas edades. Se obtienen resultados más
detallados si se fijan puntos temporales para estimar. Resulta más sencillo, práctico y
formal realizar un análisis previo de la situación para intervalos anuales de edad. Todo
esto, lleva a preferir los modelos no paramétricos como punto de partida para
posteriores ajustes de modelos paramétricos. Tal como expone Elandt-Johnson, Regina
and Johnson Norman, L. (1.980): “...destacamos los métodos de estimación dirigidos al
ajuste de proporciones de supervivencia observada y defendemos enjuiciar los métodos
de acuerdo a como se realiza esto”.
El planteamiento indirecto parte de los datos, obtiene a continuación las
probabilidades de muerte anual para todos los años y, finalmente, a través de las
estimaciones anuales llega al modelo de supervivencia. Esta última situación se trata en
el epígrafe referente a la graduación o rectificación de las estimaciones.
La secuencia de valores revisados o graduados en estos métodos paramétricos se
expresará como una función de argumento x, siendo vx una función que contiene los
parámetros que deben fijarse desde los datos que configuran las estimaciones iniciales.
La justificación de este tipo de graduación se basa en la necesidad de corregir las
imprecisiones de la estimación (debidas a datos mal ubicados en el tiempo y a la
aleatoriedad del muestreo) mediante el ajuste de una función matemática que se supone
representa las verdaderas tasas de mortalidad. La opinión previa se manifiesta en la
determinación de la forma funcional elegida (en la elección de dicha función también
participa la información que suministran los datos).
Las técnicas que se utilizan en el ajuste de las curvas para obtener los valores graduados
(estimaciones corregidas) son las características de ajustes de curvas y de regresión en
casos generales.
El paso siguiente consiste en utilizar una batería de pruebas o test para confirmar si los
valores conseguidos mediante el ajuste son “adecuados”, esto es, son coherentes con los
datos y, a la vez, representados por una función matemática razonablemente sencilla
(pocos parámetros) y suave (según el valor de las diferencias finitas).
Esta aproximación convencional gradúa la fuerza de mortalidad ajustando una fórmula
paramétrica a las tasas brutas de mortalidad (estimación previa) asumiendo que el
número real de muertes son variables aleatorias tipo Poisson (condicionadas a la
exposición). Alternativamente se utilizan la distribución binomial o normal. Con esta
situación se puede llegar a una verosimilitud característica que permite estimar los
parámetros. Tal como se ha indicado, para iniciar una graduación por fórmula
matemática, se debe elegir el tipo de funciones. Se distinguen distintas posibilidades
según el rango de edades en el cual se desea utilizar el método: rango no extenso,
amplio rango y todo el rango.
Finalmente, se muestra la necesidad de los modelos matemáticos para proyectar el
fenómeno de la mortalidad a tiempo cronológico futuro.
2.- MODELOS PARAMÉTRICOS.
El planteamiento directo, como ya se dijo, parte de los datos y supone una función de
supervivencia adecuada. Se deben estimar los parámetros de la mencionada función, se
expone el método de máxima verosimilitud suponiendo dato incompleto.
En principio un individuo entra a observación en t=ri y deja la observación en t=ti por
muerte o finalización del periodo programado de observación. Por ello, la probabilidad
de sobrevivir será
S (ti )
ti − ri p ri =
S ( ri )
y la de morir
f (ti )
.
ti − ri q ri = ti − ri p ri × λ (ti ) = ti − ri p ri ×
S (ti )
Se puede construir la función de verosimilitud como
S ( ti ) λ ( ti )
S (ti )
f ( ti )
S ( ti )
L=∏
=∏
∏
∏
S (ri ) A S (ri )
D
D S ( ri ) A S ( ri )
distinguiendo la contribución de los individuos que mueren y de los individuos que
sobreviven, o utilizar un indicador de la situación del individuo i-ésimo:
n
S (ti )[λ (ti )]
[ S ( ti ) ] [ f ( ti ) ] .
L=∏
=∏
S ( ri )
S ( ri )
i =1
i =1
Si se considera para los individuos de la muestra las posibles retiradas no programadas,
tomándolas aleatorias, hay que introducir modificaciones en la función de verosimilitud,
además de admitir el principio de independencia entre muerte y retirada.
La probabilidad de sobrevivir entre ri y ti será:
Sd (ti ) Sw(ti )
(τ )
(d )
( w)
= ti − ri p ri × ti − ri p ri =
.
ti − ri p ri
Sd (ri ) Sw(ri )
Interviene una función de supervivencia respecto de la muerte y una función de
supervivencia respecto a la retirada. Por ello, ti representará el tiempo hasta la muerte,
hasta el fin programado o hasta la retirada aleatoria. La función de verosimilitud
adoptará la forma:
δi
γi
n Sd (ti ) Sw(ti )[λd (ti ) ] [λw(ti ) ]
L=∏
=
i =1
Sd ( r i ) Sw ( r i )
n
=∏
δi
1−δi
δi
n
[Sd (ti )]1−δ [Sw(ti )]1−γ [ fd (ti)]δ [ fw(ti)]γ
i
i
i
i
Sd ( r i ) Sw ( r i )
utilizando indicadores de la situación del individuo i-ésimo respecto de la posible
muerte o retirada.
La estimación se realizará tras la especificación de las funciones de supervivencia (y,
por tanto, de la tasa de azar). Las funciones dependerán de valores muestrales (según los
datos que se tengan) y de parámetros (tratados como variables para maximizar la
verosimilitud de la muestra que se tenga).
La bondad del ajuste obtenido puede analizarse mediante test clásicos estadísticos,
rectificados debido a los datos incompletos que se utilizan. Son de interés los trabajos
de Stephens, M.A. (1.974, 1.977) donde aparecen como más convenientes el test de
Kolmogorov-Smirnov modificado para dato incompleto con sólo la familia de funciones
a ajustar especificada y, especialmente, el test de Anderson-Darling modificado.
i =1
3.- FUNCIONES DE SUPERVIVENCIA CLÁSICAS: RANGO NO EXTENSO.
Si se aplica para un rango de edades no extenso existen múltiples funciones básicas que
se pueden utilizar. La principal utilidad de estas funciones está en permitir estimar la
mortalidad anual mediante su uso en las hipótesis de mortalidad intraintervalo. Con las
estimaciones para cada año de edad se obtiene el modelo tabular o tabla de mortalidad
que es la forma más tratada en la literatura y más empleada en el trabajo actuarial.
Resumiendo, el modelo tabular clásico utiliza valores enteros de x para los que se
calcula su correspondiente valor según S(x). La falta de valores intermedios para valores
no enteros de x se resuelve estableciendo unas hipótesis de mortalidad o métodos de
interpolación entre valores enteros consecutivos que permiten considerar el modelo
completamente especificado (especificado para todos los valores positivos de x). El
modelo tabular se da a conocer como "tabla de mortalidad" , "tabla de supervivencia" o
"tabla de vida".
A continuación se presentan distribuciones de supervivencia clásicas, algunas con
aplicación sólo durante intervalos muy cortos y específicos de tiempo (para las
interpolaciones en la tabla de mortalidad), coherentes con la evidencia empírica.
Ley de Moivre.
Supone un comportamiento lineal, con la edad, de la función de supervivencia según
una progresión aritmética no negativa pero decreciente:
l (0)
l (0)
l ( x) = a − bx con b > 0, a = l (0), w =
, x≤
.
b
b
La fuerza de mortalidad que corresponde a la expresión anterior será:
b
µ ( x) =
.
l (0) − b • x
Se tiene una fuerza de mortalidad siempre creciente con la edad, lo que restringe su
utilidad a los tramos altos de edad.
La probabilidad de muerte se obtendrá como / nqx = n • µ ( x) , esto es, directamente
proporcional al tanto instantáneo de mortalidad o fuerza de mortalidad.
Primera ley de Dormoy.
Supone una determinada forma de variación de la función de supervivencia, lo que
equivaldrá a una función de supervivencia exponencial no negativa, decreciente y
convexa respecto de la variable edad:
l ( x + 1) = b • l ( x) con 0 < b < 1 ⇒
l ( x) = a • b x con a = l (0) y b x → 0 si x → w.
La fuerza de mortalidad que corresponde a la expresión anterior será:
µ ( x ) = − ln b.
Se tiene una fuerza de mortalidad constante respecto de la edad lo que restringe su
utilidad a intervalos cortos (interpolación entre dos edades enteras consecutivas, por
ejemplo).
Según las expresiones anteriores se llega a probabilidades de muerte y de supervivencia
de la forma / nqx = 1 − b n y npx = b n , que sólo dependen de la amplitud del intervalo
considerado.
Segunda ley de Dormoy.
Se modifica la primera ley para que aparezca la variable edad en la fuerza de
mortalidad.
Se elige un polinomio de primer grado que conduce a una fuerza de mortalidad
creciente con la edad (no aplicable a personas jóvenes):
µ ( x) = a + b • x con b > 0.
La función de supervivencia que corresponde a la expresión anterior será:
− a• x
b
− •x2
2
l ( x) = l (0) • e
•e
.
Esto es, no negativa, decreciente y cóncava.
Según las expresiones anteriores se llega a probabilidades de muerte y de supervivencia
que dependen de la amplitud del intervalo y de la edad considerada.
Tercera ley de Dormoy.
Se modifica la primera ley para que aparezca la variable edad en la fuerza de
mortalidad.
Se elige un polinomio de segundo grado:
µ ( x) = a + b • x + c • x 2 .
La función de supervivencia que corresponde a la expresión anterior será:
b
− •x2
c
− •x3
l ( x ) = l (0) • e − a • x • e 2 • e 3 .
Las expresiones anteriores permiten más posibilidades aunque complican los cálculos
de posibles estimaciones.
Ley de Sang.
Supone un comportamiento de la función de supervivencia geométrico respecto de la
edad junto con la existencia de otro factor diferente a la edad:
l (0) • b w
l (0)
, k=
.
l ( x) = a + k • b x con 0 < b < 1, a = −
w
1− b
1− bw
La fuerza de mortalidad que corresponde a la expresión anterior será:
ln b
b x • ln b
µ ( x) = − x
= − w− x
.
w
b −b
b −1
Se observa como la función de supervivencia es decreciente y convexa respecto de la
edad. En realidad, supone una modificación de la primera ley de Dormoy que se
consigue añadiendo un término constante en la función de supervivencia para recoger la
influencia en la mortalidad de un factor distinto de la edad.
Ley de Gompertz.
Se fundamenta en un determinado comportamiento del incremento de la fuerza de
mortalidad:
∆µ ( x) = k • µ ( x) • ∆x + O(∆x)
con k = cte., O(∆x) infinit. si ∆x → 0.
Se llega a una fuerza de mortalidad de la forma:
µ ( x) = c • e kx .
La función de supervivencia que corresponde a la expresión anterior será:
c
c
− •e kx
l ( x) = l (0) • e k • e k .
Las expresiones anteriores consideran la edad como la única causa de muerte (no
incluye factores accidentales), siendo la fuerza de mortalidad siempre creciente con la
edad, aspecto más relevante a edades altas.
Primera ley de Makeham.
Se fundamenta en un determinado comportamiento del incremento de la fuerza de
mortalidad que refleja la posible existencia de factores accidentales:
∆µ ( x ) = k 1 • µ ( x ) • ∆x + k 2 • ∆x + O( ∆x ).
Se llega a una fuerza de mortalidad nunca decreciente, de la forma:
k2
µ ( x) = − + c • e k 1• x con c > 0, k 1 > 0.
k1
La función de supervivencia que corresponde a la expresión anterior será:
c
k1
−
c g
•e
k1
k2
•x
k1
c
k2
l ( x) = l (0) • e • e
•e
con g = k 1 • x.
Segunda ley de Makeham.
Se fundamenta en la anterior, pero añadiendo a la fuerza de mortalidad otro sumando
proporcional a la edad:
k2
µ ( x ) = − + b • x + c • e k 1• x .
k1
La función de supervivencia que corresponde a la expresión anterior será:
c
−
•e g
b
− •x2
•x
l ( x) = l (0) • e k 1 • e k 1 • e k 1 • e 2
con g = k 1 • x.
Las expresiones anteriores permiten más posibilidades aunque complican los cálculos
de posibles estimaciones.
Ley de Lazarus.
Se introduce otro término en la primera ley de Makeham para ampliar su utilidad en
edades no necesariamente altas:
k2
µ ( x) = − + c • e k 1• x + d • e kd • x con e kd < 1.
k1
La función de supervivencia que corresponde a la expresión anterior será:
c
+
d
−
c
•e g
−
d
•e h
k2
•x
l ( x) = l (0) • e k 1 kd • e k 1 • e kd • e k 1
con g = k 1 • x, h = kd • x.
Las expresiones anteriores permiten más posibilidades aunque complican los cálculos
de posibles estimaciones.
Ley de Weibull.
Se basa en la siguiente forma que supone sigue la fuerza de mortalidad:
µ ( x) = k • x n con k > 0, n > 0.
La función de supervivencia que corresponde a la expresión anterior será:
l ( x ) = l (0) • e
−
k n +1
x
n +1
.
4.- GRADUACION PARAMETRICA: AMPLIO RANGO DE EDADES.
Ciertas expresiones ofrecen la posibilidad de extenderse a un amplio rango de edades,
son expresiones conocidas como “fórmulas Gompertz- Makeham de tipo (r,s)”,
r
GM α ( x) = ∑ α i x
r ,s
r+s
i −1
+e
i − r −1
∑ αi x
i = r +1
,
i =1
o como “fórmulas Logit Gompertz- Makeham de tipo (r,s)”,
GM αr , s ( x)
LGM αr , s ( x) =
,
1 + GM αr ,s ( x)
que ofrece la ventaja de ser un logit con rango de valores posible entre cero y uno. Estas
funciones son estudiadas dentro del marco de los modelos lineales y no lineales
generalizados de utilidad en el ámbito actuarial por Renshaw, A.E. (1.991).
Otra posibilidad surge con un conjunto de polinomios ortogonales formando una base.
Ante un conjunto de puntos {( x j , y j ), j = 1,..., m} el problema de ajustar una curva,
según unas ponderaciones positivas {w1 ,..., wm } , lleva a minimizar una expresión, para
ciertas funciones, del tipo:
∑ w [y
]
m
j =1
j
2
− f n (x j ) .
j
Las funciones de la expresión son de la forma
n
f n ( x) = ∑ α i pi −1 ( x) ;
i =1
siendo los polinomios según el grado marcado por el subíndice y ortogonales con la
condición
m
0 si r ≠ s
w j pr ( x j ) ps ( x j ) = 
∑
j =1
er si r = s
con er ∈ R.
La expresión a minimizar queda
2
n


S = ∑ w j  y j − ∑ α i pi −1 ( x j )
j =1
i =1


y se minimiza igualando todas las derivadas parciales (respecto de los distintos alfas) a
cero. El resultado de estas ecuaciones, unido a la condición exigida a los polinomios,
conduce a un valor de los parámetros que no depende del grado de la función
polinómica elegida:
m
m
αk =
∑w
j =1
j
y j p k −1 ( x j )
∑ w [p
m
j =1
j
k −1
(x j )
]
para k = 1,..., n .
2
5.- GRADUACION PARAMETRICA: TODO EL RANGO DE EDADES.
Extenderse a todo el rango de edades, desde el primer año de vida al último posible,
supone considerar funciones más flexibles. No existen muchos intentos en esta
dirección ya que la solución más habitual lleva a dividir el rango de edades utilizando
para cada rango una adecuada función.
Una expresión debida a Heligman, L and Pollard, L.H. (1.980) es:
n
Di
qx
= ∑ Ai e − Bi [ f i ( x ) −Ci ] .
1 − q x i =1
Para utilizar esta fórmula hay que determinar el número de sumandos, determinar la
función y ajustar los parámetros resultantes. En la población de Australia se utilizó la
expresión:
2
C
qx
= A ( x + B ) + De − E (ln x −ln F ) + GH ( x − x0 ) .
1 − qx
Se trata de una función continua y que toma valores entre cero y uno, se aplica a todo el
rango de edades (aunque no incluya muchos parámetros), y tiene una deseable
interpretación demográfica: el primer sumando es una exponencial de crecimiento
rápido que indica el descenso de mortalidad en los primeros años; el segundo sumando
recoge mediante una función similar a la lognormal la mortalidad por accidentes; el
tercer sumando manifiesta la mortalidad en edades avanzadas con una ley de Gompertz.
El significado de los parámetros se detalla a continuación. El parámetro A tiene un valor
semejante al que toma la probabilidad de fallecimiento durante el primer año de vida. El
parámetro B mide la localización de la mortalidad en el primer año de vida, teniendo
efecto sólo a la edad de cero años. El parámetro C valora la disminución de la
probabilidad de muerte en la infancia (edades superiores al año). El parámetro D mide
la magnitud de la típica “joroba de accidentes” para individuos jóvenes. El parámetro E
es inverso a la dispersión. El parámetro F localiza el máximo de la mencionada
“joroba”. El parámetro G refleja el nivel base en la mortalidad senil, esto es, la
mortalidad de tipo adulta-senil que se considera existe al nacer. El parámetro H indica el
tanto de aumento de la mortalidad anterior para edades adultas. El parámetro x0
especifica una edad para la cual q x = 0'5 , muy próxima a la máxima considerada (la
edad que se suele representar como w).
El modelo de Carriere, J.F. (1.992 y 1.994) se basa en una mixtura de funciones de
supervivencia:
n
S ( x) = ∑ wk S k ( x) .
k =1
Cada función de la mixtura representaría un tramo de edad y sus ponderaciones
indicarían las posibilidades de fallecimiento de cada nueva vida en esos tramos de edad.
Carriere sugiere aplicar una mixtura de tres funciones: para la niñez una función de
Weibull, para la adolescencia una inversa Weibull o un inversa Gompertz, y para edades
adultas una función de Gompertz. El modelo resulta con ocho parámetros, igual que el
modelo ya mencionado de Heligman y Pollard.
6.- SPLINES: AMPLIO O TODO EL RANGO DE EDADES.
Los splines suponen una solución para ajustar funciones sencillas a un amplio rango o a
todo el rango de edades. Aunque no es una función única para todo el rango de edades,
sí se trata de un conjunto de funciones polinómicas con cierta “coherencia” conjunta.
Esta coherencia se tiene por la condición exigida en los “nudos” o puntos de unión entre
funciones: las funciones polinómicas debe ser derivables hasta un orden menos que el
grado del polinomio que se tenga (siendo igual el resultado en cada nudo). No hay
reglas generalmente admitidas para determinar el número de nudos y la fijación del
punto o lugar de cada nudo. Cuantos más nudos haya, mayor aproximación existirá
entre los valores iniciales y los graduados.
7.- AJUSTE Y EVALUACIÓN
Para ajustar las funciones, en la graduación por fórmula matemática, se utilizan varios
criterios, destacan: regresión lineal simple por mínimos cuadrados (más utilizado con
splines), regresión no lineal por aproximación con series de Taylor, máxima
verosimilitud y mínima chi-cuadrado.
Publicado por U.N.E.S.P.A., una tabla de mortalidad para la población española ha
utilizado la forma funcional de Makeham y fue ajustada por regresión mínimo
cuadrática. Se trata del trabajo de Fernández, M.J. y Prieto Pérez, E. (1.994).
También adecuado es el método de máxima verosimilitud. En el trabajo de Chan, L.K.
and Panjer, H.H. (1.983) se recomienda y se expone su uso para modelos de decremento
simple y de decremento múltiple, para muestras completas e incompletas, con datos
agrupados y sin agrupar. Supone una ventaja sus propiedades asintóticas (insesgo,
mínima varianza, normalidad) que facilitan la obtención de la matriz de covarianzas de
los parámetros α subyacentes en las fórmulas que se utilicen:
−1
  ∂ 2 L(α ) 
 .
Cov(α ) = − E 

α
α
∂
∂
  i j 
La distribución para el número de muertes será la binomial, Poisson o, por
aproximación, la normal (comentadas en la estimación de mortalidad) lo que guía a la
verosimilitud. Los parámetros se sustituyen por las funciones a ajustar que
correspondan.
En caso de pólizas duplicadas, se transforman los datos (antes de incluirlos en el
modelo) dividiendo número real de muertes y exposiciones al riesgo de muerte entre un
factor de corrección conocido como “ratio varianza”,
∑i i 2 f xi
rx =
,
∑ if xi
i
siendo f xi la proporción de asegurados para la edad x que tienen i pólizas, con lo que si
no hay duplicaciones el ratio es uno y si hay es mayor que uno. La varianza queda
entonces multiplicada por el “ratio varianza” como forma de compensar el incremento
de dispersión que supone la aparición de pólizas duplicadas.
En la graduación clásica, una vez seleccionada la fórmula y tomando, por ejemplo, un
ajuste por máxima verosimilitud, permanece el problema de determinar el número de
parámetros que se desea tenga la función elegida.
La solución a este problema se puede obtener analizando graduaciones con la misma
fórmula pero con número de parámetros diferentes como si se tratara de comparar dos
graduaciones, con número igual de parámetros pero siendo cero varios parámetros de la
graduación basada en la función de menos parámetros.
El test “ratio verosimilitud” proporciona un estadístico de utilidad para este caso.
Permite determinar si se tiene una mejora significativa al añadir más parámetros.
Si se suponen dos funciones con n+k parámetros, con k parámetros igual a cero en una
de ellas, se genera un estadístico que compara los valores máximos de las
verosimilitudes:
 L(n + k ) 
D(k ) = 2[log L(n + k ) − L(n)] = 2 log 
.
 L( n) 
El estadístico se comporta como una chi-cuadrado con k grados de libertad.
Una discusión sobre su aplicación en mortalidad está en Cox and Oakes (1.984).
Una interesante aplicación de pruebas para aceptar o rechazar una determinada
graduación puede encontrarse en Navarro, Eliseo (1.992). El análisis se dedica a
examinar las desviaciones entre valores estimados y valores graduados a lo largo de
toda la secuencia. Se considera que las desviaciones tienen que estar distribuidas de
forma aleatoria (no hay errores sistemáticos en toda la secuencia de valores graduados)
y su distribución concreta será coherente con las hipótesis iniciales utilizadas (según
modelo binomial, Poisson o normal empleado).
Atendiendo a estas directrices generales se elaboran unas pruebas para las desviaciones
absolutas y relativas entre estimaciones iniciales y corregidas, considerándolas
individualmente y dentro de la secuencia total. Los tests o pruebas que se mencionan
son: test de intervalos de confianza, test de desviaciones relativas, test de desviaciones
acumuladas, test de signos, test de cambio de signo, test de la chi-cuadrado, test de
Kolmogorov-Smirnov.
8.- DINAMICIDAD DE LA MORTALIDAD.
Parece evidente la evolución en el tiempo cronológico del fenómeno de la mortalidad.
En el trabajo de MacDonald, A.S. et al. (1.998) se aportan y analizan estudios empíricos
para comparar la evolución y las últimas tendencias apreciadas en la mortalidad en
diferentes países. Esto indica que un estudio de mortalidad en base a datos presentes
debe completarse, cuando se busque cierta validez a lo largo del tiempo, con una
proyección hacia futuro.
A nivel teórico presenta interés el artículo de Janssen, J. and Skiadas, C.H. (1.995). En
este trabajo se destacan y se sigue a continuación, por su aplicación en el campo
actuarial, las investigaciones de Benjamin, B. and Soliman, A.S. (1.995) y de Felipe
Checa, María de los Ángeles y Guillén Estany, Montserrat (1.999).
Una vez realizadas las estimaciones definitivas, para proceder a modelizar la mortalidad
considerando el tiempo de calendario se puede proceder de tres formas: según
proyecciones para cada valor de la tabla de mortalidad, según proyecciones del modelo
estructural tomado en la tabla de mortalidad y según una proyección atendiendo a las
causas del fallecimiento.
Los métodos basados en proyecciones para cada valor de la tabla de mortalidad
utilizan modelos paramétricos para cada edad en los que aparece la variable tiempo
calendario de forma explícita. Son modelos del tipo: q x (t ) = f ( x,α , t ) ,
donde x es la edad que se estudia, t la variable tiempo calendario y α un vector de
parámetros. Exigen un seguimiento en el tiempo de los estudios de mortalidad.
En las tablas de mortalidad alemanas DAV1.994R se emplea el modelo: q x (t ) = a x bxt .
Se linealiza tomando logaritmos y se aplica el método de mínimos cuadrados ordinarios.
Los parámetros estimados determinan el modelo que proyecta la probabilidad de muerte
según se introducen valores a la variable t.
En las tablas españolas, realizadas para U.N.E.S.P.A. por Fernández Plasencia, M.J. y
Prieto Pérez, Eugenio (1.994) para proyectar la mortalidad se utiliza un modelo para la
esperanza de vida: e x (t ) = a x + bx 1 − e d xt ,
que permite obtener la probabilidad de muerte mediante la relación
0'5 − e x +1
qx =
e x − 0'5
En las tablas de mortalidad suizas GRM/GRF1.995 se emplea el modelo:
q x (t ) = q x (t 0 )·e − d x (t −t0 ) ,
siendo t0 el tiempo calendario inicial.
[
]
De forma conjunta pero con un cambio de escala, se consideran la edad y el tiempo en
el trabajo de Haberman, S.; Hatzopoulos P. and Renshaw, A.E. (1.996), mediante una
expresión referida al tanto instantáneo de mortalidad y que contiene catorce parámetros:
3
3
5



 
 
µ x (t ) = exp b0 + ∑ b j L j ( x' ) exp  a1 + ∑ c1 j L j ( x' ) t '+ a2 + ∑ c2 j L j ( x' ) t '2  .
j =1
j =1
j =1


 
 

Todos estos modelos suponen la ausencia de cambios estructurales en el tiempo en el
que se toman las muestras y en el tiempo futuro en que se proyecta. En estos casos, sólo
la simulación de escenarios ayudaría a analizar el impacto futuro de cambios
estructurales.
Los métodos de estimación que se utilizan en la estimación de los parámetros suponen
perturbaciones aleatorias con comportamiento normal de media cero. Esta hipótesis es
discutible debido a las transformaciones logarítmicas que se realizan en los modelos.
Además, se debería probar la no existencia de autocorrelación.
Los métodos basados en proyecciones del modelo estructural utilizado en la tabla de
mortalidad obtienen las probabilidades de fallecimiento proyectadas mediante cambios
en los parámetros del modelo.
El modelo más empleado en este tipo de proyecciones es el ya mencionado modelo de
Heligman-Pollard. Un ejemplo se encuentra en Felipe Checa, María de los Ángeles y
Guillén Estany, Montserrat (1.999): se estima la probabilidad de muerte por mínimos
cuadrados no lineales ponderados (según la inversa de la probabilidad de muerte
observada) para todo el rango de edades y cada uno de los años calendario, después se
aplica el análisis univariante de series temporales (ARIMA) para cada uno de los
parámetros de la ley Heligman-Pollard con el fin de obtener predicciones de todos ellos,
éstas predicciones determinan las predicciones de las probabilidades de muerte (para
cada edad en el calendario futuro).
A pesar del interés de las proyecciones del modelo estructural, persiste el problema de
la invalidez ante cambios posteriores al periodo de observación. Esta situación se debe
al uso de series temporales (los parámetros tienen comportamiento autorregresivo).
En la práctica, avances médicos relevantes o epidemias significativas impiden la validez
de las proyecciones efectuadas.
Los métodos basados en proyecciones atendiendo a las causas del fallecimiento
argumentan que podrían obtenerse mejores predicciones de mortalidad futura
proyectando por separado la mortalidad debida a ciertos grupos de enfermedades y la
mortalidad un residuo de fallecimiento por causas varias. Finalmente, se sumarían las
distintas proyecciones.
Benjamin, B. and Soliman, A.S. (1.995) utilizan la clasificación de enfermedades de la
O.M.S., las causas se consideran excluyentes y se deja una causa definida como “resto
de causas”.
La relación entre la probabilidad general de muerte y la probabilidad según las
diferentes causas de muerte (I,II,VII,VIII,IX,XII,R) se supone de la forma:
ln q xt = ln q xt ( I )·ln qxt ( II )·ln qxt (VII )·
·ln q xt (VIII )·ln qxt ( IX )·ln qxt ( XII )·ln q xt ( R).
La evolución en el tiempo calendario se toma como:
ln q x (i ) = ln a x (i ) + t ln bx (i ) con i = I , II , VII , VIII , IX , XII , R .
Evidentemente, se necesita información detallada de la causa de muerte para realizar
este análisis. Presenta los inconvenientes mencionados en el método denominado de
proyección para cada valor de la tabla (sería una variante realmente).
BIBLIOGRAFÍA.
Benjamin, B. and Pollard, J.H. (1.980). The analysis of Mortality. Heinemann. Londres.
Benjamin, B. and Soliman, A.S. (1.995). Mortality on the move. Ed. City University
Print. Londres.
Betzuen Zalbidegoitia, Amancio; Felipe Checa, Angie y Guillén Estany, Monserrat
(1.997). Modelos de tablas de mortalidad en España y situación actual. Anales del
Instituto de Actuarios Españoles. Tercera época, Núm.3, Págs.:79-104.
Carriere, J.F. (1.992). Parametric models for life tables. Transactions of the Society of
Actuaries. Vol.44, Págs.:77-99.
Carriere, J.F. (1.994). A select and ultimate parametric model. Transactions of the
Society of Actuaries. Vol.46, Págs.:75-97.
Cox and Oakes (1.984). Analysis of Survival data. Ed. Chapman & Hall. London.
Elandt-Johnson, Regina C. and Johnson Norman, L. (1.980). Survival models an data
analysis. Wiley. New York.
Felipe Checa, María de los Ángeles y Guillén Estany, Montserrat (1.999). Evolución y
predicción de tablas de mortalidad dinámicas para la población española. Cuadernos de
la Fundación. Editorial Mapfre Estudios.
Fernández Plasencia, M.J. y Prieto Pérez, Eugenio (1.994). Tablas de mortalidad de la
población española de 1.950 a 1.990. Tabla proyectada del año 2.000. Tablas con y sin
margen de seguridad. UNESPA. Madrid.
Forfar, D.O.; McCutcheon, J.J. and Wilkie, A.D. (1.988). On the graduation by
mathematical formula. Journal of the Institute of Actuaries. Núm.115, Págs.:1-135.
Haberman, S. and Renshaw, A.E. (1.997). Dual modelling and select mortality.
Insurance: Mathematics and Economics. Vol.19, Núm.2, Págs.:105-126. North-Holland.
Haberman, S.; Hatzopoulos P. and Renshaw, A.E. (1.996). The modelling of recent
mortality trends in United Kingdom male assured lives. British Actuarial Journal. Vol.2,
Núm.2, Págs.:449-478.
Haberman, S.; Hatzopoulos P. and Renshaw, A.E. (1.997). On the duality of
assumptions underpinning the construction of life tables. Astin Bulletin. Vol.27, Núm.1,
Págs.:5-22.
Heligman, L and Pollard, L.H. (1.980). The age pattern of mortality. Journal of the
Institute of Actuaries. Núm.107, Págs.:49-80.
Janssen, Jacques and Skiadas, C.H. (1.995). Dynamic modelling of life table data.
Applied Stochastic Models and Data Analysis. Vol.11, Págs.:35-49.
London, D. (1.985). Graduation: the revision of estimates. Actex. Connecticut.
López de la Manzanara Barbero, Juan y López Cachero, Manuel (1.996). Estadística
para actuarios. Editorial Mapfre. Madrid.
MacDonald, A.S. et al. (1.998). An international comparison of recent trends in
poputation mortality. British Actuarial Journal. Vol.4, Núm.1, Págs.:3-143.
Navarro, Eliseo (1.992). Tablas de mortalidad de la población española 1.982.
Metodología y fuentes. Editorial Mapfre. Madrid.
Renshaw, A.E. (1.991). Actuarial graduation practice and generalised linear and nonlinear models. Journal of the Institute of Actuaries. Núm.118, Vol.2, Págs.295-312.
Renshaw, A.E. (1.992). Joint modelling for actuarial graduation and duplicate policies.
Journal of the Institute of Actuaries. Núm.119, Vol.1, Págs.69-85.
Sánchez López, José María (2.001). Cuantificación de riesgos y análisis global de la
empresa aseguradora de vida, Dykinson, S.L., Madrid.
Sánchez López, José María (2.001). Construcción de tablas de mortalidad, Revista
Española de Seguros. Núm.106, pp.:297-306. Madrid.
Stephens, M.A. (1.974). EDF statistics for goodness of fit and some comparisons.
Journal of the American Statistical Association. Núm.69, Págs.:730-737.
Stephens, M.A. (1.977). Goodness of fit for the extreme value distributions. Biometrika.
Núm.64, Vol.3, Págs.:583-588.
Yuen, Kam C. (1.997). Comments on some parametric models for mortality tables.
Journal of Actuarial Practice. Vol.5, Núm.2, Págs.:253-266.
Descargar