un análisis de la eficacia de los métodos basados en ratios de

Anuncio
Un análisis de la eficacia de los métodos basados en ratios de enlace, en la estimación de la Provisión para
Siniestros Pendientes.
UN ANÁLISIS DE LA EFICACIA DE LOS MÉTODOS
BASADOS EN RATIOS DE ENLACE, EN LA
ESTIMACIÓN DE LA PROVISIÓN PARA SIENIESTROS
PENDIENTES
Santiago Leguey Galán,
Ana Belén Rabadán Gómez
Universidad Rey Juan Carlos
RESUMEN
Entre los métodos existentes en la ciencia actuarial para el cálculo de la
Provisión para Siniestros Pendientes destacan los basados en ratios de enlace. La
asunción básica sobre la que se fundamentan es la denominada hipótesis de estabilidad,
que asume que los incrementos de la siniestralidad tramitada entre periodos
consecutivos son constantes para todos los periodos de origen de siniestros.
Este trabajo propone una metodología basada en Montecarlo para la evaluación
de su idoneidad a priori, desde una perspectiva estadística y a partir de la generación de
datos coherentes de siniestralidad.
La eficacia del método de cálculo de la provisión depende de manera directa del
cumplimento de la hipótesis y, por tanto, de la variabilidad experimentada en los
incrementos de la siniestralidad entre los periodos de origen. La efectividad del método
está supeditada al tamaño de dichas desviaciones. Para el análisis de la validez del
método, en el cálculo de la provisión, se propone el establecimiento de una estructura
funcional de dependencia entre el error que comete y dicha variabilidad.
XIII Jornadas de ASEPUMA
1
Santiago Leguey Galán, Ana Belén Rabadán Gómez
1. INTRODUCCIÓN
Para garantizar la cobertura de los gastos futuros debidos a siniestros, la empresa
aseguradora debe fijar la cuantía monetaria a reservar en las denominadas provisiones
técnicas para siniestros pendientes a cierre del ejercicio económico, cuando se
determina el beneficio del mismo. De entre los métodos diseñados por la ciencia
actuarial para su cálculo, este trabajo centra su estudio en los basados en ratios de
enlace. Estos realizan el cálculo de la provisión sobre la base de información histórica
referida a cuantías de siniestros Ci , j dispuestas en una matriz triangular, denominada
triángulo de siniestros, donde las filas son referidas a los periodos donde se origina un
siniestro (periodo de origen i) y las columnas a los periodos posteriores a este en los que
es notificado o tramitado (periodo de desarrollo j). Y los ratios de enlace Fj son
definidos como las tasas de incremento en la cuantía acumulada de siniestralidad
notificada en un periodo de origen de siniestros y entre cada par de periodos de
desarrollo consecutivos. Entonces, estimando el valor de estos ratios se consigue hallar
la cuantía de provisión para cada periodo como PSPi = Ci , j ( Fˆ j +1 ⋅ Fˆ j + 2 ⋅ ....... − 1) .
La hipótesis básica sobre la que se fundamentan estos métodos es la denominada
hipótesis de estabilidad, que puede definirse como que para todo par de periodos de
desarrollo consecutivos los incrementos relativos de la siniestralidad tramitada son
constantes para todos los periodos de origen.
En este trabajo proponemos, mediante el uso de herramientas estadísticas,
investigar la idoneidad a priori de estos métodos a partir de contrastar las asunciones
básicas que los fundamentan. Específicamente, proponemos la simulación mediante el
Método Montecarlo de una matriz compuesta de ratios de enlace, o incrementos
unitarios de la siniestralidad notificada acumulada en el periodo de origen i y entre los
periodos de desarrollo j-1 y j, que definiremos como F j ,i . De este modo, podremos
conseguir información suficiente, a través de la generación de un gran número de
triángulos de siniestros, y la obtención de los datos completos mediante un
procedimiento que permita generar coherentemente los valores del triángulo inferior
derecha.
La eficacia del método de cálculo de la provisión depende del cumplimiento de
la hipótesis de estabilidad y, en consecuencia, de la variabilidad de los ratios de enlace
entre los periodos de origen. Por tanto, su efectividad está sujeta a la cuantía de dichas
2
XIII Jornadas de ASEPUMA
Un análisis de la eficacia de los métodos basados en ratios de enlace, en la estimación de la Provisión para
Siniestros Pendientes.
desviaciones. En este sentido, planteamos relacionar formalmente la eficacia del método
con la medida de variabilidad de los ratios de enlace.
Presentaremos la metodología para un caso concreto, por tanto, los resultados
obtenidos no serán generalizables. Sí lo será el planteamiento del método utilizado para
la evaluación de la eficacia.
2. SIMULACIÓN DE UNA MATRIZ DE RATIOS DE ENLACE
El caso a estudiar supone siete periodos de origen y desarrollo para el triángulo
de siniestros, referido a la siniestralidad acumulada. Esto se traduce, para nuestro
procedimiento de generación, en simular siete realizaciones distintas, referidas a los
periodos de origen, de un vector compuesto de seis variables aleatorias ratios de enlace.
Además, asumimos una distribución normal para dicho vector aleatorio. Es decir:
 F1

F2
F =
K K

F
 6
T


 ≡ N ( β , Τ)
6




.
Para la generación de una matriz de ratios de enlace establecemos como valores
de partida un vector de medias y una matriz de varianzas y covarianzas teórica. La
determinación de dichos parámetros iniciales se realiza a partir de los valores de un
vector de proporciones de siniestralidad notificada en cada periodo de desarrollo, esto es
(P , P P L , P ) .
0
1, 2,
6
Añadimos que todos los periodos son cerrados, es decir, la
siniestralidad originada en un periodo queda totalmente notificada en los 7 periodos
siguientes, pues nuestro caso requiere de datos completos. Por tanto, la proporción
notificada en el primer periodo se obtiene por sustracción. Y para la asignación de
valores a las componentes del vector de proporciones se tiene en consideración el rasgo
de decrecimiento en la proporción de cuantía de siniestralidad notificada, a medida que
se avanza en los periodos de desarrollo, característica común a todo ramo de seguro.
Fijados dichos valores, tal que Pj ∈ (0,1) y Pj < Pj −1 , se generan de modo aleatorio las
siete realizaciones correspondientes a cada periodo de accidente, y se obtiene la matriz
de proporciones P7×7 .
XIII Jornadas de ASEPUMA
3
Santiago Leguey Galán, Ana Belén Rabadán Gómez
A partir de esta matriz se consigue una matriz de ratios de enlace teórica, F7×6 ,
que responde a un comportamiento coherente de siniestralidad, teniendo en cuenta que:
j
∑P
k ,i
F j ,i =
k =0
j −1
∑P
k ,i
k =0
.
Finalmente, serán los estimadores insesgados del vector de esperanzas y matriz
de varianzas y covarianzas de dicha matriz de ratios de enlace los parámetros teóricos
de partida. Esto es: β 6×1 , con β j = E ( F j ) para j=1,...,6; y Τ6×6 , donde τ jj = Var ( Fj ) y
τ jk = Cov( Fj , Fk ) para j=1,…,6 y k=j+1,…,6.
De este modo, a partir de un vector de proporciones, queda explicitada una
matriz de varianzas y covarianzas teórica Τ , representativa de un comportamiento
posible y coherente de siniestralidad notificada.
Conseguidos los valores iniciales de β 6×1 y Τ6×6 , puede procederse a la
simulación de una matriz de ratios de enlace completa por el método de Montecarlo,
utilizando las distribuciones condicionadas de cada variable a las anteriores.
De este modo ya tendremos todos los valores simulados de los seis ratios de
enlace y, en consecuencia, la matriz completa de datos, de tal modo que se ha respetado
la estructura teórica de variabilidad y dependencia entre los ratios de enlace, descrita por
Τ . Es decir, la matriz simulada de ratios de enlace será de la forma:
 F10

F
F =  11


 F16
F20 L
F21 L
O
O
F60 

F61 
M

F66 
Repetimos el procedimiento de simulación para distintas matrices teóricas, con
lo cual recorremos distintas posibilidades de comportamientos de siniestralidad
notificada, a partir de la distinta asignación de valores a las proporciones. Y, para cada
matriz teórica generamos una muestra de matrices simuladas.
En la realidad, sólo son conocidos los ratios de enlace de la zona superior
izquierda, es decir, aquellos F j ,i tal que j<7-i que forman la matriz triangular o
incompleta. Por tanto, sólo contamos con esos datos para realizar el cálculo de la
provisión.
4
XIII Jornadas de ASEPUMA
Un análisis de la eficacia de los métodos basados en ratios de enlace, en la estimación de la Provisión para
Siniestros Pendientes.
De este modo, la matriz simulada completa nos proporcionará el valor verídico
de la provisión, que denominaremos provisión simulada, y la matriz incompleta nos
dará el valor de provisión observada tras la aplicación del método basado en ratios de
enlace. La comparación de ambos nos permitirá la construcción de la medida del error.
3. CONSTRUCCIÓN DE UNA MEDIDA DEL ERROR
3.1. Cálculo de la provisión simulada
Para obtener la provisión para cada periodo de origen solo debe calcularse la
cantidad total de siniestralidad y sustraerle la cantidad notificada ya conocida, por los
datos del triángulo. La cantidad conocida, bajo el supuesto de que Ci 0 = 1 , será igual
6 −i
a: C = ∏ F ji para i=0,…,5 y C6c = 1 . Y la cantidad total real, utilizando la matriz
c
i
j =1
6
completa de ratios de enlace simulada, será: CiTR = ∏ F ji para i=0,…,6.
j =1
En consecuencia, la provisión real para cada periodo de origen quedará
6
PSPi R = CiTR − CiC para i=0,…,6; y la provisión total real será PSP R = ∑ PSPi R .
i =0
3.2. Cálculo de la provisión con el método de cálculo
Para obtener la cantidad total de siniestralidad para cada periodo de origen según
el método, en primer lugar debemos obtener las estimaciones de los ratios de enlace
entre cada par de periodos de notificación utilizando la matriz triangular incompleta. En
concreto, según el método basado en ratios de enlace Chain Ladder y bajo el mismo
supuesto Ci 0 = 1 , tenemos que:
∑F
1i
CL
1
F
=
i=0
6
6
 j

Fj 0
∑
 ∏ Fji 
∏
i = 0  k =1

CL
k =1
= (6− j )+1 j −1
para j=2,..,5 y F6 = 5
.


Fj 0
∏
∑
 ∏ Fji 
k =1
i = 0  k =1

(6 − j ) +1
5
, F jCL
La cantidad conocida Cic para i=0,…,6 es igual que en el caso anterior. Lo que
cambia es la cantidad total de siniestralidad, que ahora será la estimada según los
valores de los ratios de enlace del método Chain Ladder.
XIII Jornadas de ASEPUMA
5
Santiago Leguey Galán, Ana Belén Rabadán Gómez
Para el primer periodo de origen, donde la siniestralidad ha sido registrada en su
6
totalidad, encontramos que: C0TE = C0C = ∏ F j 0 . Y para el resto de periodos de origen:
j =1
CiTE = CiC
6
∏
F jCL para i=1,…,6. Entonces, la provisión estimada, mediante el método
j = 6 −i +1
Chain Ladder, para cada periodo de origen es en este caso, PSPi E = CiTE − CiC para
6
i=0,…,6; y la provisión total estimada será PSP E = ∑ PSPi E .
i =0
3.3. Medida del error en la provisión
Definimos la medida del error como la tasa de desviación porcentual en la
estimación de la provisión con el método basado en ratios de enlace, respecto del valor
verdadero de la provisión. Esto es:
EPSP =
PSP R − PSP E
PSP R
.
La medida del error es, por tanto, universal y no depende de las cuantías de la
siniestralidad.
La muestra de matrices de ratios de enlace asociadas a cada matriz teórica de
varianzas y covarianzas, proporciona a su vez una muestra de valores para el error.
Tomaremos como medida de representación la media. Es decir, elegimos como
estimadores de la esperanza y varianza de la medida del error, la media aritmética y la
varianza muestral, respectivamente. Es decir:
·( EPSP ) = EPSP
E
· ( EPSP ) = S 2 ( EPSP)
Var
La bondad de la estimación del error se comprueba mediante un doble requisito.
Por un lado, requerimos un tamaño muestral mínimo de cinco mil, es decir, simulamos
un número mínimo de cinco mil matrices simuladas a partir de cada matriz teórica. Y,
por otro lado, realizamos una verificación práctica de la consistencia a través del
siguiente criterio de convergencia:
Si llamamos m al número de iteraciones o simulaciones a partir de un β y Τ
teóricos, el valor que converge en media de la variable X será x m tal que:
6
XIII Jornadas de ASEPUMA
Un análisis de la eficacia de los métodos basados en ratios de enlace, en la estimación de la Provisión para
Siniestros Pendientes.
x m − x m −1
< 0, 005 y además
x m −1
sm2 ( X ) − sm2 −1 ( X )
sm2 −1 ( X )
< 0, 005 , con m ≥ 5000 .
Entonces, para X = EPSP , el valor que asociaremos a la matriz teórica será
EPSP m con una varianza estimada de sm2 ( EPSP ) .
4. ESTIMACIÓN DE LAS MEDIDAS DE VARIABILIDAD
Para estimar las varianzas y covarianzas de la matriz Τ utilizamos los
estimadores analógicos, es decir, utilizando los valores que proporciona la matriz
triangular. En concreto, se definen como s jj para las varianzas y s jk para las
covarianzas, que para j=1,...,5 y k=j+1,...,5 se obtienen del siguiente modo:
7− j
s jj =
∑(F
ji − F j
i =0
7 − j −1
)
7−k
y s jk =
∑(F
)(
ji − F j ⋅ Fki − Fk
i =0
7 − k −1
)
7− j
, donde F j =
∑F
ji
i =0
7− j
.
(1)
Puede comprobarse que a medida que avanzamos en los periodos de notificación
contamos con menos observaciones en nuestro triángulo.
Ahora se trata de verificar la consistencia de las estimaciones analizando la
convergencia de las matrices teóricas a las estimadas. Con ello queremos determinar
cuál es el límite en periodo de notificación, a partir del cual perdemos la consistencia en
las estimaciones, por la falta de datos, y, por tanto, ya no contamos con buenos
estimadores para las medidas de dispersión.
Los criterios propuestos para la verificación de la bondad de la estimación son
los dos siguientes: El primer requisito se fundamenta en el coeficiente de variación de
las estimaciones. Concretamente, en valor absoluto, establecemos el límite razonable en
la unidad. Esto es:
CV =
sm2 ( X )
xm
<1
Y el segundo criterio se elabora en base a un contraste de hipótesis con el cual
comprobar para qué variables la estimación de la media de la medida de dispersión no
difiere significativamente de su valor teórico. Por tanto, bajo el supuesto de normalidad
y fijando un nivel de significación del 5%, este criterio será satisfecho por aquellas
medidas que verifiquen:
XIII Jornadas de ASEPUMA
7
Santiago Leguey Galán, Ana Belén Rabadán Gómez
x − XT
d ( xm , X ) = m
< 1,96 , donde σ ( xm ) =
σ ( xm )
sm2 ( X )
.
m −1
De dicho análisis, se concluye que pueden obtenerse buenas estimaciones de las
siguientes medidas de dispersión, son τ 11 ,τ 22 ,τ 33 ,τ 12 y τ 13 .
En consecuencia, estas serán las medidas susceptibles de ser estimadas con este
procedimiento. Y, por tanto, las que podremos emplear con una cierta garantía para la
consecución de nuestro objetivo, esto es la estimación de la tasa de desviación
porcentual que comete el método.
5. ESTRUCTURA FUNCIONAL DE DEPENDENCIA ENTRE EL
ERROR Y LA VARIABILIDAD DE LOS RATIOS
5.1. Relación entre el error porcentual y la variabilidad teórica
Tratamos de explicar el error a través de las medidas de dispersión propuestas.
La primera labor que realizamos es identificar qué medidas de dispersión y de qué
periodos tienen un mayor poder explicativo. Al analizar las correlaciones, se desprende
que existe un mayor nivel de asociación, con un coeficiente de correlación de Pearson
que supera el 60%, entre el error y las medidas de variabilidad referidas a los tres
primeros periodos de notificación.
Por tanto, intuimos que son los primeros periodos los que influyen de manera
más directa en la eficacia del método de cálculo. En efecto, este hecho es de una gran
coherencia con el problema, ya que es en esos periodos iniciales donde existe una
mayor proporción de siniestralidad notificada.
La investigación de la relación entre la variabilidad teórica y la eficacia se hará
mediante regresión. Buscamos, de este modo, la forma de la expresión funcional que
nos relacione la medida del error EPSP m con las medidas de variabilidad. Tras el
análisis encontramos como mejor modelo lineal, con un valor para el coeficiente de
determinación de 81,8%, el siguiente:
·
EPSP
= 3, 267 ⋅τ 11 + 10, 694 ⋅τ 22 + 15,145 ⋅τ 33 − 3,539 ⋅τ 12
Tras el análisis de esta estructura funcional podemos comprobar, por un lado,
que existe una relación creciente entre el error porcentual en el cálculo de la provisión y
8
XIII Jornadas de ASEPUMA
Un análisis de la eficacia de los métodos basados en ratios de enlace, en la estimación de la Provisión para
Siniestros Pendientes.
las medidas de variabilidad de los tres primeros ratios. Y, por otro lado, que se observa
una relación negativa entre el error y las medidas de dependencia entre ratios, estas son
las covarianzas. Estos resultados pueden explicarse por las siguientes circunstancias: Es
en los primeros periodos donde tienen lugar las mayores proporciones de siniestralidad
notificada y además en una relación negativa entre los ratios de enlace, dado que si
existe una mayor proporción de siniestralidad notificada en un periodo necesariamente
será menor en otro.
5.2. La estimación del error
Pero, en la práctica, no es posible conocer la matriz teórica de varianzas y
covarianzas, con lo cual no estaremos habilitados a utilizar el modelo teórico anterior.
Por este motivo, surge la necesidad de hacer uso de los estimadores anteriores, cuya
bondad ha sido analizada y garantizada.
En definitiva, el modelo que nos dará idea de la eficacia del método de cálculo
es:
·
$
EPSP
= f (Τ
) = f (S ) =
(2)
= f (τˆ11 , τˆ22 , τˆ33 , τˆ12 ) = 3, 267 ⋅ s11 + 10, 694 ⋅ s 22 + 15,145 ⋅ s 33 − 3, 539 ⋅ s12
5.3. Cálculo del margen admisible para el error
·
El siguiente propósito es comprobar si el error estimado, EPSP
, supera o no un
determinado porcentaje, que exceda al debido únicamente a la aleatoriedad y, por tanto,
refleje el incumplimiento de la hipótesis. El valor asignado a dicho porcentaje máximo
de error es una decisión que debe tomar la compañía aseguradora. Para este estudio
estableceremos la cota máxima del error en un 10%.
Para realizar la verificación de si dicha cota es rebasada o no, utilizando el
·
modelo anterior EPSP
= f ( S ) , podemos plantear un contraste de hipótesis, con dos
estructuras distintas:
a)
H 0 : f ( S ) ≤ 0,1
H1 : f ( S ) > 0,1
b)
H 0 : f ( S ) ≥ 0,1
H1 : f ( S ) < 0,1
Lo que diferencia estos dos planteamientos es el establecimiento de la
hipótesis nula. En el primer caso tenemos una confianza previa en la eficacia del
XIII Jornadas de ASEPUMA
9
Santiago Leguey Galán, Ana Belén Rabadán Gómez
método, mientras que en el segundo partimos de la creencia de que los datos de
siniestralidad no cumplen el supuesto de estabilidad.
Para determinar la región crítica de estos contrastes unilaterales, necesitamos
una estimación de la variabilidad que presenta el error porcentual según el modelo.
Con objeto de obtener la desviación típica de las estimaciones del modelo, que
notamos como σ ( f ( S )) , replicamos el procedimiento de simulación anterior y
generamos diez mil valores de f ( S ) . Esto nos permite estimar σ ( f ( S )) como la
cuasidesviación típica muestral, llegando a que σ·( f ( S )) = 0, 03118 .
Entonces, con el anterior valor estimado de la desviación típica, determinamos
las regiones críticas, para un nivel de confianza del 95%, son:
Para el caso a):
{ f ( S ) > 0,1 + σ ( f (S )) ⋅ z } = { f ( S ) > 0,1 + 0, 03118 ⋅ (1, 645)}
Para el caso b):
{ f ( S ) < 0,1 − σ ( f (S )) ⋅ z } = { f ( S ) < 0,1 − 0, 03118 ⋅ (1, 645)}
0,05
0,05
En conclusión, denotando como ·f ( S ) la estimación del error porcentual, dado
un triángulo de siniestros cualquiera con las características de nuestro ejemplo,
podemos establecer las siguientes pautas de actuación:
1º) Calculamos las estimaciones de los argumentos de la función f ( S ) según las
expresiones (1).
2º) Obtenemos la estimación de ·f ( S ) según la expresión (2).
3º) Evaluamos si f ( S ) se encuentra dentro del margen admisible para el error,
sabiendo que:
a) Bajo la creencia de que el modelo es eficaz en el cálculo de la provisión (a), si
·f ( S ) > 0,15 rechazamos la hipótesis nula y, por tanto, el método para ese ejemplo
supera la cota de error admitida por lo cual existe fundamento para cuestionar la
estimación de provisión que ofrezca.
b) Bajo la premisa inicial de que el modelo no será eficaz en el cálculo de la
provisión (b), si ·f ( S ) < 0, 05 rechazamos la hipótesis nula, lo que indicaría que el
método comete un error mínimo y, por tanto, no puede descartarse su efectividad.
10
XIII Jornadas de ASEPUMA
Un análisis de la eficacia de los métodos basados en ratios de enlace, en la estimación de la Provisión para
Siniestros Pendientes.
6. CONSIDERACIONES FINALES
La metodología desarrollada en este trabajo se ha desarrollado para un ejemplo.
En concreto para un triángulo de siniestros con siete periodos y asumiendo normalidad
para las variables aleatorias ratios de enlace. Por este motivo las funciones que se han
encontrado explicativas del error de la provisión a través de las medidas de dispersión,
no son trasladables para otros casos particulares.
Además, en este caso concreto, debemos notar que los resultados obtenidos, tras
el análisis, respecto al error en la provisión (EPSP) provienen de un proceso consistente
en miles de simulaciones hasta que se consigue la convergencia en media. Dado que
basamos nuestro análisis en adoptar este error como la variable exógena, es conveniente
tener en cuenta que el coeficiente de variación que presenta esta medida en la
simulación es del orden del 70%. Es un resultado admisible, pero no perfecto, que
simplemente no debe obviarse en virtud de una valoración correcta de los resultados.
En cualquier caso, el procedimiento plantea una metodología para la validación
de la eficacia del método, tanto para triángulos con características distintas como para
otro tipo de métodos de cálculo de la provisión.
7. REFERENCIAS BIBLIOGRÁFICAS
•
BANKS, J. (1998). (editor). Handbook of simulation: principles,
methodology, advances, applications and practice. John Wiley and sons.
•
MACK, T. y VENTER, G. (2000). “A comparison of stochastic models
that reproduce chain ladder reserves estimates”. Insurance: Mathematics and
Economics, 26, 101-107.
•
NARAYAN, P. y WARTHEN, T. (1997). “A Comparative Study of the
Performance of Loss Reserving. Methods Through Simulation”. Casualty Actuarial
Society Forum.
•
VEGAS ASENSIO, J. (1995). “Análisis metodológico de los métodos
estadísticos en el cálculo de las reservas o provisiones técnicas de prestaciones en
los seguros no vida”. Anales del Instituto de Actuarios Españoles, Tercera Época, 1,
163-199.
XIII Jornadas de ASEPUMA
11
Descargar