Modelos de Perdidas Agregadas en No

Anuncio
Modelos de Pérdidas
Agregadas No Vida
XXVI Congreso Nacional de Actuarios
Act. Patricio Belaunzarán
Modelo de pérdidas agregadas
El modelo de pérdidas agregadas tiene como objetivo obtener una función de
distribución, la cual incorpore los conceptos de frecuencia y severidad. Bajo el
supuesto de que las severidades son independientes entre sí, y éstas, a su vez,
independientes de la frecuencia, se procede al modelado por separado de ambas
variables. La determinación es igual a:
Z = X1 + X2 + X3 + … + XN
donde
Z = Pérdida agregada (siniestralidad anual)
N = Número total de siniestros en el periodo (Frec.); y
Xi = Monto de cada siniestro (Sev.)
Ambos son desconocidos por lo que deben ser modelados como variable
aleatoria.
La media de Z es igual a la frecuencia media por el monto medio. Es decir,
E(z) = E(N) * E(Xi)
Page 2
Modelo de pérdidas agregadas
Para obtener la distribución de pérdidas agregadas se realiza lo siguiente:
► Ajuste
de la distribución de frecuencia. Se parte de distribuciones probabilísticas
discretas de conteo entre las que se encuentran las siguientes: Poisson, Binomial,
Binomial Negativa y Beta-Binomial.
► Ajuste
de la distribución de severidad. Se obtienen los parámetros de las
distribuciones probabilísticas que mejor ajusten a los datos observados. A priori las
distribuciones que se proponen son las siguientes: Lognormal, Gamma y Pareto
Generalizada
Page 3
Ajuste de distribuciones de
monto de siniestros
Estimador de Máxima Verosimilitud (EMV)
►
Page 5
Presentation title
Método de Momentos.
►
Page 6
Presentation title
Modelos de frecuencia
Modelo Beta Binomial
Si disponemos de datos de frecuencias relativos a distribuciones binomiales,
de modo que,
donde
y
. Puesto que representa una proporción,
elegimos como distribución a priori una beta de primera especie, con función
de densidad;
Page 8
Modelo de Pérdidas Agregadas
►
Fuente: Documentos fFundación Mapfre
Modelo Beta Binomial
Los parámetros
y
Se establecemos que
pueden venir de la historia o de juicio experto.
y
entonces:
La función de verosimilitud basada en una muestra
por,
viene dada
Haciendo uso del teorema de Bayes, la función de densidad a posteriori es,
Page 9
Modelo de Pérdidas Agregadas
►
Fuente: Documentos fFundación Mapfre
Construcción del modelo de
pérdidas agregadas
Construcción
►
La manera de obtener la distribución de pérdidas es a
través de métodos numéricos, debido a que en este se
necesita obtener convoluciones de la distribución de
pérdida que no es tratable desde el punto de vista
analítico.
►
►
►
►
Page 11
Métodos recursivos
Métodos de inversión
Métodos de aproximación
Métodos de simulación
Modelo de Pérdidas Agregadas
VaR y TailVaR
Value at Risk (VaR)
►
Page 13
Presentation title
Tail VaR o Conditional Tail Expectation (CTE)
►
Page 14
Presentation title
Aplicación a una cartera de
Gastos Médicos
Datos
Frecuencia
Estimación de parámetros. Beta Binomial
Cifras al 31 de diciembre del 2012
Año
2009
2010
2011
2012
Número de
Siniestros
426
640
653
587
595
685
1,006
693
598
636
627
553
411
8,919
Trimestre
Qtr4
Qtr1
Qtr2
Qtr3
Qtr4
Qtr1
Qtr2
Qtr3
Qtr4
Qtr1
Qtr2
Qtr3
Qtr4
Total
Expuestos Promedio
p=
Varianza de la p
Page 16
Número de Expuestos
20,039
20,928
23,408
23,904
24,282
23,467
24,145
25,481
27,843
28,453
28,491
29,535
31,343
331,318
33,343
11.7817%
0.0000851
Modelo de Pérdidas Agregadas
Expuestos
Promedio ultimos
20,039
20,484
21,458
22,070
23,131
23,765
23,950
24,344
25,234
26,480
27,567
28,580
29,455
316,557
Siniestros
Últimos 12
1,006
1,536
2,040
2,306
2,475
2,520
2,873
2,979
2,982
2,933
2,554
2,414
2,227
30,845
Parámetros de la Beta
alfa=
beta=
Probabilidad de
ocurrencia
5.02%
7.50%
9.51%
10.45%
10.70%
10.60%
12.00%
12.24%
11.82%
11.08%
9.26%
8.45%
7.56%
9.74%
143.7357614
1076.254277
Metodología propuesta
El modelo de pérdidas agregadas se obtuvo de la siguiente manera:
1.
Obtención de la distribución de pérdidas agregadas.
a) Se consideró que la frecuencia se distribuye
beta-binomial (parámetros a=143.735761, b=1076.254277).
a.1) El número de expuestos promedio para 2013 se espera que
sea de 33,343 y la probabilidad de que una persona se enferme se
estima de 11.78%. Esta información se obtuvo a partir de los
expuestos al 31 de diciembre de 2012, así como de la proyección
realizada.
b) Se consideró que el monto de siniestros se distribuye Pareto
generalizada con media $86,182.
Page 17
Datos
Severidad
Muestra de siniestros
E(x)
Var(x)
86,182.52
50,187,242,761.96
Fórmulas
Parámetros Pareto Generalizada
E(x)=
Var(x)=
ba
(a-1)
k=
0.48275
Parámetro de Forma
b2a
s=
44,577.49
Parámetro de Escala
(a-1) 2(a-2)
Page 18
Modelo de Pérdidas Agregadas
Histograma Lognormal
Page 19
Modelo de Pérdidas Agregadas
Histograma Pareto Generalizada
Page 20
Modelo de Pérdidas Agregadas
Histograma Gamma
Page 21
Modelo de Pérdidas Agregadas
Resultados de Ajuste
Resultados de ajuste
Posición
Page 22
Distribución
1
Gamma
2
Pareto
Generalizada
3
Lognormal
Modelo de Pérdidas Agregadas
Parámetros
a=0.14799 b=5.8234E+5
k=0.50971 s=43883.0
m=-3320.3
s=1.5825 m=10.217
Pruebas de bondad de ajuste
►
Prueba de Kolmogorov Smirnov
Sea F0(x) la función de distribución teórica para
la variable aleatoria X, y representa la
probabilidad de que la variable aleatoria X tome
un valor menor o igual a x (también se interpreta
como la proporción esperada de observaciones
que tengan un valor menor o igual a x). Es
decir:
Sea Sn (x) la función de distribución empírica,
calculada con base en los valores observados
de la muestra n observaciones. Sn (x)
representa la proporción de valores observados
que son menores o iguales a x, y está definida
como:
Sn (x) = P ( X £ x/ dados los resultados
muestrales) = m/n
Donde m es el número de valores observados
que son menores o iguales a x.
Page 23
En la prueba de Kolmogorov-Smirnov- se está
interesado en la mayor desviación entre la función
de distribución teórica y la empírica, es decir entre
F0 (x) y Sn(x), para todo el rango de valores de x.
Bajo la hipótesis nula se espera que estas
desviaciones sean pequeñas y estén dentro de los
límites de errores aleatorios. Por lo tanto, en la
prueba S-K se calcula la mayor desviación
existente entre F0 (x) y Sn(x), denotada por
Dmax(x) y está dada por:
Dmax(x) = Max | FX (x) - Sn (x) |
La distribución de Dmax(x) es conocida y depende
del número de observaciones n. Se acepta la
hipótesis nula de que no existe diferencia
significativa entre las distribuciones teóricas y
empíricas si el valor de Dmax(x) es menor o igual
que el valor crítico Dmaxp(a,n).
Esta prueba se puede realizar para valores
agrupados en intervalos de clase y también para
valores sin agrupar.
Pruebas de bondad de ajuste
►
Prueba Anderson-Darling (A-D)
La última estadística de adaptación que se puede usar con
datos de muestra continuos es la Anderson-Darling, que se
define como
Como la estadística K-S, la A-D no requiere el establecimiento
de compartimentos. Pero a diferencia de la estadística K-S,
que se enfoque en el medio de la distribución, la estadística AD destaca las diferencias entre los extremos de la distribución
adaptada y los datos de entrada.
El test Anderson-Darling determina si los datos vienen de una
distribución específica. La fórmula para el estadístico A
determina si los datos (observar que los datos se deben
ordenar) vienen de una distribución con función acumulativa F
A2 = - n -
1 n
å (2i - 1) · [ln F ( X i ) + ln(1 - F ( X n- t +1 ))]
n i =1
Las hipótesis nula y alternativa son:
H0: Los dátos se apegan a la distribución;
HA: Los dátos no se apegan a la distribución.
Page 24
La hipótesis en cuanto a la forma distribucional es
rechazada en el nivel de importancia escogido (a) si la
estadística de prueba, A2, es mayor que el valor crítico
obtenido de una tabla. Los valores fijos a ( 0.01, 0.05 etc.)
generalmente son usados evaluar la hipótesis (H0) nula en
varios niveles de importancia. Un valor de 0.05 es usado
comúnmente para la mayoría de sus aplicaciones, sin
embargo, en algunas industrias críticas, un valor inferior
puede ser aplicado.
El estadístico de la prueba se puede entonces comparar
contra las distribuciones del estadístico de prueba
(dependiendo que F se utiliza) para determinar el P-valor.
Pruebas de bondad de ajuste
►
Prueba Chi Cuadrada de Pearson
(X2)
La prueba Chi cuadrada
permite calcular la
probabilidad de obtener resultados que únicamente por
efectos del azar se desvíen de las explicativas en la
magnitud observada si el modelo es correcto.
Para realizar la prueba Chi cuadrada, el primer paso es
comparar el número de individuos observado en cada
categoría con los números esperados considerando el
tamaño de la muestra y el modelo propuesto. Las
desviaciones son elevadas al cuadrado y divididas por
los valores esperados , lo cual proporciona un valor de
Chi cuadrada. Se utiliza el número de individuos y no
las proporciones, X2 toma en consideración el tamaño
de la muestra.
La fórmula para X2 es como se indica a continuación:
X
Donde:
clase i.
2
=å
(Oi - E i ) 2
E
i
Oi= Número de individuos observados de la
Ei = Número esperado de la clase i (teórico)
Page 25
El siguiente paso es determinar los grados de libertad. Los
grados de libertad son el número de categorías o clases
variables independientes que existe. Generalmente, esto es
igual a uno menos el número total de clases.
El paso final de la aplicación de la prueba Chi cuadrada es
buscar el valor X2 calculado y grados de libertad en una tabla
X2 y determinar el valor de la probabilidad. Este valor es la
probabilidad de que el azar por sí mismo pudiera ser
responsable de una desviación tan grande o mayor que la
observada, si la hipótesis es correcta. Si la probabilidad es
alta se considera que los datos están de acuerdo con el
modelo, lo cual no prueba que el modelo sea correcto, sino
que simplemente no se puede demostrar que sea incorrecto.
Si la probabilidad es baja, la desviación no es debida al azar
y se considera que los datos no respaldan al modelo.
Seguidamente se tiene que decidir que tan baja probabilidad
es posible aceptar antes de rechazar el modelo propuesto.
Generalmente, el nivel de confiabilidad escogido es del 5%. Si
la probabilidad es menor de 0.05, la diferencia es
“significativa”. Las probabilidades en estos intervalos
generalmente causan el rechazo de un modelo, sin embargo,
el rechazo de la hipótesis al nivel del 5% significa que se
rechazan hipótesis correctas 5% de las veces.
Bondad de Ajuste
Posición
Distribución
1
Gamma
2
Gen. Pareto
3
Lognormal
Page 26
Kolmogorov
Smirnov
Estadística
Rango
0.41879
3
0.09165
2
0.05063
1
Modelo de Pérdidas Agregadas
Anderson
Darling
Estadística
Rango
2307.3
3
75.354
2
42.942
1
Chi-cuadrado
Estadística
Rango
7844.3
3
413.17
1
463.29
2
Metodología propuesta
El modelo de pérdidas agregadas se obtuvo de la
siguiente manera (cont.):
1.
d)
Se simularon 250,000 escenarios de siniestralidad
agregada anual a partir de la simulación del mismo
número de beta-binomiales (Ni | pi ~ Beta) y
posteriormente se simularon (Ni) paretos
generalizadas.
e)
En total se simularon 982.1 millones de siniestros
(250,000 * E(Ni)).
f)
Se analizaron diversas distribuciones de monto de
siniestros a partir de las pruebas de bondad de
ajuste (Kolmogorov-Smirnov, Anderson-Darling y
Chi cuadrada de Pearson) se determinó que la
distribución que mejor ajustaba fue la Pareto
Generalizada
g)
Por lo anterior se consideró que el monto de
siniestros se distribuye Pareto Generalizada. Con
los siguientes parámetros:
f ( x) =
{
x - m ) ö -1- 1k
(
1æ
ç1 + k
÷
sè
s ø
æ (x - m) ö
1
exp ç ÷
s
s ø
è
k = 0.48275; s = 44,577 y m = 0
Page 27
A continuación se presenta la gráfica de la distribución de
pérdidas agregadas bruta
K≠0
K =0
La media de la función de severidad es de $86,182.
Metodología propuesta
2.
A
A continuación se presentan las gráficas de las
distribuciones de pérdidas considerando diferentes límites
de retención:
Obtención de la distribución de pérdidas
agregadas considerando diversos límites de
retención.
a) A partir de los 982.1 millones de siniestros
simulados se consideró el efecto que
tendría en la retención el incluir un límite
máximo de retención. Esto se logró
limitando el monto del siniestro a un nivel
LR, es decir:
LRj
X i = min(
X i, LRj )
b)
Con dichos siniestros de recalcularon las
250,000 pérdidas anuales y se obtuvo una
nueva distribución de pérdidas agregadas.
Z LR = X LR + X LR + ... + X LR
j
r
j
1
j
2
j
Nr
con r = 1,2,…, 250,000
c)
Page 28
Lo anterior se realizó para diversos límites
de retención (j).
Histograma
Bajo diferentes límites de retención
Page 29
Modelo de Pérdidas Agregadas
Escenarios de Pérdidas Agregadas
Nivel Retenido
% de Retención
60%
Nivel de Confianza
Límites
Modelo de Pérdidas Agregadas
Escenarios de Límites de Retención y Pérdidas Agregadas
Al 31 de diciembre 2012
Tomando en cuenta el número de expuestos podemos decir que la
pérdida por expuesta se determina de la siguiente forma:
Media de la pérdida agregada (PoC)
# expuestos (promedio anual)
Pérdida promedio x expuesto anual
338,637,942.00
33,343.46
10,156.05
Primas
463,706,308.75
125,068,366.75
Capital Social
100,000,000.00
De Riesgos en Curso (Parte de riesgo)
Margen de Solvencia
Disponible
208,667,838.94
5,000,000.00
213,667,838.94
Page 30
500,000
1,000,000
1,500,000
2,000,000
2,500,000
3,000,000
3,500,000
4,000,000
4,500,000
5,000,000
6,000,000
7,000,000
8,000,000
9,000,000
10,000,000
15,000,000
20,000,000
50,000,000
60,000,000
Sin Límite
Modelo de Pérdidas Agregadas
95.00%
199,823,007
215,488,622
221,242,604
224,256,298
226,115,669
227,374,451
228,285,243
228,999,527
229,558,499
230,023,011
230,733,832
231,256,784
231,656,489
231,970,580
232,254,011
233,120,468
233,635,153
235,001,085
235,232,168
235,504,621
99.00%
210,625,594
227,334,723
233,512,277
236,721,450
238,752,891
240,142,484
241,191,240
241,972,803
242,611,277
243,149,614
243,980,069
244,622,273
245,098,982
245,508,080
245,804,067
247,020,934
247,825,591
250,199,311
250,799,262
252,943,368
99.50%
214,830,368
231,808,670
238,158,329
241,370,573
243,482,707
245,007,442
246,035,474
246,868,678
247,544,782
248,052,935
248,953,899
249,615,347
250,118,603
250,550,221
250,902,194
252,186,823
253,005,970
255,823,909
256,672,451
261,043,491
99.95%
226,144,701
244,382,908
251,038,041
254,485,770
256,927,960
258,307,214
259,733,874
260,633,822
261,416,384
261,978,616
262,975,870
263,536,855
263,939,864
264,239,525
264,766,489
266,323,977
267,447,508
273,374,773
275,082,725
330,636,832
Escenarios de Pérdidas Agregadas
Nivel Bruto
Bruto
Nivel de Confianza
Límites
95.00%
500,000
1,000,000
1,500,000
2,000,000
2,500,000
3,000,000
3,500,000
4,000,000
4,500,000
5,000,000
6,000,000
7,000,000
8,000,000
9,000,000
10,000,000
15,000,000
20,000,000
50,000,000
60,000,000
Sin Límite
Page 31
333,038,345
359,147,704
368,737,674
373,760,497
376,859,448
378,957,419
380,475,405
381,665,879
382,597,499
383,371,685
384,556,386
385,427,973
386,094,148
386,617,633
387,090,018
388,534,114
389,391,922
391,668,475
392,053,613
392,507,702
99.00%
351,042,656
378,891,205
389,187,128
394,535,750
397,921,485
400,237,473
401,985,400
403,288,005
404,352,129
405,249,357
406,633,449
407,703,788
408,498,303
409,180,134
409,673,445
411,701,557
413,042,651
416,998,851
417,998,770
421,572,280
Modelo de Pérdidas Agregadas
99.50%
358,050,613
386,347,783
396,930,548
402,284,289
405,804,512
408,345,736
410,059,123
411,447,796
412,574,636
413,421,558
414,923,165
416,025,579
416,864,338
417,583,701
418,170,324
420,311,372
421,676,616
426,373,182
427,787,419
435,072,485
99.95%
376,907,835
407,304,846
418,396,735
424,142,950
428,213,266
430,512,023
432,889,790
434,389,703
435,693,973
436,631,026
438,293,117
439,228,091
439,899,773
440,399,209
441,277,482
443,873,295
445,745,847
455,624,622
458,471,208
551,061,387
Descargar