Modelos de Pérdidas Agregadas No Vida XXVI Congreso Nacional de Actuarios Act. Patricio Belaunzarán Modelo de pérdidas agregadas El modelo de pérdidas agregadas tiene como objetivo obtener una función de distribución, la cual incorpore los conceptos de frecuencia y severidad. Bajo el supuesto de que las severidades son independientes entre sí, y éstas, a su vez, independientes de la frecuencia, se procede al modelado por separado de ambas variables. La determinación es igual a: Z = X1 + X2 + X3 + … + XN donde Z = Pérdida agregada (siniestralidad anual) N = Número total de siniestros en el periodo (Frec.); y Xi = Monto de cada siniestro (Sev.) Ambos son desconocidos por lo que deben ser modelados como variable aleatoria. La media de Z es igual a la frecuencia media por el monto medio. Es decir, E(z) = E(N) * E(Xi) Page 2 Modelo de pérdidas agregadas Para obtener la distribución de pérdidas agregadas se realiza lo siguiente: ► Ajuste de la distribución de frecuencia. Se parte de distribuciones probabilísticas discretas de conteo entre las que se encuentran las siguientes: Poisson, Binomial, Binomial Negativa y Beta-Binomial. ► Ajuste de la distribución de severidad. Se obtienen los parámetros de las distribuciones probabilísticas que mejor ajusten a los datos observados. A priori las distribuciones que se proponen son las siguientes: Lognormal, Gamma y Pareto Generalizada Page 3 Ajuste de distribuciones de monto de siniestros Estimador de Máxima Verosimilitud (EMV) ► Page 5 Presentation title Método de Momentos. ► Page 6 Presentation title Modelos de frecuencia Modelo Beta Binomial Si disponemos de datos de frecuencias relativos a distribuciones binomiales, de modo que, donde y . Puesto que representa una proporción, elegimos como distribución a priori una beta de primera especie, con función de densidad; Page 8 Modelo de Pérdidas Agregadas ► Fuente: Documentos fFundación Mapfre Modelo Beta Binomial Los parámetros y Se establecemos que pueden venir de la historia o de juicio experto. y entonces: La función de verosimilitud basada en una muestra por, viene dada Haciendo uso del teorema de Bayes, la función de densidad a posteriori es, Page 9 Modelo de Pérdidas Agregadas ► Fuente: Documentos fFundación Mapfre Construcción del modelo de pérdidas agregadas Construcción ► La manera de obtener la distribución de pérdidas es a través de métodos numéricos, debido a que en este se necesita obtener convoluciones de la distribución de pérdida que no es tratable desde el punto de vista analítico. ► ► ► ► Page 11 Métodos recursivos Métodos de inversión Métodos de aproximación Métodos de simulación Modelo de Pérdidas Agregadas VaR y TailVaR Value at Risk (VaR) ► Page 13 Presentation title Tail VaR o Conditional Tail Expectation (CTE) ► Page 14 Presentation title Aplicación a una cartera de Gastos Médicos Datos Frecuencia Estimación de parámetros. Beta Binomial Cifras al 31 de diciembre del 2012 Año 2009 2010 2011 2012 Número de Siniestros 426 640 653 587 595 685 1,006 693 598 636 627 553 411 8,919 Trimestre Qtr4 Qtr1 Qtr2 Qtr3 Qtr4 Qtr1 Qtr2 Qtr3 Qtr4 Qtr1 Qtr2 Qtr3 Qtr4 Total Expuestos Promedio p= Varianza de la p Page 16 Número de Expuestos 20,039 20,928 23,408 23,904 24,282 23,467 24,145 25,481 27,843 28,453 28,491 29,535 31,343 331,318 33,343 11.7817% 0.0000851 Modelo de Pérdidas Agregadas Expuestos Promedio ultimos 20,039 20,484 21,458 22,070 23,131 23,765 23,950 24,344 25,234 26,480 27,567 28,580 29,455 316,557 Siniestros Últimos 12 1,006 1,536 2,040 2,306 2,475 2,520 2,873 2,979 2,982 2,933 2,554 2,414 2,227 30,845 Parámetros de la Beta alfa= beta= Probabilidad de ocurrencia 5.02% 7.50% 9.51% 10.45% 10.70% 10.60% 12.00% 12.24% 11.82% 11.08% 9.26% 8.45% 7.56% 9.74% 143.7357614 1076.254277 Metodología propuesta El modelo de pérdidas agregadas se obtuvo de la siguiente manera: 1. Obtención de la distribución de pérdidas agregadas. a) Se consideró que la frecuencia se distribuye beta-binomial (parámetros a=143.735761, b=1076.254277). a.1) El número de expuestos promedio para 2013 se espera que sea de 33,343 y la probabilidad de que una persona se enferme se estima de 11.78%. Esta información se obtuvo a partir de los expuestos al 31 de diciembre de 2012, así como de la proyección realizada. b) Se consideró que el monto de siniestros se distribuye Pareto generalizada con media $86,182. Page 17 Datos Severidad Muestra de siniestros E(x) Var(x) 86,182.52 50,187,242,761.96 Fórmulas Parámetros Pareto Generalizada E(x)= Var(x)= ba (a-1) k= 0.48275 Parámetro de Forma b2a s= 44,577.49 Parámetro de Escala (a-1) 2(a-2) Page 18 Modelo de Pérdidas Agregadas Histograma Lognormal Page 19 Modelo de Pérdidas Agregadas Histograma Pareto Generalizada Page 20 Modelo de Pérdidas Agregadas Histograma Gamma Page 21 Modelo de Pérdidas Agregadas Resultados de Ajuste Resultados de ajuste Posición Page 22 Distribución 1 Gamma 2 Pareto Generalizada 3 Lognormal Modelo de Pérdidas Agregadas Parámetros a=0.14799 b=5.8234E+5 k=0.50971 s=43883.0 m=-3320.3 s=1.5825 m=10.217 Pruebas de bondad de ajuste ► Prueba de Kolmogorov Smirnov Sea F0(x) la función de distribución teórica para la variable aleatoria X, y representa la probabilidad de que la variable aleatoria X tome un valor menor o igual a x (también se interpreta como la proporción esperada de observaciones que tengan un valor menor o igual a x). Es decir: Sea Sn (x) la función de distribución empírica, calculada con base en los valores observados de la muestra n observaciones. Sn (x) representa la proporción de valores observados que son menores o iguales a x, y está definida como: Sn (x) = P ( X £ x/ dados los resultados muestrales) = m/n Donde m es el número de valores observados que son menores o iguales a x. Page 23 En la prueba de Kolmogorov-Smirnov- se está interesado en la mayor desviación entre la función de distribución teórica y la empírica, es decir entre F0 (x) y Sn(x), para todo el rango de valores de x. Bajo la hipótesis nula se espera que estas desviaciones sean pequeñas y estén dentro de los límites de errores aleatorios. Por lo tanto, en la prueba S-K se calcula la mayor desviación existente entre F0 (x) y Sn(x), denotada por Dmax(x) y está dada por: Dmax(x) = Max | FX (x) - Sn (x) | La distribución de Dmax(x) es conocida y depende del número de observaciones n. Se acepta la hipótesis nula de que no existe diferencia significativa entre las distribuciones teóricas y empíricas si el valor de Dmax(x) es menor o igual que el valor crítico Dmaxp(a,n). Esta prueba se puede realizar para valores agrupados en intervalos de clase y también para valores sin agrupar. Pruebas de bondad de ajuste ► Prueba Anderson-Darling (A-D) La última estadística de adaptación que se puede usar con datos de muestra continuos es la Anderson-Darling, que se define como Como la estadística K-S, la A-D no requiere el establecimiento de compartimentos. Pero a diferencia de la estadística K-S, que se enfoque en el medio de la distribución, la estadística AD destaca las diferencias entre los extremos de la distribución adaptada y los datos de entrada. El test Anderson-Darling determina si los datos vienen de una distribución específica. La fórmula para el estadístico A determina si los datos (observar que los datos se deben ordenar) vienen de una distribución con función acumulativa F A2 = - n - 1 n å (2i - 1) · [ln F ( X i ) + ln(1 - F ( X n- t +1 ))] n i =1 Las hipótesis nula y alternativa son: H0: Los dátos se apegan a la distribución; HA: Los dátos no se apegan a la distribución. Page 24 La hipótesis en cuanto a la forma distribucional es rechazada en el nivel de importancia escogido (a) si la estadística de prueba, A2, es mayor que el valor crítico obtenido de una tabla. Los valores fijos a ( 0.01, 0.05 etc.) generalmente son usados evaluar la hipótesis (H0) nula en varios niveles de importancia. Un valor de 0.05 es usado comúnmente para la mayoría de sus aplicaciones, sin embargo, en algunas industrias críticas, un valor inferior puede ser aplicado. El estadístico de la prueba se puede entonces comparar contra las distribuciones del estadístico de prueba (dependiendo que F se utiliza) para determinar el P-valor. Pruebas de bondad de ajuste ► Prueba Chi Cuadrada de Pearson (X2) La prueba Chi cuadrada permite calcular la probabilidad de obtener resultados que únicamente por efectos del azar se desvíen de las explicativas en la magnitud observada si el modelo es correcto. Para realizar la prueba Chi cuadrada, el primer paso es comparar el número de individuos observado en cada categoría con los números esperados considerando el tamaño de la muestra y el modelo propuesto. Las desviaciones son elevadas al cuadrado y divididas por los valores esperados , lo cual proporciona un valor de Chi cuadrada. Se utiliza el número de individuos y no las proporciones, X2 toma en consideración el tamaño de la muestra. La fórmula para X2 es como se indica a continuación: X Donde: clase i. 2 =å (Oi - E i ) 2 E i Oi= Número de individuos observados de la Ei = Número esperado de la clase i (teórico) Page 25 El siguiente paso es determinar los grados de libertad. Los grados de libertad son el número de categorías o clases variables independientes que existe. Generalmente, esto es igual a uno menos el número total de clases. El paso final de la aplicación de la prueba Chi cuadrada es buscar el valor X2 calculado y grados de libertad en una tabla X2 y determinar el valor de la probabilidad. Este valor es la probabilidad de que el azar por sí mismo pudiera ser responsable de una desviación tan grande o mayor que la observada, si la hipótesis es correcta. Si la probabilidad es alta se considera que los datos están de acuerdo con el modelo, lo cual no prueba que el modelo sea correcto, sino que simplemente no se puede demostrar que sea incorrecto. Si la probabilidad es baja, la desviación no es debida al azar y se considera que los datos no respaldan al modelo. Seguidamente se tiene que decidir que tan baja probabilidad es posible aceptar antes de rechazar el modelo propuesto. Generalmente, el nivel de confiabilidad escogido es del 5%. Si la probabilidad es menor de 0.05, la diferencia es “significativa”. Las probabilidades en estos intervalos generalmente causan el rechazo de un modelo, sin embargo, el rechazo de la hipótesis al nivel del 5% significa que se rechazan hipótesis correctas 5% de las veces. Bondad de Ajuste Posición Distribución 1 Gamma 2 Gen. Pareto 3 Lognormal Page 26 Kolmogorov Smirnov Estadística Rango 0.41879 3 0.09165 2 0.05063 1 Modelo de Pérdidas Agregadas Anderson Darling Estadística Rango 2307.3 3 75.354 2 42.942 1 Chi-cuadrado Estadística Rango 7844.3 3 413.17 1 463.29 2 Metodología propuesta El modelo de pérdidas agregadas se obtuvo de la siguiente manera (cont.): 1. d) Se simularon 250,000 escenarios de siniestralidad agregada anual a partir de la simulación del mismo número de beta-binomiales (Ni | pi ~ Beta) y posteriormente se simularon (Ni) paretos generalizadas. e) En total se simularon 982.1 millones de siniestros (250,000 * E(Ni)). f) Se analizaron diversas distribuciones de monto de siniestros a partir de las pruebas de bondad de ajuste (Kolmogorov-Smirnov, Anderson-Darling y Chi cuadrada de Pearson) se determinó que la distribución que mejor ajustaba fue la Pareto Generalizada g) Por lo anterior se consideró que el monto de siniestros se distribuye Pareto Generalizada. Con los siguientes parámetros: f ( x) = { x - m ) ö -1- 1k ( 1æ ç1 + k ÷ sè s ø æ (x - m) ö 1 exp ç ÷ s s ø è k = 0.48275; s = 44,577 y m = 0 Page 27 A continuación se presenta la gráfica de la distribución de pérdidas agregadas bruta K≠0 K =0 La media de la función de severidad es de $86,182. Metodología propuesta 2. A A continuación se presentan las gráficas de las distribuciones de pérdidas considerando diferentes límites de retención: Obtención de la distribución de pérdidas agregadas considerando diversos límites de retención. a) A partir de los 982.1 millones de siniestros simulados se consideró el efecto que tendría en la retención el incluir un límite máximo de retención. Esto se logró limitando el monto del siniestro a un nivel LR, es decir: LRj X i = min( X i, LRj ) b) Con dichos siniestros de recalcularon las 250,000 pérdidas anuales y se obtuvo una nueva distribución de pérdidas agregadas. Z LR = X LR + X LR + ... + X LR j r j 1 j 2 j Nr con r = 1,2,…, 250,000 c) Page 28 Lo anterior se realizó para diversos límites de retención (j). Histograma Bajo diferentes límites de retención Page 29 Modelo de Pérdidas Agregadas Escenarios de Pérdidas Agregadas Nivel Retenido % de Retención 60% Nivel de Confianza Límites Modelo de Pérdidas Agregadas Escenarios de Límites de Retención y Pérdidas Agregadas Al 31 de diciembre 2012 Tomando en cuenta el número de expuestos podemos decir que la pérdida por expuesta se determina de la siguiente forma: Media de la pérdida agregada (PoC) # expuestos (promedio anual) Pérdida promedio x expuesto anual 338,637,942.00 33,343.46 10,156.05 Primas 463,706,308.75 125,068,366.75 Capital Social 100,000,000.00 De Riesgos en Curso (Parte de riesgo) Margen de Solvencia Disponible 208,667,838.94 5,000,000.00 213,667,838.94 Page 30 500,000 1,000,000 1,500,000 2,000,000 2,500,000 3,000,000 3,500,000 4,000,000 4,500,000 5,000,000 6,000,000 7,000,000 8,000,000 9,000,000 10,000,000 15,000,000 20,000,000 50,000,000 60,000,000 Sin Límite Modelo de Pérdidas Agregadas 95.00% 199,823,007 215,488,622 221,242,604 224,256,298 226,115,669 227,374,451 228,285,243 228,999,527 229,558,499 230,023,011 230,733,832 231,256,784 231,656,489 231,970,580 232,254,011 233,120,468 233,635,153 235,001,085 235,232,168 235,504,621 99.00% 210,625,594 227,334,723 233,512,277 236,721,450 238,752,891 240,142,484 241,191,240 241,972,803 242,611,277 243,149,614 243,980,069 244,622,273 245,098,982 245,508,080 245,804,067 247,020,934 247,825,591 250,199,311 250,799,262 252,943,368 99.50% 214,830,368 231,808,670 238,158,329 241,370,573 243,482,707 245,007,442 246,035,474 246,868,678 247,544,782 248,052,935 248,953,899 249,615,347 250,118,603 250,550,221 250,902,194 252,186,823 253,005,970 255,823,909 256,672,451 261,043,491 99.95% 226,144,701 244,382,908 251,038,041 254,485,770 256,927,960 258,307,214 259,733,874 260,633,822 261,416,384 261,978,616 262,975,870 263,536,855 263,939,864 264,239,525 264,766,489 266,323,977 267,447,508 273,374,773 275,082,725 330,636,832 Escenarios de Pérdidas Agregadas Nivel Bruto Bruto Nivel de Confianza Límites 95.00% 500,000 1,000,000 1,500,000 2,000,000 2,500,000 3,000,000 3,500,000 4,000,000 4,500,000 5,000,000 6,000,000 7,000,000 8,000,000 9,000,000 10,000,000 15,000,000 20,000,000 50,000,000 60,000,000 Sin Límite Page 31 333,038,345 359,147,704 368,737,674 373,760,497 376,859,448 378,957,419 380,475,405 381,665,879 382,597,499 383,371,685 384,556,386 385,427,973 386,094,148 386,617,633 387,090,018 388,534,114 389,391,922 391,668,475 392,053,613 392,507,702 99.00% 351,042,656 378,891,205 389,187,128 394,535,750 397,921,485 400,237,473 401,985,400 403,288,005 404,352,129 405,249,357 406,633,449 407,703,788 408,498,303 409,180,134 409,673,445 411,701,557 413,042,651 416,998,851 417,998,770 421,572,280 Modelo de Pérdidas Agregadas 99.50% 358,050,613 386,347,783 396,930,548 402,284,289 405,804,512 408,345,736 410,059,123 411,447,796 412,574,636 413,421,558 414,923,165 416,025,579 416,864,338 417,583,701 418,170,324 420,311,372 421,676,616 426,373,182 427,787,419 435,072,485 99.95% 376,907,835 407,304,846 418,396,735 424,142,950 428,213,266 430,512,023 432,889,790 434,389,703 435,693,973 436,631,026 438,293,117 439,228,091 439,899,773 440,399,209 441,277,482 443,873,295 445,745,847 455,624,622 458,471,208 551,061,387