Modelos de Pérdidas
Agregadas No Vida
XXVI Congreso Nacional de Actuarios
Page 2
Modelo de pérdidas agregadas
El modelo de pérdidas agregadas tiene como objetivo obtener una función de
distribución, la cual incorpore los conceptos de frecuencia y severidad. Bajo el
supuesto de que las severidades son independientes entre sí, y éstas, a su vez,
independientes de la frecuencia, se procede al modelado por separado de ambas
variables. La determinación es igual a:
Z = X
1+ X
2+ X
3+ … + X
Ndonde
Z = Pérdida agregada (siniestralidad anual)
N = Número total de siniestros en el periodo (Frec.); y
X
i= Monto de cada siniestro (Sev.)
Ambos son desconocidos por lo que deben ser modelados como variable
aleatoria.
La media de Z es igual a la frecuencia media por el monto medio. Es decir,
Page 3
Modelo de pérdidas agregadas
Para obtener la distribución de pérdidas agregadas se realiza lo siguiente:
►
Ajuste de la distribución de frecuencia. Se parte de distribuciones probabilísticas
discretas de conteo entre las que se encuentran las siguientes: Poisson, Binomial,
Binomial Negativa y Beta-Binomial.
►
Ajuste de la distribución de severidad.
Se obtienen los parámetros de las
distribuciones probabilísticas que mejor ajusten a los datos observados. A priori las
distribuciones que se proponen son las siguientes: Lognormal, Gamma y Pareto
Generalizada
Ajuste de distribuciones de
monto de siniestros
Page 5
Estimador de Máxima Verosimilitud (EMV)
►
Page 6
Método de Momentos.
►
Page 8
Modelo Beta Binomial
Modelo de Pérdidas Agregadas
Si disponemos de datos de frecuencias relativos a distribuciones binomiales,
de modo que,
donde
y
. Puesto que representa una proporción,
elegimos como distribución a priori una beta de primera especie, con función
de densidad;
Page 9
Modelo Beta Binomial
Modelo de Pérdidas Agregadas
Los parámetros y pueden venir de la historia o de juicio experto.
Se establecemos que
y
entonces:
La función de verosimilitud basada en una muestra
viene dada
por,
Haciendo uso del teorema de Bayes, la función de densidad a posteriori es,
Construcción del modelo de
pérdidas agregadas
Page 11
Construcción
►
La manera de obtener la distribución de pérdidas es a
través de métodos numéricos, debido a que en este se
necesita obtener convoluciones de la distribución de
pérdida que no es tratable desde el punto de vista
analítico.
►
Métodos recursivos
►
Métodos de inversión
►
Métodos de aproximación
►
Métodos de simulación
Page 13
Value at Risk (VaR)
►
Page 14
Tail VaR o Conditional Tail Expectation (CTE)
►
Aplicación a una cartera de
Gastos Médicos
Page 16
Datos
Frecuencia
Modelo de Pérdidas Agregadas
Estimación de parámetros. Beta Binomial
Cifras al 31 de diciembre del 2012
Qtr4 426 20,039 20,039 1,006 5.02% Qtr1 640 20,928 20,484 1,536 7.50% Qtr2 653 23,408 21,458 2,040 9.51% Qtr3 587 23,904 22,070 2,306 10.45% Qtr4 595 24,282 23,131 2,475 10.70% Qtr1 685 23,467 23,765 2,520 10.60% Qtr2 1,006 24,145 23,950 2,873 12.00% Qtr3 693 25,481 24,344 2,979 12.24% Qtr4 598 27,843 25,234 2,982 11.82% Qtr1 636 28,453 26,480 2,933 11.08% Qtr2 627 28,491 27,567 2,554 9.26% Qtr3 553 29,535 28,580 2,414 8.45% Qtr4 411 31,343 29,455 2,227 7.56% Total 8,919 331,318 316,557 30,845 9.74% 2009 2010 2011 2012 Número de Expuestos Expuestos Promedio ultimos Siniestros Últimos 12 Probabilidad de ocurrencia Año Trimestre Número de Siniestros Expuestos Promedio 33,343
p=
11.7817%
Varianza de la p 0.0000851 Parámetros de la Beta alfa= 143.7357614 beta= 1076.254277Page 17
Metodología propuesta
El modelo de pérdidas agregadas se obtuvo de la siguiente manera:
1.
Obtención de la distribución de pérdidas agregadas.
a)
Se consideró que la frecuencia se distribuye
beta-binomial (parámetros
a=
143.735761
, b=
1076.254277).
a.1)
El número de expuestos promedio para 2013 se espera que
sea de 33,343 y la probabilidad de que una persona se enferme se
estima de 11.78%. Esta información se obtuvo a partir de los
expuestos al 31 de diciembre de 2012, así como de la proyección
realizada.
b)
Se consideró que el monto de siniestros se distribuye Pareto
Page 18
Datos
Severidad
Modelo de Pérdidas Agregadas
Muestra de siniestros
E(x)
86,182.52
Var(x)
50,187,242,761.96
Fórmulas
E(x)=
ba
(a-1)
Var(x)=
b
2a
(a-1)
2(a-2)
Parámetros Pareto Generalizada
k=
0.48275
Parámetro de Forma
Page 19
Histograma Lognormal
Page 20
Histograma Pareto Generalizada
Page 21
Histograma Gamma
Page 22
Resultados de Ajuste
Modelo de Pérdidas Agregadas
Resultados de ajuste
Posición
Distribución
Parámetros
1
Gamma
a
=0.14799
b
=5.8234E+5
2
Pareto
Generalizada
k=0.50971
s
=43883.0
m
=-3320.3
3
Lognormal
s
=1.5825
m
=10.217
Page 23
Pruebas de bondad de ajuste
►
Prueba de Kolmogorov
-Smirnov
Sea F
0(x) la función de distribución teórica para
la variable aleatoria X, y representa la
probabilidad de que la variable aleatoria X tome
un valor menor o igual a x (también se interpreta
como la proporción esperada de observaciones
que tengan un valor menor o igual a x). Es
decir:
Sea S
n(x) la función de distribución empírica,
calculada con base en los valores observados
de la muestra n observaciones. Sn (x)
representa la proporción de valores observados
que son menores o iguales a x, y está definida
como:
S
n(x) = P ( X £ x/ dados los resultados
muestrales) = m/n
Donde m es el número de valores observados
que son menores o iguales a x.
En la prueba de Kolmogorov-Smirnov- se está
interesado en la mayor desviación entre la función
de distribución teórica y la empírica, es decir entre
F
0(x) y S
n(x), para todo el rango de valores de x.
Bajo la hipótesis nula se espera que estas
desviaciones sean pequeñas y estén dentro de los
límites de errores aleatorios. Por lo tanto, en la
prueba S-K se calcula la mayor desviación
existente entre F
0(x) y S
n(x), denotada por
Dmax(x) y está dada por:
Dmax(x) = Max | FX (x) - S
n(x) |
La distribución de Dmax(x) es conocida y depende
del número de observaciones n. Se acepta la
hipótesis nula de que no existe diferencia
significativa entre las distribuciones teóricas y
empíricas si el valor de Dmax(x) es menor o igual
que el valor crítico Dmaxp(a,n).
Esta prueba se puede realizar para valores
agrupados en intervalos de clase y también para
valores sin agrupar.
Page 24
Pruebas de bondad de ajuste
►
Prueba Anderson-Darling (A-D)
La última estadística de adaptación que se puede usar con
datos de muestra continuos es la Anderson-Darling, que se
define como
Como la estadística K-S, la A-D no requiere el establecimiento
de compartimentos. Pero a diferencia de la estadística K-S,
que se enfoque en el medio de la distribución, la estadística
A-D destaca las diferencias entre los extremos de la distribución
adaptada y los datos de entrada.
El test Anderson-Darling determina si los datos vienen de una
distribución específica. La fórmula para el estadístico A
determina si los datos (observar que los datos se deben
ordenar) vienen de una distribución con función acumulativa F
Las hipótesis nula y alternativa son:
H
0: Los dátos se apegan a la distribución;
H
A: Los dátos no se apegan a la distribución.
))]
(
1
ln(
)
(
[ln
)
1
2
(
1
1 1 2 + -=-+
·
-=
å
n n t i iF
X
X
F
i
n
n
A
La hipótesis en cuanto a la forma distribucional es
rechazada en el nivel de importancia escogido (a) si la
estadística de prueba, A
2, es mayor que el valor crítico
obtenido de una tabla. Los valores fijos a ( 0.01, 0.05 etc.)
generalmente son usados evaluar la hipótesis (H
0) nula en
varios niveles de importancia. Un valor de 0.05 es usado
comúnmente para la mayoría de sus aplicaciones, sin
embargo, en algunas industrias críticas, un valor inferior
puede ser aplicado.
El estadístico de la prueba se puede entonces comparar
contra las distribuciones del estadístico de prueba
Page 25
Pruebas de bondad de ajuste
►
Prueba Chi Cuadrada de Pearson
La prueba Chi cuadrada (
X
2) permite calcular la
probabilidad de obtener resultados que únicamente por
efectos del azar se desvíen de las explicativas en la
magnitud observada si el modelo es correcto.
Para realizar la prueba Chi cuadrada, el primer paso es
comparar el número de individuos observado en cada
categoría con los números esperados considerando el
tamaño de la muestra y el modelo propuesto. Las
desviaciones son elevadas al cuadrado y divididas por
los valores esperados , lo cual proporciona un valor de
Chi cuadrada. Se utiliza el número de individuos y no
las proporciones,
X
2toma en consideración el tamaño
de la muestra.
La fórmula para
X
2es como se indica a continuación:
Donde:
O
i= Número de individuos observados de la
clase i.
E
i= Número esperado de la clase i (teórico)
å
-=
E
E
O
X
i i i 2 2(
)
El siguiente paso es determinar los grados de libertad. Los
grados de libertad son el número de categorías o clases
variables independientes que existe. Generalmente, esto es
igual a uno menos el número total de clases.
El paso final de la aplicación de la prueba Chi cuadrada es
buscar el valor
X
2calculado y grados de libertad en una tabla
X
2y determinar el valor de la probabilidad. Este valor es la
probabilidad de que el azar por sí mismo pudiera ser
responsable de una desviación tan grande o mayor que la
observada, si la hipótesis es correcta. Si la probabilidad es
alta se considera que los datos están de acuerdo con el
modelo, lo cual no prueba que el modelo sea correcto, sino
que simplemente no se puede demostrar que sea incorrecto.
Si la probabilidad es baja, la desviación no es debida al azar
y se considera que los datos no respaldan al modelo.
Seguidamente se tiene que decidir que tan baja probabilidad
es posible aceptar antes de rechazar el modelo propuesto.
Generalmente, el nivel de confiabilidad escogido es del 5%. Si
la probabilidad es menor de 0.05, la diferencia es
“significativa”. Las probabilidades en estos intervalos
generalmente causan el rechazo de un modelo, sin embargo,
el rechazo de la hipótesis al nivel del 5% significa que se
rechazan hipótesis correctas 5% de las veces.
Page 26
Bondad de Ajuste
Modelo de Pérdidas Agregadas
Estadística
Rango
Estadística
Rango
Estadística
Rango
1
Gamma
0.41879
3
2307.3
3
7844.3
3
2
Gen. Pareto
0.09165
2
75.354
2
413.17
1
3
Lognormal
0.05063
1
42.942
1
463.29
2
Chi-cuadrado
Posición
Distribución
Kolmogorov
Smirnov
Anderson
Darling
Page 27
Metodología propuesta
1. El modelo de pérdidas agregadas se obtuvo de la siguiente manera (cont.):
d) Se simularon 250,000 escenarios de siniestralidad agregada anual a partir de la simulación del mismo número de beta-binomiales (Ni | pi ~ Beta) y
posteriormente se simularon (Ni) paretos generalizadas.
e) En total se simularon 982.1millonesde siniestros (250,000 * E(Ni)).
f) Se analizaron diversas distribuciones de monto de siniestros a partir de las pruebas de bondad de ajuste (Kolmogorov-Smirnov, Anderson-Darling y Chi cuadrada de Pearson) se determinó que la distribución que mejor ajustaba fue la Pareto Generalizada
g) Por lo anterior se consideró que el monto de siniestros se distribuye Pareto Generalizada. Con los siguientes parámetros:
k = 0.48275; s= 44,577 y m= 0
A continuación se presenta la gráfica de la distribución de pérdidas agregadas bruta
La media de la función de severidad es de $86,182.
(
)
1 11
1
k
x
m
ks
s
-æ
-
ö
+
ç
÷
è
ø
(
)
1
exp
x
m
s
s
æ
-
ö
-ç
÷
è
ø
( )
f x
=
{
K ≠ 0 K =0Page 28
Metodología propuesta
2. Obtención de la distribución de pérdidas agregadas considerando diversos límites de retención.
a) A partir de los 982.1 millones de siniestros simulados se consideró el efecto que tendría en la retención el incluir un límite máximo de retención. Esto se logró limitando el monto del siniestro a un nivel LR, es decir:
b) Con dichos siniestros de recalcularon las
250,000 pérdidas anuales y se obtuvo una nueva distribución de pérdidas agregadas.
con r = 1,2,…, 250,000
c) Lo anterior se realizó para diversos límites de retención (j).
min(
,
)
LRj i j iX
=
X
LR
X
X
X
Z
LR
jLR
jLR
jLR
j Nr r=
1+
2+
...
+
AA continuación se presentan las gráficas de las
distribuciones de pérdidas considerando diferentes límites de retención:
Page 29
Histograma
Bajo diferentes límites de retención
Page 30
Escenarios de Pérdidas Agregadas
Nivel Retenido
Modelo de Pérdidas Agregadas
Modelo de Pérdidas Agregadas
Escenarios de Límites de Retención y Pérdidas Agregadas Al 31 de diciembre 2012
Media de la pérdida agregada (PoC) 338,637,942.00 # expuestos (promedio anual) 33,343.46
Pérdida promedio x expuesto anual 10,156.05 Primas 463,706,308.75 125,068,366.75
Capital Social 100,000,000.00
De Riesgos en Curso (Parte de riesgo) 208,667,838.94 Margen de Solvencia 5,000,000.00 Disponible 213,667,838.94 Tomando en cuenta el número de expuestos podemos decir que la
pérdida por expuesta se determina de la siguiente forma:
% de Retención 60% Nivel de Confianza Límites 95.00% 99.00% 99.50% 99.95% 500,000 199,823,007 210,625,594 214,830,368 226,144,701 1,000,000 215,488,622 227,334,723 231,808,670 244,382,908 1,500,000 221,242,604 233,512,277 238,158,329 251,038,041 2,000,000 224,256,298 236,721,450 241,370,573 254,485,770 2,500,000 226,115,669 238,752,891 243,482,707 256,927,960 3,000,000 227,374,451 240,142,484 245,007,442 258,307,214 3,500,000 228,285,243 241,191,240 246,035,474 259,733,874 4,000,000 228,999,527 241,972,803 246,868,678 260,633,822 4,500,000 229,558,499 242,611,277 247,544,782 261,416,384 5,000,000 230,023,011 243,149,614 248,052,935 261,978,616 6,000,000 230,733,832 243,980,069 248,953,899 262,975,870 7,000,000 231,256,784 244,622,273 249,615,347 263,536,855 8,000,000 231,656,489 245,098,982 250,118,603 263,939,864 9,000,000 231,970,580 245,508,080 250,550,221 264,239,525 10,000,000 232,254,011 245,804,067 250,902,194 264,766,489 15,000,000 233,120,468 247,020,934 252,186,823 266,323,977 20,000,000 233,635,153 247,825,591 253,005,970 267,447,508 50,000,000 235,001,085 250,199,311 255,823,909 273,374,773 60,000,000 235,232,168 250,799,262 256,672,451 275,082,725 Sin Límite 235,504,621 252,943,368 261,043,491 330,636,832