1
Implementación de metodologías alternativas para
medidas de riesgo financiero
JUAN DAVID CARRILLO 201016356
ASESOR: CAMILO SANTOS
RESUMEN. El presente documento se centra en evaluar el cumplimiento del supuesto de normalidad en el comportamiento de los retornos de los activos financieros, presentando evidencia de que en algunos casos este no se cumple en su totalidad. Adicionalmente, presenta una metodología de estimación semiparamétrica como alternativa para modelaje del comportamiento individual de los activos y así mismo, introduce el concepto de cópula para modelar la dependencia entre estos. Con estas herramientas se realiza la aplicación de las cópulas en las medidas de riesgo financiero, utilizando como caso de estudio un portafolio compuesto por cinco activos que trata de replicar la composición de un fondo con perfil de riesgo moderado del sistema de pensiones privado en Colombia.
La medida de riesgo financiero que se utiliza es el Valor en Riesgo (VaR) y se realizan pruebas de desempeño sobre datos de 2013 y 2014, que dan como resultado que la metodología de cópulas obtenga resultados más precisos que los determinados por metodologías que asumen normalidad y las simulaciones históricas.
2
1. INTRODUCCIÓN
Desde finales del siglo XX con la evolución de los mercados financieros se han ido desarrollando metodologías para evaluar el riesgo financiero que permiten a los inversionistas llevar a cabo un mejor manejo del capital en términos de la exposición que tienen frente a los diferentes activos. Los métodos cuantitativos que se establecieron como tradicionales durante este desarrollo se fundamentan en teorías estadísticas que deben cumplir con ciertos supuestos. El tema central de este trabajo se enfoca en la validez de estos supuestos. Esta temática es de gran importancia puesto que la implementación que se realice de un modelo depende en gran medida de los supuestos que se apliquen a las diferentes variables que lo componen. Evaluar si los supuestos que se asumen en las metodologías tradicionales reflejan acertadamente la realidad será el punto de partida del presente estudio. De no cumplirse estos supuestos, es menester responder interrogantes como ¿Cuáles son los supuestos adecuados? ¿Qué modelo estadístico se ajusta a los nuevos supuestos? ¿Cómo se ve impactada la precisión de los resultados obtenidos al cambiar de modelo? Es así como el objetivo central de este documento es implementar una metodología adecuada a las principales medidas de riesgo, permitiendo una mayor precisión en los resultados.
Es importante destacar la relevancia de esta temática en el ámbito económico. “En cualquier economía la adopción de métodos más exactos en la medición de riesgo genera garantías para la estabilidad del sistema financiero”. (Becerra & Melo, 2008, p. 1) Lo anterior, permite evidenciar la percepción que investigadores del Banco de la Republica de Colombia tienen acerca de la importancia de una correcta implementación de modelos para la medición del riesgo en la economía en general. No obstante, la motivación no solo se enfoca en un contexto económico nacional, sino también en la posibilidad de llevar a cabo una inversión más eficiente de los recursos. Usualmente las medidas de riesgo son utilizadas como referencia para medir la exposición que un portafolio tiene al mercado financiero, por lo cual es comúnmente usado para establecer un límite máximo de riesgo al cual puede estar expuesto. Siendo así, estimar de forma más precisa las medidas de riesgo permitiría invertir de forma eficiente, entendiendo eficiencia como la no subestimación o sobreestimación del nivel máximo de riesgo, de tal forma que no se pierda el costo de oportunidad sobre parte de los recursos disponibles. Un ejemplo de la anterior situación es el caso de la sobrestimación del riesgo, donde se fija una restricción muy alta del nivel de riesgo al que se puede estar expuesto y por ende se esperaría obtener menos rendimientos sobre el capital invertido.
En la categoría de medidas de riesgo financiero es posible encontrar una amplia selección de modelos que se usan para este objetivo, pero en el actual documento se dará especial énfasis al Valor en Riesgo (VaR), cuyo funcionamiento se presentará en detalle más adelante. ¿Por qué esta medida y no otras? “Para el caso colombiano, el VaR tiene implicaciones directas en el cálculo de la relación de solvencia en las entidades financieras, un VaR más alto representa una relación de solvencia más baja, lo cual obliga a las entidades a reasignar sus activos riesgosos o a realizar aportes adicionales de capital.” (Becerra & Melo, 2008, p. 1) En otras palabras, el VaR es fundamental en el ámbito regulatorio puesto que está directamente relacionado con la razón de solvencia; es decir, con el capital necesario que debe tener una institución para poder respaldar sus obligaciones. Como se mencionó anteriormente, este es uno de los hechos que motivan la realización de la presente investigación, ya que como lo mencionan Becerra y Melo, esta medida de riesgo determina si una institución debe reasignar la composición de su portafolio u obtener
3
capital adicional. Es así como una correcta medición del VaR permitiría determinar una composición del portafolio que sea lo más eficiente posible.
El VaR no tiene una metodología única para ser calculado; existen gran cantidad de metodologías que es posible aplicar para su determinación. La diferencia entre una y otra radica principalmente en los supuestos y técnicas utilizadas para modelar los activos y su dependencia. En general, el supuesto que comúnmente se aplica para calcular el VaR es que los retornos de los activos se distribuyen de forma normal y con base en este, la técnica que con mayor frecuencia se usa para modelar la dependencia entre los activos es el coeficiente de Pearson. Hecho que sirve como una motivación más para la realización de este documento, dado que la normalidad de los retornos es un supuesto que en la mayoría de las circunstancias no se cumple a cabalidad. En las gráficas 1, 2, 3 y 4 se presenta el gráfico Q-Q para una distribución normal de los retornos en pesos de la tasa IBR, el índice COLCAP, el Vanguard Total Bond Marker Index Fund y el S&P 500 para una serie de los retornos de 1 de Enero de 2008 al 10 de Septiembre de 2014. En un gráfico Q-Q es posible identificar visualmente si la muestra se comporta de acuerdo a una distribución normal si los puntos se superponen a la diagonal. Como se puede observar, los activos presentan valores en las colas que no son caracterizados por la distribución normal y posteriormente se evaluarán metodologías para tratar con el problema de las colas, pero por el momento es importante hacer énfasis en que el uso del coeficiente de Pearson no sería adecuado para estudiar las dependencias existentes entre estos activos.
Gráfico 1: Gráfico Q-Q Distr. Normal Estándar COLCAP Gráfico 2: Gráfico Q-Q Distr. Normal Estándar IBR
Gráfico 3: Gráfico Q-Q Distr. Normal Estándar VBMFX Gráfico 4: Gráfico Q-Q Distr. Normal Estándar S&P500
Es con esta motivación y con el objetivo de encontrar una forma más adecuada de modelar los activos y su dependencia que a continuación se presenta el marco teórico del documento, donde inicialmente se exhiben en detalle dos metodologías usadas para calcular el VaR y
4
posteriormente, el desarrollo de todo lo que será el uso de estimaciones semiparamétricas para hallar las distribuciones individuales de cada activo y el uso de cópulas para obtener la forma funcional de la dependencia entre estos. Seguido, se hace uso de estos tres métodos para calcular el VaR de un portafolio que trata de replicar la composición de un fondo con perfil de riesgo moderado manejado en el sistema de pensiones privado de Colombia. Posteriormente se realizan medidas de desempeño para determinar cuál arroja un mejor resultado. Finalmente, se presentan algunas conclusiones y observaciones que permitan dar mayor claridad a los resultados obtenidos.
Con el fin de dar mayor claridad al procedimiento teórico que se presentará en la siguiente sección, se cree es útil mencionar brevemente y en términos simples lo que se desea lograr con las herramientas conceptuales. En general, la metodología de cálculo de VaR asume que los retornos de los activos se distribuyen de forma normal. Lo anterior permite que la dependencia entre estos activos sea modelada por medio del coeficiente de correlación de Pearson; medida que, en primer lugar, está diseñada para caracterizar estructuras de dependencia lineales, y segundo, resume toda esta estructura en un solo número que según su signo y magnitud indica que tan positiva o negativamente relacionadas son las variables. Lo que se desea lograr es plantear un marco teórico en el que se elimine el supuesto de normalidad y sea posible caracterizar la dependencia de forma que sea posible calcular el VaR y así mismo se capture adecuadamente el comportamiento individual y conjunto de los activos que conforman un portafolio. Es así como la cópula provee la estructura adecuada para lograr este objetivo. Siendo la cópula la función conjunta de variables uniformemente distribuidas, permite utilizar la función de distribución de cada una de las variables para estimar su comportamiento de forma conjunta. El razonamiento conceptual que permite realizar esta “transformación” es aportada por la teoría de generación de números aleatorios que establece que dada una variable aleatoria X con función de distribución Fx, la variable aleatoria U = Fx(X) está uniformemente distribuida en el intervalo [0,1]. Es de esta forma como se obtiene la cópula y con base en esta es posible calcular el VaR.
Por último, es importante mencionar que todos los procedimientos estadísticos que se aplican en el presente estudio se realizan sobre el paquete de software R. Asimismo, se utilizan funciones provenientes de la librería “Rsafd” desarrollada por René Carmona y que se encuentra publicada en su página web de Princeton. Esta librería fue diseñada para la aplicación de las temáticas tratadas en el libro “Statistical Analysis of Financial Data in R”, del cual se obtienen la mayoría de metodologías presentadas en el marco teórico, y en el cual es posible encontrar en detalle el funcionamiento de los comandos. Por otro lado, también se hace uso extensivo de la librería “copula” desarrollada por Marius Hofert, Ivan Kojadinovic, Martin Maechler, y Jun Yan, la cual es posible encontrar en el sitio web oficial del proyecto R.
2. MARCO TEÓRICO
Valor en riego (VaR)
En términos generales Becerra y Melo (2008) presentan una definición clara y simple sobre esta medida: el VaRα corresponde al α-ésimo cuantíl de la distribución de pérdidas y ganancias de un activo; esta medida representa la máxima pérdida en que incurre un activo en el α x 100% mejor de los casos. Aunque en la definición se especifica el VaR para un activo, es equivalente para un portafolio compuesto por diversos activos. Es así como en el más sencillo de los casos (un activo) calcular el VaR se limita a encontrar la función de distribución que caracteriza sus
5
pérdidas y ganancias y obtener el α-ésimo cuantíl. En la gráfica 5 se exhibe lo que sería la forma general de esta medida de riesgo. Es importante resaltar que usualmente se elige el cuantíl correspondiente al 5% y 1 % de la distribución, por lo que el VaR es una medida que toma en cuenta el riesgo de cola, o en otras palabras, el riesgo que al que se está expuesto en escenarios extremos.
Se debe aclarar que el VaR se expresa en una medida monetaria, es por esto que la distribución de pérdidas y ganancias se calcula de la forma
𝑃𝑚∗ 𝑃𝑖 𝑃𝑖−1
donde Pi es el valor del activo en el día i y Pm es el precio hoy. Como tal, multiplicar el retorno 𝑃𝑖
𝑃𝑖−1 por el precio de hoy permite expresar la distribución en unidad monetaria. En el presente
estudio se utilizará el Valor en Riesgo Relativo (RVaR), que expresa la distribución de pérdidas y ganancias en términos del retorno únicamente y consecuentemente presenta el VaR como valor porcentual, indicando que es la pérdida esperada en términos relativos.
Una primera metodología por medio de la cual es posible obtener el RVaR de un portafolio es la simulación histórica, donde se utiliza la serie de retornos de cada uno de los activos que lo componen y se calcula el retorno total de acuerdo a su composición. Una vez se tiene la serie de retornos del portafolio, se proceden a organizar de menor a mayor y se selecciona el valor que se encuentre en la α x 100% posición de la zona correspondiente a las pérdidas. Esta sería la metodología más simple, en el sentido que asume que la información pasada es suficiente guía para determinar un escenario de lo que podría pasar en el futuro, limitando así el procedimiento a realizar un cálculo descriptivo sobre la muestra. (Hull, 2005) Aunque este método tiene como ventaja ajustarse con mayor precisión al comportamiento histórico del portafolio, no aporta herramientas que permitan realizar un ejercicio de simulación para identificar posibles casos que no se hayan presentado en el pasado.
Gráfico 5: Ejemplo de una función de pérdidas y ganancias. (Becerra & Melo, 2008)
En segunda instancia, se presenta el enfoque de construcción de un modelo para calcular esta media de riesgo. En principio, la construcción de un modelo requiere definir supuestos que permitan aplicar una determinada metodología. La metodología presentada a continuación tiene dos supuestos fundamentales: primero, los retornos de los activos se comportan de acuerdo a una
6
distribución normal y segundo, el cambio esperado del retorno de un activo es cero. (Hull, 2005) Si se asume que todos los activos se distribuyen normal, entonces por definición es posible afirmar que la distribución del portafolio también es normal. Es entonces como la estimación del α-ésimo cuantíl puede obtenerse con dos parámetros: la desviación estándar del portafolio y el nivel de confianza α. Al estar conformado por varios activos, el cálculo de la desviación estándar de un portafolio no solo debe tener en cuenta la variabilidad individual de cada activo, sino que también debe considerar la dependencia que existe entre cada uno de ellos. De acuerdo con lo anterior, esta medida de dispersión se obtiene por medio de la ecuación 1, donde ρij es el coeficiente de correlación de Pearson entre el activo i y j, αi es la participación que tiene el activo i en el portafolio y σi es la desviación estándar del activo i.
𝜎𝑃 = √∑ ∑ 𝜌𝑖𝑗𝛼𝑖𝛼𝑗𝜎𝑖𝜎𝑗 𝑛
𝑗=1 𝑛
𝑖=1
Ecuación 1: Desviación estándar de un portafolio.
Se observa que en la ecuación se incluye el coeficiente de Pearson, medida con la cual se cuantifica la dependencia lineal que existe entre dos variables. Las ecuaciones 2 y 3 presentan la expresión matemática con la que se obtiene el coeficiente de correlación y la covarianza respectivamente, donde n es el tamaño de la muestra, rik es la k-ésima observación de la serie de retornos del activo i, y 𝑟̅ es el retorno promedio del activo i. (Becerra & Melo, 2008) Es 𝑖 importante aclarar que el uso de esta medida es apropiada únicamente cuando los retornos de los activos siguen una distribución normal multivariada (Bouyé et al, 2000) o de forma más general, cuando su función de distribución es elíptica. (Embrechts et al, 1999) Algunas de las ventajas que presenta esta medida de dependencia radican en su facilidad de interpretación, puesto que se caracteriza toda la relación lineal por medio de un valor escalar que puede tomar valores reales entre -1 y 1, siendo -1 perfecta y negativamente correlacionado y 1 perfecta y positivamente correlacionado.
𝜌𝑖𝑗 =𝑐𝑜𝑣(𝑅𝑖, 𝑅𝑗)
𝜎𝑖𝜎𝑗 𝑐𝑜𝑣(𝑅𝑖, 𝑅𝑗) = 1
𝑛 − 1∑(𝑟𝑖𝑘− 𝑟̅)(𝑟𝑖 𝑗𝑘− 𝑟̅)𝑗 𝑛
𝑘=1 Ecuación 2: Coeficiente de correlación de Pearson. Ecuación 3: Covarianza.
Finalmente, la ecuación 4 exhibe el cálculo del RVaR bajo el modelo tratado, donde N-1(α) es la función inversa de la probabilidad acumulada α para una distribución normal.
𝑅𝑉𝑎𝑅𝛼 = 𝑁−1(𝛼) ∗ 𝜎𝑃 Ecuación 4: Valor en riesgo (RVaR).
Metodología de cópulas
Carmona (2014) presenta un marco teórico sobre esta metodología que se presentará de una forma breve y concisa. Una Cópula es la distribución conjunta de variables aleatorias uniformemente distribuidas. Entonces si U y V se distribuyen U(0,1), la función C definida en [0,1] x [0,1] por
7
es una cópula. En adición, si X y Y son variables aleatorias con distribuciones de probabilidad Fx y Fy, entonces la distribución conjunta de las variables aleatorias uniformes
es llamada la cópula de (X,Y).
Becerra y Melo (2008) presentan otra definición: La cópula, en líneas generales, es una función que aproxima el comportamiento conjunto de variables aleatorias a partir de sus comportamientos individuales; esta aproximación tiene la ventaja de presentar el concepto de dependencia como una estructura que describe completamente los factores de riesgo, en lugar de tratar de resumirla en un solo número. Asimismo, Carmona (2008) plantea una serie de propiedades asociadas a una cópula:
1. C no cambia si se reemplaza X o Y por una función no decreciente de X y Y.
2. La función de probabilidad conjunta de (X,Y) puede ser recuperada de la cópula y las función de probabilidad marginal por medio de la fórmula:
3. C es única si F(X,Y)(x,y) es continua. 4. C(u,v) es no decreciente en cada variable.
5. C(u,1) = u y C(1,v) = v en tanto que las distribuciones marginales de una cópula son distribuidas uniformemente.
6. Si u1 <= u2 y v1 <= v2, entonces:
La cópula se utiliza para variables aleatorias multivariadas, haciendo referencia a que se está estudiando más de una variable aleatoria. Adicionalmente, es importante resaltar que es una metodología de estimación paramétrica, es decir, existe una variedad de familias de cópulas y es necesario encontrar cuál de estas se ajusta con mayor precisión la muestra de datos. La especificación de las principales familias de cópulas se encuentra en el Anexo A, pero es posible identificar las principales como la cópula normal, t, Clayton, Frank y Gumbel.
Hasta el momento se presenta una idea abstracta de lo que es una cópula, pero no es claro qué se necesita ni cómo se llegará a este resultado. Es así, como el siguiente paso es exponer el procedimiento desde la caracterización de la distribución de los datos hasta la estimación de la cópula como distribución conjunta de estos. Para lograr lo anterior se presenta un conglomerado de aplicaciones estadísticas que presenta Carmona (2014) omitiendo ciertos conceptos que extienden el punto central de la discusión.
En un principio se debe estudiar cada una de las variables aleatorias por separado. Es importante evaluar con gráficos Q-Q la similitud que los datos puedan tener con las diferentes familias de distribuciones univariadas para obtener una idea de la posible distribución que los caracteriza. De acuerdo con Becerra & Melo (2008) y Carmona (2008) en el caso de estudio de activos financieros es usual encontrar comportamientos muy concentrados hacia el centro de la distribución con valores extremos en las colas que no se comportan como los demás. Es posible evidenciar este hecho en los Gráficos 1 - 4, en los cuales las colas de la distribución tienden a
8
desviarse del patrón de comportamiento. Por lo anterior, es apropiado en estos casos utilizar una metodología de estimación semi-paramétrica; en otras palabras, se estima la distribución de manera mixta: para la porción de la distribución con la que se cuenta con una gran cantidad de datos es posible implementar métodos de estimación no paramétrica, mientras que en las colas de la distribución se aplican metodologías asociadas a distribuciones de colas pesadas.
Existen tres grandes metodologías de estimación no paramétrica: Función de distribución acumulada empírica, histogramas y estimador Kernel. De acuerdo con la literatura, en general la metodología más apropiada cuando se cuenta con una adecuada cantidad de datos en la muestra es el estimador Kernel, puesto que soluciona problemas asociados a los primeros dos métodos de estimación. En términos teóricos Carmona (2014) presenta la definición del estimador Kernel de la siguiente forma.
Dada una muestra x1,…,xn de una distribución (desconocida) con densidad f(x), la definición formal de la un estimador Kernel de f es la función 𝑓̂𝑏 definida por:
𝑓̂ =𝑏 1
𝑛𝑏∑ 𝐾 ( 𝑥 − 𝑥𝑖
𝑏 ) 𝑛
𝑖=1
Donde la función K es una función no negativa dada que se integra a 1 (esto es, una función de densidad de probabilidad) que es llamada el Kernel, y b > 0 es un número positivo que es llamado el ancho de banda. (Carmona, 2014, p. 41)
En términos más simples, la interpretación de la anterior fórmula es que sobre cada punto de la muestra xi, se centra una copia escalada de la función Kernel K, y el estimado de la densidad final es la superposición de todos estos “lotes”. La división por nb garantiza que la masa total de la función sea 1 (esto es, que la integral de 𝑓̂𝑏 sea 1). Existen 7 tipos de Kernel, pero en el momento se describirán los 4 más comúnmente utilizados, los cuales se especifican en el Gráfico 6 para mayor claridad.
Gráfico 6: Cuatro tipos de Kernal. Superior izquierdo: Kernel Rectangular. Superior Derecho: Kernel Triangular. Inferior Izquierdo: Kernel coseinoidal. Inferior Derecho: Kernel Gaussiano. (Carmona, 2014)
9
Además del tipo de Kernel usado, es importante definir adecuadamente el ancho de banda puesto que este determina el grado de suavizamiento de la función de densidad estimada. Su relevancia radica en que si se suaviza demasiado (ancho de banda alto) se pierden características importantes de la muestra (en especial para los valores extremos), pero si por el contrario se suaviza poco (ancho de banda bajo) se ajusta en mayor medida a los datos de la muestra perdiendo efectividad al momento de caracterizar los datos en una distribución.
Habiendo aclarado las ventajas y limitaciones expuestas en la metodología de estimación de Kernel, es posible dar paso a las distribuciones de colas pesadas, en donde se da solución a la problemática que tiene el Kernel para ajustarse a los valores extremos de la muestra.
El tratamiento de los valores extremos es de gran importancia para el cálculo del RVaR, puesto que como se presentó al inicio de la sección, es una medida asociada al extremo de la distribución. El objetivo final de calcular esta medida de riesgo permite evidenciar la importancia de modelar correctamente los valores extremos, de los cuales depende captar adecuadamente el comportamiento de las colas de la distribución.
La metodología que presenta Carmona (2014) para modelar los valores extremos se centra en las llamadas Distribuciones de Pareto, cuya implementación inicialmente se define para muestras que evidencian una sola cola y son distribuciones que toman solo valores positivos (Ordinarias), pero que se puede expresar en una metodología general para dos colas y valores negativos y positivos. El procedimiento de ajustamiento que se implementará en el estudio se conoce como Distribuciones de Pareto Generalizadas (DPG), y consta de ajustar en cada una de las colas una Distribución de Pareto Ordinaria para los respectivos valores y nada especial en la mitad.
La Distribución de Pareto Ordinaria (DPO) es una metodología de estimación paramétrica cuya forma funcional es conocida y el objetivo es estimar los parámetros para que caractericen adecuadamente los datos en la cola que se está evaluando. La estructura que presenta una DPO es la siguiente:
En donde m es un parámetro de localización, λ es un parámetro de escala y ξ es un parámetro de forma.
De manera más específica, el procedimiento mencionado para encontrar la distribución de las dos colas (Distribución de Pareto Generalizada), será caracterizado por:
Un parámetro de localización 𝑚+, un parámetro de escala 𝜆+ y un parámetro de forma 𝜉+especificando la DPO que aplica al lado derecho del umbral 𝑚+.
Un parámetro de localización 𝑚−, un parámetro de escala 𝜆− y un parámetro de forma 𝜉−especificando la DPO que aplica al lado izquierdo del umbral 𝑚−.
10 Cualquier distribución en el intervalo [𝑚+, 𝑚−].
El siguiente paso es estimar los parámetros de la función. Para esto existen tres grandes metodologías: Método de momentos L, Estimación de Máxima Verosimilitud y Método de Block-Maxima. De acuerdo con las metodologías que se utilizarán más adelante en el desarrollo de la parte empírica, se presentará el marco teórico de la metodología de Estimación de Máxima Verosimilitud, con el cual se estimarán los parámetros posteriormente.
El Método de Máxima Verosimilitud (MV) presenta una ventaja en este caso particular puesto que se conoce de forma explícita la forma funcional de la distribución para la cual se desean estimar los parámetros. La única diferencia en términos de las aplicaciones usuales de esta metodología radica en el hecho de que se imponen restricciones sobre el dominio para el cual se encuentra definida esta función. Tal como se enunció en el marco teórico de la Distribución de Pareto Generalizada (DPG), la función de probabilidad se encontraría definida para un subconjunto de valores del dominio de la función completa. Carmona (2014) aclara que este es un percance menor que puede ser pasado por alto en la práctica. A continuación se presenta el marco teórico relacionado con el método MV basado en lo planteado por Carmona (2014)
En el caso de una DPG es importante resaltar que se debe diferenciar cuando ξ = 0 y cuando ξ ≠ 0. En el primer caso, se reduce al análisis de muestras exponenciales. De hecho, la función de densidad estaría dada por:
Si 𝑥 ≥ 𝑚 y 0 de lo contrario. Esto implica que la verosimilitud de la muestra 𝑥1, … , 𝑥𝑛 esta dada por:
Si min {𝑥1, … , 𝑥𝑛} ≥ 𝑚 y 0 de lo contrario. Por lo tanto, la correspondiente log-verosimilitud está dada por:
Lo que lleva a los estimadores de máxima verosimilitud de localización y escala de una muestra exponencial.
Por otro lado cuando ξ ≠ 0 se obtiene una función de densidad dada por:
Si 𝑥 ≤ 𝑚 −𝜆
𝜉 para ξ < 0 o 𝑥 ≥ 𝑚 − 𝜆
𝜉 para ξ > 0, y 0 de lo contrario. Esto implica que la verosimilitud de la muestra 𝑥1, … , 𝑥𝑛 esta dada por:
11 Si max {𝑥1, … , 𝑥𝑛} ≤ 𝑚 −𝜆
𝜉 para ξ < 0 o min{𝑥1, … , 𝑥𝑛} ≥ 𝑚 − 𝜆
𝜉 para ξ > 0, y 0 de lo contrario. Finalmente, la correspondiente log-verosimilitud está dada por:
Con las mismas restricciones de dominio.
Hasta el momento se definió la metodología que es utilizada para estimar la función de distribución de una variable aleatoria de forma que se ajuste adecuadamente, tanto en los datos del centro como a los datos de los extremos de la distribución. Lo que permite conectar este resultado con las cópulas explicadas inicialmente está sustentado en dos hechos fundamentales de la teoría de la generación de números aleatorios, los cuales se presentan a continuación.
Hecho 1: Dada una variable aleatoria X con función de distribución Fx, la variable aleatoria U = Fx(X) está uniformemente distribuida en el intervalo [0,1].
Hecho2: Si U ~ U(0,1) y F es una función de distribución, entonces si se define la variable aleatoria X por X = F-1(U) necesariamente se tiene que Fx = F.
En el presente documento no se hace énfasis en la sustentación teórica de estos hechos, pero es posible encontrarlos en Carmona (2014) en la sección de “Monte Carlo Computations”.
El hecho 1 implica que es posible transformar los datos originales de una muestra y crear una muestra multivariada en la unidad cuadrada de forma que las funciones marginales sean uniformes. Es así, como con base en las funciones de distribución marginales halladas por la metodología de estimación semi-paramétrica es posible realizar la posterior transformación y poder inferir la forma funcional de la cópula que contienen la información completa, tanto de las distribuciones individuales, como de la distribución conjunta (dependencia) de las variables analizadas.
Una vez se elige la familia de cópulas que más se ajusta a las variables, se procede a generar una cantidad significativa de simulaciones para obtener una muestra de observaciones simuladas de la cual es posible extraer posteriormente el α-ésimo cuantíl y obtener el RVaR correspondiente.
3. CASO DE APLICACIÓN
Como se mencionó en un principio, se pretende aplicar la teoría planteada anteriormente a un portafolio representativo de un fondo de pensiones colombiano. En términos generales, un portafolio perteneciente a una de estas instituciones contiene infinidad de activos que por razones de acceso de información y herramientas computacionales, no es posible evaluar en detalle. En contraste, es posible evaluar un portafolio semejante al que publica Asofondos en donde se presenta la composición del portafolio del sistema general de pensiones privado por clase de activo. En la gráfica 7 es posible observar esta composición para los cuatro portafolios que ofrece el sistema de multifondos en Colombia, clasificados por perfil de riesgo a 31 de Diciembre de 2013.
12
Gráfica 7: Composición de cada uno de los portafolios del sistema multifondos a 31 de Diciembre de 2013
Adicionalmente, se concentra el estudio en el portafolio moderado puesto que según las fichas técnicas publicadas a Julio de 2014 por Porvenir S.A, una empresa representativa del sector, es el portafolio que mayor porcentaje tiene de los recursos administrados en relación con el negocio de pensiones obligatorias. Una vez definido el portafolio con el cual se va trabajar, se deben seleccionar instrumentos que sean representativos de cada uno de los tipos de activos que componen el portafolio. No fue posible determinar instrumentos representativos de algunas clases de activos y en otros casos no se encontró la información necesaria para el estudio estadístico de otros activos, por lo que se pensó conveniente excluir algunos tipos de activos y modificar ligeramente las ponderaciones de la composición del portafolio para facilitar el desarrollo del estudio. El portfolio a evaluar se presenta en la Tabla 1 y en la gráfica 8. Adicionalmente, es posible observar los instrumentos seleccionados para representar cada clase de activo, resaltando que por facilidad del estudio, se asume que los títulos en el exterior se refieren a títulos en Estados Unidos.
13
Ticker Descripción Tipo Activo Peso
IBR Tasa overnight COP Vista 4%
COLCAP Indice accionario BVC RV Local 29%
IDP Indice deuda pública Colombia Deuda Pública 47% VBMFX Vanguard Total Bond Market Index Fund RF Exterior 3% S&P 500 Standard and Poor’s 500 RV Exterior 17%
Tabla 1: Información de activos y composición del portafolio seleccionado para el estudio.
Las series de datos fueron obtenidas para el periodo entre 1 de Enero de 2008 al 10 de Septiembre de 2014. Se seleccionó así, no solo por la disponibilidad de los datos para todos los activos, sino también porque se incluye un periodo de crisis financiera a nivel mundial que permite captar el comportamiento de los activos bajo escenarios muy negativos y bajo escenarios de posterior recuperación. Las series se obtuvieron de diferentes fuentes, entre las que se encuentran Yahoo Finance, Bolsa de Valores de Colombia, Banco de la República y Corficolombiana.
En primer lugar, es importante obtener una caracterización de las series usadas. En el Anexo B se puede observar en detalle el comportamiento de la serie de precios de cada uno de los activos junto con la evolución de los retornos logarítmicos en el periodo estudiado. Esta descripción gráfica del precio y retorno de los activos aporta información muy limitada; como tal, solo es posible observar una serie de retornos que aparentemente se mueve de forma aleatoria, con algunos valores extremos que se presentan eventualmente. Estos valores extremos se refieren a los incrementos y descensos repentinos en el retorno de un activo.
Carmona (2014) realiza una aclaración que es importante al momento de definir como modelar los datos, tomando en cuenta que son series de tiempo. Enfatiza que el proceso temporal que sigue cada una de la series no es de mayor relevancia para este estudio, puesto que lo que se busca es caracterizar la relación de los activos y el comportamiento individual en un día cualquiera. Es por lo anterior que se omiten pruebas relacionadas con el estudio temporal de las muestras y se procede a implementar la metodología como se planteó en el marco teórico.
El paso a seguir es evaluar las características de cada uno de los activos. Como se identificó en la sección introductoria del documento, los gráficos Q-Q para una distribución normal de cuatro de los cinco activos se ajustan en la parte central, pero las colas tienen un comportamiento que difiere con esta distribución. El gráfico 9 exhibe el gráfico Q-Q del IDP, que presenta un mayor ajuste a la distribución normal, con excepción de unos pocos valores extremos en las colas.
14
Gráfica 9: Gráfico Q-Q Distr. Normal Estándar IDP.
A continuación se da inicio al tratamiento de la muestra con el fin de estimar la distribución de probabilidad acumulada de cada uno de los activos. Se explicará en detalle el procedimiento con el COLCAP para poder relacionar los procedimientos empíricos con lo desarrollado en el marco teórico. Dado que el procedimiento en general se aplica de la misma forma a todos los activos, para el IBR, S&P 500, IDP y VBMFX se presentarán los resultados, pero sin profundizar en el procedimiento.
COLCAP
Inicialmente se tratan los valores extremos que toman las colas de la distribución, para lo cual se aplica la metodología DPG. Para llevar a cabo este procedimiento se debe definir el parámetro de localización a partir del cual se analizaran las muestras pertenecientes a, tanto la cola derecha, como la cola izquierda. La función shapeplot permite graficar el valor que toma este parámetro de localización para cada uno de los puntos de la muestra. Adicionalmente, presenta el porcentaje de datos que se encuentran a partir de ese punto; en relación a lo anterior, Carmona (2014) recomienda que se tome un punto de corte donde se pueda obtener al menos un 10% de los datos de la muestra. La gráfica 10 permite observar esta información. De acuerdo con lo anterior, parece adecuado seleccionar como punto de corte 0.013 para la cola superior y -0.049 para la cola inferior. Estos valores se determinan con base en la observación de la gráfica, dado que en el momento no se cuenta con algún algoritmo de selección.
15
Gráfica 10: Shapeplot de las colas del COLCAP
Una vez determinados los valores de corte para cada una de las colas, se procede a realizar la estimación de la DPG por medio de la función fit.gdp. El resultado de esta función es un vector de que contiene las estimaciones de los parámetros de escala y forma para cada una de las colas; así mismo contiene la información de los valores estimados de la DPG. Adicionalmente, presenta una gráfica de los excesos sobre el umbral seleccionado contra los cuantíles de la DPG estimada para cada una de las colas. Es posible observar en la gráfica 11 el resultado de esta función. Según Carmona (2014) el comportamiento lineal de los puntos al principio de la gráfica es indicador de que la DPG es una metodología apropiada para el tratamiento de los valores extremos. Con el fin de comprobar gráficamente que se realizó adecuadamente la estimación, existe la función tailplot que presenta un gráfico del estimado de las colas de la función de distribución. La gráfica 12 permite evidenciar que se realizó un ajuste satisfactorio, puesto que los puntos sobre el plano se alinean en su mayoría con la línea de estimación.
16
Por otro lado, es importante que la estimación sea igual de efectiva al momento de realizar simulaciones. El comando rgpd permite obtener la probabilidad asociada a una función de distribución estimada para una cantidad determinada de realizaciones que se especifican como parámetros del comando. Para lograr visualizar de manera clara si las simulaciones sirven, se da la instrucción al comando de crear tantas realizaciones como cantidad de datos hay en la muestra. Posteriormente se realiza un gráfico Q-Q que evalúa los datos de la muestra original contra los estimados. Los resultados se pueden observar en la gráfica 13.
Gráfica 12: Gráfico de colas de la estimación DPG para COLCAP.
Gráfica 13: Gráfico Q-Q de datos originales contra datos simulados de la estimación DPG.
Con estos resultados se puede realizar la comparación entre la gráfica 1 y la gráfica 13, donde se identifica el impacto que tiene la correcta estimación del comportamiento de las colas en la
17
distribución. Lo anterior dado que los valores en la diagonal se encuentran más cercanos a la diagonal y gráficamente tiene un mejor ajuste.
Indicador Bancario de Referencia (IBR)
En las gráficas 14 – 17 se exhibe el procedimiento explicado anteriormente para la muestra de datos del índice bancario de referencia (IBR). A diferencia del COLCAP el gráfico 15 ilustra los resultados de estimación DPG no presenta un comportamiento lineal tan marcado en los puntos al principio del plano en ambas colas; no obstante, se realizaron estimaciones con varios valores para los parámetros de localización para el proceso de estimación DPG, y dado que se obtienen mejoras en el ajusto de la distribución (Gráfica 17), se determinó que no presenta mayores inconvenientes. Los parámetros de localización identificados del shapeplot fueron 0.0065 y -0.0065 para la cola derecha e izquierda respectivamente.
Gráfica 14: Shapeplot de las colas del IBR. Gráfica 15: Resultados estimación DPG para IBR.
Gráfica 16: Gráfico de colas de la estimación DPG para IBR. Gráfica 17: Gráfico Q-Q de datos originales contra datos simulados de la estimación DPG para el IBR.
Standard & Poor’s 500 (S&P 500)
Las gráficas 18 – 21 exhiben los resultados obtenidos para la estimación de la distribución de probabilidad del Standard & Poor’s 500. Se observa un comportamiento similar al del COLCAP en el caso del gráfico de resultados de estimación DPG (Gráfica 19), donde se identifica un patrón lineal en los puntos que se encuentran al comienzo del plano. Lo anterior implica que el DPG es un método apropiado para modelar las colas de este activo y se evidencia en la gráfica 20, en la que los puntos se superponen de manera satisfactoria sobre la función estimada. Adicionalmente, el gráfico 21 permite visualizar un mejor ajuste en términos del
18
comportamiento de la muestra y la distribución estimada, tanto para la parte central, como para las colas de la distribución. Los parámetros de localización utilizados fueron 0.015 y -0.015 para la cola derecha e izquierda respectivamente.
Gráfica 18: Shapeplot de las colas del S&P 500. Gráfica 19: Resultados estimación DPG para S&P 500.
Gráfica 20: Gráfico de colas de la estimación DPG para S&P 500. Gráfica 21: Gráfico Q-Q de datos originales contra datos simulados de la estimación DPG para el S&P 500.
Vanguard Total Bond Index Fund (VBMFX)
Las gráficas 22 – 25 exhiben los resultados obtenidos para la estimación de la distribución de probabilidad del Vanguard Total Bond Index Fund. Se observa un comportamiento similar al del COLCAP y el S&P 500, con la única diferencia que en el caso de la cola inferior se observa una ligera desviación del patrón lineal en el gráfico 23; no obstante, en el gráfico 24 se identifica un buen ajuste en términos de las observaciones con la función estimada. Adicionalmente, se evidencia una mejora significativa en el gráfico Q-Q (Gráfico 25). Los parámetros de localización utilizados fueron 0.0065 y -0.0075 para la cola derecha e izquierda respectivamente.
19
Gráfica 22: Shapeplot de las colas del VBMFX. Gráfica 23: Resultados estimación DPG para VBMFX.
Gráfica 24: Gráfico de colas de la estimación DPG para VBMFX. Gráfica 25: Gráfico Q-Q de datos originales contra datos simulados de la estimación DPG para el VBMFX.
Índice Deuda Pública (IDP)
Las gráficas 26 – 29 exhiben los resultados obtenidos para la estimación de la distribución de probabilidad del índice de deuda pública. En términos generales, este activo se comporta diferente los anteriores cuatro, en el sentido que presenta muy pocas observaciones en escenarios extremos. La gráfica 6B que se encuentra en el anexo B exhibe el comportamiento de los retornos de este activo y se evidencia que solo en dos momentos del tiempo se evidenciaron variaciones extremas del activo. Es por lo anterior que, no importa la metodología que se utiliza, es complejo el modelamiento de los valores extremos cuando se tienen tan pocas observaciones. Aun así, se implementó la metodología de estimación y de acuerdo con los resultados exhibidos en las gráficas 27 y 28, se determinó que estimar la distribución de acuerdo a este procedimiento aporta consistencia al ejercicio y no afecta el resultado final. Los parámetros de localización utilizados fueron 0.0025 y -0.0017 para la cola derecha e izquierda respectivamente.
20
Gráfica 26: Shapeplot de las colas del IDP. Gráfica 27: Resultados estimación DPG para IDP.
Gráfica 28: Gráfico de colas de la estimación DPG para IDP. Gráfica 29: Gráfico Q-Q de datos originales contra datos simulados de la estimación DPG para el IDP.
Cópula
Con las estimaciones de las distribuciones de probabilidad acumulada de cada uno de los activos, es posible estimar la cópula y evaluar cuál de las familias tiene mayor ajuste a los activos. Para lo anterior se utiliza el comando fitCopula que utiliza como parámetro una matriz que contiene las cinco distribuciones de probabilidad y estima los parámetros de la función conjunta por medio de la metodología de máxima verosimilitud. Se realizó la estimación para cópula normal, t, Gumbel, Clayton y Frank.
Familia Verosimilitud Param 1 Error Std. Pr(>|z|) Param 2 Error Std. Pr(>|z|)
Normal 37.1365 0.0720 0.0093 9.25E-15 - - - T 130.3071 0.0682 0.0099 6.29E-12 7.8620 0.6874 2.72E-30 Gumbel 22.0307 1.0373 0.0070 0.00E+00 - - - Clayton 51.7415 0.0925 0.0111 9.83E-17 - - -
Frank 28.1240 0.3384 0.0515 5.18E-11 - - -
Tabla 2: Resultados estimación familias de cópulas.
De acuerdo con los resultados de las estimaciones presentados en la tabla 2, se determinó que la familia de cópulas que mayor ajuste tiene es la cópula T. Lo anterior con base en la gran diferencia que se obtiene en la verosimilitud que tiene esta función y en la significancia de los parámetros estimados. Esta cópula contiene el efecto individual y conjunto de los activos, con la que es posible realizar simulaciones que permitan generar instancias de retornos que no necesariamente han tenido lugar en el pasado, pero que de acuerdo con este patrón de
21
comportamiento lo podrían hacer en el futuro. Es con base en este hecho que para calcular el RVaR del portafolio se generan 1.000 muestras que siguen el comportamiento de la cópula T anteriormente estimada por medio del comando rcopula. La gráfica 30 exhibe la distribución de pérdidas y ganancias simulada donde se evidencian a primera vista algunas de las ventajas de esta metodología. En primer lugar, con la herramienta de simulación es posible generar una muestra lo suficientemente grande que permita evaluar los diferentes escenarios que se pueden presentar en el periodo para el cual se está calculando la medida. Por otro lado, se observa como la cópula contempla el efecto del correcto modelamiento de los valores extremos al generar muestras que se sitúan en los extremos de la distribución.
Gráfica 20: Simulación de distribución de pérdidas y ganancias del portafolio.
El RVaR5% del portafolio es el quantíl correspondiente al 5% de la muestra simulada. Es así como se obtiene un resultado de -0.747%, lo que quiere decir que en el 5% de los casos se esperaría tener una pérdida igual o mayor a 0.747%. En otras palabras, si la metodología de estimación es adecuada, en un horizonte de 100 días se deberían observar pérdidas iguales o mayores a este nivel en 5 días. De acuerdo con lo anterior, se realizó la estimación del RVaR por medio de simulación histórica y con el modelo que supone normalidad, explicados ambos al inicio del marco teórico. Los resultados obtenidos fueron -0.787% y -1.263% respectivamente.
Con el fin de evaluar cual metodología de estimación tiene mayor precisión, se realizaron medidas de desempeño sobre los últimos 200 días de la muestra original. Lo anterior quiere decir que se estimó el RVaR para cada uno de los últimos 200 días, utilizando la serie de datos únicamente hasta el día en que se realiza el cálculo. Las gráficas 31 – 33 exhiben los resultados de las pruebas. Como se mencionó anteriormente, para un RVaR5% se esperaría que en 10 de los 200 días evaluados se observaran pérdidas iguales o mayores al nivel calculado. Para los métodos de simulación histórica y modelo con supuesto de normalidad, se evidencia que en ningún punto el retorno realizado del portafolio alcanza el nivel del RVaR5%; por el contrario, con el modelo de cópula T se presentan 2 días en el que se alcanza este nivel.
22
Gráfica 31: RVaR5% con simulación histórica. Gráfica 32: RVaR5% con modelo asumiendo normalidad.
Gráfica 33: RVaR5% con modelo de cópula T.
4. CONCLUSIONES
En términos de precisión en los resultados, las pruebas de desempeño permiten concluir que se necesita mejorar la metodología para que sea posible evidenciar la cantidad de días esperados en los que se alcanza el nivel del RVaR. En comparación con las metodologías de simulación histórica y modelo que asume normalidad, se lograron mejoras dado que en ninguno de los casos se evidenció que el retronó alcanzara el nivel esperado ningún día.
En relación con la motivación inicial de evaluar y cuestionar el ampliamente aceptado supuesto de normalidad sobre los retornos de los activos y los resultados que este arroja, se puede afirmar que se lograron los objetivos propuestos en un principio. Se presenta evidencia de que el supuesto de normalidad, para el caso específico del portafolio estudiado, sobrestima el riesgo. Lo anterior causa que se establezca un nivel más alto de RVaR, estimando mayores pérdidas de las que realmente se deben contemplar. Como se comentó al inicio de la sección del caso de aplicación, el ejercicio intento simular un portafolio compuesto de forma similar al de un portafolio de perfil de riesgo moderado de un fondo representativo de pensiones privado de Colombia; según información publicada por Porvenir S.A, la AFP líder de Colombia, a Julio de 2014 este portafolio administraba recursos por un valor de alrededor 56 billones de pesos. Lo anterior implica que una diferencia de 0.516 puntos porcentuales en el RVaR que se obtuvo entre
23
la estimación con cópula T y modelo con supuesto de normalidad corresponde a una diferencia de alrededor 287 mil millones de pesos en la percepción del riesgo al que está expuesto el portafolio. La importancia de este resultado radica en que si se percibe equivocadamente el riesgo, la composición del portafolio no se va realizar de forma óptima y por lo tanto se estaría perdiendo un costo de oportunidad sobre estos recursos.
En cuanto a la precisión, se esperaba obtener resultados más satisfactorios en las pruebas de desempeño. Aunque si se evidencia una mejora, es importante evaluar qué factores pueden afectando la estimación final. En principio, se podría pensar en la alternativa de modelar las distribuciones de probabilidad individual de tal forma que sean tratadas como series de tiempo y se estimen con procesos que incorporen la volatilidad dinámica que caracteriza los activos financieros. Por otro lado, el procedimiento de estimación en las pruebas de desempeño es más complejo dado que los parámetros de localización que se usan para estimar la distribución en las colas pueden cambiar a medida que se agrega nueva información a la muestra; para efectos del presente estudio se utilizaron los valores mencionados en el caso de aplicación para la estimación del RVaR en todos los 200 días de las pruebas.
En general el procedimiento permitió evidenciar resultados satisfactorios acorde con los objetivos planteados en un principio y se espera tratar las posibles fallas mencionadas anteriormente en trabajos futuros.
24 REFERENCIAS
Becerra, O. & Melo, L.F. (2008). Medidas de riesgo financiero usando cópulas: Teoría y aplicaciones. Borradores de Economía del Banco de la Republica de Colombia. Recuperado el día 11 de Septiembre de 2014 de la base de datos del Banco de la República.
Bouy´e, E., V. Durrleman, A. Nikeghballi, G. Riboulet, & T. Roncalli (2000): “Copulas for Finance - A Reading Guide and Some Applications,” Discussion paper, available at SSRN: http://ssrn.com/paper=1032533.
Carmona, R. (2014) Statistical analysis of financial data in R (2da Ed.). Princeton, New Jersey, EE.UU: Springer.
Embrechts, P., A. Mcneil, & D. Straumann (1999): “Correlation and Dependency in Risk Management: Properties and Pitfalls,” RISK Magazine, pp. 69–71.
Hull, J. (2005). Options, Futures and other derivatives. (6ta Ed.). Upper Saddle River, New Jersey. EE.UU: Pearson Prentice Hall.
25 ANEXOS
ANEXO A
Algunas cópulas d-dimensionales
26 ANEXO B
IBR
Gráfica 1B: Serie de precios del IBR Gráfica 2B: Retornos logarítmicos IBR
COLCAP
Gráfica 3B: Serie de precios del COLCAP Gráfica 4B: Retornos logarítmicos CAOLCAP
IDP
Gráfica 5B: Serie de precios del IDP Gráfica 6B: Retornos logarítmicos IDP
27
Gráfica 7B: Serie de precios del S&P 500 Gráfica 8B: Retornos logarítmicos S&P 500
VBMFX