Modelos de volatilidad estocástica: una alternativa atractiva y factible para modelizar la evolución de la volatilidad

60 

Texto completo

(1)Anales de Estudios Económicos y Empresariales, Vol. XVIII, 2008, 9-68. 9. Modelos de Volatilidad Estocástica: Una Alternativa Atractiva y Factible para Modelizar la Evolución de la Volatilidad Esther Ruiz1 , Helena Veiga1 1. Departamento de Estadı́stica, Universidad Carlos III de Madrid, España. Resumen Los modelos de volatilidad estocástica (SV) tienen propiedades que los convierten en una alternativa atractiva a los populares modelos GARCH para representar la evolución de la volatilidad. En general, son más flexibles para representar las propiedades empı́ricas caracterı́sticas de los rendimientos financieros y, desde el punto de vista teórico, están más cercanos a los modelos utilizados en Finanzas. Sin embargo, su utilización empı́rica ha sido muy limitada debido fundamentalmente a que la estimación de los parámetros de dichos modelos es más complicada que la de los modelos GARCH. En este artı́culo se revisan las principales propiedades estadı́sticas de los modelos SV univariantes ası́ como los últimos desarrollos en cuanto a su estimación. Todos los resultados se ilustran con ejemplos de series reales y simuladas.. Palabras clave. Efecto Leverage, Heterocedasticidad Condicional, MCMC, Me-. moria Larga, Rendimientos Financieros. Clasificación JEL C22, C51.. Correspondencia a: Esther Ruiz (e-mail: ortega@est-econ.uc3m.es).

(2) 10. 1.. Esther Ruiz, Helena Veiga. Introducción. La incertidumbre de muchas variables económicas y financieras evoluciona a lo largo del tiempo. Cuantificar dicha incertidumbre es interesante tanto desde el punto de vista teórico como econométrico. Desde el punto de vista teórico, dicha cuantificación es fundamental para modelos de valoración de activos. Por ejemplo, Melino y Turnbull (1990) concluyen que los precios de opciones cuya valoración se basa en volatilidad estocástica son más precisos que aquellos basados en el modelo de Black-Scholes; ver también Hull y White (1987) y Eberlein et al. (2003), entre otros muchos, para otras aplicaciones financieras. Por otra parte, desde un punto de vista econométrico, modelizar adecuadamente la heterocedasticidad, es decir, la evolución temporal de la volatilidad, tiene repercusiones sobre la eficiencia de los estimadores ası́ como sobre la construcción de intervalos de predicción. Sin embargo, medir la incertidumbre no es fácil debido a que dicha variable no es observable. En consecuencia, dependiendo de qué supuestos se realicen sobre su evolución dinámica, se obtendrán modelos alternativos para representarla. Cualquier modelo que intente aproximar la incertidumbre debe ser capaz de reproducir algunas propiedades empı́ricas observadas en las series que se trate de analizar. Como ilustración, vamos a considerar dos series reales de rendimientos, una del IBEX35 y otra del tipo de cambio Libra/Dolar. El Gráfico 1 (panel a) representa rendimientos diarios del IBEX35 observados desde 3/1/1994 hasta 6/9/2006 calculados como yt = 100xlog (pt /pt−1 ) donde pt es el precio en el momento t. El número total de observaciones es T = 3176. En dicho gráfico puede observarse que los rendimientos oscilan alrededor de cero. Además, la volatilidad aparece agrupada con periodos de tiempo de relativa calma seguidos de otros con marcadas oscilaciones en los rendimientos. En el panel (b) de dicho gráfico aparecen las autocorrelaciones muestrales de los rendimientos que, en general, no son significativas y, en cualquier caso, tienen una magnitud muy pequeña. En consecuencia, los rendimientos no tienen dependencia lineal con su propio pasado. Sin embargo, la agrupación de la volatilidad que hemos comentado anteriormente, aparece.

(3) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 11. estadı́sticamente reflejada en las autocorrelaciones positivas de los rendimientos absolutos (panel c) y de los rendimientos cuadrados (panel d). Nótese que los rendimientos cuadrados y absolutos están relacionados con la dispersión y, por lo tanto, una correlación positiva de dichas transformaciones significa que la volatilidad tiene dependencia temporal y, en consecuencia, aparecerá agrupada. En ambos casos, las correlaciones son claramente significativas siendo ligeramente superiores para los rendimientos absolutos. Esta última propiedad es conocida como efecto Taylor y ha sido observada en numerosas series de rendimientos financieros; ver, por ejemplo, Taylor (1986), Ding et al. (1993) y Dacorogna et al. (2001) entre otros muchos. La dependencia en los rendimientos cuadrados y absolutos implica que la volatilidad puede predecirse utilizando información de la evolución pasada de los rendimientos. Finalmente, el Figura 1 representa las correlaciones muestrales cruzadas entre los rendimientos y sus valores absolutos futuros y pasados (paneles e y g respectivamente) y entre los rendimientos y sus cuadrados futuros y pasados (paneles f y h). Dichas correlaciones cruzadas son significativas y negativas en los dos casos cuando se consideran con el futuro pero no cuando son con el pasado. Esto significa que un rendimiento negativo genera un incremento de volatilidad futura mayor que un rendimiento positivo. Esta caracterı́stica muestral también ha sido observada en otras muchas series de rendimientos financieros y es conocida como efecto leverage; ver, por ejemplo, Black (1976) que observó por primera vez este fenómeno y Giot y Laurent (2003) y Chen, Gerlach y So(2006) para algunas aplicaciones recientes. Por otra parte, la volatilidad pasada no tiene efectos sobre los rendimientos futuros. Caracterı́sticas similares pueden observarse en el Figura 2 donde aparecen representadas las mismas series y correlaciones relativas a rendimientos del tipo de cambio Libra/Dólar observado diariamente desde 3/1/1994 hasta 6/9/2006 con T = 3308. En este caso, las correlaciones de los rendimientos absolutos y cuadrados son menores y las correlaciones cruzadas no son significativas en ningún caso..

(4) 12. Esther Ruiz, Helena Veiga. En el Cuadro 1 aparecen distintos momentos muestrales de los rendimientos del IBEX35, en particular la media, desviación tı́pica, asimetrı́a y curtosis. La asimetrı́a es negativa mientras que la curtosis es mayor que 3. Por lo tanto, parece que la serie de rendimientos del IBEX35 no está adecuadamente representada por una distribución Normal. Para contrastar formalmente la Normalidad en el contexto de series condicionalmente heterocedásticas, Fiorentini et al. (2004) sugieren utilizar el estadı́stico propuesto por Kiefer y Salmon (1983) dado por KSN = (KSS )2 + (KSK )2 donde. r KSS =. y. r KSK =. T 6. ". T 1 X ∗3 3X t = 1T yt∗ yt − T t=1 T. #. " # T T T 1 X ∗4 6 X ∗2 y − y +3 , 24 T t=1 t T t=1 t. donde yt∗ son los rendimientos centrados y estandarizados. Si la distribución de yt∗ es condicionalmente N (0, 1), entonces KSN es asintóticamente χ2(2) y KSS y KSS son asintóticamente N (0, 1)1 . Los resultados de este constraste también 1. Nótese que el estimador muestral de la curtosis tiene sesgos negativos muy importantes tanto en presencia de distribuciones con colas anchas como en distribuciones asimétricas; ver, por ejemplo, An y Ahmed (2008). Por otra parte, Premaratne y Bera (2005) han propuesto un contraste LM de asimetrı́a de la distribución que tiene en cuenta la posible presencia de exceso de curtosis por lo que evita el exceso de rechazos de los contrastes tradicionales en este contexto. Sin embargo, no está claro que este último contraste sea válido cuando se implementa en los residuos de un modelo estimado. Bontemps y Meddahi (2005) han propuesto un contraste de Normalidad alternativo basado en polinomios Hermite que es robusto a la estimación de los parámetros. Por otra parte, Bai y Ng (2005) han propuesto un contraste de asimetrı́a robusto a la presencia de dependencia y a la distribución de los errores. Muy recientemente, Chen y Lin (2008) han propuesto un contraste robusto más general. Su discusión sobre los distintos contrastes de asimetrı́a propuestos en la literatura es muy interesante. Finalmente, Kim y White (2004) analizan el comportamiento de las medidas de asimetrı́a y curtosis en presencia de atı́picos y sugieren la necesidad de utilizar medidas robustas. Ellos asumen observaciones iid y serı́a interesante analizar la validez de sus resultados en presencia de heterocedasticidad condicional..

(5) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 13. aparecen en el Cuadro 1 y claramente rechazan el supuesto de Normalidad de los rendimientos diarios del IBEX35 durante el periodo muestral considerado en este artı́culo. La misma conclusión se obtiene para los rendimientos del tipo de cambio Libra/Dolar aunque, en este caso, la curtosis es menor y no se rechaza la simetrı́a de su distribución marginal. Por otra parte, en el Cuadro 1 aparece el estadı́stico de Box-Ljung para contrastar si las 10 primeras autocorrelaciones son conjuntamente iguales a cero. Es importante señalar que, en presencia de heterocedasticidad condicional, la distribución asintótica de este estadı́stico no es la habitual. En particular, la varianza asintótica de las correlaciones muestrales puede estimarse mediante la siguiente expresión V ar(ry (τ )) =. 1 T. µ ¶ γ by2 (τ ) 1+ σ by4. donde γ by2 (τ ) es la covarianza muestral de orden τ de los rendimientos al cuadrado yσ by es la desviación tı́pica muestral de los rendimientos; ver Diebold (1988). Por otra parte, para tener la distribución asintótica habitual, χ2(M ) , el estadı́stico de Box-Ljung debe ser modificado como sigue, Qy (M ) = T (T + 2). M X j=1. σ by4 1 2 [ry (j)] 4 , (T − j) σ by + γ by2 (j). donde ry (j) es la autocorrelación muestral de orden j de yt . Como resultado del contraste, se rechaza la hipótesis nula de incorrelación en los rendimientos al 5 % pero no cuando el nivel de significación es del 1 %. En cualquier caso, como ya hemos comentado en el Figura 1, las autocorrelaciones muestrales son muy pequeñas. Por lo tanto, podemos concluir que, como era de esperar, los rendimientos no son linealmente predecibles dada su evolución pasada. En el Cuadro 1 también aparecen los estadı́sticos Box-Ljung para las primeras 10 autocorrelaciones de los rendimientos absolutos y cuadrados. Si una serie es lineal y Gaussiana, las autocorrelaciones de los cuadrados son iguales al cuadrado de sus correlaciones; ver Maravall (1987) y Palma y Zevallos (2004). Sin embargo, las autocorrelaciones.

(6) 14. Esther Ruiz, Helena Veiga. de los rendimientos cuadrados del IBEX35 son claramente mayores a las autocorrelaciones al cuadrado de los rendimientos originales; ver también la Figura 1. Por lo tanto, el modelo que explique la dependencia dinámica de los rendimientos debe ser no lineal y/o no Gaussiano. Finalmente, en el Cuadro 1 aparecen los estadı́sticos de Box-Ljung para las 2 correlaciones cruzadas entre yt y |yt+τ | y entre yt y yt+τ . Estas correlaciones que,. como hemos comentado anteriormente, reflejan el efecto leverage, son significativas. Por otra parte, el Cuadro 1 contiene los mismos momentos muestrales y estadı́sticos correspondientes a la serie de rendimientos del tipo de cambio Libra/Dólar. Como ya hemos observado en el Figura 1, las correlaciones de |yt | y de yt2 observadas en los rendimientos de los tipos de cambio, ası́ como sus correspondientes estadı́sticos de Box-Ljung, son menores que las de los ı́ndices. Por lo tanto, parece que la dependencia de los segundos momentos de los rendimientos de los tipos de cambio es más débil. Además, las correlaciones cruzadas de estos ¡ ¢ 2 rendimientos, Corr yt , yt+τ y Corr (yt , |yt+τ |) no son significativas. En resumen, las caracterı́sticas empı́ricas observadas habitualmente en las series de rendimientos financieros son las siguientes: 1. Distribuciones marginales con media cero y con exceso de curtosis que, en algunas series de rendimientos, pueden ser asimétricas. 2. Autocorrelaciones de yt no significativas. 3. Autocorrelaciones de |yt | y yt2 significativas y con las siguientes caracterı́sticas: i) positivas y pequeñas en magnitud, ii) correlaciones de |yt | mayores que las de yt2 , iii) decaen lentamente hacia cero. 4. En algunas series, correlaciones cruzadas negativas entre rendimientos y volatilidades futuras..

(7) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 15. Cualquier modelo cuyo objetivo sea representar la evolución dinámica de series de rendimientos financieros debe ser capaz de explicar dichas propiedades empı́ricas. En la literatura econométrica se han propuesto dos tipos de modelos capaces de representar estas caracterı́sticas: los modelos GARCH propuestos originalmente por Engle (1982) y Bollerslev (1986) y los modelos de volatilidad estocástica (SV) propuestos por Taylor (1982). La principal diferencia entre ambas alternativas es que los modelos basados en GARCH asumen que la volatilidad es observable un periodo hacia adelante mientras que en los modelos SV, la volatilidad es una variable latente que no puede ser observada sin error. Ambos tipos de modelos pueden generar series incorreladas y con media cero, con exceso de curtosis y potencias de los rendimientos absolutos correlacionadas. Sin embargo, Carnero et al. (2004) demuestran que los modelos SV son más flexibles para representar las caracterı́sticas empı́ricas observadas en series reales de rendimientos financieros. En cuanto a aplicaciones empı́ricas, Kim et al. (1998) y Yu (2002), observan dentro de la muestra y en predicción respectivamente, el comportamiento mejor de los modelos SV frente a los modelos GARCH. Finalmente, los modelos SV también han sido elegidos por varios autores para ser implementados en modelos financieros; ver, por ejemplo, Eberlein et al. (2003) para un modelo de gestión del riesgo. Sin embargo, el precio de esta flexibilidad es la dificultad en la estimación de los modelos SV. El problema surge porque en estos modelos no es posible obtener una expresión analı́tica de la verosimilitud debido a que los dos ruidos que aparecen en dichos modelos, lo hacen de forma no lineal. Como consecuencia, no es posible utilizar directamente los métodos de estimación habituales basados en Máxima Verosimilitud (MV). Aunque ha habido numerosas propuestas sobre procedimientos de estimación de modelos SV, la implementación empı́rica de dichos modelos es aún relativamente escasa debido a que el software comercial actual generalmente permite la estimación de los modelos GARCH pero no de los modelos SV..

(8) 16. Esther Ruiz, Helena Veiga. El primer objetivo de este artı́culo es revisar las principales caracterı́sticas que los modelos de volatilidad estocástica son capaces de representar. Existen otras revisiones de esta literatura como, por ejemplo, Taylor (1994), Ruiz (1994b), Ghysels et al. (1996) y Shephard (1996). En este artı́culo se actualizan dichas revisiones añadiendo resultados recientes sobre momentos de los modelos SV con efecto leverage. Además, consideramos una especificación de la volatilidad alternativa a la considerada tradicionalmente que facilita la interpretación de los parámetros. Bajo la especificación considerada en este artı́culo, la varianza de la volatilidad siempre es finita evitándose algunos de los problemas de interpretación encontrados cuando al ajustar estos modelos en series reales se encontraban estimaciones que implican que la volatilidad tiene una raı́z unitaria. El segundo objetivo de este artı́culo es revisar la literatura más reciente sobre la estimación de modelos de volatilidad estocástica actualizando la revisión realizada por Broto y Ruiz (2004). El resto del artı́culo está organizado como sigue. En la Sección 2 se describen las propiedades de los modelos SV empezando por el modelo básico en el que el logaritmo de la volatilidad es un proceso AR(1). Después se considera el modelo con efecto leverage en el que el incremento de la volatilidad es amyor ante un rendimiento negativo que ante otro positivo de la misma magnitud. Finalmente, se describen los modelos con memoria larga en la volatilidad. Los modelos y propiedades se ilustran tanto con series reales como simuladas. La Sección 3 está dedicada a la revisión de los estimadores propuestos recientemente para estimar los parámetros y las volatilidades subyacentes de los modelos SV. Finalmente, la Sección 4 contiene nuestras conclusiones y algunas sugerencias de lineas de investigación futuras que puedan ser de interés.. 2.. Propiedades de los Modelos SV. A continuación, vamos a describir los modelos SV más populares propuestos en la literatura para representar los distintos aspectos observados en la volatilidad y señalados en la sección anterior..

(9) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 2.1.. 17. Modelo SV Básico. El modelo SV más sencillo asume que el logaritmo de la volatilidad2 puede representarse como un modelo AR(1). En este caso, el modelo se denomina como ARSV(1) y viene dado por: yt = σ∗ σt εt 2 log σt2 = φ log σt−1 + σh (1 − φ2 )1/2 ηt ,. (1). donde σt es la volatilidad. El parámetro σ∗ es una escala que evita tener que incluir una constante en la ecuación de la log-volatilidad. So, Lam y Li (1997) y So, Li y Lam (1997) interpretan este parámetro como la volatilidad base de un dı́a tı́pico o la varianza marginal que tendrı́a yt si no hubiera heterocedasticidad. Para ello tienen en cuenta que si log σt2 está en su valor medio, es decir, log σt2 = 0, entonces σt2 = 1. Nótese que σ∗2 es la media de yt2 condicional en σt2 = 1. Por lo tanto, en un dı́a tı́ pico, definido como aquel en el que la volatilidad está en la media, σt2 = 1. Por otra parte, el parámetro φ está relacionado con la persistencia de los shocks a la volatilidad. La condición de estacionariedad del modelo es |φ| ≤ 1. El parámetro σh2 es la varianza de la log-volatilidad que es considerada como un parámetro fijo y finito3 . Cuando este parámetro es cero, el proceso es homocedástico. El proceso también es homoscedástico cuando φ = 1. En la práctica, se observan frecuentemente estimaciones del parámetro autorregresivo cercanas a la unidad junto con estimaciones de la varianza del ruido asociado a la ecuación de la volatilidad, ση2 , muy pequeñas. En este caso, por lo tanto, debemos 2 Se modeliza el logaritmo en lugar de la volatilidad para evitar imponer restricciones en los parámetros que garanticen la positividad de σt2 en todo momento de tiempo. Además, al modelizar el logaritmo se introduce asimetrı́a en la distribución de la volatilidad en el sentido de que la ocurrencia de periodos de volatilidad elevada es menor que la de periodos de volatilidad baja. 3 En la literatura de los modelos SV es habitual considerar como fijo el parámetro de la varianza de ηt , dado por ση2 = σh2 (1 − φ2 ). La especificación adoptada en este artı́culo tiene la ventaja de que al asumir que σh2 es finita, se garantiza que la varianza marginal de yt es finita. Otros autores que han asumido esta especificación son Harvey y Streibel (1998) y Taylor (2005)..

(10) 18. Esther Ruiz, Helena Veiga. concluir que estamos ante una serie donde la evolución de la volatilidad es muy suave aunque esté cercana a la raiz unitaria. Nótese que cuando φ = 0, la serie de rendimientos, yt , también es homoscedástica. Sin embargo, en este último caso, el modelo no es identificable. Finalmente, el supuesto sobre las perturbaciones del modelo, εt y ηt , es que ambas son contemporánea y serialmente independientes. La distribución de εt tiene una densidad simétrica con media cero y varianza 1, mientras que la distribución de ηt es N (0, 1). Aunque este supuesto puede parecer ad hoc, varios autores han justificado empı́ricamente su adecuación tanto en rendimientos de tipos de cambio como de activos financieros; ver, por ejemplo, Andersen et al. (2001) y Andersen et al. (2001, 2003) basándose en asimetrı́a, curtosis y estimaciones no-paramétricas de la densidad de la log-volatilidad realizada y Thomakos y Wang (2003) basándose en contrastes KS y Jarque-Bera. Otras referencias donde el supuesto de normalidad de log σt2 se sustenta empı́ricamente son Areal y Taylor (2002) y Pong et al. (2004). Por otra parte, Bontemps y Meddahi (2005) rechazan la Normalidad de la log-volatilidad realizada debido a la presencia de asimetrı́as. También, Durham (2006) presenta evidencia empı́rica sobre la falta de adecuación de la distribución log-Normal para la volatilidad. Sin embargo, hay que tener en cuenta que ninguno de los contrastes de Normalidad utilizados tienen propiedades adecuadas en presencia de memoria larga que, como veremos más adelante, es una de las propiedades empı́ricas que caracterizan las correlaciones de potencias de los rendimientos absolutos de muchos activos financieros. El supuesto habitual para la distribución de εt es la Normalidad. Sin embargo, algunos autores han asumido también otras distribuciones alternativas con colas anchas. Por ejemplo, Ruiz (1994a), Harvey et al. (1994), Sandmann y Koopman (1998), Lisenfeld y Jung (2000) y Asai (2008) asumen que εt tiene una distribución Student-ν. Además, los dos últimos trabajos consideran también una distribución GED (Generalized Error Distribution) y algunos de ellos consideran mixturas de Normales. Finalmente, Lisenfeld y Richard (2003) han considerado.

(11) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 19. una distribución semiparamétrica. Raggi y Bordignon (2006) argumentan que una distribución con colas anchas para εt es más apropiada para explicar observaciones extremas en las series de rendimientos que la introducción de saltos en el modelo. Cuando εt en (1) tiene una distribución con colas anchas, algunos autores han considerado la siguiente especificación alternativa del modelo: yt = σ∗ σt. p. λt εt. 2 log σt2 = φ log σt−1 + ση ηt. (2). donde εt tiene una distribución NID(0,1) y λt es una variable i.i.d. de mixtura de escala contemporáneamente independiente de εt y de ηt . Por ejemplo, Jacquier et al. (2004), Raggi y Bordignon (2006) y Durham (2006) asumen que λνt tiene √ una distribución χ2(ν) y, en este caso, λt εt tiene una distribución Student-ν. Por otra parte, Omori et al. (2007) asumen que log λt tiene una distribución √ N (−0,5τ 2 , τ 2 ) y, entonces, la variable λt εt tiene una distribución log-Normal. Las propiedades estadı́sticas de series generadas por el modelo (1) pueden encontrarse en, por ejemplo, Carnero et al. (2004). En particular, la media de yt es cero y la varianza y curtosis de yt vienen dadas por: ½ σy2. =. σ∗2. exp. σh2 2. ¾ ,. (3). y κy = κε exp(σh2 ),. (4). respectivamente, donde κε es la curtosis de εt . Si σh2 6= 0, es decir, cuando la serie es condicionalmente heterocedástica, la curtosis es mayor que κε . En concreto, si la distribución de εt es Normal, como se asume habitualmente en la práctica, la curtosis de los rendimientos es mayor que 3, caracterı́stica que como hemos señalado en la introducción se observa frecuentemente en series de rendimientos financieros reales. Nótese que, tal y como está definido el modelo en (1), ni la.

(12) 20. Esther Ruiz, Helena Veiga. varianza ni la curtosis de los rendimientos dependen de cuál sea el parámetro que mide la persistencia de la volatilidad, φ, sino que únicamente depende de σh2 , la varianza de la volatilidad. Dado que, como hemos comentado anteriormente, σ∗2 es la varianza de un dı́a tı́pico, la proporción de la varianza de yt atribuible a la presencia de heterocedasticidad viene dada por ½ ¾ σy2 − σ∗2 σh2 = 1 − exp − σy2 2. (5). ver So, Lam y Li (1997).. Es fácil demostrar que las autocorrelaciones teóricas de yt en el modelo (1) son iguales a cero. Sin embargo, la función de autocorrelación (fac) de potencias θ. de rendimientos absolutos, |yt | , derivada por Harvey (1998), viene dada por ³ ρθ (k) =. exp. ´. θ2 2 4 σh ρh (k). κθ exp. ¡ θ2 4. ¢ 2. −1. σh − 1. , k > 1, θ > −0,5, θ 6= 0. (6). donde ρh (k) es la correlación de orden k de log σt2 que, en el modelo (1), viene dada E (|εt |2θ ) por ρh (k) = φk y κθ = {E|ε |θ }2 . Bajo el supuesto de que εt tiene una distribución t. Normal(0,1), κθ =. Γ (θ+0,5)Γ (0,5) [Γ (0,5(θ+1)]2. donde Γ (·) es la función Gamma. En este caso,. el coeficiente κθ toma valores κ1 =. π 2. y κ2 = 3 respectivamente, para los dos. casos de mayor interés empı́rico, es decir, cuando se calculan las correlaciones de valores absolutos y cuadrados. Por otro lado, si εt tiene una distribución Student-ν, entonces κθ =. Γ (θ+0,5)Γ (−θ+0,5ν)Γ (0,5)Γ (0,5ν) . [Γ (0,5(θ+1)Γ (−0,5(θ−ν))]2. A medida que ν tiende θ. a infinito, el valor de κθ desciende. Por lo tanto, las correlaciones de |yt | son máximas cuando εt tiene una distribución Normal. En consecuencia, dados los parámetros φ y σh2 , la heterocedasticidad será más difı́cil de detectar utilizando las autocorrelaciones muestrales cuando los errores tengan colas anchas, debido a que las autocorrelaciones de potencias de los rendimientos absolutos serán menores; ver, por ejemplo, Pérez y Ruiz (2003). Finalmente, es importante señalar que θ. cuando εt es Student-ν, el momento de segundo orden de |εt | existe si θ < ν/2.

(13) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 21. θ. y, por lo tanto, las autocorrelaciones de |yt | solo están definidas para dichas potencias. La Figura 3 representa una serie artificial generada por el modelo (1) con parámetros σ∗2 = 1, φ = 0,98, σh2 = 0,5, ηt Normal y εt con una distribución Normal mientras que en la Figura 4 se ha representado una serie generada por el mismo modelo pero donde εt tiene una distribución Student-7. En ambos casos, la varianza poblacional de yt es 1.133 pero la curtosis es 4.946 en el primer caso mientras que en el segundo es 8.243. Ambas figuras ilustran la forma de las fac de valores absolutos y cuadrados en los modelos ARSV(1) con errores Normales y Student-7 respectivamente que hemos descrito anteriormente. En dichas figuras puede observarse, en primer lugar, que hay efecto Taylor, es decir, que las autocorrelaciones de |yt | son mayores que las de yt2 . Este efecto es especialmente pronunciado en el caso del modelo en el que los errores son Student-7. Pérez y Ruiz (2008) analizan los valores del parámetro θ que maximizan las correlaciones concluyendo que, cuando la curtosis de yt es próxima a 3, dichas correlaciones se maximizan para potencias próximas a 2. Sin embargo, cuando hay exceso de curtosis, las correlaciones se maximizan cuando se calculan para los rendimientos absolutos, es decir, θ = 1. Finalmente, solo cuando las curtosis son inusualmente grandes, las correlaciones se maximizan para valores de θ más pequeños. Por lo tanto, el efecto Taylor, observado en el Cuadro 1, puede ser reproducido por el modelo ARSV(1) en (1) para valores de los parámetros cercanos a los que se estiman cuando dichos modelos se ajustan para explicar la evolución dinámica de la volatilidad de series reales. Además, comparando las fac representadas en la Figura 3 con las correspondientes fac representadas en la Figura 4, también podemos observar que las primeras son mayores que las segundas, es decir, que, como hemos señalado anteriormente, las autocorrelaciones son mayores cuando los errores son Normales. Además, en los gráficos aparecen también las correspondientes autocorrelaciones muestrales calculadas con las series simuladas. Comparando las autocorrelaciones.

(14) 22. Esther Ruiz, Helena Veiga. muestrales con las teóricas es posible observar que las primeras son estimadores negativamente sesgados de las segundas; ver Peréz y Ruiz (2003). Finalmente, también puede observarse que el efecto Taylor aparece tanto en las correlaciones teóricas como en las muestrales. Por último, cuando el parámetro de la potencia es cero, es decir, θ = 0, consideramos la transformación logarı́tmica de los rendimientos absolutos y, en este caso, las correlaciones de log |yt | vienen dadas por: ρ0 (k) =. σh2 ρh (k) . (σh2 + σε2 ). (7). En consecuencia, la fac de log |yt | es la misma que la de log σt2 multiplicada por una constante que, en general, es muy pequeña en las aplicaciones empı́ricas de interés; ver Pérez y Ruiz (2003). Vamos a considerar nuevamente las series de rendimientos del IBEX35 y del tipo de cambio Libra/Dolar. Ajustando el modelo ARSV(1) a los rendimientos del IBEX35 y estimando sus parámetros mediante Efficient Method of Moments (EMM)4 se obtienen las estimaciones que aparecen en el Cuadro 2. La caracterı́stica más notable de estas estimaciones es la gran persistencia que implica la estimación del parámetro φ. Por otra parte, el porcentaje de la varianza de yt que es atribuible a la presencia de heterocedasticidad puede calcularse con la expresión (5) y es del 20.67 %. En el Cuadro 2 también aparecen los resultados para el tipo de cambio Dólar/Libra. En este caso, el parámetro ση también es significativo, por lo que 4 Los estimadores de los parámetros de los modelos SV serán descritos en la siguiente sección. El estimador EMM tiene la desventaja de que necesita asumir Normalidad de los errores. Además, no permite obtener directamente estimaciones de la volatilidad subyacente. Sin embargo, es el que hemos elegido para esta ilustración por razones comparativas porque es el único que permite estimar el modelo más general considerado en este artı́culo, es decir, un modelo con efecto leverage y memoria larga. Es importante señalar que este estimador es computacionalmente muy intensivo y que puede presentar importantes problemas de convergencia. Además, los resultados dependen de los valores iniciales utilizados por lo que es necesario un gran esfuerzo antes de conseguir estimaciones fiables..

(15) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 23. la volatilidad evoluciona a lo largo del tiempo. Sin embargo, la persistencia es mucho menor aunque el porcentaje de la varianza de los rendimientos atribuible a dicha evolución es de 19 %. Finalmente, los Figuras 5 y 6 representan las estimaciones de la volatilidad, σ bt , para el IBEX35 y el tipo de cambio Dólar/Libra respectivamente5 .. 2.2.. Modelos con Efecto Leverage. En la introducción hemos señalado que en muchas series de rendimientos financieros reales se ha observado el efecto leverage, es decir, que los incrementos de la volatilidad son mayores cuando el rendimiento es negativo que cuando es positivo y de la misma magnitud. El modelo ARSV(1) no es capaz de representar dicho efecto dado que la respuesta de la volatilidad solo depende de la magnitud de los rendimientos pasados pero no de su signo. Harvey y Shephard (1996) han propuesto introducir el efecto leverage en el modelo ARSV mediante la introducción de correlación entre el ruido que afecta al nivel de los rendimientos, εt , y las varia2 − φ log σt2 . ciones futuras de la log-volatilidad un periodo hacia adelante, log σt+1. Si δ es dicha correlación, el modelo ARSV(1) asimétrico (A-ARSV(1)) puede expresarse como sigue a continuación yt = σ∗ σt εt 2 log σt2 = φ log σt−1 + ση (δεt−1 + (1 − δ 2 )1/2 ηt ).. (8). Harvey y Shephard (1996) demuestran que la presencia de dicha correlación no cambia los momentos marginales de los rendimientos. Por lo tanto, la varianza y curtosis de yt siguen dados por (3) y (4) respectivamente. Además, puede 5. Dado que en este artı́culo las estimaciones de los parámetros se han obtenido mediante el procedimiento EMM propuesto por Gallant et al. (1997), las estimaciones de la volatilidad también se han obtenido como proponen dichos autores mediante retroproyección. Sin embargo, es importante señalar que este procedimiento de estimación de la volatilidad es muy dependiente de la elección subjetiva de algunos parámetros..

(16) 24. Esther Ruiz, Helena Veiga. demostrarse que los rendimientos siguen siendo incorrelados. Alternativamente, Jacquier et al. (2004) han propuesto introducir el efecto leverage mediante la correlación contemporánea entre εt y las variaciones de la volatilidad. En este caso la serie de rendimientos, yt , no es incorrelada y, por ello, muchos autores argumentan que la mejor especificación para el efecto leverage es como en (8); ver, por ejemplo, Harvey y Shephard (1996) y Yu (2005). Además, la formulación propuesta por Jacquier et al. (2004) tiene otro incoveniente ya que el parámetro δ no solo genera correlación entre los rendimientos y las volatilidades futuras sino que también genera asimetrı́a en la distribución marginal de los rendimientos. Tener un único parámetro que genera dos efectos distintos en el modelo resta flexibilidad al mismo además de dificultar su interpretación. Sin embargo, Durham (2006) señala que no está claro que empı́ricamente sea necesario representar rendimientos incorrelados y que la especificación de la correlación contemporánea entre los ruidos puede ayudar a explicar los rendimientos negativos extremadamente grandes que se observan ocasionalmente en las series reales. θ. La fac de |yt | en el modelo A-ARSV(1) ha sido recientemente derivada por Pérez et al. (2008) bajo el supuesto de que los errores εt son Normales6 . En particular, dicha fac viene dada por ³ ρθ (k) =. donde Ak =. exp. λk δση 2. 2 θ 2 σh ρh (k) 4. ´. ³ 2 2´ ³ ´ 2 2 θ A 1 θ Ak exp − 2 k Φ θ+1 −1 2 , 2; 2 ³ 2 2´ , k ≥ 1, θ σh −1 κθ exp 4. (9). con λk = φk−1 , Φ(·, ·; ·) es la función hipergeométrica dege-. nerada. Taylor (2005) ha derivado la fac de yt2 para el modelo A-ARSV(1) que puede obtenerse como caso particular de (9) cuando θ = 2. Por otra parte, cuan¡ ¢ 1 do no hay efecto leverage, es decir, δ = 0, entonces Ak = 0 y Φ c+1 2 , 2 ; 0 = 1. Parece difı́cil poder derivar resultados generales sobre las autocorrelaciones de |yt |θ en el caso de modelos A-ARSV con distribuciones de εt distintas a la Normal como, por ejemplo, el propuesto por Durham (2006); ver también Kawakatsu (2007b) que encuentra un problema similar. 6.

(17) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 25. En este caso, se obtiene, como caso particular, la fac en (6) del modelo ARSV(1) simétrico. Como ilustración, la Figura 7 representa una serie temporal generada por el modelo (8) con los mismos valores de los parámetros σ ∗ , φ y σh2 considerados anteriormente y con δ = −0,5 y errores εt Normales. En este caso, como ya hemos comentado, la varianza y la curtosis marginales no cambian y siguen siendo 1.133 y 4.946 respectivamente, como en el modelo simétrico. Por otra parte, en la Figura 7, aparecen representadas las fac de los rendimientos absolutos y cuadrados junto con las correspondientes estimaciones muestrales. Nótese que tanto las autocorrelaciones muestrales de los rendimientos absolutos como las de cuadrados son similares a las obtenidas en el correspondiente modelo simétrico representadas en el Figura 3. Además, podemos observar los sesgos negativos que ya habı́amos señalado anteriormente. Acabamos de ver que la presencia del efecto leverage no afecta en gran medida a las fac de los rendimientos absolutos y cuadrados. Sin embargo, dicho efecto puede detectarse en las correlaciones cruzadas entre las volatilidades y los rendimientos pasados, que son distintas de cero. Pérez et al. (2008) han derivado las θ. correlaciones cruzadas entre yt y |yt+k | bajo el supuesto de errores Gaussianos, que vienen dadas por ´ ³ 2 θσh ρh (k) θAk exp 4 Corr(yt , |yt+k |θ ) = , k ≥ 1. ³ 2 ´r ³ 2 2´ σ θ σh exp 8h κθ exp − 1 4. (10). ver también Demos (2002) y Taylor (2005) para el caso particular de correlaciones entre rendimientos y rendimientos cuadrados futuros y Ruiz y Veiga (2008) para rendimientos absolutos futuros. Estas correlaciones cruzadas tienen el mismo signo que δ y su magnitud se incrementa con dicho parámetro. Como ilustración, en la Figura 7, paneles (d) y (e), se han representado dichas correlaciones cruzadas para el modelo A-ARSV descrito anteriormente. En este gráfico puede.

(18) 26. Esther Ruiz, Helena Veiga. observarse que las correlaciones cruzadas son negativas y decaen exponencialmente hacia cero. Además, también puede observarse que no son muy distintas cuando se calculan para valores absolutos o para cuadrados. Compárense estos gráficos con sus análogos en la Figura 3 donde se representaban series generadas con δ = 0. En este caso, las correlaciones cruzadas teóricas son cero y las muestrales no son significativamente distintas de cero. Las estimaciones del modelo A-ARSV(1) para el IBEX35 aparecen en el Cuadro 2. El parámetro de asimetrı́a es significativo e igual a -0.801 indicando una relación negativa entre los rendimientos y la volatilidad futura. Los otros parámetros del modelo son muy similares a los estimados en el modelo simétrico con un ligero incremento de la persistencia y una ligera disminucion de la variabilidad de la volatilidad. El porcentaje de varianza de los rendimientos atribuible a la evolución de la volatilidad es del 27.55 %, ligeramente mayor que en el modelo simétrico. Los resultados para el Dólar/Libra son similares aunque, en este caso, el parámetro δ es positivo y está en los lı́mites de significatividad. Como consecuencia, el resto de los parámetros del modelo y el porcentaje de varianza de los rendimientos atribuible a la volatilidad son similares a los obtenidos en el modelo simétrico. Este resultado es esperable en los tipos de cambio donde normalmente no se observa el efecto leverage; véase el Cuadro 1 donde las correlaciones cruzadas no son significativas. Los Figuras 5 y 6 representan las estimaciones de la volatilidad, σ bt , obtenidas cuando se ajusta el modelo A-ARSV(1) al IBEX35 y al tipo de cambio Dólar/Libra respectivamente. Dichos gráficos también representan las diferencias y los gráficos de puntos entre dichas estimaciones de la volatilidad y las obtenidas mediante el modelo simétrico ARSV(1). Nótese que en el caso del tipo de cambio, las estimaciones de la volatilidad obtenidas mediante los modelos ARSV(1) y A-ARSV(1) son, como era de esperar dado que el parámetro δ no es significativo, prácticamente idénticas. Sin embargo, las volatilidades estimadas por ambos modelos para el IBEX35 son diferentes. Al incorporar la asimetrı́a, las.

(19) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 27. estimaciones de la volatilidad son mayores que cuando se asume una respuesta simétrica de la volatilidad ante rendimientos positivos y negativos. Existen algunas propuestas alternativas de modelos SV con efecto leverage. Por ejemplo, Watanabe (1999) ha propuesto un modelo SV en el que en la ecuación de la varianza aparece el shock retardado del rendimiento como una variable explicativa. Por otra parte, So et al. (1998) y So et al. (2002) han propuesto un modelo SV con umbrales. Muñoz et al. (2007) presentan una comparación empı́rica de la capacidad predictiva de este modelo con respecto a su análogo simétrico y Carvalho y Lopes (2007) tratan de su estimación. Recientemente se han propuesto varias familias de modelos SV que tratan de contener algunas especificaciones alternativas de la volatilidad de forma que sea posible realizar contrastes sobre cuál es la especificación más adecuada para una serie concreta. Una de estas propuestas es la realizada por Yu et al. (2006) que proponen una extensión del modelo A-ARSV en la que una transformación Box-Cox de la volatilidad sigue un modelo AR(1). La ecuación de la volatilidad viene dada por g(σt ) = φg(σt−1 ) + ση (δεt−1 + (1 − δ 2 )1/2 ηt ), donde. (11).  2θ  σt −1 , θ 6= 0 θ g(σt ) =  log σ 2 , θ = 0. t. Nótese que el modelo A-ARSV(1) se obtiene cuando θ = 0. El parámetro de la transformación lo interpretan como que en media llegan al mercado 1/θ unidades de nueva información. Por lo tanto, según esta interpretación, en el caso de que modelicemos el logaritmo de la volatilidad estamos suponiendo que la llegada de noticias al mercado es continua. Muy recientemente, Zhang y King (2008) proporcionan una interpretación alternativa más atractiva del parámetro θ. Ellos argumentan que dicho parámetro permite tener una distribución asimétrica de la volatilidad. Cuando θ < 0, que es el caso que ellos estiman empı́ricamente, las.

(20) 28. Esther Ruiz, Helena Veiga. colas de la densidad marginal de σt2 son más estrechas que las que se obtienen cuando se especifica la volatilidad con la transformación logarı́tmica, especialmente en el caso de la cola izquierda. Por lo tanto, la frecuencia empı́rica de las volatilidades pequeñas es mayor que la de las volatilidades elevadas. Aunque el modelo es atractivo al permitir estimar el parámetro θ adecuado a cada variable, Yu et al. (2006) señalan que no parece posible obtener momentos poblaciones para este modelo; ver Yu y Yang (2006) que proponen una forma de aproximar estos momentos. El modelo propuesto por Yu et al. (2006) tiene intersecciones aunque no contiene exactamente otras familias propuestas en la literatura como, por ejemplo, Andersen (1994) y Jones (2003). Yu et al. (2006) han ajustado el modelo ARSV(1) a una serie de rendimientos del tipo de cambio Libra/Dolar como la considerada en la introducción, aunque observada en un periodo muestral anterior, con resultados similares a los que aparecen en el Cuadro 2. Además, ellos ajustan un modelo donde la volatilidad se especifica mediante una transformación Box-Cox, como en (11) y concluyen que la especificación logarı́tmica no es adecuada; ver también Zhang y King (2008) para otra aplicación empı́rica. Su estimación del parámetro de la transformación es θb = 0,172, que, en cualquier caso no difiere mucho de cero. Finalmente, utilizan el modelo ARSV(1) estimado para valorar opciones siguiendo el procedimiento propuesto por Mahieu y Schotman (1998). Adicionalmente, Kawakatsu (2007b) ha propuesto un modelo con efecto leverage en el que la log-volatilidad es una función cuadrática de una variable latente que sigue un proceso AR. En concreto, la volatilidad viene dada por log(σt2 ) = a0 + a1 xt + a2 x2t. (12). xt = φxt−1 + ση (δεt−1 + (1 − δ 2 )1/2 ηt ). En una aplicación empı́rica a rendimientos diarios del S&P500, ven que el parámetro a2 es significativamente distinto de cero y, por lo tanto, la especificación del modelo ARSV(1) no es apropiada..

(21) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 2.3.. 29. Modelos con Memoria Larga. Otra caracterı́stica empı́rica observada frecuentemente en series de rendimientos financieros es el decaimiento muy lento de las autocorrelaciones de cuadrados y valores absolutos hacia cero con valores significativamente distintos de cero incluso en retardos muy alejados; véanse las Figuras 1 y 2, paneles (c) y (d). Esta caracterı́stica ha sido identificada por muchos autores con la presencia de memoria larga en la volatilidad. En consecuencia, Harvey (1998) y Breidt et al. (1998) propusieron independientemente el modelo SV con memoria larga, en el que el logaritmo de la volatilidad es un proceso ARFIMA(1,d,0). El modelo resultante, denominado LMSV(1,d,0), viene dado por: yt = σ∗ σt εt (1 − φL)(1 − L)d log σt2 = ση ηt , q donde ση = σh Γ (1 − d). 1+φ Γ (1−2d)F (1,1+d;1−d;φ) ,. (13). F (·, ·; ·; ·) es la función hiper-. geométrica y L es el operador de retardos tal que Lxt = xt−1 . Las propiedades dinámicas del modelo (13) con errores εt y ηt independientes aparecen descritas en, por ejemplo, Ghysels et al. (1996). La estacionariedad de yt depende de la estacionariedad de la log-volatilidad, ht = log σt2 . Por lo tanto, si |φ| < 1 y d < 0,5, yt es una serie estacionaria. En este caso, la varianza y curtosis de yt vienen dadas por (3) y (4) respectivamente. θ. La función de autocorrelación de |yt | viene dada por (6) donde ρh (k), la fac de la log-volatilidad, viene dada por: ρh (k) =. Ãk−1 Y i=0. d+i 1−d+i. !. F (1, d + k; 1 − d + k; φ) + F (1, d − k; 1 − d − k; φ) − 1 ; (1 − φ)F (1, 1 + d; 1 − d; φ). ver Hosking (1981) para la expresión de la fac de un modelo ARFIMA. En la práctica, el cálculo de estas autocorrelaciones puede ser relativamente complicado por lo que Bertelli y Caporin (2002) han propuesto algoritmos para simplificarlo..

(22) 30. Esther Ruiz, Helena Veiga. Para ilustrar las propiedades de las series generadas por el modelo LMSV(1,d, 0) en (13), hemos simulado una serie temporal por dicho modelo con parámetros φ = 0,7, d = 0,4 y σh2 = 0,5 y con ambos errores Normales de media cero y varianza 1. Dicha serie, junto con las correspondientes fac muestrales y poblacionales para |yt | y yt2 , aparecen en el Figura 8. Una vez más, es posible observar los sesgos negativos en la estimación de las correlaciones. Además, el decaimiento de las correlaciones poblacionales es claramente más lento que en el Gráfico 3 en el que la volatilidad no tiene memoria larga. Sin embargo, comparando las correlaciones muestrales representadas en ambos gráficos, no está claro que dichas correlaciones permitan diferenciar una serie que tenga memoria larga en la volatilidad de otra que no la tenga; ver Pérez y Ruiz (2003) para un resultado similar. En el Figura 9, hemos representado otra serie simulada generada por el mismo modelo pero donde εt tiene una distribución Student-7. Nótese que en este caso, aunque la magnitud de las correlaciones teóricas es muy similar a la de las representadas en el Figura 4, los sesgos son muy superiores. Por lo tanto, las correlaciones muestrales de la serie generada con memoria larga son claramente menores que las de la serie con memoria corta haciendo muy difı́cil la identificación de la presencia de heterocedasticidad condicional utilizando estadı́sticos basados en dichas autocorrelaciones7 . El modelo (13) ha sido extendido por Ruiz y Veiga (2008) para representar el efecto leverage asumiendo que la correlación entre las perturbaciones εt y ηt+1 es δ. En dicho artı́culo se demuestra que las expresiones de la varianza y la curtosis θ. no cambian. Pérez et al. (2008) derivan la acf de |yt | que viene dada por (9) con k−1 P Γ (i+d) k−i−1 λk sustituido por λk = . Γ (i+1)Γ (d) φ i=0. Como ya hemos mencionado anteriormente, la identificación de la presencia de θ. asimetrı́as puede realizarse mediante las correlaciones cruzadas entre yt y |yt+k | . 7. El modelo LMSV(1,d,0) no ha sido ajustado a las series reales porque después de varias semanas no hemos conseguido resultados fiables del estimador EMM..

(23) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 31. Dichas correlaciones para el modelo A-LMSV(1,d,0) vienen dadas por la expresión (10) donde λk debe ser adecuadamente sustituido. Cuando existe memoria larga, el decaimiento de las correlaciones cruzadas hacia cero es hiperbólico en lugar de ser exponencial como en el caso de memoria corta. Como ilustración, la Figura 10 representa una serie generada por el modelo A-LMSV(1,d,0) con los mismos parámetros considerados anteriormente y con δ = −0,5.. 3.. Estimación de Parámetros y Volatilidades. Ya hemos comentado en la Introducción que la estimación de los parámetros de los modelos de volatilidad estocástica tiene la dificultad de que no es posible obtener una expresión analı́tica de la verosimilitud debido a que los dos ruidos que aparecen en dichos modelos, εt y ηt , lo hacen de forma no lineal. Como consecuencia, no es posible utilizar directamente los métodos de estimación habituales basados en MV. Además, debido a que la volatilidad es inobservable, es necesario utilizar filtros de extracción de señales para estimarla. Dependiendo del tipo de modelo, existen varias propuestas de estimadores alternativos. Los métodos para estimar los parámetros de los modelos SV se pueden clasificar en dos grandes grupos dependiendo de que se basen directamente en las propiedades de yt o utilicen transformaciones adecuadas para linealizar el modelo. Por ejemplo, si consideramos el modelo ARSV(1), y tomamos logaritmos de los rendimientos cuadrados, obtenemos el siguiente modelo log yt2 = µ + log σt2 + ξt 2 log σt2 = φ log σt−1 + σh (1 − φ2 )1/2 ηt ,. (14). ¡ ¢ ¡ ¢ donde µ = log σ∗2 + E log ε2t y ξt = log ε2t − E log ε2t . El modelo (14) es un modelo del espacio de los estados lineal aunque la perturbación ξt no es Normal. Si, por ejemplo, εt tiene una distribución Normal, entonces ξt tiene una distribución log(χ2(1) ) centrada cuya varianza es σξ2 =. π2 2 .. Por otra parte, si εt.

(24) 32. Esther Ruiz, Helena Veiga. tiene una distribución Student-ν, entonces ξt tiene una distribución log(χ2(1) ) − log(χ2(ν) ) + log ν centrada cuya varianza es σξ2 =. π2 2. + ψ 0 (ν) donde ψ 0 (·) es la. función digamma. Dentro de los métodos de estimación basados en las propiedades de yt existen tres alternativas fundamentales. En primer lugar están los métodos basados en el principio de Generalized Method of Moments (GMM). Alternativamente, muchos autores han propuesto procedimientos que intentan aproximar directamente la verosimilitud de yt fundamentalmente mediante técnicas de simulación como, por ejemplo, el popular Monte Carlo Markov Chain (MCMC). Finalmente, existen estimadores basados en estimar los parámetros de un modelo auxiliar. Algunos métodos de estimación pueden utilizarse directamente en el caso de modelos con efecto leverage o memoria larga. Sin embargo, también se han propuestos estimadores especı́ficos para cada uno de estos casos. Por ejemplo, en el caso de modelos con memoria larga, no es posible utilizar algunos de los métodos anteriores debido a que la representación del vector de estado no es finita. Algo similar sucede en el modelo con efecto leverage. En este caso, los estimadores basados en log yt2 no se pueden utilizar directamente debido a que al tomar cuadrados se pierde la información sobre el signo de los rendimientos y, obviamente, esta información es fundamental para poder estimar la correlación entre los rendimientos y sus volatilidades. Broto y Ruiz (2004) realizan una revisión crı́tica de la literatura sobre métodos de estimación de modelos SV. En esta sección vamos a resumir los resultados principales de dicho artı́culo actualizándolos con las nuevas aportaciones realizadas desde entonces a la literatura. 3.1. 3.1.1.. Estimadores Basados en yt Basados en el Principio GMM. El estimador GMM, propuesto por Me-. lino y Turnbull (1990) para modelos SV, se basa en la convergencia de determinados momentos muestrales hacia los correspondientes momentos marginales.

(25) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 33. poblacionales. Tiene el atractivo de ser computacionalmente muy simple. Sin embargo, en el caso de los modelos SV existe un inconveniente para utilizar estos estimadores debido a que los momentos a utilizar en la estimación no pueden ser seleccionados de forma óptima al no disponerse del gradiente; ver Andersen y Sørensen (1996). Además, en muestras finitas, los estimadores GMM tienen propiedades peores que estimadores basados en el principio de MV, especialmente cuando son implementados en series cercanas a tener una raı́z unitaria, dado que, en este caso, los momentos no están definidos. Serı́a interesante investigar cuál es el comportamiento de los estimadores GMM cuando son implementados en el modelo tal y como ha sido formulado en este artı́culo ya que, en este caso, la presencia de la raı́z unitaria implica que el proceso está cerca de ser homoscedástico. 3.1.2.. Basados en la Aproximación de la Verosimilitud. Existen varios proce-. dimientos de estimación de los parámetros que se basan en la aproximación de la verosimilitud de yt . Entre ellos describiremos a continuación los más populares, que son los estimadores basados en Monte Carlo Markov Chain (MCMC). También consideraremos los estimadores de Máxima Verosimilitud Simulada y los de Máxima Verosimilitud Directa. Monte Carlo Markov Chain Los estimadores MV están teniendo un gran desarrollo paralelo al de los métodos numéricos basados en procedimientos MCMC. El problema fundamental que se plantea al estimar un modelo SV es la evaluación de la verosimilitud que viene dada por:. Z f (Y |θ) =. f (Y |H, θ)f (H|θ)dH. donde Y = (y1 , ..., yT ), H = (log σ12 , ..., log σT2 ) y θ es el vector que contiene los parámetros desconocidos del modelo. El más popular de los procedimientos MCMC es el muestreo de Gibss, propuesto por Jacquier et al. (1994) y extendido posteriormente por Jacquier et al. (2004) a modelos con colas anchas y efecto leverage. Este procedimiento se basa.

(26) 34. Esther Ruiz, Helena Veiga. en un remuestreo de movimiento único que genera, dadas todas las demás variables de estado y parámetros, una única variable de estado en cada momento del tiempo. Es un procedimiento relativamente fácil de programar pero genera muestras que están altamente correlacionadas por lo que para poder hacer inferencia, es necesario generar un número elevadı́simo de muestras. En consecuencia, son procedimientos altamente ineficientes numéricamente, especialmente cuando la volatilidad está muy correlacionada, es decir, cuando φ está cerca de 1 y ση2 cerca de cero; ver Shephard y Kim (1994). Para solucionar este problema, Shephard y Pitt (1997) propusieron un algoritmo para muestrear por bloques (muestreo de movimiento múltiple); ver también Watanabe y Omori (2004). Este procedimiento consiste en generar un bloque de variables de estado en cada momento del tiempo. Muy recientmente, Liesenfeld y Richard (en prensa) han propuesto mejorar el diseño y las propiedades muestrales de los procedimientos MCMC mediante su combinación con el procedimiento Efficient Importance Sampling (EIS) propuesto por Richard y Zhang (2007) y la utilización de un muestreo por bloques en el mismo espı́ritu del propuesto por Shephard y Pitt (1997). Importance Sampling ha sido también utilizado por Jungbacker y Koopman (2007) para estimar un modelo A-ARSV. Ellos proponen estimar la moda de la distribución a posteriori mediante una aproximación de Laplace; ver también Meyer et al. (2003) donde utilizan la aproximación de Laplace en el contexto de la estimación MCMC del modelo ARSV con colas anchas. Los procedimientos MCMC han sido extendidos a modelos con errores con colas anchas por Chib et al. (2002) y a modelos con efecto leverage por So et al. (2002). Koopman y Uspensky (2002) extienden el método propuesto por Shephard y Pitt (1997) al modelo con efectos de la volatilidad en la media, ARSV-M, en el que la verosimilitud es evaluada utilizando Importance Sampling. Strickland et al. (2007) presentan resultados sobre la importancia que tiene la parametrización del modelo sobre la eficiencia computacional de los procedimien-.

(27) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 35. tos MCMC. En concreto, muestran las ganancias que se pueden obtener cuando los parámetros de escala y la varianza del error de la volatilidad aparecen en la ecuación de los rendimientos, yt , en lugar de hacerlo en la de la volatilidad, σt . Nótese que en la especificación considerada en este artı́culo, el parámetro de escala aparece en la ecuación de yt pero no el de la varianza de la volatilidad. En cualquier caso, los resultados en el artı́culo de Strickland et al. (2007) hacen referencia al modelo ARSV(1) con errores Normales, sin memoria larga ni efecto leverage. No está claro como dichos resultados pueden generalizarse a otros modelos SV. Finalmente, Yu et al. (2006) han propuesto un procedimiento MCMC para estimar el modelo donde se modeliza una transformación Box-Cox de la volatilidad como en (11). El algoritmo de remuestreo propuesto por Yu et al. (2006) está limitado en el sentido de que no permite incorporar el efecto leverage y porque asume que la distribución de los errores, εt , es Normal. Estas dos limitaciones han sido superadas en Zhang and King (2008). Máxima Verosimilitud Simulada (SML) El estimador SML, propuesto por Danielsson (1994), se basa en aproximar la verosimilitud utilizando simulación para integrar la volatilidad. Durham (2006) analiza las propiedades del estimador SML que puede ser implementado en modelos con efecto leverage y errores εt no Normales; ver, por ejemplo, Liesenfeld y Richard (2003). Durham (2006) muestra mediante experimentos de Monte Carlo que la distribución muestral de las estimaciones es muy parecida a la que se obtiene mediante el estimador MCMC de Jackier et al. (1994). Durham (2006) considera también el filtrado, suavizado, diagnóstico y el comportamiento numérico de estos métodos. El requerimiento básico para poder utilizar el estimador SML es que sea posible obtener la expresión de la densidad conjunta de las variables observables e inobservables del modelo. Cuando esto no es posible, el modelo puede estimarse por.

(28) 36. Esther Ruiz, Helena Veiga. Simulated Method of Moments (SMM) que sólo requiere que sea posible generar observaciones artificiales del modelo. Todas las estimaciones obtenidas mediante métodos basados en simulación dependen no sólo de los datos utilizados sino también de las semillas utilizadas para generar las secuencias pseudo-aleatorias. Dados unos datos determinados, cada semilla implica una estimación diferente de los parámetros. En este sentido, Durham (2006) recomienda hacer un análisis pormenorizado del error atribuible a la simulación. En concreto, sus estimaciones se basan en un número elevado de semillas para el generador aleatorio de las cuáles se reportan su media y desviación estándar. Máxima Verosimilitud Directa Este estimador fue propuesto por Fridman y Harris (1998) y se basa en calcular directamente la verosimilitud a través de integración numérica. Su convergencia es muy lenta. El procedimiento es implementado para estimar un modelo SV-M y ha sido extendido al modelo con efecto leverage por Bartolucci y De Luca (2003). Finalmente, Davis y Rodrı́guez-Yam (2005) proponen dos estimadores basados en una aproximación de la verosimilitud. En el primer estimador, la aproximación se calcula y se maximiza directamente. En consecuencia, el estimador es rápido y no es necesario recurrir a simulación. El segundo estimador se utiliza importance-sampling para estimar el error que se comete al aproximar la verosimilitud. 3.1.3.. Basados en Modelos Auxiliares. Estos estimadores se basan en el hecho. de que los modelos SV se simulan fácilmente aunque su estimación sea complicada. En consecuencia, se elige un modelo auxiliar cuya estimación sea sencilla. Exiten dos estimadores fundamentales dentro de este apartado: el estimador de Inferencia Indirecta (II) de Gourieroux et al. (1993) y el estimador EMM de Gallant y Tauchen (1996). Ambos procedimientos son muy intensivos computacionalmente y requieren utilizar un procedimiento adicional para estimar la volatilidad subyacente. Además, ambos proporcionan contrastes de mala especi-.

(29) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 37. ficación del modelo ajustado. Monfardini (1998) analiza las propiedades en muestras finitas del estimador II cuando se eligen como modelos auxiliares modelos AR y ARMA para log yt2 .. 3.2.. Estimadores Basados en la Aproximación Lineal. Estos procedimientos son rápidos y eficientes pero tienen la desventaja de que requieren linealizar el modelo. Por lo tanto, no pueden ser utilizados en modelos que no tengan una transformación lineal como, por ejemplo, el modelo SV-M en el que la volatilidad afecta al rendimiento medio; ver Koopman y Uspensky (2002). Con respecto a los métodos de estimación basados en aproximar las propiedades de log yt2 , existen dos estimadores fundamentales. En primer lugar, el estimador de Pseudo Máxima Verosimilitud (PMV), que maximiza la verosimilitud Gaussiana y, en segundo lugar, estimadores que tratan de aproximar la verosimilitud de log yt2 , normalmente mediante mixturas de Normales. Además, recientemente Knight et al. (2002) han propuesto estimar el modelo linealizado mediante el procedimiento de la Función Caracterı́stica Empı́rica. 3.2.1.. Pseudo-Máxima Verosimilitud (PMV). Tomando logaritmos de los ren-. dimientos al cuadrado en el modelo (1) se obtiene el modelo en (14). El estimador PMV, propuesto por Harvey et al. (1994), se obtiene maximizando la verosimilitud Gaussiana que se deriva del modelo (14), tratando ξt como si fuera Normal aunque realmente no lo sea. En consecuencia, el estimador PMV es consistente pero no eficiente; ver Ruiz (1994a). El estimador PMV puede utilizarse para cualquier distribución de εt . De hecho, si estimamos σξ2 como un parámetro más del modelo, su valor estimado puede sugerir cual es la distribución adecuada para εt mediante la relación entre dicho parámetro y la distribución, señalada anteriormente. Breidt y Carriquiry (1996) demuestran que el estimador PMV tiene un Error Cuadrático Medio (ECM) menor cuando se implementa con la transformación.

(30) 38. Esther Ruiz, Helena Veiga. propuesta por Fuller (1996) mediante la que se evita el problema de observaciones extremas que se obtienen cuando se toman logaritmos de rendimientos muy cercanos a cero. Su propuesta es aproximar log(yt2 ) por log(yt2 + λs2y ) − λs2y /(yt2 + λs2y ). (15). donde s2y es la varianza muestral de yt y λ es una constante8 . Además, muestran que la especificación del modelo en la que la constante aparece en la ecuación de los rendimientos en lugar de aparecer en la ecuación de la volatilidad, reduce los sesgos y los ECM del estimador PMV. Finalmente, So, Li y Lam (1997) han propuesto la utilización del algoritmo EM para obtener el estimador QML. Este procedimiento evita la maximización numérica de la verosimilitud y proporciona expresiones recursivas del estimador. Como consecuencia, el algoritmo EM es fácil de programar, computacionalmente eficiente y numéricamente estable. Además, el algoritmo permite obtener una expresión directa de la matriz de varianzas y covarianzas. 3.2.2.. Estimadores Basados en Aproximar la Verosimilitud de log yt2. Varios. autores han propuesto incrementar la eficiencia del estimador PMV aproximando la densidad de log ε2t . Además, estas aproximaciones permiten reducir las correlaciones entre extracciones sucesivas que aparecen cuando se utilizan procedimientos MCMC de movimiento único. En este sentido, Kim et al. (1998) asumen que εt es Normal en el modelo en el que no hay efectos asimétricos y aproximan dicha densidad mendiante una mixtura de 7 distribuciones Gaussianas para poder representar los primeros 4 momentos de la distribución9 . Después utilizan procedimientos de MCMC para remuestrear de las distribuciones a pos8. Harvey y Streibel (1998) fijan la constante λ en 0.02. Alternativamente, Kim et al. (1998) y Omori et al. (2007) también consideran una transformación similar dada por log(yt2 + c) donde c = 0,001 y 0,0001 respectivamente. 9 Carter y Kohn (1997) utilizan 5 componentes en la mixtura para estimar los parámetros de un modelo de componentes inobservables mediante un estimador basado en el periodograma..

(31) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 39. teriori de los parámetros y de las volatilidades; ver Mahieu y Schotman (1998), Primiceri (2005) y Stroud et al. (2003) para algunas aplicaciones empı́ricas de este estimador denominado KSC. Posteriormente Chib et al. (2002) propusieron la generalización del procedimiento al caso en el que εt tuviera colas anchas y Omori et al. (2007) proponen la extensión del estimador KSC a modelos donde εt tenga una distribución con colas anchas y pueda haber efectos asimétricos. Su procedimiento se basa en aproximar la distribución conjunta de log ε2t y (δεt−1 + (1 − δ 2 )1/2 ηt ) mediante una mixtura de 10 variables Normales bivariantes. Al comparar sus resultados con el estimador MCMC de Jacquier et al. (2004), ven que su estimador es más apropiado al tener correlaciones entre las extracciones más pequeñas y factores de ineficiencia menores. Kim y Stoffer (2008) también han propuesto aproximar la distribución del error de la ecuación de log yt2 mediante una mixtura de Normales con parámetros desconocidos; ver también Durham (2007) y Stoffer y Wall (2004). Su procedimiento permite que el ruido del nivel, εt , tenga colas anchas. Además, utilizan un procedimiento EM para poder implementar el estimador en series con observaciones irregulares. Finalmente, Sandman y Koopman (1998) propusieron el estimador de Monte Carlo Likelihood (MCL) basado en descomponer la verosimilitud de log ε2t en una parte Gaussiana, que se puede obtener mediante el filtro de Kalman, y el resto cuya esperanza se obtiene mediante simulación. Este estimador puede ser implementado en modelo con colas anchas, efectos leverage y SV-M.. 3.3.. Estimadores para Modelos con Memoria Larga. Los estimadores para modelos LMSV simétricos propuestos en la literatura pueden clasificarse en estimadores paramétricos y semiparamétricos. En los primeros se asume un modelo concreto tanto para la memoria larga como para la dinámica de memoria corta de la volatilidad y se estiman todos los parámetros de dicho.

(32) 40. Esther Ruiz, Helena Veiga. modelo, mientras que, en el segundo grupo de estimadores, no se asume una especificación concreta para la dependencia a corto plazo de log σt2 y únicamente se estima el parámetro de memoria larga, d. Pérez y Ruiz (2002) hacen una revisión de la literatura sobre modelos de memoria larga con especial atención a los estimadores de los parámetros del modelo LMSV(1,d,0). Más recientemente, Hurvich y Soulier (2008) han realizado una excelente revisión actualizada. En esta sección completamos dicha revisión.. 3.3.1.. Estimadores Paramétricos. Dentro de los estimadores paramétricos pue-. den distinguirse estimadores basados en cuatro principios distintos. En primer lugar están los estimadores basados en GMM propuestos por Wright (1999). El segundo grupo son los estimadores basados en EMM. El tercer grupo está formado por los estimadores bayesianos; ver, por ejemplo, So (2002), Chan y Petris (2000) y la extensión del procedimiento KSC a memoria larga de Jensen (2004). Recientmente, Brockwell (2006) ha propuesto un estimador del modelo LMSV basado en MCMC que permite obtener estimaciones de las volatilidades subyacentes que incorporan la variabilidad asociada a la estimación de los parámetros. Finalmente, el cuarto grupo está formado por los estimadores basados en PMV. Dentro de este cuarto grupo, hay dos estimadores. En primer lugar están los estimadores que maximizan la verosimilitud Gaussiana expresada en términos del error de predicción. El principal problema que se plantea al estimar los parámetros del modelo LMSV utilizando procedimientos basados en la representación del estado de los espacios del modelo es que el véctor de componentes inobservables no es finito; ver Chan y Palma (1998). Sin embargo, los problemas computacionales planteados en este estimador han sido superados mediante el procedimiento propuesto por Chen, Hurvich y Lu (2006); ver Deo (1995) para la demostración √ de la T −consistencia y la Normalidad asintótica del estimador PMV en el dominio del tiempo. Ferraz y Hotta (2007) analizan las propiedades en tamaños de muestra finitos del estimador PMV en el dominio del tiempo basado en truncar.

(33) Modelos de Volatilidad Estocástica...Modelizar la Evolución de la Volatilidad. 41. la representación ARMA de log yt2 en el espacio de los estados; ver Chan y Palma (1998) y Basak et al. (2001). Alternativamente, el estimador PMV más popular se basa en maximizar la aproximación de Whittle de la verosimilitud Gaussiana de log yt2 en el dominio de las frecuencias; ver Harvey (1998) y Breidt et al. (1998) que propusieron independientemente el estimador de Whitle para modelos √ LMSV. El estimador de Whittle tiene garantı́a de ser T -consistente; ver Chen y Deo (2006) sobre la necesidad de una elección de momentos cuidadosa en el estimador EMM para poder garantizar esta propiedad. Además, los resultados de Zaffaroni (2008) permiten derivar su distribución asintótica en el modelo con errores incorrelados. Sin embargo, el estimador de Whittle es ineficiente porque se basa en el supuesto de Gaussianidad y tı́picamente log yt2 no es Gaussiano. Además, sus propiedades en tamaños de muestra finitos, analizadas por Pérez y Ruiz (2001) solo son adecuadas cuando el tamaño de muestra es muy grande. Recientemente, Deo et al. (2006) han propuesto una modificación del estimador de Whittle denominada Enhanced Frequency Domain QML (EFDQML) que se basa en implementar el estimador de Whittle a transformaciones de los rendimientos que estén más cercanas a la Normalidad de lo que lo está log yt2 . En θ. concreto, proponen la transformación |yt | donde θ se elige de forma que dicha transformación tenga el parámetro de asimetrı́a igual a cero. No hay resultados sobre la distribución asintótica del estimador EFDQML aunque los experimentos de Monte Carlo realizados por Deo et al. (2006) señalan que este estimador tiene mejores propiedades en tamaños de muestra finitos que el estimador de Whittle.. 3.3.2.. Estimadores Semiparamétricos. Chen y Deo (2006) han demostrado que,. incluso en el caso de una correcta especificación de la memoria larga en un modelo ARFIMA, si la dinámica de la memoria corta no está bien especificada, el estimador del parámetro d converge a un valor distinto del verdadero. Por ello, cuando el interés se centra únicamente en la estimación de dicho parámetro puede ser interesante utilizar estimadores semiparamétricos, propuestos para estimar-.

(34) 42. Esther Ruiz, Helena Veiga. lo independientemente de otros componentes dinámicos que puedan caraterizar a la volatilidad. Estos estimadores se basan en la transformación lineal de los rendimientos en (14). Los primeros estimadores semiparamétricos del parámetro de memoria larga fueron el estimador de la regresión del log-periodograma, LPE, propuesto por Geweke y Porter-Hudak (1993) y el estimador Gaussiano semiparamétrico, GSE, de Robinson (1995). El estimador GSE tiene la desventaja de que requiere optimización no lineal pero es más eficiente que LPE. Sin embargo, ninguno de estos estimadores iniciales tienen en cuenta la presencia del ruido en (14) y, en consecuencia, tienen grandes sesgos negativos; ver Deo y Hurvich (2001, 2003), Crato y Ray (2002) y Arteche (2004). Posteriormente, se han propuesto estimadores que modifican a los anteriores considerando explı́citamente la presencia del ruido con el que la volatilidad es observada. Sun y Phillips (2003) propusieron una modificación del estimador LPE y Hurvich y Ray (2003) propusieron el estimador de Whittle local que generaliza al estimador GSE teniendo este último mejores propiedades estadı́sticas; ver Arteche (2004), Hurvich et al. (2005) y Dalla et al. (2005) para dichas propiedades. Recientemente, Arteche (2006), ha propuesto un estimador basado en LPE con propiedades estadı́sticas similares a las del estimador de Hurvich et al. (2005). Aunque la demostración de la consistencia y normalidad asintótica de este nuevo estimador se realizan bajo el supuesto de ruidos Normales, Arteche (2006) ilustra mediante experimentos de Monte Carlo que dichas propiedades también se satisfacen en casos no Normales como el modelo en (14). Además, aunque las propiedades asintóticas de estos estimadores solo se han derivado para el caso estacionario, es decir, d < 0,5, Sun y Phillips (2003) señalan que puede esperarse que también tengan buenas propiedades siempre que d < 1. Finalmente, Arteche (2006) realiza una extensa comparación de las propiedades en muestras finitas de todos los estimadores semiparamétricos del parámetro d. En general, dichos estimadores tienen varianzas muestrales muy grandes. En una aplicación empı́rica a una serie de rendimientos.

Figure

Actualización...

Referencias

Actualización...