Pronóstico de la tasa de cambio nominal utilizando métodos alternativos

Texto completo

(1)PRONÓSTICO DE LA TASA DE CAMBIO NOMINAL UTILIZANDO METODOS ALTERNATIVOS. OCTAVIO JOSE SALCEDO PARRA. UNIVERSIDAD DE LOS ANDES FACULTAD DE ECONOMIA MAESTRIA EN ECONOMÍA - PEG SANTAFÉ DE BOGOTÁ, D.C. 2004.

(2) PRONÓSTICO DE LA TASA DE CAMBIO NOMINAL UTILIZANDO METODOS ALTERNATIVOS. OCTAVIO JOSE SALCEDO PARRA. Proyecto de grado para optar al título de Magíster en Economía. Director LUIS FERNANDO NIÑO PhD.. UNIVERSIDAD DE LOS ANDES FACULTAD DE ECONOMIA MAESTRIA EN ECONOMÍA - PEG SANTAFÉ DE BOGOTÁ, D.C. 2004.

(3) Nota de aceptación. Director. Jurado. Jurado. Ciudad y fecha.

(4) COMENTARIOS.

(5) TABLA DE CONTENIDO Página 1.. INTRODUCCIÓN .................................................................................................................................... 9. 2.. REDES NEURONALES ARTIFICIALES –RNA- Y LA MICRO-ESTRUCTURA DE LOS MERCADOS FINANCIEROS ......................................................................................................................................................... 14. 2.1. REDES NEURONALES ARTIFICIALES – RNA- ....................................................................................... 14. 2.2. MICROESTRUCTURA DE MERCADOS FINANCIEROS Y TASA DE CAMBIO ................................................ 23. 3.. ANÁLISIS EMPÍRICO ........................................................................................................................... 26. 3.1. DATOS UTILIZADOS ........................................................................................................................... 26. 3.2. ANÁLISIS DE RESULTADOS ................................................................................................................ 27. 3.3. MODELOS DE REDES NEURONALES ARTIFICIALES – RNA- .................................................................. 28. 3.4. MODELOS DE SERIES DE TIEMPO......................................................................................................... 29. 3.4.1 ANÁLISIS MULTIVARIADO .................................................................................................................. 29 3.4.2 ANÁLISIS UNIVARIADO ...................................................................................................................... 31 3.5. VERIFICANDO LA NO LINEALIDAD ...................................................................................................... 32. 4.. CONCLUSIONES Y RECOMENDACIONES ............................................................................................... 33. 5.. BIBLIOGRAFÍA ................................................................................................................................... 35.

(6) LISTA DE TABLAS Página TABLA NO. 1 PRUEBAS DE RAÍZ UNITARIA .................................................................................................. 28 TABLA NO. 2 TEST DE COINTEGRACION DE JOHANSEN .................................................................................. 29 TABLA NO. 3 VECTOR DE COINTEGRACION.................................................................................................. 30 TABLA NO. 4 MATRIZ ALPHA ...................................................................................................................... 30 TABLA NO. 5 CAUSALIDAD DE GRANGER Y TEST PORTMANTEAU ................................................................ 30 TABLA NO. 6 MODELO GARCH(1,1)............................................................................................................. 31 TABLA NO. 7 EVALUACIÓN DEL PRONOSTICO CON MODELOS ...................................................................... 31 TABLA NO. 8 PRUEBAS DE NO LINEALIDAD (HO: MODELO ES LINEAL) ........................................................ 33.

(7) LISTA DE GRAFICAS Página. GRÁFICA NO. 1 ESTRUCTURA DE UNA NEURONA BIOLÓGICA ......................................................................... 15 GRÁFICA NO. 1 SERIES EN NIVEL ................................................................................................................. 27 GRÁFICA NO. 2 AJUSTE DEL MODELO 1 RNA PRONÓSTICO H=10 ................................................................. 29 GRÁFICA NO. 3 AJUSTE DEL MODELO 2 RNA PRONÓSTICO H=10 ................................................................. 29.

(8) RESUMEN En este trabajo se han combinado dos nuevos enfoques capaces de modelar y pronosticar la evolución diaria del tipo de cambio nominal respecto al dólar estadounidense. Uno de estos enfoques, denominado Redes Neuronales Artificiales RNA pertenece a la inteligencia computacional, es un modelo estadístico no lineal inspirado en el funcionamiento del sistema nervioso, específicamente en las neuronas biológicas, capaz de pronosticar la tasa de cambio nominal y describir comportamientos no lineales presentes en esta. El otro elemento novedoso es la introducción de una variable microeconómica perteneciente a la microestructura de mercados financieros, orden de flujo, que captura las factibles no linealidades del tipo de cambio nominal: como se puede detectar en la presión a la demanda o la oferta de divisas por parte de los agentes en la bolsa de valores de Colombia, por tanto mediante la combinación de estos dos conceptos (RNA, orden flujo) se obtienen nuevos modelos alternativos para el pronóstico diario del tipo de cambio nominal, en oposición a la gama de modelos macroeconómicos y univariados existentes.. Palabras Clave:. Tipo de Cambio Nominal, Pronóstico,. Neuronales Artificiales.. modelo No-Lineal, Redes.

(9) 1. Introducción. El análisis para la modelación y el pronóstico del tipo de cambio de una divisa con respecto a otras ha tenido varias etapas relevantes. En este sentido los primeros modelos desarrollados, tenían como punto de partida los equilibrios de flujos entre los países, estos planteaban que el tipo de cambio podía determinarse mediante funciones de oferta y demanda de divisas correspondiente a cada uno de los países, entre los modelos que hacen parte de esta línea de desarrollo están los de Meade (1951) y Mundell - Fleming (1963) mencionados por Manrique (2001). Posteriormente con el dinamismo que adquirieron los mercados financieros y la caída del Bretton Woods aparecieron modelos en los que el comercio internacional, los flujos internacionales de comercio, el precio de las exportaciones, los bienes domésticos y los portafolios internacionales de activos, se tomaron como variables relevantes para la determinación de la tasa de cambio. Este enfoque se denominó equilibrio de stocks o mercado de activos, el cual se encuentra dividido en modelos monetarios (precios flexibles, precios rígidos) y modelos de equilibrio de cartera, los cuales pretenden explicar las fluctuaciones del tipo de cambio mediante un proceso análogo al que se ven sometidos los precios de otros activos financieros. En esta misma corriente, se originaron los modelos seminales y obligados en la literatura del tipo de cambio: Rogoff y Meese (1983, 1988), los cuales examinan los modelos monetarios y de balance de portafolios para pronósticos en horizontes cortos (1 a 12 meses). No obstante los trabajos de Meese y Rogoff (1983, 1988), reciben fuertes criticas en Evans y Lyons (1999), quienes consideran que los modelos de tasa de cambio nominal han estado en crisis desde la aparición de dicho modelo, al hacer todos ello un aproximación que empíricamente falla. Adicionalmente Frankel y Rose (1995) escriben “El análisis de Meese y Rogoff en horizontes cortos nunca ha sido convincentemente explicado. Se continuó. 9.

(10) trayendo un efecto pesimista en el campo de la modelación de la tasa de cambio empíricamente en particular y en las finanzas internacionales en general”1. En ese orden de ideas aparecen modelos tratando de explicar las causas de los pobres resultados de los modelos tradicionalmente macro de TCN. Flood y Rose (1995), por ejemplo, se encaminan a que los determinantes más críticos de la volatilidad de la tasa de cambio no son macroeconómicos. Blanchard (1979), Dornbusch (1982), Meese (1986) y Evans (1986), entre otros, se mueven en la corriente que propone que se deben tomar variables exógenos para explicar la volatilidad de la TCN, a partir de burbujas financieras. en contravia Flood y Hodrick (1990) concluyen que las alternativas de burbuja son poco convincentes. De otra parte Domínguez 1986, Frankel y Froot 1987 y Hau 1998, entre otros, explican los componentes exógenos a partir de irracionalidades como errores en las variables expectativas.2 Con esta motivación surge el trabajo de Evans y Lyons (1999) el cual hace un aporte significativo: la inclusión de una variable microeconómica para explicar y pronosticar las variaciones en la TCN. La idea central de este modelo es considerar elementos propios de la microestructura de mercados financieros sobre la valoración de activos, para incluir variables explicativas (microeconómicas), no consideradas en los trabajos hasta aquí realizados. Fundamentalmente se hace un desarrollo sobre las órdenes de flujo, entendidas como la medida de la presión a la venta o la compra del activo financiero, tomándolas como variable explicativa del modelo de TCN. Este modelo explica las variaciones de la tasa de cambio en una función lineal del diferencial de la tasa de interés y el orden de flujo el yen vs. US dólar y marco alemán vs. US dólar para el periodo comprendido de mayo 1 a agosto 31 de 1996. Las conclusiones del este documento apuntan en cuatro direcciones: la robustez, la causalidad, cambios en el portafolio y la capacidad de pronóstico fuera de la muestra.. 1 2. Evans y Lyons (1999) Ibid. 10.

(11) Otros trabajos se movieron en una dirección alterna, no de especificación, sino de la forma funcional de la tasa de cambio, en el sentido que hicieron apreciaciones sobre la no linealidad de la tasa de cambio. Se destacan Baillie y McMahon (1989) quienes precisaron que la tasa de cambio no es linealmente previsible, Hsieh (1989) observó que los cambios de la tasa de cambio pueden ser no linealmente dependientes. A pesar de ello Meese y Rose (1991) encontraron que el pobre poder explicativo de los modelos no podía ser atribuido a las no linealidades, pese a que previamente, Meese y Rose (1990), utilizaron un estimador no-paramétrico para manejar las no linealidades, sin que proporcionara ninguna mejora significativa en la explicación mensual de la tasa de cambio 3. En este contexto, recientemente Evans y Lyons(2004) persisten en la microestructura como determinante de la tasa de cambio, mediante un modelo de equilibrio dinámico. Este trabajo concluye que aun existen vacíos en la explicación de la TCN a partir de fundamentos macro. Los problemas en la explicación surgen por la volatilidad de las variables macro, porque hay variaciones en la TCN cuando no hay movimientos en las variables macro, o viceversa. Adicionalmente y en contraposición a los tradicionales modelos ARIMA, de caminata aleatoria, martingale, cadenas de markov utilizados entre otros por Baillie y Bollerslev (1989), Engel y Hamilton (1990) y Verkooijen (1996) y Plasmans, Verkooijen, y Daniels (1998) utilizaron modelos macroeconómicos y las redes neuronales artificiales (RNA), para probar si la relación subyacente es no lineal, a la vez que Hu (1999) demostró (con datos diarios y semanales) que las redes neuronales artificiales –RNA- son un método más robusto de pronóstico que el modelo de caminata aleatoria. Previamente Kuan y Liu (1995) habían usado una técnica hacia el futuro y redes neuronales artificiales recurrentes para producir pronósticos de media condicional de la tasa de cambio 4.. 3 4. Gradojevic y Yang 2000 Ibid. 11.

(12) Contrariamente en Colombia la literatura de TCN no es muy amplia, en contraste con la de tasa real, Cárdenas (1997) menciona los trabajos de Wiesner (1978), Urrutia (1981), López (1987) y Steiner (1987) sobre los procesos de minidevaluaciones en el sistema de crawling peg colombiano. El trabajo de Cárdenas (1997), analiza los determinantes de la tasa de cambio nominal en el periodo 1985-1986, bajo los dos regímenes, crawlin peg y el sistema de bandas5, mediante: el modelo monetario simple, el modelo monetario con precios fijos y el modelo de balance de portafolio, la conclusión sobre los determinantes apunta a que el modelo monetario con precios flexibles se ajusta en buena manera la comportamiento de la TCN colombiana. Según el modelo la TCN responde a cambios en la oferta monetaria y las tasas de interés. Más recientemente Oliveros y Huertas (2002), presentan un documento que considera “la estimación de los desequilibrios nominales y reales del tipo de cambio en Colombia” incluyendo dos componentes: uno de tendencia estocástica y uno asociado al ciclo. Sintéticamente la descomposición apunta a que la tendencia se asocia al equilibrio y el componente estocástico con los desequilibrios. Para el TCN en la serie presentada (información trimestral de marzo 1980 a marzo 2002) la paridad en el poder de compra, no se valida en el sentido estricto. Adicionalmente se construye un modelo de Behavioral Equilibrium Exchange Rate –BEER-, el cual arroja conclusiones similares. En el horizonte metodológico Jalil y Melo (1999) presentan una manera de testear la nolinealidad de la inflación y el crecimiento de los medios de pago, particularmente comparando un AR(p), con un modelo autorregresivo de transición suave STAR6. Son relevantes las conclusiones que van de la mano con la identificación de relaciones nolineales entre inflación y el crecimiento de los medios de pago y con la alta capacidad de pronóstico del modelo no lineal en el largo plazo.. 5. Colombia desde 1967 a octubre de 1991 mantuvo un tipo de cambio fijo ajustado con minidevaluaciones (crawling peg), a partir de noviembre de 1991 adoptó un sistema de bandas hasta septiembre de 1999 cuando se adoptan el tipo de cambio de flotación libre. 6 Particularmente este test es aplicable a modelos no-lineales con formas funcionales definidas y no es factible su aplicación a RNA, ya que estas no tienen formas funcionales definidas. 12.

(13) Bajo este contexto, fundamentado en la microestructura y las RNA, y teniendo en cuenta las críticas hacia los modelos enteramente macro de Evans y Lyons (1999) y lo expresado por Barkoulas, Baum, Caglayan y Chakraborty (2001) sobre los procesos tipo martingale y la memoria de largo plazo, el presente documento examina el comportamiento de un modelo de pronóstico de la TCN del peso respecto al U.S. dólar al introducir una variable de la microestructura del mercado (orden de flujo) en un sistema de observaciones diarias con variables macroeconómicas (tasas de interés), bajo una modelación no lineal de RNA, para series de tiempo diarias de un (1) año. Se compara este modelo contra varias alternativas de estimación, las cuales ya han sido ampliamente referidas en la literatura empírica: Modelos de Cointegración y Modelos ARCH. Por último, se compara la capacidad de pronóstico mediante la raíz del error cuadrático medio (RMSE) y el error medio porcentual absoluto (MAPE)7.. Para ello el artículo se dividió en cuatro secciones: La primera sección que cubrió la introducción. La sección 2 revisa lo relacionado con las RNA y la microestructura de los mercados financieros. La sección 3 describe los datos, analiza y presenta los resultados. La sección 4 corresponde a conclusiones y recomendaciones.. 7. Una amplia revisión de estos modelos econométricos puede encontrarse en Mills(1999) y Brooks(2002). De hecho, Mills(1999) presenta los modelos aquí mencionados para datos de la libra esterlina en diferentes períodos de tiempo.. 13.

(14) 2. Redes Neuronales Artificiales –RNA- y La micro-estructura de los mercados financieros 2.1 Redes Neuronales Artificiales – RNAUna Red Neuronal Artificial. (RNA) es un intento de poder realizar una simulación. computacional del comportamiento de partes del cerebro humano mediante la réplica en pequeña escala de los patrones que éste desempeña en la formación de resultados a partir de los sucesos percibidos. Más formalmente las RNA son modelos estadísticos no lineales utilizados principalmente para la clasificación y predicción de datos y variables, inspirados por el sistema nervioso biológico, que tratan de simular el proceso de aprendizaje humano con el convencimiento de que habiendo sido creados por el proceso de selección natural el mecanismo debe ser eficiente. (Montenegro, 2001). Se denominan neuronales porque están basadas en el funcionamiento de una neurona biológica cuando procesa información. Éstas tienen tres partes bien diferenciadas: la soma, las dendritas y el axón. La neurona biológica toma los datos por las dendritas que están conectadas a otras neuronas o centros de información nerviosa, estas a su vez son el árbol receptor de la red, son como fibras nerviosas que cargan de señales eléctricas el cuerpo de la célula. La conexión, denominada sinapsis se realiza mediante los llamados neurotransmisores, es el punto de contacto entre un axón de una célula y una denterita de otra célula. La transmisión de una señal de una neurona a otra, es a través de una sinapsis, la cual es un proceso complicado, en el cual sustancias transmisoras especificas son enviadas del lado que trasmite en la sinapsis, los estímulos procedentes de las conexiones sinápticas son lo suficientemente grandes la neurona se activa enviando a través del axón una corriente eléctrica destinada a liberar neurotransmisores hacia otras neuronas y el soma, el cuerpo de la célula, realiza la suma de esas señales de entrada. En la figura 1 se puede detallan las partes:. 14.

(15) Gráfica No. 1 Estructura de una neurona biológica La estructura de una neurona artificial es una emulación de una neurona biológica de modo que se podría hacer el siguiente paralelo con la neurona biológica: Las entrada Xi representan los pulsos discretos que provienen de otras neuronas y que son absorbidas por las dendritas (UTP, 2000). Los pesos Wi son la intensidad de la sinapsis que conecta dos neuronas. θ, es el umbral, valor que la neurona debe sobrepasar, para que se produzca el proceso biológico dentro de la célula al activarse, analogía que puede apreciar en la grafica 2.. θ. De la cual se deduce que: 15.

(16) H. H i (t ) = ∑ X j ⋅W j =1. j. donde: Hi(t): Potencial sináptico de la neurona i en el momento t Xj:. Entrada de datos procedentes de la fuente de información j. Wj:. El peso sináptico asociado a la entrada Xj. Como una de las características mas relevantes detrás de las RNA es adquirir conocimiento mediante datos pasados se hace necesario el proceso de aprendizaje en el cual la RNA modifica sus pesos (Wi) en respuesta a una información de entrada (Xi). Los cambios que se producen durante el proceso de aprendizaje se reducen a la destrucción, modificación y creación de conexiones, entre neuronas. Por tanto el proceso de aprendizaje (entrenamiento) de la red artificial depende del tipo de red neural modelada, y se catalogan como algoritmos de aprendizaje supervisados y no supervisados. Para las redes neurales utilizadas en este trabajo es necesario emplear algoritmos de aprendizaje supervisados que consisten en modificación sucesiva de los parámetros de la red (pesos y umbrales) hasta que la salida de la red sea lo mas próxima posible a la salida deseada o esperada para cada patrón de entrenamiento. En este sentido se utilizó la arquitectura RNA Multilayer Perceptron –MLP- con la técnica de aprendizaje, backpropagation, en la que su topología puede tener una capa de entrada con n neuronas, para este caso de estudio, se utilizó una capa con dos neuronas para el primer modelo (la orden de flujo –ODF- y la diferencia entre la DTF y la libor -DDL-, con los siguientes rezagos: ODFt-1, ODFt-2, ODFt-9, ODFt-13, ODFt-36, DDLt-1, DDLt-5, DDLt-6, DDL. t-8,. DDLt-9, DDLt-17), y cinco neuronas (TRMt-1, TRMt-2, TRMt-3, TRMt-14 y TRMt-16). para el segundo modelo8, por lo menos una capa oculta (con cuatro y ocho neuronas, para el. 8. Se utilizó el δ – test, ver Anexo A. 16.

(17) primer y segundo modelo RNA respectivamente) también con n neuronas, y una capa de salida con m neuronas, para estos modelos se utilizó solamente una neurona de salida – TRM-, en síntesis la RNA considerada posee una arquitectura con una capa de entrada, una capa oculta y una capa de salida, por tanto puede ser expresada como RNA(I, H, O). Es de resaltar, que el tamaño de la capa de entrada (ODF, DDL) corresponde a la caracterización propia del problema, de acuerdo con esta consideración, la generación de la capa de entrada es proporcional a las variables de mayor relevancia sugeridas en la solución del problema, aplicándole el δ-test se obtuvo el porcentaje de significancia de cada una de ellas para el ajuste y pronóstico de la tasa cambio nominal (TRM). El tamaño de la capa oculta puede ser un factor multiplicativo de la capa de entrada. La capa de salida depende del patrón de resultados que deseamos obtener para la TRM. La técnica de aprendizaje, se basa en la regla delta generalizada la cual es una técnica basada en el descenso usando la técnica del gradiente para minimizar una función objetivo W(wi) que es diferenciable con respecto cada uno de los pesos en la red, en este sentido es realmente una técnica. de optimización distribuida basada en el descenso, usando la. dirección del gradiente, tal que las expresiones de descenso que usan el gradiente aparecen como reglas discretas de actualización de los pesos, que utilizan únicamente información localmente disponible a cada neurona (nodo) y una cantidad que es retropropagada desde las neuronas (nodos) en la penúltima capa, por tanto a continuación se deduce la regla que se utilizo en el modelo de pronostico de RNA: La arquitectura funcional de la red es:. Y. t. H. I. h =1. i =1. = g (∑ c h g (∑ xti wih + θ h ) + d ). Donde los ch son los pesos que unen la neurona h de la capa oculta con la neurona de la capa de salida y d el umbral de la neurona en la capa de salida, los pesos (w, c) y umbrales (θ, d) son ajustados durante el entrenamiento de la red. La fórmula para el ajuste de los. 17.

(18) pesos de la red depende de la posición de las capas que conectan los pesos, particularmente si los pesos están en la capa oculta o en la capa de salida. •. Actualización de los pesos de la capa de salida. El error de una unidad de la red de salida MLP puede escribirse como:. δ tk = (Ytk − Yˆtk ). (1). t se refiere al t–ésimo vector de entrenamiento y k a la k-ésima unidad de salida (Como en el modelo MLP solo se utilizó una neurona en la capa de salida k = 1) (Mendez 2002). La regla delta generalizada del algoritmo BP minimiza la SCE de todas las unidades de salida. Et =. 1 O 2 δ tk ∑ 2 k =1. (2a.). El termino ½ aparece solo por conveniencia. Para determinar el sentido en que se deben cambiar los pesos, se calcula el valor negativo del gradiente de Et, ∇Et respecto a los pesos Wkj. Et =. 1 O (Ytk − Yˆtk ) 2 ∑ 2 k =1. ∂Et ∂Wkj. o. = −(Ytk − Yˆtk ). ∂ (netatk ) o. ∂Wkj. o. ⎛ ∂ =⎜ ⎜ ∂Wkj o ⎝. (2b.). ∂Fk. ∂(netatk ) o. o. ∂(netatk ) o. ∂Wkj. (3). o. ⎞ o o⎟ + W S d = S tj ∑ kj tj k ⎟ j =1 ⎠ H. (4). Con nodos de salida, salida de cada nodo de la capa oculta y salidas de los nodos de la capa de entrada como sigue:. 18.

(19) H. netatk = ∑ Wkj S tj + d k o. o. o. (5),. j =1. S pj = F j (netatj ) h. h. I. (6),. netatj = ∑ W ji X ti + θ j h. h. h. (7),. i =1. La magnitud del cambio de los pesos será proporcional al gradiente negativo de: ∂Et ∂Wkj ⇒. o. = −(Ytk − Yˆtk ). ∆ t Wkj. o. ∂Fk. o. ∂(netatk ) o. = η (Ytk − Yˆtk ). S tj ∂Fk. (8) o. ∂ (netatk ) o. (9). S tj. Los pesos de la capa de salida se actualizan según: Wkj (iteraccion) = Wkj (iteraccion − 1) + ∆ tWkj (iteracción − 1) o. o. o. (10a.). Si la función de activación es la función sigmoide (logística): F ( x) =. 1 , 1 + e−x. Su derivada es: F ' ( x) = F ( x )(1 − F ( x) ). (11). De (9), (10a) y (11) la dinámica del vector de pesos de la capa de salida se calcula como:. (. ). o o Wkj (iteracción) = Wkj (iteracción − 1) + η (Ytk − Yˆtk ) Yˆtk 1 − Yˆtk S tj. (10b). Donde en (10b), η es la tasa de aprendizaje, un valor alto de esta tasa de aprendizaje puede ayudar a la rápida convergencia de la red, pero se corre el peligro de saltarse el mínimo global de la suma de los cuadrados de los errores (SCE).. 19.

(20) De esta manera queda manifiesto que las modelaciones mediante RNA se refieren típicamente a modelos estadísticos no lineales, del tipo:. x t = f ( x t −1 , x t − 2 ,..., x t − d ) + g (rt , rt −1 , K , rt − k ) donde f puede ser cualquier tipo de función relacionando con la salida xt dado un conjunto de variables de entrada. Adicionalmente cabe mencionar que dado el proceso iterativo y la forma funcional que precede cada respuesta los valores de los parámetros no interesan en el sentido cualitativo, tal como interesan en modelos lineales o regresivos. •. Actualización de los pesos de la capa oculta. Para determinar la dinámica del vector de pesos de la capa oculta, se calcula el gradiente negativo de la suma de los cuadrados de los errores con respecto a los pesos de la capa oculta y el cambio en el vector de pesos se hace en la dirección del negativo de este gradiente (Méndez, 2002) . Partiendo de: (2b.) 1 2. Et =. =. O. ∑ (Y k =1. − F k ( neta o. tk. o tk. )) 2. (2c.). 1 O o o o (Ytk − Fk (∑ Wkj S tj + d k )) 2 ∑ 2 k =1. (2d.). Como Stj depende de los pesos de las capas ocultas ∂E t ∂W ji. =−. h. = − ∑ (Ytk − Yˆtk ). ∂Et ∂W ji. 1 ∂ (Ytk − Yˆtk ) 2 ∑ h 2 ∂W ji. h. (12a). ∂Yˆtk. o ∂S tj ∂ (netatj ) ∂(netatk ) o h h ∂S tj ∂(neta tk ) ∂(netatj ) ∂W ji h. 20. (12b.).

(21) ∂Et ∂W ji. h. o o o h h = − ∑ (Ytk − Yˆtk ) Fk ' (netatk ) Wkj F j ' (netatj ) X ti. (12c.). Los pesos de la capa oculta se ajustan proporcionalmente al negativo de la ecuación (12c) h h h o o o ∆ t W ji = η F j ' (neta tj ) X ti ∑ (Ytk − Yˆtk ) Fk ' (neta tk ) Wkj. (13). De (13), el cambio en el vector de pesos de la capa oculta se calcula como: h h h h o o o W ji (iter ) = W ji (iter − 1) + η F j ' (netatj ) X ti ∑ (Ytk − Yˆtk ) Fk ' (netatk ) Wkj. (14). Es de resaltar que la repropagación sugiere, la idea básica detrás de este calculo de señales de error para los nodos ocultos es propagar los errores hacia atrás, basados en la discrepancia observada entre los valores de los nodos de salida y los esperados para un patrón de entrenamiento, es anotar que los pesos cambian cuando se presenta cada patrón de entrenamiento. En este contexto considerando la convergencia del algoritmo de acuerdo con las técnicas de gradiente descendiente es conveniente avanzar por la superficie de error con incrementos pequeños de los pesos, ya que se tiene información local de superficie y no sabe lo lejos o lo cerca que se esta del punto mínimo, y si se toman valores grandes de incrementos, es posible no evaluar valores pequeños que factiblemente sean una buena medida del valor pronóstico. En muchos entrenamientos la tasa de aprendizaje (alfa factor de decaimiento exponencial entre 0 y 1 que determina la contribución relativa del gradiente actual y los anteriores al cambio en los pesos), de peso debe ser pequeña y se le introduce un termino de aceleración, para asegurar que la red converja, por ello casi siempre la red debe hacer un numero significativo de iteraciones.. El modelo base de la red neuronal artificial trabajada es:. 21.

(22) H. I. h =1. i =1. Yt = g (∑ ch g (∑ xti wih + θ h ) + d ) Para una salida de la capa oculta de la siguiente forma: I. Oth = g (∑ whi xti + θ h ) i =1. Donde: Oth. Es la de salida de la neurona h de la capa oculta dado el vector de entrada en t.. Xti. Es la señal de entrada9 i que pertenece al vector de entrada (vector de entrada en el tiempo t).. Whi. Son los pesos que conectan las neuronas entre capas.. θh. Es el umbral de la neurona h ubicada en la capa oculta.. I. Es la dimensión del vector de entrada.. g. Es la función de activación, función logística: g ( x) =. 1 , 1 + exp − x. Esta función limita la señal de salida al intervalo [0,1] porque g(-∞) = 0 y g(∞) = 1.. 9. La selección del vector de entrada no es inmediata y, dada su importancia, debe utilizarse un método adecuado. Hong Pi y Carsten Peterson (1994) diseñaron el método de la prueba δ (δ -test), el cual establece las dependencias funcionales dadas en una secuencia de medidas. Este método se basa en el cálculo de las probabilidades condicionales y posterior derivación de las dependencias entre variables. La virtud del método para preprocesar datos en el contexto de redes neuronales de tipo feedforward está demostrado tal como el perceptrón multicapa –MPL- utilizado para diseñar la RNA (Buitrago y Alcalá, 1998). Ver anexo A, para una explicación detallada.. 22.

(23) Aplicando esta conceptualización y haciendo un paralelo con el modelo clásico de regresión lineal, el interés no radica en los parámetros del modelo o en el signo de éstos, lo que interesa realmente es que iterando con unos pesos y con una función de activación (se aplica la función sigmoide), seguramente se podrá ajustar el modelo y encontrar un buen pronóstico. Debido a que las RNA no definen un modelo matemático determinado o una forma funcional establecida, no es posible establecer una distribución para los errores. 2.2. Microestructura de Mercados Financieros y Tasa de Cambio. La microestructura de los mercados financieros es el estudio de los procesos y resultados que se producen en el intercambio de activos bajo reglas de negociación explícitas (Marín y Rubio, 2001). Dicha microestructura, se centra en la interacción entre los mecanismos del proceso de negociación y sus resultados en términos de precios y cantidades negociadas. Se reconoce que las reglas específicas bajo las cuales se produce el proceso de negociación afectan directamente los resultados de tales procesos, es decir el comportamiento de los agentes en el juego de demanda y oferta determinan el precio y los volúmenes de transacción. Cuestiones como la eficiencia de un determinado mecanismo de contratación, la naturaleza del proceso de ajuste de los precios ante la llegada de nueva información, y el papel de la información asimétrica entre los diversos agentes que intervienen en las negociaciones son piezas claves de la microestructura de mercados. La introducción de microestructuras al estudio de la tasa de cambio permite considerar tres elementos que complementan la visión del mercado de activos: información que no es del dominio público, la existencia de diversos actores en el mercado que intervienen de diferente manera y la presencia de varias formas de intercambio, las cuales afectan los precios. La idea central bajo la cual se sustenta este nuevo approach es evaluar que verdaderamente quienes definen el precio, son los que intervienen en la compra o venta del activo, y en ese sentido son relevantes sus preferencias dentro del mercado y la manera en 23.

(24) que toman las decisiones acerca de comprar o vender. Lo anterior permite una visión complementaria a algunos puzzles de la tasa de cambio: explicar la alta volatilidad de la tasa de cambio, el problema de especificación a partir de fundamentos macro y los inexplicables, pero predecibles retornos excesivos a la especulación, a partir de la forma en que las decisiones son tomadas con expectativas racionales y no racionales, y con información pública y privada, por parte de los actores del mercado. A su vez el sustento de las microestructuras para el estudio de la TCN se resumen en order flow y spread, el primer concepto se refiere al volumen de transacciones y el sentido de la mismas, es decir el volumen a transar y si se compra o se vende, lo que se asimila al exceso de demanda, toda vez que se realiza una operación no necesariamente implica un equilibrio de suma cero, el segundo a su vez es condicionante del precio en la medida que se adentra en las asimetrías de la información en le mercado financiero. A modo de resumen, la idea fundamental es que los mecanismos específicos de negociación, contratación y liquidación, así como la organización concreta sobre la que trabajan los intermediarios afectan el comportamiento de los precios. Esto implica que los determinantes de los precios no pueden medirse exclusivamente en términos de rendimiento esperado y múltiples fuentes de riesgo. La propia estructura del mercado es en si misma un determinante de los precios. Es relevante igualmente mencionar que el enfoque de microestructuras en TCN10 modela en la siguiente dirección: ∆Pt = f(X, I, Z) + εt Donde el cambio en la tasa de cambio nominal entre dos transacciones (∆Pt) (en contravía de variaciones promedio mensuales de los enfoque macro), es explicado a partir del orden de flujo (X), una medida de la posición del dealer o inventario (I) y un conjunto de variables micro adicionales (Z). Sin embargo el presente trabajo se mueve en la dirección. 10. Como modelos originales provenientes de Lyons y Evans (1999).. 24.

(25) de los híbridos, donde el pronóstico de la tasa de cambio (Pt), es explicado por variables micro y macro, de la siguiente manera: Pt = f(X, I, Z) + g (i ) + εt Donde, las órdenes de flujo se agregan y además se introduce una variable macro como es: tasas de interés nacionales y extranjeras (i). Esta modelación trata de solucionar los problemas de ajuste de los modelos macro de mercado de activos, en los que este es asociado con las órdenes de flujo no consideradas, que en ambos casos es recogido por el término de error de la función (εt), pero es mejor explicado a partir de consideraciones micro. En ese sentido, el presente está interesado en la “Demanda” entendida como el ofrecimiento de compra de una determinada divisa que contiene la información necesaria para identificarla o divulgarla y valorizarla y la “Oferta”, ofrecimiento de venta de una determinada divisa ó contrato que contiene la información necesaria para identificarla o divulgarla y valorizarla, de este sentido el sistema permite la transacción de divisas y /o contratos a través del sistema de mercado spot y sistema de mercado Next day (BVC, 2003), como variable micro y el diferencial de las tasas de cambio (DTF y LIBOR) como variable macro, como determinantes de las variaciones diarias de la TCN. Sobre las órdenes de flujo a nivel colombiano cabe mencionar que las operaciones legales de compra y venta de dólares se desarrollan a través de la Bolsa de Valores de Colombia, específicamente en el Sistema Electrónico de Transacciones e Información del mercado de divisas SET FX, que puede definirse como un mecanismo electrónico a través del cual las entidades afiliadas pueden mediante estaciones de trabajo conectadas a una red computacional, en sesiones de negociación, ingresar ofertas y demandas, cotizar y/o celebrar entre ellas las operaciones, contratos y transacciones propias a su régimen legal en el mercado cambiario, de forma que quedan registradas las operaciones a nivel intradiario. Adicionalmente es de relevancia mencionar que el mercado de intercambio nacional está organizado como un mercado de negociantes descentralizados con N negociantes, y clientes de los negociantes, los cuales ejecutan sus transacciones concurrentemente con todos los participantes conectados al sistema SET FX. La negociación se inicia todos los 25.

(26) días hábiles de lunes a viernes de 8:00 a.m. a 1:00 p.m., generalmente antes del inicio de cada sesión, los negociantes se reúnen con sus respectivos asesores en riesgo y analista económicos. para evaluar la tendencia del mercado de divisas y especular sobre las. necesidades de los clientes, lo cual va marcar el ajuste del precio y de la forma hasta cuanto los clientes están dispuestos apostarles a al compra y venta de divisas. Durante cada sesión los negociantes ejecutan las órdenes de flujo ya sea ejerciendo presión a la venta o la compra, dependiendo del comportamiento del mercado y de acuerdo con las necesidades de liquidez o comercialización que tengan sus clientes, es de resaltar que cada una de las realizaciones que ejecutan los negociantes y los clientes de los. negociantes son. independientes distribuidas normalmente, no públicamente observadas entre clientes y negociantes pero si observables entre negociantes. 3. Análisis Empírico 3.1 Datos Utilizados. La disponibilidad de bases de datos detalladas sobre la actividad intradiaria y diaria en los mercados financieros ha abierto la posibilidad a investigaciones econométricas sobre el funcionamiento de este tipo de mercados, por tanto se tomo orden de flujo ODF, TRM y el diferencial de la Tasa de Interés Libor DDL, desde 16 de Abril del 2003 al 16 Abril 200411. El set de entrenamiento de la red neuronal artificial se definió de acuerdo a una medida del error entre los datos generados y el conjunto de entrenamiento (datos reales), por lo general este valor varia, considerando valores pequeños. En el proceso de entrenamiento es probable, que si la RNA sufre un proceso de sobreentrenamiento, lo que provoca que la RNA entre un loop o si sufre un proceso de subentrenamiento, entonces para ambos procesos, la RNA perderá su capacidad de ajuste, pronóstico y generalización (Buitrago y Alcalá, 1998).. 11. El mercado de divisas en el país es relativamente nuevo 1991. Anteriormente las operaciones eran registradas, entre otros operadores, por el CITIBANK, y no hay disponibilidad de datos anteriores al proceso administrado por la BVC.. 26.

(27) En lo relacionado a la variable diferencial de tasa de interés (DDL) se tomo, la libor a noventa 90 días como componente macroeconómico de la economía estadounidense, la fuente de los datos es el sistema REUTER y por Colombia se tomo las DTF a noventa 90, estos datos tiene su origen en la pagina Web de Corfinsura. Finalmente y teniendo en cuenta la definición antes dada de orden de flujo, esta se calcula como la diferencia entre todas las operaciones iniciadas a la compra (T) y todas las operaciones iniciadas a la venta (P) en el mismo día, de tal forma que si OD > 0 hay mas intención de compra y por lo tanto una presión al alza en la tasa de cambio – la cual no necesariamente es explicada por variables macro del mercado – y cuando OD < 0 se produce el proceso inverso. 3.2 Análisis de Resultados. El gráfico 1 presenta las variables en niveles. Es de esperar, una alta volatilidad, característica de las series de tiempo financieras. Mediante los tests ADF y KPSS se determinó la estacionariedad de las series.. 2950. 300. 2900. 200. 2850. 100. 2800. 0. 2750. -100. 2700. -200. 2650. -300 -400. 2600 50. 100. 150. 50. 200. TRM. 100. 150 ODF. 6.9 6.8 6.7 6.6 6.5 6.4 6.3 50. 100. 150. 200. DIFLINEAL. Gráfica No. 1 Series en nivel. 27. 200.

(28) Tabla No. 1 Pruebas De Raíz Unitaria. Los resultados muestran que a un nivel de significancia de 1%, las series TRM y Diferencial de tasas de interés son no estacionarias. La Serie ODF es estacionaria. Adicionalmente se presenta el Test Ljung-Box para el residuo de la regresión auxiliar en cada caso y entre paréntesis el p-value asociado a la prueba. En el caso de modelos paramétricos se debe considerar esta propiedad de estacionariedad. Más adelante se muestran los resultados del test de cointegración de Johansen y para el caso de modelos univariados de pronóstico de TRM se trabajó con su primera diferencia en logaritmo natural(que corresponde al rendimiento compuesto continuamente).. 3.3 Modelos de Redes Neuronales Artificiales – RNA-. Como se explicó previamente, las RNA no tienen un modelo paramétrico específico, lo que se hizo, fue variar el vector de entrada, variables independientes, orden de flujo, diferencial de tasa de interés (DTF-Libor) en un tiempo t y rezagadas en un τ . Para el primer modelo al aplicar el δ - test, se obtuvo los siguientes rezagos más significativos para el modelo : (ODFt-1, ODFt-2, ODFt-9, ODFt-13, ODFt-36, DDLt-1, DDLt-5, DDLt-6, DDLt-8, DDLt-9, DDLt-17) Para el segundo modelo se considera la TRM rezagada en un τ = 1, como si fuera un AR(p), para este caso el δ – test, arroja significancia para los rezagos TRMt-1, TRMt-2, TRMt-3, TRMt-14, TRMt-16. 28.

(29) Gráfica No. 2 Ajuste del Modelo 1 RNA Pronóstico h=10. Gráfica No. 3 Ajuste del Modelo 2 RNA Pronóstico h=10. Finalmente cabe mencionar que según los pronósticos, se observa que a medida que pasa el tiempo (días) en el modelo 2 de RNA pierde capacidad de predicción, sin embargo, su aproximación a los valores reales es mejor que los otros modelos y a su vez es consistente con los estadísticos obtenidos, por ende la utilización de las técnicas RNA en el pronóstico de la TRM presentan mejores pronósticos que los modelos convencionales que utilizan técnicas estadísticas lineales.. 3.4 Modelos de Series de Tiempo 3.4.1 Análisis Multivariado. En la siguiente tabla se presenta el test de cointegración de Johansen. En todos los casos se presenta el test de la traza. Los resultados fueron obtenidos utilizando 2 rezagos. Vectores Ninguno Al menos 1 Al menos 2. Modelo 1 Valor Crítico 1% Modelo 2 Valor Crítico 1% Modelo 3 Valor Crítico 1% Modelo 4 Valor Crítico 1% 99.38 7.90(*) 2.42. 29.75 16.31 6.51. 104.03 12.36(*) 2.54. 41.07 24.6 12.97. 100.82 9.59(*) 0.00. 35.65 20.04 6.65. Tabla No. 2 Test de Cointegracion de Johansen. 29. 106.29 14.94(*) 3.52. 48.45 30.45 16.26.

(30) En todos los casos se encuentra que existe un vector de cointegración. Sin embargo, como se vio anteriormente, una de las variables es I(0), lo cual puede afectar esta conclusión; en particular, esta variable puede ser la que conforma el vector de cointegración. Utilizando el criterio de Schwartz, el modelo que se consideró adecuado fue el primero. Al estimar el VEC se obtuvo los siguientes resultados: TRM 1. Coeficiente Estadístico t. ODF 32.33773 [10.4216]. DIFERENCIAL 446.6811 [16.9962]. Tabla No. 3 Vector De Cointegracion. Coeficiente Estadístico t. -0.00268 [-9.72161]. 0.024488 [ 5.37546]. -4.18E-07 [-0.61896]. Tabla No. 4 Matriz Alpha. Exclude D(ODF) D(DIFLINEAL). Test. Causada : TRM P-value. 96.86 2.43. 0.00 0.30. Causada: ODF D(TRM) D(DIFLINEAL). 2.32 1.04. 0.31 0.59. Causada: DIFERENCIAL D(TRM) D(ODF) Portamentau(40). 1.120 1.163 6.99439. 0.571 0.559 0.6377. Tabla No. 5 Causalidad De Granger Y Test Portmanteau. En el anexo B se presenta el componente de corto plazo y la descomposición de varianza para este modelo. Se observa que en el corto plazo, únicamente la variable ODF causa a la tasa de cambio; sin embargo en el componente de largo plazo, las variables ODF y diferencial son significativas. Sobre este modelo se realizó el pronóstico 1 paso adelante para 10 períodos.. 30.

(31) 3.4.2 Análisis Univariado. Se considero un modelo alternativo sobre la primera diferencia de la tasa de cambio: Un modelo GARCH(1,1). COEFICIENTE Z- ESTADISTICO C D21 D25 D203 AR(1) MA(1). -0.05 1.52 -1.48 0.87 -0.34 0.55. P-VALUE. -2.05 9.95 -3.24 6.13 -1.23 2.31. 0.04 0.00 0.00 0.00 0.22 0.02. 1.689 2.971 2.193 p-value 0.177 0.850 0.805. 0.091 0.003 0.028. Variance Equation C ARCH(1) GARCH(1) Ljung-Box Jarque-Bera Arch(4) Modelo Definitivo. 0.034 0.272 0.457 Test 34.747 0.310 1.62. Tabla No. 6 Modelo Garch(1,1). RMSE MAPE. GARCH(1,1) 22.90 17.94. MODELO 1 RNA 31.98 26.93. VEC 20.66 15.72. MODELO 2 RNA 17.24 12.78. Tabla No. 7 Evaluación Del Pronostico Con Modelos. Los resultados de evaluación de pronóstico muestran que el modelo 2 de Redes Neuronales presenta mejor pronóstico que los modelos paramétricos presentados.. 31.

(32) 3.5 Verificando la No Linealidad. En este documento se propone un modelo no lineal e incluso se compara con alternativas de estimación y pronóstico de otros modelos. Para verificar la existencia de no linealidad para cada modelo se han desarrollado diversas pruebas, como el Test Arch referenciado anteriormente o el test LSTR mencionado en la introducción, aplicado a modelos con formas funcionales específicas.. Mills(1999) y Brooks(2002) presentan una discusión al respecto y muestran cómo en el caso que no se tenga una forma funcional previamente definida proponen como forma general de verificar no linealidad un test de Ramsey sobre los residuales de un modelo lineal, generalmente un modelo autorregresivo. Igualmente, Los autores proponen una variación denominada Test de Tsay, el cual en lugar de incluir términos pronosticados a diferentes potencias adiciona el producto de términos rezagados. Las ventajas de estos tests es que no requieren una forma funcional no lineal específica. La forma funcional para verificar no linealidad en el Test de Tsay es:. Donde u son los términos residuales del modelo lineal. Bajo la hipótesis nula, el modelo es lineal y el estadístico tiene distribución chi cuadrado con tantos grados de libertad como términos adicionales se incluyan en la anterior regresión. En el caso particular de verificar la posibilidad de no linealidad de un tipo de red neuronal, Terasvirta et al(1994), pág 2931 propone la siguiente forma funcional para verificar no linealidad:. 32.

(33) Igualmente bajo la hipótesis nula se tendría linealidad. Tanto el estadístico de Tsay como este particular para redes neuronales se distribuyen chi cuadrado. La enorme ventaja de esta modificación es que permite discernir la no linealidad que se analiza en este trabajo. A continuación se presentan los resultados para verificar la existencia de no linealidad en la tasa de cambio. Para todos los casos se supuso como número de rezagos, p=2. Test 4.154917 15.79502. TEST DE TSAY TEST NO LINEAL RNA. P-value 0.2452 0.0033. Tabla No. 8 Pruebas De No Linealidad (Ho: Modelo Es Lineal). Los resultados muestran que se rechaza la hipótesis nula para el test de no linealidad tipo Red Neuronal Artificial, según lo explicado por Mills(1999). Este resultado refuerza la conclusión parcial presentada previamente, según la cual el modelo alternativo más adecuado debería ser aquel que incluyese este tipo de linealidad. 4. Conclusiones y Recomendaciones. •. Este trabajo se mueve en la misma dirección de los recientes trabajos de Evans y Lyons de las microestructuras y tasa de cambio, haciendo una primera aproximación al caso colombiano, unido a una nueva metodología no-lineal para modelar –RNA- planteado para el caso de la inflación por Misas, López y Querubín (2002). Este enfoque permite analizar cómo las señales son percibidas de diferente forma por los agentes y de alguna manera se reflejan en la microestructura de la información, siendo, de todas maneras, asimetrías propias del mercado de divisas.. •. El uso de –RNA- que son típicamente modelos estadísticos no lineales, que pueden ser expresadas como un modelo genérico de aproximación de funciones permitió pronósticos mejores para un modelo de TRM, según el RMSE, respecto a otros modelos. 33.

(34) que deben ser parametrizados, con la inclusión de la variable microeconómica, orden de flujo. Adicionalmente se verificó la existencia de no linealidad del tipo RNA. •. El poder explicativo de las variables macroeconómicas, tal como mencionan Evans y Lyons (1999), en el comportamiento del tipo de cambio en el corto plazo –diario- es poco significativo, ya que para los modelos desarrollados se comportan como no significativas, en este sentido el mercado financiero con su comportamiento especulativo, explicado en gran parte por las órdenes de flujo es un determinante del precio del dólar en el corto plazo, ya que el volumen diario de negociación supera en gran medida el volumen de las ofertas y demanda reales de la economía, lo que explica en gran parte el poder del mercado financiero en la determinación del precio de las mismas.. •. La propia estructura del mercado es en si mismo es un determinante de los precios y de la determinación de la tasa de cambio nominal, específicamente la orden de flujo, como indicador de los mecanismos de negociación, contratación y liquidación, afecta el comportamiento de los precios.. •. Como recomendación a nivel metodológico, sería adecuado iniciar el estudio de líneas de investigación que fusionen diferentes técnicas de la computación bio-inspirada como los algoritmos genéticos y la lógica difusa, para así de esta forma obtener métodos predictivos y de optimización mas eficaces y potentes, ya que éstas tratan de simular comportamientos humanos de maneras diferentes a las tradicionales modelaciones lineales y computacionales.. 34.

(35) 5. Bibliografía. Baillie, R. and T. Bollerslev (1989). “Common stochastic trends in a system of exchange rates”, Journal of Finance, 44, 167-181. Barkoulas, T., Baum, C., Caglayan, M., Chakraborty, A (2000). “Persistent dependence in foreign exchange rates? A reexamination”. Department of Economics and Accounting. University of Liverpool Buitrago, A., Alcalá, J., (1998). “Análisis, Diseño e Implementación de un Prototipo de Sistema Neuronal Para Pronóstico de Series de Tiempo Económicas”. Departamento de Ingeniería de Sistemas. Universidad nacional Blanchard, O., (1979). “Speculative bubbles, crashes, and rational expectations”, Economics Letters, 14: 387-389. Cárdenas, M. (1997). “La tasa de cambio en Colombia”, Editores Tercer Mundo S.A. Primera Edición. Bogotá. Diebold, F. and J. Nason (1990).” Nonparametric exchange rate prediction?”, Journal of International Economics, 28, 315-332. Dominguez, K., (1986).”Are foreign exchange forecasts rational? New evidence from survey data”, Economic Letters, 21: 277-281. Dornbusch, R., (1982). “Equilibrium and disequilibrium exchange rates, Zeitschrift fur Wirtschafts und Sozialwissenschaften”, 102: 573-799; reprinted in R. Dornbusch, Dollars, Debts and Deficits, MIT Press: Cambridge, MA. Engel, C. and J. D. Hamilton (1990). “Long swings in the dollar: Are they in the data and do markets know it?”, American Economic Review, 80, 689-713. Evans, M., Lyons, R. (1999). “Order Flow and Exchange Rate dynamics”. NBER Working Paper No. 7317. 35.

(36) Evans, M., Lyons, R. (2004). “A New Micro Model of Exchange Rate Dynamics”. Frankel, J., and A. Rose, (1995). Empirical research on nominal exchange rates, in G. Grossman and K. Rogoff (eds.), Handbook of International Economics, Elsevier Science: Amsterdam, 1689-1729. Flood, R., and A. Rose, (1995).” Fixing exchange rates: A virtual quest for fundamentals”, Journal of Monetary Economics 36, 3-37. Gradojevic, N., Yang, J. (2000). “The Application Of Artificial Networks To Exchange Rate Forecasting: The Role Of Market Microstructure Variables” Bank of Canada December 2000, working paper 2000-23. Hau, H., (1998).” Competitive entry and endogenous risk in the foreign exchange market”, Review of Financial Studies, 11: 757-788. Hu, M.Y., G. Zhang, C.X. Jiang, and B.E. Patuwo. (1999). “A Cross-Validation Analysis of Neural Network Out-of-Sample Performance in Exchange Rate Forecasting.” Decision Sciences 30 (1): 197–216. Kuan, C-M. and T. Liu (1995).” Forecasting exchange rates using feedforward and recurrent neural networks”, Journal of Applied Econometrics, 10, 347-364. Jalil, M. y Melo, L.F. (1999). “Una relación no lineal entre la inflación y los medios de pago”. Borradores de Economía Banco de la República. Lyons, R (2001). “The microstructure approach to exchange rates”. MIT press. López, A.(1987). “Las minidevaluaciones en Colombia: un largo de búsqueda de una tasa de cambio libre, pero intervenida”, EN: 20 años del régimen de cambios y de comercio exterior. Banco de la República, Bogotá. Marín, C., Rubio, G. (2001). Economía Financiera. Barcelona: Antoni Bosch.. 36.

(37) Manrique, C. (2001).”La Modelización del Tipo de Cambio de la Peseta y el Marco Alemán Durante el Período 1987-1996”. Fundamentos de Análisis Económico. Meese, R., and K. Rogoff, (1983a). “Empirical exchange rate models of the seventies, Journal of International Economics”, 14: 3-24. Meese, R., and K. Rogoff, (1983b). The out-of-sample failure of empirical exchange rate models, in J. Frenkel (ed.), Exchange Rate and International Macroeconomics, University of Chicago Press: Chicago. Meese, R., and K. Rogoff, (1988).” Was it real? The exchange rate-interest differential relation of the modern floating-rate period,” Journal of Finance, 43: 933-948. Meese, R., Rogoff, K. (1983). “Empirical Exchange Rate Model of the Seventies: Do They Fit Out of Sample?” Journal of International Economics 14: 3–24. Meese, R. A. and A. K. Rose (1991). “An empirical assessment of nonlinearities in models of exchange rate determination”, Review of Economic Studies, 80, 192-196. Meese, R.A. and A.K. Rose. (1990). “Nonlinear, Nonparametric, Nonessential Exchange Rate Estimation.” The American Economic Review 80 (2): 678–91. Meese, R.A. and A.K. Rose. (1991). “An Empirical Assessment of Non-Linearities in Models of Exchange Rate Determination.” Review of Economic Studies 58 (3): 603–19. Montenegro, A.(2001).“Redes Neurales Artificiales” Documentos de investigación, Departamento de economía, Pontificia universidad Javeriana. Oliveros C, H. y Huertas C, C. (2002). “Desequilibrios nominales del tipo de cambio en Colombia”. Borrador4es d economía. Banco de la República. Plasmans, J., W. Verkooijen, and Daniels, H. (1998). “Estimating Structural Exchange Rate Models by Artificial Neural Networks.” Applied Financial Economics 8: 541–51.. 37.

(38) Steiner, R.(1987). “El manejo de la tasa de cambio y el estatuto cambiario: los objetivos de largo plazo y los desarrollos coyunturales”, EN: 20 años del régimen de cambios y de comercio exterior. Banco de la República, Bogotá. Torres, L., Hernández, G., Niño, L.(1994). Redes Neuronales. Bogota. Departamento de Matemática. Universidad Nacional de Colombia. Urrutia, M. (1981). “Experience with the crawling peg in Colombia” IN: J. Williamson, ed., Exchange Rate Rules, St. Martinus Press. NY Universidad Tecnológica de Pereira.(2000). “Redes Neuronales artificiales”. Facultad de Ingeniería Eléctrica. Disponible en http://ohm.utp.edu.co/neuronales Wiesner, E. (1978). “Devaluación y mecanismos de ajuste en Colombia” EN: Política económica externa en Colombia. Asociación Bancaria de Colombia, Bogotá, pp. 123-224. Verkooijen, W. (1996.). “A Neural Network Approach to Long-Run Exchange Rate Prediction.” Computational Economics 9: 51–65. Zhang, G. and M.Y. Hu. 1998. “Neural Network Forecasting of the British Pound/US Dollar Exchange Rate.” International Journal of Management Science 26 (4): 495–506. Mills, T(1999) The Econometric of Financial Modelling. Second Edition. Cambridge University Press. Brooks, J(2002) Introductory Econometrics For Finance. Cambridge University Press. Terasvirta, T et al(1994) Aspects of Modelling Nonlinear Time Series. Handbook of Econometrics. Chapter 48.. 38.

(39) Anexo A: Formulación General del δ − test Sea xt una serie de tiempo, t = 1, 2, 3, ..., N. x t = f ( xt −1 , x t − 2 ,..., x t − d ) + g (rt , rt −1 , K , rt − k ). (1). La serie de tiempo es representada como una sucesión de N puntos z(i) en un espacio de dimensión (d+1), (d=0,1,2,...). z (i ) = ( z 0 (i ), z1 (i ),K , z k (i ), K , z d (i )) Donde. z k (t ) = x t − k .. (2). definiendo :. l k (i , j ) = z k ( i ) − z k ( j ) ,. k = 0,1, K , d. (3). n(l0 ≤ ε , l ≤ δ ) = n( l0 ≤ ε , l1 ≤ δ , l12 ≤ δ , K , ld ≤ δ ) n(l ≤ δ ) = n(l1 ≤ δ , l12 ≤ δ , K , l d ≤ δ ) Se obtienen los valores de probabilidades para la dimensión:. P( l 0 ≤ ε , l ≤ δ ) = P( l ≤ δ ) =. 1 n( l0 ≤ ε , l ≤ δ ) N par. (4). 1 n( l ≤ δ ) N par. Donde Npar es el número total de parejas de vectores.. A partir de las anteriores definiciones se calculan las. probabilidades condicionales de la ecuación ( 5 ).. Pd (ε δ ) ≡ P( l0 ≤ ε l ≤ δ ) =. P( l 0 ≤ ε , l ≤ δ ). (5). P( l ≤ δ ). Pd (ε ) = max Pd (ε δ ) = Pd (ε δ ) δ ≤δ ε δ >0. Pd ( ε ). mide qué tan bien la dinámica puede ser modelada en términos de la variable d. Para cuantificar la dependencia. de cada una de las variables, es conveniente definir el índice de dependencia:. λd ( ε ) =. Pd ( ε ) − Pd −1 ( ε ) , 1 − P0 ( ε ). y su promedio sobre ε. 39. d = 1,2,K. (6).

(40) ∞. λ d (ε ) =. ∫ dελd ( ε )(1 − Po (ε )) 0. ∞. ∫ dε (1 − Po ( ε ) ) 0. Para un sistema determinístico libre de ruido,. Pd ( ε ). ∞. ∫ dε ( P ( ε ) − P. d −a. d. =. ( ε )). (7). 0. ∞. ∫ dε (1 − P ( ε )) o. 0. se satura a 1 para. d0. d0. d =1. d =1. d ≥ d0. ∑ λ d = ∑ λd ( ε ) = 1. 40. y se tiene (8).

(41) Anexo B: Componente De Corto Plazo – Vec. Error Correction:. D(TRM). D(ODF). CointEq1. -0.00268 [-9.72161]. 0.024488 [ 5.37546]. -4.18E-07 [-0.61896]. D(TRM(-1)). -0.16032 [-2.50996]. -1.605227 [-1.51920]. 5.39E-05 [ 0.34402]. D(TRM(-2)). -0.07862 [-1.55135]. 0.008388 [ 0.01000]. -0.000121 [-0.97518]. D(ODF(-1)). -0.05091 [-6.15994]. -0.214042 [-1.56548]. -9.01E-06 [-0.44446]. D(ODF(-2)). -0.00274 [-0.48561]. -0.101893 [-1.09048]. -1.30E-05 [-0.93642]. D(DIFLINEAL(-1)). -4.59097 [-0.18186]. -50.08267 [-0.11993]. 0.23435 [ 3.78351]. D(DIFLINEAL(-2)). -35.1767 [-1.42513]. -380.8994 [-0.93286]. 0.137912 [ 2.27720]. D9. -29.2282 [-4.02189]. -73.35969 [-0.61023]. 0.02447 [ 1.37233]. D21. 44.99588 [ 6.14487]. 105.7153 [ 0.87274]. -0.005439 [-0.30276]. D22. 31.92607 [ 4.04969]. 146.2174 [ 1.12120]. -0.000185 [-0.00957]. D25. -21.5619 [-2.96531]. -23.33663 [-0.19401]. 0.001495 [ 0.08381]. D120. 2.336862 [ 0.32214]. 67.2767 [ 0.56064]. 0.06987 [ 3.92559]. D62. -0.49423 [-0.06887]. -75.50492 [-0.63609]. 0.06922 [ 3.93156]. D214. 2.653032 [ 0.36252]. 100.8995 [ 0.83346]. 0.06946 [ 3.86834]. D57. -7.45664 [-1.03198]. 66.56916 [ 0.55694]. -0.05681 [-3.20445]. R-squared. 0.598634. 0.506211. 0.304177. 41. D(DIFLINEAL).

(42) Anexo C. Descomposición De Varianza – Modelo VEC Variance Decomposition of TRM: Period S.E. TRM 1 2 3 4 5 6 7 8 9 10. 7.1 9.8 13.9 16.7 19.2 21.5 23.6 25.6 27.4 29.1. ODF 97.4 87.5 57.1 48.0 43.1 39.8 37.4 35.8 34.5 33.6. Variance Decomposition of ODF: Period S.E. TRM 1 2 3 4 5 6 7 8 9 10. 117.95 118.49 118.90 118.98 119.01 119.02 119.02 119.02 119.03 119.03. 0.02 0.03 0.04 0.05 0.05 0.06 0.07 0.07 0.08 0.08. 2.5 12.4 42.7 51.6 56.2 59.3 61.5 63.0 64.1 64.9. ODF 0.00 0.88 0.91 0.90 0.90 0.90 0.90 0.90 0.90 0.91. Variance Decomposition of DIFLINEAL: Period S.E. TRM 1 2 3 4 5 6 7 8 9 10. DIFLINEAL. DIFLINEAL. 100.00 99.10 98.74 98.73 98.71 98.70 98.69 98.69 98.69 98.68. ODF. 0.00 0.02 0.03 0.03 0.04 0.05 0.05 0.05 0.06 0.06. 42. 0.1 0.1 0.2 0.4 0.7 0.9 1.1 1.3 1.4 1.5. 0.00 0.01 0.35 0.36 0.39 0.40 0.40 0.41 0.41 0.41. DIFLINEAL 0.51 0.35 0.32 0.21 0.16 0.13 0.11 0.09 0.08 0.07. 99.49 99.63 99.65 99.76 99.80 99.82 99.84 99.86 99.86 99.87.

(43) Anexo D. Resultados de los Pronósticos por Modelo Modelos Lineales Modelos de Redes neuronales Modelo GARCH Modelo VEC Modelo 1 Modelo 2 2677,13 2681,51 2682,68 2661,65 2675,72 2676,35 2682,68 2664,66 2674,49 2674,28 2685,69 2664,66 2673,51 2672,41 2682,68 2664,66 2672,53 2670,79 2682,68 2658,65 2671,53 2669,21 2679,68 2658,65 2670,51 2667,94 2682,68 2658,65 2669,51 2666,34 2682,68 2661,65 2668,50 2664,89 2679,68 2658,65 2667,50 2663,81 2679,68 2655,64. Valores Reales 2682,09 2671,01 2666,55 2667,06 2663,05 2659,05 2648,8 2642,55 2631,72 2619,59. 2700 2680. 2640. Valores Reales Modelo GARCH Modelo VEC. 2620. Modelo 1 Modelo 2. 2660. 2600 2580 1. 2. 3. 4. 5. 6. 7. 43. 8. 9. 10.

(44) Anexo D. Funciones de VBA Para los Modelos RNA 'Cognos 4Thought 4.x Generated Visual Basic source code for Model 1 of TRM-N '07/26/04 01:33:58 Option Explicit Option Base 1. 'Cognos 4Thought 4.x Generated Visual Basic source code for Model 2 of TRM-N '07/26/04 01:43:47 Option Explicit Option Base 1. Const MAX_X = 15 Const MAX_Y = 0.999999694098 Const MIN_X = -15 Const MIN_Y = 3.05902226926e-7 Function SIGMOID_01(x) If x > MAX_X Then SIGMOID_01 = 1 Elseif x < MIN_X Then SIGMOID_01 = 0 Else SIGMOID_01 = 1/(1 + Exp(-x)) End If End Function. Const MAX_X = 15 Const MAX_Y = 0.999999694098 Const MIN_X = -15 Const MIN_Y = 3.05902226926e-7 Function SIGMOID_01(x) If x > MAX_X Then SIGMOID_01 = 1 Elseif x < MIN_X Then SIGMOID_01 = 0 Else SIGMOID_01 = 1/(1 + Exp(-x)) End If End Function. Function INVERSE_SIGMOID_01(y) If y > MAX_Y Then INVERSE_SIGMOID_01 = MAX_X Elseif y < MIN_Y Then INVERSE_SIGMOID_01 = MIN_X Else INVERSE_SIGMOID_01 = -(Log(1/y - 1)) End If End Function. Function INVERSE_SIGMOID_01(y) If y > MAX_Y Then INVERSE_SIGMOID_01 = MAX_X Elseif y < MIN_Y Then INVERSE_SIGMOID_01 = MIN_X Else INVERSE_SIGMOID_01 = -(Log(1/y - 1)) End If End Function. Sub SIGVEC(ByRef d() As Double, n) Dim ii As Long For ii = 2 To n If d(ii) < -15 Then d(ii) = -1 Elseif d(ii) > 15 Then d(ii) = 1 Else d(ii) = (2/(1 + Exp(-d(ii)))) - 1 End If Next ii End Sub. Sub SIGVEC(ByRef d() As Double, n) Dim ii As Long For ii = 2 To n If d(ii) < -15 Then d(ii) = -1 Elseif d(ii) > 15 Then d(ii) = 1 Else d(ii) = (2/(1 + Exp(-d(ii)))) - 1 End If Next ii End Sub. Sub SUMXVEC(ByRef dTot() As Double, dVec() As Double, lVec As Long, dWgt() As Double, lWgt As Long) Dim ii As Long, jj As Long For ii = 1 To lWgt For jj = 1 To lVec dTot(ii) = dTot(ii) + (dVec(jj) * dWgt(jj, ii)) Next jj Next ii End Sub. Sub SUMXVEC(ByRef dTot() As Double, dVec() As Double, lVec As Long, dWgt() As Double, lWgt As Long) Dim ii As Long, jj As Long For ii = 1 To lWgt For jj = 1 To lVec dTot(ii) = dTot(ii) + (dVec(jj) * dWgt(jj, ii)) Next jj Next ii End Sub. Sub SUMVEC(ByRef dRes As Double, ByRef dTot() As Double, n As Long, dWgt() As Double) Dim ii As Long For ii = 1 To n dTot(ii) = dTot(ii) * dWgt(ii) dRes = dRes + dTot(ii) Next ii End Sub. Sub SUMVEC(ByRef dRes As Double, ByRef dTot() As Double, n As Long, dWgt() As Double) Dim ii As Long For ii = 1 To n dTot(ii) = dTot(ii) * dWgt(ii) dRes = dRes + dTot(ii) Next ii End Sub. Function minof(x, y). Function minof(x, y). 44.

(45) minof = y If x < y Then minof = x End If End Function. minof = y If x < y Then minof = x End If End Function. Function maxof(x, y) maxof = y If x > y Then maxof = x End If End Function. Function maxof(x, y) maxof = y If x > y Then maxof = x End If End Function. '------------------------------------------------------------Function TRM_N_Auto__Transform(dValue As Double) Dim dResult As Double Const dSD = 0.52667670222990992 Const dMean = -0.53629674485605083 dValue = ((dValue * dSD) + dMean) dResult = Exp(dValue) TRM_N_Auto__Transform = dResult End Function. '------------------------------------------------------------Function TRM_N_Auto__Transform(dValue As Double) Dim dResult As Double Const dSD = 0.52251462434125684 Const dMean = -0.531341048671779 dValue = ((dValue * dSD) + dMean) dResult = Exp(dValue) TRM_N_Auto__Transform = dResult End Function. '------------------------------------------------------------Function FECHA_Transform(dValue As Double) Dim dResult As Double Const dSD = 0.0026442217546689102 Const dMean = 10.542774275839843 dValue = Log(dValue) dResult = ((dValue - dMean)/dSD) FECHA_Transform = dResult End Function. '------------------------------------------------------------Function TRMREZAGADA_Transform(dValue As Double) Dim dResult As Double Const dSD = 0.52663513966549358 Const dMean = -0.53866295961199528 dValue = Log(dValue) dResult = ((dValue - dMean)/dSD) TRMREZAGADA_Transform = dResult End Function. '------------------------------------------------------------Sub FECHAVector_Calculator(dValue As Double, pdResult() As Double, lIndex As Long) Dim dResult As Double pdResult(lIndex) = FECHA_Transform(dValue) End Sub. '------------------------------------------------------------Sub TRMREZAGADAVector_Calculator(dValue As Double, pdResult() As Double, lIndex As Long) Dim dResult As Double pdResult(lIndex) = TRMREZAGADA_Transform(dValue) End Sub. '------------------------------------------------------------Function ODF_N_Transform(dValue As Double) Dim dResult As Double Const dSD = 0.1848790398332828 Const dMean = 0.53196484256227872 dResult = ((dValue - dMean)/dSD) ODF_N_Transform = dResult End Function '------------------------------------------------------------Sub ODF_NVector_Calculator(dValue As Double, pdResult() As Double, lIndex As Long) Dim dResult As Double pdResult(lIndex) = ODF_N_Transform(dValue) End Sub '------------------------------------------------------------Function DTF_N_Transform(dValue As Double) Dim dResult As Double Const dSD = 0.2133843830439289 Const dMean = 0.59051076530135782 dResult = ((dValue - dMean)/dSD) DTF_N_Transform = dResult End Function. '------------------------------------------------------------Function Model_1_of_TRM_N_Calculator(TRMREZAGADA As Double) As Double Dim dResult As Double dResult = 0 Dim lIndex As Long lIndex = 0 Dim dVector(1) As Double Dim lIn As Long lIn = 1 Dim lL1 As Long lL1 = 4 Dim lL2 As Long lL2 = 1 Dim dL1Weights(1, 4) As Double dL1Weights(1, 1) = 0.86105723857635952 dL1Weights(1, 2) = 0.49207611305554139 dL1Weights(1, 3) = 0.003184754793738804 dL1Weights(1, 4) = 0.93639022873719868 Dim dL1Totals(4) As Double dL1Totals(1) = -0.027977456769020574 dL1Totals(2) = 1.4110172598756816 dL1Totals(3) = -1.2420444643793658 dL1Totals(4) = -0.31562901959022299. '-------------------------------------------------------------. 45.

(46) Sub DTF_NVector_Calculator(dValue As Double, pdResult() As Double, lIndex As Long) Dim dResult As Double pdResult(lIndex) = DTF_N_Transform(dValue) End Sub '------------------------------------------------------------Function Model_1_of_TRM_N_Calculator(FECHA As Double, ODF_N As Double, DTF_N As Double) As Double Dim dResult As Double dResult = 0 Dim lIndex As Long lIndex = 0 Dim dVector(3) As Double Dim lIn As Long lIn = 3 Dim lL1 As Long lL1 = 4 Dim lL2 As Long lL2 = 1 Dim dL1Weights(3, 4) As Double dL1Weights(1, 1) = 0.023990879796156099 dL1Weights(1, 2) = 0.0026050612299536313 dL1Weights(1, 3) = 0.47894450118684351 dL1Weights(1, 4) = -0.51889229264706649 dL1Weights(2, 1) = -0.2469728059960816 dL1Weights(2, 2) = -0.3628709365613158 dL1Weights(2, 3) = 0.23322496001856224 dL1Weights(2, 4) = 0.40694101108451869 dL1Weights(3, 1) = 0.45119979277504119 dL1Weights(3, 2) = 2.7201390656486937 dL1Weights(3, 3) = 0.020299694024979786 dL1Weights(3, 4) = 0.26093099918700879 Dim dL1Totals(4) As Double dL1Totals(1) = -0.67129630414080677 dL1Totals(2) = -2.9686567753204329 dL1Totals(3) = -0.01187580353472634 dL1Totals(4) = -0.54372978721777432 Dim dL2Weights(4) As Double dL2Weights(1) = 0.80618508536000655 dL2Weights(2) = -2.4417268497644895 dL2Weights(3) = -0.074143830023371549 dL2Weights(4) = 0.17605653750435457 'Initialise the input vector For lIndex = 1 To lIn dVector(lIndex) = 0 Next lIndex 'Calculate and normalise the input vector FECHAVector_Calculator FECHA, dVector(), 3 ODF_NVector_Calculator ODF_N, dVector(), 1 DTF_NVector_Calculator DTF_N, dVector(), 2 '1-Hidden layer network 'Apply Layer 1 weights SUMXVEC dL1Totals, dVector, lIn, dL1Weights, lL1 'Apply transform SIGVEC dL1Totals, lL1 'Apply output weights and sum SUMVEC dResult, dL1Totals, lL1, dL2Weights 'Add output node bias. 46. Dim dL2Weights(4) As Double dL2Weights(1) = 0.9802436648166124 dL2Weights(2) = 0.15210240388025362 dL2Weights(3) = 0.010486010921491956 dL2Weights(4) = 0.30113243285039204 'Initialise the input vector For lIndex = 1 To lIn dVector(lIndex) = 0 Next lIndex 'Calculate and normalise the input vector TRMREZAGADAVector_Calculator TRMREZAGADA, dVector(), 1 '1-Hidden layer network 'Apply Layer 1 weights SUMXVEC dL1Totals, dVector, lIn, dL1Weights, lL1 'Apply transform SIGVEC dL1Totals, lL1 'Apply output weights and sum SUMVEC dResult, dL1Totals, lL1, dL2Weights 'Add output node bias dResult = dResult + -0.01281478591091377 'Un-normalise dResult = TRM_N_Auto__Transform(dResult) Model_1_of_TRM_N_Calculator = dResult End Function.

(47) dResult = dResult + -0.98879233455433746 'Un-normalise dResult = TRM_N_Auto__Transform(dResult) Model_1_of_TRM_N_Calculator = dResult End Function. 47.

(48)