Un modelo de series de tiempo financieras utilizando algoritmos genéticos en la etapa de estimación de parámetros

Texto completo

(1)INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY CAMPUS ESTADO DE MÉXICO. O5 ENE 2001. BIBLIOTECA \\\.t!.TUD!os ,,.'\.. r#. -. J'~. t. CAMPUS ESTADO ~ 1l DE ;: ~~ MEXICO ~. ji. ~--. W/111, lt''\...~. 18 DIC. 2001. UN MODELO DE SERIES DE TIEMPO FINANCIERAS UTILIZANDO ALGORITMOS GENÉTICOS EN LA ETAPA DE ESTIMACIÓN DE PARÁMETROS TESIS QUE PARA OPTAR EL GRADO DE MAESTRO EN CIENCIAS DE LA COMPUTACIÓN PRESENTA. YOLANDA CUEVAS SALGADO Asesor:. Dr. EDGAR VALLEJO CLEMENTE. Comité de Tesis : Dr. RAÚL MONROY BORJA Dr. EDUARDO GARCÍA GARCÍA Jurado:. Dr. Eduardo García García Dr. Raúl Monroy Borja Dr. Edgar Vallejo Clemente. Presidente Secretario Vocal. Atizapán de l.aragoza, Edo. Méx., Noviembre del 2000..

(2) iv. RESUMEN El. volumen de las transacciones financieras ha crecido notablemente en las últimas décadas paralelamente el enorme incremento en el comercio e inversión internacional, que no serían posibles sin la habilidad de comprar y vender divisas extranjeras. Las fluctuaciones en la cotización de precios en las divisas extranjeras causan gran preocupación en el comercio internacional, debido a ello las empresas hacen uso de las transacciones del 1ipo· de cambio a plazo, para eliminar o cubrir el riesgo de pérdidas en la compra o venta denominada en divisas extranjeras. Este riesgo se basa en la variabilidad del tipo de cambio al contado en el futuro. Para poder proyectar la variación del tipo de cambio es necesai:io anali7.ar los fuctores que influyen directamente, tales como la tasa de interés y la tasa de inflación. Desde un punto de vista estadístico, la tasa de interés, la tasa de inflación y el tipo de cambio pueden ser estudiadas como series de tiempo, por lo cual son susceptibles de un análisis a través de la construcción de un modelo de series de tiempo como el modelo ARIMA (Autorregresivo Integrado y de Promedios Móviles). El modelo ARIMA permite analizar series mediante la construcción de un modelo estocástico discreto, el cual es capaz, entre otras cosas, de proyectar valores futuros de una serie de tiempo, en términos de una muestra de observaciones (o realiz.aciones pasadas) del proceso en estudio. El ARIMA ajusta factores de tendencia y estacionalidad, estima valores apropiados a los ~tros, verifica el modelo y repite el ciclo hasta encontrar el resultado esperado. La parte esencial en la construcción del modelo es la etapa de estimación de parámetros, la cual se resuelve mediante técnicas de optimización no lineal..

(3) vi. ~IBLIOTECA. ,·a o\C. 200, CONTENIDO l. INTRODUCCION 1.1. Antecedentes 1.2. Objetivos. 8 8 9. 2. ANÁLISIS DEL PROBLEMA DEL RIESGO DEL TIPO DE CAMBIO DE DMSAS 2.1. El problema del riesgo del tipo de cambio de divisas 2.2. Enfoques del riesgo del tipo de cambio de divisas 2.3. Análisis estadístico del riesgo del tipo de cambio 2.4. Trabajos relacionados con el pronóstico del tipo de cambio de divisas 2.5. El modelo del vector de series de tiempo multivariado 2.5 .1. Representación del vector de series de tiempo 2.5.2. Identificación 2.5.2.1. Matriz de autocorrelación 2.5.2.2. Matriz de autocorrelación parcial 2.5.3. Estimación no lineal 2.5.4. Verificación 2.5.5. Pronóstico 2.6. Algoritmos genéticos 2.6.1. ¿Qué son los Algoritmos Genéticos? 2.6.2.1. Principales elementos de los Algoritmos Genéticos 2.6.2.1.1. Representación de la población 2.6.2.1.2. Evaluación de la función de Aptitud 2.6.2.1.3. Selección 2.6.2.1.3.1. Método de Selección Proporcional a ,la Aptitud 2.6.2.1.3.2. Método de Selección por Torneo 2.6.2.1.3.3. Método Elitista 2.6.2.1.4. Reproducción. 11 11 12 13 14 16 16 20 20 21 22 24 24 25 25 29 29 29 30 30 31 31 31.

(4) vii. 2.6.2.1.4.1. Cruce 2.6.2.1.4.2. Mutación 2.7. AMPL (A Modeling Language for Mathematical Programming) 2.8. Diferencias entre los Algoritmos Genéticos y los métodos clásicos de optimización.. 3. CONSTRUCCIÓN DEL MODELO DE SERIES DE TIEMPO EMPLEANDO ALGORITMOS GENÉTICOS EN LA ETAPA DE ESTIMACIÓN DE PARÁMETROS. 31 32 32 33. 35. 3.1. Etapa de identificación 36 3.2. Etapa de estimación, verificación y pronóstico mediante la aplicación de 42 Algoritmos Genéticos 3.2.1. Partes que componen al algoritmo genético 42. 4. EXPERIMENTACIÓN 4.1. Grupo 1 4.2. Grupo 2 4.3. Grupo 3 4.4. Grupo 4 4.5. Grupo 5 4.6. Grupo 6 4. 7. Pronóstico mediante la aplicación de AMPL en la etapa de estimación 4.8. Análisis comparativo de los resultados obtenidos al utilizar Algoritmos Genéticos y AMPL. 46 47 56 57 57 58 59 60 64. 5. CONCLUSIONES 5.1. Conclusiones 5.2. Contribuciones 5.3 Trabajo futuro. 68 68 70 70. M~~A. n. APENDICE B. 100. REFERENCIAS Y BIBLIOGRAFÍA. 104.

(5) 8. l. INTRODUCCIÓN. 1.1. ANTECEDENTES En el ámbito de una economía globali7.ada, se ha propiciado que cada vez más países participen en el comercio internacional. En consecuencia, las transacciones internacionales tienen que realizarse en más de una divisa; por lo tanto las corporaciones internacionales tienen que planear sus operaciones con el extranjero en divisas sujetas a variaciones en 1a cotización, de ahí que se requiera de un medio que le pennita a la corporación planear sus operaciones internacionales en el futuro. Las fluctuaciones en la cotización de precios en las divisas extranjeras causan gran · preocupación en el comercio intemacionai debido a ello los comerciantes hacen uso de 1as transacciones del tipo de cambio a plazo para eliminar o cubrir el riesgo de pérdida en 1a compra o venta denominada en divisas extranjeras. Este riesgo se basa en la variabilidad del tipo de cambio al contado en el futuro. Por tal motivo, es de gran importancia que los participantes en el mercado de divisas cuenten con algún método para realizar el pronóstico de la cotización de la divisa, así quienes toman decisiones financieras podrían contemplar un horizonte de planeación más veraz para la realización de sus contratos con el extranjero, obteniendo mayores utilidades en las operaciones de la empresa..

(6) 9. 1.2. OBJETIVOS El pronóstico es una de las herramientas más importantes para la planeación y control financieros. Así, el objetivo principal de este trabajo .de tesis, es proporcionar a quienes participen en los mercados financieros internacionales un medio por el cual pueda proyectar la variación del tipo de cambio para obtener las tendencias de la cotización de las divisas y así ayudarle a planear las operaciones internacionales, esto a través de un modelo de series de tiempo, apoyándose en los algoritmos genéticos como herramienta principal para la resolución del problema de optimiz.a.ción en la etapa de estimación de parámetros. Para lograr el objetivo anterior se plantean los siguientes objetivos secundarios: 1. Hac~ un estudio minucioso de los factores que influyen directamente en la variación del tipo de cambio de divisas mediante un análisis estadístico de las series de tiempo de tos factores en cuestión, para determinar si existe correlación entre ellos. 2. Una vez que se haya determinado la naturaleza del problema se requiere de la selección de alguna técnica estadística de series de tiempo que permita modelar el problema. Esta técnica requiere de la selección de los parámetros adecuados para la resolución del problema. 3. La selección de los parámetros requiere el empleo de técnicas no lineales para ello se emplea la técnica de Inteligencia Artificial conocida como Algoritmos Genéticos, para apoyar en la resolución de los problemas no-lineales. 4. Con los resultados obtenidos en el modelo se pretende analizar el grado de error y las tendencias de las series de estudio, para determinar si los parámetros seleccionados inicialmente fueron los más adecuados de no ser así, se volvería al punto 2 para obtener una nueva selección. · 5. Una vez que se han cumplido los objetivos anteriores, se pretende dar una interpretación de los resultados obtenidos por el modelo. Para este caso la aplicación es el pronóstico del tipo de cambio de divisas. 6. Para sustentar los resultados obtenidos se pretende realizar un análisis comparativo entre los algoritmos genéticos y alguna técnica tradicional de programación matemática. Las hipótesis que se siguen en este trabajo de tesis son: 1) el tipo de cambio de divisas está influenciado directamente por la tasa de interés y la tasa de inflación. A través de un · · análisis estadístico de estos tres factores, se espera comprobar que efectivamente éstos de~riben el comportamiento del problema en fonna conjunta. 2)Además, la parte esencial es el problema de optimización generado en la etapa de estimación de parámetros, el cual es un problema de optimización no lineal susceptible de resolverse a través de la aplicación de los algoritmos genéticos, ya que éstos son, a diferencia de los métodos clásicos, técnicas de.

(7) 10. búsqueda que permiten encontrar varias soluciones posibles de un mismo problema, no requieren de una estimación inicial fonnal de la región de solución y debido a la naturaleza estocástica del mecanismo de búsqueda los algoritmos genéticos son capaces de buscar en el espacio de soluciones posibles con más oportunidad de encontrar el óptimo global que los métodos de optimización clásicos, son fáciles de implementar y se han aplicado a una gran cantidad de problemas de optimización. En el aspecto financiero el pronóstico es una de las herramientas más importantes para la planeación y control en la toma de decisiones. Por lo que se espera que el pronóstico obtenido sea lo más cercano a los valores reales. El empleo de los algoritmos genéticos en la resolución del problema de optimización no lineal en el modelo de series de tiempo implica la creación de un modelo híbrido, que combina a la inteligencia artificial y a los métodos estadísticos clásicos lo cual se espera que contribuya como una alternativa de solución para el problema del pronóstico de divisas. Este trabajo de tesis esta organizado de la manera siguiente: En el capítulo 1 "Introducción", se exponen los antecedentes del problema y los alcances del documento. En el capítulo 2 "Análisis del problema del riesgo del tipo de cambio de divisas", se expone un análisis estadístico de la variación del tipo de cambio de divisas, se analizan trabajos relacionados con el tema y se propone una alternativa de solución. En el capítulo 3 "Construcción del modelo de series de tiempo empleando algoritmos genéticos en la etapa de estimación de parámetros", se propone la técnica del modelo ARIMA (Autorregresivo Integrado y de Promedios Móviles) en combinación con los Algoritmos Genéticos. Se reali7.a la etapa de identificación y se proponen las partes del algoritmo genético para la resolución del problema de optimi7.ación no lineal. En el capítulo 4 "Experimentación", se reportan los experimentos correspondientes a la etapa de estimación, verificación y pronóstico, para los algoritmos genéticos y también para AMPL; se hace un análisis comparativo de ambas técnicas y se reportan resultados. En el capítulo 5 "Conclusiones y Trabajo futuro", se comentan los resuhados obtenidos a través de todo el trabajo de tesis, se menciona la contribución del mismo y finalmente se proponen alternativas que contribuyen al trabajo futuro del documento. En el apéndice A se muestran las figuras correspondientes a la· etapa de identificación, verificación y pronóstico de la construcción del modelo. En el apéndice B se muestra el listado del programa para AMPL..

(8) 11. 2. ANÁLISIS DEL PROBLEMA DEL RIESGO DEL TIPO DE CAMBIO DE DIVISAS 2.1. EL PROBLEMA DEL RIESGO DEL TIPO DE CAMBIO DE DMSAS Con el advenimiento de nuevos ~rumentos de inversióJ?. en los mercados financieros internacionales, las operaciones comerciales requieren de diversos tipos de monedas, que pueden ser convertidas unas a otras, a través de los mercad~s de divisas. Las transacciones e inversiones internacionales se realizan en más de una divisa, es decir, el comprador puede pagar en una divisa y el vendedor recibir el pago en otra. Debido a que intervienen diferentes divisas se tiene que establecer una tasa de cambio que represente la relación de conversión entre ellas, a esta tasa se le conoce como tipo de cambio y no es más que una divisa en términos de otra [18]. Existen formas en las que una corporación internacional puede administrar y limitar su riesgo del tipo de cambio, esto es, a través de una protección financiera del mercado a plazo, el cual permite que las empresas internacionales transfieran el riesgo del tipo de cambio a los tomadores de riesgo profesionales. Los contratos a plazo se pueden realizar por cualquier cantidad de dinero, por cualquier plazo de tiempo y entre dos divisas cualesquiera, siempre y cuando las dos partes del contrato estén de acuerdo. En algunas ocasiones se realizan contratos a plazo sin pasar por un intermediario, pero generalmente se realizan a través de un banco [15]. Las empresas internacionales compran o venden divisas como una forma de protegerse contra la variabilidad de la cotización de los tipos de cambio. Por ejemplo, una empresa mexicana compra algún insumo a un productor alemán. El pago por dicho insumo se.

(9) 12. tendría que realizar en marcos alemanes a un plazo de 30 días después de entregada la mercancía, por lo tanto, el productor alemán estaría dando crédito comercial a la empresa mexicana por 30 días. La empresa mexicana por su parte, cree que el peso puede devaluarse con respecto al marco alemán. En este caso, si el marco alemán se revalúa dentro de los 30 días de crédito comercial, entonces se necesitarán más pesos para comprar los marcos alemanes necesarios para cubrir el pago, como consecuencia, las utilidades de la compra del insumo estarían en riesgo. La empresa mexicana tiene la opción de aprovechar el crédito comercial de 30 días y protegerse de la variación del tipo de cambio utilizando para ello un contrato a plazo por 30 días, de esta manera cuando el pago venz.a, independientemente del tipo de cambio al contado a esa fecha (a los 30 días del crédito comercial), la empresa mexicana podrá obtener los marcos alemanes que necesita para cubrir el pago a la cotil.ación del tipo de cambio del día en que se realizó el contrato. As~ la empresa mexicana podrá cubrir sus pagos con una protección contra la variabilidad de la cotización de los tipos de cambio. La empresa mexicana se encuentra en varias situaciones, si la cotización del marco alemán con respecto al peso aumenta a la fecha del vencimiento del pago, la empresa mexicana ahorrará cierta cantidad de pesos al comprar el contrato a plazo. De esta manera, la empresa no solamente reduce el riesgo, sino que a su vez también ahorrará dinero (pesos) sobre el precio al contado. Puede ocurrir que el marco alemán se devalúe con respecto al peso, enton~ para la empresa hubiera sido mejor no comprar el contrato a plazo, esperar a la fecha del vencimiento y entonces efectuar el pago. Esto último es el riesgo de la variabilidad de la cotización de los tipos de cambio al que se ven expuestas las empresas internacionales y todos aquellos quienes participen en el mercado de divisas. Por tal motivo, es de gran importancia que los participantes de este mercado cuenten con algún método para realizar el pronóstico de la cotización de la divisa, así quienes toman decisiones podrían contemplar un horizonte de planeación más veraz para la realización de sus contratos con el extranjero, obteniendo mayores utilidades en las operaciones de la empresa.. 2.2. ENFOQUES DEL RIESGO DEL TIPO DE CAMBIO DE DMSAS Para poder proyectar la variación del tipo de cambio es necesario analizar los factores que influyen directamente, para ello se consideran dos enfoques principales [13]. En el primero, la oferta y la demanda son considerados, en gran parte de la literatura de mercados financieros internacionales, como el factor clave en la cotización del tipo de cambio, en este enfoque se tiene que analizar el comportamiento de los principales participantes en las transacciones internacionales, estas transacciones se miden en la balanza de pagos, además, el predecir los tipos de cambio implica prever el valor de las partidas que se encuentran en ese documento y su saldo. Pero, el análisis es puramente contable..

(10) 13. El segundo enfoque es relacionar las variables que influyen directamente en el tipo de cambio tales como la tasa de interés y la tasa de inflación. En este enfoque es posible obtener una proyección del tipo de cambio haciendo un .análisis estadístico de los valores históricos de las tres variables. En este trabajo de tesis se adopta el segundo enfoque, que relaciona al tipo de cambio de divisas con la tasa de inflación y la tasa de interés, como alternativa para proyectar la variación del tipo de cambio. La tasa de inflación se refleja en la tasa de interés y viceversa, a su vez éstas influyen en el tipo de cambio. Esto afecta directamente en los métodos elegidos por las empresas internacionales para financiar sus inversiones extranjeras. De hecho, una divisa extranjera se devaluará (o se revaluará) en promedio a una tasa porcentual aproximadamente igual al monto en el cual la tasa de inflación exceda a (o sea inferior a) la tasa de inflación del propio país [S]. Debido a que la tasa de interés de cualquier país está detenninada con base en su tasa de inflación y ambas afectan directamente al tipo de cambio, es necesario encontrar la mejor técnica que relacione estas tres variables para ayudar a quienes toman decisiones financieras a resolver el problema del pronóstico del tipo de cambio. El resultado obtenido del pronóstico debe ser confiable, ya que de ello depende lograr una buena planeación :financiera. Quienes toman decisiones financieras, por lo general, realiz.an sus operaciones internacionales en horizontes de planeación mensual, debido a ello es necesario ·que el pronóstico proporcione resuhados de acuerdo a éstas necesidades. Por tal motivo, la técnica que se utilice debe ser capaz de proveer proyecciones mensuales de las variables involucradas.. 2.3. ANÁLISIS ESTADÍSTICO DEL RIESGO DEL TIPO DE CAMBIO Desde un punto de vista estadístico, el comportamiento de cada una de estas tres variables se puede explicar bajo la conceptuaJimción de variable aleatoria. Es decir, los valores mensuales (o realizaciones) que toma cada variable en algunos casos, pueden depender de los valores pasados de la misma variable, de tal forma se tiene un conjunto de realizaciones correlacionadas entre sí de la misma variable aleatoria. Este conjunto constituye un proceso estocástico discreto univariado, es decir, constituye una serie de tiempo. Un modelo estadístico univariado no puede tomarse como un mecanismo para describir la forma en la cual las observaciones son generadas, sino para describir su comportamiento a través del tiempo, tanto pasado como futuro [3]. Existen dos raz.ones para querer modelar una serie de tiempo univariada. La primera es proporcionar una descripción de las series en ténninos de sus componentes de interés. El comportamiento estacional de las series podría.

(11) 14. ser de gran interés y para algunos propósitos puede ser deseable extraer la componente estacional para producir un ajuste de estacionalidad de la serie. Otro motivo para la construcción de un modelo de series de tiempo univariado es la proyección de las observaciones futuras. Como una regla, el empleo del modelo para descripción podría ser usado como la base para el pronóstico. Pero, hay que considerar que el tipo de modelo depende de Ja naturaleza del problema. El análisis estadístico multivariado analiz.a conjuntos de datos, de eventos que forman parte del mismo fenómeno. Estas observaciones son muy comunes en el aspecto financiero, tal es el caso del problema del pronóstico de divisas, en donde las series de la tasa de interés, la tasa de inflación y el tipo de cambio pueden ser modeladas independientemente, como series univariadas. Sin embargo, debido a que están sujetas a influencias similares, es posible modelarlas en forma conjunta. De esta manera es posible considerar a la tasa de interés, la tasa de inflación y el tipo de cambio como series de tiempo, por lo cual son susceptibles de un análisis a través de la construcción de un modelo de series de tiempo como el Autorregresivo y de Promedios Móviles (ARMA). El modelo ARMA permite analizar series mediante la construcción de un modelo estocástico discreto, el cual es capaz, entre otras cosas, de proyectar valores futuros de una serie de tiempo, en términos de una muestra de observaciones (o realiz.aciones pasadas) del proceso en estudio.. 2.4. TRABAJOS }U:LACIONADOS CON EL PRONÓSTICO DEL TIPO DE CAMBIO DE DMSAS Los modelos de series de tiempo han sido introducidos principal.mente para propósitos de predicción, un modelo de series de tiempo clásico es el ARMA, el cual es ficil de implementar. Las series de tiempo financieras han sido muy estudiadas en los últimos aiios y se han propuesto nuevos modelos, tal es el caso del modelo ARCH (Autorregresivo Conditional Heteroskedastic). En el artículo de Bollerslev y Andersen [2] los autores consideran al método ARCH como un modelo específico de series de tiempo no lineal; que emplea un modelo del tipo estocástico volátil, que producen una gran precisión en aplicaciones de pronóstico diario. Consideran que un modelo ARCH bien especificado puede producir una exactitud : sorprendente en el pronóstico volátil. Se han derivado otros métodos a partir del ARCH, tal como el método GARCH o LARCH. A pesar de lo prometedor de este método, el modelo ARCH es considerado como una herramienta de decisión en fase experimental..

(12) 15. Otro modelo que ha surgido en la literatura del pronóstico del tipo de cambio, es el modelo SEMIFAR, el cual provee un esquema de modelación que permite el análisis de datos para separar tendencias determinísticas y estocásticas, así como la memoria de los componentes en las series de tiempo observadas. En el artículo de Beran y Ocker [1] los autores presentan al modelo SE:MIFAR para una aplicación del tipo de cambio extranjero entre Europa y Asia. Ellos consideran que existe una gran cantidad de modelos en la literatura de series de tiempo que tratan con cierto tipo de tendencias, pero que la gran variedad produce confusión en la selección del modelo adecuado. Consideran que una posibilidad para resolver este problema es un esquema unificado el cual permita una modelación flexible de los componentes determinísticos y estocásticos que sea posible, y del manejo de datos para inferir la decisión de cuáles componentes se pueden presentar, a este enfoque lo definieron como modelos SEMIFAR. Se han realizado algunos trabajos que combinan a los métodos clásicos de series de tiempo con los algoritmos genéticos. Uno de los cuales es el de RoU: Sprave y Urfer [14]. En este trabajo presentan a los algoritmos genéticos como una alternativa para la etapa de identificación y estimación de parámetros. En éste, sugieren que el problema principal de la estimación surge del hecho de la calidad de la estimación de parámetros que depende mucho de la exactitud de los errores en las series estimadas. Proponen que en lugar de usar al proceso autorregresivo para obtener residuales, los residuales del mejor ajuste del modelo ARMA sean usados como series para la siguiente generación, así como una estimación preliminar para el primer paso. Esta técnica permite mejorar el ajuste de error de las series estimadas, así como el modelo mismo.· Esto significa que el mismo conjunto de parámetros pueden resultar en diferentes valores de aptitud dependiendo del error de estimación actual F~nte, los autores mencionan, que aunque se obtuvieron buenos resultados, el enfoque propuesto no pudo competir con los métodos tradicionales, los cuales superaron a los algoritmos genéticos. En el trabajo de Shanna.n [16]; se propone la estimación de parámetros mediante la función de máxima verosimilitud y se aplica para un problema simple de señales y proceso de imágenes. La principal contribución es la introducción de los algoritmos genéticos para resolver la ecuación de máxima verosimilitud. A diferencia de los trabajos anteriores en este trabajo de tesis se presenta un modelo de series de tiempo clá$ico ARMA en combinación con una técnica de inteligencia artificial para la resolución del problema d~ optimiz.ación no lineal en la _etapa de estimación de parámetros, para esta etapa se propone la función de mínimos cuadrados no lineal y se aproxima a través de la aplicación de algoritmos genéticos, lo cual proporciona una herramienta híbrida para modelar el problema del pronóstico del tipo de cambio de divisas..

(13) 16. 2.5 EL MODELO DEL VECTOR DE SERIES DE TIEMPO MULTIVARIADO Muchas series de tiempo consisten de observaciones de varias variables, tal es el caso del problema del riesgo del tipo de cambio de divisas. Para este tipo de problema se propone como alternativa de solución la construcción de un modelo del vector de series de tiempo ARMA (Autorregresivo y de Promedios Móviles). 2.5.1. REPRESENTACIÓN DEL VECTOR DE SERIES DE TIEMPO El proceso del vector autorregresivo y de promedios móviles ARMA(p,q) se representa como: • <f> ,(B)Z, = 0 9 (B)a,. (2.5.1.1). donde: 1.. (f), ( B). es llamada 1a matriz de polinomios autorregresivos de orden p (2.5.1.2). 2. 0q (B) es llamada 1a matriz de polinomios de promedios móviles de orden q (2.5.1.3). 3. Donde p y q son los ordenes de 1a matriz de polinomios autorregresivos y de promedios móviles respectivamente. •. 4. Z, es el vector de observaciones Z, =. [z .,,z 1. 2 .,, •••. ,Zm,1 ]• , donde t = 0,±1,±2, ... ,. (2.5.1.4).

(14) 17. 5. a, es el proceso del vector aleatorio m dimensional de ruido blanco. El cual es una secuencia de variables aleatorias no correlacionadas de una distribución fija con media constante, generaJm.ente cero y varianza constante var( a,) = u; . En el análisis c,le series de tiempo, es muy común observar series que muestran comportamiento no estacionario. Una forma de reducir series no estacionarias a estacionarias es por medio de la diferenciación [17]. La extensión para el proceso del vector es: (2.5.1.5) que es equivalente a: (2.5.1.6). 0 ,(B)(l-Bt Z, = E>q(B)a,. Sin embargo esta extensión implica que todos los componentes de las series sean diferenciados el mismo número de veces, entonces, es posible reducir un modelo no estacionario a estacionario aplicando el operador diferencia. (2.5.1.7). D(B)Z,. Donde:. (2.5.1.8). D(B)= (1-Bt·. y (d 1, d2, ••• , dm) es un conjunto de enteros positivos. Esto da lugar a un modelo del vector no estacionario siguiente: · <l> ,(B)D(B)Z, = E>q(B)a,. (2.5.1.9). . Las etapas para la construcción de modelos del vector de series de tiempo .ARIMA son las · siguientes: La técnica de construcción del .ARIMA consiste en cuatro etapas:.

(15) 18. 1. Identificación En esta etapa se modelos ARIMA(p, d, q).. trata. de encontrar un posible modelo dentro de los. 2. Estimación. Una vez identificado el modelo es necesario estimar los valores de los parámetros que intervienen en éste, para ello se utilizan técnicas no lineales. 3. Verificación. Es necesario que se cumplan los supuestos básicos: estacionalidad, matriz de covarianza constante, autocorreJación cero, etc. El modelo debe proporcionar el ajuste adecuado; de lo contrario se debe determinar cuales son las modificaciones apropiadas repitiendo las etapas necesarias para lograrlo. 4. Aplicación Esta etapa se refiere al uso adecuado que deberá de hacer quien construya el modelo, puede ser pronóstico, controi explicación del fenómeno en estudio, etc. Estas etapas se muestran en la figura 2.5.1..

(16) 19. ETAPAS DEL MODELO AR1MA. IDENTIFICACIÓN. ESTIMACIÓN (Algoritmos Genéticos). VERIFICACIÓN. ¿SE SATISFACEN LOS SUPUESTOS?. APLICACIÓN. Figura 2.5.1. Etapas de la construcción del modelos ARIMA.

(17) 20. 2.5.2. IDENTIFICACIÓN En 1a etapa de identificación se trata de encontrar alguna infonnación de cómo fueron generadas las series para sugerir posiblemente que los datos sean una reali7.ación de un proceso ARIMA y en particular una realización de un proceso estacionario. Si los datos muestran características que sugieren que las series no son estacionarias (tendencias, estacionalidad), entonces es necesario hacer una transformación tal que nos produzca nuevas series que sean más compatibles con 1a suposición de estacionalidad [4]. Este análisis puede realizarse por medio del dibujo gráfico de las series mismas o por medio de 1a función de autocorreJación y de 1a función de autocorreJación parcial o por ambas. 2.5.2.1. Matriz de Autocorrelación Para el caso del vector de series de tiempo den observaciones Z1, Z2, calcular la función de la matriz de correJación de la forma siguiente:. ••• ,. y Z.. se puede. (2.5 .2.1.1) A. d'?nde_el pij(k) son las correlaciones muestrales a través de los componentes i-ésimo y jésimo de las series: (2.5.2.1.2). y Z; y. Z1 son la media muestral de las componentes de las series correspondientes. La. media del vector de observaciones esta dado como:. (2.5.2.1.3). La función de la matriz de correlación es muy útil en la identificación de un modelo de promedios móviles de orden finito [17]. 13:..t,o? 'BIBLIOTECA.

(18) 21. 2.5.2.2. Matriz de Autocorrelación Parcial Inicialmente se desconoce cuál es el orden del proceso autorregresivo de una serie de tiempo observada. Una herramienta útil para identificar el orden de un modelo autorregresivo es la función de autocorrelación parcial P(s). A continuación se presenta un método recursivo para calcular la matriz de autocorrelación parcial con retraso s. Paras= 1, Vu(l) = Vv(l) = f(O), VYU(l) = f(l),. a 1•1 = f'(l)[f(O)j. (2.5.2.2.1). 1 ,. Pu = f(l)[f(O) j 1• Para s ~ 2, y k = l, ... ,s-1, s-1. Vu(s) = f(O)- Lªs-uf(k), k=I. s-1. Vv(s) = f(O)- IP,-uf'(k), 1-I. VYU(s) =f(s)-·rr(s-k)7'~-u' k=l 1. (2.5.2.2.2). a = V'vu (s)[Vv(s)j , 1 ,1. P1,s = Vvu(s)(vu(s)t1, P1..t = Ps-u - Ps.,ª,-1.,-.t·. donde D.,(s) es una matriz diagonal donde el i-ésimo elemento es la raíz cuadrada del iésimo elemento de Vv(s) y Du(s) es definida similarmente de V.(s). /\. El estimador de P(s), denotado P(s) es obtenido sustituyendo al estimador de f(j), /\. /\. f(j) , en (2.5.2.2.1). Por otra parte los estimadores f(k) pueden ser calculados como. sigue.

(19) 22 A. f(s). 1 n-1. _. _. =- I(z, -zXzt+, -z), n ,.,,. s = 1, 2, .... (2.5.2.2.3). donde Z es la media muestral vectorial del proceso. Además, los elementos Pv(s) son normalmente distribuídos con media cero y varianza _!_; n. en consecuencra; e1 estadístico. {P, e.>]' es asintóticamente distribuido como una z' con. 1 grado de libertad, lo cual implica que m m. [A. ]2. X(s) = n~; Pv(s). (2.5.2.2.4). es asintóticamente distribuido como una z 2 con m2 grados de libertad. Así X(s) provee un diagnóstico de ayuda para determinar el orden de un modelo autorregresivo.. 2.5.3. ESTIMACIÓN NO LINEAL El proceso de identificación nos permite formular un modelo tentativo, entonces el paso siguiente es obtener la estimación eficiente de los parámetros. La estimación es el proceso de ajustar un modelo matemático para datos experimentales para determinar los parámetros desconocidos en el modelo. Los parámetros son seleccionados tal que la salida del modelo es la mejQr en el sentido de los datos observados. El proceso de estimación es frecuentemente no lineal por que los datos observados no varían en dirección proporcional de los parámetros en cuestión. La etapa de estimación es Ja parte esencial del modelo, debido a ello se espera que Ja técnica que se emplee para obtener la estimación de los parámetros dewelva excelentes resultados. Existen varios procedimientos para estimar los valores de los parámetros, en este trabajo de tes~ se emplea un método de estimación no lineal conocido como mínimos cuadrados, se escogió debido a que es un método simple, está bien definido y siempre se obtienen a los parámetros. La estimación por mínimos cuadrados implica minimiz.ar la suma de los cuadrados de S.(Cl>,0) o S(Cl>,0). Esto es la suma de las cuadrados de los términos de error a,, el cual.

(20) 23. es lineal, sin embargo para un modelo que contiene términos de promedios móviles los a ' t' son no lineales en los parámetros, esto hace que la función sea dificil de resolver. El procedimiento de estimación no lineal por mínimos cuadrados implica una técnica de búsqueda iterativa, y es posiblemente el método estadístico más comúnmente empleado en análisis de datos. El procedimiento no lineal por mínimos cuadrados comienu inicialmente suponiendo valores de los parámetros. Controla éstos valores en dirección de la suma menor de cuadrados y modifica los valores supuestos inicialmente. Continua las iteraciones hasta que algún criterio de convergencia sea rechazado. n. S(<l>,0) =. Lª,ª', ,.... (2.5.3.1). donde. (2.5.3.2). La estimación por mínimos cuadrados se resuelve mediante la aplicación de algún método de optimi:zación que minimice las ecuación (2.5.3.1) la cual requiere de (2.5.3.2). La optimización se emplea cuando no es fácil encontrar una solución directa. Esto ocurre usualmente cuando la estructura del problema es compleja o existe un gran número de soluciones posibles, tal es el caso del problema de optimiz.ación presentado en la estimación de parámetros por el método no lineal de mínimos cuadrados. La optimización es el proceso de encontrar la mejor solución (u óptimo) de un conjunto de soluciones. La optimización se divide en dos clases: global y local. La optimización global encuentra la mejor solución del conjunto de todas las soluciones (el óptimo global). La optimización local encuentra la mejor solución de un conjunto de soluciones que son cercanas a otra (un óptimo local). En la optimización local, la solución encontrada depende de un punto inicial para la optimivtción. La optimización global podría encontrar siempre la misma solución a pesar del punto iniciai pero usualmente requiere de gran poder computacional. Existen muchas técnicas para aproximar la ecuación (2.5.3.1), en este trabajo de tesis se propone como alternativa de solución emplear una técnica de inteligencia artificial (algoritmos genéticos) y compararla contra una técnica de programación matemática (empleando el software AMPL)..

(21) 25. 2.6. ALGORITMOS GENÉTICOS 2.6.1. ¿QUÉ SON LOS ALGORITMOS GENÉTICOS? El algoritmo genético es un método estocástico de búsqueda que imita a la metáfora de la evolución biológica natural. Los algoritmos genéticos operan en una población de soluciones posibles aplicando el principio de supervivencia para producir el mejor y las mejores aproximaciones a una solución. En cada generación, se crea un nuevo conjunto por el proceso de selección de individuos de acuerdo a su nivel de aptitud en el dominio del problema y reproduciéndose al mismo tiempo usando operadores tomados prestados de la genética natural. Este proceso conduce a la evolución de la población de individuos los cuales son los más aptos para su medio ambiente [19]. Los algoritmos genéticos usan un vocabulario tomado de la genética natural. Se pude hablar a cerca de individuos (o genotipos, estructuras) en una población; :frecuentemente a estos individuos se les llama cadenas o cromosomas. Los cromosomas están compuestos de unidades de genes colocados en una sucesión lineal; todo gen controla la herencia de uno o varios caracteres. Cada genotipo (un simple cromosoma) podría representar una solución posible para un problema. Un proceso de evolución se aplica sobre una población de cromosomas correspondientes ~ la_ "búsq~eda a través de un espacio de soluciones posibles. Una búsqueda tal requiere balancear dos objetivos: la explotación de las mejores soluciones y la exploración del espacio de búsqueda. Los algoritmos genéticos son una clase de métodos de búsqueda (independiente_ del dominio) de propósito general los cuales dan un balance entre explotación y exploración de los espacios de búsqueda. La exploración investiga áreas nuevas y desconocidas en el espacio de búsqueda, y la explotación hace uso del conocimiento de puntos (visitados) previamente encontrados para ayudar a encontrar los mejores puntos. El balance es fuertemente afectado por parámetros estratégicos tales como, el tamaiio de la población, máximo de generaciones, probabilidad de cruce y probabilidad de mutación [7]. Una propiedad importante de los métodos de búsqueda basados en genética es que mantienen una población de soluciones posibles (todos los otros métodos procesan un simple punto de un espacio de búsqueda). Si- lo~ algoritmos genéticos se han implementado correctamente, la población evoluciona sobre generaciones sucesivas tal que la aptitud del mejor individuo y del individuo promedio incrementa en cada generación hacia el óptimo global. La convergencia es la progresión hacia un incremento uniforme. Un individuo se dice que converge cuando el.

(22) 26. 95% de la población se distribuye hacia el mismo valor. La población se dice que tiene convergencia cuando todos los individuos han convergido. Un problema clásico de los algoritmos genéticos es que algunos individuos puedan llegar a dominar a la población, causando convergencia en un máximo local. Los algoritmos genéticos no garantizan convergencia en problemas arbitrarios, para evitar la convergencia prematura se utilizan métodos adicionales, por ejemplo el escalamiento de la función de aptitud entre otros, para fortalecer a los algoritmos genéticos. Sin embargo esto no reduce su utilidad. Los algoritmos genéticos son fáciles de implementar si las soluciones factibles pueden ser generadas fácilmente. Trabajan mejor con poblaciones grandes de soluciones, desafortunadamente el espacio necesario para almacenar una solución simple puede ser muy grande, así el algoritmo genético usa una gran cantidad de memoria para mantener la población completa. Generar una población inicial muy grande puede consumir mucho tiempo y no existe un medio para saber cuando llll algoritmo genético ha encontrado la solución óptima. Un algoritmo genético para un problema particular debe tener los siguientes cmco componentes [10]: • Una representación genética para soluciones posibles de un problema. • Un medio para crear una población inicial de soluciones posibles. • Una función de evaluación que juega el papel del ambiente, rango de soluciones en términos de su aptitud. • Operaciones genéticas que aheran la composición de descendientes. • Valores para varios parámetros que usa el algoritmo genético (población, tamaño, probabilidades de aplicación de operadores genéticos, etc.). Los algoritmos genéticos siguen las siguientes etapas: 1. Generar una población de tamaflo "M'' (mediante un proceso aleatorio). 2. Evaluación de la aptitud de cada individuo de la población. 3. Selección de los mejores individuos. Este proceso consiste en seleccionar M cadenas de padres de acuerdo a un criterio estocástico el cual asegura que únicamente la cadena más apta es posible de reproducirse. 4. Reproducción: •. Cruce: La operación de cruce combina pares de cadenas, para producir una tercera, una cadena de descendencia. El cruce es la herramienta principal para crear 1a siguiente.

(23) 27. generación. Cada padre seleccionado es cnmwo aleatoriamente· con un miembro de la población para producir el hijo M de la siguiente generación. • Mutación: El propósito de este operador es introducir un cambio en los genes de la población. La mutación involucra el cambio aleatorio de bits en los genes hijos producidos por el cruce. La mutación es principalmente usada, para suspender una convergencia prematura hacia un mínimo local. 5. ¿Se satisfacen los criterios de terminación?. Los criterios de terminación pueden ser hasta concluir un número G de generaciones o algún otro criterio según el tipo de problema.. 6. Regresar al paso 2. Las etapas de un algoritmo genético se muestran en la figura 2.6.1..

(24) 28. ,. ETAPAS DE UN ALGORITMO GENETICO. Generar \Ula población inicial de tam.ai'lo M. Evaluación de cada cromosoma (aplicar función de aptitud). Crear mejorada genética). Selección de los mejores .....__ _ _ _ _ _ ___ cromosomas. Figura 2.6.1. Etapas de la construcción de un algoritmo genético.. wia. población (reproducción.

(25) 29. 2.6.2. PRINCIPALES ELEMENTOS DE LOS ALGORITMOS GENÉTICOS 2.6.2.1. Representación de la población Los algoritmos genéticos trabajan de forma muy similar a algún otro algoritmo de optimi7.ación, primero, definiendo los parámetros a optimiz.ar, la función objetivo y el costo, y finaliz.a al igual que cualquier otro algoritmo de optimi7.ación por alguna prueba de convergencia (9]. Una función objetivo genera una salida .de un conjunto de parámetros de entrada (un cromosoma). El algoritmo genético comienz.a por definir un cromosoma o un arreglo de valores de variables a ser optimiz.ados. Si el cromosoma tiene N Yllr variables (un problema de optimi7.ación Nv,. dimensional) dado por v1,v2,... ,vN.... , entonces el cromosoma se escribirá como un arreglo de N vs elementos. cromosoma= [v1, v2 , ••• , vN_]. (2.6.2.1.1). El algoritmo genético comienz.a con una comunidad grande de. cromosomas conocidos como la población inicial. Esta población tiene N vs cromosomas y es una IIµltriz de N v• • N ba.,., creada con ceros y unos generados aleatoriamente. Cada renglón de la matriz es un cromosoma.. 2.6.2.2. Evaluación de la función de Aptitud La función objetivo es usada para proporcionar una medida de cómo los individuos se han desempeñado en el dominio del problema. La función de aptitud, es normalmente usada para transformar el valor de la función objetivo en una medida de aptitud relativa[19]. F(x) = g(f(x)). (2.6.2.2.1). donde f es la función objetivo, g transforma el valor de la función objetivo a un número no-negativo y F es el resultado de 1a aptitud relativa. Se asume que los problemas son únicamente de maximización, pero, si el problema es mini.miz.ar una función f, esto es equivalente a maximizar una función g, donde g = - f [1O], por ejemplo min. f (x) = max g(x) = max {- /(x)}. (2.6.2.2.2). Además, se asume que 1a función objetivo f toma valores positivos, en otro caso se puede agregar una constante e, por ejemplo.

(26) 30. max g(x) = max {g(x)+c}. (2.6.2.2.3). Existen algunas medidas adicionales que podrían ser de mucha ayuda en el ajuste de problemas relacionados con las características de la función a optimfaar. Un medio se refiere a tratar de fijar la función por sí misma por la introducción de un mecanismo de escalamiento.. Método Truncamiento Sigma Este método fue diseñado para tratar valores de evaluación negativa e incorporar información que depende del problema en el mapeo mismo. Se emplea para evitar la convergencia prematura. La nueva función de aptitud se calcula de acuerdo a /'; = ¡; +(7-c*u). donde e es seleccionado como un entero pequeño (usualmente un número del rango 1 a 5) y u es la desviación estándar; posibles soluciones negativas de f1 son conjuntos de ceros. (10].. 2.6.2.3. Selección La selección es el procéso de determinar el número de veces o pruebas, que un individuo en particular es seleccionado para reproducción y, así, el número de descendientes que un individuo puede producir [19]. La selección dirige la búsqueda genética hacia una región prometedora en el espacio de búsqueda.. 2.6.2.3.1. Método de Selección Proporcional a la Aptitud Un método de selección muy conocido es el llamado selección proporcional a la aptitud (o selección por giro de la ruleta). La idea básica es determinar la probabilidad de selección o probabilidad de supervivencia de cada cromosoma proporcional al valor de aptitud. Entonces un modelo proporcional a la aptitud puede mostrar éstas probabilidades. El proceso de selección se basa en dar el giro el número de veces igual al tamaflo de la · poblac~ón, cada vez se selecciona un cromosoma simple de la nueva población (7). La.selección proporcional a la aptitud es un método de muestreo estocástico..

(27) 31. 2.6.2.3.2. Método de Selección por Torneo Este método selecciona aleatoriamente un conjunto de cromosomas y escoge el mejor para reproducción. Selecciona algún número k de individuos y selecciona el mejor de este conjunto de k elementos en la siguiente generación. El proceso es repetido un número igual al tamaño de la población. Es claro, que el valor más grande de k incrementa la selectividad del procedimiento; un valor generalmente aceptado por muchas aplicaciones es k = 2 (llamado tamafl.o del torneo) [10]. 2.6.2.3.3. Método Elitista El método elitista se emplea para preservar el mejor cromosoma para la siguiente generación [7]. Es una adición a muchos métodos de selección para fortalecer al algoritmo genético, para retener algún número de los mejores individuos. en cada generación. Estos individuos pueden perderse si no son seleccionados para reproducirse o si ellos son destruidos por los operadores de cruce y mutación [11]. 2.6.2.4. Reproducción 2.6.2.4.1. Cruce El operador básico para reproducir nuevos cromosomas en los algoritmos genéticos es el cruce. El algoritmo genético. utiliza el cruce basado en un punto, en el cual los dos individuos seleccionados para jugar el papel de padres, son recombinados por medio de la selección de un punto de corte, para posteriormente intercambiar las secciones que se encuentran a la derecha de dicho punto. Es decir, se selecciona una posición entera o punto de cruce k único aleatoriamente entre 1 y la longitud del cromosoma menos uno, [1,l -1 ]. Se crean dos nuevas cadenas por el intercambio de todos los caracteres entre las posiciones k+l y 1 [8]. Por ejemplo, sea A1 y A2 dos cromosomas Á1. = 01101101. Á2. = 11001010. (2.6.2.4.1.1). Se escoge aleatoriamente un número entre 1 y 6, se obtiene un k = 4. El resultado del cruce lleva a dos nuevas cadenas A'i y A' 2.

(28) 32. A\= 0110010. A' 2 = 1100101. (2.6.2.4.1.2). 2.6.2.4.2. Mutación La mutación se considera un operador secundario, que proporciona un pequeño elemento de aleatoriedad en la vecindad de los individuos de la población. En algoritmos genéticos la mutación modifica los elementos aleatoriamente con una · probabilidad baja, generalmente en el rango de 0.001 y 0.01 y se aplica en el cromosoma. La mutación frecuentemente proporciona una garantía de que la probabilidad de búsqueda de alguna cadena dada puede nunca ser cero y actúa como un seguro para cubrir pérdidas a través de la acción de selección y cruce [19]. La mutación es generalmente aplicada a la población completa de cromosomas, y es posible que un cromosoma dado pueda ser mutado en más de un punto. Sea loncrom la longitud del cromosoma y tampob el tamaño de la población y Pm = 0.01 la probabilidad de mutación. Entonces, existen /oncrom • tampob = Nutnbits en el total de la población, significa que el 1% del total de bits de la población serán mutados, por cada generación. Cada bit tiene igual oportunidad de ser mutado, así de cada bit en la población, se genera un número aleatorio r del rango [0..1], si r < 0:01, entonces se muta el bit, es decir si en esa posición se tiene un Ose cambia por 1 y vi~versa.. 2~7. AMPL (A MODELING LANGUAGE FOR PROBLEMS OF MATIIEMATICAL PROGRAMMING) La programación matemática es una técnica usada para describir la maximización o minimización de una función objetivo de muchas variables, sujeta a restricciones en las variables. AMPL(A Modeling Language for Problems of Mathematical Programming) es un lenguaje para especificar problemas de producción, distribución, calendarización y muchos otros tipos conocidos generalmente como problemas de optimi:zación de gran escala o programación matemática. AMPL está diseftado para proporcionar un gran soporte para validación, verificación y reporte de soluciones óptimas..

(29) 33. Tiene .la flexibilidad de habilitar varios resolvedores· para que le permita al usuario intercambiar resolvedores y permitir seleccionar la opción que podría mejorar la solución dependiendo del tipo de problema. Para el tipo de problemas de optimización no lineal existen vanos resolvedores especializados para este caso. MINOS es un paquete de software de optimización para programación lineal y no lineal. Para programas matemáticos que son no lineales en la función objetivo pero lineales en las restricciones, MINOS emplea un enfoque de gradiente descendiente, el cual puede ser visto como una generalización del algoritmo simplex. Para tratar con restricciones no lineales, MINOS además generaliza este algoritmo. En cada iteración se construye una aproximación lineal hacia la restricción no lineal muy cerca de la solución actuai· y la función objetivo es modificada para agregar dos términos. El resultado se resuelve por el algoritmo de gradiente descendiente [6]. AMPL envía a MINOS la información necesaria para calcular los valores y derivaciones de todos los términos no lineales en la función objetivo y en las restricciones. MINOS almacena por separado las partes lineales y no lineales de un programa matemático. La representación de la parte lineal es esencialmente la misma como para un programa lineal, mientras que la representación de la parte no lineal requiere una cantidad de memoria RAM dependiendo de la complejidad de los términos no lineales [20). Los métodos clásicos de optimización no line~ los cuales son métodos comúnmente implementados en resolvedores (por ejemplo AMPL), están diseftados para buscar un óptimo local. ComieD7.3.Il con un punto iniciai estos métodos no garantizan encontrar una solución que es un óptimo global, en el sentido del mejor valor entre todas 1as soluciones que satisfacen las restricciones. En general encontrar un óptimo global es mucho más dificil que encontrar un óptimo local. Afortunadamente, existen muchos casos en los cuales un óptimo local es completamente satisfactorio. Cuando la función objetivo y restricciones satisfacen ciertas propiedades, un óptimo local es considerado global.. ,. 2.8. DIFERENCIAS ENTRE LOS ALGORITMOS GENETICOS Y LOS MÉTODOS CLÁSICOS DE OPTIMIZACIÓN Los algoritmos genéticos encuentran la solución a problemas por el empleo de evolución de una solución aceptable a una mejor. Los algoritmos genéticos se enfocan en optimización local; sin embargo la evolución es controlada de forma tal que se busca el espacio de soluciones posibles. Los algoritmos genéticos pueden tomar un gran número de iteraciones.

(30) 34. para encontrar una solución posible, pero la simplicidad del proceso soporta razonamiento de rápida ejecución. Son muy útiles en problemas que son dificiles de tratar cómo el problema no lineal expuesto en (2.5.3.1) y (2.5.3.2). Los algoritmos genéticos son fáciles de implementar si las soluciones factibles pueden ser generadas fácilmente. Trabajan mejor con poblaciones grandes de soluciones, desafortunadamente el espacio necesario para almacenar una solución simple puede ser muy grande, así el algoritmo genético usa una gran cantidad de memoria para mantener la población completa. Generar una población inicial muy grande puede tener un costo computacional muy alto y no existe un medio para saber cuando un algoritmo genético ha encontrado la solución óptima. A diferencia de los algoritmos genéticos, los métodos clásicos de optiroi~ción no lineal están diseñados para buscar un óptimo local. Comienzan con un punto inicial, estos métodos no garantizan encontrar una solución que es un óptimo global, en el sentido del mejor valor entre todas las soluciones que satisfacen las restricciones. En general encontrar un óptimo global es mucho más dificil que encontrar un óptimo local.

(31) 35. 3. CONSTRUCCIÓN DEL MODELO DE SERIES DE TIEMPO EMPLEANDO ALGORITMOS GENÉTICOS EN LA ETAPA DE ESTIMACIÓN DE PARÁMETROS El análisis de series de tiempo involucra observaciones de varias variables, tal es el caso del problema que se .está analizando; en este capítulo se expone el desarrollo de Ja ' construcción del modelo de -series de tiempo multivariado ARIMA para el problema del pronóstico del tipo de cambio de divisas. Se sigue la técnica de construcción del modelo ARIMA en las secciones de identificación, estimación, verificación y pronóstico, apli~ a la divisa Dólar Estadounidense. Como se mencionó en el capítulo anterior, la etapa más significativa en Ja construcción de modelos de series de tiempo es. la etapa de estimación de parámetros, la cual se aproxima mediante la aplicación de algoritmos genéticos; los resultados obtenidos con esta técnica son comparados con los resultados generados de la aplicación de un paquete de software de programación matemática (AMPL) que también se empleó para resolver el mismo problema. Los experimentos se realizaron con las series siguientes: para el tipo de cambio de divisas se utilizó la serie del dólar en su cotización a la venta, para la serie de la inflación se utilizó la serie del INPC (Indice Nacional de Precios al Consumidor) y para la serie de la tasa de interés se utilizó la serie de los CETES (Certificados de la Tesorería) a un pJazo de 28 días, los tres tipos de series se tomaron para el periodo que comprende de Enero de 1995 a Agosto del 2000. Es importante seftalar que por ramnes de presentación, algunas de las figuras de gráficas y listado del programa de AMPL se encuentran en los apéndices..

(32) 36. 3.1. ETAPA DE IDENTIFICACIÓN La etapa de identificación nos ayuda a encontrar un posible modelo dentro de 1a familia general de modelos ARIMA(p,d,q). Para ello es necesario analizar 1as series en estudio. Debido a que los tres tipos de series son diferentes, se refieren a conceptos distintos, es necesario aplicar alguna transformación que permita procesarlos en forma conjunta. Sea Z el vector de observaciones definido en (2.5.1.4), entonces para cada serie se tiene. z. - (z1;.r+11 -Z1;.11) [i,t) -. z. (3.1.1). [i,t). para i. =1,2,3. y para t. =0,1, .. .,n.. Donde los subíndices 1, 2, 3 se refieren a las series Dólar, INPC y CETES, respectivamente. De esta forma se tiene la transformación de las observaciones a tasas para cada una de las tres series. Ahora bien, una vez transformadas las series en estudio es necesario hacer un análisis subjetivo-de 1as gráficas de las series. Al observar 1a gráfica de 1a serie del DÓLAR no se encuentran patrones anormales, 1a serie es estacionaria, figura 3.1.1.. OBSERVACIONES Dá.AR_E VENTA. Tiempo. Figura 3.1.1. Observaciones de la serie Dólar Estadounidense en su cotización a 1a venta..

(33) 39. El siguiente paso es calcular y examinar la FAC (función de autocorrelación) y la FACP (función de autocorrelación parcial) de 1as series originales propiamente diferenciadas, para identificar los ordenes adecuados de p y q para el proceso autorregresivo AR(p) y para el proceso de promedios móviles MA(q). Al calcular cada uno de los componentes de las FAC y FACP, se obtienen dos matrices del tipo siguiente:. DÓLAR E,DOLAR E INPC,DÓLAR E CETES,DÓLAR E. DÓLAR E,INPC INPC,INPC CETES,INPC. DÓLAR E,CETES INPC,CETES CETES,CETES. Se analizaron todos los valores de ambas matrices, iniciando con los elementos de la diagonal principal, con el propósito de identificar cada uno de los procesos univariados que forman parte del proceso muhivariado. La FAC se obtiene de la ecuación (2.S.2.1.2). La FACP se obtiene de las ecuaciones (2.S.2.2.1) y (2.S.2.2.2). Cada gráfica de ambas funciones muestran 20 retrasos. Donde un retraso es el número de periodos de tiempo entre dos periodos de tiempo en la serie. Por ejemplo, el retraso entre el periodo t y t - k es k. Se compara cada índice de. la matriz de la FAC contra cada índice correspondiente de la matriz de la FACP. Según el comportamiento de los retrasos especificado en la tabla 3.1.1.. PROCESO AR(p). MA(q). ARMA(p,q). FAC Las líneas muestran un decaimiento exponencial o comportamiento en forma de onda senoidal. Las lineas muestran un corte después de q retrasos.. FACP Las lineas muestran un corte después de p retrasos.. Las líneas muestran un decaimiento exponencial o comportamiento en forma de una onda senoidal patrones patrones Muestran Muestran irregulares después de (q-p) irregulares después de (p-q) retrasos. retrasos.. Tabla 3.1.1. Características teóricas de la FAC (Función de Autocorrelación) y FACP (Función de Autocorrelación Parcial)..

(34) 40. Por ejemplo, El primer análisis se realiza para el índice (DÓLAR,DÓLAR), entonces, se comparan la gráfica de la FAC contra la gráfica de la FACP, que se muestran en la figura 3.1.7.. DóLM_E VENTA FAC(DOI.M,DOLAR) ldelllllcacl6n 1. 0.1 .. o.e. 1. 0.1. o.e. CI' 0.4. CI' 0.4. 1.(l:. e;. 0.2. J.(l:. -0.1 -0.1. 41. -1. -1. e;. 0.2. t- 44. -0.4 -0.1. Figura 3.1.7. La gráfica izquierda representa a la FAC (Función de Autocorrelación) y la gráfica derecha representa a la FACP (Función de Autocorrelación Parcial) para el índice (DÓLAR_E,DÓLAR_E). ·. En la figura 3.1.7 se puede observar que la gráfica de la FA<;, muestra cortes en los retruos 2,4,5,7,8, mientras que para la FACP los retrasos muestran un decaimiento exponencial, lo cual sugieré un posible modelo MA de orden 2, 4, S, 1, 8, pero hay que recordar que el indice (DÓLAR_E,DÓLAR_E) representa un proceso univariado, y se tienen que analizar a todos los índices para poder sugerir un modelo para el proceso multivariado [17]. El mismo análisis se repite para el resto de los índices, estas gráficas se encuentran en el apéndice A en las figuras A.1.1. a la A.1.8. Al analizar cuidadosamente la gráfica de la función de la matriz de autocorreJación y de la función de autocorreJación parcial de todos los índices, se observó que los cortes en los retrasos, sugieren un orden de 3 o 4 para el modelo autorregresivo y postblemente un orden de 2 o 4 para el modelo de promedios móviles.. Para apoyar el análisis al identificar los valores de p y q adicionalmente, se calculó el estadístico X(s) dado en (2.5.2.2.4), para la función de autocotrelación con un nivel de significancia de a =O.OS, es decir 95% de confiabilidad o 5% de riesgo. Para saber los grados de libertad se consideran el número de correlaciones menos el número de parámetros en el modelo, es decir 20 - 3 = 17 grados de h'bertad, los resultados se muestran en la tabJa 3.1.2:.

(35) 41. Función de Autocorrelación Estadistica X(s) con 17 grados de libertad X(1) =38.244131 X(11) =7.349057 X(2) =12.430471 X(12) =18.798349 X(3) =5. 7964 73 X(13) =18.154054 X(4) =12.124999 X(14) =8.887243 X(5) =6.401125 X(15) =7.671284 X(6) =10.068347 X(16) =7.071338 X(7) =2.785105 X(17) =4.106629 X(8) =10.932362 X(18) =8.774721 X(9) =9.213350 X(19) =6.358052 X(10) =9.665171 X(20) =2.930345. Tabla 3.1.2. Estadístico X(s) con 17 grados de libertad, para la función de autocorrelación El ·valor en la tabla de una distribución z2 para una significancia del 95o/o y 17 grados de libertad es de 27.587 por lo tanto, los valores que son susceptibles de incluirse en el modelo son aquellos que sean mayores o iguales al valor en la tabla, de esta manera podrían incluirse el valor X(l). Así mismo, se calculó el estadístico X(s) para la función de autocorrelación parcial con una confiabilidad del 95o/o y con 17 grados de libertad; los resultados se muestran en la tabla 3.1.3: Función de Autocorrelación Parcial Estadistica X(s) con 17 grados de libertad X(1) =38.244131 X(11) =19.006220 X(2) =29.870934 X(12) =12.145736 X(13) =7.299249 X(3) =21.226146 X(14) =10.722743 X(4) =7.514107 X(5) =12.191076 X(15) =20.415392 X(16) =13.810571 X(6) =13.548324 X(17) =6.840343 X(7) =11.087379 X(18) =10.886103 X(8) =7.740025 X(19) =12.943760 X(9) =9.745834 X(20) =29.927455 X{10) =10.157140. Tabla 3.1.3. Estadístico X(s) con 17 grados de libertad, para la función de autocorrelación parcial..

(36) 42. Los valores que podrían incluirse en el modelo son X(l), X(2) y X(20). Finalmente se identificaron los órdenes p y q de la ecuación (2.5.1.9) por el análisis de la FAC muestra! y de la FACP muestra~ además de considerar a los valores obtenidos en el estadístico X(s). El análisis final indica que los valores p y q obtenidos para el modelo son p=3 y q=O. Y con esto se tiene un modelo tentativo del tipo ARIMA(3, 1,0).. 3.2. ETAPA DE ESTIMACIÓN, VERIFICACIÓN Y PRONÓSTICO MEDIANTE LA APLICACIÓN DE ALGORITMOS GENÉTICOS Después de identificar un modelo tentativo, el siguiente paso es estimar los parámetros en el modelo ARIMA(3,l,0). Para esto, se trata de optimizar a la función no lineal de mínimos cuadrados expuesta en el capítulo anterior, empleando a los algoritmos genéticos.. 3.2.1. PARTES QUE COMPONEN AL ALGORITMO GENÉTICO De la etapa de identificación se supuso un modelo tentativo con los valores de p=3, y q=O, entonces de (2.5.3.1) y de (2.5.3.2) se tiene que (3.2.1.1) (3.2.1.2) Como se mencionó anteriormente, cada índice l, 2 y 3 representa a la serie Dólar; INPC y CETES respectivamente y t representa a las observaciones mensuales que son un total de 68 por serie. Para poder optimizar la función no lineal de mínimos cuadrados por la aplicación de algoritmos genéticos es necesario identificar una función objetivo y las variables a optimizar. La ecuación no lineal a optimizar (2.5.3.1) y (2.5.3.2) representa a la función objetivo, para este caso se desea minimizar la función. Y las variables a optimizar están contenidas en las matrices de los parámetros <I> P y 0 q •.

(37) 43. Debido a que los algoritmos genéticos trabajan de · tal fonna que sólo maxnruzan problemas de optimi:iación, entonces la transfonnación de un problema de minimiz.ación a un problema de maximimción es aplicando min /(x) = max g(x) = max {- /(x)}. y max g(x) = max {g(x)+c}. As~ se obtiene una función de aptitud. Donde la constante e se actualiza con el máximo. valor de la función de aptitud en cada generación. Las variables .a optimizar están contenidas en las matrices CI> P y 0, ; de la etapa de identificación se supuso que los ordenes de p para el modelo AR(p) y q para el modelo MA(q) son p=3 y q=O, por lo tanto, las variables se encuentran contenidas únicamente en el parámetro CI> P de la forma siguiente:. <1)1. V2. = V4. v,]. Vs. v6. . V7. Va. V9. r. [VIO VII. Cl>2. Cl>3. v.,]. = V13. V14. VIS. V16. V17. V1s. V20. =[V" V22. v,.]. V23. V24. V2s. V26. V27. (3.2.1.3). donde v1 , v2 , ••• , son cada una de las variables a optimiz.ar. Una vez que se han planteado la función de aptitud y las variables a optimiz.ar, el siguiente paso es aplicar el proceso del algoritmo genético. Se elaboró un programa que implementa al algoritmo genético dentro del proceso de series de tiempo. Inicialmente se elaboró un algoritmo genético básico que contiene los módulos siguientes:.

(38) 44. Inicialmente se genera una población de tamado M donde cada individuo de 1a población · representa a un cromosoma. Este cromosoma se compone de todas 1as variables a optimizar. De (3.2.1.3) se tiene que 1a matriz el>, esta compuesta de 27 variables que son v1, v2••.• v27 • Cada variable requiere de una precisión de. 6 posiciones en un intervalo de [a; .. b;]. Para cada variable. (b; - a;}· 106 = al tamaño del intervalo. Suponiendo que m; es ~l entero más pequeño tal que (b, - a 1) • 106 = 2,,,, - l. Entonces se tiene que cada variable v1 es codificada como una cadena binaria de longitud m1 • Entonces cada cromosoma está representado por una cadena binaria de longitud le. m=¿m;. i=I. Para iniciar la población se generan aleatoriamente ceros y unos que conforman a cada cromosoma, donde un cierto número· de cromosomas forman la población completa. Ahora se presentan los pasos para cada generación. l. Evaluación de 1a función de aptitud En cada generación se evalúa a cada cromosoma usando la fut;tción de aptitud (2.5.3.1) y (2.5.3.2) mediante 1a decodificación de cada una de 1as variables~ Cada variable se decodifica mediante la siguiente ecuación [1 O]: b.. V;. -a,. =a;+ decimal(1001...001 2 ) • ',,,, _ 1 2. (3.2.1.4). 2. Selección Para el proceso de selección, que es seleccionar una nueva población con respecto a la distribución de probabilidad basada en el valor de 1a aptitud, se implementó el método de selección proporcional a la aptitud (o método de la ruleta). Además de un método de escalamiento lineal, truncamiento sigma. Inicialmente se calcula el valor de 1a función de aptitud mediante la evaluación de la misma eva/uar(crom1 ) (donde i = 1,2, ... ,tampob), para cada uno de los cromosomas. Posterionnente, se obtiene la suma de todos los valores de la función de aptitud de la población mediante: F=. L:; evaluar(¡;).

(39) 45. Se calcula la probabilidad de selección p, para cada cromosoma crom; (donde i = 1,2, ... ,tampob ),:. evaluar(crom,). P; =. F. Luego, se calcula una probabilidad acumulada q; para cada cromosoma crom; (donde i = 1,2, .. . ,tampob ),:. Cada vez que se gira la· ruleta se selecciona un cromosoma para la nueva población mediante la generación de un número aleatorio real r en el intervalo de (0..1]. Si r < q1 entonces se selecciona el primer cromosoma (crom1) ; si no, se selecciona el i-ésimo · cromosoma crom; (2 ~ i S tampob) tal que qH < r < q,.. 3. · Reproducción En la reproducción genética se alteran los cromosomas en la nueva población mediante la aplicación de los operadores de cruce y mutación. En la operación de cruce se generaron un número r de números reales en el intervalo de (0..1]. Sir< Pe (probabilidad de cruce) ese cromosoma es seleccionado para cruce. Si el número de cromosomas para cruce es impar, entonces se elimina aleatoriamente alguno de los cromosomas seleccionados, esto es para mantener siempre un número par; Para cada pareja de cromosomas generadas aleatoriamente se genera un número aleatorio entero pos en el intervalo de [l../on-1) (Ion es el número de bits del cromosoma), pos indica la posición del cruce. De la posición pos a la derecha se intercambia el resto del cromosoma} por el resto del cromosoma]. De esta forma se obtiene el cruce. Después del cruce el siguiente operador que se emplea, es el operador de mutación. Para cada cromosoma de la población actual y para cada bit dentro del cromosoma se genera un número real r aleatoriamente en el intervalo (0..1] y se compara si r < p,,, (probabilidad de mutación) entonces cambiar el bit, si es Opor 1 y si es 1 por O. La nueva población esta lista para la siguiente generación, y el resto de la evolución es un ciclo de repetición hasta completar un número de generaciones..

(40) . 46. 4. EXPERIMENTACIÓN En esta sección se describen cada uno de los expetimentos que se reali7.aron aplicando como base al algoritmo genético descrito en la sección anterior. Se reali7.aron seis grupos de experimentos, cada uno con cuatro experimentos diferentes, a los que se les llama Prueba l, Prueba 2, Prueba 3 y Prueba 4. Una vez que se ha concluido la primera prueba, ésta se anali7.a en la etapa de verificación del proceso de series de tiempo ARIMA. Sí los supuestos se satisfacen, entonces se procede con la etapa de la aplicación que para este problema es el pronóstico del tipo de cambio de divisas. Este proceso se repite para cada una de las pruebas de cada uno de los grupos de experimentación. Para los Grupos de experimentación 1,2, 3, 4 y 5 se mantuvo como constante el rango de las variables a optimizar en [-1..1]. Para el Grupo 6 se consideró un rango de (-2..2]. Para los Grupos 1, 2, 3 y 6 se mantuvo como constante a la precisión de 6 posiciones. Para los Grupos 4 y 5 se consideró una precisión de 4 posiciones. Cabe seftalar que la elección del rango de las variables a optimizar, así como el valor de la precisión, la probabilidad de cruce y la probabilidad de mutación, se deben al resultado de una serie de experimentos preliminares, en los cuales se variaron los valores de estos parámetros con el fin de encontrar aquellos que mejor se adecuaran al problema a optimizar. Los resultados obtenidos de estos experimentos preliminares no sirvieron para ajustar al modelo adecuadamente, motivo por el cual no son presentados; sin embargo nos ayudan a dar una idea aproximada de los valores de estos parámetros. Los valores de los parámetros fueron los siguientes: · · Rango de las variables Precisión Probabilidad de cruce Probabilidad de mutación. (-2..2] y 6 posiciones (O. 7] y (0.01] y. (-1..1] y 4 posiciones (0.6] [0.001].