CAPITULO 2
MARCO TEORICO
2.1 REDES RECURRENTES
Las redes recurrentes son estructuras que tienen una gran importancia en el área de RNA. Las más populares son los modelos de Hopfield, en donde se presenta como concepto principal, que las redes neuronales son sistemas dinámicos con energía. Este tipo de redes recurrentes tienen las siguientes características:
a) Unidades computacionales no-lineales. b) Conexiones sinápticas simétricas. c) Abundante uso de Retro-Alimentación.
Existen diferentes topologías de redes recurrentes, de las cuales podemos tener: Redes que cuentan con un solo nivel, redes que tienen por lo menos un nivel escondido o más y redes que presentan en su estructura conexiones completamente conectadas [7]. En aquellas redes en las que existe un solo nivel con un conjunto determinado de nodos, la recurrencia se presenta en este mismo conjunto de nodos. En este caso la salida de datos para cada nodo representa la retro-alimentación para este mismo nivel, convirtiéndose las salidas en entradas. En este tipo de redes no se presenta retro-alimentación para el mismo nodo, sino hacia los demás nodos. La figura 2.1, muestra un ejemplo de esta arquitectura de red [12].
Figura 2.1 Red recurrente de un solo nivel [12].
Para una red recurrente como la que podemos observar en la figura 2.2, es un ejemplo de una red que tiene por lo menos un nivel escondido. La recurrencia se origina en el nivel de salida, donde los resultados de las salidas de este nivel representan las entradas para el nivel escondido; esto quiere decir que las salidas de datos del último nivel son retro-alimentados al nivel escondido, en las que se presentan nuevas entradas para este nivel. [12]
Figura 2.2 Red recurrente con un nivel escondido [12].
En el caso de que la red cuente con varios niveles escondidos, la recurrencia puede presentarse en cualquier nivel. Al existir recurrencia en un determinado nivel, la salida de datos obtenidas son retro-alimentadas a un nivel más abajo; en donde estas salidas ahora sirven de entradas al nivel.
Existe también otro tipo de redes con una estructura más compleja, en la que cada una de los nodos que forman parte de la red, se encuentran totalmente conectados todos contra todos, existiendo también una conexión entre sí mismo para cada nodo. Estas redes son también llamadas redes recurrentes completamente conectadas.
Figura 2.3 Red recurrente completamente conectada [12].
Este tipo de redes recurrentes son también conocidos con otros nombres como: “Redes Recurrentes de Feedback”, “Simple Redes Neuronales” y “Redes Recurrentes Parciales”. Para distintas arquitecturas de redes neuronales se pueden emplean diferentes tipos de “feedback”. La unidad de activación de los niveles escondidos son alimentados hacia atrás, en niveles más abajo en la red. Para la red completamente recurrente, toda la información es alimentada hacia atrás vía “feedback” en un solo nivel [12][17][22].
El algoritmo de Retro-Propagación (Back-Propagation) es uno de los modelos más conocidos y utilizados para el entrenamiento de redes de perceptrones de varios niveles. Este algoritmo emplea un aprendizaje supervisado, ya que la red se alimenta con un par de patrones de entrenamiento, en la que uno de estos patrones es la salida deseada de la red (En un entrenamiento no supervisado no se alimenta a la red con la salida deseada). Retro-Propagación utiliza una generalización de la regla delta para el entrenamiento de cualquier tipo de red neuronal, en la que se aplica el concepto de gradiente descendente, que consiste primordialmente en una técnica de disminución del error. El objetivo principal consiste en minimizar la función de error promedio
al cuadrado que hay entre la salida real y la salida deseada de la red [25]. La función de error que minimiza Retro-Propagación está dada por:
E = Σ Ep (2.1)
p Donde:
Ep = ½ Σ ( Tpj – Opj)2 (2.2)
j Ep = es el error obtenido del patrón p.
Tpj = es el j-ésimo componente de la salida deseada cuando se aplica el patrón p.
Opj = es el j-ésimo componente de la salida en la red cuando se aplica el patrón p.
Retro-Propagación es un algoritmo que busca que los pesos que forman el nivel escondido principalmente generen una representación interna apropiado al problema a resolver. Este modelo ha demostrado gran éxito para muchas aplicaciones. Sin embargo, también presenta algunas limitaciones, como el ser muy costoso computacionalmente hablando ya que no se puede asegurar una garantía de éxito para una aplicación dada. Pero la principal limitación de este algoritmo es que exclusivamente puede aprender a partir de un conjunto de valores que permanecen de una manera estática. El algoritmo recibe un conjunto de valores de un vector X, que representa las entradas, las cuales son asociadas a otro conjunto de valores que están en el vector Y, que representan las salidas. Estos conjuntos de datos permanecen independientes a través del tiempo [7].
Figura 2.4 Clasificador estático [12].
El modelo de Retro-Propagación podría ser utilizado en una serie de tiempo estática para una predicción no-lineal. Tomando en cuenta que una serie de tiempo es estacionaria cuando sus estadísticos no presentan cambios a través del tiempo. El vector de entrada x puede ser representado de la siguiente forma:
X = [ X( n – 1), X( n – 2), . . ., X( n – p) ]T (2.3)
Donde p es el orden de predicción, obteniéndose la salida de la red y(n), en respuesta del vector de entrada x.
∧
Y(n) = X(n) (2.4) El vector X(n) representa las entradas en respuesta a los resultados deseados al
momento del entrenamiento de la red. El tiempo es considerado importante en la ejecución de algunas tareas, ¿De que manera podemos representar este tiempo?. La finalidad de encontrar una representación del tiempo es analizar el efecto que éste tiene en el procesamiento de señales.
Figura 2.5 Sistema predictor [12].
La memoria es un factor importante para que una red neuronal sea dinámica. Esto se logra a través de la implantación de tiempos de espera en las estructuras sinápticas en la red, mediante la cual se realizan ajustes de valores durante la fase de aprendizaje. Una manera de lograr un comportamiento dinámico de una red neuronal es a través de la recurrencia. Para entrenar una red recurrente se puede aplicar el método de Retro-Propagación a Través del Tiempo. Este algoritmo fue descrito por Werbos (1974) (1990). Y redescubierto independientemente por Rumelhart (1986). Una variante de este método es desarrollado por Williams y Peng (1990) [25]. El modelo de entrenamiento que se implementa para los intereses de esta tesis es el de Retro-Propagación a Través del Tiempo. Este modelo es utilizado para llevar a cabo un entrenamiento supervisado a redes neuronales recurrentes, completamente recurrentes ó híbridas.
2.2 RETRO-PROPAGACION A TRAVES DEL TIEMPO (BPTT)
El modelo de Retro-Propagación a través del tiempo es un algoritmo que se puede utilizar para diversas aplicaciones como es el reconocimiento de patrones, modelos dinámicos, análisis sensitivos, control de sistema sobre el tiempo, entre otros. Este modelo es utilizado para realizar el entrenamiento de redes recurrentes, teniendo como principio básico el modelo de Retro-Propagación [24]. En términos generales, el conjunto de datos usados en una red recurrente se pueden dividir en un período de tiempo. Para una red neuronal completamente recurrente los nodos que forman la arquitectura de la red están conectados todos contra todos [7][25]. La ecuación que representa la salida de yi para cada uno de los neurones i es:
∂yi / ∂t = - yi + σ(xi) + Ii (2.5) Donde:
Xi =
Σ
Wji Yj (2.6)j
Los valores de Xi representan el total de entradas para el i-ésimo neuron que viene
de otro neuron, Ii es una entrada externa a cada neuron i, Wji son los pesos de conexión del neuron i al neuron j, y σ(x) es una función de activación, normalmente
la sigmoide:
σ(x) = 1 / 1 + e(-α x) (2.7)
Donde:
α es un parámetro de escalamiento.
Este algoritmo trata de minimizar el error obtenido en un período de tiempo entre la salida de un neuron y el valor de salida deseada. Este fue originalmente propuesto por Werbos [25]. El error total es una salida del neuron que es representado por:
t1
E =
∫
(Y(t) – d(t))dt, (2.8)t0
En donde Y(t) representa la salida real del neuron y para d(t) es la salida deseada. Se
desea obtener la minimización de la raíz cuadrada de E. El modelo de Retro-Propagación a través del tiempo es de gran interés para el desarrollo de proyectos en redes neuronales donde el período de tiempo es importante. En éste algoritmo se utiliza el aprendizaje supervisado, para llevar a cabo la etapa de entrenamiento de la red. Uno de los pares de entrenamiento es el conjunto de entradas X(t) que representa
la información que entrada del mundo exterior a la red, con la cual se obtiene una salida real Y(t); esta salida tiende a parecerse lo más posible a las salidas deseadas
Y(t) para el tratamiento de un conjunto de T patrones. El vector de salidas deseadas
Y(t) es parte del par de entrenamiento [8][25].
Una de las partes de gran importancia para toda red neuronal es la etapa de entrenamiento, ya que son muchos los factores que pueden influir para que una red neuronal no llegue a obtener un aprendizaje eficiente. Para poder obtener un aprendizaje supervisado de una manera eficiente hay que considerar los siguientes dos puntos:
a) Debemos definir la topología de la red neuronal, esto quiere decir, especificar claramente las conexiones y ecuaciones que interviene, para el par de entrenamiento, que son el conjunto de entradas X(t) y salidas reales
Y(t), en la que se espera obtener una aproximación a la salidas deseadas
Y(t), a través de una relación de entradas y salidas que dependen del
conjunto de pesos (parámetros) Wij, los cuales deben de ser ajustados
b) Especificar las reglas del aprendizaje, tomando en cuenta un procedimiento para el ajuste de los pesos Wij con las actuales salidas
reales Y(t), las cuales deben aproximar a las salidas deseadas Y(t). [25]
Amir F. Atiya y Suzan M. El-Shoura [1] implementaron el algoritmo de Retro-Propagación en el tiempo, para la predicción del flujo de corriente del Río Nilo en Egipto, mediante la implementación de una Red Neuronal. Además utilizaron una serie de tiempos como un benchmark para la comparación entre varios métodos de Redes Neuronales para predicciones. Realizándose la comparación entre cuatro métodos diferentes de preprocesado de entradas y salidas.
El algoritmo de Retro-Propagación a través del tiempo se encuentra descrito en el trabajo de investigación sobre predicciones de señales caóticas realizado por la Dra. M. Pilar Gómez Gil [8].
2.3 CAOS
2.3.1 Teoría del Caos
Durante siglos el mundo de las matemáticas se consideró como lineal. Es decir, que los investigadores en las ciencias Matemáticas y Física principalmente, no tomaron en cuenta a los sistemas dinámicos, como el azar e impredecibilidad. Los únicos sistemas que se consideraron en el pasados fueron los lineales, aquellos sistemas que siguen un modelo predecible. Como por ejemplo, ecuaciones lineales, funciones lineales, álgebra lineal, programación lineal, etc., son áreas que se entienden y han sido dominadas. Sin embargo, el problema es que no vivimos en un mundo lineal; de hecho, nuestro mundo debe considerarse como no lineal. Hoy en día no se ha podido
realizar una descripción acertada sobre azar y los fenómenos incomprensibles [4][20].
Los primeros experimentos relacionados con Caos fueron llevados a cabo por Edward Lorenz en 1960, en el área de meteorología. El trabajo fue orientado primordialmente al problema de la predicción del clima. Utilizó un conjunto de computadoras, con una serie de doce ecuaciones para simular el tiempo. No obtuvo la predicción del tiempo. Pero este programa de computadora pudo predecir lo que los tiempos podrían ser teóricamente hablando [18].
La teoría del caos es una disciplina que todavía está en vías de desarrollo, orientándose al estudio de sistemas no-lineales principalmente. Para tener un mejor entendimiento a cerca de esta teoría debemos tomar en cuenta dos cosas, el concepto de sistema y término no-lineal.
El concepto sistema, se refiere primordialmente a comprender la relación que existe entre las cosas que actúan recíprocamente. Para comprender este concepto, analicemos lo que puede suceder con un montón de piedras por ejemplo. El montón es un sistema que actúa recíprocamente basado en cómo las piedras fueron amontonadas. Si se amontonaron inicialmente en un estado que no esta en equilibrio, la interacción produce movimiento hasta que estas encuentren una condición de equilibrio. Uno de los puntos importantes a cerca de los sistemas es que éstos se pueden modelar. Es decir, podemos generar sistemas qué simulen la conducta original del sistema, teóricamente. Por ejemplo, si se toma un segundo grupo de piedras similar al primer grupo, y se amontonan exactamente de la misma forma como fueron amontonadas el primer grupo; se podría predecir que estas se acomodarán exactamente de la misma forma que el primer grupo. El modelo de Isaac Newton para este análisis se podría utilizar para hacer las predicciones. Encontrar el modelo matemático que simule al sistema podría decirse que es la llave
El término no-lineal, se relaciona con el tipo de modelo matemático que describe al sistema. Cuando empezó el interés por la teoría del caos en los sistemas no-lineales, estos modelos fueron analizados como sistemas lineales. Si el modelo matemático representaba un formato gráfico, los resultados obtenidos eran una línea recta.
Sin embargo un sistema caótico presenta las siguientes características:
a) Los sistemas caóticos son deterministicos y no presentan periodicidad. Esto significa que tienen alguna ecuación que determina su comportamiento, además la conducta caótica nunca se repite exactamente. No hay ningún ciclo identificable que se repite a los intervalos regulares.
b) Los sistemas caóticos son sensibles a las condiciones iniciales. Incluso un mismo cambio en el punto de arranque puede llevar a diferentes resultados significativamente diferentes. Esto significa que pequeñas diferencias en condiciones iniciales, se producirá grandes diferencias en la conducta en un punto más adelante en el tiempo.
c) Los sistemas caóticos no son aleatorios, ni desordenados. De verdad los sistemas aleatorios no son caóticos, los sistemas caóticos tienen un sentido de orden y son más exactos [20][21].
2.3.2 Dependencia sensible a condiciones iniciales
Una de las características esenciales de un sistema complejo es que son impredecibles; es lo que Edward Lorenz llama sensibilidad a condiciones iniciales, conocido también como el fenómeno del efecto mariposa. Esto nos quiere decir que en un sistema no-lineal, que presente pequeñas diferencias en las entradas iniciales producirá resultados dramáticamente diferentes después de varios ciclos en el sistema. Debido a la alta dependencia de las condiciones iniciales en los sistemas complejos, es difícil generar modelos para predecir resultados con precisión. Los sistemas caóticos se originan cuando estos son muy sensibles a las condiciones
iniciales, en el que este conjunto representa los valores en donde empieza el tiempo [14].
En la figura 2.6 nos muestra un ejemplo matemático de las condiciones iniciales. Aquí se tienen dos puntos X0 y X1, en un círculo que representan los valores de
inicio en un sistema T. La diferencia entre estos dos puntos esta representada por la distancia d. Después de que se ejecuta la primera iteración, la distancia d entre estos dos puntos T(2X0) y T(2X1), se duplica. Al hacerse otra iteración podemos observar
que la distancia d es cuatro veces más que el tamaño inicial entre estos dos puntos
T(4X0) y T(4X1). En este modelo observamos que la distancia entre Tn(nX0) y
Tn(nX1), es 2nd.
Figure 2.6 Condiciones Iniciales [20].
El ejemplo anterior nos explica que no importa que tan cerca las dos condiciones se inicien, porque después de realizarse algunas iteraciones los dos puntos serán separados exponencialmente. Para un caso en el que interviene una computadora, en
decimales, desechando los restantes, habrá una cierta cantidad de error decimal, aun cuando los valores iniciales hayan entrado con precisión. Un error diminuto en las condiciones iniciales es una diferencia grande en los resultados. Esto ocasiona que los sistemas caóticos sean muy inestables [20].
2.3.3 Complejidad
La complejidad se presenta tanto en los sistemas naturales como en los sistemas artificiales, en la que los sistemas dinámicos complejos, pueden ser muy grandes o muy pequeños. Un sistema complejo presenta características de que no es totalmente deterministico, ni completamente al azar, si no exhibie ambas condiciones. La complejidad de un sistema depende totalmente del carácter, su ambiente y naturaleza de las interacciones entre éstos. Un sistema caótico dinámico es complejo cuando presenta inestabilidad [11].
Figura 2.7 Diagrama de Bifurcación [4].
En la grafica 2.7 la señal se bifurca una y otra vez, hasta convertirse en caótica. La complejidad de un sistema se define por la complejidad de los requisitos para
predecir la conducta del sistema de una forma eficiente. El modelo debe parecerse más al sistema real para poder predecir los resultados del sistema. El ejemplo del sistema más complejo es el clima que sólo puede predecirse usando un duplicado exacto de sí mismo.
2.3.4. Atractores extraños
Los atractores extraños también son llamados caóticos y los más conocidos son: Atactor de Lorenz, Atractor de Rössler, Atractor de Chua y Atractor de Duffing. Un atractor extraño se puede considerar como el límite que define una trayectoria caótica. Algunos autores lo definen como: “Un conjunto de limites que colecciona una trayectoria”, “Es simplemente el modelo de la senda visual, producida gráficamente por la conducta del sistema”, “Es un conjunto de puntos tal que todas las trayectorias cercanas convergen a él”. El atractor extraño es considerado distinto a una órbita periódica o un ciclo limite [19][20].
En la figura 2.8 se muestra el Atractor de Lorenz, quien encontró que a pesar de que los valores generados nunca se repiten y que las condiciones iniciales pueden hacer variar completamente los valores generados, de ahí el nombre de atractor extraño o caótico. El atractor toma una forma única y parece conservar cierto orden, sus infinitas trayectorias nunca se cortan, pues eso implicaría que entraríamos en un ciclo periódico en un sistema autónomo. Para un sistema que presenta sensibilidad a las condiciones iniciales, las trayectorias de los puntos de las condiciones iniciales entrarán en alguna dirección, más cercanas para un período que otros, originando un encogimiento del volumen neto. Esta extrema sensibilidad a las condiciones iniciales fue lo que originó la frase del llamado Efecto Mariposa. El atractor se origina si un sistema es sensible a las condiciones iniciales y no es conservador [4][18].
El modelo atmosférico que utilizo Lorenz consiste en una atmósfera bidimensional rectangular, cuyo extremo inferior está a una temperatura mayor que el superior. De esta forma el aire caliente subirá y el aire frío bajará creándose corrientes que harán un intercambio de calor por convección. Las ecuaciones que describan este proceso son:
dx/dt = σ(y-x) (2.9)
dy/dt = rx – y – xz (2.10)
dz/dt = xy – bz (2.11)
En donde las variables, que dependen del tiempo son: “x” representa el flujo convectivo.
“y” es la distribución de temperatura horizontal. “z” es la distribución de temperatura vertical.
Además tenemos los tres parámetros que intervienen en las ecuaciones: “σ” cociente entre la viscosidad y la conductividad térmica.
“r” la diferencia de temperatura entre la capa inferior y superior. “b” el cociente entre la altura y el ancho del rectángulo.
2.3.5 Predicciones
El campo de la predicción es de gran interés, ya que ha encontrado una gran aplicación en el mundo que nos rodea, para predecir aquellos eventos o procesos en el que tenemos un desconocimiento. Podemos mencionar que usualmente es empleado para predecir lo que no se conoce en un tiempo futuro (predecir una Serie de Tiempo); algunas de las aplicaciones en las que se puede emplear las predicciones son por ejemplo: predecir el clima en un intervalo de tiempo, predecir el comportamiento del nivel de ventas de cierta mercancía ó el mantener un stock, predicción de razones financieras, predecir eventos catastróficos en los electrocardiogramas (ECG), etc. En la predicción el principal interés es preocuparse como sucederán en el futuro ciertos eventos, mientras que en una planeación se interesa por lo que debe presentarse. El proceso normalmente empieza con una planeación. La predicción necesita de un plan que es la entrada al proceso de predicción con la información del ambiente para crear una previsión [5].
Los métodos de predicción los podemos considerar subjetivos u objetivos. Los subjetivos o sensatos, quizá son las previsiones más ampliamente usadas para predicciones importantes. Para los métodos objetivos incluyen extrapolación, métodos de segmentación. Los médicos, científicos, economistas, etc., se han interesado por el estudio de los sistemas dinámicos no-lineales, que forman parte de la Teoría del Caos. En el mundo en que vivimos se encuentra en constante
como la temperatura o el precio de un mercado libre, tiende a ser diferente, para diferentes períodos de tiempos. Esto ha ocasionado un interés por el desarrollo de métodos matemáticos que consideren al tiempo como un factor importante. En el caso de Retro-Propagación a través del tiempo se consideran patrones dinámicos [22][25].
2.3.6 Procesamiento de una Serie de Tiempo
Una Serie de Tiempo consiste en una secuencia de valores en un vector que dependen de un período de tiempo t: X ( t ) , t = [0, 1, 2, 3, . . . n]. Ejemplos de
algunos valores que se pueden considerar como parte de una Serie de Tiempo son: a) La temperatura del aire que se presenta dentro de un edificio.
b) El precio asignado a cierto artículo en un stock de intercambio dado. c) El número de nacimientos en una ciudad determinada.
d) La cantidad de agua que se consume en cualquier comunidad. e) Los electrocardiogramas.
Teóricamente X puede representarse como una función continua en un período de tiempo variable t. Regularmente el tiempo es representado en términos discretos, orientado a una instancia X para cada punto final en un intervalo de tiempo de tamaño fijo. El tamaño de este intervalo depende exclusivamente del tipo de problema a resolver, que podría ser cosas en milisegundos, horas al día, ó cada año, etc. Para muchos de los casos las observaciones disponibles solo se pueden representar como tiempos discretos, como el precio de un artículo de cada hora o día. En otros casos los valores tienen que ser acumulados ó calcular un promedio sobre un intervalo de tiempo para obtener la serie, como en el caso de obtener el número de nacimientos en una ciudad, dirigido al número de nacimiento por mes [6] [13].
La frecuencia de la muestra, el número de puntos obtenidos como resultado de la media, y el intervalo de tiempo escogido, es parte crucial que cambia esencialmente las características principales de los resultados en una serie de tiempo. Existen otros campos relacionados con el procesamiento de una serie de tiempo, como es el procesamiento de señales, reconocimiento de voz, detección de patrones anormales en electrocardiogramas (ECGS). Una señal cuando se muestra dentro de una secuencia de valores de tiempo discretos, constituye una Serie de Tiempo. De esta manera no podemos hacer una distinción formal entre el procesamiento de señal y serie de tiempo. La diferencia puede ser proporcionada en el tipo de aplicación predominante, para el caso del procesamiento de señales se utiliza el término reconocimiento o filtrado, en el procesamiento de una serie de tiempo la naturaleza es el intervalo de tiempo. En el procesamiento de señales la media puede ser una fracción de segundo, mientras que en el procesamiento en una Serie de Tiempo el intervalo a menudo es arriba de una hora [3][16].
2.4 FRACTALES
2.4.1 Geometría Fractal
La geometría fractal y la teoría de los sistemas dinámicos están íntimamente ligadas, ya que la región del espacio hacia la que tiende asintóticamente una órbita caótica tiene estructura fractal (atractores extraños). Por lo tanto, la geometría fractal permite estudiar el soporte sobre el que se definen los sistemas dinámicos caóticos. La geometría tradicional (euclídeana) se encarga de las propiedades y de las mediciones de objetos tales como puntos, líneas, planos y volúmenes. La geometría fractal permite estudiar fenómenos irregulares que no pueden ser caracterizados con las teorías clásicas. Este es un nuevo idioma que describe un modelo y analiza
de grupo animal, modelos económicos, etc. La dimensión fractal puede medir la textura y la complejidad de los litorales, las montañas, nubes, etc. Podemos relacionarlos con el hecho de guardar imágenes de calidad fotográfica en diminutos fragmentos en un espacio determinado [18]. Estos proporcionan una forma muy diferente de observar y modelar los fenómenos complejos como lo hace la geometría euclidiana. Simplemente los fractales son imágenes complejas de belleza extraordinaria con funciones matemáticas bastante simples. Una característica esencial que distingue una imagen fractal de otros tipos de gráficos es su propiedad de auto-similitud. Esto quiere decir que una región arbitrariamente pequeña de un fractal se parece, al fractal entero. De esta manera, son semejantes al ADN, así como el ADN contiene toda la información para un organismo viviente, también en una región pequeña porción del fractal contiene toda la información [2].
Estos sistemas son también conocidos como sistemas no lineales, ya que ellos presentan grandes fluctuaciones debido a cambios pequeños en los parámetros que los controlan. El estudio de la teoría del caos y los fractales tiene importantes aplicaciones en meteorología, irregularidades cardiacas, modelos poblacionales, mecánica cuántica y astronomía.
2.4.2 Fractales
El término Fractal fue creado por Benoit Mandelbrot, que se deriva del latín fractus que significa roto, que describe algo irregular [18]. Un fractal a diferencia de una figura geométrica euclidiana, es irregular. Los fractales son objetos geométricos que cuentan con dos propiedades muy importantes: la auto-similitud y la dimensión fraccionaria, como son las montañas, nubes, sistemas de ríos, árboles, etc. Los fractales no son completamente caóticos, estos presentan un orden, aunque no son totalmente ordenados. Mandelbrot ayudó a descubrir el orden en los fractales. El encontró la característica de auto-similitud en su fractal [19 ]. La figura 2.9 muestra la imagen clásica de Mandelbrot, que popularizó grandemente a los sistemas
caóticos y fractales. El conjunto de Mandelbrot es creado por una técnica general, en donde una función de la forma Z n+1 = f(Zn) se usa para crear una serie de variables
complejas. En el caso del conjunto Mandelbrot, la función está dada por f(Zn) = Zn2
+ Zo. Esta serie se genera para cada Zo en el punto inicial en alguna partición del
plano complejo [19].
Figura 2.9 Conjunto de Mandelbrot [19].
También existen otras estructuras que son consideradas fractales como por ejemplo: el triángulo de Sierpinski, copo de nieve de Koch, curva de Peano y Atractor de Lorenz. Mandelbrot define a una figura geométrica como fractal si presenta las siguientes características:
a) Si sus partes tienen la misma forma o estructura como el todo, sólo que a una escala diferente.
b) Si su forma es sumamente irregular o sumamente interrumpida.
El concepto de auto-similitud se entiende como el hecho de que si se analiza un fractal de cerca o de lejos, se ve muy similar. Es decir, si se toma una porción de un fractal y se amplia varias veces, esta parte es bastante similar al fractal completo. La dimensión fraccionaria significa que la mayoría de los fractales no tienen a un número entero por dimensión, sino a una fracción. Por ejemplo, una línea, un triángulo o un cubo tienen una dimensión entera como 1, 2 ó 3; los fractales tienen dimensiones como 1.8779 ó 1.787 [11][23].
2.4.3 Dimensión Fractal
Muchas de las formas geométricas usadas para construir pertenecen a la geometría euclidiana. Estas formas comprenden líneas, rectángulos, arcos, cilindros, esferas, etc. Estos elementos pueden ser clasificados dentro de una dimensión del entero 1, 2, o 3. Para una dimensión es importante el segmento de línea. Si la dimensión del segmento de la línea se dobla entonces la longitud de la línea se ha doblado. En dos dimensiones, si la dimensión lineal se dobla, para un rectángulo el tamaño característico, es el área, aumenta por un factor de cuatro. En tres dimensiones si la dimensión lineal de una caja se dobla entonces el volumen aumenta por un factor de ocho. Esta relación esta dada por S = LD, donde D es la dimensión, L la escalar y S el aumento en tamaño. Esto nos quiere decir que si se escala un objeto con dos dimensiones, su área aumenta el cuadrado de la escalar y para un objeto de tres dimensiones, el volumen aumenta al cubo del factor escalar. Siguiendo este concepto obtenemos una expresión reestructurada para dimensionar el tamaño dependiendo del cambio en relación al escalamiento lineal, D = log(S) / log (L). El valor de D es un entero que ésta en 1, 2, o 3 dependiendo de la dimensión geométrica. Esta es una relación para todas las formas euclidianas [5].
Existen muchas formas en el mundo que nos rodea que no forman al entero, esta idea se origina en la dimensión con respecto a la descripción intuitiva y matemática.
Es decir, por ejemplo existen objetos que parecen curvas, pero en un punto en la curva no puede definirse con un solo número. Hay formas que son escaladas linealmente por un factor L, pero el área no aumenta por L al cuadrado. Esta geometría se llama Fractal. Uno de los fractales más simples es el copo de nieve de von Koch. Este método consiste en reemplazar cada segmento de la línea repetidamente con cuatro segmentos de línea como se muestra en la figura 2.10 [19][23].
Figura 2.10 Segmento básico [19].
Con una simple regla de generación para una forma se puede generar algo más complejo llamado fractal. El proceso empieza con un segmento de línea y continúa para siempre. Si se hace un análisis de lo general a lo específico del fractal de una forma muy detallada, observaremos que una porción es idéntica a cualquier otra porción en general, esto es auto-similitud. En cada iteración la longitud de la curva se aumentará por un factor de 4/3 y de esta manera la curva limite es de longitud infinita, de hecho la longitud entre cualquiera de los dos puntos de la curva es infinita. Esta curva comprime una longitud infinita en un área finita del plano sin cortarse [18].
Figura 2.11 Niveles de iteración [ 19].
La figura 2.11 nos muestra la longitud infinita encerrada en un área finita. Muchos de estos objetos son construidos mediante algoritmos iterativos, partiendo de un iniciador y aplicando reiterativamente un conjunto de transformaciones. De esta forma se puede definir una gran cantidad de objetos matemáticos con propiedades comunes, como la autosemejanza.