2. Metodología
2.4. Análisis
2.4.2. Redes neuronales artificiales
Los análisis multivariantes, como el análisis discriminante múltiple o regresión logística, tienen el inconveniente de exigir a las variables verificar unas fuertes condiciones estadísticas propias de las distribuciones paramétricas, que no siempre se cumplen (como son la normalidad multivariante, la homocedasticidad, la linealidad y la ausencia de multicolinealidad). Esto ha llevado en las últimas décadas a buscar técnicas alternativas más eficientes, de la que destacamos las redes neuronales artificiales (RNA), las cuales, sin exigir tantos requisitos estadísticos, proporcionan clasificaciones y predicciones con índices de aciertos comparables o sensiblemente mejores que los análisis multivariantes.
Las Redes Neuronales Artificiales son técnicas de distribución libre o no paramétricas que se caracterizan por su relativo buen comportamiento ante problemas no lineales o datos con mucho ruido, es decir datos incompletos o erróneos. Trabajan sobre la base de reconocimiento de patrones, de manera que tienen la capacidad de adquirir conocimiento a partir de los ejemplos. Esto les otorga una gran capacidad para procesar datos y realizar procesos inteligentes como aprender a partir de ejemplos, generalizar
el conocimiento adquirido a nuevos casos y reconocer tendencias y patrones en los datos.
Su estructura se inspira en las neuronas biológicas, imitadas por elementos procesadores de información interconectados y distribuidos en niveles o capas. Poseen un nivel de entrada que introduce los datos en la red, y un nivel de salida que proporciona la respuesta. Entre ellos hay uno o más niveles intermedios que procesan los datos aprendiendo la relación entre los datos de entrada y los de salida y que se denominan capas ocultas, las cuales son en realidad, modelos matemáticos multivariantes que utilizan procedimientos iterativos para minimizar las funciones de error.
Las redes neuronales se caracterizan por ciertas condiciones:
a) Aprendizaje adaptativo: poseen la habilidad de aprender la forma de realizar tareas basadas en la información entregada para entrenamiento o experiencia inicial. Las redes neuronales, al igual que sus modelos humanos de la cual son imagen, aprenden por el ejemplo.
b) Auto-organización: pueden crear su propia organización o representación de la información que reciben durante el período de aprendizaje.
c) Operación en tiempo real: el trabajo de las redes neuronales puede ser efectuado en paralelo.
d) Tolerancia a errores a través de codificación de información redundante.
Una de las RNA más ampliamente utilizadas en el análisis de clasificación es el Perceptrón Multicapa (MLP – del inglés Multilayer Perceptron). Rumelhart, Hinton y Williams formalizaron un método para que una red de este tipo aprendiera la asociación que existe entre un conjunto de patrones de entrada y sus salidas correspondientes, método conocido como backpropagation error.
Un MLP está compuesto por una capa de entrada, una de salida y una o más capas ocultas. En este tipo de modelos las conexiones entre nodos siempre van desde las neuronas de una determinada capa hacia las neuronas de la siguiente. No hay conexiones laterales ni hacia atrás. Por tanto, la información siempre se transmite
desde la capa de entrada hacia la capa de salida. En la siguiente figura se puede observar la arquitectura de un MLP.
Figura 4. Arquitectura de un Perceptrón Multicapa. Cortesía del profesor Marcelino Bermejo Pérez.
La amplia aplicabilidad de las redes neuronales se debe a que son capaces de actuar como aproximadores universales de funciones. Una red MPL con al menos una capa oculta con suficientes unidades no lineales puede aprender cualquier tipo de función o relación continua entre un grupo de variables de entrada y de salida. Esto convierte a las redes Perceptrón Multicapa en herramientas de propósito general, flexibles y no lineales que muestran un rendimiento superior respecto a los modelos estadísticos clásicos en numerosos campos de aplicación.
Por las características analizadas hasta ahora, para efectuar los análisis planteados en este estudio, se aplica un modelo basado en redes neuronales artificiales Perceptrón Multicapa con una capa oculta, proceso de entrenamiento batch y con un algoritmo de optimización de gradiente conjugado que se deriva del algoritmo backpropagation. Se fundamenta en el cálculo de la segunda derivada del error con respecto a cada peso, y en obtener el cambio a realizar en los pesos a partir de este valor y el de la primera derivada. Se utilizan funciones de activación logísticas en las salidas de la red, que son utilizadas como una función discriminante no lineal.
Capa de Entrada Capa oculta Capa de Salida Entrada 1 Entrada 2 Entrada 3 Entrada n Salida
En primer lugar, se determina si el modelo predice correctamente el grupo al que pertenecerá una gestante dadas las variables planteadas. En segundo lugar, se calcula la importancia de cada predictor en la determinación de la red neuronal, basando el análisis en el entrenamiento combinado y en las muestras de prueba, evidenciando la importancia y la importancia normalizada para cada predictor. Por último, se determina la importancia que tienen las variables explicativas sobre la variable de respuesta mediante un análisis de sensibilidad numérica, que se basa en el cálculo de las pendientes que se forman entre entradas y salidas, sin realizar ningún supuesto acerca de la naturaleza de las variables y respetando la estructura original de los datos.