• No se han encontrado resultados

moide (b)38

El proceso por el cual la red neuronal aprende a computar la salida correcta pa- ra distintas entradas se denomina “entrenamiento”, y consiste en una adaptación de los pesos sinápticos de la red en respuesta a los ejemplos que se le presentan. El aprendizaje puede ser onlineu offline. En el primer caso, durante su funciona- miento habitual la red continúa aprendiendo, mientras que en el segundo existe una primera etapa de entrenamiento y una vez concluída ésta, los pesos de la red ya no pueden ser modificados y ésta se utiliza únicamente para clasificar nuevos ejemplos.

Cuando se utiliza aprendizaje supervisado, la modificación de los pesos duran- te el entrenamiento es una función del error, es decir, de la diferencia entre las salidas deseadas para ciertas entradas y las salidas efectivamente computadas por la red para estas entradas. En un principio, los pesos sinápticos se inicializan en valores pequeños tanto negativos como positivos, frecuentemente de manera alea- toria. Luego, se van presentando los sucesivos ejemplos a la red y se computa la salida de la misma para cada uno de esos ejemplos. Finalmente, los pesos se ac- tualizan de manera proporcional a la diferencia entre la respuesta dada por la red

38Fuente: Stuart Russell y Peter Norvig.Inteligencia Artificial. Un enfoque moderno.2.aed. Pear- son, 2004.

y la esperada. La presentación a la red de todos los ejemplos y la correspondiente adaptación de los pesos para cada uno de ellos se denomina “época”. El entre- namiento de una red precisa de varias épocas, y termina cuando se cumple un número determinado de épocas determinado previamente o bien cuando el error llega a un valor aceptable. Para determinar el error de la red pueden utilizarse distintas funciones de error; una de las más comunes es el error cuadrático medio. En este proyecto, se utilizó una red neuronal de tipo perceptrón multicapa (MLP), que consiste en varias capas de perceptrones sigmoideos. Se eligió este tipo de red debido a que es la más comúnmente usada y presenta múltiples ventajas, tales como su universalidad que las hace aptas para resolver distintas clases de problemas, su robustez y la facilidad que reviste su utilización.

En los MLP, el aprendizaje se da mediante un algoritmo llamado “retropropa- gación”. Este algoritmo permite encontrar un mínimo local en la función de error, y determina que con cada ejemplo presentado, los pesos sinápticos que relacionan las neuronas j de la capa l con las neuronas ide la capa precedente, se adaptan de acuerdo a la siguiente regla:

∆wijl =η×δjl×gli−1 (42) Paral = 1, ..., L.

Donde:

∆wl

ij es la modificación que debe hacerse al peso sináptico que va desde la neuronaien la capal−1a la neuronaj en la capal.

ηes una “tasa de aprendizaje”, que determina cuán bruscos son los cambios en los pesos en cada iteración. Este parámetro toma un valor entre 0 y 1: un valor de η pequeño permite una convergencia lenta pero más suave del error hacia un mínimo, mientras que un valor alto dará una convergencia más rápida pero más errática. Este parámetro debe optimizarse para lograr la mejor convergencia.

δl

j representa el error contribuido por la neuronaj en la capal al error total de la red.

gli−1 es la salida de la neuronaide la capa precedente.

El error δjl se calcula, para la capa de salida(l=L), de la siguiente manera:

δjL= (tj−gLj)×g

0L

Donde tj es la salida que se esperaba para la neurona j, gj es la salida que efectivamente computó esta neurona, yg0j es la derivada de esta salida.

Para las neuronas de las capas ocultas(l < L), el error se calcula de la siguiente forma: δli = ( nl+1 X j=1 δjl+1×wijl+1)×g0li (44)

Es decir, que el error contribuido por la neuronaien la capal es proporcional a la suma de los errores asociados con las unidades en la capa posterior a las que la neuronaj está conectada.

4.2.

Base de datos “MIT-BIH Arrhythmia Database

Para poder implementar un algoritmo de aprendizaje automático, es necesario contar con una gran cantidad de datos representativos de aquellos que se quieren clasificar. Mas aún, si lo que se busca es aplicar el aprendizaje supervisado, estos datos deben estar etiquetados con la clase correspondiente. En este caso, se requie- ren señales de ECG correspondientes a latidos cardíacos de diferentes clases, con su etiqueta. Para esto, se recurrió a PhysioBank, un archivo de registros digitales de señales fisiológicas, y PhysioToolkit, una librería desoftwarede código abierto para el procesamiento y análisis de estas señales. Dentro del PhysioBank se encon- tró la base de datos “MIT-BIH Arrhythmia Database”, que contiene 48 registros de media hora de dos canales de ECG ambulatorio obtenidos de 47 pacientes estu- diados en elBIH Arrhythmia Laboratoryentre 1975 y 1979. Presenta las siguientes características:

Criterio de selección de los registros: 23 de los 48 registros fueron ele- gidos de manera aleatoria entre pacientes de un hospital, mientras que los restantes fueron seleccionados para contemplar casos raros de arritmias que no estarían bien representados en una muestra aleatoria.

Derivaciones: Cada registro consiste de dos derivaciones, de las cuales la primera es DII modificada, es decir, DII pero con los electrodos colocados en el pecho, como puede observarse en la figura 43. La segunda es general- mente la derivación V1 modificada, aunque en algunos casos se registró V2 o V5 y en un único registro V4. Para este proyecto esta segunda derivación no tiene importancia debido a que se trabajó únicamente con la primera.