Arquitectura estándar de la red CNN - Introducción a las redes CNN

1.1. Introducción a las redes CNN

1.1.1. Arquitectura estándar de la red CNN

Las redes CNN pueden ser representadas mediante sistemas de celdas defi-

nidos en el espacio normalizado Rn_{. La dimensión de estos sistemas no suele}

exceder n > 3 debido a la dificultad que supone su fabricación sobre dispositivos integrados analógicos, generalmente basados en procesos planares. En el espacio bidimensional, las celdas de la redes CNN pueden ser mapeadas sobre diferentes esquemas físicos, como, por ejemplo, los mostrados en la figura 1.1. Con indepen- dencia de la topología empleada, las redes CNN pueden estar formadas por celdas idénticas entre sí o por un conjunto reducido de celdas diferentes, como ocurre en el caso de la redes NUP-CNN (Non-Uniform-Processor CNN), figuras 1.1-d y 1.1-f.

Como se ha indicado anteriormente, las celdas de las redes CNN únicamente pueden estar conectadas a celdas que estén situadas en su proximidad, es decir, en su entorno de vecindad. La vecindad de una celda se define como el conjunto de celdas que se sitúan a su alrededor y sobre las cuales esta ejerce su influencia de forma directa. Según esta definición es posible encontrar una función distancia que determine exactamente la región de vecindad de cada celda. En general, esta región suele venir representada mediante una esfera, centrada en la propia celda, y cuyo radio r especifica el tamaño de la vecindad. Hay que mencionar que existen redes CNN con diferentes tamaños de vecindad que se denominan MNS-CNN (Multiple-Neighborhood-Size CNN) (Roska T., 1992). Un ejemplo de este tipo de redes, constituida por celdas con radio de vecindad r = 1 y por celdas con radio de vecindad r = 2, se muestra en la figura 1.1-e.

(a) (b) (c)

(d) (e) (f)

Figura 1.1: Ejemplos de redes CNN con distintas topologías y conexiado. a) Rec- tangular. b) Triangular. c) Hexagonal. d) Diferentes celdas (NUP-CNN). e) Dife- rente tamaño de vecindad (MNS-CNN). f) Diferentes celdas y conexionado.

Como se ha visto, las redes CNN pueden presentar multitud de topologías y conexionados diferentes. En la práctica, sin embargo, lo habitual es que las redes CNN formen estructuras bidimensionales de una sola capa y radios de vecindad reducidos. La arquitectura más estandarizada de las redes CNN es representada mediante una matriz de celdas, de dimensión M×N, que se distribuyen uniforme- mente sobre el plano. Dicha distribución hace uso de un sistema de coordenadas cartesiano, de variables discretas (i, j) (siendo i = 1, 2, ...M y j = 1, 2, ..., N), que permite ordenar las celdas en filas y columnas, según un patrón geométrico rectangular. Como se observa en la figura 1.2, a partir de este esquema, las celdas pueden ser identificadas fácilmente mediante sus correspondientes coordenadas cartesianas C(i, j). La forma rectangular de esta distribución, similar al formato de una imagen, permite asociar fácilmente las celdas de la red a los píxeles de la imagen, lo que propicia que sea la topología más utilizada en procesamiento de imágenes.

En la arquitectura estándar de las redes CNN, la vecindad de las celdas se define mediante la expresión (2r+1)×(2r+1), cuya representación gráfica coincide con un cuadrado de lado 2r + 1 centrado en la celda C(i, j), siendo r el radio de vecindad de la celda. En la figura 1.1-a se muestra la arquitectura estándar de

1.1 Introducción a las redes CNN 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Figura 1.2: Distribución estándar de una red CNN de M×N celdas. la red CNN para un radio de vecindad r = 1. En dicha figura se observa como las celdas se conectan a sus 8 vecinas de alrededor para dar lugar a una ventana de vecindad de tamaño 3×3. Para un radio de vecindad r = 2 (celda central de la figura 1.1-e), las celdas se conectan con sus 24 vecinas obteniéndose una ventana de tamaño 5×5. De forma general, para un radio de vecindad r dado, el conjunto de celdas que forman vecindad con la celda C(i, j) vendrá definido por la expresión siguiente.

Nr(i, j) = {C(k, l)| max (|k − i| , |l − j|) ≤ r} , ∀ 1≤k≤M1≤l≤N (1.1)

Una caso particular es cuando el radio de vecindad de la red CNN es mayor o igual al tamaño de la propia red (r ≥ M/2, suponiendo redes cuadradas M = N). En ese caso todas las celdas de la red estarán interconectadas entre sí, lo que da lugar a redes CNN completamente conectadas. En esta situación, la interconexión de las redes CNN coincide con el esquema de las redes clásicas de Hopfield y, por tanto, la implementación hardware resulta más costosa y difícil de realizar. En estas circunstancias el número de líneas de conexionado crece exponencialmente con el tamaño de la red y la dificultad de realizar redes de gran tamaño aumenta considerablemente. A pesar de este inconveniente, hay que indicar que existen implementaciones físicas de estas redes, entre las que destaca el chip comercial ETANN (Intel, 1991) fabricado por Intel, que integra una red de Hopfield de 64 neuronas con un total de 10.240 conexiones sinápticas.

Es interesante destacar que las interacciones que se producen en el interior de las redes CNN, entre sus celdas, no dependen ni del tamaño de la red ni de la posición de las celdas en su interior. Dichas interacciones dependen principalmente

de una matriz de pesos, denominada matriz de coeficientes o plantilla (template en ingles), que determina la intensidad de las conexiones sinápticas entre las celdas y la propagación de la información a lo largo de la red. De forma equivalente a como sucede en las conexiones sinápticas de las redes neuronales biológicas, los elementos de esta matriz establecen la contribución de cada entrada en la respuesta de la celda y determina la fuerza con la que se conectan las celdas entre sí. Para caracterizar los pesos de la redes CNN suelen utilizarse algoritmos de entrenamiento o conjuntos de reglas locales cuyo objetivo es determinar los estados de equilibrio internos de las celdas para una serie de entradas y salidas dadas.

En un esquema tradicional, como el mostrado en la figura 1.3, las celdas de una red CNN pueden clasificarse en función de la posición que ocupan dentro de la red. Se denomina celda regular a aquella que está completamente rodeada por otras o que se encuentra completamente interconectada. Por el contrario, si la celda está parcialmente conectada o no está completamente rodeada se denomina celda frontera. Un caso particular de celda frontera, denomina celda esquina, es cuando la celda está situada en algunos de los vértices de la red.

Celda regular Celda frontera Celda esquina Celda virtual

Figura 1.3: Clasificación de las celdas de una red CNN en función de su posición. Ejemplo para el caso de una red de tamaño 7×7 y radio de vecindad r = 1.

Según la definición de la sección 1.1, una red CNN no quedará completamente definida hasta que no se especifiquen las condiciones de su contorno. Para ello es necesario desarrollar un mecanismo que proporcione información a las entradas

1.1 Introducción a las redes CNN 7 no conectadas de las celdas fronteras. Este mecanismo se construye a partir de celdas virtuales, no implementadas físicamente, cuya única misión es recrear las condiciones de contorno de la red CNN. Es importante resaltar la importancia de las condiciones de contorno de las redes CNN debido a que, en virtud del efecto de propagación de la información, su valor podrá afectar de manera importante al comportamiento global de la red (P., 1993; Mirzai B., 1998). Las condiciones de contorno más utilizadas por la redes CNN son las siguientes (ver figura 1.4):

Condiciones de contorno fija (o contorno Dirichlet). Esta condición establece un valor fijo (habitualmente a cero) para las entradas de las celdas frontera.

Condiciones de contorno de flujo cero (o contorno Neumann). En este caso las celdas fronteras y las celdas virtuales comparten las mismas entradas y salidas.

Condiciones de contorno periódicas (o contorno toroidal). La red se pliega formando un cilindro, uniéndose las celdas frontera de posiciones simétricas, y a continuación los extremos del cilindro se unen para formar un anillo con forma toroidal.

(a) (b) (c)

Figura 1.4: Condiciones de contorno típicas. a) Condiciones de contorno Dirichlet. b) Condiciones de contorno Neuman. c) Condiciones de contorno toroidal.

In document Diseño e implementación sobre hardware reconfigurable de una arquitectura para la emulación en tiempo real de redes neuronales celulares (página 47-52)