• No se han encontrado resultados

Secuencia Tiempo de VidaProteína

6.3 Procesado de Información

6.3.2 Pruebas de Procesado

6.3.2.2. Problema de Clasificación de las Flores de Iris

6.3.2.2.1 Clasificación con Todos los Patrones

En la primera de las pruebas efectuadas con el sistema se busca presentar los patrones en la entrada del sistema y que una célula decida a que tipo pertenece el patrón deseado. Para esto el sistema se configuró como se muestra en la Tabla 6.19.

Figura 6.17: Configuración del entorno para la prueba de clasificación de flores Iris

Para la ejecución de las pruebas para el cálculo del valor de ajuste, además se configuró el entorno como se muestra en la Figura 6.17. En una de las posiciones se establecen 4 fuentes que emitirán una proteína distinta cada una de ellas. Cada una de estas proteínas identifica una de las mediciones mencionadas en el apartado 6.3.2.2. Las 4

fuentes han sido colocadas en la misma posición que está marcada con una F. Además también se situó una célula en el centro en la posición marcada con una C y un sumidero posicionado en la S para realizar la lectura de la salida tras 10 ciclos celulares.

Como se explica en el apartado 5.9.2 del presente documento, el modelo de comunicación utilizado está basado en una función, la cual establece la probabilidad de recibir una proteína del tipo emitido teniendo en cuenta el punto de emisión y la distancia a la que se encuentra el punto receptor. Esa probabilidad decrece con la distancia desde un valor máximo. Teniendo esto en cuenta para las fuentes del problema, se establece el valor máximo de la probabilidad desde las fuentes como el valor máximo normalizado de la variable en cuestión. Así, ante un valor más elevado en una determinada proteína las células tendrán más probabilidades de capturar proteínas de ese tipo. Por tanto, los valores de las mediciones para las cuatro variables de la flor Iris han sido normalizados entre 0 y 1. Esos valores normalizados se establecen para cada una de las fuentes como la probabilidad máxima durante los 10 ciclos antes de la lectura de la salida en el sumidero para un patrón determinado. Comentar además que, tanto el entorno, como el citoplasma de la célula, se vacían de proteínas tras cada patrón para no interferir en los resultados del siguiente.

Por tanto, por lo comentado anteriormente, está claro que hay que identificar 7 secuencias, 4 para representar las entradas y 3 para las salidas deseadas. En concreto en los ejemplos que se muestran se identificaron como:

Longitud de sépalo: 0001 Ancho de sépalo: 0010

Longitud de pétalo: 0100 Ancho de pétalo: 1000 Tipo Iris Setosa: 1111 Tipo Iris Versicolor: 1001 Tipo Iris Virgínica: 1010

Finalmente para la configuración del sistema queda por fijar la función de ajuste. Para realizar el cálculo del error de un patrón se establecen los valores de entrada en las fuentes y, tras 10 ciclos celulares, se leen en el sumidero las proteínas recibidas. Con estas proteínas se crea una lista ordenada según su concentración. Esta lista se utiliza para determinar la posición que ocupa la proteína deseada para el patrón. Esta posición marcará el valor del error que ese patrón aportará al error total, que constituirá el valor de ajuste del ADN.

( )

fitness

f i

i

Valor de f(i) Cuando se aplica

0 La proteína deseada es la 1ª de la lista ordenada de proteínas recibidas 0,5 La proteína deseada es la 2ª de la lista ordenada de proteínas recibidas 0,75 La proteína deseada es la 3ª de la lista ordenada de proteínas recibidas 0,85 La proteína deseada está en la lista ordenada de proteínas recibidas

1 La proteína deseada no figura entre las recibidas 10 No se ha recibido ninguna proteína en el sumidero

El ajuste de un ADN se mide utilizando la Eq. 6.3. Esta función representa la suma de los errores para cada patrón i del conjunto, donde el error de cada patrón se calcula con la función f(i). Dicha función f(i), tal cual como se comentó antes, utiliza la lista ordenada de concentraciones de proteínas recibidas en el sumidero. Según la posición que ocupa en dicha lista la proteína deseada para cada patrón se añade un error como muestra la Eq. 6.3. Comentar que los valores de f(i) han sido hallados de manera empírica para este problema concreto. Finalmente comentar que se han establecido dos casos extra. El primero le asigna un error 1 al patrón si ninguna de las proteínas recibidas en el sumidero es la proteína deseada. El segundo establece un valor de penalización de 10 si, para un patrón, la célula no emite ninguna respuesta.

Con esta configuración el sistema halló la solución que se muestra en la Figura 6.18 y cuyo desglose de aciertos se muestra en la Tabla 6.22. En concreto, en la citada figura se muestra en la izquierda el conjunto de patrones acertados y en la derecha el conjunto de patrones que se han clasificado incorrectamente.

Tabla 6.22: Desglose de aciertos del sistema celular por los distintos tipos

Tipo Número Total Aciertos

Iris Setosa: 1111(*) 50 50

Iris Versicolor: 1001 (+) 50 46

Iris Virgínica: 1010(□) 50 44

Comentar que el sistema ha sido capaz de clasificar 139 patrones de 150 lo que supone un 92.67% del total. La Figura 6.18 muestra además los patrones clasificados por la

longitud del sépalo y el ancho del pétalo. Se realiza la representación de esta manera para facilitar el visionado de los patrones. La razón para escoger estas dos características es que estudios previos (Rivero 2007) han demostrado que estos son los dos parámetros más influyentes en la clasificación y, por tanto, son una referencia para la representación. Como se puede ver la clasificación se hace correctamente excepto en aquella zona en que dos de las clases entran en conflicto, donde ocurren algunos errores.

Figura 6.18: Clasificación de las flores Iris. A la izquierda los aciertos y a la derecha los fallos.

Finalmente, comentar que para estos resultados el individuo hallado utilizó 483 secciones del algoritmo genético (ver el punto 5.10.1) para codificar 108 genes. Comentar que estos resultados parecen bastante satisfactorios si se tiene en cuenta que se ha utilizado un solo elemento de procesado (célula).

Como conclusiones de esta prueba se puede extraer que:

El sistema es apto para resolver problemas de clasificación de patrones con características similares a las del problema de las flores Iris.

P e ta l W id th Sepal Lenght P e ta l W id th Sepal Lenght * Setosa +Versicolor □ Virgínica

Los resultados que se observan con un único elemento de procesado son esperanzadores para que, con más elementos, se muestre un mejor comportamiento