• No se han encontrado resultados

RECONOCIMIENTO DE PATRONES INTRODUCCIÓN AL RECONOCIMIENTO DE PATRONES

Introducción y campos de aplicación.

El reconocimiento de patrones es la ciencia que se encarga de la descripción y clasificación (reconocimiento) de objetos, personas, señales, representaciones, etc. Si bien el margen de aplicaciones es muy amplio las más importantes estan relacionados con la visión y audición por parte de una máquina, de una forma análoga a los seres humanos.

Algunos ejemplos de los campos relacionados son:

 Reconocimiento de caracteres: a partir de un texto impreso o manuscrito, se genera un fichero que contiene los caracteres presentes en el texto. Esta aplicación resulta útil en sistemas de lectura de textos (añadiendo un conversor texto-voz), lectura de etiquetas, clasificación automática de cartas en función de código postal, lectura de matriculas de Vehículos, etc.

 Aplicaciones industriales: controles de calidad, detección y clasificación de piezas defectuosas en líneas de producción.

 Cartografía: realización automática de mapas a partir de fotografías de satélites, medida de distancias de carretera.

 Aplicaciones médicas: detección de tumores a partir de imágenes médicas (radiografías ecografías, etc.), recuento de células sanguíneas, espermatozoides, etc., medidas de tamaño y forma de órganos, análisis de cromosomas.

 Guiado de Vehículo: detección de obstáculos, destinos, etc. para modificar la trayectoria del vehículo guiado de forma adecuado.

 Reconocimiento automático del habla: consiste en la trascripción de un mensaje

hablado a su grafía. Entre las posibles aplicaciones cabe citar el dictado de textos al ordenador, de forma que no sea necesario tecleara, la elección mediante la voz entre varias posibilidades en un servidor de audiotext por teléfono.

 Reconocimiento biométrico de personas: consiste en asignar la identidad de un

individuo, o verificar si es quien dice ser, a partir de la medida de algunas características propias de la persona, como su voz, cara, manos, huellas, iris, firma, etc.

Algunas de estas aplicaciones no se consideran estrictamente reconocimiento de patrones, pero en mayor o menor medida están relacionadas.

Página 43 Dificultad intrínseca del reconocimiento de patrones.

En cierta manera, el conocimiento de los mecanismos llevados a cabo por los humanos para reconocer objetos dentro de una imagen o identificar personas, es de utilidad a la hora de implementar sistemas automáticos mediante el ordenador, puesto que este podrá emular los procesos llevados a cabo por las personas. Sin embargo, en muchos casos, la comprensión de dichos mecanismos no es trivial. Por ejemplo, en la mayoría de culturas, el reconocimiento de personas u objetos en fotografías no presentan gran dificultad, siempre y cuando los elementos representados sean previamente conocidos por el observador.

Tareas que a primera vista nos parecen extremadamente triviales por estar acostumbradas a realizarlas de forma natural multitud de veces al día, en realidad son habilidades extremadamente complicadas que el hombre ha aprendido a realizar a lo largo de su infancia.

El éxito de la automatización de tareas mediante máquinas no siempre ha radicado en copiar a la naturaleza. En este sentido, resulta paradigmático que todos los intentos del hombre por conseguir volar, fracasaran al tratar de imitar el vuelo de las aves.

Aproximaciones al reconocimiento de patrones.

Existen tres aproximaciones principales de reconocimiento de patrones: 1.-Reconocimiento estadístico de patrones (o teoría de decisión).

2.-Reconocimiento de patrones (o estructural). 3.-Reconocimiento basado en redes neuronales.

Además, es posible formular métodos que combinen varias de estas tecnologías, y que den lugar a sistemas híbridos de reconocimiento. En las aproximaciones 1 y 3 suele distinguirse un proceso de entrenamiento(o aprendizaje) y un proceso de clasificación (o test), de forma que inicialmente es necesario disponer de una serie de “ejemplos” de

cada una de las clases posibles, denominada secuencia de vectores de entrenamiento. A partir de ella se realiza una extracción y selección de características, y se entrena o ajusta un clasificador para que puedas realizar la tarea de asignar patrones de entada a una de las clases posibles.

Para evaluar la bondad del clasificador será necesario disponer de muestras pertenecientes a cada una de las clases que no hayan sido utilizadas en el proceso de entrenamiento o ajuste del sistema. A partir del conteo de aciertos y errores se extraerán las tasas de reconocimiento, y podrá evaluarse el clasificador.

Por otra parte, el reconocimiento del clasificador está relacionado con otros campos, tales como:

 Tratamiento de voz e imagen, visión artificial, etc.

 Inteligencia artificial.

 Redes Neuronales.

 Gramáticas formales.

Página 44

Para implementar un sistema de reconocimiento de patrones, suele usarse un método fuertemente dependiente de las características del problema, de forma que resulta difícil formular una solución generalista válida para una amplia casuística.

Esquema general de un sistema de reconocimiento de patrones.

El esquema de un sistema de reconocimiento de patrones consta de varias etapas relacionadas entre sí. La figura siguiente muestra el esquema genérico de un sistema capaz de clasificar señales u objetos de entrada en una de las clases predefinidas. Para ellos deberá analizar un cierto número de características. Por ejemplo, pero, dimensiones, etc. CAPTACIÓN (Sensor/transductor) PREPROCESADOS (Mejora) SEGMENTACIÓN EXTRACCIÓN DE CARACTERÍSTICAS CLASIFICADOR MUNDO REAL DESCRIPCIÓN

Para poder clasificar satisfactoriamente señales de entrada será necesario un proceso de aprendizaje en el cual el sistema creará un modelo de cada una de las clases a partir de una secuencia de entrenamiento o conjunto de vectores de características de cada una de las clases. Generalmente se acepta que la secuencia de muestras de entrenamiento debe contener, para cada una de las clases, un mínimo de elementos igual a diez veces la dimensión de los vectores de características. Si la secuencia de entrenamiento contiene suficientes elementos representativos de las distintas realizaciones de una misma clase, el sistema será capaz de reconocer patrones de entrada que no sean estrictamente iguales a los usados en el proceso de entrenamiento. Este concepto recibe el nombre de capacidad de generalización.

Por otra parte, existen algoritmos de aprendizaje no supervisado en los cuales no resulta necesario conocer a qué clase pertenece cada uno de los patrones de la secuencia de entrenamiento.

Página 45

En el análisis de imágenes, los principales factores de variabilidad entre patrones de una misma clase son:

 Ruido: frecuentemente las medidas del mundo real están alteradas por ruido del

propio sensor y del entorno. En algunos casos la captación del mundo real no se realizará con el mismo dispositivo.

 Variabilidad inherente: algunos patrones pertenecientes a una misma clase experimentan ciertas variaciones. En el caso de reconocimiento de individuo, cada uno de ellos constituirá una clase, y la variación será debida al envejecimiento, estado de salud, grado de bronceado de la piel, etc.

 Traslaciones: los objetos presentados no están siempre en la misma ubicación, sino que pueden estar en posiciones distintas. En muchos casos, un primer paso será la detección de la posición del objeto dentro de la escena.

 Rotaciones: aún estando en la misma posición, los objetos pueden haber girado

respecto a su centro, de tal manera que una comparación directa de los mapas de bits.

 Cambio de escala: dependiendo de la distancia del objeto de la cámara, posición

del zoom, etc., los objetos aparecen más grandes o más pequeños.

 Deformaciones: en algunos de los casos el objeto o persona puede aparecer deformado.

El sistema de reconocimiento de valores deberá de tener en cuenta las fuentes de variabilidad, ya sea incluyendo en la secuencia de entrenamiento patrones que hayan experimentado estas modificaciones, o realizando un proceso que compense la variabilidad.

Extracción de características.

Uno de los aspectos más importantes a tener en cuenta en un reconocedor de patrones es el tipo de parametrización a realizar sobre la señal de entrada.

En el caso de imágenes podrá usarse como vector de características la propia imagen (mapa de bits) de forma que P=m. Otra forma es usar una serie de medidas efectuados sobre la imagen en un proceso de extracción de características.

La parametrización proporciona innumerables ventajas entre las que cabe destacar básicamente dos:

 Una reducción del número de datos necesarios a procesar, tamaño de los modelos de los locutores.

 La transformación a un nuevo espacio de características en el cual es más fácil

Página 46

Adicionalmente la separabilidad entre las clases no depende únicamente de su distribución en el espacio de la señal, sino que viene condicionada por el tipo de clasificador a utilizar.

Selección de características.

La posibilidad de mantener un sistema de reconocimiento de patrones al eliminar algunas de las componentes de los vectores de características. Esta estrategia corresponde a la introducción de un bloque selector de características entre los bloques extractores de características.

Además de la mejora de la tasas de reconocimiento, la reducción de la dimensionalidad lleva asociada una disminución del coste computacional, cantidad de memoria necesaria para almacenar los modelos de cada una de la clases, etc. Sin embargo, debe presentarse especial atención a la evaluación de la consistencia en los resultados. Para ello, basta aplicarlos a otra base de datos o condiciones de desajunte. Si la mejora no se mantiene, indica que el procedimiento realizado está adaptado a las condiciones y datos de la prueba, por lo que no supone una mejora real. En este sentido es importante ser cuidadoso a la hora de desarrollar un sistema de reconocimiento, de forma que se utilicen señales de entrada diferentes a las usadas para evaluar los resultados, puesto que ésta será la situación normal de funcionamiento en su entorno real.

Para aliviar el coste computacional existen algoritmos de búsqueda. Se trata de algoritmos subóptimos, puesto que es posible que existan interacciones entre las distintas dimensiones, de tal manera que una determinada dirección únicamente resulta útil en combinación con otra.

A continuación se describen algunos algoritmos de selección de características.

SELECCIÓN SECUENCIAL HACIA DELANTE

Consiste en evaluar cada uno de los componentes por separado y elegir la que proporciona el mejor resultado. A partir de la primera, se va añadiendo una nueva dimensión en cada una de las sucesivas iteraciones del algoritmo, de entre las dimensiones restantes no seleccionadas todavía. El criterio para seleccionarla será el de obtener el máximo incremento en la tasa de clasificación.

ELIMINACIÓN SECUENCIAL HACIA ATRÁS.

A diferencia del anterior se parte de todas las dimensiones y se va eliminando una de cada iteración, hasta llegar al número de componentes deseadas. El algoritmo de eliminación proporciona mejores resultados, esto es debido a que conserva mejor aquellos conjuntos de características que individualmente no proporcionan una gran capacidad discriminativa, pero de forma conjunta sí.

REDES DE DIMENSIONALIDAD MEDIANTE REDES NEURONALES.

Para reducir la dimensión de los vectores de características es posible utilizar una red neuronal. Durante el proceso de entrenamiento, se presentarán a la red neuronal los vectores de características y se forzará el aprendizaje a la salida del mismo vector de entrada. Cuando la red neuronal ha sido entrenada, se presentan a la entrada los vectores a comprimir, y se obtiene la salida de la capa oculta intermedia.

Página 47

CLASIFICACIÓN BASADA EN CREAR FRONTERAS DE DECISIÓN.

Consiste en crear fronteras de decisión entre clases, a partir de la optimización de un determinado criterio de de error. Algunos clasificadores que pertenecen a este método pueden aproximarse de forma asintótica al clasificador Bayesiano. Durante el entrenamiento de este tipo de clasificadores, se minimiza un determinado criterio de error, como por ejemplo el error cuadrático medio entre los resultados proporcionados por el clasificador y los resultados deseados a la salida del clasificador.

Página 48 CAPÍTULO 6

REDES NEURONALES