Matriz de Confusi´ on - Clasificaci´ on y Validaci´ on

2. Marco Te´ orico 11

2.8. Clasificaci´ on y Validaci´ on

2.8.4. Matriz de Confusi´ on

La matriz de confusión es una herramienta muy útil dentro de los problemas de cla- sificación, es una de las métricas más intuitivas y sencillas, esta herramienta nos permite ver de manera gráfica el desenvolvimiento de un algoritmo determinado y se utiliza para los problemas de clasificación donde la salida puede ser de dos o más tipos de clases.

2.8.4.1. Matriz de Confusi´on Binaria

La forma m´as representativa de mostrar una matriz de confusi´on es el caso binario, en donde las filas corresponden a la clase verdadera y las columnas a la clase predicha, esta estructura la podemos observar en el Cuadro 2.3 [RG16].

Clase Predecida Positivo (1) Negativo (0) Clase

Verdadera Positivo (1) TP FN

Negativo (0) FP TN

Cuadro 2.3: Matriz de confusi´on binaria.

D´onde:

Verdaderos Positivos (True Positives - TP) – Son los casos en los que los datos reales son 1 (Verdadero) y la predicci´on tambi´en es 1 (Verdadero).

Verdaderos Negativos (True Negatives - TN) – Son los casos en los que los datos reales son 0 (Falso) y la predicci´on tambi´en es 0 (Falso).

Falsos Positivos (False Positives - FP) – Son los casos en los que los datos reales indica que es 0 (Falso) y la predicción indica que es 1 (Verdadero), es decir la predicción ha sido errónea.

Falso Negativo (False Negatives - FN) – Son los casos en los que los datos reales son 1 (Verdadero) y la predicci´on tambi´en es 1 (verdadero).

La matriz de confusi´on para problemas binarios se puede resumir en estos cuatro valores, de manera ideal se desea que el modelo de 0 falsos positivos y 0 falsos negativos, sin embargo, esto no se da el la vida real y cualquier modelo no tiene un acierto del 100 % [RG16].

2.8.4.2. Matriz de Confusi´on de m´as de Dos Clases

La matriz de confusión también se puede aplicar a un problema de clasificación de más de dos clases. Por ejemplo, si tenemos k número de clases la matriz de confusión deberá tener k filas y k columnas, de manera visual nos permitirá ver que tan bien funciona el algoritmo o que tan mal funciona [RG16].

Al tener los resultados representados gráficamente es bastante sencillo extraer infor- mación útil. Por ejemplo, los valores altos en la diagonal principal, nos indica en general

que el clasificador est´a funcionando bastante bien.

Los elementos altos fuera de la diagonal principal nos informan acerca de errores que están relacionados regularmente con las muestras, este análisis no solo nos permite descu- brir donde se están cometiendo errores, sino que también proporcionan sugerencias sobre cómo mejorar el rendimiento (ignorar algunas muestras, mejorar su calidad, sustituirlas, etc) [RG16].

1 2 3 4 5

Clase predecida (y) 1

Clase Verdadera (y)

1 1

1 4

C

4 i j

Figura 2.8: Matriz de connfusi´on para 5 clases.

Por ejemplo en la Figura 2.8 se muestra un ejemplo de matriz de confusi´on de 5 clases, d´onde cada clase tiene 4 muestras, los elementos de la diagonal principal de color azul re- presenta el 100 % de acierto para las clases 1,2,3 ; mientras que en la clase 4 una muestra se confunde con la clase 5;yen el caso de la clase 5, tiene 0 % de acierto, 2 de sus muestras se confunde con la clase 4, 1 muestra con la clase 2 y finalmente 1 muestra con la clase 3.

Es posible obtener una estima de la probabilidad (Ecuación 2.25) condicionada de decidirDi cuando la clase verdadera esHj a partir de la matriz de confusión de la Figura 2.8, las estimas de estas probabilidades se pueden ver en la Ecuación 2.26.

P_ij =Pb(D_i|H_j) = Cij

iC_ij (2.25)

Pb(D|H) =







1 0 0 0 0

0 1 0 0 0

0 0 1 0 0

0 0 0 1 1/4

0 1/4 1/4 2/4 0







(2.26)

Cap´ıtulo 3

Estado del Arte

Existen diversas investigaciones relacionados al desarrollo de hardware de bajo costo y utilización de algoritmos para segmentar patrones de venas en imágenes capturadas en el espectro infrarrojo cercano, sin embargo, muchas de estas investigaciones relacionan software y hardware, pero a un nivel simple, mientras que otras se centran solo en software, pero utilizando métodos tradicionales. Además, de acuerdo a las diversas investigaciones revisadas en esta Sección, el método de SC propuesto para la extracción de caracter´ısticas, no ha sido aplicado a la tarea de extraer los patrones de venas, por tanto la propuesta del presente trabajo innova, incluye y relaciona SC (como métodos del aprendizaje máquina) para potenciar los resultados en contraste con los métodos anteriormente propuestos.

3.1. Seguridad

Existen algunos art´ıculos, donde tratan trabajos de seguridad como por ejemplo el del reconocimiento de rostros heterogéneos que se utiliza en el sector forense, seguridad y comercial; sin embargo, este reconocimiento de rostros heterogéneos presenta problemas desafiantes, para ello proponen una red neuronal convolucional para mejorar las caracter´ısticas de las imágenes faciales a través del infrarrojo cercano, finalmente los resultados son alentadores, por tanto se alienta en investigar para una mayor precisión en espacios del espectro infrarrojo cercano [HWST18].

Otro trabajo que se vio respecto a seguridad, es la identificación de personas basado en imágenes de sus iris, donde se resalta el hecho de que los sistemas de seguridad basados en biometr´ıa para la autentificación se están convirtiendo en la opción preferida para reemplazar los sistemas basados en contraseñas, sin embargo esta opción biométrica es costosa [SHI17].

Las venas de los dedos siempre han tenido una especial atención por los sistemas de seguridad biométricos, se propone extraer la región de interés especialmente del área entre las falanges [YWS19], luego se utiliza un filtro de Gabor para mejorar la visualización de las venas, posteriormente para el reconocimiento de venas se propuso el Modelo Jerárquico de Hiperesfera (HHsM), el cuál fue realmente convincente para manejar los problemas de reconocimiento de venas en los dedos. El sistema propuesto no utiliza técnica alguna de reducción de caracter´ısticas.

En la actualidad existen sistemas de seguridad implementados en tel´efonos m´oviles y

otros dispositivos, pero son vulnerables en el sentido de que pones una foto del usuario, la cual la podr´ıas sacar de su red social y ponerla en frente del dispositivo para de esa forma burlar la supuesta seguridad con esa foto estática. El enfoque que se propone es de utilizar la captura de imágenes del iris en el espectro infrarrojo cercano, para después utilizar clasificadores como Haar Cascade y LBP (del inglés, Local Binary Patterns ), para que una vez capturada la imagen, dicha información sea guardada en un data del tipo QR, el cual sirve como un identificador único de cada persona [SHI17].

3.2. Infrarrojo Cercano en Tejidos y Venas

Respecto al estudio del infrarrojo cercano en tejidos, para medir la propagación de luz desde una fuente y el detector humano colocado en un tejido determinado se pueden usar tecnolog´ıas analógicas y digitales, se resalta que los tejidos del cuerpo son altamente dispersantes con una distancia media, la longitud usada es de 700 nm a 850 nm, donde se enfatiza que la mayor parte de absorción de la energ´ıa se debe principalmente al 5 % - 10 % del volumen de tejido ocupado por la sangre [CCG⁺98]. También, la utilización del infrarrojo cercano está basado en el grado de absorción de un componente de la sangre llamado desoxihemoglobina, la cual cambia de estado al estar expuesto a longitudes de onda infrarroja, se habla de una ventana espectral que se extiende desde los 700nma los 900nm donde la luz infrarroja ingresa profundamente hasta llegar a tejidos e inclusive a los vasos de la sangre ubicados en capas más profundas de la piel, dichos cambios pueden llegar a ser captados por cámaras infrarrojas [FF02], además de esto se requiere de dispositivos que permitan realizar este procedimiento, es decir que detecten la estructura venosa [GUC⁺08].

Sin embargo, existen en la parte de hardware intentos por crear dispositivos de bajo coste para captar imágenes infrarrojas [NS10]. Finalmente, uno de los puntos más resaltantes es la inmunidad a la falsificación, debido a que las venas de los dedos que se encuentran debajo de la superficie de la piel, traen consigo un determinado patrón, el cual, de acuerdo a los investigadores, es muy dif´ıcil de duplicar en la vida práctica [YSW11].

Debemos indicar que el tipo de imágenes médicas tales como regiones de venas o determinados tejidos suelen presentar vac´ıos o regiones en la que es complicado ver las venas o reconocerlas, para ello existen métodos como el k-means que podr´ıan ayudar a resaltar la imagen, el k-means es un método de agrupamiento que usa una distancia euclidiana entre diferentes puntos a lo largo de un espacio bajo ciertas condiciones, sin embargo, dicha distancia en p´ıxeles no funciona en imágenes complejas, es por ello que se le considera un algoritmo de cuantización robusto [XGF16]. Sin embargo, en otras aplicaciones el k-means combinado con GMM (del inglés, Gaussian Mixture Model) hace que la agrupación robusta delk-means se vea potenciada al combinarlo con GMM [TZG17].

Sin embargo, dichos métodos basados en k-means y GMM, tienen la desventaja de trabajar directamente sobre los datos sensoriales. Además del k-means también se vio la técnica de PCA, el cual básicamente realiza una transformación l´ıneal de datos en un sistema de coordenadas nuevo, su objetivo es de reducir el número de variables de los datos de entrada, con el detalle de preservar la mayor cantidad de información disponible [Bis06].

3.3. Identificaci´ on Biom´ etrica y Reconocimiento de Patro- nes

La mayor´ıa de sistemas de identificación biométrica están basados en una sola caracter´ıstica, sin embargo, existen otras caracter´ısticas con patrones únicos que podr´ıan combinarse para mejorar el rendimiento de estos sistemas de identificación, por ejemplo en [SYW⁺19] se propone un sistema biométrico multimodal, donde se aprovechan dos ventajas de patrones únicos, el reconocimiento de venas en los dedos y el electrocardiograma. En el reconocimiento de venas se plantea utilizar un Patrón Binario Local para cada usuario, este patrón es el producto de la relación entre el centro de cada pixel y sus vecinos cercanos a los cuales se les asigna valores binarios, para luego compararlos con la intensidad del pixel central, el vector final será el producto de concatenar esos números binarios, el histograma de este vector final nos dará un patrón único para cada usuario.

Comparando un sistema uni-biométrico con uno multi-biométrico, este último fusiona múltiples caracter´ısticas biométricas [YWH⁺18], al realizar esta fusión se puede mejorar la precisión de reconocimiento en sistemas de seguridad, se propone fusionar información de la huella digital y del patrón de venas en los dedos, para la huella digital a través del método de minucias que finalmente será representado por un vector lógico y para el patrón de venas en los dedos, extrayendo la Región de Interés (ROI), luego a esta región se le aplica un filtro de Gabor y un análisis discriminativo lineal, los resultados de ambos procedimientos se guardan en un vector, a partir de este vector se maximizan las variaciones entre clases y se minimizan las variaciones dentro de la misma clase, posteriormente se utiliza la Transformada de Fourier Discreta Parcial Mejorada (EP-DFT) para combinar las caracter´ısticas de la huella digital y de las venas en los dedos, al aplicar estos procedimientos finalmente se demostró que muestran un alto rendimiento, mejorando el reconocimiento dentro de los sistemas de seguridad, que abre la posibilidad de aplicarlo a sistemas biométricos que podr´ıan combinar más caracter´ısticas para mejorar aún más los sistemas de reconocimiento biométricos basados en múltiples caracter´ısticas.

Las técnicas para reconocer patrones de venas en los dedos tienen el problema que la luz infrarroja se atenúa en los tejidos y la imagen de las venas en los dedos se ve degradada, lo cual perjudica inevitablemente el reconocimiento de las venas, se propone un simple pero efectivo método de eliminación de dispersión para mejorar la visualización de las venas, primero utilizan una serie de diferentes filtros de Gabor y finalmente se usa una estrategia de correlación de una fase para medir la similitud con la imagen mejorada, los resultados muestran que este método propuesto es efectivo y de confianza en el mejoramiento y restauración de imágenes de venas en los dedos [YS14].

Gupta and Gupta [GG15] en el año 2015, plantean realizar diversas etapas para la extracción de ROI, y extracción de caracter´ısticas, para que todas estas aproximaciones de forma conjunta representen una caracter´ıstica única para cada usuario, se obtiene un error de 4.47 % utilizando diferencia de suma de cuadrados, sin embargo estas perspectivas solo son válidas en imágenes uniformes, y condiciones controladas.

3.4. M´ etodos de Agrupamiento y Clasificaci´ on

Uno de los atributos biométricos con mayor robustez es el patrón único que descri- ben las venas, y sobre todo si son capturadas en el espectro infrarrojo, sin embargo, las grandes cantidades de patrones de venas podr´ıan hacer que en determinadas zonas se con- fundan unas con otras, es por eso que se prueban los modelos de diferentes esquemas de agrupamiento, como por ejemplo k-means yk-medois [RSB15].

En la actualidad, existen métodos basados en clustering sobre variables latentes. Entre ellos los métodos del estado del arte utilizan las representaciones latentes obtenidas luego de entrenar máquinas profundas [AGSC18, LUZ17]. En ellos se aprovecha el hecho de que las representaciones son altamente no lineales y tienden a estar más separados entre grupos o clases existentes en los datos [LKB⁺17, Kri16]. Esto es aprovechado por méto- dos de clustering (k-means ó Spectral Clustering). Una desventaja de utilizar máquinas profundas es de que necesitan un gran número de muestras para ser entrenadas y evitar el sobreajuste (esto por el gran número de parámetros de este tipo de máquinas). Por ello, dado las restricciones de nuestras bases de datos, en cuanto al bajo número de muestras, es que optaremos por el estudio de métodos de clustering en la etapa de extracción de caracter´ısticas para alimentar un clasificador.

Por ejemplo Wu and Liu propone combinar (PCA) y linear discriminant analysis por sus siglas en inglés Linear Discriminant Analysis(LDA) [WL11b, WL11a], y para la etapa de clasificación Máquina de Vectores de Soporte por sus siglas en inglés Support Vector Machine (SVM), obteniendo una tasa de acierto del 98 %, sin embargo su toma de datos fue bastante controlado, para que la calidad del ROI no se vea afectado, por tanto esto no se asemeja a condiciones reales y quedar´ıa sujeto a la toma de datos con un dispositivo espec´ıfico, lo cual no es práctico.

Los sistemas basados en patrones de venas en los dedos, para la identificación de usuarios han tenido éxito en muchas aplicaciones, sin embargo, al tratarse de base de datos grandes, esto sistemas no son muy eficientes, es por ello que se usa dos etapas para la clasificación, la primera basada en k-means y la segunda basa la clasificación en las Maquinas de Vector de Soporte [TYSX13].

La identificación eficiente de las venas es un desaf´ıo constante, sin embargo, este proceso requiere de un alto coste computacional, una solución a ello es los algoritmos de Hashing que son altamente efectivos, se utilizó el esquema de Preservación de Afinidad k-means Hashing (APKMH) para aliviar este coste computacional, demostrando finalmente ser superior frente a otros métodos del estado del arte [SYYY17].

La función superp´ıxeles esta basada en k-means, que combina cinco métodos que no son mencionados, sus fortalezas son adherirse a los l´ımites de la imagen, velocidad, eficiencia de memoria y su impacto cómo método de segmentación [ASS⁺12].

SC se ha convertido en uno de los algoritmos de agrupamiento moderno más populares, es fácil de implementar, puede resolver de manera eficiente mediante conceptos de algebra lineal estándar y frecuentemente supera a los algoritmos de agrupamiento tradicionales, como el algoritmo k-means [VL07].

unicos, el reconocimiento de venas en los dedos y la informaci´on del electrocardiograma (ECG), al combinar estas dos perspectivas finalmente se obtiene un error rate de 0.14 %.

Pero al utilizar las venas de los dedos se obtiene un error de 3.78 %, por tanto a pesar de que combinando caracter´ısticas se busque mejorar la tasa de acierto vemos que en la etapa de extracci´on de caracter´ısticas aun falta mejorar, lo cual se pretende hacerlo con Agrupamiento Espectral.

El Agrupamiento Espectral en los últimos años se ha convertido es una de las herra- mientas más apropiada en la investigación para realizar tareas de agrupamiento, uno de los retos más comunes es la segmentación de imágenes. La escalabilidad es una de sus des- ventajas, ya que segmentar imágenes demasiado grandes puede ser imposible de realizar.

Sin embargo, una opción simple es el de reducir el tamaño de la imágen pero si realizamos tal procedimiento entonces esto causar´ıa pérdida de detalles. Nuestra propuesta es utilizar Agrupamiento Espectral como una combinación de procesamiento por bloques, esto hace que las demandas de coste computacional bajen considerablemente [XG, VL07, TWC10].

3.5. Conclusiones y Apreciaciones finales

Según la literatura revisada, en la actualidad las diversas caracter´ısticas o señales biométricas es un área de constante investigación, en especial la utilización de imáge- nes infrarrojas de los dedos permite habilitar un grado más de seguridad, debido a su alta fiabilidad, facilidad de uso, prevención de ataques, aceptación de la población y estabilidad, debido a que es poco probable falsificar las imágenes infrarrojas de los dedos.

Algoritmos como el SC, han demostrado tener un buen desempe˜no para agrupar datos del mismo tipo, en im´agenes que no son patrones de venas. Por ello se justifica el uso de este algoritmo para agrupar p´ıxeles de venas en dedos captadas en el espectro infrarrojo.

Muchos de los datos (entre ellos imágenes) resultantes son de gran tamaño, por tanto, es necesario utilizar métodos de reducción de dimensionalidad para optimizar el coste computacional.

La utilización de aprendizaje automático o máquinas automáticas permiten reconocer patrones en los datos de modo tal que puedan clasificarse automáticamente las imágenes o muestras.

In document FACULTAD DE INGENIERÍA Y COMPUTACI ÓN DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTR ÓNICA Escuela Profesional de Ingenier´ıa Electrónica y de Telecomunicaciones (página 34-38)