2. Marco Te´ orico 11
2.8. Clasificaci´ on y Validaci´ on
2.8.4. Matriz de Confusi´ on
La matriz de confusi´on es una herramienta muy ´util dentro de los problemas de cla- sificaci´on, es una de las m´etricas m´as intuitivas y sencillas, esta herramienta nos permite ver de manera gr´afica el desenvolvimiento de un algoritmo determinado y se utiliza para los problemas de clasificaci´on donde la salida puede ser de dos o m´as tipos de clases.
2.8.4.1. Matriz de Confusi´on Binaria
La forma m´as representativa de mostrar una matriz de confusi´on es el caso binario, en donde las filas corresponden a la clase verdadera y las columnas a la clase predicha, esta estructura la podemos observar en el Cuadro 2.3 [RG16].
Clase Predecida Positivo (1) Negativo (0) Clase
Verdadera Positivo (1) TP FN
Negativo (0) FP TN
Cuadro 2.3: Matriz de confusi´on binaria.
D´onde:
Verdaderos Positivos (True Positives - TP) – Son los casos en los que los datos reales son 1 (Verdadero) y la predicci´on tambi´en es 1 (Verdadero).
Verdaderos Negativos (True Negatives - TN) – Son los casos en los que los datos reales son 0 (Falso) y la predicci´on tambi´en es 0 (Falso).
Falsos Positivos (False Positives - FP) – Son los casos en los que los datos reales indica que es 0 (Falso) y la predicci´on indica que es 1 (Verdadero), es decir la predicci´on ha sido err´onea.
Falso Negativo (False Negatives - FN) – Son los casos en los que los datos reales son 1 (Verdadero) y la predicci´on tambi´en es 1 (verdadero).
La matriz de confusi´on para problemas binarios se puede resumir en estos cuatro valores, de manera ideal se desea que el modelo de 0 falsos positivos y 0 falsos negativos, sin embargo, esto no se da el la vida real y cualquier modelo no tiene un acierto del 100 % [RG16].
2.8.4.2. Matriz de Confusi´on de m´as de Dos Clases
La matriz de confusi´on tambi´en se puede aplicar a un problema de clasificaci´on de m´as de dos clases. Por ejemplo, si tenemos k n´umero de clases la matriz de confusi´on deber´a tener k filas y k columnas, de manera visual nos permitir´a ver que tan bien funciona el algoritmo o que tan mal funciona [RG16].
Al tener los resultados representados gr´aficamente es bastante sencillo extraer infor- maci´on ´util. Por ejemplo, los valores altos en la diagonal principal, nos indica en general
que el clasificador est´a funcionando bastante bien.
Los elementos altos fuera de la diagonal principal nos informan acerca de errores que est´an relacionados regularmente con las muestras, este an´alisis no solo nos permite descu- brir donde se est´an cometiendo errores, sino que tambi´en proporcionan sugerencias sobre c´omo mejorar el rendimiento (ignorar algunas muestras, mejorar su calidad, sustituirlas, etc) [RG16].
1 2 3 4 5
Clase predecida (y) 1
2
3
4
5
Clase Verdadera (y)
1 1
3
2
1 4
4
C
4 i jFigura 2.8: Matriz de connfusi´on para 5 clases.
Por ejemplo en la Figura 2.8 se muestra un ejemplo de matriz de confusi´on de 5 clases, d´onde cada clase tiene 4 muestras, los elementos de la diagonal principal de color azul re- presenta el 100 % de acierto para las clases 1,2,3 ; mientras que en la clase 4 una muestra se confunde con la clase 5;yen el caso de la clase 5, tiene 0 % de acierto, 2 de sus muestras se confunde con la clase 4, 1 muestra con la clase 2 y finalmente 1 muestra con la clase 3.
Es posible obtener una estima de la probabilidad (Ecuaci´on 2.25) condicionada de decidirDi cuando la clase verdadera esHj a partir de la matriz de confusi´on de la Figura 2.8, las estimas de estas probabilidades se pueden ver en la Ecuaci´on 2.26.
Pij =Pb(Di|Hj) = Cij
P
iCij (2.25)
Pb(D|H) =
1 0 0 0 0
0 1 0 0 0
0 0 1 0 0
0 0 0 1 1/4
0 1/4 1/4 2/4 0
(2.26)
Cap´ıtulo 3
Estado del Arte
Existen diversas investigaciones relacionados al desarrollo de hardware de bajo costo y utilizaci´on de algoritmos para segmentar patrones de venas en im´agenes capturadas en el espectro infrarrojo cercano, sin embargo, muchas de estas investigaciones relacionan software y hardware, pero a un nivel simple, mientras que otras se centran solo en software, pero utilizando m´etodos tradicionales. Adem´as, de acuerdo a las diversas investigaciones revisadas en esta Secci´on, el m´etodo de SC propuesto para la extracci´on de caracter´ısticas, no ha sido aplicado a la tarea de extraer los patrones de venas, por tanto la propuesta del presente trabajo innova, incluye y relaciona SC (como m´etodos del aprendizaje m´aquina) para potenciar los resultados en contraste con los m´etodos anteriormente propuestos.
3.1. Seguridad
Existen algunos art´ıculos, donde tratan trabajos de seguridad como por ejemplo el del reconocimiento de rostros heterog´eneos que se utiliza en el sector forense, seguridad y comercial; sin embargo, este reconocimiento de rostros heterog´eneos presenta problemas desafiantes, para ello proponen una red neuronal convolucional para mejorar las carac- ter´ısticas de las im´agenes faciales a trav´es del infrarrojo cercano, finalmente los resultados son alentadores, por tanto se alienta en investigar para una mayor precisi´on en espacios del espectro infrarrojo cercano [HWST18].
Otro trabajo que se vio respecto a seguridad, es la identificaci´on de personas basado en im´agenes de sus iris, donde se resalta el hecho de que los sistemas de seguridad basados en biometr´ıa para la autentificaci´on se est´an convirtiendo en la opci´on preferida para reemplazar los sistemas basados en contrase˜nas, sin embargo esta opci´on biom´etrica es costosa [SHI17].
Las venas de los dedos siempre han tenido una especial atenci´on por los sistemas de seguridad biom´etricos, se propone extraer la regi´on de inter´es especialmente del ´area entre las falanges [YWS19], luego se utiliza un filtro de Gabor para mejorar la visualizaci´on de las venas, posteriormente para el reconocimiento de venas se propuso el Modelo Jer´arquico de Hiperesfera (HHsM), el cu´al fue realmente convincente para manejar los problemas de reconocimiento de venas en los dedos. El sistema propuesto no utiliza t´ecnica alguna de reducci´on de caracter´ısticas.
En la actualidad existen sistemas de seguridad implementados en tel´efonos m´oviles y
otros dispositivos, pero son vulnerables en el sentido de que pones una foto del usuario, la cual la podr´ıas sacar de su red social y ponerla en frente del dispositivo para de esa forma burlar la supuesta seguridad con esa foto est´atica. El enfoque que se propone es de utilizar la captura de im´agenes del iris en el espectro infrarrojo cercano, para despu´es utilizar clasificadores como Haar Cascade y LBP (del ingl´es, Local Binary Patterns ), para que una vez capturada la imagen, dicha informaci´on sea guardada en un data del tipo QR, el cual sirve como un identificador ´unico de cada persona [SHI17].
3.2. Infrarrojo Cercano en Tejidos y Venas
Respecto al estudio del infrarrojo cercano en tejidos, para medir la propagaci´on de luz desde una fuente y el detector humano colocado en un tejido determinado se pueden usar tecnolog´ıas anal´ogicas y digitales, se resalta que los tejidos del cuerpo son altamente dispersantes con una distancia media, la longitud usada es de 700 nm a 850 nm, donde se enfatiza que la mayor parte de absorci´on de la energ´ıa se debe principalmente al 5 % - 10 % del volumen de tejido ocupado por la sangre [CCG+98]. Tambi´en, la utilizaci´on del infrarrojo cercano est´a basado en el grado de absorci´on de un componente de la sangre llamado desoxihemoglobina, la cual cambia de estado al estar expuesto a longitudes de onda infrarroja, se habla de una ventana espectral que se extiende desde los 700nma los 900nm donde la luz infrarroja ingresa profundamente hasta llegar a tejidos e inclusive a los vasos de la sangre ubicados en capas m´as profundas de la piel, dichos cambios pueden llegar a ser captados por c´amaras infrarrojas [FF02], adem´as de esto se requiere de dispositivos que permitan realizar este procedimiento, es decir que detecten la estructura venosa [GUC+08].
Sin embargo, existen en la parte de hardware intentos por crear dispositivos de bajo coste para captar im´agenes infrarrojas [NS10]. Finalmente, uno de los puntos m´as resaltantes es la inmunidad a la falsificaci´on, debido a que las venas de los dedos que se encuentran debajo de la superficie de la piel, traen consigo un determinado patr´on, el cual, de acuerdo a los investigadores, es muy dif´ıcil de duplicar en la vida pr´actica [YSW11].
Debemos indicar que el tipo de im´agenes m´edicas tales como regiones de venas o determinados tejidos suelen presentar vac´ıos o regiones en la que es complicado ver las venas o reconocerlas, para ello existen m´etodos como el k-means que podr´ıan ayudar a resaltar la imagen, el k-means es un m´etodo de agrupamiento que usa una distancia euclidiana entre diferentes puntos a lo largo de un espacio bajo ciertas condiciones, sin embargo, dicha distancia en p´ıxeles no funciona en im´agenes complejas, es por ello que se le considera un algoritmo de cuantizaci´on robusto [XGF16]. Sin embargo, en otras aplicaciones el k-means combinado con GMM (del ingl´es, Gaussian Mixture Model) hace que la agrupaci´on robusta delk-means se vea potenciada al combinarlo con GMM [TZG17].
Sin embargo, dichos m´etodos basados en k-means y GMM, tienen la desventaja de trabajar directamente sobre los datos sensoriales. Adem´as del k-means tambi´en se vio la t´ecnica de PCA, el cual b´asicamente realiza una transformaci´on l´ıneal de datos en un sistema de coordenadas nuevo, su objetivo es de reducir el n´umero de variables de los datos de entrada, con el detalle de preservar la mayor cantidad de informaci´on disponible [Bis06].
3.3. Identificaci´ on Biom´ etrica y Reconocimiento de Patro- nes
La mayor´ıa de sistemas de identificaci´on biom´etrica est´an basados en una sola ca- racter´ıstica, sin embargo, existen otras caracter´ısticas con patrones ´unicos que podr´ıan combinarse para mejorar el rendimiento de estos sistemas de identificaci´on, por ejemplo en [SYW+19] se propone un sistema biom´etrico multimodal, donde se aprovechan dos ventajas de patrones ´unicos, el reconocimiento de venas en los dedos y el electrocardio- grama. En el reconocimiento de venas se plantea utilizar un Patr´on Binario Local para cada usuario, este patr´on es el producto de la relaci´on entre el centro de cada pixel y sus vecinos cercanos a los cuales se les asigna valores binarios, para luego compararlos con la intensidad del pixel central, el vector final ser´a el producto de concatenar esos n´umeros binarios, el histograma de este vector final nos dar´a un patr´on ´unico para cada usuario.
Comparando un sistema uni-biom´etrico con uno multi-biom´etrico, este ´ultimo fusiona m´ultiples caracter´ısticas biom´etricas [YWH+18], al realizar esta fusi´on se puede mejorar la precisi´on de reconocimiento en sistemas de seguridad, se propone fusionar informaci´on de la huella digital y del patr´on de venas en los dedos, para la huella digital a trav´es del m´etodo de minucias que finalmente ser´a representado por un vector l´ogico y para el patr´on de venas en los dedos, extrayendo la Regi´on de Inter´es (ROI), luego a esta regi´on se le aplica un filtro de Gabor y un an´alisis discriminativo lineal, los resultados de ambos procedimientos se guardan en un vector, a partir de este vector se maximizan las variacio- nes entre clases y se minimizan las variaciones dentro de la misma clase, posteriormente se utiliza la Transformada de Fourier Discreta Parcial Mejorada (EP-DFT) para combi- nar las caracter´ısticas de la huella digital y de las venas en los dedos, al aplicar estos procedimientos finalmente se demostr´o que muestran un alto rendimiento, mejorando el reconocimiento dentro de los sistemas de seguridad, que abre la posibilidad de aplicarlo a sistemas biom´etricos que podr´ıan combinar m´as caracter´ısticas para mejorar a´un m´as los sistemas de reconocimiento biom´etricos basados en m´ultiples caracter´ısticas.
Las t´ecnicas para reconocer patrones de venas en los dedos tienen el problema que la luz infrarroja se aten´ua en los tejidos y la imagen de las venas en los dedos se ve degradada, lo cual perjudica inevitablemente el reconocimiento de las venas, se propone un simple pero efectivo m´etodo de eliminaci´on de dispersi´on para mejorar la visualizaci´on de las venas, primero utilizan una serie de diferentes filtros de Gabor y finalmente se usa una estrategia de correlaci´on de una fase para medir la similitud con la imagen mejorada, los resultados muestran que este m´etodo propuesto es efectivo y de confianza en el mejoramiento y restauraci´on de im´agenes de venas en los dedos [YS14].
Gupta and Gupta [GG15] en el a˜no 2015, plantean realizar diversas etapas para la extracci´on de ROI, y extracci´on de caracter´ısticas, para que todas estas aproximaciones de forma conjunta representen una caracter´ıstica ´unica para cada usuario, se obtiene un error de 4.47 % utilizando diferencia de suma de cuadrados, sin embargo estas perspectivas solo son v´alidas en im´agenes uniformes, y condiciones controladas.
3.4. M´ etodos de Agrupamiento y Clasificaci´ on
Uno de los atributos biom´etricos con mayor robustez es el patr´on ´unico que descri- ben las venas, y sobre todo si son capturadas en el espectro infrarrojo, sin embargo, las grandes cantidades de patrones de venas podr´ıan hacer que en determinadas zonas se con- fundan unas con otras, es por eso que se prueban los modelos de diferentes esquemas de agrupamiento, como por ejemplo k-means yk-medois [RSB15].
En la actualidad, existen m´etodos basados en clustering sobre variables latentes. Entre ellos los m´etodos del estado del arte utilizan las representaciones latentes obtenidas luego de entrenar m´aquinas profundas [AGSC18, LUZ17]. En ellos se aprovecha el hecho de que las representaciones son altamente no lineales y tienden a estar m´as separados entre grupos o clases existentes en los datos [LKB+17, Kri16]. Esto es aprovechado por m´eto- dos de clustering (k-means ´o Spectral Clustering). Una desventaja de utilizar m´aquinas profundas es de que necesitan un gran n´umero de muestras para ser entrenadas y evitar el sobreajuste (esto por el gran n´umero de par´ametros de este tipo de m´aquinas). Por ello, dado las restricciones de nuestras bases de datos, en cuanto al bajo n´umero de muestras, es que optaremos por el estudio de m´etodos de clustering en la etapa de extracci´on de caracter´ısticas para alimentar un clasificador.
Por ejemplo Wu and Liu propone combinar (PCA) y linear discriminant analysis por sus siglas en ingl´es Linear Discriminant Analysis(LDA) [WL11b, WL11a], y para la etapa de clasificaci´on M´aquina de Vectores de Soporte por sus siglas en ingl´es Support Vector Machine (SVM), obteniendo una tasa de acierto del 98 %, sin embargo su toma de datos fue bastante controlado, para que la calidad del ROI no se vea afectado, por tanto esto no se asemeja a condiciones reales y quedar´ıa sujeto a la toma de datos con un dispositivo espec´ıfico, lo cual no es pr´actico.
Los sistemas basados en patrones de venas en los dedos, para la identificaci´on de usuarios han tenido ´exito en muchas aplicaciones, sin embargo, al tratarse de base de datos grandes, esto sistemas no son muy eficientes, es por ello que se usa dos etapas para la clasificaci´on, la primera basada en k-means y la segunda basa la clasificaci´on en las Maquinas de Vector de Soporte [TYSX13].
La identificaci´on eficiente de las venas es un desaf´ıo constante, sin embargo, este proceso requiere de un alto coste computacional, una soluci´on a ello es los algoritmos de Hashing que son altamente efectivos, se utiliz´o el esquema de Preservaci´on de Afinidad k-means Hashing (APKMH) para aliviar este coste computacional, demostrando finalmente ser superior frente a otros m´etodos del estado del arte [SYYY17].
La funci´on superp´ıxeles esta basada en k-means, que combina cinco m´etodos que no son mencionados, sus fortalezas son adherirse a los l´ımites de la imagen, velocidad, eficiencia de memoria y su impacto c´omo m´etodo de segmentaci´on [ASS+12].
SC se ha convertido en uno de los algoritmos de agrupamiento moderno m´as populares, es f´acil de implementar, puede resolver de manera eficiente mediante conceptos de algebra lineal est´andar y frecuentemente supera a los algoritmos de agrupamiento tradicionales, como el algoritmo k-means [VL07].
La mayor´ıa de sistemas de identificaci´on biom´etrica est´an basados en una sola ca- racter´ıstica, sin embargo, existen otras caracter´ısticas con patrones ´unicos que podr´ıan combinarse para mejorar el rendimiento de estos sistemas de identificaci´on. En [KZ11] se propone un sistema biom´etrico multimodal, donde se aprovechan dos ventajas de patrones
´
unicos, el reconocimiento de venas en los dedos y la informaci´on del electrocardiograma (ECG), al combinar estas dos perspectivas finalmente se obtiene un error rate de 0.14 %.
Pero al utilizar las venas de los dedos se obtiene un error de 3.78 %, por tanto a pesar de que combinando caracter´ısticas se busque mejorar la tasa de acierto vemos que en la etapa de extracci´on de caracter´ısticas aun falta mejorar, lo cual se pretende hacerlo con Agrupamiento Espectral.
El Agrupamiento Espectral en los ´ultimos a˜nos se ha convertido es una de las herra- mientas m´as apropiada en la investigaci´on para realizar tareas de agrupamiento, uno de los retos m´as comunes es la segmentaci´on de im´agenes. La escalabilidad es una de sus des- ventajas, ya que segmentar im´agenes demasiado grandes puede ser imposible de realizar.
Sin embargo, una opci´on simple es el de reducir el tama˜no de la im´agen pero si realizamos tal procedimiento entonces esto causar´ıa p´erdida de detalles. Nuestra propuesta es utilizar Agrupamiento Espectral como una combinaci´on de procesamiento por bloques, esto hace que las demandas de coste computacional bajen considerablemente [XG, VL07, TWC10].
3.5. Conclusiones y Apreciaciones finales
Seg´un la literatura revisada, en la actualidad las diversas caracter´ısticas o se˜nales biom´etricas es un ´area de constante investigaci´on, en especial la utilizaci´on de im´age- nes infrarrojas de los dedos permite habilitar un grado m´as de seguridad, debido a su alta fiabilidad, facilidad de uso, prevenci´on de ataques, aceptaci´on de la poblaci´on y estabilidad, debido a que es poco probable falsificar las im´agenes infrarrojas de los dedos.
Algoritmos como el SC, han demostrado tener un buen desempe˜no para agrupar datos del mismo tipo, en im´agenes que no son patrones de venas. Por ello se justifica el uso de este algoritmo para agrupar p´ıxeles de venas en dedos captadas en el espectro infrarrojo.
Muchos de los datos (entre ellos im´agenes) resultantes son de gran tama˜no, por tanto, es necesario utilizar m´etodos de reducci´on de dimensionalidad para optimizar el coste computacional.
La utilizaci´on de aprendizaje autom´atico o m´aquinas autom´aticas permiten recono- cer patrones en los datos de modo tal que puedan clasificarse autom´aticamente las im´agenes o muestras.