• No se han encontrado resultados

FACULTAD DE INGENIER´IA Y COMPUTACI ´ON DEPARTAMENTO DE INGENIER´IA EL´ECTRICA Y ELECTR ´ONICA Escuela Profesional de Ingenier´ıa Electr´onica y de Telecomunicaciones

N/A
N/A
Protected

Academic year: 2024

Share "FACULTAD DE INGENIER´IA Y COMPUTACI ´ON DEPARTAMENTO DE INGENIER´IA EL´ECTRICA Y ELECTR ´ONICA Escuela Profesional de Ingenier´ıa Electr´onica y de Telecomunicaciones"

Copied!
71
0
0

Texto completo

(1)

FACULTAD DE INGENIER´IA Y COMPUTACI ´ ON DEPARTAMENTO DE INGENIER´IA EL´ ECTRICA Y

ELECTR ´ ONICA

Escuela Profesional de Ingenier´ıa Electr´ onica y de Telecomunicaciones

Tesis de pregrado:

SEGMENTACI ´ ON DE VENAS EN IM ´ AGENES INFRARROJAS DE LOS DEDOS UTILIZANDO

AGRUPAMIENTO ESPECTRAL PARA LA CLASIFICACI ´ ON DE USUARIOS

Autor: Zenin Josep Vasquez Villar

Asesor: MSc. Juan Jos´e Choquehuanca Zevallos

Documento presentado a la Escuela Profesional de Inge- nier´ıa Electr´onica y de Telecomunicaciones como parte de los requisitos para obtener el t´ıtulo profesional de Ingeniero Electr´onico y de Telecomunicaciones.

Arequipa, noviembre de 2020

(2)

2

(3)

´ Indice general

Abstract 1

Resumen 3

1. Introducci´on 5

1.1. Motivaci´on y contexto . . . 6

1.2. Planteamiento del problema . . . 6

1.3. Objetivos . . . 7

1.3.1. Objetivo general . . . 7

1.3.2. Objetivos espec´ıficos . . . 7

1.4. Metodolog´ıa . . . 7

1.4.1. L´ınea(s) de investigaci´on . . . 7

1.4.2. Tipo de investigaci´on . . . 7

1.4.3. M´etodos para experimentos y pruebas . . . 8

1.4.4. Formas de comprobaci´on . . . 9

1.5. Consideraciones Complementarias . . . 10

1.5.1. Recursos y Materiales . . . 10

2. Marco Te´orico 11 2.1. Biometr´ıa . . . 11

2.1.1. Introducci´on . . . 11

2.1.2. Identificaci´on Biom´etrica . . . 11

2.1.3. Aplicaciones Biom´etricas . . . 11

2.2. El Especto Electromagn´etico . . . 12

2.2.1. Introducci´on . . . 12

2.2.2. La Radiaci´on Infrarroja . . . 14

2.2.3. Espectro Infrarrojo . . . 14

2.3. Im´agenes de las venas de los dedos en el Infrarrojo Cercano . . . 14

2.4. Reconocimiento de Patrones de Venas . . . 15

2.5. Descripci´on de las Bases de Datos . . . 15

2.5.1. Finger Vascular Pattern Database - Universidad Twente (BD1) . . . 15

2.5.2. Finger Image Database (Versi´on 1.0) - Universidad Polit´ecnica de Hong Kong (BD2) . . . 16

2.6. Pre-Procesamiento . . . 17

2.6.1. Segmentaci´on de Fondo - M´etodo Superp´ıxeles . . . 17

2.6.2. Mejora Visualizaci´on de las Venas . . . 17

(4)

ii ´INDICE GENERAL

2.6.3. Regi´on de Inter´es (ROI) . . . 17

2.7. Extracci´on de caracter´ısticas . . . 18

2.7.1. Descripci´on del M´etodo Agrupamiento Espectral (SC) . . . 18

2.7.2. An´alisis de Componentes Principales (PCA) . . . 21

2.8. Clasificaci´on y Validaci´on . . . 23

2.8.1. Regresor Log´ıstico . . . 23

2.8.2. Leave One Out Cross Validation . . . 25

2.8.3. C´alculo del Error y Tasa de Acierto . . . 25

2.8.4. Matriz de Confusi´on . . . 26

3. Estado del Arte 29 3.1. Seguridad . . . 29

3.2. Infrarrojo Cercano en Tejidos y Venas . . . 30

3.3. Identificaci´on Biom´etrica y Reconocimiento de Patrones . . . 31

3.4. M´etodos de Agrupamiento y Clasificaci´on . . . 32

3.5. Conclusiones y Apreciaciones finales . . . 34

4. Propuesta de Soluci´on 35 4.1. Pre-procesamiento . . . 35

4.1.1. Base de Datos Universidad de Twente (BD1) . . . 35

4.1.2. Base de Datos Universidad Polit´ecnica de Hong Kong (BD2) . . . . 39

4.2. Extracci´on de Caracter´ısticas . . . 41

4.2.1. Agrupamiento Espectral (SC) . . . 41

4.3. Reducci´on de Dimensionalidad . . . 43

4.3.1. PCA - Base de Datos Universidad de Twente . . . 43

4.3.2. PCA - Base de Datos Universidad Polit´ecnica de Hong Kong . . . . 44

4.4. Clasificaci´on y Validaci´on . . . 45

4.4.1. Regresor Log´ıstico . . . 45

5. Resultados y Comparaciones 49 5.1. Error de evaluaci´on en entrenamiento y prueba sin reducci´on de dimensio- nalidad . . . 49

5.2. Error de evaluaci´on de entrenamiento y prueba con reducci´on de dimensio- nalidad . . . 51

6. Conclusiones y trabajos futuros 57

(5)

´ Indice de figuras

1.1. Diagrama de la metodolog´ıa Utilizada: (a) Sin reducci´on de dimensionali-

dad; y, (b) Aplicando reducci´on de dimensionalidad. . . 8

2.1. El espectro electromagn´etico [ ´AG+13]. . . 13

2.2. Nivel de absorci´on de hemoglobina desoxigenada [FF02]. . . 14

2.3. Principales etapas de un sistema de identificaci´on biom´etrico. . . 15

2.4. Dedos involucrados en la toma de muestras (BD1) [Ton12]. . . 16

2.5. Funci´on de Activaci´on Log´ıstica . . . 23

2.6. Esquema Gr´afico del Regresor Log´ıstico. . . 24

2.7. Live One Out Cross Validation . . . 25

2.8. Matriz de connfusi´on para 5 clases. . . 27

4.1. Segmentado Manual de M´ascara. . . 36

4.2. Segmentado de Fondo . . . 36

4.3. Promedio de m´ascaras de todos los usuarios dedo ´ındice. . . 37

4.4. Representaci´on gr´afica del promedio de m´ascaras del dedo ´ındice. . . 37

4.5. Visualizaci´on del promedio de m´ascaras tras aplicar el corte. . . 38

4.6. ROI final. . . 38

4.7. Mejora de la visualizaci´on de las venas a partir de la ROI para la BD1. . . 39

4.8. Centro de masa de una muestra. . . 39

4.9. Relaci´on entre p´ıxeles y promedio de umbral. . . 40

4.10. Mejora de la visualizaci´on de las venas a partir de la ROI para la BD2. . . 40

4.11. Semilla Patr´on . . . 41

4.12. Resultado de aplicar SC a la semilla patr´on. . . 42

4.13. Resultado de aplicar SC a toda la ROI. . . 42

4.14. PCA aplicado a la BD1. . . 43

4.15. PCA aplicado a la BD2. . . 44

4.16. Evoluci´on del coste Lpara el Regresor Log´ıstico en funci´on del n´umero de ´ epocas y para distintos valores de tasa de aprendizaje (η) para BD1. . . 45

4.17. Evoluci´on del coste Lpara el Regresor Log´ıstico en funci´on del n´umero de ´ epocas y para distintos valores de tasa de aprendizaje (η) para BD2. . . 46

4.18. Evoluci´on del coste L para el Regresor Log´ıstico en funci´on del n´umero de ´epocas y para distintos valores de tasa de aprendizaje (η) para BD1 aplicando PCA. . . 47

(6)

iv ´INDICE DE FIGURAS

4.19. Evoluci´on del coste L para el Regresor Log´ıstico en funci´on del n´umero de ´epocas y para distintos valores de tasa de aprendizaje (η) para BD2 aplicando PCA. . . 47 5.1. Matriz de confusi´on para el dedo 5 de la BD1 . . . 50 5.2. Matriz de confusi´on del conjunto de prueba para el dedo 1 de la BD2. . . . 50 5.3. Matriz de confusi´on para el conjunto de prueba del dedo 5 de la BD1 apli-

cando PCA. . . 52 5.4. Gr´afica del error en funci´on del n´umero de componentes PCA o caracter´ısti-

cas para todos los dedos de la BD1. . . 53 5.5. Gr´afica del n´umero de autovalores frente al error de todos los dedos para la

BD2. . . 54 5.6. Matriz de confusi´on para el conjunto de prueba del dedo 1 utilizando PCA

para la BD2. . . 54

(7)

´ Indice de cuadros

2.1. Comparaci´on de diversas caracter´ısticas biom´etricas. . . 13 2.2. Clasificaci´on del espectro infrarrojo . . . 14 2.3. Matriz de confusi´on binaria. . . 26 5.1. Tasa de error para el conjunto de entrenamiento y prueba para BD1 y BD2,

y para cada uno de los dedos en dichas bases. . . 49 5.2. Tasa de error sin utilizar PCA para BD1 y BD2 . . . 51 5.3. Errores de train para la DB1 considerando diferente n´umero de caracter´ısti-

cas PCA (Nc). . . 51 5.4. Errores de test para la BD1 considerando diferente n´umero de caracter´ısti-

cas PCA (Nc). . . 52 5.5. Errores de entrenamiento y prueba en clasificaci´on considerando diferentes

n´umero de caracter´ısticas PCA para la BD2. . . 53

(8)

vi ´INDICE DE CUADROS

(9)

Abstract

Among biometric systems for user identification, finger vein patterns captured in the infrared spectrum have shown to be relevant for identifying users; and, in this way to provide a high level and low cost security system. Unfortunately, the extraction of these vascular patterns is affected by many factors such as the capture device, light variations, force exerted on the finger, tissues and bones with different morphology, finger position.

So, the improvement of the segmentation of the veins is very important for subsequent steps like the feature extraction or classification stage. Consequently, Spectral Clustering (SC) is proposed for the task of improving pixel segmentation of veins applied in infrared images. To do so, the spectral clustering memory requirements for large number of samples is attacked considering small disjoint partitions of the image and comparing resulting clusters in order to joint them avoiding the need for subsequent processing steps. Finally, results are compared in terms of user classification accuracy, obtaining a 99.85 % hit rate in the databases used by the University of Twente and Hong Kong Polytechnic.

keywords: Finger-vein authentication, biometrics, finger-vein, feature extraction, pattern recognition, classification, machine learning, identity validation, finger-vein extraction.

(10)
(11)

Resumen

Entre los sistemas biom´etricos para la identificaci´on de usuarios, los patrones de ve- nas de los dedos capturados en el espectro infrarrojo han demostrado ser relevantes para identificar a los usuarios; y, de esta manera, proporcionar un sistema de seguridad de alto nivel y bajo costo. Desafortunadamente, la extracci´on de estos patrones vasculares se ve afectada por muchos factores, como el dispositivo de captura, las variaciones de luz, la fuerza ejercida sobre el dedo, los tejidos, los huesos con diferente morfolog´ıa y la posici´on del dedo. Por lo tanto, la mejora de la segmentaci´on de las venas es muy importante pa- ra los pasos posteriores, como la extracci´on de caracter´ısticas o la etapa de clasificaci´on.

En consecuencia, se propone Agrupamiento Espectral (SC) para la tarea de mejorar la segmentaci´on de p´ıxeles de las venas aplicada en im´agenes infrarrojas. Para hacerlo, se atacan los requerimientos de memoria del Agrupamiento Espectral para un gran n´ume- ro de muestras considerando peque˜nas particiones disjuntas de la imagen y comparando los agrupamientos resultantes para unirlos evitando la necesidad de pasos posteriores de procesamiento. Finalmente, los resultados se comparan en t´erminos de precisi´on de cla- sificaci´on del usuario obteniendo una tasa de acierto de 99.85 % en las bases de datos utilizadas de la universidad de Twente y Polit´ecnica de Hong kong.

Palabras clave: Autenticaci´on de venas del dedo, biometr´ıa, vena del dedo, extracci´on de caracter´ısticas, reconocimiento de patrones, clasificaci´on, aprendizaje autom´atico, validaci´on de identidad, extracci´on de venas del dedo.

(12)
(13)

Cap´ıtulo 1

Introducci´ on

Utilizar las caracter´ısticas de las personas para identificarlas, es una tarea que se re- monta desde civilizaciones como los Egipcios, cuando utilizaban la antropometr´ıa (medidas de algunas partes del cuerpo) para identificar personas, m´as adelante otra caracter´ıstica como la huella dactilar se utiliz´o en la antigua China (105 D.C.), al estampar con tinta china las marcas de los dedos o la palma de la mano en documentos de registro oficial, desde entonces la tarea de identificaci´on ha pasado desde oriente a occidente.

Los primeros indicios en occidente se remontan al a˜no 1850 cuando Sir William James Herschel empieza a incluir el uso de la huella dactilar en acuerdos y contratos. En el mismo a˜no, Herschel –que adem´as era un astr´onomo aficionado– da pie a otro tema de relevancia en este escrito: La luz infrarroja (Secci´on 2.2), descubriendo que el calor era m´as intenso a lado del color rojo del espectro. Y, de esta manera, sus experimentos fueron el inicio del estudio de la radiaci´on infrarroja.

En 1880, el m´edico Henry Faulds por iniciativa propia recolecta y guarda huellas dac- tilares de humanos y primates, y llega a la conclusi´on de que las huellas dactilares eran

´

unicas y adem´as suger´ıa que estas podr´ıan ser clasificables. En el mismo a˜no, se invent´o el primer bol´ometro utilizado para medir la radiaci´on infrarroja que proven´ıa del sol, abriendo el paso a diversos estudios en relaci´on con la luz infrarroja y sus aplicaciones.

Con la adquisici´on de im´agenes digitales en el espectro infrarrojo se abre la posibilidad de que se desarrollen estudios sobre todo en medicina y seguridad, ya sea para la identifi- caci´on de personas, detecci´on de anomal´ıas, etc [TV13].Y aunque muchos trabajos se han realizado, los sistemas de identificaci´on son temas a´un emergentes, por ejemplo, el uso de patrones de las venas del dedo surge como una nueva forma de biometr´ıa [Ton12].

Impulsados por la evoluci´on de la computadora y el procesamiento de la se˜nal, sur- gieron varios paradigmas para la identificaci´on de usuarios basados en diferentes datos biom´etricos obtenidos de caracter´ısticas como retina, firma, caracter´ısticas de la cara, iris del ojo, voz, patrones vasculares, temperatura de la cara [Mil94], como se puede observar de manera comparativa en el Cuadro 2.1). En particular, los patrones vasculares ofrecen varias ventajas como gran confiabilidad (alta seguridad), f´acil de usar, alta aceptaci´on, estabilidad y prevenci´on de ataques [MY13, SISS+16]. Adem´as, se pueden adquirir de manera no invasiva, los patrones no cambian con el tiempo (estabilidad), son ´unicos para cada persona, incluso hay m´as de un patr´on disponible por persona (diez dedos: mano izquierda y derecha y cada uno de ellos son diferentes); y, finalmente, las im´agenes solo se pueden tomar cuando una persona est´a viva [YSY11, WZL10]. Por otro lado, se han

(14)

propuesto diversos aproximaciones para extraer de manera eficiente los patrones de las venas [SISS+16], sin embargo Agrupamiento Espectral ´o Spectral Clustering (SC) no ha sido aplicado a esta tarea. SC es un algoritmo utilizado ampliamente en el agrupamien- to de elementos, utiliza operaciones simples de ´algebra lineal, es f´acil de implementar y ha demostrado ser ampliamente mejor en el agrupamiento en espacios inclusive de alta dimensionalidad.

1.1. Motivaci´ on y contexto

La identificaci´on biom´etrica y la detecci´on de anomal´ıas es un tema a´un emergente, debido a la vulnerabilidad de los sistemas de seguridad tradicionales, encontrando en el patr´on de venas un aliado perfecto [Ton12].

De acuerdo a las diversas aproximaciones revisadas en el estado del arte en relaci´on a la etapa de extracci´on de caracter´ısticas [SISS+16], el ´exito de estas aproximaciones se ve sujeto en mucho de los casos a sistemas muy controlados, no simulando un entorno real [YRL11].

Dentro de las aproximaciones revisadas, el algoritmo de SC presenta muchas ventajas para el agrupamiento de muestras similares que pertenecen al mismo grupo. Por ello, da- das las bondades de esta t´ecnica surge la idea de utilizarla para la etapa de extracci´on de caracter´ısticas, siendo un algoritmo ampliamente utilizado en la segmentaci´on de im´agenes [XG], en consecuencia surge la idea de proponer SC para la etapa de extracci´on de carac- ter´ısticas para el reconocimiento de patrones de venas en im´agenes infrarrojas de los dedos.

1.2. Planteamiento del problema

Si bien es cierto que ya existen sistemas de seguridad, lamentablemente la extracci´on de estos patrones vasculares se ve afectada por muchos problemas, como el dispositivo de captura, las variaciones de luz, la fuerza ejercida sobre el dedo, los tejidos, los huesos con diferente morfolog´ıa y la posici´on del dedo, por ello necesitamos nuevas alternativas para mejorar esos sistemas de extracci´on de caracter´ısticas. Un m´etodo eficiente en la etapa de extracci´on de caracter´ısticas, nos proporcionar´a mayor eficiencia en cuanto a seguri- dad o detecci´on de anomal´ıas. Es as´ı que al proponer SC en la etapa de extracci´on de caracter´ısticas se busca obtener de manera eficiente los patrones de venas para incluir SC dentro de la tarea de reconocimiento de patrones y medir su eficiencia utiliz´andolo en un clasificador de usuarios. Adem´as, los requerimientos de memoria de SC escalan r´apidamen- te con respecto del n´umero de muestras, por lo que trabajos anteriores aplican SC sobre grupos peque˜nos de muestras y utilizan extensos procedimientos de post-procesamiento para unir los resultados sobre tales grupos. En la presenta tesis se hace un planteamiento para resolver estos problemas de escalabilidad.

(15)

1.3. Objetivos

1.3.1. Objetivo general

Extracci´on de caracter´ısticas basados en Agrupamiento Espectral aplicado a im´agenes infrarrojas de las venas en los dedos para la identificaci´on de usuarios.

1.3.2. Objetivos espec´ıficos

Para lograr el objetivo general de este trabajo de tesis, se tiene que llevar a cabo los siguientes objetivos espec´ıficos:

1. Implementar el algoritmo de Agrupamiento Espectral para analizar la Regi´on de Inter´es y poder segmentar regiones que contengan p´ıxeles de venas.

2. Realizar la reducci´on de dimensionalidad utilizando An´alisis de Componentes Prin- cipales.

3. Optimizaci´on y validaci´on de un regresor log´ıstico multiclase para clasificar usuarios.

1.4. Metodolog´ıa

Utilizaremos una metodolog´ıa basada en la b´usqueda de informaci´on cient´ıfica.

1.4.1. L´ınea(s) de investigaci´on

De acuerdo a las l´ıneas sectoriales de la Escuela Profesional (EP) de Ingenier´ıa Electr´oni- ca y de Telecomunicaciones (IET), el presente trabajo de tes´ıs esta enfocado al Procesa- miento de se˜nales y datos (tratamiento de im´agenes infrarrojas).

1.4.2. Tipo de investigaci´on

La presente tesis profesional involucra dos tipos de investigaci´on:

1. Investigaci´on Cient´ıfica, el desarrollo del presente escrito, esta basado en evidencia cient´ıfica ya existente (art´ıculos), se compararon y analizaron diversos m´etodos ya existentes, utilizados y probados para la extracci´on de caracter´ısticas y clasificaci´on, para que de ese modo se pueda proponer una debida metodolog´ıa y procedimientos para lograr el objetivo general.

2. Investigaci´on de Innovaci´on, tambi´en la presente tesis, es considerada de inovaci´on ya que en las diversas aproximaciones revisadas en el estado del arte [SISS+16], el m´etodo de SC propuesto para esta tarea, no ha sido aplicado al reconocimiento de patrones de venas, por tanto los resultados descritos en el presente trabajo, deter- minar´an un nuevo camino a ser aplicado a la etapa de extracci´on de caracter´ısticas en im´agenes infrarojas de los dedos.

(16)

1.4.3. M´etodos para experimentos y pruebas

El panorama general de la metodolog´ıa utilizada se muestra en la Figura 1.1.

Pre-Procesamiento Región de Interés

Agrupamiento Espectral (SC) Clasificación y Validación

Bases de Datos

Pre-Procesamiento Región de Interés

Bases de Datos

Clasificación y Validación

(a) (b)

Agrupamiento Espectral (SC)

Análisis de Componentes Principales (PCA)

Figura 1.1: Diagrama de la metodolog´ıa Utilizada: (a) Sin reducci´on de dimensionalidad;

y, (b) Aplicando reducci´on de dimensionalidad.

Las dos aproximaciones mostradas en la Figura 1.1 son dos esquemas muy similares, sin embargo como se puede observar en la Figura 1.1.b se agrega una etapa de reducci´on de dimensionalidad, la Figura 1.1.a representa el diagrama de bloques para la primera aproximaci´on, donde se resalta solo el uso de SC para la extracci´on de caracter´ısticas, la segunda aproximaci´on se puede observar en el diagrama de bloques de la Figura 1.1.b en d´onde se resalta que adem´as de extraer las caracter´ısticas con el uso de SC se incluye una etapa adicional de reducci´on de dimensionalidad (aplicaci´on de An´alisis de Componentes Principales (PCA)), con el objetivo de optimizar tiempo y almacenamiento, finalmente ambos esquemas son clasificados y validados.

La propuesta de soluci´on para la extracci´on de los patrones de venas y clasificaci´on, se describen a continuaci´on:

1. Adquisici´on de im´agenes: Com´unmente involucra un dispositivo con un sensor infra- rrojo (tambi´en se desarrollan sistemas basados en luz visible). Sin embargo, nuestro prop´osito es ver el impacto de SC, para ello utilizaremos bases de datos ya dispo- nibles que nos facilitan el proceso de adquisici´on de im´agenes, para el desarrollo y experimentaci´on de la presente tesis se utiliz´o dos bases de datos, indicadas a continuaci´on:

a) La proporcionada por la Universidad de Twente - Finger Vascular Pattern Da- tabase (BD1) [TV13], la cual se describe con mayor detalle en la Secci´on 2.5.1.

b) La base de datos de la Universidad Polit´ecnica de Hong Kong - Finger Image

(17)

Database (Version 1.0) (BD2) [AK, KZ11], la cual esta descrita con mayor detalle en la Secci´on 2.5.2.

2. Pre-Procesamiento: Se implement´o varios procedimientos para la estandarizaci´on y mejora de im´agenes con el fin de extraer la Regi´on de Inter´espor sus siglas en ingl´es Region of Interest (ROI), sin embargo al trabajar con dos bases de datos, cada uno de ellos representa un caso particular en cuanto al preprocesamiento.

a) Para el caso de la Base de Datos 1 (BD1) [TV13], de la universidad de Twente, las muestras se encontraban con mayor calidad, por tanto se realiz´o un en- mascarado directo con el algoritmoSimple Linear Iterative Clustering (SLIC), posteriormente se mejor´o la visualizaci´on de las venas aplicando una equaliza- ci´on por histograma adapatativo y ajuste de contraste. Finalmente se hall´o el promedio de todas las m´ascaras para detectar donde se encontraba la mayor actividad de informaci´on de las venas, para poder obtener la ROI final.

b) En el caso de la Base de Datos 2 (BD2) [AK, KZ11], de la universidad Po- lit´ecnica de Hong Kong, se realiz´o un filtrado de las muestras de peor calidad y se elimin´o aquellas muestras que ten´ıan muy baja correlaci´on con las dem´as.

Luego se aplic´o una equalizaci´on por histograma adaptativo y ajuste de con- traste. Finalmente se hall´o el centro de masa y se defini´o de acuerdo al ancho del dedo la ROI final.

3. Extracci´on de Caracter´ısticas: Implementa procedimientos para segmentar p´ıxeles de venas desde la ROI.

a) Segmentaci´on de venas: Se aplica Agrupamiento Espectral (SC) para realizar esta tarea, se selecciona primero una semilla patr´on de una im´agen donde se diferencien claramente las regiones de venas del fondo, para poder aplicarlo a toda la im´agen de forma iterativa y asi obtener el patr´on final de venas para cada muestra.

b) Reducci´on de la dimensionalidad: Para poder reducir la redundancia en las im´agenes resultantes y optimizar los recursos de procesamiento, se aplic´o PCA para reducir la dimensionalidad, la c´ual es adecuada para preparar los datos que se utilizar´an en las pr´oximas etapas.

1.4.4. Formas de comprobaci´on

Clasificaci´on y Validaci´on: Para poder comprobar la eficiencia en la etapa de extracci´on de caracter´ısticas, se clasific´o mediante el uso de un regresor log´ıstico multiclase, debido al n´umero de muestras, para la BD1, cuatro muestras por dedo, y para la BD2, doce muestras por dedo; se entren´o el clasificador y se valid´o mediante validaci´on cruzadapor sus siglas en ingl´es Leave-one-out cross-validation (LOOCV), una alta tasa de acierto en la etapa de clasificaci´on, es una manera de comprobar la eficiencia de SC en la etapa de extracci´on de caracter´ısticas, adem´as se utiliz´o dos criterios, el primero sin reducci´on de dimensionalidad y el segundo aplicando reducci´on de dimensionalidad (PCA).

(18)

1.5. Consideraciones Complementarias

1.5.1. Recursos y Materiales

Software,por sus siglas en ingl´es MATrix LABoratory (MATLAB) 2019.

Hadware, Laptop o PC de escritorio, core i76600-8GB.

Organizaci´ on del Presente Documento

El Cap´ıtulo 1 (Introducci´on) incluye la motivaci´on y contexto, adem´as del plantea- miento del problema, tambi´en incluye el objetivo general y espec´ıficos, finalmente la metodolog´ıa propuesta y algunas consideraciones complementarias.

En el Cap´ıtulo 2 (Marco Te´orico) se describen conceptos previos necesarios para el desarrollo de la presente investigaci´on adem´as de los m´etodos y algoritmos utilizados de acuerdo a la metodolog´ıa propuesta.

El Cap´ıtulo 3 (Estado del Arte) describe las investigaciones que sirvieron como base y referencia de acuerdo a cada etapa de la metodolog´ıa propuesta en la secci´on 1.4.

En el Cap´ıtulo 4 (Propuesta de Soluci´on) se detalla a profundidad cada etapa pro- puesta para enfrentar los desaf´ıos que nos plantea el objetivo general y espec´ıficos.

El Cap´ıtulo 5 (Resultados y comparaciones) muestra los resultados obtenidos para cada objetivo espec´ıfico, adem´as de gr´aficas y comparaciones, finalmente se describen las conclusiones previas a las que se ha llegado.

En el Cap´ıtulo 6 (Conclusiones y trabajos futuros) se presentan las conclusiones finales adem´as de posibles trabajos futuros.

(19)

Cap´ıtulo 2

Marco Te´ orico

2.1. Biometr´ıa

2.1.1. Introducci´on

De acuerdo al Diccionario de la Real Academia de la Lengua Espa˜nola, la definici´on de biometr´ıa es:Estudio mensurativo o estad´ıstico de los fen´omenos o procesos biol´ogicos, sin embargo, en un sentido espec´ıfico la biometr´ıa se la concibe como aquella ciencia de- dicada al estudio estad´ıstico y probabil´ıstico de caracter´ısticas cuantitativas de personas, tales como: huellas dactilares, peso, altura, etc. Este t´ermino es utilizado para referir a los m´etodos autom´aticos que analizan determinadas caracter´ısticas humanas con el fin de identificar y autenticar a las personas [ST05].

En [PGCY09], la biometr´ıa hoy en d´ıa est´a ampliamente relacionada con la seguridad, criminolog´ıa y seguridad inform´atica, estas ´areas son la base de los sistemas de seguri- dad, las tecnolog´ıas biom´etricas son aplicables en las organizaciones, un ejemplo es que para realizar ciertas operaciones es necesario la identificaci´on de la persona ya sea con su clave secreta o tarjeta y al mismo tiempo al individuo tambi´en se le puede identificar biom´etricamente, por ejemplo, mediante su huella dactilar.

2.1.2. Identificaci´on Biom´etrica

Identificaci´on se refiere a que, mediante un sistema biom´etrico, se trata de responder a la pregunta: ¿Qui´en es la persona XX?, se tiene la informaci´on de la persona de la que se desconoce su identidad, para ello se debe contar con un sistema que guarde e identifique personas [ST05].

2.1.3. Aplicaciones Biom´etricas

De acuerdo a [MY13], las aplicaciones biom´etricas son aplicables pr´acticamente a cual- quier caracter´ıstica que pueda ser usada para la identificaci´on, dentro de las caracter´ısticas biom´etricas actualmente utilizadas, tenemos:

1. Huella dactilar: Dentro de sus ventajas se encuentra la f´acil extracci´on y pr´actica- mente cero costes, lo cual le permite ser la m´as popular.

(20)

2. ADN ( ´Acido Desoxirribonucleico): Es la ´unica t´ecnica a trav´es de la cual la identidad de una persona puede ser confirmada con un cien por cien de ´exito, sin embargo, son muy costosas y de alto coste computacional al procesar los datos.

3. Iris: Esta aplicaci´on se centra b´asicamente en los estudios de John Daugman que confirma la inalterabilidad que tiene el iris durante el ciclo de vida de un ser humano, siendo muy superior a la huella dactilar, no obstante, el coste de los equipos para realizar este tipo de identificaci´on es demasiado alto.

4. Voz: Es una aplicaci´on muy estudiada de f´acil obtenci´on y es por eso que es una aplicaci´on muy extendida para fines de identificaci´on. Sin embargo, la voz esta sujeta a muchas variaciones del entorno y del medio, adem´as que var´ıa con la edad, el padecimiento de ciertas enfermedades o simplemente con cambios de ´animo, . 5. Retina: Su principal fortaleza se encuentra en la geometr´ıa vascular que tiene y

supera en fiabilidad incluso al iris, el problema se encuentra en que es necesario un l´aser para capturar muestras raz´on por la cual las personas muestran rechazo.

6. Reconocimiento facial: Es una de las utilizadas en la actualidad, por ejemplo, es los celulares de alta gama, debido a que capturar muestras es f´acil y barato, sin embargo, uno de los principales inconvenientes es que es muy sensible a cambios o variaciones tales como usar gafas, vello, corte, fotograf´ıas y variaciones de luz.

7. Geometr´ıa de la mano: Existen diversas bases de datos, debido a que es r´apido, en se- gundos se puede identificar usuarios; est´a indicado para ambientes con una densidad de identificaci´on bastante alta donde la rapidez es un requerimiento importante.

8. Firma: Es una de la mas conocidas, sin embargo, su fiabilidad es cuestionable, ya que falsificar una firma es relativamente f´acil, por tanto, su fiabilidad es muy baja en cuanto a m´etodo biom´etrico.

9. Vascular: Este m´etodo de identificaci´on utiliza el patr´on de venas de los dedos o de la mano, es una caracter´ıstica con una fiabilidad muy alta, facilidad de uso y prevenci´on de ataques. Una de las ventajas que presenta frente a otros m´etodos como la identificaci´on por el iris, es que este no requiere de luz visible (400−750 nm), mientras que para el patr´on de venas de dedos o manos requiere de luz infrarroja (800−950 nm) la cual la hace menos variable al momento de capturar las muestras para la identificaci´on.

En el Cuadro 2.1, se compara los diversas caracter´ısticas biom´etricas existentes con de- terminados criterios que determinan las ventajas de uno respecto a los otros [ST05], se resalta la preponderancia que tiene la caracter´ısticas vascular de los dedos y la mano.

2.2. El Especto Electromagn´ etico

2.2.1. Introducci´on

El espectro electromagn´etico es la clasificaci´on de energ´ıa de un grupo de ondas elec- tromagn´eticas [GSM02], incluyen los rayos gamma, la luz ultravioleta, la luz visible y los

(21)

Fiabilidad Facilidad de uso

Prevenci´on de ataques

Aceptaci´on Estabilidad

Iris Muy alta Media Muy alta Media Alta

Retina Muy alta Baja Muy alta Baja Alta

Huellas dactilares

Muy alta Alta Alta Alta Alta

Vascular dedo

Muy alta Muy alta Muy alta Alta Alta

Vascular mano

Muy alta Muy alta Muy alta Alta Alta

Geometr´ıa de la mano

Alta Alta Alta Alta Media

Escritura y firma

Media Alta Media Muy alta Baja

Voz Alta Alta Alta Muy alta Alta

Cuadro 2.1: Comparaci´on de diversas caracter´ısticas biom´etricas.

infrarrojos, hasta las ondas de radio. La Figura 2.1 muestra la representaci´on de las dife- rentes longitudes de onda con objetos de uso com´un, adem´as de su temperatura [ ´AG+13].

Edificios Humanos Mariposas Punta de aguja

Protozoos Moléculas Átomos Núcleo atómico

104 108 1012 1015 1016 1018 1020

1 K 100 K 10.000 K 10.000.000 K

¿Penetra la atmósfera terrestre?

Radio Microondas Infrarrojo Visible Ultravioleta Rayos X Rayos gamma

103 10−2 10−5 0,5×10−6 10−8 10−10 10−12

Tipo de radiación Longitud de onda (m) Escala aproximada de la longitud de onda

Frecuencia (Hz)

Temperatura de los objetos en los cuales la radiación con esta longitud de onda es la más intensa

−272 °C −173 °C 9.727 °C ~10.000.000 °C

Figura 2.1: El espectro electromagn´etico [ ´AG+13].

(22)

2.2.2. La Radiaci´on Infrarroja

Es un tipo de radiaci´on electromagn´etica cuya longitud de onda es mayor que el de la luz visible, su longitud de onda va desde los 0.7 µm hasta los 1000µm [ ´AG+13].

2.2.3. Espectro Infrarrojo

La regi´on infrarroja se clasifica de acuerdo a su longitud de onda, esta clasificaci´on se puede observar en el Cuadro 2.2.

Nombre Longitud de ondaµm Infrarrojo Cercano 0,753

Infrarojo Medio 38 Infrarrojo Lejano 815 Infrarrojo Extremo 151000

Cuadro 2.2: Clasificaci´on del espectro infrarrojo

2.3. Im´ agenes de las venas de los dedos en el Infrarrojo Cercano

Una de las principales razones por las que se utiliza el Infrarrojo Cercanopor sus siglas en ingl´es Near InfraRed (NIR), es porque biol´ogicamente existe una “ventana de absor- ci´on”(700µm- 900µm), d´onde la luz incidente puede penetrar profundamente a los tejidos, por ejemplo, el nivel de absorci´on (Figura 2.2) de hemoglobina desoxigenada presenta su punto m´aximo de absorci´on en el espectro del infrarrojo cercano (NIR) [WESS05, FF02].

700 800 900 1000

Longitud de Onda (nm) 1

2 3 4

Hemoglobina Oxigenada Hemoglobina Desoxigenada

<<< Absorción de Ondas a 760 nm.

Nivel de Absorción (1/cm)

Figura 2.2: Nivel de absorci´on de hemoglobina desoxigenada [FF02].

Para poder aprovechar las ventajas en cuanto a penetrabilidad y absorci´on que poseen las venas y tejidos, es posible a trav´es de hardware especialmente dise˜nado o de dispositivos de captura dedicados a esta tarea, por lo tanto obtener im´agenes en el espectro infrarrojo

(23)

cercano de las venas de los dedos permite utilizarlas en diversas aplicaciones biom´etricas o de detecci´on de anomal´ıas [TC09].

2.4. Reconocimiento de Patrones de Venas

Es un procedimiento d´onde se puede utilizar diversas t´ecnicas para recoger informaci´on del medio, lo com´un es hacerlo por medio de sensores, para ello es necesario procesar la informaci´on capturada para poder compararla. Este llamado reconocimiento de patrones comprende cuatro fases b´asicas: Adquisici´on de los datos, segmentaci´on, extracci´on de caracter´ısticas y clasificaci´on. En la Figura 2.3 se muestra el diagrama de bloques de las principales etapas de un sistema de reconocimiento de patrones [GA91].

Adquisición Segmentación Extracción de

características Clasificación

Imagen Imagen

procesada Patrón

Decisión

Información Sensorial Clases

Figura 2.3: Principales etapas de un sistema de identificaci´on biom´etrico.

2.5. Descripci´ on de las Bases de Datos

2.5.1. Finger Vascular Pattern Database - Universidad Twente (BD1) La primera base datos elegida para el prop´osito de extraer caracter´ısticas e iden- tificaci´on, es la base de datos creada por la Universidad de Twente, esta base de datos proporciona conjuntos de datos de patrones vasculares disponibles para la co- munidad de investigaci´on, este conjunto de muestras contiene 1440 im´agenes para un total de 60 usuarios [TV13],

Esta base de datos es ´unica en su tipo, ya que las im´agenes son de alta resoluci´on y tienen una densidad de p´ıxeles ´optima. Adem´as, este es el primer conjunto de datos que contiene la edad, el g´enero y la muestra de m´ultiples dedos por mano [Ton12].

Las im´agenes capturadas por el sensor infrarojo son de 380 x 672 p´ıxeles y tienen una resoluci´on de 126 p´ıxeles por cent´ımetro (ppcm). En unidades no m´etricas, esto ser´ıa 320 p´ıxeles por pulgada (ppi). El formato que se utiliza para almacenar las im´agenes es (*.png) (Portable Network Graphics) de escala de grises de 8 bits.

Los dedos capturados fueron el anular, ´ındice y medio de ambas manos en dos dife- rentes sesiones para cada mano, se obtuvo cuatro im´agenes por dedo en cada sesi´on,

(24)

se realiz´o a un total de 60 usuarios, por tanto 6×4×60 = 1440 muestras, en la Figura 2.4, se muestra de manera gr´afica los dedos tomados en cuenta para la toma de muestras por mano.

Figura 2.4: Dedos involucrados en la toma de muestras (BD1) [Ton12].

2.5.2. Finger Image Database (Versi´on 1.0) - Universidad Polit´ecnica de Hong Kong (BD2)

La segunda Base de Datos elegida, peternece a la Universidad Polit´ecnica de Hong Kong [AK, KZ11], el principal objetivo de esta fue crear un conjunto de muestras a una escala alta para ponerla a disposici´on de los investigadores que requieran ampliar el conocimiento en investigaci´on de las aplicaciones que involucran este tipo de im´agenes.

Esta base de datos contiene 6264 im´agenes de un total de 156 usuarios y todas las im´agenes estan en formato de mapa de bits (*.bmp), cada im´agen es de 513 x 256 p´ıxeles.

Dentro del tipo de muestras, contiene los patrones vasculares y las im´agenes de los dedos, captados en la banda infrarroja y luz visible respectivamente.

La toma de datos se realiz´o en dos sesiones diferentes, en cada sesi´on se proporcio- naron 12 muestras por dedo, solo se tomaron muestras del dedo ´ındice y medio de la mano izquierda, 6 muestras pertenec´ıan al patr´on vascular y las otras 6 a la imagen de la textura del dedo, de modo que cada usuario proporcion´o en total 24 im´agenes por sesi´on [AK].

El n´umero de muestras de patrones vasculares por cada sesi´on es 12, de las cuales 6 pertenecen al primer dedo y 6 corresponden al segundo dedo, por tanto para un total de 156 usuarios y dos sesiones se obtienen 12×156 = 1872 muestras para cada dedo, en total 1872×2 = 3744 muestras de patrones vasculares en total para todos los dedos.

(25)

2.6. Pre-Procesamiento

2.6.1. Segmentaci´on de Fondo - M´etodo Superp´ıxeles

Superp´ıxeles es un nuevo algoritmo basado en k-means, que utiliza Agrupamiento Iterativo Lineal Simple (SLIC), se utiliz´o superp´ıxeles para realizar el segmentado del borde del dedo con el fondo, este m´etodo funciona a partir de una m´ascara patr´on binaria que se selecciona manualmente de una im´agen donde se diferencien claramente el fondo del borde del dedo, para posteriormente aplicarlo a todas las muestras [ASS+12].

2.6.2. Mejora Visualizaci´on de las Venas

Para realizar esta tarea se aplicaron dos funciones implementadas en Matlab [LS14], que se describen brevemente a continuaci´on:

imadjust, esta funci´on nos permite ajustar el contraste de los diferentes p´ıxeles de la im´agen con nuevos valores, los valores altos se saturan, mientras que los bajos se aten´uan.

adapthisteq, con esta funci´on mejora cada grupo de p´ıxeles para que coincida con una distribuci´on uniforme determinada por el programador, a diferencia de otras funciones, la mejora del contraste se da en peque˜nas regiones de la im´agen de forma iterativa hasta recorrer toda la im´agen, de este modo se mejora el contraste en cada porci´on de im´agen para finalmente mostrar todas las porciones en conjunto, mejorando el contraste global de forma eficiente.

2.6.3. Regi´on de Inter´es (ROI)

Una de las cosas m´as importantes que puede hacer un investigador para aumentar la productividad es asegurarse de que los recursos inform´aticos no se gasten en c´alculos innecesarios. Tenemos algunas maneras diferentes de evitar el exceso de c´omputo, por ello uno de los m´etodos m´as b´asicos es seleccionar una ROI.

Una Regi´on de Inter´es ´o ROI es una ´area especificada por el usuario que puede usarse para limitar ciertos c´alculos de composici´on dentro de sus l´ımites (generalmente tempo- rales). El uso del ROI para limitar los c´alculos se realiza principalmente como un paso intermedio entre etapas, es decir, cuando uno desea concentrarse en ajustar un ´area parti- cular de la imagen completa [Bri08]. En el presente trabajo se utiliza una ROI rectangular por simplicidad

Al especificar una regi´on de inter´es en un ´area determinada, permite a la computadora que se ocupe exclusivamente de los p´ıxeles que elija. Existen im´agenes que tienen zonas complejas que pueden quedar fuera de cualquier ROI especificado, por tanto podr´a ignorar estas ´areas complejas por completo cuando trabaje solo dentro del ROI.

(26)

2.7. Extracci´ on de caracter´ısticas

2.7.1. Descripci´on del M´etodo Agrupamiento Espectral (SC)

El agrupamiento espectral tiene una simple formulaci´on y puede ser resuelto por ope- raciones simples de ´algebra lineal, sin embargo, produce mejores resultados que algoritmos de agrupamiento tradicionales como k-means [XG, VL07].

2.7.1.1. Distancia Euclidiana

Existen diferentes formas de encontrar distancias, la mas simple es la distancia Eucli- diana.

Dado un conjunto de N datos X ∈ RD×N cuyas columnas son las muestras x(n) ∈ RD×1, siendo D el n´umero de caracter´ısticas de la n-´esima muestra.Luego, la distancia Euclidiana entre las m-´esima y n-´esima muestras,xm yxn respectivamente, esta definida por:

wa(m, n) = v u u t

D

X

d=1

x(m)d −x(n)d 2

∀ {1,2, ..., N} (2.1) As´ı, podemos definir la matriz de distanciasWa∈RN×N con elementoswa(m, n).

Una caracter´ıstica importante de la matriz Wa es que sus elementos de la diagonal principal ser´an ceros. Los valores deWavan desde 0 hasta∞, esto significa que mientras m´as cercano este el valor de 0 las muestras x(m) yx(n) se parecen m´as; y, mientras m´as grande sea el valor, es decir tienda a infinito, las muestras x(m) yx(n) no se parecen.

2.7.1.2. Funci´on de Similitud Gaussiana

Los valores en Wa estan entre 0 hasta ∞; es decir, los valores no est´an controlados.

Este descontrol en los valores causan problemas, de modo que se debe buscar un modo de ecualizar estos valores. Para ello, se utiliza la funci´on de similitud gaussiana definida en la Ecuaci´on 2.2.

Wb(m, n) =exp −kx(m)−x(n)k22

!

(2.2) Una ventaja de aplicar la ecualizaci´on es que los valores enWb est´an restringidos entre 0 y 1. En este caso, las similitudes entre dos datos m y nse expresan de tal manera que si Wb(m, n) est´a cerca de cero, los puntos est´an lejanos; y por el contrario, si los valores son cercanos a uno significa que los puntos est´an lo suficientemente cerca.

Wb(m, n) =

(1 parecidos

0 distintos (2.3)

En la Ecuaci´on 2.2, σ2 es un hiperpar´ametro necesario para validar, s´ı es grande agrupa m´as los puntos (equivaldr´ıa a forzar que se acerquen); es decir, no solo toma en cuenta las distancias. Por el contrario, el valor de σ2, alejar´a m´as los datos. Este valor σ2 por tanto regula el valor de la distancia; y, es un hiperpar´ametro que se modifica de acuerdo a la naturaleza del problema que se desea atacar.

(27)

2.7.1.3. Norma de la matriz

Los valores ahora se concentran en un ´unico rango entre 0 y 1 (Ecuaci´on 2.3), estos valores siguen siendo una medida de la distancia que ya los tenemos controlados gracias a la funci´on de Similitud Gausiana.

La matriz Wb (Ecuaci´on 2.2), ya tiene en su diagonal principal puros 1. Normalizar en este contexto significa hacer que los elementos de una fila y que este fuera de la diagonal principal sumen 1. Para normalizar se debe conseguir primero que la diagonal principal valga 0, para ello se resta de Wb una matriz con diagonal principal de puros 1 (matriz identidadD) as´ı como se muestra en la Ecuaci´on 2.4.

Wcc=D−Wb (2.4)

El siguiente paso es dividir cada fila entre la suma de los valores de toda la fila para poder normalizarla, se debe tener presente que los elementos de la diagonal principal valen 0, en consecuencia no afecta la suma de los elementos de una fila. La obtenci´on de los elementosWc(m, n) de la matriz normalizada Wc∈RN×N se muestra en la Ecuaci´on 2.5.

Wc(m, n) = Wcc(m, n) PN

n=1Wcc(m, n) (2.5)

Finalmente los elementos de la diagonal principal de Wc tendr´a en su diagonal principal puros 1.

2.7.1.4. Grado de la Matriz

La matriz Wc esta normalizada, decimos que su grado es 1, porque la suma de todos los elementos de cada fila deWcsuma 1, el grado de la matriz esta dado como la suma de los elementos de cada fila fuera de la diagonal principal igual a 1, definido en la Ecuaci´on 2.6.

DA=

1 0 0 0

0 ... 0 0

0 0 1 0

0 0 0 1

N×N

(2.6)

Donde DA es del mismo tama˜no queWc. 2.7.1.5. Laplaciano Normalizado

Finalmente el Laplaciano normalizado no es m´as que la matricial entre el grado de la matriz (DA) menos la norma de la matriz (Wc), definido en la Ecuaci´on 2.7.

L=DA−Wc (2.7)

Las principales propiedades de la matriz Laplaciana son:

Es sim´etrica y semi-definida positivamente.

(28)

El m´ınimo valor de sus eigenvalores de L es 0, que corresponde al eigenvector de constante 1.

Los elementos de la matrizL no tiene valores negativos.

Lo m´as importante de encontrar el Laplaciano normalizado, es sus eigenvalores y sus eigenvectores.

Los eigenvalores nos dar´an informaci´on de cuantos grupos se distinguen, mientras m´as cercanos a 0 se encuentren, ser´an entonces un grupo o clase diferenciada [VL07].

Dentro de la importancia de los eigenvectores, el eigenvector 1 y 2, son los m´as impor- tantes:

1. El eigenvector uno, muestra la distribuci´on de clases diferenciadas, sin embargo los valores que describen esta distribuci´on se encuentran muy acotadas, y no es posible determinar un par´ametro de corte.

2. El eigenvector dos, a diferencia del uno nos mostrar´a la distribuci´on de los grupos o clase diferenciadas con valores lo suficientemente separados para poder definir un par´ametro de corte y de esa manera diferenciar las clases.

2.7.1.6. Agrupamiento Espectral para gran cantidad de datos

Una desventaja principal es que el tama˜no de la matriz laplaciana L se escala como O(N2). Para grandesNes f´acil encontrar una cantidad prohibitiva de recursos de memoria.

El enfoque m´as com´un es realizar Agrupamiento Espectral sobre peque˜nos subconjuntos de datos y luego realizar pasos fuertes de procesamiento posterior porque pueden surgir diferentes problemas dada la naturaleza de los datos.

En el contexto de la segmentaci´on del patr´on de venas, la tarea es agrupar autom´ati- camente todos los p´ıxeles que pertenecen a las venas en un grupo y cualquier otro p´ıxel a un segundo grupo.

Para hacerlo, un primer enfoque es dividir una imagen en partes peque˜nasyky realizar Agrupamiento Espectral. Sin embargo, da como resultado diferentes problemas:

1. Un primer problema surge cuando todos los p´ıxeles de yk tienen valores iguales o cercanos, por ejemplo, si yk solo tiene p´ıxeles venosos, se encontrar´an subgrupos.

Para resolver este problema, seleccionamos un peque˜no subconjunto de p´ıxeles de la imagen que contiene muestras de diferentes grupos de inter´es, llamamos a este fragmento de imagen como semilla (ys). Despu´es de unir ys a todos los subconjun- tos diferentes yk (concatenarlos como ys,k = [yk;ys]), se realiza el procedimiento de Agrupamiento Espectral descrito anteriormente. Como resultado, incluso si yk contiene los mismos p´ıxeles, el procedimiento de Agrupamiento Espectral asignar´a todos los p´ıxeles al mismo grupo que en la semilla, ya que contendr´a informaci´on deseable de muestras de diferentes agrupaciones evitando la agrupaci´on intragrupo.

(29)

2. Un segundo problema est´a relacionado con el orden de asignaci´on de los cl´usteres.

Esto se debe a que un autovectorv1proporciona la misma informaci´on de cl´uster que v2 =−v1. Para corregir esto, primero realizamos la agrupaci´on enysy guardamos el segundo vector propiovs. Luego, despu´es de aplicar Agrupamiento Espectral sobre ys,k = [yk;ys], comparamos valores dentro de vectores propios correspondientes a p´ıxeles de yk (llamado vs,k), y tome el signo de la correlaci´on cruzada entre vs y vs,k. Si el signo de dicha correlaci´on cruzada es positivo, ambos vectores propios asignar´an las mismas asignaciones a los grupos y el vector propio es ˆvs,k=vs,kpero si el signo es negativo, entonces simplemente corregimosvs,k multiplic´andolo por -1, es decir, ˆvs,k=−vs,k.

2.7.2. An´alisis de Componentes Principales (PCA) 2.7.2.1. Introducci´on

PCA es una t´ecnica estad´ıstica ´util que ha encontrado aplicaci´on en campos como el reconocimiento de rostros y compresi´on de im´agenes, es una t´ecnica com´un para en- contrar patrones comprimidos en datos de alta dimensi´on. Este m´etodo de reducci´on de caracter´ısticas utiliza informaci´o de la matriz de covarianza [Smi02].

2.7.2.2. Matriz de Covarianza

Dado la matrizX correspondiente a los datos de entrenamiento, dondeDes el n´umero de caracter´ısticas y N el n´umero de clases.

X =

... ... ... ... ... ... ... ... ... ... x(1) x(2) x(n) ... x(N)

... ... ... ... ... ... ... ... ... ...

D×N

(2.8)

donde cada columna en X es una muestra x(n) ∈RD×1

x(n) =

 x(n)1 x(n)2 ... x(n)D

D×1

(2.9)

con media µx∈RD×1;

µx=

 µ1 µ2

... µD

D×1

(2.10)

y que puede ser calculada muestralmente como sigue:

(30)

µx= 1 N

N

X

n=1

x(n) (2.11)

Una forma ´util de obtener todos los posibles valores de covarianza entre todas las diferentes dimensiones es calcularlos todos y colocarlos en una matriz. De modo que, la matriz de covarianza para un conjunto de datos esta definida en la Ecuaci´on 2.12.

C=

σ112 σ122 σ132 . . . σ1D2 σ212 σ222 σ232 ...

... ...

... ...

σD12 σD22 · · · σDD2

D×D

(2.12)

Entonces los elementos de la matriz de covarianzaCse puede calcular con la Ecuaci´on 2.13.

σi,j2 =

N

X

n=1

(x(n)i −µi)(x(n)j −µj) (2.13) Algunos puntos a tener en cuenta respecto de la matriz C, son las siguientes:

La matriz es sim´etrica respecto a la diagonal principal [Smi02].

La diagonal principal contiene las varianzas de cada dimensi´on σdd2 [Smi02].

2.7.2.3. Eigenvectores y Eigenvalores

Los eigenvectores de una matriz son los vectores no nulos que despu´es de operar, dan como resultado a un eigenvalor (m´ultiplo escalar de s´ı mismos), es decir no cambian su direcci´on.

λv=Cv λv−Cv= 0 (λI−C)v= 0

(2.14) Para poder hallar los eigenvectores de una matriz, se debe saber que solo es aplicable a matrices cuadradas como lo es la matrizC(eq. 2.12), tambi´en es preciso aclarar que no todas las matrices cuadradas tienen vectores propios.

Los vectores propios de las transformaciones lineales son vectores que no son afectados por la transformaci´on o s´olo resultan multiplicados por un escalar, en consecuencia no var´ıan su direcci´on [DB00].

(31)

2.8. Clasificaci´ on y Validaci´ on

2.8.1. Regresor Log´ıstico

Para el caso de clasificaci´on multiclase en donde las salidas est´an limitadas a ciertos valores, se utiliza la funci´on de activaci´on log´ıstica o sigmoide Ecuaci´on 2.15 [RG16].

σ(z) = 1

1 + exp(−z) (2.15)

-30 -20 -10 0 10 20 30

z 0

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Sigma(Z)

Figura 2.5: Funci´on de Activaci´on Log´ıstica

La Figura 2.5, representa la funci´on sigmoide, n´otese que el valor de 0 cae justo en 0.5.

La relaci´on de los datos (x(n) ∈ RD×1) y sus etiquetas (y∈ RK×1) est´a definida por las ecuaciones 2.16 y 2.17 respectivamente.

z(n)=WTx(n) (2.16)

donde z∈RK×1 yW ∈RD×K ˆ

y(n)=σ(z(n)) (2.17)

en donde ˆy es una estima de la etiqueta verdaderay; y, σ es la funci´on de activaci´on sigmoidal.

2.8.1.1. Funci´on de coste

La funci´on de coste utiliza el Error Cuadr´atico Medio por sus siglas en ingl´es Mean Squared Error (MSE). Para optimizar los pesos del Regresor Log´ıstico minimizamos una funci´on de coste b´asicamente una funci´on de coste mide que tanto var´ıan o discrepan los valores estimados entre las etiquetas de entrada.

M SE= 1 2N

N

X

n=1

ky(n)−yˆ(n)k2 (2.18)

(32)

2.8.1.2. Descenso por gradiente

Su objetivo es buscar par´ametros ´optimos (W) del sistema paso a paso, siguiendo una direcci´on de descenso hacia un m´ınimo global de la funci´on de coste.

W =W −η∂L

∂W (2.19)

En la Ecuaci´on 2.19, L = M SE (eq. 2.18) y ∂W∂L esta dada por la Ecuaci´on 2.20;

adem´as,η es un hiperpar´ametro llamado taza de aprendizaje que se utiliza para controlar el descenso por gradiente, mientras mayor sea este hiperpar´ametro el descenso se dar´a en pasos mas grandes, muy por el contrario mientras menor sea el valor de este hiperpar´ame- tro, el descenso se dara mas lentamente.

∂L

∂W =− 1 2N

N

X

n=1

∂z(n)

∂W

∂L

∂ˆy(n)

∂yˆ(n)

∂z(n) (2.20)

∂L

∂W =−1 N

N

X

n=1

x(n)0•(y(n)−yˆ(n)))T (2.21) en donde • indica el producto punto yσ0 =σ(z(n))•(1−σ(z(n))) es la derivada de la funci´on sigmoidal.

En la Figura 2.6, se muestra el esquema general utilizado, para cada salida (etiqueta) yk, dondekrepresenta el n´umero de clases a la salida de la red; y sus respectivas entradas xn.

x0 x1

x

D

... ...

W10 W1d W1D

y

k

y

1

y

Figura 2.6: Esquema Gr´afico del Regresor Log´ıstico.

Los par´ametros ´optimos est´an representados en la matriz W (Ecuaci´on 2.19),

W =

w11 w12 · · · w1K

w21 w22 · · · w2K ... ... ... ... ... ... wD1 wD2 · · · wDK

D×K

(2.22)

(33)

2.8.2. Leave One Out Cross Validation

Para la etapa de validaci´on, se utiliz´o la validaci´on cruzada dejando una muestra fuera para validaci´on ´o conocido como Leave One Out Cross Validation (LOOCV), esta forma de validar consiste en dejar un muestra como prueba por cada iteraci´on y todo el resto de muestras para entrenamiento.

Iteración 1 Iteración 2 Iteración 3

Iteración N

Dato de Prueba

Dato de Prueba

Dato de Prueba

Dato de Prueba

N

Datos de Entrenamiento

. .. .. . .. .

Total de datos

Figura 2.7: Live One Out Cross Validation

Esta forma de validaci´on es precisa cuando se tiene un n´umero de muestras reducida, para poder hallar el error de evaluaci´on en entrenamiento y prueba.

De manera anal´ıtica el conjunto de entrenamiento y prueba se muestran en la Ecuaci´on 2.23.

Xtst=

x(i) ∀ i {1,2,3, ..., N} Xtr =

x(j) ∀ j6=i∧(i, j){1,2,3, ..., N} (2.23) 2.8.3. C´alculo del Error y Tasa de Acierto

Para evaluar el desempe˜no de LOOCV, se halla el error de evaluaci´on en entrenamiento y prueba, el c´alculo del error de las diferentes validaciones producto de cada iteraci´on viene dada por un error, es decir por cada iteraci´on se tiene un error determinado. En cada una de las N iteraciones se produce un error, el error final se obtiene obteniendo el promedio de los N errores de cada iteraci´on, como se muestra en la Ecuaci´on 2.24.

E = 1 N

N

X

i=1

Ei (2.24)

La tasa de aciertoAcc, esta dado porAcc = 1−E. El error mide el promedio de la tasa de error de un clasificador, es una medida que nos muestra la diferencia entre los valores reales y los estimados para poder medir la eficiencia de un clasificador.

(34)

2.8.4. Matriz de Confusi´on

La matriz de confusi´on es una herramienta muy ´util dentro de los problemas de cla- sificaci´on, es una de las m´etricas m´as intuitivas y sencillas, esta herramienta nos permite ver de manera gr´afica el desenvolvimiento de un algoritmo determinado y se utiliza para los problemas de clasificaci´on donde la salida puede ser de dos o m´as tipos de clases.

2.8.4.1. Matriz de Confusi´on Binaria

La forma m´as representativa de mostrar una matriz de confusi´on es el caso binario, en donde las filas corresponden a la clase verdadera y las columnas a la clase predicha, esta estructura la podemos observar en el Cuadro 2.3 [RG16].

Clase Predecida Positivo (1) Negativo (0) Clase

Verdadera Positivo (1) TP FN

Negativo (0) FP TN

Cuadro 2.3: Matriz de confusi´on binaria.

D´onde:

Verdaderos Positivos (True Positives - TP) – Son los casos en los que los datos reales son 1 (Verdadero) y la predicci´on tambi´en es 1 (Verdadero).

Verdaderos Negativos (True Negatives - TN) – Son los casos en los que los datos reales son 0 (Falso) y la predicci´on tambi´en es 0 (Falso).

Falsos Positivos (False Positives - FP) – Son los casos en los que los datos reales indica que es 0 (Falso) y la predicci´on indica que es 1 (Verdadero), es decir la predicci´on ha sido err´onea.

Falso Negativo (False Negatives - FN) – Son los casos en los que los datos reales son 1 (Verdadero) y la predicci´on tambi´en es 1 (verdadero).

La matriz de confusi´on para problemas binarios se puede resumir en estos cuatro valores, de manera ideal se desea que el modelo de 0 falsos positivos y 0 falsos negativos, sin embargo, esto no se da el la vida real y cualquier modelo no tiene un acierto del 100 % [RG16].

2.8.4.2. Matriz de Confusi´on de m´as de Dos Clases

La matriz de confusi´on tambi´en se puede aplicar a un problema de clasificaci´on de m´as de dos clases. Por ejemplo, si tenemos k n´umero de clases la matriz de confusi´on deber´a tener k filas y k columnas, de manera visual nos permitir´a ver que tan bien funciona el algoritmo o que tan mal funciona [RG16].

Al tener los resultados representados gr´aficamente es bastante sencillo extraer infor- maci´on ´util. Por ejemplo, los valores altos en la diagonal principal, nos indica en general

(35)

que el clasificador est´a funcionando bastante bien.

Los elementos altos fuera de la diagonal principal nos informan acerca de errores que est´an relacionados regularmente con las muestras, este an´alisis no solo nos permite descu- brir donde se est´an cometiendo errores, sino que tambi´en proporcionan sugerencias sobre c´omo mejorar el rendimiento (ignorar algunas muestras, mejorar su calidad, sustituirlas, etc) [RG16].

1 2 3 4 5

Clase predecida (y) 1

2

3

4

5

Clase Verdadera (y)

1 1

3

2

1 4

4

C

4 i j

Figura 2.8: Matriz de connfusi´on para 5 clases.

Por ejemplo en la Figura 2.8 se muestra un ejemplo de matriz de confusi´on de 5 clases, d´onde cada clase tiene 4 muestras, los elementos de la diagonal principal de color azul re- presenta el 100 % de acierto para las clases 1,2,3 ; mientras que en la clase 4 una muestra se confunde con la clase 5;yen el caso de la clase 5, tiene 0 % de acierto, 2 de sus muestras se confunde con la clase 4, 1 muestra con la clase 2 y finalmente 1 muestra con la clase 3.

Es posible obtener una estima de la probabilidad (Ecuaci´on 2.25) condicionada de decidirDi cuando la clase verdadera esHj a partir de la matriz de confusi´on de la Figura 2.8, las estimas de estas probabilidades se pueden ver en la Ecuaci´on 2.26.

Pij =Pb(Di|Hj) = Cij

P

iCij (2.25)

(36)

Pb(D|H) =

1 0 0 0 0

0 1 0 0 0

0 0 1 0 0

0 0 0 1 1/4

0 1/4 1/4 2/4 0

(2.26)

(37)

Cap´ıtulo 3

Estado del Arte

Existen diversas investigaciones relacionados al desarrollo de hardware de bajo costo y utilizaci´on de algoritmos para segmentar patrones de venas en im´agenes capturadas en el espectro infrarrojo cercano, sin embargo, muchas de estas investigaciones relacionan software y hardware, pero a un nivel simple, mientras que otras se centran solo en software, pero utilizando m´etodos tradicionales. Adem´as, de acuerdo a las diversas investigaciones revisadas en esta Secci´on, el m´etodo de SC propuesto para la extracci´on de caracter´ısticas, no ha sido aplicado a la tarea de extraer los patrones de venas, por tanto la propuesta del presente trabajo innova, incluye y relaciona SC (como m´etodos del aprendizaje m´aquina) para potenciar los resultados en contraste con los m´etodos anteriormente propuestos.

3.1. Seguridad

Existen algunos art´ıculos, donde tratan trabajos de seguridad como por ejemplo el del reconocimiento de rostros heterog´eneos que se utiliza en el sector forense, seguridad y comercial; sin embargo, este reconocimiento de rostros heterog´eneos presenta problemas desafiantes, para ello proponen una red neuronal convolucional para mejorar las carac- ter´ısticas de las im´agenes faciales a trav´es del infrarrojo cercano, finalmente los resultados son alentadores, por tanto se alienta en investigar para una mayor precisi´on en espacios del espectro infrarrojo cercano [HWST18].

Otro trabajo que se vio respecto a seguridad, es la identificaci´on de personas basado en im´agenes de sus iris, donde se resalta el hecho de que los sistemas de seguridad basados en biometr´ıa para la autentificaci´on se est´an convirtiendo en la opci´on preferida para reemplazar los sistemas basados en contrase˜nas, sin embargo esta opci´on biom´etrica es costosa [SHI17].

Las venas de los dedos siempre han tenido una especial atenci´on por los sistemas de seguridad biom´etricos, se propone extraer la regi´on de inter´es especialmente del ´area entre las falanges [YWS19], luego se utiliza un filtro de Gabor para mejorar la visualizaci´on de las venas, posteriormente para el reconocimiento de venas se propuso el Modelo Jer´arquico de Hiperesfera (HHsM), el cu´al fue realmente convincente para manejar los problemas de reconocimiento de venas en los dedos. El sistema propuesto no utiliza t´ecnica alguna de reducci´on de caracter´ısticas.

En la actualidad existen sistemas de seguridad implementados en tel´efonos m´oviles y

(38)

otros dispositivos, pero son vulnerables en el sentido de que pones una foto del usuario, la cual la podr´ıas sacar de su red social y ponerla en frente del dispositivo para de esa forma burlar la supuesta seguridad con esa foto est´atica. El enfoque que se propone es de utilizar la captura de im´agenes del iris en el espectro infrarrojo cercano, para despu´es utilizar clasificadores como Haar Cascade y LBP (del ingl´es, Local Binary Patterns ), para que una vez capturada la imagen, dicha informaci´on sea guardada en un data del tipo QR, el cual sirve como un identificador ´unico de cada persona [SHI17].

3.2. Infrarrojo Cercano en Tejidos y Venas

Respecto al estudio del infrarrojo cercano en tejidos, para medir la propagaci´on de luz desde una fuente y el detector humano colocado en un tejido determinado se pueden usar tecnolog´ıas anal´ogicas y digitales, se resalta que los tejidos del cuerpo son altamente dispersantes con una distancia media, la longitud usada es de 700 nm a 850 nm, donde se enfatiza que la mayor parte de absorci´on de la energ´ıa se debe principalmente al 5 % - 10 % del volumen de tejido ocupado por la sangre [CCG+98]. Tambi´en, la utilizaci´on del infrarrojo cercano est´a basado en el grado de absorci´on de un componente de la sangre llamado des

Referencias

Documento similar