FACULTAD DE INGENIERÍA Y COMPUTACI ÓN DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTR ÓNICA Escuela Profesional de Ingenier´ıa Electrónica y de Telecomunicaciones

(1)

FACULTAD DE INGENIER´IA Y COMPUTACI ´ ON DEPARTAMENTO DE INGENIER´IA EL´ ECTRICA Y

ELECTR ´ ONICA

Escuela Profesional de Ingenier´ıa Electr´ onica y de Telecomunicaciones

Tesis de pregrado:

SEGMENTACI ´ ON DE VENAS EN IM ´ AGENES INFRARROJAS DE LOS DEDOS UTILIZANDO

AGRUPAMIENTO ESPECTRAL PARA LA CLASIFICACI ´ ON DE USUARIOS

Autor: Zenin Josep Vasquez Villar

Asesor: MSc. Juan Jos´e Choquehuanca Zevallos

Documento presentado a la Escuela Profesional de Inge- nier´ıa Electr´onica y de Telecomunicaciones como parte de los requisitos para obtener el t´ıtulo profesional de Ingeniero Electr´onico y de Telecomunicaciones.

Arequipa, noviembre de 2020

(2)

2

(3)

´ Indice general

Abstract 1

Resumen 3

1. Introducci´on 5

1.1. Motivaci´on y contexto . . . 6

1.2. Planteamiento del problema . . . 6

1.3. Objetivos . . . 7

1.3.1. Objetivo general . . . 7

1.3.2. Objetivos espec´ıficos . . . 7

1.4. Metodolog´ıa . . . 7

1.4.1. L´ınea(s) de investigaci´on . . . 7

1.4.2. Tipo de investigaci´on . . . 7

1.4.3. M´etodos para experimentos y pruebas . . . 8

1.4.4. Formas de comprobaci´on . . . 9

1.5. Consideraciones Complementarias . . . 10

1.5.1. Recursos y Materiales . . . 10

2. Marco Te´orico 11 2.1. Biometr´ıa . . . 11

2.1.1. Introducci´on . . . 11

2.1.2. Identificaci´on Biom´etrica . . . 11

2.1.3. Aplicaciones Biom´etricas . . . 11

2.2. El Especto Electromagn´etico . . . 12

2.2.1. Introducci´on . . . 12

2.2.2. La Radiaci´on Infrarroja . . . 14

2.2.3. Espectro Infrarrojo . . . 14

2.3. Im´agenes de las venas de los dedos en el Infrarrojo Cercano . . . 14

2.4. Reconocimiento de Patrones de Venas . . . 15

2.5. Descripci´on de las Bases de Datos . . . 15

2.5.1. Finger Vascular Pattern Database - Universidad Twente (BD1) . . . 15

2.5.2. Finger Image Database (Versi´on 1.0) - Universidad Polit´ecnica de Hong Kong (BD2) . . . 16

2.6. Pre-Procesamiento . . . 17

2.6.1. Segmentaci´on de Fondo - M´etodo Superp´ıxeles . . . 17

2.6.2. Mejora Visualizaci´on de las Venas . . . 17

(4)

ii ´INDICE GENERAL

2.6.3. Regi´on de Inter´es (ROI) . . . 17

2.7. Extracci´on de caracter´ısticas . . . 18

2.7.1. Descripci´on del M´etodo Agrupamiento Espectral (SC) . . . 18

2.7.2. An´alisis de Componentes Principales (PCA) . . . 21

2.8. Clasificaci´on y Validaci´on . . . 23

2.8.1. Regresor Log´ıstico . . . 23

2.8.2. Leave One Out Cross Validation . . . 25

2.8.3. C´alculo del Error y Tasa de Acierto . . . 25

2.8.4. Matriz de Confusi´on . . . 26

3. Estado del Arte 29 3.1. Seguridad . . . 29

3.2. Infrarrojo Cercano en Tejidos y Venas . . . 30

3.3. Identificaci´on Biom´etrica y Reconocimiento de Patrones . . . 31

3.4. M´etodos de Agrupamiento y Clasificaci´on . . . 32

3.5. Conclusiones y Apreciaciones finales . . . 34

4. Propuesta de Soluci´on 35 4.1. Pre-procesamiento . . . 35

4.1.1. Base de Datos Universidad de Twente (BD1) . . . 35

4.1.2. Base de Datos Universidad Polit´ecnica de Hong Kong (BD2) . . . . 39

4.2. Extracci´on de Caracter´ısticas . . . 41

4.2.1. Agrupamiento Espectral (SC) . . . 41

4.3. Reducci´on de Dimensionalidad . . . 43

4.3.1. PCA - Base de Datos Universidad de Twente . . . 43

4.3.2. PCA - Base de Datos Universidad Polit´ecnica de Hong Kong . . . . 44

4.4. Clasificaci´on y Validaci´on . . . 45

4.4.1. Regresor Log´ıstico . . . 45

5. Resultados y Comparaciones 49 5.1. Error de evaluaci´on en entrenamiento y prueba sin reducci´on de dimensionalidad . . . 49

5.2. Error de evaluaci´on de entrenamiento y prueba con reducci´on de dimensionalidad . . . 51

6. Conclusiones y trabajos futuros 57

(5)

´ Indice de figuras

1.1. Diagrama de la metodolog´ıa Utilizada: (a) Sin reducci´on de dimensionali-

dad; y, (b) Aplicando reducci´on de dimensionalidad. . . 8

2.1. El espectro electromagn´etico [ ´AG⁺13]. . . 13

2.2. Nivel de absorci´on de hemoglobina desoxigenada [FF02]. . . 14

2.3. Principales etapas de un sistema de identificaci´on biom´etrico. . . 15

2.4. Dedos involucrados en la toma de muestras (BD1) [Ton12]. . . 16

2.5. Funci´on de Activaci´on Log´ıstica . . . 23

2.6. Esquema Gr´afico del Regresor Log´ıstico. . . 24

2.7. Live One Out Cross Validation . . . 25

2.8. Matriz de connfusi´on para 5 clases. . . 27

4.1. Segmentado Manual de M´ascara. . . 36

4.2. Segmentado de Fondo . . . 36

4.3. Promedio de m´ascaras de todos los usuarios dedo ´ındice. . . 37

4.4. Representación gráfica del promedio de máscaras del dedo ´ındice. . . 37

4.5. Visualizaci´on del promedio de m´ascaras tras aplicar el corte. . . 38

4.6. ROI final. . . 38

4.7. Mejora de la visualizaci´on de las venas a partir de la ROI para la BD1. . . 39

4.8. Centro de masa de una muestra. . . 39

4.9. Relaci´on entre p´ıxeles y promedio de umbral. . . 40

4.10. Mejora de la visualizaci´on de las venas a partir de la ROI para la BD2. . . 40

4.11. Semilla Patr´on . . . 41

4.12. Resultado de aplicar SC a la semilla patr´on. . . 42

4.13. Resultado de aplicar SC a toda la ROI. . . 42

4.14. PCA aplicado a la BD1. . . 43

4.15. PCA aplicado a la BD2. . . 44

4.16. Evolución del coste Lpara el Regresor Log´ıstico en función del número de ´ epocas y para distintos valores de tasa de aprendizaje (η) para BD1. . . 45

4.17. Evolución del coste Lpara el Regresor Log´ıstico en función del número de ´ epocas y para distintos valores de tasa de aprendizaje (η) para BD2. . . 46

4.18. Evolución del coste L para el Regresor Log´ıstico en función del número de épocas y para distintos valores de tasa de aprendizaje (η) para BD1 aplicando PCA. . . 47

(6)

iv ´INDICE DE FIGURAS

4.19. Evolución del coste L para el Regresor Log´ıstico en función del número de épocas y para distintos valores de tasa de aprendizaje (η) para BD2 aplicando PCA. . . 47 5.1. Matriz de confusión para el dedo 5 de la BD1 . . . 50 5.2. Matriz de confusión del conjunto de prueba para el dedo 1 de la BD2. . . . 50 5.3. Matriz de confusión para el conjunto de prueba del dedo 5 de la BD1 apli-

cando PCA. . . 52 5.4. Gráfica del error en función del número de componentes PCA o caracter´ısti-

cas para todos los dedos de la BD1. . . 53 5.5. Gr´afica del n´umero de autovalores frente al error de todos los dedos para la

BD2. . . 54 5.6. Matriz de confusi´on para el conjunto de prueba del dedo 1 utilizando PCA

para la BD2. . . 54

(7)

´ Indice de cuadros

2.1. Comparación de diversas caracter´ısticas biométricas. . . 13 2.2. Clasificación del espectro infrarrojo . . . 14 2.3. Matriz de confusión binaria. . . 26 5.1. Tasa de error para el conjunto de entrenamiento y prueba para BD1 y BD2,

y para cada uno de los dedos en dichas bases. . . 49 5.2. Tasa de error sin utilizar PCA para BD1 y BD2 . . . 51 5.3. Errores de train para la DB1 considerando diferente n´umero de caracter´ısti-

cas PCA (Nc). . . 51 5.4. Errores de test para la BD1 considerando diferente n´umero de caracter´ısti-

cas PCA (N_c). . . 52 5.5. Errores de entrenamiento y prueba en clasificaci´on considerando diferentes

n´umero de caracter´ısticas PCA para la BD2. . . 53

(8)

vi ´INDICE DE CUADROS

(9)

Abstract

Among biometric systems for user identification, finger vein patterns captured in the infrared spectrum have shown to be relevant for identifying users; and, in this way to provide a high level and low cost security system. Unfortunately, the extraction of these vascular patterns is affected by many factors such as the capture device, light variations, force exerted on the finger, tissues and bones with different morphology, finger position.

So, the improvement of the segmentation of the veins is very important for subsequent steps like the feature extraction or classification stage. Consequently, Spectral Clustering (SC) is proposed for the task of improving pixel segmentation of veins applied in infrared images. To do so, the spectral clustering memory requirements for large number of samples is attacked considering small disjoint partitions of the image and comparing resulting clusters in order to joint them avoiding the need for subsequent processing steps. Finally, results are compared in terms of user classification accuracy, obtaining a 99.85 % hit rate in the databases used by the University of Twente and Hong Kong Polytechnic.

keywords: Finger-vein authentication, biometrics, finger-vein, feature extraction, pattern recognition, classification, machine learning, identity validation, finger-vein extraction.

(10)

(11)

Resumen

Entre los sistemas biométricos para la identificación de usuarios, los patrones de venas de los dedos capturados en el espectro infrarrojo han demostrado ser relevantes para identificar a los usuarios; y, de esta manera, proporcionar un sistema de seguridad de alto nivel y bajo costo. Desafortunadamente, la extracción de estos patrones vasculares se ve afectada por muchos factores, como el dispositivo de captura, las variaciones de luz, la fuerza ejercida sobre el dedo, los tejidos, los huesos con diferente morfolog´ıa y la posición del dedo. Por lo tanto, la mejora de la segmentación de las venas es muy importante para los pasos posteriores, como la extracción de caracter´ısticas o la etapa de clasificación.

En consecuencia, se propone Agrupamiento Espectral (SC) para la tarea de mejorar la segmentación de p´ıxeles de las venas aplicada en imágenes infrarrojas. Para hacerlo, se atacan los requerimientos de memoria del Agrupamiento Espectral para un gran núme- ro de muestras considerando pequeñas particiones disjuntas de la imagen y comparando los agrupamientos resultantes para unirlos evitando la necesidad de pasos posteriores de procesamiento. Finalmente, los resultados se comparan en términos de precisión de cla- sificación del usuario obteniendo una tasa de acierto de 99.85 % en las bases de datos utilizadas de la universidad de Twente y Politécnica de Hong kong.

Palabras clave: Autenticación de venas del dedo, biometr´ıa, vena del dedo, extracción de caracter´ısticas, reconocimiento de patrones, clasificación, aprendizaje automático, validación de identidad, extracción de venas del dedo.

(12)

(13)

Cap´ıtulo 1

Introducci´ on

Utilizar las caracter´ısticas de las personas para identificarlas, es una tarea que se re- monta desde civilizaciones como los Egipcios, cuando utilizaban la antropometr´ıa (medidas de algunas partes del cuerpo) para identificar personas, más adelante otra caracter´ıstica como la huella dactilar se utilizó en la antigua China (105 D.C.), al estampar con tinta china las marcas de los dedos o la palma de la mano en documentos de registro oficial, desde entonces la tarea de identificación ha pasado desde oriente a occidente.

Los primeros indicios en occidente se remontan al año 1850 cuando Sir William James Herschel empieza a incluir el uso de la huella dactilar en acuerdos y contratos. En el mismo año, Herschel –que además era un astrónomo aficionado– da pie a otro tema de relevancia en este escrito: La luz infrarroja (Sección 2.2), descubriendo que el calor era más intenso a lado del color rojo del espectro. Y, de esta manera, sus experimentos fueron el inicio del estudio de la radiación infrarroja.

En 1880, el m´edico Henry Faulds por iniciativa propia recolecta y guarda huellas dactilares de humanos y primates, y llega a la conclusi´on de que las huellas dactilares eran

´

unicas y además suger´ıa que estas podr´ıan ser clasificables. En el mismo año, se inventó el primer bolómetro utilizado para medir la radiación infrarroja que proven´ıa del sol, abriendo el paso a diversos estudios en relación con la luz infrarroja y sus aplicaciones.

Con la adquisición de imágenes digitales en el espectro infrarrojo se abre la posibilidad de que se desarrollen estudios sobre todo en medicina y seguridad, ya sea para la identifi- cación de personas, detección de anomal´ıas, etc [TV13].Y aunque muchos trabajos se han realizado, los sistemas de identificación son temas aún emergentes, por ejemplo, el uso de patrones de las venas del dedo surge como una nueva forma de biometr´ıa [Ton12].

Impulsados por la evolución de la computadora y el procesamiento de la señal, sur- gieron varios paradigmas para la identificación de usuarios basados en diferentes datos biométricos obtenidos de caracter´ısticas como retina, firma, caracter´ısticas de la cara, iris del ojo, voz, patrones vasculares, temperatura de la cara [Mil94], como se puede observar de manera comparativa en el Cuadro 2.1). En particular, los patrones vasculares ofrecen varias ventajas como gran confiabilidad (alta seguridad), fácil de usar, alta aceptación, estabilidad y prevención de ataques [MY13, SISS⁺16]. Además, se pueden adquirir de manera no invasiva, los patrones no cambian con el tiempo (estabilidad), son únicos para cada persona, incluso hay más de un patrón disponible por persona (diez dedos: mano izquierda y derecha y cada uno de ellos son diferentes); y, finalmente, las imágenes solo se pueden tomar cuando una persona está viva [YSY11, WZL10]. Por otro lado, se han

(14)

propuesto diversos aproximaciones para extraer de manera eficiente los patrones de las venas [SISS⁺16], sin embargo Agrupamiento Espectral ó Spectral Clustering (SC) no ha sido aplicado a esta tarea. SC es un algoritmo utilizado ampliamente en el agrupamien- to de elementos, utiliza operaciones simples de álgebra lineal, es fácil de implementar y ha demostrado ser ampliamente mejor en el agrupamiento en espacios inclusive de alta dimensionalidad.

1.1. Motivaci´ on y contexto

La identificación biométrica y la detección de anomal´ıas es un tema aún emergente, debido a la vulnerabilidad de los sistemas de seguridad tradicionales, encontrando en el patrón de venas un aliado perfecto [Ton12].

De acuerdo a las diversas aproximaciones revisadas en el estado del arte en relación a la etapa de extracción de caracter´ısticas [SISS⁺16], el éxito de estas aproximaciones se ve sujeto en mucho de los casos a sistemas muy controlados, no simulando un entorno real [YRL11].

Dentro de las aproximaciones revisadas, el algoritmo de SC presenta muchas ventajas para el agrupamiento de muestras similares que pertenecen al mismo grupo. Por ello, da- das las bondades de esta técnica surge la idea de utilizarla para la etapa de extracción de caracter´ısticas, siendo un algoritmo ampliamente utilizado en la segmentación de imágenes [XG], en consecuencia surge la idea de proponer SC para la etapa de extracción de caracter´ısticas para el reconocimiento de patrones de venas en imágenes infrarrojas de los dedos.

1.2. Planteamiento del problema

Si bien es cierto que ya existen sistemas de seguridad, lamentablemente la extracción de estos patrones vasculares se ve afectada por muchos problemas, como el dispositivo de captura, las variaciones de luz, la fuerza ejercida sobre el dedo, los tejidos, los huesos con diferente morfolog´ıa y la posición del dedo, por ello necesitamos nuevas alternativas para mejorar esos sistemas de extracción de caracter´ısticas. Un método eficiente en la etapa de extracción de caracter´ısticas, nos proporcionará mayor eficiencia en cuanto a seguridad o detección de anomal´ıas. Es as´ı que al proponer SC en la etapa de extracción de caracter´ısticas se busca obtener de manera eficiente los patrones de venas para incluir SC dentro de la tarea de reconocimiento de patrones y medir su eficiencia utilizándolo en un clasificador de usuarios. Además, los requerimientos de memoria de SC escalan rápidamen- te con respecto del número de muestras, por lo que trabajos anteriores aplican SC sobre grupos pequeños de muestras y utilizan extensos procedimientos de post-procesamiento para unir los resultados sobre tales grupos. En la presenta tesis se hace un planteamiento para resolver estos problemas de escalabilidad.

(15)

1.3. Objetivos

1.3.1. Objetivo general

Extracción de caracter´ısticas basados en Agrupamiento Espectral aplicado a imágenes infrarrojas de las venas en los dedos para la identificación de usuarios.

1.3.2. Objetivos espec´ıficos

Para lograr el objetivo general de este trabajo de tesis, se tiene que llevar a cabo los siguientes objetivos espec´ıficos:

1. Implementar el algoritmo de Agrupamiento Espectral para analizar la Regi´on de Inter´es y poder segmentar regiones que contengan p´ıxeles de venas.

2. Realizar la reducci´on de dimensionalidad utilizando An´alisis de Componentes Prin- cipales.

3. Optimizaci´on y validaci´on de un regresor log´ıstico multiclase para clasificar usuarios.

1.4. Metodolog´ıa

Utilizaremos una metodolog´ıa basada en la b´usqueda de informaci´on cient´ıfica.

1.4.1. L´ınea(s) de investigaci´on

De acuerdo a las l´ıneas sectoriales de la Escuela Profesional (EP) de Ingenier´ıa Electróni- ca y de Telecomunicaciones (IET), el presente trabajo de tes´ıs esta enfocado al Procesa- miento de señales y datos (tratamiento de imágenes infrarrojas).

1.4.2. Tipo de investigaci´on

La presente tesis profesional involucra dos tipos de investigaci´on:

1. Investigación Cient´ıfica, el desarrollo del presente escrito, esta basado en evidencia cient´ıfica ya existente (art´ıculos), se compararon y analizaron diversos métodos ya existentes, utilizados y probados para la extracción de caracter´ısticas y clasificación, para que de ese modo se pueda proponer una debida metodolog´ıa y procedimientos para lograr el objetivo general.

2. Investigación de Innovación, también la presente tesis, es considerada de inovación ya que en las diversas aproximaciones revisadas en el estado del arte [SISS⁺16], el método de SC propuesto para esta tarea, no ha sido aplicado al reconocimiento de patrones de venas, por tanto los resultados descritos en el presente trabajo, deter- minarán un nuevo camino a ser aplicado a la etapa de extracción de caracter´ısticas en imágenes infrarojas de los dedos.

(16)

1.4.3. M´etodos para experimentos y pruebas

El panorama general de la metodolog´ıa utilizada se muestra en la Figura 1.1.

Pre-Procesamiento Región de Interés

Agrupamiento Espectral (SC) Clasificación y Validación

Bases de Datos

Pre-Procesamiento Región de Interés

Bases de Datos

Clasificación y Validación

(a) (b)

Agrupamiento Espectral (SC)

Análisis de Componentes Principales (PCA)

Figura 1.1: Diagrama de la metodolog´ıa Utilizada: (a) Sin reducci´on de dimensionalidad;

y, (b) Aplicando reducci´on de dimensionalidad.

Las dos aproximaciones mostradas en la Figura 1.1 son dos esquemas muy similares, sin embargo como se puede observar en la Figura 1.1.b se agrega una etapa de reducción de dimensionalidad, la Figura 1.1.a representa el diagrama de bloques para la primera aproximación, donde se resalta solo el uso de SC para la extracción de caracter´ısticas, la segunda aproximación se puede observar en el diagrama de bloques de la Figura 1.1.b en dónde se resalta que además de extraer las caracter´ısticas con el uso de SC se incluye una etapa adicional de reducción de dimensionalidad (aplicación de Análisis de Componentes Principales (PCA)), con el objetivo de optimizar tiempo y almacenamiento, finalmente ambos esquemas son clasificados y validados.

La propuesta de solución para la extracción de los patrones de venas y clasificación, se describen a continuación:

1. Adquisición de imágenes: Comúnmente involucra un dispositivo con un sensor infrarrojo (también se desarrollan sistemas basados en luz visible). Sin embargo, nuestro propósito es ver el impacto de SC, para ello utilizaremos bases de datos ya disponibles que nos facilitan el proceso de adquisición de imágenes, para el desarrollo y experimentación de la presente tesis se utilizó dos bases de datos, indicadas a continuación:

a) La proporcionada por la Universidad de Twente - Finger Vascular Pattern Da- tabase (BD1) [TV13], la cual se describe con mayor detalle en la Secci´on 2.5.1.

b) La base de datos de la Universidad Polit´ecnica de Hong Kong - Finger Image

(17)

Database (Version 1.0) (BD2) [AK, KZ11], la cual esta descrita con mayor detalle en la Secci´on 2.5.2.

2. Pre-Procesamiento: Se implementó varios procedimientos para la estandarización y mejora de imágenes con el fin de extraer la Región de Interéspor sus siglas en inglés Region of Interest (ROI), sin embargo al trabajar con dos bases de datos, cada uno de ellos representa un caso particular en cuanto al preprocesamiento.

a) Para el caso de la Base de Datos 1 (BD1) [TV13], de la universidad de Twente, las muestras se encontraban con mayor calidad, por tanto se realizó un en- mascarado directo con el algoritmoSimple Linear Iterative Clustering (SLIC), posteriormente se mejoró la visualización de las venas aplicando una equaliza- ción por histograma adapatativo y ajuste de contraste. Finalmente se halló el promedio de todas las máscaras para detectar donde se encontraba la mayor actividad de información de las venas, para poder obtener la ROI final.

b) En el caso de la Base de Datos 2 (BD2) [AK, KZ11], de la universidad Po- litécnica de Hong Kong, se realizó un filtrado de las muestras de peor calidad y se eliminó aquellas muestras que ten´ıan muy baja correlación con las demás.

Luego se aplicó una equalización por histograma adaptativo y ajuste de contraste. Finalmente se halló el centro de masa y se definió de acuerdo al ancho del dedo la ROI final.

3. Extracci´on de Caracter´ısticas: Implementa procedimientos para segmentar p´ıxeles de venas desde la ROI.

a) Segmentación de venas: Se aplica Agrupamiento Espectral (SC) para realizar esta tarea, se selecciona primero una semilla patrón de una imágen donde se diferencien claramente las regiones de venas del fondo, para poder aplicarlo a toda la imágen de forma iterativa y asi obtener el patrón final de venas para cada muestra.

b) Reducción de la dimensionalidad: Para poder reducir la redundancia en las imágenes resultantes y optimizar los recursos de procesamiento, se aplicó PCA para reducir la dimensionalidad, la cúal es adecuada para preparar los datos que se utilizarán en las próximas etapas.

1.4.4. Formas de comprobaci´on

Clasificación y Validación: Para poder comprobar la eficiencia en la etapa de extracción de caracter´ısticas, se clasificó mediante el uso de un regresor log´ıstico multiclase, debido al número de muestras, para la BD1, cuatro muestras por dedo, y para la BD2, doce muestras por dedo; se entrenó el clasificador y se validó mediante validación cruzadapor sus siglas en inglés Leave-one-out cross-validation (LOOCV), una alta tasa de acierto en la etapa de clasificación, es una manera de comprobar la eficiencia de SC en la etapa de extracción de caracter´ısticas, además se utilizó dos criterios, el primero sin reducción de dimensionalidad y el segundo aplicando reducción de dimensionalidad (PCA).

(18)

1.5. Consideraciones Complementarias

1.5.1. Recursos y Materiales

Software,por sus siglas en ingl´es MATrix LABoratory (MATLAB) 2019.

Hadware, Laptop o PC de escritorio, core i76600-8GB.

Organizaci´ on del Presente Documento

El Cap´ıtulo 1 (Introducción) incluye la motivación y contexto, además del planteamiento del problema, también incluye el objetivo general y espec´ıficos, finalmente la metodolog´ıa propuesta y algunas consideraciones complementarias.

En el Cap´ıtulo 2 (Marco Teórico) se describen conceptos previos necesarios para el desarrollo de la presente investigación además de los métodos y algoritmos utilizados de acuerdo a la metodolog´ıa propuesta.

El Cap´ıtulo 3 (Estado del Arte) describe las investigaciones que sirvieron como base y referencia de acuerdo a cada etapa de la metodolog´ıa propuesta en la secci´on 1.4.

En el Cap´ıtulo 4 (Propuesta de Soluci´on) se detalla a profundidad cada etapa propuesta para enfrentar los desaf´ıos que nos plantea el objetivo general y espec´ıficos.

El Cap´ıtulo 5 (Resultados y comparaciones) muestra los resultados obtenidos para cada objetivo espec´ıfico, adem´as de gr´aficas y comparaciones, finalmente se describen las conclusiones previas a las que se ha llegado.

En el Cap´ıtulo 6 (Conclusiones y trabajos futuros) se presentan las conclusiones finales adem´as de posibles trabajos futuros.

(19)

Cap´ıtulo 2

Marco Te´ orico

2.1. Biometr´ıa

2.1.1. Introducci´on

De acuerdo al Diccionario de la Real Academia de la Lengua Española, la definición de biometr´ıa es:Estudio mensurativo o estad´ıstico de los fenómenos o procesos biológicos, sin embargo, en un sentido espec´ıfico la biometr´ıa se la concibe como aquella ciencia de- dicada al estudio estad´ıstico y probabil´ıstico de caracter´ısticas cuantitativas de personas, tales como: huellas dactilares, peso, altura, etc. Este término es utilizado para referir a los métodos automáticos que analizan determinadas caracter´ısticas humanas con el fin de identificar y autenticar a las personas [ST05].

En [PGCY09], la biometr´ıa hoy en d´ıa está ampliamente relacionada con la seguridad, criminolog´ıa y seguridad informática, estas áreas son la base de los sistemas de seguridad, las tecnolog´ıas biométricas son aplicables en las organizaciones, un ejemplo es que para realizar ciertas operaciones es necesario la identificación de la persona ya sea con su clave secreta o tarjeta y al mismo tiempo al individuo también se le puede identificar biométricamente, por ejemplo, mediante su huella dactilar.

2.1.2. Identificaci´on Biom´etrica

Identificación se refiere a que, mediante un sistema biométrico, se trata de responder a la pregunta: ¿Quién es la persona XX?, se tiene la información de la persona de la que se desconoce su identidad, para ello se debe contar con un sistema que guarde e identifique personas [ST05].

2.1.3. Aplicaciones Biom´etricas

De acuerdo a [MY13], las aplicaciones biométricas son aplicables prácticamente a cualquier caracter´ıstica que pueda ser usada para la identificación, dentro de las caracter´ısticas biométricas actualmente utilizadas, tenemos:

1. Huella dactilar: Dentro de sus ventajas se encuentra la fácil extracción y práctica- mente cero costes, lo cual le permite ser la más popular.

(20)

2. ADN ( Ácido Desoxirribonucleico): Es la única técnica a través de la cual la identidad de una persona puede ser confirmada con un cien por cien de éxito, sin embargo, son muy costosas y de alto coste computacional al procesar los datos.

3. Iris: Esta aplicación se centra básicamente en los estudios de John Daugman que confirma la inalterabilidad que tiene el iris durante el ciclo de vida de un ser humano, siendo muy superior a la huella dactilar, no obstante, el coste de los equipos para realizar este tipo de identificación es demasiado alto.

4. Voz: Es una aplicación muy estudiada de fácil obtención y es por eso que es una aplicación muy extendida para fines de identificación. Sin embargo, la voz esta sujeta a muchas variaciones del entorno y del medio, además que var´ıa con la edad, el padecimiento de ciertas enfermedades o simplemente con cambios de ánimo, . 5. Retina: Su principal fortaleza se encuentra en la geometr´ıa vascular que tiene y

supera en fiabilidad incluso al iris, el problema se encuentra en que es necesario un l´aser para capturar muestras raz´on por la cual las personas muestran rechazo.

6. Reconocimiento facial: Es una de las utilizadas en la actualidad, por ejemplo, es los celulares de alta gama, debido a que capturar muestras es f´acil y barato, sin embargo, uno de los principales inconvenientes es que es muy sensible a cambios o variaciones tales como usar gafas, vello, corte, fotograf´ıas y variaciones de luz.

7. Geometr´ıa de la mano: Existen diversas bases de datos, debido a que es rápido, en se- gundos se puede identificar usuarios; está indicado para ambientes con una densidad de identificación bastante alta donde la rapidez es un requerimiento importante.

8. Firma: Es una de la mas conocidas, sin embargo, su fiabilidad es cuestionable, ya que falsificar una firma es relativamente fácil, por tanto, su fiabilidad es muy baja en cuanto a método biométrico.

9. Vascular: Este método de identificación utiliza el patrón de venas de los dedos o de la mano, es una caracter´ıstica con una fiabilidad muy alta, facilidad de uso y prevención de ataques. Una de las ventajas que presenta frente a otros métodos como la identificación por el iris, es que este no requiere de luz visible (400−750 nm), mientras que para el patrón de venas de dedos o manos requiere de luz infrarroja (800−950 nm) la cual la hace menos variable al momento de capturar las muestras para la identificación.

En el Cuadro 2.1, se compara los diversas caracter´ısticas biom´etricas existentes con de- terminados criterios que determinan las ventajas de uno respecto a los otros [ST05], se resalta la preponderancia que tiene la caracter´ısticas vascular de los dedos y la mano.

2.2. El Especto Electromagn´ etico

2.2.1. Introducci´on

El espectro electromagnético es la clasificación de energ´ıa de un grupo de ondas elec- tromagnéticas [GSM02], incluyen los rayos gamma, la luz ultravioleta, la luz visible y los

(21)

Fiabilidad Facilidad de uso

Prevenci´on de ataques

Aceptaci´on Estabilidad

Iris Muy alta Media Muy alta Media Alta

Retina Muy alta Baja Muy alta Baja Alta

Huellas dactilares

Muy alta Alta Alta Alta Alta

Vascular dedo

Muy alta Muy alta Muy alta Alta Alta

Vascular mano

Muy alta Muy alta Muy alta Alta Alta

Geometr´ıa de la mano

Alta Alta Alta Alta Media

Escritura y firma

Media Alta Media Muy alta Baja

Voz Alta Alta Alta Muy alta Alta

Cuadro 2.1: Comparaci´on de diversas caracter´ısticas biom´etricas.

infrarrojos, hasta las ondas de radio. La Figura 2.1 muestra la representación de las diferentes longitudes de onda con objetos de uso común, además de su temperatura [ ÁG⁺13].

Edificios Humanos Mariposas Punta de aguja

Protozoos Moléculas Átomos Núcleo atómico

10⁴ 10⁸ 10¹² 10¹⁵ 10¹⁶ 10¹⁸ 10²⁰

1 K 100 K 10.000 K 10.000.000 K

¿Penetra la atmósfera terrestre?

Radio Microondas Infrarrojo Visible Ultravioleta Rayos X Rayos gamma

10³ 10⁻² 10⁻⁵ 0,5×10⁻⁶ 10⁻⁸ 10⁻¹⁰ 10⁻¹²

Tipo de radiación Longitud de onda (m) Escala aproximada de la longitud de onda

Frecuencia (Hz)

Temperatura de los objetos en los cuales la radiación con esta longitud de onda es la más intensa

−272 °C −173 °C 9.727 °C ~10.000.000 °C

Figura 2.1: El espectro electromagn´etico [ ´AG⁺13].

(22)

2.2.2. La Radiaci´on Infrarroja

Es un tipo de radiación electromagnética cuya longitud de onda es mayor que el de la luz visible, su longitud de onda va desde los 0.7 µm hasta los 1000µm [ ÁG⁺13].

2.2.3. Espectro Infrarrojo

La regi´on infrarroja se clasifica de acuerdo a su longitud de onda, esta clasificaci´on se puede observar en el Cuadro 2.2.

Nombre Longitud de ondaµm Infrarrojo Cercano 0,75−3

Infrarojo Medio 3−8 Infrarrojo Lejano 8−15 Infrarrojo Extremo 15−1000

Cuadro 2.2: Clasificaci´on del espectro infrarrojo

2.3. Im´ agenes de las venas de los dedos en el Infrarrojo Cercano

Una de las principales razones por las que se utiliza el Infrarrojo Cercanopor sus siglas en inglés Near InfraRed (NIR), es porque biológicamente existe una “ventana de absor- ción”(700µm- 900µm), dónde la luz incidente puede penetrar profundamente a los tejidos, por ejemplo, el nivel de absorción (Figura 2.2) de hemoglobina desoxigenada presenta su punto máximo de absorción en el espectro del infrarrojo cercano (NIR) [WESS05, FF02].

700 800 900 1000

Longitud de Onda (nm) 1

2 3 4

Hemoglobina Oxigenada Hemoglobina Desoxigenada

<<< Absorción de Ondas a 760 nm.

Nivel de Absorción (1/cm)

Figura 2.2: Nivel de absorci´on de hemoglobina desoxigenada [FF02].

Para poder aprovechar las ventajas en cuanto a penetrabilidad y absorción que poseen las venas y tejidos, es posible a través de hardware especialmente diseñado o de dispositivos de captura dedicados a esta tarea, por lo tanto obtener imágenes en el espectro infrarrojo

(23)

cercano de las venas de los dedos permite utilizarlas en diversas aplicaciones biom´etricas o de detecci´on de anomal´ıas [TC09].

2.4. Reconocimiento de Patrones de Venas

Es un procedimiento dónde se puede utilizar diversas técnicas para recoger información del medio, lo común es hacerlo por medio de sensores, para ello es necesario procesar la información capturada para poder compararla. Este llamado reconocimiento de patrones comprende cuatro fases básicas: Adquisición de los datos, segmentación, extracción de caracter´ısticas y clasificación. En la Figura 2.3 se muestra el diagrama de bloques de las principales etapas de un sistema de reconocimiento de patrones [GA91].

Adquisición Segmentación Extracción de

características Clasificación

Imagen Imagen

procesada Patrón

Decisión

Información Sensorial Clases

Figura 2.3: Principales etapas de un sistema de identificaci´on biom´etrico.

2.5. Descripci´ on de las Bases de Datos

2.5.1. Finger Vascular Pattern Database - Universidad Twente (BD1) La primera base datos elegida para el propósito de extraer caracter´ısticas e iden- tificación, es la base de datos creada por la Universidad de Twente, esta base de datos proporciona conjuntos de datos de patrones vasculares disponibles para la co- munidad de investigación, este conjunto de muestras contiene 1440 imágenes para un total de 60 usuarios [TV13],

Esta base de datos es única en su tipo, ya que las imágenes son de alta resolución y tienen una densidad de p´ıxeles óptima. Además, este es el primer conjunto de datos que contiene la edad, el género y la muestra de múltiples dedos por mano [Ton12].

Las imágenes capturadas por el sensor infrarojo son de 380 x 672 p´ıxeles y tienen una resolución de 126 p´ıxeles por cent´ımetro (ppcm). En unidades no métricas, esto ser´ıa 320 p´ıxeles por pulgada (ppi). El formato que se utiliza para almacenar las imágenes es (*.png) (Portable Network Graphics) de escala de grises de 8 bits.

Los dedos capturados fueron el anular, ´ındice y medio de ambas manos en dos diferentes sesiones para cada mano, se obtuvo cuatro im´agenes por dedo en cada sesi´on,

(24)

se realiz´o a un total de 60 usuarios, por tanto 6×4×60 = 1440 muestras, en la Figura 2.4, se muestra de manera gr´afica los dedos tomados en cuenta para la toma de muestras por mano.

Figura 2.4: Dedos involucrados en la toma de muestras (BD1) [Ton12].

2.5.2. Finger Image Database (Versi´on 1.0) - Universidad Polit´ecnica de Hong Kong (BD2)

La segunda Base de Datos elegida, peternece a la Universidad Politécnica de Hong Kong [AK, KZ11], el principal objetivo de esta fue crear un conjunto de muestras a una escala alta para ponerla a disposición de los investigadores que requieran ampliar el conocimiento en investigación de las aplicaciones que involucran este tipo de imágenes.

Esta base de datos contiene 6264 imágenes de un total de 156 usuarios y todas las imágenes estan en formato de mapa de bits (*.bmp), cada imágen es de 513 x 256 p´ıxeles.

Dentro del tipo de muestras, contiene los patrones vasculares y las im´agenes de los dedos, captados en la banda infrarroja y luz visible respectivamente.

La toma de datos se realizó en dos sesiones diferentes, en cada sesión se proporcio- naron 12 muestras por dedo, solo se tomaron muestras del dedo ´ındice y medio de la mano izquierda, 6 muestras pertenec´ıan al patrón vascular y las otras 6 a la imagen de la textura del dedo, de modo que cada usuario proporcionó en total 24 imágenes por sesión [AK].

El n´umero de muestras de patrones vasculares por cada sesi´on es 12, de las cuales 6 pertenecen al primer dedo y 6 corresponden al segundo dedo, por tanto para un total de 156 usuarios y dos sesiones se obtienen 12×156 = 1872 muestras para cada dedo, en total 1872×2 = 3744 muestras de patrones vasculares en total para todos los dedos.

(25)

2.6. Pre-Procesamiento

2.6.1. Segmentaci´on de Fondo - M´etodo Superp´ıxeles

Superp´ıxeles es un nuevo algoritmo basado en k-means, que utiliza Agrupamiento Iterativo Lineal Simple (SLIC), se utilizó superp´ıxeles para realizar el segmentado del borde del dedo con el fondo, este método funciona a partir de una máscara patrón binaria que se selecciona manualmente de una imágen donde se diferencien claramente el fondo del borde del dedo, para posteriormente aplicarlo a todas las muestras [ASS⁺12].

2.6.2. Mejora Visualizaci´on de las Venas

Para realizar esta tarea se aplicaron dos funciones implementadas en Matlab [LS14], que se describen brevemente a continuaci´on:

imadjust, esta función nos permite ajustar el contraste de los diferentes p´ıxeles de la imágen con nuevos valores, los valores altos se saturan, mientras que los bajos se atenúan.

adapthisteq, con esta función mejora cada grupo de p´ıxeles para que coincida con una distribución uniforme determinada por el programador, a diferencia de otras funciones, la mejora del contraste se da en pequeñas regiones de la imágen de forma iterativa hasta recorrer toda la imágen, de este modo se mejora el contraste en cada porción de imágen para finalmente mostrar todas las porciones en conjunto, mejorando el contraste global de forma eficiente.

2.6.3. Regi´on de Inter´es (ROI)

Una de las cosas más importantes que puede hacer un investigador para aumentar la productividad es asegurarse de que los recursos informáticos no se gasten en cálculos innecesarios. Tenemos algunas maneras diferentes de evitar el exceso de cómputo, por ello uno de los métodos más básicos es seleccionar una ROI.

Una Región de Interés ó ROI es una área especificada por el usuario que puede usarse para limitar ciertos cálculos de composición dentro de sus l´ımites (generalmente tempo- rales). El uso del ROI para limitar los cálculos se realiza principalmente como un paso intermedio entre etapas, es decir, cuando uno desea concentrarse en ajustar un área particular de la imagen completa [Bri08]. En el presente trabajo se utiliza una ROI rectangular por simplicidad

Al especificar una región de interés en un área determinada, permite a la computadora que se ocupe exclusivamente de los p´ıxeles que elija. Existen imágenes que tienen zonas complejas que pueden quedar fuera de cualquier ROI especificado, por tanto podrá ignorar estas áreas complejas por completo cuando trabaje solo dentro del ROI.

(26)

2.7. Extracci´ on de caracter´ısticas

2.7.1. Descripci´on del M´etodo Agrupamiento Espectral (SC)

El agrupamiento espectral tiene una simple formulaci´on y puede ser resuelto por operaciones simples de ´algebra lineal, sin embargo, produce mejores resultados que algoritmos de agrupamiento tradicionales como k-means [XG, VL07].

2.7.1.1. Distancia Euclidiana

Existen diferentes formas de encontrar distancias, la mas simple es la distancia Eucli- diana.

Dado un conjunto de N datos X ∈ R^D×N cuyas columnas son las muestras x⁽ⁿ⁾ ∈ R^D×1, siendo D el número de caracter´ısticas de la n-ésima muestra.Luego, la distancia Euclidiana entre las m-ésima y n-ésima muestras,x_m yx_n respectivamente, esta definida por:

w_a(m, n) = v u u t

D

X

d=1

x^(m)_d −x⁽ⁿ⁾_d 2

∀ {1,2, ..., N} (2.1) As´ı, podemos definir la matriz de distanciasW_a∈R^N×N con elementosw_a(m, n).

Una caracter´ıstica importante de la matriz W_a es que sus elementos de la diagonal principal serán ceros. Los valores deWavan desde 0 hasta∞, esto significa que mientras más cercano este el valor de 0 las muestras x^(m) yx⁽ⁿ⁾ se parecen más; y, mientras más grande sea el valor, es decir tienda a infinito, las muestras x^(m) yx⁽ⁿ⁾ no se parecen.

2.7.1.2. Funci´on de Similitud Gaussiana

Los valores en Wa estan entre 0 hasta ∞; es decir, los valores no est´an controlados.

Este descontrol en los valores causan problemas, de modo que se debe buscar un modo de ecualizar estos valores. Para ello, se utiliza la funci´on de similitud gaussiana definida en la Ecuaci´on 2.2.

Wb(m, n) =exp −kx^(m)−x⁽ⁿ⁾k² 2σ²

!

(2.2) Una ventaja de aplicar la ecualización es que los valores enWb están restringidos entre 0 y 1. En este caso, las similitudes entre dos datos m y nse expresan de tal manera que si W_b(m, n) está cerca de cero, los puntos están lejanos; y por el contrario, si los valores son cercanos a uno significa que los puntos están lo suficientemente cerca.

W_b(m, n) =

(1 parecidos

0 distintos (2.3)

En la Ecuación 2.2, σ² es un hiperparámetro necesario para validar, s´ı es grande agrupa más los puntos (equivaldr´ıa a forzar que se acerquen); es decir, no solo toma en cuenta las distancias. Por el contrario, el valor de σ², alejará más los datos. Este valor σ² por tanto regula el valor de la distancia; y, es un hiperparámetro que se modifica de acuerdo a la naturaleza del problema que se desea atacar.

(27)

2.7.1.3. Norma de la matriz

Los valores ahora se concentran en un único rango entre 0 y 1 (Ecuación 2.3), estos valores siguen siendo una medida de la distancia que ya los tenemos controlados gracias a la función de Similitud Gausiana.

La matriz W_b (Ecuaci´on 2.2), ya tiene en su diagonal principal puros 1. Normalizar en este contexto significa hacer que los elementos de una fila y que este fuera de la diagonal principal sumen 1. Para normalizar se debe conseguir primero que la diagonal principal valga 0, para ello se resta de W_b una matriz con diagonal principal de puros 1 (matriz identidadD) as´ı como se muestra en la Ecuaci´on 2.4.

Wcc=D−Wb (2.4)

El siguiente paso es dividir cada fila entre la suma de los valores de toda la fila para poder normalizarla, se debe tener presente que los elementos de la diagonal principal valen 0, en consecuencia no afecta la suma de los elementos de una fila. La obtenci´on de los elementosW_c(m, n) de la matriz normalizada W_c∈R^N×N se muestra en la Ecuaci´on 2.5.

Wc(m, n) = Wcc(m, n) PN

n=1Wcc(m, n) (2.5)

Finalmente los elementos de la diagonal principal de W_c tendr´a en su diagonal principal puros 1.

2.7.1.4. Grado de la Matriz

La matriz Wc esta normalizada, decimos que su grado es 1, porque la suma de todos los elementos de cada fila deW_csuma 1, el grado de la matriz esta dado como la suma de los elementos de cada fila fuera de la diagonal principal igual a 1, definido en la Ecuaci´on 2.6.

DA=







1 0 0 0

0 ... 0 0

0 0 1 0

0 0 0 1







N×N

(2.6)

Donde D_A es del mismo tama˜no queW_c. 2.7.1.5. Laplaciano Normalizado

Finalmente el Laplaciano normalizado no es m´as que la matricial entre el grado de la matriz (DA) menos la norma de la matriz (Wc), definido en la Ecuaci´on 2.7.

L=DA−Wc (2.7)

Las principales propiedades de la matriz Laplaciana son:

Es sim´etrica y semi-definida positivamente.

(28)

El m´ınimo valor de sus eigenvalores de L es 0, que corresponde al eigenvector de constante 1.

Los elementos de la matrizL no tiene valores negativos.

Lo m´as importante de encontrar el Laplaciano normalizado, es sus eigenvalores y sus eigenvectores.

Los eigenvalores nos darán información de cuantos grupos se distinguen, mientras más cercanos a 0 se encuentren, serán entonces un grupo o clase diferenciada [VL07].

Dentro de la importancia de los eigenvectores, el eigenvector 1 y 2, son los m´as importantes:

1. El eigenvector uno, muestra la distribución de clases diferenciadas, sin embargo los valores que describen esta distribución se encuentran muy acotadas, y no es posible determinar un parámetro de corte.

2. El eigenvector dos, a diferencia del uno nos mostrará la distribución de los grupos o clase diferenciadas con valores lo suficientemente separados para poder definir un parámetro de corte y de esa manera diferenciar las clases.

2.7.1.6. Agrupamiento Espectral para gran cantidad de datos

Una desventaja principal es que el tama˜no de la matriz laplaciana L se escala como O(N²). Para grandesNes f´acil encontrar una cantidad prohibitiva de recursos de memoria.

El enfoque más común es realizar Agrupamiento Espectral sobre pequeños subconjuntos de datos y luego realizar pasos fuertes de procesamiento posterior porque pueden surgir diferentes problemas dada la naturaleza de los datos.

En el contexto de la segmentación del patrón de venas, la tarea es agrupar automáti- camente todos los p´ıxeles que pertenecen a las venas en un grupo y cualquier otro p´ıxel a un segundo grupo.

Para hacerlo, un primer enfoque es dividir una imagen en partes peque˜nasyky realizar Agrupamiento Espectral. Sin embargo, da como resultado diferentes problemas:

1. Un primer problema surge cuando todos los p´ıxeles de y_k tienen valores iguales o cercanos, por ejemplo, si y_k solo tiene p´ıxeles venosos, se encontrar´an subgrupos.

Para resolver este problema, seleccionamos un pequeño subconjunto de p´ıxeles de la imagen que contiene muestras de diferentes grupos de interés, llamamos a este fragmento de imagen como semilla (y_s). Después de unir y_s a todos los subconjuntos diferentes yk (concatenarlos como ys,k = [yk;ys]), se realiza el procedimiento de Agrupamiento Espectral descrito anteriormente. Como resultado, incluso si y_k contiene los mismos p´ıxeles, el procedimiento de Agrupamiento Espectral asignará todos los p´ıxeles al mismo grupo que en la semilla, ya que contendrá información deseable de muestras de diferentes agrupaciones evitando la agrupación intragrupo.

(29)

2. Un segundo problema está relacionado con el orden de asignación de los clústeres.

Esto se debe a que un autovectorv₁proporciona la misma información de clúster que v₂ =−v₁. Para corregir esto, primero realizamos la agrupación eny_sy guardamos el segundo vector propiovs. Luego, después de aplicar Agrupamiento Espectral sobre y_s,k = [y_k;y_s], comparamos valores dentro de vectores propios correspondientes a p´ıxeles de y_k (llamado v_s,k), y tome el signo de la correlación cruzada entre v_s y v_s,k. Si el signo de dicha correlación cruzada es positivo, ambos vectores propios asignarán las mismas asignaciones a los grupos y el vector propio es ˆv_s,k=v_s,kpero si el signo es negativo, entonces simplemente corregimosv_s,k multiplicándolo por -1, es decir, ˆvs,k=−v_s,k.

2.7.2. An´alisis de Componentes Principales (PCA) 2.7.2.1. Introducci´on

PCA es una técnica estad´ıstica útil que ha encontrado aplicación en campos como el reconocimiento de rostros y compresión de imágenes, es una técnica común para encontrar patrones comprimidos en datos de alta dimensión. Este método de reducción de caracter´ısticas utiliza informació de la matriz de covarianza [Smi02].

2.7.2.2. Matriz de Covarianza

Dado la matrizX correspondiente a los datos de entrenamiento, dondeDes el n´umero de caracter´ısticas y N el n´umero de clases.

X =







... ... ... ... ... ... ... ... ... ... x⁽¹⁾ x⁽²⁾ x⁽ⁿ⁾ ... x^(N)

... ... ... ... ... ... ... ... ... ...







D×N

(2.8)

donde cada columna en X es una muestra x⁽ⁿ⁾ ∈R^D×1

x⁽ⁿ⁾ =





 x⁽ⁿ⁾₁ x⁽ⁿ⁾₂ ... x⁽ⁿ⁾_D







D×1

(2.9)

con media µ_x∈R^D×1;

µ_x=





 µ₁ µ2

... µD







D×1

(2.10)

y que puede ser calculada muestralmente como sigue:

(30)

µx= 1 N

N

X

n=1

x⁽ⁿ⁾ (2.11)

Una forma ´util de obtener todos los posibles valores de covarianza entre todas las diferentes dimensiones es calcularlos todos y colocarlos en una matriz. De modo que, la matriz de covarianza para un conjunto de datos esta definida en la Ecuaci´on 2.12.

C=







σ₁₁² σ₁₂² σ₁₃² . . . σ_1D² σ₂₁² σ₂₂² σ₂₃² ...

... ...

σ_D1² σ_D2² · · · σ_DD²







D×D

(2.12)

Entonces los elementos de la matriz de covarianzaCse puede calcular con la Ecuaci´on 2.13.

σ_i,j² =

N

X

n=1

(x⁽ⁿ⁾_i −µi)(x⁽ⁿ⁾_j −µj) (2.13) Algunos puntos a tener en cuenta respecto de la matriz C, son las siguientes:

La matriz es sim´etrica respecto a la diagonal principal [Smi02].

La diagonal principal contiene las varianzas de cada dimensi´on σ_dd² [Smi02].

2.7.2.3. Eigenvectores y Eigenvalores

Los eigenvectores de una matriz son los vectores no nulos que después de operar, dan como resultado a un eigenvalor (múltiplo escalar de s´ı mismos), es decir no cambian su dirección.

λv=Cv λv−Cv= 0 (λI−C)v= 0

(2.14) Para poder hallar los eigenvectores de una matriz, se debe saber que solo es aplicable a matrices cuadradas como lo es la matrizC(eq. 2.12), tambi´en es preciso aclarar que no todas las matrices cuadradas tienen vectores propios.

Los vectores propios de las transformaciones lineales son vectores que no son afectados por la transformación o sólo resultan multiplicados por un escalar, en consecuencia no var´ıan su dirección [DB00].

(31)

2.8. Clasificaci´ on y Validaci´ on

2.8.1. Regresor Log´ıstico

Para el caso de clasificación multiclase en donde las salidas están limitadas a ciertos valores, se utiliza la función de activación log´ıstica o sigmoide Ecuación 2.15 [RG16].

σ(z) = 1

1 + exp(−z) (2.15)

-30 -20 -10 0 10 20 30

z 0

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Sigma(Z)

Figura 2.5: Funci´on de Activaci´on Log´ıstica

La Figura 2.5, representa la funci´on sigmoide, n´otese que el valor de 0 cae justo en 0.5.

La relaci´on de los datos (x⁽ⁿ⁾ ∈ R^D×1) y sus etiquetas (y∈ R^K×1) est´a definida por las ecuaciones 2.16 y 2.17 respectivamente.

z⁽ⁿ⁾=W^Tx⁽ⁿ⁾ (2.16)

donde z∈R^K×1 yW ∈R^D×K ˆ

y⁽ⁿ⁾=σ(z⁽ⁿ⁾) (2.17)

en donde ˆy es una estima de la etiqueta verdaderay; y, σ es la funci´on de activaci´on sigmoidal.

2.8.1.1. Funci´on de coste

La función de coste utiliza el Error Cuadrático Medio por sus siglas en inglés Mean Squared Error (MSE). Para optimizar los pesos del Regresor Log´ıstico minimizamos una función de coste básicamente una función de coste mide que tanto var´ıan o discrepan los valores estimados entre las etiquetas de entrada.

M SE= 1 2N

N

X

n=1

ky⁽ⁿ⁾−yˆ⁽ⁿ⁾k² (2.18)

(32)

2.8.1.2. Descenso por gradiente

Su objetivo es buscar parámetros óptimos (W) del sistema paso a paso, siguiendo una dirección de descenso hacia un m´ınimo global de la función de coste.

W =W −η∂L

∂W (2.19)

En la Ecuaci´on 2.19, L = M SE (eq. 2.18) y _∂W^∂L esta dada por la Ecuaci´on 2.20;

además,η es un hiperparámetro llamado taza de aprendizaje que se utiliza para controlar el descenso por gradiente, mientras mayor sea este hiperparámetro el descenso se dará en pasos mas grandes, muy por el contrario mientras menor sea el valor de este hiperparáme- tro, el descenso se dara mas lentamente.

∂L

∂W =− 1 2N

N

X

n=1

∂z⁽ⁿ⁾

∂W

∂L

∂ˆy⁽ⁿ⁾

∂yˆ⁽ⁿ⁾

∂z⁽ⁿ⁾ (2.20)

∂L

∂W =−1 N

N

X

n=1

x⁽ⁿ⁾(σ⁰•(y⁽ⁿ⁾−yˆ⁽ⁿ⁾))^T (2.21) en donde • indica el producto punto yσ⁰ =σ(z⁽ⁿ⁾)•(1−σ(z⁽ⁿ⁾)) es la derivada de la funci´on sigmoidal.

En la Figura 2.6, se muestra el esquema general utilizado, para cada salida (etiqueta) y_k, dondekrepresenta el n´umero de clases a la salida de la red; y sus respectivas entradas x_n.

x0 x1

x

_D

... ...

W10 W1d W1D

y

k

y

₁

y

Figura 2.6: Esquema Gr´afico del Regresor Log´ıstico.

Los parámetros óptimos están representados en la matriz W (Ecuación 2.19),

W =







w11 w12 · · · w1K

w₂₁ w₂₂ · · · w_2K ... ... ... ... ... ... w_D1 w_D2 · · · w_DK







D×K

(2.22)

(33)

2.8.2. Leave One Out Cross Validation

Para la etapa de validación, se utilizó la validación cruzada dejando una muestra fuera para validación ó conocido como Leave One Out Cross Validation (LOOCV), esta forma de validar consiste en dejar un muestra como prueba por cada iteración y todo el resto de muestras para entrenamiento.

Iteración 1 Iteración 2 Iteración 3

Iteración N

Dato de Prueba

Dato de Prueba

N

Datos de Entrenamiento

. .. .. . .. .

Total de datos

Figura 2.7: Live One Out Cross Validation

Esta forma de validación es precisa cuando se tiene un número de muestras reducida, para poder hallar el error de evaluación en entrenamiento y prueba.

De manera anal´ıtica el conjunto de entrenamiento y prueba se muestran en la Ecuaci´on 2.23.

X_tst=

x⁽ⁱ⁾ ∀ i {1,2,3, ..., N} X_tr =

x^(j) ∀ j6=i∧(i, j){1,2,3, ..., N} (2.23) 2.8.3. C´alculo del Error y Tasa de Acierto

Para evaluar el desempeño de LOOCV, se halla el error de evaluación en entrenamiento y prueba, el cálculo del error de las diferentes validaciones producto de cada iteración viene dada por un error, es decir por cada iteración se tiene un error determinado. En cada una de las N iteraciones se produce un error, el error final se obtiene obteniendo el promedio de los N errores de cada iteración, como se muestra en la Ecuación 2.24.

E = 1 N

N

X

i=1

E_i (2.24)

La tasa de aciertoA_cc, esta dado porA_cc = 1−E. El error mide el promedio de la tasa de error de un clasificador, es una medida que nos muestra la diferencia entre los valores reales y los estimados para poder medir la eficiencia de un clasificador.

(34)

2.8.4. Matriz de Confusi´on

La matriz de confusión es una herramienta muy útil dentro de los problemas de cla- sificación, es una de las métricas más intuitivas y sencillas, esta herramienta nos permite ver de manera gráfica el desenvolvimiento de un algoritmo determinado y se utiliza para los problemas de clasificación donde la salida puede ser de dos o más tipos de clases.

2.8.4.1. Matriz de Confusi´on Binaria

La forma m´as representativa de mostrar una matriz de confusi´on es el caso binario, en donde las filas corresponden a la clase verdadera y las columnas a la clase predicha, esta estructura la podemos observar en el Cuadro 2.3 [RG16].

Clase Predecida Positivo (1) Negativo (0) Clase

Verdadera Positivo (1) TP FN

Negativo (0) FP TN

Cuadro 2.3: Matriz de confusi´on binaria.

D´onde:

Verdaderos Positivos (True Positives - TP) – Son los casos en los que los datos reales son 1 (Verdadero) y la predicci´on tambi´en es 1 (Verdadero).

Verdaderos Negativos (True Negatives - TN) – Son los casos en los que los datos reales son 0 (Falso) y la predicci´on tambi´en es 0 (Falso).

Falsos Positivos (False Positives - FP) – Son los casos en los que los datos reales indica que es 0 (Falso) y la predicción indica que es 1 (Verdadero), es decir la predicción ha sido errónea.

Falso Negativo (False Negatives - FN) – Son los casos en los que los datos reales son 1 (Verdadero) y la predicci´on tambi´en es 1 (verdadero).

La matriz de confusi´on para problemas binarios se puede resumir en estos cuatro valores, de manera ideal se desea que el modelo de 0 falsos positivos y 0 falsos negativos, sin embargo, esto no se da el la vida real y cualquier modelo no tiene un acierto del 100 % [RG16].

2.8.4.2. Matriz de Confusi´on de m´as de Dos Clases

La matriz de confusión también se puede aplicar a un problema de clasificación de más de dos clases. Por ejemplo, si tenemos k número de clases la matriz de confusión deberá tener k filas y k columnas, de manera visual nos permitirá ver que tan bien funciona el algoritmo o que tan mal funciona [RG16].

Al tener los resultados representados gráficamente es bastante sencillo extraer infor- mación útil. Por ejemplo, los valores altos en la diagonal principal, nos indica en general

(35)

que el clasificador est´a funcionando bastante bien.

Los elementos altos fuera de la diagonal principal nos informan acerca de errores que están relacionados regularmente con las muestras, este análisis no solo nos permite descu- brir donde se están cometiendo errores, sino que también proporcionan sugerencias sobre cómo mejorar el rendimiento (ignorar algunas muestras, mejorar su calidad, sustituirlas, etc) [RG16].

1 2 3 4 5

Clase predecida (y) 1

2

3

4

5

Clase Verdadera (y)

1 1

3

2

1 4

4

C

4 i j

Figura 2.8: Matriz de connfusi´on para 5 clases.

Por ejemplo en la Figura 2.8 se muestra un ejemplo de matriz de confusi´on de 5 clases, d´onde cada clase tiene 4 muestras, los elementos de la diagonal principal de color azul representa el 100 % de acierto para las clases 1,2,3 ; mientras que en la clase 4 una muestra se confunde con la clase 5;yen el caso de la clase 5, tiene 0 % de acierto, 2 de sus muestras se confunde con la clase 4, 1 muestra con la clase 2 y finalmente 1 muestra con la clase 3.

Es posible obtener una estima de la probabilidad (Ecuación 2.25) condicionada de decidirDi cuando la clase verdadera esHj a partir de la matriz de confusión de la Figura 2.8, las estimas de estas probabilidades se pueden ver en la Ecuación 2.26.

P_ij =Pb(D_i|H_j) = Cij

P

iC_ij (2.25)

(36)

Pb(D|H) =







1 0 0 0 0

0 1 0 0 0

0 0 1 0 0

0 0 0 1 1/4

0 1/4 1/4 2/4 0







(2.26)

(37)

Cap´ıtulo 3

Estado del Arte

Existen diversas investigaciones relacionados al desarrollo de hardware de bajo costo y utilización de algoritmos para segmentar patrones de venas en imágenes capturadas en el espectro infrarrojo cercano, sin embargo, muchas de estas investigaciones relacionan software y hardware, pero a un nivel simple, mientras que otras se centran solo en software, pero utilizando métodos tradicionales. Además, de acuerdo a las diversas investigaciones revisadas en esta Sección, el método de SC propuesto para la extracción de caracter´ısticas, no ha sido aplicado a la tarea de extraer los patrones de venas, por tanto la propuesta del presente trabajo innova, incluye y relaciona SC (como métodos del aprendizaje máquina) para potenciar los resultados en contraste con los métodos anteriormente propuestos.

3.1. Seguridad

Existen algunos art´ıculos, donde tratan trabajos de seguridad como por ejemplo el del reconocimiento de rostros heterogéneos que se utiliza en el sector forense, seguridad y comercial; sin embargo, este reconocimiento de rostros heterogéneos presenta problemas desafiantes, para ello proponen una red neuronal convolucional para mejorar las caracter´ısticas de las imágenes faciales a través del infrarrojo cercano, finalmente los resultados son alentadores, por tanto se alienta en investigar para una mayor precisión en espacios del espectro infrarrojo cercano [HWST18].

Otro trabajo que se vio respecto a seguridad, es la identificación de personas basado en imágenes de sus iris, donde se resalta el hecho de que los sistemas de seguridad basados en biometr´ıa para la autentificación se están convirtiendo en la opción preferida para reemplazar los sistemas basados en contraseñas, sin embargo esta opción biométrica es costosa [SHI17].

Las venas de los dedos siempre han tenido una especial atención por los sistemas de seguridad biométricos, se propone extraer la región de interés especialmente del área entre las falanges [YWS19], luego se utiliza un filtro de Gabor para mejorar la visualización de las venas, posteriormente para el reconocimiento de venas se propuso el Modelo Jerárquico de Hiperesfera (HHsM), el cuál fue realmente convincente para manejar los problemas de reconocimiento de venas en los dedos. El sistema propuesto no utiliza técnica alguna de reducción de caracter´ısticas.

En la actualidad existen sistemas de seguridad implementados en tel´efonos m´oviles y

(38)

otros dispositivos, pero son vulnerables en el sentido de que pones una foto del usuario, la cual la podr´ıas sacar de su red social y ponerla en frente del dispositivo para de esa forma burlar la supuesta seguridad con esa foto estática. El enfoque que se propone es de utilizar la captura de imágenes del iris en el espectro infrarrojo cercano, para después utilizar clasificadores como Haar Cascade y LBP (del inglés, Local Binary Patterns ), para que una vez capturada la imagen, dicha información sea guardada en un data del tipo QR, el cual sirve como un identificador único de cada persona [SHI17].

3.2. Infrarrojo Cercano en Tejidos y Venas

Respecto al estudio del infrarrojo cercano en tejidos, para medir la propagación de luz desde una fuente y el detector humano colocado en un tejido determinado se pueden usar tecnolog´ıas analógicas y digitales, se resalta que los tejidos del cuerpo son altamente dispersantes con una distancia media, la longitud usada es de 700 nm a 850 nm, donde se enfatiza que la mayor parte de absorción de la energ´ıa se debe principalmente al 5 % - 10 % del volumen de tejido ocupado por la sangre [CCG⁺98]. También, la utilización del infrarrojo cercano está basado en el grado de absorción de un componente de la sangre llamado des