• No se han encontrado resultados

Clasificación de huellas dactilares con redes neuronales

N/A
N/A
Protected

Academic year: 2020

Share "Clasificación de huellas dactilares con redes neuronales"

Copied!
78
0
0

Texto completo

(1)CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES NEURONALES. Jorge Mario Barajas. Ingeniería de Sistemas y Computación Universidad de los Andes 2003.

(2) ISC-2003-1-5. Universidad de los Andes Descripción breve CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES NEURONALES Por Jorge Mario Barajas Asesores: José Tiberio Hernández Rafael Armando García Departamento de Ingeniería de Sistemas y Computación La clasificación de huellas dactilares es crucial para el desempeño de un AFIS (Automated Fingerprint Identificaction System), más específicamente, es utilizada para indexar cada huella dactilar en una base de datos. Se diseñaron e implementaron 2 redes neuronales: un perceptrón multicapa entrenado con el algoritmo de aprendizaje backpropagation y una red SOM (Self-Organizing Map). Con el perceptrón multicapa se logró una tasa de error de 14,58% para el problema de clasificación de huellas dactilares en las 5 clases de Henry sin rechazar huellas y sin mejorar las imágenes. Rechazando el 10% de las huellas se logró una tasa de error de 9,56% sin mejorar las imágenes. La red SOM subclasificó las huellas dactilares revelando interesantes características de huellas que pertenecían a la misma clase de Henry pero que la red encontraba diferentes..

(3) ISC-2003-1-5 TABLA DE CONTENIDO. LISTA DE TABLAS ...........................................................................................................................II LISTA DE ILUSTRACIONES .......................................................................................................III GLOSARIO .......................................................................................................................................VII 1 INTRODUCCIÓN........................................................................................................................... 1 1.1 DESCRIPCIÓN DEL TRABAJO.......................................................................................................1 1.1.1 Objetivos del trabajo ........................................................................................................ 1 1.2 SUSTENTACIÓN DEL TEMA.........................................................................................................1 1.3 PRERREQUISITOS NECESARIOS ..................................................................................................2 1.4 ORGANIZACIÓN DEL DOCUMENTO............................................................................................2 2 LOS SISTEMAS BIOMETRICOS.............................................................................................. 4 2.1 M ETODOLOGÍAS BIOMÉTRICOS .................................................................................................4 2.1.1 Sistemas Biométricos Existentes..................................................................................... 5 2.2 SISTEMAS BIOMÉTRICOS DE HUELLA DACTILAR ....................................................................9 2.3 LAS HUELLAS DACTILARES.....................................................................................................13 2.3.1 Historia de las Huellas Dactilares................................................................................13 2.3.2 Características de las Huellas Dactilares...................................................................17 2.4 LAS CINCO CLASES DE HENRY................................................................................................19 3 PREPROCESAMIENTO ............................................................................................................21 3.1 ESTADO DEL A RTE ....................................................................................................................21 3.2 BASE DE DATOS NIST-14 ........................................................................................................24 3.3 PREPROCESAMIENTO DE LA IMAGEN .......................................................................................26 3.3.1 Segmentación...................................................................................................................27 3.4 M APA DE DIRECCIONES............................................................................................................35 4 CLASIFICACIÓN DE HUELLAS DACTILARES ..............................................................42 4.1 REDES NEURONALES ................................................................................................................42 4.2 A NÁLISIS DE COMPONENTES PRINCIPALES ............................................................................43 4.2.1 Normalización del Mapa de Direcciones.....................................................................44 4.2.2 Matriz de Transformación.............................................................................................46 4.3 BACKPROPAGATION ..................................................................................................................47 4.4 SELF-ORGANIZING M AP ...........................................................................................................54 5 CONCLUSIONES .........................................................................................................................63 5.1 TRABAJO FUTURO .....................................................................................................................65 BIBLIOGRAFÍA ...............................................................................................................................67.

(4) ISC-2003-1-5 LISTA DE TABLAS. Número Página Tabla 1. Tabla comparativa de algunos sistemas biométricos existentes. (Jain, Hong & Pankanti, 1997, p. 6). ......................................................8 Tabla 2. Estado del Arte para la Clasificación de Huellas Dactilares. (Prabhakar, 2001, p. 123).....................................................................23 Tabla 3. Resultados en la determinación de la arquitectura de red.....................48 Tabla 4. Determinación del Numero Optimo de Épocas en la Etapa de Entrenamiento....................................................................................49 Tabla 5. Determinación experimental del valor de ambigüedad en la red para el 10% de las huellas....................................................................52 Tabla 6. Clasificación de la SOM de acuerdo a las 5 clases de Henry mas la clase Accidental ..................................................................................58. ii.

(5) ISC-2003-1-5 LISTA DE ILUSTRACIONES. Número Página Ilustración 1. Geometría de la mano (Recuperado el 14 de marzo de 2003, de http://biometrics.cse.msu.edu/hand_proto.html)....................5 Ilustración 2. Regiones de la Iris para ser procesadas con fines de identificación o autenticación en sistemas biométricos. (Recuperado el 12 de marzo de 2003, de http://www.igd.fhg.de/igd-a8/biometrics/images/iris.gif) ....................6 Ilustración 3. Los patrones de las venas en la retina son únicos para cada individuo. (Recuperado el 13 de marzo de 2003, de http://www.prip.tuwien.ac.at/Teaching/SS/GdBA/LU/Images /retina.png) ..........................................................................................7 Ilustración 4. El reconocimiento de cara es una de las tecnologías más fascinantes. (Recuperado el 15 de marzo de 2003, de http://biometrics.cse.msu.edu/face1.gif)...............................................7 Ilustración 5. Las ondas de la voz se utilizan como método biométrico (Recuperado el 10 de marzo de 2003, de http://wwwinst.eecs.berkeley.edu/~assist/hearing_image11.gif ). ............................8 Ilustración 6. AFAS (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 9)...............10 Ilustración 7. AFIS (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 10)..............12 Ilustración 8. Marcelo Malpigui (Recuperado el 01 de marzo de 2003, de http://www.ridgesandfurrows.homestead.co/files/marcello_mal pighi.jpg) ............................................................................................13 Ilustración 9. Jean Evangelista Purkinje (Recuperado el 01 de marzo de 2003, de http://vlp.mpiwgberlin.mpg.de/people/images/img3802.jpg)........................................14 Ilustración 10. Sir William Herschel (Recuperado el 01 de marzo de 2003, de http://www.ridgesandfurrows.homestead.co/files/marcello_mal pighi.jpg) ............................................................................................15 Ilustración 11. Henry Faulds (Recuperado el 01 de marzo de 2003, de http://www.ridgesandfurrows.homestead.com/ files/HenryFaulds.jpg) ........................................................................15 Ilustración 12. Francis Galton. (Recuperado el 02 de marzo de 2003, de http://www.doktor.ru/doctor/biometr/Galton.jpg)...........................16 Ilustración 13. Juan Vucetich. (Recuperado el 01 de marzo de 2003, de http://www.policiacientifica.gov.ar/images/vucetich.jpg)....................16 Ilustración 14. Sir Edward Henry. (Recuperado el 01 de marzo de 2003, de http://www.met.police.uk/history/images/time3d.gif)...................17 iii.

(6) ISC-2003-1-5 Ilustración 15. La Huella Dactilar (Generada con SFinge Versión 2.5, Universidad de Bologna). ....................................................................18 Ilustración 16. Minucias Comunes (Generada con SFinge Versión 2.5, Universidad de Bologna).....................................................................18 Ilustración 17. Las 5 clases de Henry (Recuperado el 22 de marzo de 2003 de http://anil299.tripod.com/vol_002_no_001/papers/paper005.h tml) ....................................................................................................19 Ilustración 18. Huellas Dactilares de la Base de Datos NIST-14 (f0000001 y f0000002).........................................................................25 Ilustración 19. Imagen de mala calidad (NIST-14, f0006890)............................26 Ilustración 20. Imagen de huella dactilar (NIST-14, f0000009). ........................27 Ilustración 21. Separación del Fondo...............................................................29 Ilustración 22. Grupo más grande centrado con base en su centroide...............30 Ilustración 23. Bordes de la imagen .................................................................31 Ilustración 24. Imagen binaria rotada...............................................................33 Ilustración 25. Imagen binarizada pequeña.......................................................33 Ilustración 26. Imagen Segmentada (Imagen Original NIST-14, f0000009). ..........................................................................................34 Ilustración 27. Error en la segmentación por fondo no uniforme (NIST14, f0007720)......................................................................................34 Ilustración 28. Error en la segmentación por presencia de caracteres (NIST-14, f0008915)...........................................................................35 Ilustración 29. Imagen segmentada (Original NIST-14, f0000011)....................36 Ilustración 30. Mapa de direcciones. ................................................................38 Ilustración 31. Mapa de direcciones suavizado. ................................................39 Ilustración 32. Imagen segmentada de mala calidad con un mapa de direcciones correcto (Original NIST-14, f0009047)..............................39 Ilustración 33. Imagen segmentada con exceso de tinta y su mapa de direcciones erróneo (Original NIST-14, f0009265)...............................40 Ilustración 34. Imagen segmentada de mala calidad con cortaduras en la huella y su mapa de direcciones (Original NIST-14, f0009740).............40 Ilustración 35. Mapa de direcciones con dos núcleos y su normalización. .........45 Ilustración 36. Mapa de direcciones con núcleo falso y su incorrecta normalización. ....................................................................................46 Ilustración 37. Desempeño de la Red con diferente Número de Épocas en el Entrenamiento............................................................................50 Ilustración 38. Errores en la clasificación de la red entrenada con backpropagation. ....................................................................................51 Ilustración 39. Huellas que presentan ambigüedad para la red (Imágenes tomadas de NIST-14)..........................................................................53. iv.

(7) ISC-2003-1-5 Ilustración 40. Huellas mal clasificadas por la red que no son rechazadas (Imágenes tomadas de NIST-14). ........................................................54 Ilustración 41. Convergencia de la SOM. .........................................................55 Ilustración 42. Clusters SOM...........................................................................56 Ilustración 43. Vectores Peso con Las Clases de Huellas. .................................57 Ilustración 44. Huellas más cercanas a cada neurona de salida (Imágenes tomadas de NIST-14)..........................................................................59 Ilustración 45. Diferencias en los puntos singulares de las huella lado derechos de cada neurona. ..................................................................60 Ilustración 46. Huellas con mejor respuesta por neurona de acuerdo a su clase....................................................................................................61 Ilustración 47. Secuencia (Imagen tomada de NIST-14, f0012994)...................63. v.

(8) ISC-2003-1-5 AGRADECIMIENTOS. El autor desea dar las gracias a José Tiberio Hernández y Rafael Armando García quienes asesoraron este proyecto. A la Universidad de los Andes por su patrocinio.. vi.

(9) ISC-2003-1-5 GLOSARIO. AFAS. Automated Fingerprint Authentication System. Sistema automatizado de autenticación con huella dactilar. AFIS. Automated Fingerprint Identificaction System. Sistema automatizado de identificación con huella dactilar. Biométrico. Cualquier característica fisiológica y/o de comportamiento que puede ser capturada y subsecuentemente comparada con otra instancia en el tiempo de verificación. Dactiloscopia . Estudio de las huellas dactilares como medio de identificación de las personas. Delta. El punto donde 3 flujos de surcos se encuentran en una huella dactilar. Filtro Pasa Bajo. Filtro de suavización ideal. Filtro que retiene los puntos que están dentro de una distancia L y elimina los que están por fuera. Minucia. Discontinuidades locales en una huella dactilar. Núcleo. El punto más alto del surco curveado más interior en una huella dactilar. Red Neuronal. Red Neuronal Artificial. Sistemas de procesamiento distribuido paralelo.. vii.

(10) ISC-2003-1-5 Capítulo 1. INTRODUCCIÓN La clasificación de huellas dactilares es crucial para el desempeño de un AFIS (Automated Fingerprint Identificaction System), más específicamente, es utilizada para indexar cada huella dactilar en una base de datos. El documento ilustra el proceso de diseño e implementación de 2 redes neuronales con el fin de clasificar las huellas dactilares dentro del marco de las 5 clases de Henry.. 1.1 Descripción del Trabajo En el trabajo se muestra el proceso de diseño del sistema de clasificación así como los resultados obtenidos en su implementación y evaluación. Para lo referente al preprocesamiento de la imagen se utilizó Matlab 6.1 con el toolbox de procesamiento de imágenes v4.0 y java v1.4 con la librería de ImageJ v1.29 mientras que en lo que respecta a redes neuronales propiamente dichas se utilizó el toolbox de redes neuronales v4.0 de Matlab 6.1.. 1.1.1 Objetivos del trabajo -. Modelar e implementar un método para preprocesar imágenes de huellas dactilares con el objetivo de clasificarlas.. -. Modelar e implementar un perceptrón multicapa entrenado con el algoritmo de aprendizaje backpropagation para que clasifique huellas dactilares en las 5 clases de Henry.. -. Modelar e implementar una red neuronal SOM y analizar el resultado de la clasificación de huellas dactilares con aprendizaje no supervisado.. 1.2 Sustentación del Tema Existen muchos trabajos que intentan solucionar el problema de clasificar huellas dactilares de diferentes maneras, ¿Por qué hacer otro más? Un estudio a los trabajos existentes muestra que estos dejan en el aire muchas preguntas acerca del proceso que realizan y los resultados que consiguen. Las pruebas de métodos.

(11) ISC-2003-1-5 orientados a clasificar huellas dactilares manejan una gran cantidad de datos, es por este motivo que los métodos implementados deben tener un muy buen diseño. Por otra parte las fallas de cada método no se encuentran completamente documentada s ya que los resultados de las clasificaciones se han convertido en una especie de competencia donde muy pocos trabajos se preocupan por ilustrar completamente el proceso realizado con sus fallas correspondientes. Queda por explicar el por qué se utilizaron redes neuronales artificiales para solucionar el problema de clasificar huellas dactilares. Existen varias ventajas que brindan las redes neuronales entre las cuales esta la no necesidad de conocimiento a priori de la distribución estadística de los datos, paralelismo inherente, clasificación rápida y la más importante que es la tolerancia a fallas. El problema a tratar es un problema de clasificación de patrones donde las redes neuronales han demostrado tener éxito. Backpropagation y SOM son dos ejemplos de algoritmos de aprendizaje supervisado y no supervisado en redes neuronales. Por ser ejemplos de diferentes tipos de aprendizaje su estudio resulta ilustrativo y de alguna forma comparable. Es por esta razón que se escogieron estos algoritmos de aprendizaje. Finalmente vale la pena destacar lo ilustrativo del problema desde un punto de vista pedagógico. La clasificación de huellas dactilares es un gran ejemplo de cómo integrar el procesamiento de imágenes con la implementación de redes neuronales. El proceso de diseño de una red neuronal es muy importante y en el caso del clasificador de huellas este proceso es muy claro y fácil de entender.. 1.3 Prerrequisitos Necesarios El documento asume un completo entendimiento de los conceptos básicos de las redes neuronales artificiales así como de los algoritmos de aprendizaje backpropagation y Self-Organizing Map. Los conceptos necesarios sobre las huellas dactilares para solucionar el problema de clasificación son cubiertos en su totalidad en el segundo capítulo.. 1.4 Organización del Documento El documento tiene 5 capítulos organizados de la siguiente manera:. 2.

(12) ISC-2003-1-5 -. Capitulo 2, Los Sistemas Biométricos. En este capítulo se introduce al lector en los sistemas biométricos profundizando en aquellos que utilizan la huella dactilar. Este capítulo comprende lo que el lector necesita saber para acercarse a l problema de clasificación de huellas dactilares y entender el funcionamiento de los sistemas biométricos en general.. -. Capítulo 3, Preprocesamiento. Se ilustra todo el proceso implementado para poder extraer aquellas características que sirven para poder clasificar las huellas dactilares. Se muestran los resultados obtenidos con los métodos implementados para preprocesar las imágenes que se van a clasificar.. -. Capítulo 4, Clasificación de Huellas Dactilares. Este es el capítulo donde se muestran los resultados obtenidos en la implementación de las redes neuronales. Se ilustra paso a paso su diseño y se analizan los resultados obtenidos.. -. Capítulo 5, Conclusiones. Se discute el trabajo global y el trabajo futuro a realizar.. 3.

(13) ISC-2003-1-5 Capítulo 2. LOS SISTEMAS BIOMETRICOS Desde el antiguo Egipto se tienen datos del uso de sistemas biométricos. Se cuenta la historia de Khasekem, un trabajador oficial encargado de la administración y provisión de comida a los trabajadores durante la construcción de la gran pirámide de Khufu (Ashbourn, 2002, pp. 1-4). Existían casos en que los trabajadores hacían trampa y pedían dos raciones de comida o mantenían dos identidades. Por esta razón, Khasekem desarrolló un sistema en que se tenía diferente información acerca de los trabajadores como el nombre, edad, lugar de origen y ocupa ción. A través del tiempo Khasekem mejoró su sistema de identificación incluyendo en cada ficha del trabajador características físicas que le servirían para constatar su identidad. Fue así que empezó Khasekem a anotar la forma de la cara, cicatrices, etc. Khasekem había implementado un sistema de verificación de identidad biométrico.. 2.1 Metodologías Biométricos Biométrico es cualquier característica fisiológica y/o de comportamiento que puede ser capturada y subsecuentemente comparada con otra instancia en el tiempo de verificación (Ashbourn, 2002, p. 12). Para que una característica biométrica pueda ser usada como método de identificación, debe cumplir las siguientes características (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 4): -. Universalidad, se refiere a que todos los individuos deben tener la característica.. -. Unicidad, se refiere a que no existen dos individuos iguales en términos de la característica.. -. Permanencia, se refiere a que la característica debe ser invariante en el tiempo.. -. Coleccionabilidad, se refiere a que la característica puede ser medida cuantitativamente.. 4.

(14) ISC-2003-1-5 A partir de esta definición se puede empezar a estudiar las características humanas que clasifican como biométricos para así poder entender las diferentes tecnologías biométricas actuales.. 2.1.1 Sistemas Biométricos Existentes Existen diferentes metodologías biométricas y cada una de estas se diferencian en su confiabilidad y facilidad de uso. Las más populares son la s de huella dactilar (de los cuales se profundizará un poco mas adelante), de mano, iris, cara y voz. También existen otros sistemas que por ahora no son populares pero están tomando fuerza a medida que pasa el tiempo como la comparación de retina, de ADN y de firma.. Ilustración 1. Geometría de la mano.. Los sistemas que utilizan la geometría de la mano son muy interesantes ya que son muy fáciles de usar. El usuario pone la mano en un escáner que toma una “imagen” tridimensional de la mano. Existen varias medidas que se hacen a la geometría de la mano y que el sistema las usa para verificar. El gran problema es que viola el principio de unicidad para ser usado como sistema biométrico confiable. La mano humana no es única1. Es por esto que la mano puede ser utilizada como método complementario en la verificación pero no en la autenticación. La verificación hace referencia al procedimiento llevado a cabo con 1. Tomado de: Biometrics: Hand Geometry. Recuperado el 10 de marzo de 2003, de Biometrics Research. Department of Computer Science And Engineering Michigan State University: http://biometrics.cse.msu.edu/hand_geometry.html.. 5.

(15) ISC-2003-1-5 el fin de comprobar que una persona es quien dice ser mientras que la autenticación es el proceso necesario para identificar a una persona o usuario. Otros sistemas biométricos hacen uso del iris. A través de los años se ha comprobado que el iris es único para cada persona y que cambia poco a través de los años (Ashbourn, 2002, p. 52). Estos sistemas son bastante confiables y hacen uso de los patrones existentes en el iris, el problema es que el costo de su implementación es alto en comparación a los demás métodos. Hoy en día existen aplicaciones lo suficientemente confiables para usuarios que utilicen gafas o lentes de contacto.. Ilustración 2. Regiones de la Iris para ser procesadas con fines de identificación o autenticación en sistemas biométricos.. La retina es otro órgano que ha sido utilizado con fines de autenticación e identificación. Esta tecnología explota el hecho de que los patrones de las venas dentro de la retina son únicos en cada individuo y no se alteran a través del tiempo. Esta característica hace que la retina sea un buen órgano para ser usado en un sistema biométrico. El gran problema del uso de esta metodología es que es considerado el sistema biométrico más difícil de usar y es bastante lento en comparación a los demás.. 6.

(16) ISC-2003-1-5. Ilustración 3. Los patrones de las venas en la retina son únicos para cada individuo.. Otra de las tecnologías biométricas que ha generado una gran cantidad de investigación es el reconocimiento de la cara. Un paso necesario en el sistema es la detección de la cara, y aunque en escenarios controlados esto puede ser muy fácil, en escenarios habituales el problema se complica. Sin embargo últimamente se han dado grandes pasos y las actuales soluciones brindan resultados prometedores. Algunos casinos utilizan reconocimiento de caras para detectar tramposos. Los sistemas biométricos que utilizan la cara es una de las tecnologías más amigables para los usuarios, sin embargo hace falta tiempo para que esta metodología sea lo suficientemente confiable.. Ilustración 4. El reconocimiento de cara es una de las tecnologías más fascinantes.. La forma del tracto vocal hace que la voz de cada ser humano tenga características especiales, lo que lo convierte en un candidato para ser utilizado en 7.

(17) ISC-2003-1-5 sistemas biométricos. Utilizar la voz como medio de identificación o autenticación resulta muy fácil para el usuario ya que solo debe acercarse y pronunciar un par de palabras. Aunque dos voces parezcan iguales a los oídos de una tercera persona, las ondas tienen diferencias visibles. Aunque los sistemas que existen hoy en día son relativamente confiables, existen diferentes problemas para su implementación: recintos abiertos (con la presencia de otros ruidos), usuarios con gripe o alguna otra enfermedad que afecte su voz, etc.. Ilustración 5. Las ondas de la voz se utilizan como método biométrico.. Existen varias metodologías biométricas fuera de las ya antes descritas. La verificación de firma es interesante ya que es una metodología biométrica de tipo anatómico que explota la familiaridad y naturalidad asociada a la firma de cada individuo. También existen sistemas que utilizan el patrón de las venas detrás de la mano y de la muñeca. Aunque no es fácil decidir cuál es mejor que todas, si se puede observar que cada una brinda ventajas y desventajas que deben ser tenidas en cuenta de acuerdo a las diferentes necesidades. Los sistemas más seguros reúnen un conjunto de diferentes metodologías.. Biométrico. Universalidad. Unicidad. Permanencia. Coleccionabilidad. Desempeño. Aceptabilidad. Violabilidad. Cara. Alto. Bajo. Medio. Alto. Bajo. Alto. Bajo. Huella Dactilar. Medio. Alto. Alto. Medio. Alto. Medio. Alto. Medio. Medio. Medio. Alto. Medio. Medio. Medio. Venas de Manos. Medio. Medio. Medio. Medio. Medio. Medio. Alto. Iris. Alto. Alto. Alto. Medio. Alto. Bajo. Alto. Geometría Mano. de. la. 8.

(18) ISC-2003-1-5 Retina. Alto. Alto. Medio. Bajo. Alto. Bajo. Alto. Firma. Bajo. Bajo. Bajo. Alto. Bajo. Medio. Bajo. Voz. Medio. Bajo. Bajo. Medio. Bajo. Medio. Bajo. Tabla 1. Tabla comparativa de algunos sistemas biométricos existentes.. En la anterior tabla (Jain, Hong & Pankanti, 1997, p. 6), universalidad, unicidad, permanencia y coleccionabilidad hacen referencia a las características que debe tener un buen sistema biométrico y que ya fueron descritas. Por ejemplo una huella dactilar tiene alta permanencia (dura toda la vida) y unicidad (la huella es única en los seres humanos), media permanencia (es posible que no todos los seres humanos tengan huellas o incluso todos los dedos) y aceptabilidad (algunos usuarios asocian las huellas a procesos judiciales). La aceptabilidad se refiere al nivel de confianza que inspira el sistema en los usuarios y la violabilidad a la capacidad que tienen los usuarios para violar el sistema.. 2.2 Sistemas Biométricos de Huella Dactilar Los sistemas biométricos que utilizan huella dactilar se pueden reunir en dos grupos: - Sistema Automático de Autenticación con Huellas Dactilares, AFAS (Automatic Fingerprint Authentication System). - Sistema Automático de Identificación con Huellas Dactilares, AFIS (Automatic Fingerprint Identification System). En un AFAS, se compara. Normalmente un usuario se acerca al sistema y provee un método que le permita validar la huella, puede ser con información proveniente de una tarjeta inteligente o simplemente insertando en el sistema una identificación. El sistema simplemente compara lo que procesa (toma una impresión de la huella dactilar de la persona con un escáner de alta resolución) con la información dada por el usuario y con base en esto valida, responde si o no. El sistema responde afirmativamente, si la huella procesada y la información contenida en el sistema corresponden. La ilustración 6 es un diagrama de bloques de un sistema AFAS (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 9). El sistema tiene dos entradas: la huella dactilar y la información del usuario para que el sistema pueda sacar de su base de datos la información necesaria para autenticar la huella dactilar de entrada. Para la 9.

(19) ISC-2003-1-5 adquisición de la huella dactilar se utiliza un escáner de alta resolución o una cámara CCD. La huella dactilar digitalizada necesita ser procesada para arreglar la imagen (aunque esto no es necesario en todos los casos) y se extraen las características que describen la huella y que representan la unicidad de la huella. Paralelamente al proceso anteriormente descrito, el usuario debió haber insertado información al sistema que ayudaba a identificarlo. Esta información es usada para buscar en la base de datos del sistema la entrada que corresponde al usuario y sacar las características de la huella dactilar del usuario que se encontraban en el sistema. Como se puede ver, se tienen dos conjuntos de datos y cada uno representa características de una huella dactilar; uno proviene del escáner biométrico y el otro de la base de datos del sistema. Lo único que queda es comparar los dos tipos de datos y el sistema ya está en capacidad de rechazar o aceptar al usuario.. Ilustración 6. AFAS.. 10.

(20) ISC-2003-1-5 La entrada perteneciente a la información del usuario puede ser un login y su correspondiente contraseña. Con esta información el sistema ya puede extraer de la base de datos las características de su huella. Esta entrada puede ser también una tarjeta inteligente que contiene los datos que le permiten al sistema identificar la entrada en la base de datos. Cualquiera que sea el sistema utilizado, el objetivo es el mismo. Esta base de datos es actualizada cuando un nuevo usuario se registra con el sistema. Al registrarse el usuario provee datos personales y se le toman huellas dactilares para ser usadas en la comparación del sistema. Normalmente se registra en el sistema la mejor impresión de la huella dactilar del usuario. Esto se logra tomando múltiples impresiones y su objetivo es incrementar la precisión del sistema. En un AFIS, se encuentra. En este sistema el método de clasificación de huellas dactilares juega un rol primordial en el diseño. El sistema captura la impresión de la huella dactilar del usuario y es el sistema el encargado de identificar el usuario al que pertenece la huella dactilar, o en el peor de los casos, dar una lista de personas que cumplan con las características de la impresión. Para responder el porque de la importancia de clasificar en estos sistemas, basta poner un ejemplo: en un sistema que maneje gran cantidad de usuarios, cada vez que llegara un usuario, el sistema tendría que comparar la impresión de la huella dactilar adquirida con el escáner, con cada huella dactilar que se encuentre en la base de datos. Este proceso podría no ser muy rápido en una base de datos de miles o millones de personas, es por esto que resultaría más fácil “dividir” la información para que cada vez que un usuario intente validarse, el sistema pueda de algún modo enfocar su búsqueda en un número de datos menor al total en la base de datos. La calidad de tal clasificación mejoraría el desempeño de cualquier sistema AFIS. La capacidad de identificar es lo más atractivo de un sistema AFIS. Como se puede ver en la ilustración 7, el sistema tiene solo una entrada: la huella dactilar. Al igual que en un sistema AFAS, la huella dactilar se adquiere mediante un escáner biométrico o una cámara CCD. A la huella dactilar digitalizada se le extraen las características y son estas características (o con una parte de estas características) las que ese utilizan para clasificar la huella dactilar y acceder a la base de datos para adquirir los datos que le permitan al sistema hacer la comparación con un número de datos reducido. Puede que en esta comparación, aparezca más de una persona que cumplen las mismas características que la huella dactilar. En este caso son necesarios algoritmos que califiquen los niveles de similitud y el sistema responda con un conjunto de individuos cuyas calificaciones sean altas.. 11.

(21) ISC-2003-1-5. Ilustración 7. AFIS.. Los sistemas biométricos de huella dactilar normalmente utilizan las minucias para autenticar e identificar, aunque existen otros métodos. Las minucias son las discontinuidades locales que aparecen en una huella (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 12). De la impresión de la huella dactilar se extraen las minucias, su localización y su orientación, esto es suficiente para saber si dos huellas dactilares pertenecen a la misma persona. En una huella dactilar existen entre 50 y 150 minucias; en los sistemas automatizados 10 minucias que correspondan son suficientes para establecer identidad (Baldi & Chauvin, 1993).. 12.

(22) ISC-2003-1-5 2.3 Las Huellas Dactilares A continuación se dará una breve introducción a las huellas dactilares para poder entender mejor el problema de clasificación. Se continuará con una breve descripción de las características de las huellas dactilares y finalmente se hará una descripción de las 5 clases de huellas dactilares definidas por Henry.. 2.3.1 Historia de las Huellas Dactilares Realmente no es claro en que punto las huellas dactilares empezaron a ser usadas como método de identificación. Los expertos en el tema no se han puesto de acuerdo en quienes fueron los primeros y existen varias hipótesis respecto al tema. Se ha sugerido que las impresiones de huellas dactilares que se han encontrado en las tablas de arcilla babilónicas y en los sellos chinos de arcilla, fueron puestas deliberadamente como método de identificación (Keogh, 2001), pero otros expertos sostienen que aunque los chinos si utilizaban las huellas dactilares habitualmente para una gran cantidad de documentos, no sabían de las propiedades de las huellas dactilares para identificación de personas.. Ilustración 8. Marcelo Malpigui.. En 1686, un profesor de anatomía en la Universidad de Bologna, Marcello Malpigui, continuó la investigación del inglés Nehemia Grew. En este trabajo se encontraron los surcos, ciclos y espirales, sin embargo, no se hizo ninguna referencia a las huellas dactilares como herramienta de identificación de personas. El trabajo de Malpigui estaba orientado al estudio de la naturaleza anatómica y no a la superficie (Lennard & Patterson, s.f.). Fue hasta 1798 que el alemán J. C. Mayer propuso la idea de que los arreglos de los surcos eran únicos. Pero 13.

(23) ISC-2003-1-5 realmente fue hasta 1823 con el checo Jan Evangelista Purkinje, que el concepto de unicidad en las huellas dactilares se incorporó en el pensamiento científico (Ashbourn, 2002, p. 5). Purkinje, estaba estudiando las glándulas sudoríparas y observo que estas desembocaban en unos patrones que parecían ser únicos en cada individuo. Entre sus resultados mas interesantes estaba la clasificación de huellas, identificando nueve patrones.. Ilustración 9. Jean Evangelista Purkinje.. La primera persona en darle uso a las huellas dactilares fue Sir William Herschel, un trabajador oficial inglés en 1856. Herschel hacía que las personas imprimiera n su huella dactilar en documentos públicos; en un principio lo hizo como un acto de solemnidad ya que pensaba que ayudaba a que las personas tomaran conciencia del acto y no hicieran trampa o engañaran, sin embargo, se dio cuenta de que las huellas dactilares podrían ser utilizadas como métodos de identificación en diferentes asuntos oficiales y legales. Su entusiasmo no fue compartido en el Reino Unido (Keogh, 2001, párr. 9).. 14.

(24) ISC-2003-1-5. Ilustración 10. Sir William Herschel.. Un paso crucial en el uso de las huellas dactilares fue hecho por el médico escocés Henry Faulds a finales de los 1870´s mientras trabajaba en un hospital en Japón. Faulds, observó que las huellas dactilares permanecían en los pacientes sin mayores cambios aún con heridas superficiales, y que estos eran diferentes entre los individuos. Se le pidió ayuda para investigar un crimen y mediante el análisis de huellas dactilares en la escena, convenció a las autoridades de que su sospechoso era el culpable. Este fue el primer crimen en el mundo que fue resuelto con la ayuda de las huellas dactilares. Escribió al diario Nature una carta con su investigación y lo mismo hizo a Charles Darwin quién pensó que era muy viejo para estudiar el tema y le mando esta carta a su primo Sir Francis Galton.. Ilustración 11. Henry Faulds.. Francis Galton estaba trabajando en la aplicabilidad de la estadística en datos sicológicos y parte de su trabajo tenía que ver con las huellas dactilares (Ashbourn, 2002, p. 6). En 1892 Galton publicó un profundo estudio acerca de la ciencia de las huellas dactilares. Fue así que estableció que las huellas dactilares 15.

(25) ISC-2003-1-5 son únicas; en su estudio estaba incluido un método de clasificación pero su acercamiento era inadecuado (Lennard & Patterson, s.f.) y fue necesario el trabajo de otros científicos para establecer métodos de clasificación.. Ilustración 12. Francis Galton.. Un policía argentino de Buenos Aires, Juan Vucetich fue el primero en usar imágenes de huellas dactilares en tinta, dactilogramas. En 1888 publicó un tratado sobre la dactiloscopia comparativa, donde definió un esquema de clasificación para las huellas dactilares, llamándolo "icnofalagometrico". Este esquema empezó a funcionar en 1891 y en junio de 1892 se pudo resolver un caso de asesinato en Necochea. Se trataba de un asesinato de dos niños cuya madre (Francisca Rojas) alegaba haber sido atacada por un vecino. En un vistazo a la escena del crimen se encontraron huellas de la madre y cuando fue confrontada con la evidencia confesó su crimen.. Ilustración 13. Juan Vucetich.. 16.

(26) ISC-2003-1-5 En 1897, Sir Edward Henry, un policía ingles que para la época trabajaba en India, definió un sistema para clasificar huellas dactilares. Finalmente publicó su investigación en 1900: “Classification and Uses of Fingerprints”.. Ilustración 14. Sir Edward Henry.. 2.3.2 Características de las Huellas Dactilares En una impresión de una huella dactilar se pueden observar claramente los surcos y los valles. Las áreas oscuras de una huella dactilar se llaman surcos y las áreas claras se llaman valles. Los surcos y los valles describen “líneas” suaves a través de la impresión de la huella dactilar. Otros puntos visibles en la huella dactilar son el núcleo y el delta. Aunque ninguno de los dos ocurre en una de las clases definidas por Henry como se verá mas adelante, estos dos son los llamados puntos de singularidad en una huella dactilar y constituyen una de las principales características descriptivas de una huella dactilar. El núcleo se define como el punto más alto del surco curveado más interior y el delta es el punto donde 3 flujos de surcos se encuentran (Srinivasan & Murthy, 1992).. 17.

(27) ISC-2003-1-5. Ilustración 15. La Huella Dactilar.. Como se puede ver en la ilustración 15, los surcos tienen discontinuidades. Estas discontinuidades fueron estudiadas por Galton y se llaman minucias. Las minucias son las características más utilizadas para identificar y autenticar las personas.. Ilustración 16. Minucias Comunes.. El tipo, posición y orientación de las minucias son lo que hace que las huellas dactilares sirvan como método fiable de autenticación e identificación. En un principio, Galton definió los surcos, bifurcaciones, islas y cerramientos. Estas 18.

(28) ISC-2003-1-5 características fueron completadas a través del tiempo. En la mayoría de sistemas de autenticación solo se usan las terminaciones y bifurcaciones (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 7).. 2.4 Las Cinco Clases de Henry Cuando Sir Edward Henry estaba definiendo su sistema de clasificación, observó 5 patrones globales que se encontraban en todas las huellas dactilares, fue así que definió cinco clases o tipos de huella dactilar: lado izquierdo, lado derecho, arco, arco tendido y espiral.. Ilustración 17. Las 5 clases de Henry.. Existen huellas dactilares que no clasifican en ninguna de las 5 clases de Henry, estas huellas hacen parte del grupo llamado accidental y no son muy comunes. Cada huella que pertenece a alguna de las clases tiene las siguientes características (Keogh, 2001): -. Una huella de arco tiene surcos que entran desde un lado, se elevan cierta cantidad para volver a caer y salir por el lado opuesto al que entraron. 19.

(29) ISC-2003-1-5 -. Una huella de arco tendido es muy parecida a una huella de arco, la única diferencia es que existe al menos un surco que tiene una elevación de más de 45 grados.. -. Una huella de espiral contiene al menos un surco que da una vuelta completa de 360 grados alrededor del núcleo de la huella.. -. Las huellas de lado izquierdo o derecho tienen uno o más surcos que entran por un lado, dan la vuelta por el núcleo y vuelven a salir por el mismo lado por el que entraron.. Las clases de Henry tienen distribuciones irregulares en la población. La proporción de distribución natural de las clases es (Prabhakar, 2001, p. 18): -. Espiral: 32,52% Lado Derecho: 36,48% Lado Izquierdo: 17,03% Arco: 6,16% Arco Tendido: 7,79%. Estas distribuciones varían en una pequeña proporción de acuerdo a las regiones.. 20.

(30) ISC-2003-1-5 Capítulo 3. PREPROCESAMIENTO El problema es clasificar imágenes de huellas dactilares para poder ser indexadas en una base de datos, y para conseguir este objetivo se han propuesto muchas metodologías a través del tiempo. Aunque el desarrollo de los computadores ha sido exponencial, todavía es necesario nivelar desempeño y calidad de los sistemas biométricos en general. Existen métodos con excelentes resultados para clasificación de patrones, el problema empieza cuando esta clasificación ocurre en sistemas cuyo tiempo de respuesta es primordial. En los sistemas biométricos de huella dactilar el tiempo de respuesta es importante, y este será aún más importante a medida que la autenticación e identificación automatizada se vuelve una cotidianidad. Es por esto que se deben buscar métodos que minimicen los rangos de error en el menor tiempo de ejecución. En la mayoría de metodologías propuestas, el preprocesamiento de la imagen de huella dactilar se lleva la mayor cantidad de tiempo de procesamiento del sistema en comparación a la clasificación, aunque este preprocesamiento esta orientado ha mejorar la imagen y por ende, mejorar la clasificación.. 3.1 Estado del Arte Existen 4 grandes acercamientos al problema de clasificación de huellas dactilares (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, pp. 14,15): -. Sintáctico: los patrones de surcos y minucias se aproximan a cadenas de primitivas, las clases de clasificación se modelan como reglas de producción o reglas de gramática con las muestras de entrenamiento. La clasificación se realiza pasándole a un parser la cadena de primitivas.. -. Estructural: características basadas en minucias (o singularidades) se extraen y se representan con un grafo. La clasificación estructural se realiza mediante la explotación de la topología de las características.. -. Estadístico: se utilizan clasificadores estadísticos con las características de las huellas dactilares.. -. Red Neuronal Artificial: se construyen vectores característicos de la huella dactilar para ser pasado a una red neuronal artificial clasificadora. 21.

(31) ISC-2003-1-5 Existen muchos métodos propuestos para la clasificación de las huellas dactilares. En el caso de este trabajo se evaluará la clasificación con redes neuronales artificiales y se utilizará la base de datos NIST-14, la cuál será descrita más adelante. El escoger esta base de datos, cierra de algún modo el marco de comparación ya que la solución para estos problemas depende de la calidad y tipo de las imágenes. La gran mayoría de los trabajos hechos sobre el tema de clasificación de huellas dactilares utilizan la base de datos NIST-4, una base de datos que es mucho mas útil para evaluar algoritmos de extracción de características; el utilizar la base de datos NIST-14 provee resultados mucho mas realistas (Watson, Candela & Grother, 1994, p. 7). Vale la pena destacar que la base de datos NIST-9 está contenida en la base de datos NIST-14. Es por esta razón que aquellos trabajos que hagan uso de la base de datos NIST-9 sirven como marco de comparación. Watson, Candela y Grother implementaron en 1994 un clasificador probabilístico con red neuronal. En su experimento utilizaron los 5 primeros volúmenes de la base de datos NIST-9, las imágenes “F” fueron utilizadas para entrenar la red, y las imágenes “S” fueron utilizadas para probar la red. En el preprocesamiento de la imagen hacen una segmentación para obtener una imagen más pequeña de la original que contiene la huella dactilar, y utilizan filtros con base en la transformada Fourier para mejorar la imagen. Para extraer las características utilizan un método basado en surco-valle, y la transformada K-L. El sistema rechaza huellas dependiendo de su calidad dado que presentan ambigüedad para el clasificador. Watson, Candela y Grother obtuvieron tasas de error de 8,65% clasificando en las 5 clases de Henry rechazando 10% de las huellas dactilares, una mejora del 2% en la tasa de error comparando la clasificación sin mejoras a la imagen antes de la clasificación. La tabla 2 (Prabhakar, 2001, p. 123) muestra los resultados conseguidos por algunos autores en el problema de clasificación de huellas dactilares. Aunque en esta tabla no se especifica la base de datos utilizada y en algunos casos no se clasifican las huellas en las 5 clases de Henry, sirve para poder comparara los resultados obtenidos en este trabajo.. 22.

(32) ISC-2003-1-5. Autores. Clases. Características. Método. 7. Puntos Singulares. Basado Reglas. Blue, 1994.. 5. Campo Direcciones. de. Red Neuronal. 92,8% (0%). Wilson, 1994.. 5. Campo Direcciones. de. Red Neuronal. 90,2% (0%). Candela, 1995.. 6. Campo Direcciones. de. Red Neuronal. 92,2% (0%). Pal & Mitra, 1996.. 5. Campo Direcciones. de. Red Neuronal. 82+% (0%). Fitz & Green, 1996.. 3. FFT. Vecino cercano.. más. 85% (0%). Karu & Jain, 1996.. 5. Puntos Singulares. Basado reglas.. en. 85% (0%). Senior, 1997.. 4. Surcos. Modelo de Markov oculto.. 90% (0%). Chong, 1997.. 5. Surcos. Basado en reglas. 96,5% (0%). Hong & Jain, 1999.. 5. Puntos singulares y surcos.. Basado en reglas. 87,5% (0%). Proposed, 1999.. 5. Respuesta Gabor.. Combinación. 90% (1,8%). Capelli, 2000.. 5. Campo Direcciones.. Combinación. 99% (20%). Kawagoe 1984.. &. Tojo,. de. Precisión (% de rechazo) en. 91,5% (0%). Tabla 2. Estado del Arte para la Clasificación de Huellas Dactilares.. 23.

(33) ISC-2003-1-5. 3.2 Base de Datos NIST-14 El método utilizado para adquirir las imágenes de huellas dactilares, personaliza la solución del problema de clasificación de huellas dactilares. En un sistema biométrico que cuente con un escáner de alta resolución, el preprocesamiento de la imagen va a ser mínimo ya que el escáner garantiza de algún modo la calidad y posición de la huella dactilar dentro del marco de la imagen. En cambio, un sistema de clasificación cuyas imágenes sean adquiridas mediante fotografías de alta resolución (normalmente se hace con una cámara CCD), el preprocesamiento es importante ya que estas imágenes vienen normalmente de impresiones de tinta donde la posición y calidad de la huella no fueron evaluadas para su posterior digitalización y procesamiento. El saber escoger una base de datos para evaluar un sistema es muy importante ya que le da realismo a los resultados del experimento. En este trabajo se utilizaron las imágenes “F” del segundo volumen de la base de datos NIST-14. Esta base de datos es mantenida por el Instituto Nacional de Estándares y Tecnología de Estados Unidos, NIST (National Institute of Standards and Technology). Esta es una base de datos apropiada para la investigación de métodos de clasificación de huellas dactilares2. El segundo volumen de la base de datos NIST-14 cuenta con 13.500 imágenes de huellas dactilares en escala de grises de 8 bits con dimensiones de 832x768 píxeles (19.7 píxeles por milímetro). Estas 13.500 imágenes de huellas dactilares pertenecen a una colección de tarjetas pares de huellas dactilares. Es decir, se tomaron impresiones de los diez dedos de un individuo en una tarjeta de 4096x1536 píxeles 2 veces, y a partir de estas tarjetas se obtuvieron 20 imágenes de impresiones de huellas dactilares de 832x768 píxeles. Una de las tarjetas esta compuesta por las imágenes cuyo nombre de archivo comienza por “F” y las otras imágenes de la segunda impresión comienzan por “S”. La diferencia entre estas copias es que las “F” son los archivos y las “S” hacen parte de las tarjetas de búsqueda.. 2. NIST Special Database 14. NIST http://www.nist.gov/srd/nistsd14.htm. SCIENTIFIC. 24. AND. TECHNICAL. DATABASES..

(34) ISC-2003-1-5. Ilustración 18. Huellas Dactilares de la Base de Datos NIST-14.. La distribución de las imágenes “F” del segundo volumen de las base de datos NIST-14 es la siguiente: -. Lado Izquierdo: 34,32%. -. Lado Derecho: 34,91%. -. Espiral: 22,23%. -. Arco Tendido: 4,38%. -. Arco: 4,05%. -. Accidental (Scar): 0,07%. Esta distribución es parecida a la distribución natural de huellas. Esta clasificación viene como encabezado en el archivo de cada imagen con L para lado izquierdo, R para lado derecho, W para espiral, A para arco, T para arc o tendido y S para accidental. La base de datos NIST-14 es adecuada para investigar métodos de clasificación. Como se puede ver en la ilustración 18, las imágenes fueron tomadas teniendo en cuenta el campo de impresión de la tarjeta y no se intento centrar la huella dactilar. Este aspecto incrementa el realismo de la situación. Solo basta imaginar el proceso de digitalización de una base de datos de algún organismo que tenga gran cantidad de huellas dactilares. Este proceso de digitalización debería tener en 25.

(35) ISC-2003-1-5 cuenta que el proceso físico de impresión de cada huella dactilar fue hecho sin tener mucho cuidado en la calidad o posición de la impresión. Las imágenes con las que se trabajo tienen niveles de calidad variables. Como ya se dijo anteriormente no se tuvo en cuenta la orientación de la huella, la posición y la calidad de la impresión. Aunque hay varias imágenes con calidad aceptable, hay otras que presentarán problemas en el trabajo a realizar. La ilustración 19 muestra una imagen de mala calidad.. Ilustración 19. Imagen de mala calidad.. La base de datos NIST-14 tiene todas las huellas dactilares de la base de datos NIST-9. De hecho, las primeras 13.500 imágenes de NIST-14 son todas las imágenes que se encuentran en los 5 volúmenes de la base de datos NIST-9.. 3.3 Preprocesamiento de la imagen Las imágenes de huellas dactilares de la base de datos NIST-14 tienen niveles de calidad variables. Este aspecto crea la necesidad de tratar de mejorar la calidad de la imagen para no exponer el sistema de clasificación a ruido proveniente de una huella de mala calidad que incida en el resultado de la clasificación. El primer paso necesario es tomar de cada imagen lo que realmente interesa, es decir, extraer la huella dactilar. Se parte de la hipótesis que la huella es aquel grupo más grande de píxeles oscuros con un fondo mucho más claro. Como se podrá ver mas adelante este no es el caso en todas las imágenes ya que hay imágenes que tienen las huellas con algún tipo de escritura que dificultará el proceso de segmentación.. 26.

(36) ISC-2003-1-5 3.3.1 Segmentación Las imágenes de la base de datos NIST-14, tienen a la huella dactilar en diferentes posiciones y orientaciones. Es necesario implementar un método que capture la huella dactilar y deseche el resto de la imagen. Al segmentar la imagen también se logra que la dimensión de la información se reduzca y también la carga de operaciones del sistema.. Ilustración 20. Imagen de huella dactilar.. El método implementado se basa en el algoritmo propuesto por Watson, Candela y Gother (1994). En este método, se toma la imagen de huella dactilar con dimensiones de 832x768 píxeles y se genera una imagen de 512x480 píxeles. Esta dimensión resultado se definió para lograr compatibilidad con algoritmos existentes que se implementan en los sistemas biométricos de huella dactilar. La orientación de esta imagen resultado puede ser distinta a la imagen original ya que el algoritmo intenta enderezar la huella dactilar. 1. En este primer paso se asocia una imagen binaria de 104x96. Esta imagen binaria pretende generalizar el proceso de segmentación para toda la imagen, la idea es operar sobre bloques de 8x8 de la imagen original. Primero se intenta definir que parte de la imagen es huella y que parte es fondo, para esto se debe calcular el valor mínimo y máximo de píxel en toda la imagen y el valor mínimo de píxel de cada bloque. for (varios valores (factor) entre 0,0 y 1,0) { 27.

(37) ISC-2003-1-5 umbral=mínimo_global+factor*(máximo_global – mínimo_global) Asignar “verdadero” a cada píxel de la imagen binaria asociada (104x96) cuyo valor de bloque mínimo sea menor o igual que el umbral. Se cuenta el número de píxeles “verdaderos” de la imagen binaria. Estos píxeles de la imagen binaria equivalen a bloques que no hacen parte del fondo en la imagen original (832x768). A continuación se deben contar el número de transiciones que existen entre los píxeles verdaderos y falsos de la imagen binaria asociada, horizontalmente y verticalmente. Esto equivale a contar el número de huecos que existen en las filas y columnas de la imagen binaria asociada. Se debe llevar el factor que al ser aplicado, tiene el menor número de transiciones en la imagen binaria asociada. } Una vez se completa este ciclo, se debe tener un valor para factor cuya imagen binaria asociada sea una imagen binaria de la imagen original. Se repite el algoritmo una vez mas, solo que ya no es un ciclo por que el valor de factor óptimo ya se conoce. Hay varios aspectos para resaltar de esta rutina. Es posible que el ciclo comience desde 0,4 y termine en 1 con incrementos de 0,1. Si por ejemplo se asigna a factor un valor muy bajo (0,0 – 0,4), la imagen binaria tendrá muchos huecos en lugares que no hacen parte del fondo, y si se tiene un valor muy alto (0,8 – 1,0), habrá muchas manchas en lo que debería ser fondo. Basta notar que se efectúan al menos 6 iteraciones para concluir que este proceso es bastante pesado para la máquina por lo que empezar desde 0,4 no es mala idea. No es posible imponer un límite menor a 1,0 ya que la base de datos cuenta con imágenes de huellas muy claras donde no es fácil diferenciar la huella del fondo. Si la rutina tiene un límite superior menor a 1,0 es muy posible que no se detecte la huella y la imagen binaria sea una imagen de píxeles falsos lo que estropearía las siguientes rutinas. Es necesario definir un rango para el número de píxeles verdaderos en la imagen binaria asociada ya que si no existe un límite inferior, una imagen binaria asociada llena de píxeles falsos tendría 0 transiciones lo que llevaría a cometer errores en el cálculo del factor. Análogamente se tendría el mismo problema si no se tiene un límite superior: una imagen llena de píxeles verdaderos tiene 0 transiciones pero esto no es lo que se quiere. Se encontró que era suficiente que hubiesen entre 4.500 y 8.000 píxeles 28.

(38) ISC-2003-1-5 verdaderos que no hacen parte de fondo en la imagen binaria asociada. Si el límite bajo es por ejemplo 3.000, se va a tener una imagen con muchas partes “falsas”. Si el límite alto es demasiado alto se va a obtener una imagen con muchas partes “verdaderas”.. Ilustración 21. Separación del Fondo.. 2. Se limpia la imagen binaria asociada y se centra. Primero se erosiona la imagen 3 veces. En cada erosión se cambian a falso aquellos píxeles que tienen algún vecino verdadero. Estos vecinos son aquellos de conexión 4: (arriba, abajo, izquierda y derecha). La huella siempre va a ser el conjunto de píxeles verdaderos más grande. Se cambian a falso aquellos píxeles que no pertenecen a este grupo. Esto se puede lograr mediante el método de etiquetamiento de componentes para imágenes binarias (Ritter & Wilson, 2000, p. 173). Se cambia a verdadero todo píxel falso que tenga los píxel de la izquierda y derecha verdaderos o los píxeles de arriba y abajo. Se calcula la posición del centro del área de la huella y se centra la huella con base en las coordenadas del centroide. Las coordenadas del centroide de una imagen binaria I con dimensiones mxn (píxeles verdaderos son 1 y falsos son 0) son:. 29.

(39) ISC-2003-1-5 m. x=. n. ∑∑ x ⋅ I ( x, y ) x =1 y =1 m n. ∑ ∑ I (x, y ) x=1 y =1. m. y=. n. ∑∑ y ⋅ I ( x, y ) x =1 y =1 m n. ∑∑ I ( x, y ) x =1 y =1. Ilustración 22. Grupo más grande centrado con base en su centroide.. 3. Se encuentra el borde izquierdo, derecho y superior de la imagen binaria asociada. El procedimiento es análogo para los tres lados. Por ejemplo para el borde derecho, se parte desde la columna de la mitad y se hace un ciclo que recorra las columnas hasta que se exista una transición de verdadero a falso o hasta cuando exista una diferencia de 2 con respecto a la columna del borde de la fi la inmediatamente anterior. Esta última condición se incluye para no aceptar cambios bruscos en el borde. Como se puede ver en la ilustración, el recorrido se hace dentro de límites. Para el borde derecho e izquierdo, se recorre desde la fila 30 hasta la fila 66, ya que con la información contenida en estas filas es suficiente para continuar con el siguiente paso. Lo mismo ocurre con el borde superior, se recorre desde la columna 30 hasta la columna 76. 30.

(40) ISC-2003-1-5. Ilustración 23. Bordes de la imagen. 4. Linearizar los bordes de la imagen binaria asociada y encontrar sus pendientes. Esta rutina tiene un problema ya que en el método al intentar linearizar un conjunto de puntos verticales aproxima una línea horizontal, es por esto que es necesario ver los bordes derecho e izquierdo de lado: las filas de la imagen son la primera dimensión y las columnas la segunda dimensión. En el caso del borde superior las columnas son la primera dimensión y las filas la segunda. Se parte de la hipótesis que no van a existir bordes derechos o izquierdos horizontales lo cual es claramente muy difícil que ocurra o que no haya bordes superiores verticales. El método de evaluación de eigenvectores sirve para linearizar. Primeo se calculan los promedios de cada dimensión x,y dado un conjunto de puntos:. 1. x = N ∑x. i. 1. y= N ∑y. i. Se le resta el promedio a cada punto en cada dimensión para estandarizarlo:. 31.

(41) ISC-2003-1-5. xˆ = x − x i. i. yˆ = y − y i. i. Se calculan los valores a, b y c:. a = ∑x ˆi b=∑. 2. (xˆ yˆ ) i. c =∑ y ˆi. i. 2. Se calcula λ (menor eigenvalor) y la pendiente m :. (a + c ) −. ( a + c)( a + c) − 4ac + 4bb 2 m = −b /( λ − a ) λ=. Si a = λ la pendiente es vertical. Ya con la pendiente se puede calcular el ángulo del borde linearizado. 5. Promediar los ángulos de las pendientes de la imagen binaria asociada. Es trivial calcular el ángulo teniendo la pendiente, después se debe cambiar cada ángulo para que se cumpla la siguiente condición: 0 ≤ φ <180 Esto es necesario para conseguir el promedio de ángulos ya que si simplemente se suman y se divide por 3, el resultado es erróneo. Por ejemplo 90° y -90° son ángulos equivalentes, pero si se suman y se dividen entre 2 dará como resultado 0°, lo cuál esta mal. Si en cambio se cambia el -90° a 90 que es su equivalente, al sumar y dividir entre 2 da 90° que es la respuesta que se busca. 6. Rotar la imagen con base en el cálculo del ángulo promedio de las pendientes de los tres lados. Para conocer la orientación de la imagen: orientación_de_la_huella = atan(pendiente).. 32.

(42) ISC-2003-1-5 rotación_de_la_imagen = π/2 - orientación_de_la_huella.. Ilustración 24. Imagen binaria rotada.. 7. Encontrar el borde superior de la huella dactilar con la imagen binaria asociada. Para esto se desplaza una ventana de 60x64centrada horizontalmente de arriba abajo. Se para cuando la primera fila contenga 10 o más píxeles verdaderos. Este número se calcula experimentalmente y lo que se logra es bajar un poco el marco de la ventana pequeña con respecto al borde superior de la imagen. Con la información que se tiene hasta este punto ya se sabe cuanto se debe rotar, desplazar y desde donde se toma la imagen pequeña de la imagen original.. Ilustración 25. Imagen binarizada pequeña.. 8. La imagen original se desplaza, rota y se toma la subimagen de la huella dactilar. La segmentación ha terminado. 33.

(43) ISC-2003-1-5. Ilustración 26. Imagen Segmentada.. Con esta rutina de segmentación se logran buenos resultados la mayoría de los casos. Cuando esta rutina no logra buenos resultados es por que la huella no se diferencia fácilmente del fondo mas claro y esto ocurre por varias razones: - El fondo no es uniformemente mas claro que la huella. El fondo tiene partes oscuras y el primer paso de la rutina de segmentación no logra separar la huella del fondo.. Ilustración 27. Error en la segmentación por fondo no uniforme.. 34.

(44) ISC-2003-1-5 - Hay ruido en la imagen como escritura ajena a la huella que en la primera parte de la segmentación se confunde como conjunto de píxeles pertenecientes a la huella:. Ilustración 28. Error en la segmentación por presencia de caracteres.. 3.4 Mapa de Direcciones Existen 2 grandes tipos de características en la huella dactilar (Prabhakar, 2001, pp. 18-19): -. Estructuras globales de surcos y valles.. -. Minucias locales de surcos y valles.. Para clasificar huellas dactilares las estructuras globales son las que se utilizan para clasificar en los grupos globales. Para identificación y autenticación se utilizan las minucias. Es así que se debe buscar algo que caracterice esa estructura global de la huella dactilar que es formada por los surcos y los valles, una estructura que es claramente distinguible en cada clase de Henry.. 35.

(45) ISC-2003-1-5. Ilustración 29. Imagen segmentada.. El mapa de direcciones representa una propiedad intrínseca de las imágenes de huellas dactilares y define coordenadas invariantes para surcos y valles en vecindades locales (Hong, Wan & Jain, 1998, p. 10). Esto quiere decir que la huella dactilar se puede ver como una textura orientada, y por ende se puede caracterizar la huella dactilar con el mapa de direcciones. Este mapa de direcciones es la orientación de cada punto en la imagen con respecto a sus vecinos y normalmente se determina la orientación de bloques y no por puntos para reducir la carga computacional (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 20). Para calcular el mapa de direcciones se implementó un método muy popular y es parecido al utilizado por Zhang, Huang y Yan (s.f.) entre muchos otros autores. Siendo G la imagen de M×N, primero se calculan los gradientes Gx y Gy que son matrices con dimensiones de M×N cada una (Sobel fue el operador utilizado para calcular el gradiente), Son un conjunto de vectores que apuntan en la dirección de valores crecientes de G. Una vez se tienen los gradientes, se calcula la orientación ángulo de cada punto:   Gy  , si G x ≠ 0 ∧ G y ≠ 0 arctan  G α (i , j ) =   x 0, si G = 0 ∨ G = 0 x y  36.

(46) ISC-2003-1-5 Es necesario poner la segunda condición en la ecuación ( α (i , j ) = 0, si G x = 0 ∨ G y = 0 ) ya que si G x = 0 o G y = 0 , el punto tiene una orientación vertical u horizontal, así que se pueden tomar los valores de 0 o π/2 radianes. Ahora se calcula la orientación de bloques de 16×16 (W). Para esto es necesario promediar los ángulos de los puntos que se encuentran en cada bloque:   ∑ sin(2 * α ( i, j))   (i , j )∈W  1  , si ∑ cos(2 *α (i, j )) ≠ 0 ∧ ∑ sin(2 * α ( i, j)) ≠ 0  * arctan ( i , j )∈W ( i , j )∈W  ∑ cos(2 * α ( i, j))  θ ( x, y ) =  2  (i, j )∈W   0, si ∑ cos(2 * α (i, j )) = 0 ∨ ∑ sin(2 * α (i , j )) = 0  ( i , j )∈W ( i, j ) ∈W. Es necesario aclarar varias cosas de la anterior ecuación. θ es una matriz con menor dimensión a la imagen original ya que cada valor representa la dirección de cada bloque; es decir si 1 ≤ i ≤ M ∧ 1 ≤ j ≤ N , entonces 1 ≤ x ≤ M w ∧ 1 ≤ y ≤ N w , ya que w = 16 es el tamaño de cada bloque ( w× w ). Para poder promediar los ángulos, es necesario sumar los senos de los ángulos multiplicados por 2, y dividirlo por la suma de cosenos de los ángulos multiplicados por 2. La matriz orientación fue convertida a un campo vectorial continuo. Si por ejemplo se tienen 2 ángulos de 1° y 179°, el sumarlos y dividirlos por 2 daría un ángulo cercano a los 90°. Si se convierten a un campo vectorial continuo (cos(2*ángulo), sin(2*ángulo)), 1°=(0.9994, 0.0349) y 179°=(0.9994, 0.0349), al promediarlos da (0.9994, 0) que equivale a una línea horizontal (Wilson, Candela & Watson, 1993, p. 5).. 37.

(47) ISC-2003-1-5. Ilustración 30. Mapa de direcciones.. Como se puede ver, el mapa de direcciones presenta diferentes perturbaciones, es necesario implementar algún método que suavice este mapa de direcciones. El método utiliza un filtro pasa bajo ω de radio 2 con una ventana de tamaño λ=5. Este paso equivale a promediar aquellos puntos que se encuentran dentro de una radio de 2 puntos para asignárselo al punto del centro del filtro. Para esto es necesario convertir primero la matriz orientación en un campo vectorial continuo como se describió anteriormente. La matriz orientación suavizada O se obtiene con:. ϕ x ( x , y ) = cos( 2 * θ ( x, y )), ϕ y ( x, y ) = sin( 2 * θ ( x, y )). ϕ x' ( x , y ) = ϕ 'y ( x, y ) =. λ /2. ∑∑. u= − λ / 2 λ/2. λ /2 v =− λ / 2. ∑∑. u = −λ / 2. λ /2 v=−λ / 2. ω (u , v ) * ϕ x ( x + u , y + v ),. y. ω (u, v) *ϕ y ( x + u, y + v ).. 1  ϕ y' ( x, y )  , si ϕ x' ( x , y ) ≠ 0 ∧ ϕ 'y ( x, y ) ≠ 0  * arctan  '   O( x , y ) =  2  ϕ x ( x, y)   ' ' 0, si ϕ x ( x , y ) = 0 ∨ ϕ y ( x, y ) = 0. 38.

(48) ISC-2003-1-5. Ilustración 31. Mapa de direcciones suavizado.. El mapa de direcciones puede ser utilizado para clasificar las huellas dactilares por que describe el patrón formado por los surcos y los valles. Los mapas de direcciones que no correspondes con estos patrones son errores producto de la calidad de la huella. Estos mapas de direcciones se calculan de las imágenes segmentadas, así que todavía se depende de la calidad de las imágenes de la base de datos NIST-14. Aunque se logran buenos resultados en la mayoría de las imágenes, la mala calidad de una huella puede derivar fácilmente en un mapa de direcciones erróneo.. Ilustración 32. Imagen segmentada de mala calidad con un mapa de direcciones correcto.. 39.

(49) ISC-2003-1-5 La mala calidad de las imágenes puede ser producto de un exceso de tinta en la impresión de la huella dactilar o una falta de tinta haciendo que los surcos y los valles no estén claramente delineados aunque en este último caso el método implementado para el mapa de direcciones no introduce tantos errores.. Ilustración 33. Imagen segmentada con exceso de tinta y su mapa de direcciones erróneo.. Como era de esperarse, el mapa de direcciones es afectado por objetos ajenos a la huella dactilar o por cortaduras en el dedo que se ven representadas en la impresión. Para el mapa de direcciones el método implementado tiene muy buenos resultados, los problemas ocurren cuando la calidad de la imagen no es buena, el mismo problema que se puede tener en la segmentación. La buena calidad de la imagen es crucial para un buen mapa de direcciones así que para buscar mejorar el mapa de direcciones se debe mejorar previamente la imagen.. Ilustración 34. Imagen segmentada de mala calidad con cortaduras en la huella y su mapa de direcciones.. 40.

(50) ISC-2003-1-5 El mapa de direcciones describe los patrones globales de las huellas. Es una matriz de 30x32 que se puede ver como un vector de 960 dimensiones tomando las filas de la matriz. Con el mapa de direcciones se puede continuar con la clasificación.. 41.

Referencias

Documento similar

o Si dispone en su establecimiento de alguna silla de ruedas Jazz S50 o 708D cuyo nº de serie figura en el anexo 1 de esta nota informativa, consulte la nota de aviso de la

Las manifestaciones musicales y su organización institucional a lo largo de los siglos XVI al XVIII son aspectos poco conocidos de la cultura alicantina. Analizar el alcance y

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)