5. Resultados y Comparaciones 49
5.2. Error de evaluaci´ on de entrenamiento y prueba con reducci´ on de dimensio-
Para realizar esta tarea se aplic´o PCA sobre las im´agenes de venas segmentadas con SC, en el Cuadro 5.3 se puede observar los diferentes autovalores o caracter´ısticas utilizadas para la etapa de entrenamiento de la BD1.
Error en Entrenamiento ( %)
Nc/Dedo 1 2 3 4 5 6 Promedio
5 0.61 0.58 0.57 0.57 0.57 0.55 0.58 10 0.12 0.08 0.13 0.11 0.09 0.09 0.10 20 0.01 0.00 0.01 0.01 0.00 0.00 0.01 30 0.00 0.00 0.00 0.01 0.00 0.00 0.00 40 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Cuadro 5.3: Errores de train para la DB1 considerando diferente n´umero de caracter´ısticas PCA (Nc).
El cuadro 5.4, representa los errores del conjunto de prueba utilizando PCA para diferente n´umero de autovalores para la BD1, como se puede observar el n´umero ´optimo de autovalores o caracter´ısticas es 40, con la c´ual se obtiene un error de evaluaci´on en prueba de 0.04 %.
Errores Conjunto de Prueba ( %)
Nc/Dedo 1 2 3 4 5 6 Promedio
5 0.75 0.70 0.64 0.66 0.64 0.63 0.67 10 0.32 0.23 0.31 0.23 0.20 0.21 0.25 20 0.12 0.05 0.12 0.09 0.05 0.07 0.08 30 0.10 0.04 0.09 0.08 0.03 0.04 0.06 40 0.0625 0.037 0.039 0.037 0.020 0.041 0.039
Cuadro 5.4: Errores de test para la BD1 considerando diferente n´umero de caracter´ısticas PCA (Nc).
La Figura 5.3 representa la matriz de confusi´on para el dedo 5 (dedo medio mano derecha) del conjunto de prueba de la BD1 utilizando PCA, se observa que de 60 usuarios existen errores en 5 usuarios, en cada uno de ellos solo una muestra ha sido err´oneamente clasificado, que significa la mitad de usuarios incorrectamente clasificados en relaci´on a la etapa de clasificaci´on sin utilizar PCA.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Predicted Class
12 34 56 78 109 1112 1314 1516 1718 1920 2122 2324 2526 2728 2930 3132 3334 3536 3738 3940 4142 4344 4546 4748 4950 5152 5354 5556 5758 5960
True Class
1 1 1
3
3
1 1
1 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
4 4
Figura 5.3: Matriz de confusi´on para el conjunto de prueba del dedo 5 de la BD1 aplicando PCA.
La Figura 5.3 representa la matriz de confusi´on para el dedo 5 (dedo medio mano derecha) del conjunto de prueba de la BD1 utilizando PCA, se observa que de 60 usuarios existen errores en 5 usuarios, en cada uno de ellos solo una muestra ha sido err´oneamente clasificado, que significa la mitad de usuarios incorrectamente clasificados en relaci´on a la etapa de clasificaci´on sin utilizar PCA.
5 10 15 20 25 30 35 40 Número de características
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
Error
Dedo 1 Dedo 2 Dedo 3 Dedo 4 Dedo 5 Dedo 6
Figura 5.4: Gr´afica del error en funci´on del n´umero de componentes PCA o caracter´ısticas para todos los dedos de la BD1.
La Figura 5.4 representa el n´umero de autovalores o caracter´ısticas extra´ıdas despu´es de aplicar PCA frente a su error despu´es de utilizar el clasificador, se observa que para todos los dedos 40 autovalores representan un n´umero de caracter´ısticas ´optima.
El Cuadro 5.5 representa los errores de evaluaci´on –tasa de error– en prueba y entrena- miento de la BD2 aplicando PCA. Se puede observar que el n´umero ´optimo de autovalores es 300 con un error de 0.0015 %.
ERRORES BD2 ( %)
Entrenamiento Prueba
Nc/Dedo 1 2 Promedio 1 2 Promedio
50 0.001 0.001 0.001 0.005 0.002 0.0035
100 0.00005 0.00009 0.00007 0.003 0.002 0.0025
150 0.00004 0.001 0.00052 0.003 0.003 0.003
200 0.00004 0.0004 0.00022 0.002 0.002 0.002
250 0 0.0005 0.00025 0.002 0.003 0.0025
300 0 0.0004 0.0002 0.001 0.002 0.0015
Cuadro 5.5: Errores de entrenamiento y prueba en clasificaci´on considerando diferentes n´umero de caracter´ısticas PCA para la BD2.
La Figura 5.5 representa el n´umero de autovalores o caracter´ısticas extra´ıdas frente a su error de evaluaci´on en entrenamiento y prueba, se observa que 300 autovalores o caracter´ısticas dan las mejores tasas de error tanto en entrenamiento como en prueba para la BD2.
50 100 150 200 250 300 Número de características
1 1.5 2 2.5 3 3.5 4 4.5 5
Error
#10-3
Dedo 1 Dedo 2
Figura 5.5: Gr´afica del n´umero de autovalores frente al error de todos los dedos para la BD2.
1 50 100 156
Predicted Class 1
50
100
156
True Class
Figura 5.6: Matriz de confusi´on para el conjunto de prueba del dedo 1 utilizando PCA para la BD2.
La Figura 5.6 representa la matriz de confusi´on para el conjunto de prueba del dedo 1 (dedo ´ındice mano izquierda), despues de aplicar PCA (300 autovalores representativos) para la BD2, donde se distinguen 156 clases y pr´acticamente ninguna muestra confundida, en donde la tasa de acierto es de 99.9985 %.
Cap´ıtulo 6
Conclusiones y trabajos futuros
En este trabajo de tesis, se implement´o un sistema para la identificaci´on de usua- rios, para ello se utiliz´o el algoritmo de Spectral Clustering (SC) para la segmentaci´on de p´ıxeles de venas en im´agenes infrarrojas de los dedos, adem´as para la reducci´on de dimensionalidad se utiliz´o An´alisis de Componentes Principales (PCA) sobre las im´agenes segmentadas con SC. Finalmente para la clasificaci´on de usuarios se optimiz´o un regreso log´ıstico multiclase entrenado tanto con las im´agenes segmentadas con SC como con los datos luego de la reducci´on de dimensionalidad con PCA.
Se concluye que el n´umero de muestras es importante para que un clasificador pueda funcionar correctamente, sin embargo, el problema abordado en este trabajo de tesis es un problema cerrado por lo que no necesariamente se necesita un n´umero de muestras alto para tener una buena tasa de error. Por ejemplo, la base de datos de la Universidad de Twente tiene cuatro muestras por dedo, mientras que la base de datos de la Universidad Polit´ecnica de Hong Kong tiene doce muestras por dedo, not´andose claramente la ventaja que representa tener mayor n´umero de muestras con la tasa de error que se obtuvo con cada base de datos.
La tasa de error ´optima que se obtiene es a partir de aplicar reducci´on de dimensiona- lidad (PCA) a los patrones resultantes obtenidos con SC, logrando una tasa de error de 0.0015 % para 300 autovalores representativos (de acuerdo a los experimentos a partir de 300 caracter´ısticas no existen reducciones significativas en la tasa de error).
Una ventaja importante que representa SC a diferencia de los m´etodos del estado del arte es que ha podido diferenciar tres grupos tales como el patr´on de venas, el fondo, y la regi´on intermedia.
Al obtener una tasa de error final de 0.0015 % se concluye que el m´etodo propuesto de SC se desempe˜na de forma eficiente en la tarea de la extracci´on de patrones de venas.
El regresor multiclase ha sido capaz de aprender las caracter´ısticas obtenidas con SC y la respectiva reducci´on de dimensionalidad con PCA, los resultados utilizando un clasifi- cador b´asico resalta la eficacia de SC en la etapa de extracci´on de caracter´ısticas a trav´es de la segmentaci´on de los p´ıxeles correspondientes a las venas.
PCA al momento de validar ayuda y reduce el coste computacional notablemente, se obtiene un error de evaluaci´on ´optimo para el conjunto de prueba debido a que PCA re- duce caracter´ısticas ruidosas y redundantes.
El patr´on de venas se adquiri´o mediante SC en peque˜nas regiones, evitando incurrir en grandes cantidades de memoria, atacando as´ı una de las principales desventajas de SC.
Los resultados muestran que el algoritmo de SC puede obtener patrones de venas que a veces son dif´ıciles de diferenciar a simple vista y son buenas estimaciones de patrones de venas reales, incluso usando una sola semilla patr´on para todas las muestras, de esta manera SC se desempe˜no eficientemente en la tarea de extracci´on de caracter´ısticas (pa- trones de p´ıxeles de las venas).
Como trabajo futuro, los patrones de venas de diferentes dedos se concatenar´an y se probar´a clasificadores m´as fuertes para aumentar el rendimiento de la clasificaci´on.
La etapa de extracci´on de semilla patr´on a partir de una muestra donde se diferencien las zonas de venas y no venas ha sido una tarea manual, por tanto, esta semilla podr´ıa ser obtenida de forma autom´atica, se propone la posibilidad de encontrar la semilla patr´on y los par´ametros de corte del segundo eigenvector, de forma autom´atica.
Bibliograf´ıa
[ ´AG+13] Hugo ´Alvarez Garc´ıa et al. Optimizaci´on de un sistema dual de imagen in- frarroja para aplicaci´on en t´ecnicas de an´alisis no invasivo. Master’s thesis, 2013.
[AGSC18] Elie Aljalbout, Vladimir Golkov, Yawar Siddiqui, and Daniel Cremers. Clus- tering with deep learning: Taxonomy and new methods. arXiv preprint ar- Xiv:1801.07648, 2018.
[AK] The Hong Kong Polytechnic University R Ajay Kumar, Yingbo Zhou.
Finger image database (version 1.0). https://www4.comp.polyu.edu.hk/
~csajaykr/fvdatabase.htm. Accedido en Enero del 2020.
[ASS+12] Radhakrishna Achanta, Appu Shaji, Kevin Smith, Aurelien Lucchi, Pascal Fua, Sabine S¨usstrunk, et al. SLIC superpixels compared to state-of-the- art superpixel methods. IEEE transactions on pattern analysis and machine intelligence, 34(11):2274–2282, 2012.
[Bis06] Christopher M. Bishop. Pattern recognition and machine learning. springer, 2006.
[Bri08] Ron Brinkmann. The art and science of digital compositing: Techniques for visual effects, animation and motion graphics. Morgan Kaufmann, 2008.
[CCG+98] Britton Chance, M. Cope, E. Gratton, N. Ramanujam, and B. Tromberg.
Phase measurement of light absorption and scatter in human tissue. Review of scientific instruments, 69(10):3457–3481, 1998.
[DB00] Juan De Burgos. ´Algebra lineal y geometr´ıa cartesiana. 2da. Edici´on)–Mc Graw Hill-2000, 2000.
[FF02] Sergio Fantini and Maria Angela Franceschini. Frequency-domain techniques for tissue spectroscopy and imaging. Handbook of optical biomedical diagnos- tics, 7:405–453, 2002.
[GA91] D. Maravall G´omez-Allende. Reconocimiento, de formas y visi´on artificial.
J. Wiley&Sond. Inc, Ed. RAMA. 1993 o DIGITAL IMAGE PROCESSING.
WK Pratt, 1991.
[GG15] Puneet Gupta and Phalguni Gupta. An accurate finger vein based verification system. Digital Signal Processing, 38:43–52, 2015.
[GSM02] Jos´e Manuel Aranda Gallego, Juan Mel´endez S´anchez, and Fernando L´opez Mart´ınez.Espectrometr´ıa de imagen en el infrarrojo: una contribuci´on al estu- dio de las combustiones ya la teledetecci´on de incendios forestales. Universidad Carlos III de Madrid, Departamento de F´ısica, 2002.
[GUC+08] David M. Griffiths, Arthur E. Uber, Page Cedarholm, Adrienne Fazio, and Michael J. Yanniello. Vein locating device for vascular access procedures, June 19 2008. US Patent App. 11/612,147.
[HWST18] Ran He, Xiang Wu, Zhenan Sun, and Tieniu Tan. Wasserstein cnn: Learning invariant features for nir-vis face recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018.
[Kri16] Scott Krig. Feature learning and deep learning architecture survey. InCom- puter Vision Metrics, pages 375–514. Springer, 2016.
[KZ11] Ajay Kumar and Yingbo Zhou. Human identification using finger images.
IEEE Transactions on image processing, 21(4):2228–2244, 2011.
[LKB+17] Geert Litjens, Thijs Kooi, Babak Ehteshami Bejnordi, Arnaud Arindra Adi- yoso Setio, Francesco Ciompi, Mohsen Ghafoorian, Jeroen A.W.M. van der Laak, Bram Van Ginneken, and Clara I. S´anchez. A survey on deep learning in medical image analysis. Medical image analysis, 42:60–88, 2017.
[LS14] E. Jebamalar Leavline and D. Asir Antony Gnana Singh. On teaching digital image processing with matlab. American Journal of Signaling Processing, pages 7–15, 2014.
[LUZ17] Marc T. Law, Raquel Urtasun, and Richard S. Zemel. Deep spectral clustering learning. InInternational Conference on Machine Learning, pages 1985–1994, 2017.
[Mil94] Benjamin Miller. Vital signs of identity [biometrics].IEEE spectrum, 31(2):22–
30, 1994.
[MY13] David Manso Yuste. Miniaturizaci´on y automatizaci´on de sistema de captura de im´agenes vasculares. B.S. thesis, 2013.
[NS10] Koushik Kumar Nundy and Shourjya Sanyal. A low cost vein detection system using integrable mobile camera devices. In India Conference (INDICON), 2010 Annual IEEE, pages 1–3. IEEE, 2010.
[PGCY09] Mg. Luzmila Pr´o, Juan Carlos Gonz´ales, Walter Contreras, and Carlos Ya˜nez.
Tecnolog´ıas biom´etricas aplicadas a la seguridad en las organizaciones. Fac.
Ing. Sist. e Inform´atica Univ. Nac. Mayor San Marcos, pages 55–66, 2009.
[RG16] Simon Rogers and Mark Girolami. A first course in machine learning. Chap- man and Hall/CRC, 2016.
[RSB15] Ramachandra Raghavendra, Jayachander Surbiryala, and Christoph Busch.
An efficient finger vein indexing scheme based on unsupervised clustering. In IEEE International Conference on Identity, Security and Behavior Analysis (ISBA 2015), pages 1–8. IEEE, 2015.
[SHI17] Hossain Shahriar, Hisham Haddad, and Mahbubul Islam. An iris-based aut- hentication framework to prevent presentation attacks. In 2017 IEEE 41st Annual Computer Software and Applications Conference (COMPSAC), volu- me 2, pages 504–509. IEEE, 2017.
[SISS+16] K. Syazana-Itqan, A.R. Syafeeza, N.M. Saad, Norihan Abdul Hamid, and W.H.B.M. Saad. A review of finger-vein biometrics identification approaches.
Indian J. Sci. Technol, 9(32), 2016.
[Smi02] Lindsay I. Smith. A tutorial on principal components analysis. Technical report, 2002.
[ST05] A. Sig¨uenza and M. Tapiador. Tecnolog´ıas biom´etricas aplicadas a la seguri- dad. Editorial Ra-Ma, 2005.
[SYW+19] Kun Su, Gongping Yang, Bo Wu, Lu Yang, Dunfeng Li, Peng Su, and Yilong Yin. Human identification using finger vein and ecg signals. Neurocomputing, 332:111–118, 2019.
[SYYY17] Kun Su, Gongping Yang, Lu Yang, and Yilong Yin. Finger vein image retrieval via affinity-preserving k-means hashing. In Biometrics (IJCB), 2017 IEEE International Joint Conference on, pages 375–382. IEEE, 2017.
[TC09] Oscar Fernando Motato Toro and Humberto Loaiza Correa. Identificaci´´ on biom´etrica utilizando im´agenes infrarrojas de la red vascular de la cara dorsal de la mano. Ingenier´ıa e Investigaci´on, 29(1):90–100, 2009.
[Ton12] Bram Ton. Vascular pattern of the finger: biometric of the future? sensor de- sign, data collection and performance verification. Master’s thesis, University of Twente, 2012.
[TV13] Bram T. Ton and Raymond N.J. Veldhuis. A high quality finger vascular pattern dataset collected using a custom designed capturing device. In2013 International Conference on Biometrics (ICB), pages 1–5. IEEE, 2013.
[TWC10] Frederick Tung, Alexander Wong, and David A. Clausi. Enabling scalable spectral clustering for image segmentation. Pattern Recognition, 43(12):4069–
4076, 2010.
[TYSX13] Dun Tan, Jinfeng Yang, Yihua Shi, and Chenghua Xu. A hierarchal framework for finger-vein image classification. In 2013 2nd IAPR Asian Conference on Pattern Recognition, pages 833–837. IEEE, 2013.
[TZG17] Kai Tian, Shuigeng Zhou, and Jihong Guan. Deepcluster: A general clustering framework based on deep learning. InJoint European Conference on Machine
Learning and Knowledge Discovery in Databases, pages 809–825. Springer, 2017.
[VL07] Ulrike Von Luxburg. A tutorial on spectral clustering. Statistics and compu- ting, 17(4):395–416, 2007.
[WESS05] Masaki Watanabe, Toshio Endoh, Morito Shiohara, and Shigeru Sasaki. Palm vein authentication technology and its applications. In Proceedings of the biometric consortium conference, pages 19–21, 2005.
[WL11a] Jian-Da Wu and Chiung-Tsiung Liu. Finger-vein pattern identification using principal component analysis and the neural network technique. Expert Sys- tems with Applications, 38(5):5423–5427, 2011.
[WL11b] Jian-Da Wu and Chiung-Tsiung Liu. Finger-vein pattern identification using svm and neural network technique. Expert Systems with Applications, 38(11):14284–14289, 2011.
[WZL10] Xuebing Wen, Jiangwei Zhao, and Xuezhang Liang. Research on enhancing human finger vein pattern characteristics. In2010 Asia-Pacific Conference on Power Electronics and Design, pages 97–100. IEEE, 2010.
[XG] Tao Xiang and Shaogang Gong. Spectral clustering with eigenvector selection.
Pattern Recognition, 41(3).
[XGF16] Junyuan Xie, Ross Girshick, and Ali Farhadi. Unsupervised deep embedding for clustering analysis. InInternational conference on machine learning, pages 478–487, 2016.
[YRL11] Wenming Yang, Qing Rao, and Qingmin Liao. Personal identification for single sample using finger vein location and direction coding. In2011 International Conference on Hand-Based Biometrics, pages 1–6. IEEE, 2011.
[YS14] Jinfeng Yang and Yihua Shi. Towards finger-vein image restoration and en- hancement for finger-vein recognition. Information Sciences, 268:33–52, 2014.
[YSW11] Jinfeng Yang, Yihua Shi, and Renbiao Wu. Finger-vein recognition based on gabor features. InBiometric Systems, Design and Applications. InTech, 2011.
[YSY11] Jinfeng Yang, Yihua Shi, and Jinli Yang. Personal identification based on finger-vein features. Computers in Human Behavior, 27(5):1565–1570, 2011.
[YWH+18] Wencheng Yang, Song Wang, Jiankun Hu, Guanglou Zheng, and Craig Valli.
A fingerprint and finger-vein based cancelable multi-biometric system.Pattern Recognition, 78:242–251, 2018.
[YWS19] Jinfeng Yang, Jianze Wei, and Yihua Shi. Accurate ROI localization and hierarchical hyper-sphere model for finger-vein recognition. Neurocomputing, 328:171–181, 2019.