Desarrollo de un método para la clasificación automática de imágenes faciales basada en el atractivo aplicando máquinas de aprendizaje
Texto completo
(2) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2. S. AUTORIDADES DE LA UNIVERSIDAD NACIONAL DE TRUJILLO. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. Dr. ORLANDO VELASQUEZ BENITES. A. RECTOR:. DECANO DE LA FACULTAD DECC. FF. Y MM.: Dr. HUMBERTO VERDE OLIVARES. DIRECTOR DE LA ESCUELA ACADEMICO PROFESIONAL DE INFORMÁTICA: M. Sc. EDWIN MENDOZA TORRES. ACADEMICO. DE. TE. JEFE DEL DEPARTAMENTO INFORMÁTICA:. B. IB. LI O. M. SC. CARLOS ENRIQUE CASTILLO DIESTRA. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(3) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 3. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. JURADO DICTAMINADOR. M. SC. CARLOS ENRIQUE CASTILLO DIESTRA PRESIDENTE. B. IB. LI O. TE. ING. JOSÉ LUIS PERALTA LUJÁN SECRETARIO. M. SC. JOSÉ GABRIEL CRUZ SILVA VOCAL. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(4) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 4. SI C. A. SEÑORES MIEMBROS DEL JURADO DICTAMINADOR:. S. PRESENTACIÓN. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. En cumplimiento con las disposiciones vigentes para grados y títulos de la Facultad de Ciencias Físicas y Matemáticas de la Universidad Nacional de Trujillo, sometemos a vuestra consideración la presente tesis titulada: “DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE.” Esperando que el presente sea de vuestra aprobación.. ______________________________. ______________________________ VANESSA VALDIVIEZO PULIDO. B. IB. LI O. TE. ELKE ROMINA ALCALDE LINARES. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(5) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 5. AGRADECIMIENTOS. S. Después de varios altos y bajos, de pasarlo mejor y peor… e incluso de estar a punto de tirar la toalla… al final terminamos la Tesis…. SI C. A. Este trabajo no lo hicimos solas, y por eso agradecemos a todas las personas que de una u otra forma nos han ayudado. En primer lugar a Dios porque siempre nos iluminó en el camino.. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. A nuestro asesor José Gabriel Cruz Silva y a los jurados Carlos Castillo Diestra y José Peralta Luján: Muchísimas gracias por todas las horas dedicadas y por toda la ayuda prestada. A nuestros familiares y amigos por su comprensión.. A todas las personas que participaron respondiendo a la encuesta que elaboramos.. B. IB. LI O. TE. Muchas gracias a todos.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(6) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 6. DEDICATORIA. SI C. A. S. A mi papá Pelayo que aunque no esté él presente en cuerpo está en mi mente porque me enseñó a ser fuerte y siempre sus sabios consejos me dejaron muy en claro que en la vida uno debe luchar por lo que quiere y no quedarse por más dificultades que existan.. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. A mi familia en especial a mi mamá por apoyarme siempre en todo por los cafecitos a la medianoche que daba para que no me durmiera. A mi hermano por entender que no me podía mover de la computadora porque estaba avanzando esta tesis gracias por tu comprensión Ronald. A mis tíos Raúl, Mónica por sus consejos y a mis primos Martha, Kevin por la ayuda prestada en el momento que más lo necesitaba. Un abrazo muy grande para todos. Romina Alcalde. Vanessa Valdiviezo. B. IB. LI O. TE. A Dios que me dio la oportunidad de vivir y de regalarme una familia maravillosa. A mis padres que me dieron la vida y están conmigo en todo momento, brindándome su apoyo sincero e incondicional. Ellos son la base de mi vida profesional, realmente estoy muy agradecida de tenerlos a mi lado.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(7) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 7. INDICE GENERAL INDICE GENERAL ......................................................................................................................... 7 INDICE DE FIGURAS ..................................................................................................................... 9. S. INDICE DE TABLAS ..................................................................................................................... 10. A. CAPITULO 1: ......................................................................................................................... 14. REALIDAD PROBLEMÁTICA ......................................................................................... 14 FORMULACIÓN DEL PROBLEMA .................................................................................. 16 HIPÓTESIS .................................................................................................................... 16 OBJETIVOS................................................................................................................... 16 Objetivo general .................................................................................................... 16 Objetivos específicos.............................................................................................. 16 JUSTIFICACIÓN DEL PROBLEMA.................................................................................. 17 Justificación Social ................................................................................................ 17 Justificación Tecnológica ...................................................................................... 17 Justificación Económica........................................................................................ 17 Justificación Académica........................................................................................ 18 ANTECEDENTES ........................................................................................................... 18 LIMITACIONES DEL ESTUDIO ...................................................................................... 21 SÍNTESIS ORGANIZATIVA DEL INFORME .................................................................... 21. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. 1.1 1.2 1.3 1.4 1.4.1 1.4.2 1.5 1.5.1 1.5.2 1.5.3 1.5.4 1.6 1.7 1.8. SI C. PLANTEAMIENTO DEL ESTUDIO................................................................................................. 14. CAPITULO 2: ......................................................................................................................... 22 MARCO TEÓRICO ...................................................................................................................... 22 CONCEPTOS GENERALES ............................................................................................ 22 Píxel en la Imagen Digital ..................................................................................... 22 Definición de Imagen Digital ................................................................................ 23 Clasificación de imágenes digitales ...................................................................... 23 Representación del color en Imágenes Digitales ................................................. 25 PROCESAMIENTO DIGITAL DE LAS IMÁGENES ........................................................... 28 Binarización ........................................................................................................... 29 Filtrado en Imágenes ............................................................................................. 30 Filtrado en frecuencia: .......................................................................................... 32 Gradiente................................................................................................................ 32 CONTORNO ACTIVO O SNAKE ..................................................................................... 39 TEORÍA DE GRAFOS..................................................................................................... 43 Definición básica y notación de un Grafo ............................................................ 43 Algunos tipos particulares de grafos .................................................................... 44 TRIANGULACIÓN DELAUNAY ...................................................................................... 46 Condición de Delaunay ......................................................................................... 46 Algoritmos para calcular Triangulación Delaunay ............................................ 47 MÁQUINAS DE APRENDIZAJE ...................................................................................... 49 MÁQUINAS DE SOPORTE VECTORIAL(SVM) ............................................................. 50 Definición ............................................................................................................... 50 Metodología............................................................................................................ 51 Clasificación para datos linealmente separables ................................................ 54 Clasificación para datos linealmente no separables ........................................... 57 Clasificación múltiple ............................................................................................ 60. B. IB. LI O. TE. 2.1 2.1.1 2.1.2 2.1.3 2.1.4 2.2 2.2.1 2.2.2 2.2.3 2.2.4 2.3 2.4 2.4.1 2.4.2 2.5 2.5.1 2.5.2 2.6 2.7 2.7.1 2.7.2 2.7.3 2.7.4 2.7.5. CAPITULO 3: ......................................................................................................................... 61 MATERIALES Y MÉTODOS.......................................................................................................... 61 3.1 TIPO DE INVESTIGACIÓN ............................................................................................. 61 3.1.1 De acuerdo al fin que persigue ............................................................................. 61 3.1.2 De acuerdo al diseño de contrastación ................................................................. 61. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(8) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 8. SI C. A. S. DISEÑO DE LA INVESTIGACIÓN ................................................................................... 61 POBLACIÓN Y MUESTRA .............................................................................................. 62 Población ................................................................................................................ 62 Muestra .................................................................................................................. 62 MÉTODOS Y TÉCNICAS ................................................................................................ 63 Método .................................................................................................................... 63 Técnicas .................................................................................................................. 63 ENTORNO ..................................................................................................................... 64 INTERVENCIONES ........................................................................................................ 64 DESARROLLO DEL MÉTODO ....................................................................................... 65 Procedimiento ........................................................................................................ 67 Proceso de Extracción de Características............................................................ 68 Triangulación Delaunay de los Puntos Característicos: .................................... 69 Obtención de Vector de Características: ............................................................. 71 Proceso de Clasificación ........................................................................................ 72 HERRAMIENTAS DE IMPLEMENTACIÓN: .................................................................... 73 Lenguaje de Programación Java .......................................................................... 73 MySQL ................................................................................................................... 76 IMPLEMENTACIÓN DEL MÉTODO ............................................................................... 76 Módulo de Selección de Puntos Característicos ................................................. 76 Módulo de Triangulación Delaunay .................................................................. 77 Base de Datos: ........................................................................................................ 78 Módulos de Entrenamiento y Clasificación: ....................................................... 79. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. 3.2 3.3 3.3.1 3.3.2 3.4 3.4.1 3.4.2 3.5 3.6 3.7 3.7.1 3.7.2 3.7.3 3.7.4 3.7.5 3.8 3.8.1 3.8.2 3.9 3.9.1 3.9.2 3.9.3 3.9.4. CAPITULO 4: ......................................................................................................................... 81 EVALUACIÓN Y RESULTADOS……………………………………………...………………81 4.1 ANÁLISIS DE LOS DATOS ............................................................................................. 81 4.1.1 Software a utilizar: Estadístico SPSS .................................................................. 81 4.1.2 Demostración de la Confiabilidad de los resultados de la investigación ........... 81 4.1.3 Diferencias de Género ........................................................................................... 82 4.1.4 Resultados Evaluadores humanos comparados con la SVM ............................. 85 CAPITULO 5: ......................................................................................................................... 89 CONCLUSIONES Y RECOMENDACIONES ..................................................................................... 89 CONCLUSIONES ........................................................................................................... 89 RECOMENDACIONES.................................................................................................... 91 TRABAJOS FUTUROS.................................................................................................... 92. TE. 5.1 5.2 5.3. REFERENCIAS BIBLIOGRÁFICAS ................................................................................................. 93. B. IB. LI O. ANEXOS .................................................................................................................................... 97. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(9) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 9. INDICE DE FIGURAS. B. IB. LI O. TE. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. Figura 2.1 Representación de un pixel [13]..................................................................................... 22 Figura 2.2 a) Imagen original; b) Estructura matricial de la imagen [13] ....................................... 23 Figura 2.3 Imagen binaria ............................................................................................................... 24 Figura 2.4 Imagen en escalas de grises ........................................................................................... 24 Figura 2.5 Imagen en color ............................................................................................................ 25 Figura 2.6 Representación gráfica del modelo de color RGB [13] ............................................... 26 Figura 2.7 Representación gráfica del modelo de color HSV [13]................................................. 27 Figura 2.8 Ejemplo de Binarización [19] ....................................................................................... 29 Figura 2.9 a) Imagen original; b) Imagen filtrada paso bajo con el filtro de la Matriz 2.1 [13] ...... 31 Figura 2.10 a) Imagen original; b) Imagen filtrada paso alto con el filtro de la Matriz 2.2 [13] ... 32 Figura 2.11 Detección de bordes usando el operador Sobel ........................................................... 34 Figura 2.12 Imágenes con distintos operadores detectores de bordes. ........................................... 36 Figura 2.13 Aumento de contraste [13] .......................................................................................... 37 Figura 2.14 a) Imagen original en escala de grises; b) Imagen erosionada [13] ............................ 38 Figura 2.15 ...................................................................................................................................... 42 Figura 2.16 Grafo [19] ................................................................................................................... 44 Figura 2.17 Grafos Completos [19] ............................................................................................... 44 Figura 2.18: k4 es planar [19] ......................................................................................................... 45 Figura 2.19: Grafo plano con 5 caras [19] ..................................................................................... 46 Figura 2.20 Propiedad 1 (triangulación de Delaunay).[14] ............................................................. 46 Figura 2.21 Propiedad 2 (triangulación de Delaunay) [14]. ............................................................ 47 Figura 2.22 Esquema de aplicación de las SVM [17] ..................................................................... 52 Figura 2.23: La frontera de decisión debe estar tan lejos de los datos de ambas clases como sea. . 53 Figura 2.24 Diferentes tamaños de la frontera de decisión ............................................................ 54 Figura 2.25 Muestra del hiperplano de dos clases linealmente separables [17] .............................. 55 Figura 3.1. División en bloques del método basado en Máquinas de Soporte Vectorial para la Clasificación.................................................................................................................................... 65 Figura 3.2 Construcción del Método para la Clasificación de Imágenes basado en el grado de atractivo facial. ................................................................................................................................ 66 Figura 3.3 Proceso de obtención del Vector de Características....................................................... 69 Figura 3.5 Proceso de Clasificación de Imágenes Basado en su atractivo ...................................... 72 Figura 3.6 Puntos característicos marcados para representar el rostro ............................................ 77 Figura 3.7 Triangulación Delaunay resultado de unir los 97 Puntos Característicos. ..................... 78 Figura 4.1 Encuestas realizadas a personas del sexo masculino vs personas del sexo femenino .... 83. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(10) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 10. INDICE DE TABLAS. A. S. 65 82 82 83 83 84 84 85 88 88. B. IB. LI O. TE. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. Tabla 3.1 Escala Likert para medir el atractivo facial Tabla 4.1 Resumen del procesamiento de los casos Tabla 4.2 Estadísticos de Fiablidad Tabla 4.3 Resumen del procesamiento de los casos Tabla 4.4 Tabla de contingencia Sexo * Grado de atractivo Tabla 4.5 Pruebas de chi-cuadrado Tabla 4.6 Medidas simétricas Tabla 4.7 Comparación de Resultados de las Encuestas vs Resultados de SVM Tabla 4.8 Pruebas de chi-cuadrado Tabla 4.9 Medidas simétricas. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(11) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 11. A. S. Resumen. SI C. En el presente documento se realiza un estudio de la noción de "atractivo. facial" en un contexto de “aprendizaje” con Máquinas de Soporte Vectorial. Para. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. ello se han aplicado encuestas a un grupo de personas que evaluaron fotografías frontales de rostros de mujeres calificando a cada una en una escala de valoración conforme a su atractivo. La técnica de aprendizaje de máquinas utilizada son las Máquinas de Soporte Vectorial (SVM). Luego las imágenes fueron entrenadas en la SVM con su respectivo grado de belleza. Con la prueba Chi cuadrado se compara la distribución de las puntuaciones de los evaluadores humanos con los de la SVM, demostrando que no existe diferencia significativa entre los dos grupos. Los resultados muestran claramente que la belleza facial es un concepto universal, que puede ser aprendido por una máquina. Analizando la precisión de la misma en cuanto a su predicción de la belleza como una función del tamaño de los datos de entrenamiento indica que una máquina puede producir similares resultados al pensamiento humano.. B. IB. LI O. TE. Palabras clave: Atractivo Facial, Máquina de Aprendizaje, Máquinas de Soporte Vectorial. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(12) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 12. Abstract This thesis is a study of the notion of "facial attractiveness" in the machine. S. learning with the SVM context. To this end, we have used statistical evaluations. A. made to a group of people who rated front face photographs of women qualifying. SI C. each on a rating scale according to its appeal. The machine learning technique used is Support Vector Machine (SVM). Then the images were trained in SVM on. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. its respective degree of beauty. By using Chi-square test, we compare the distribution of scores of human evaluators with SVM results show that there is no significant difference between the two groups. The results clearly show that facial beauty is a universal concept, which can be learned by a machine. Analyzing the accuracy of the machine in terms of beauty prediction as a function of the training data size indicates that a machine can produce similar results to human thought.. B. IB. LI O. TE. Key Words: Facial Attractiveness, Machine Learning, Support Vector Machines. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(13) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 13. Introducción La belleza, es y ha sido estudiada a través de los tiempos como parte de la. S. estética, la sociología, la psicología social, las ciencias biológicas, la cultura. La. A. computación no ha sido la excepción para realizar estudios en esta percepción.. SI C. Muchos de los estudios demuestran que lejos de ser una cuestión de gusto. personal existen reglas universales que rigen la belleza, patrones que los bellos. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. tienen en común, algo que incluso se puede medir. Lo que nos sugiere que hay cosas con las que todos estamos de acuerdo; por lo que se presentó ante un grupo de evaluadores humanos un conjunto de imágenes de rostros de mujeres jóvenes y se les pidió que los clasificaran en función de su atractivo estético (cada una fue evaluada en una escala del 1 al 5 que van desde muy poco atractivas hasta muy atractivas), los resultados indicaron que existe un consenso estadístico entre los evaluadores.. Como un modesto aporte a esta percepción, en este trabajo se investiga la. noción de “atractivo facial” a través del desarrollo de un método computacional que hace uso de máquinas de aprendizaje, específicamente máquinas de soporte vectorial (SVM) para clasificar las imágenes de los rostros, de acuerdo con las. TE. preferencias humanas, la SVM “aprendió” la relación entre las características y. LI O. los rasgos faciales que provocaban atracción y después fue puesta a prueba con un. B. IB. grupo nuevo de caras. Se realizaron pruebas estadísticas para contrastar las puntaciones obtenidas. por el método utilizado con los de los evaluadores humanos, obteniendo muy buenos resultados.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(14) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 14. CAPITULO 1:. A SI C. 1.1 Realidad problemática. S. PLANTEAMIENTO DEL ESTUDIO. La belleza está asociada a la hermosura. Se trata de una apreciación. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. subjetiva, lo que es bello para una persona, puede no serlo para otra. Sin embargo, se conoce como canon de belleza a ciertas características que la sociedad en general considera como atractivas, deseables y bonitas.. La belleza es un tema que ha inspirado a muchos, ha quitado el sueño a. otros, ha sido y es motivo de profundo estudio, se afirma que el rostro humano es el lugar a la vez más íntimo y más exterior de un sujeto, el que traduce más directamente y de modo más complejo su interioridad psicológica y también el que padece más coerciones públicas, así como también es la sede de la revelación y de la simulación, de la indiscreción y de la ocultación, de la espontaneidad y del engaño [1].. En los tiempos modernos la noción de belleza era una cuestión de opinión. TE. subjetiva, los resultados recientes sugieren que las personas podrían compartir un gusto común por el atractivo facial y que sus preferencias pueden ser una parte. LI O. innata de la constitución primaria de nuestra naturaleza. En estudios con bebés se. B. IB. ha demostrado que a ellos les gusta ver y se quedan más minutos observando, con mucho agrado, a los rostros más "bonitos" de personas, definiendo como caras lindas a las más simétricas [2] . También se ha encontrado en mujeres que prefieren o escogen pareja, tomando en cuenta la simetría de la cara y del cuerpo del hombre; ellas tendrían la capacidad de medir al "mejor" hombre genéticamente hablando, al calcular la simetría de su rostro y cuerpo. A mayor simetría "mejor" serían los genes de la pareja. El hombre escogería de igual forma. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(15) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA ENEL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 15. Planteamiento del Estudio y por ello la mujer, en todos los pueblos y culturas, y durante todos los tiempos, se ha maquillado para igualar ambas partes de la cara como cejas, labios y ojos [3] .. S. La gran influencia que tienen los medios de comunicación en la actualidad. A. muestra a personas con rostros más atractivos en videos musicales, cine,. SI C. comerciales de publicidad para marcas reconocidas, y en muchas ocasiones. utilizan software para dar ciertos “retoques” a las imágenes eliminando. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. imperfecciones y realzando el atractivo facial de las mismas.. Existen estudios que han demostrado un alto acuerdo intercultural en el. grado de atractivo de los rostros de diferentes etnias [15]. La elevada congruencia en el origen étnico, clase social, edad y sexo ha llevado a la creencia de que la percepción del atractivo facial es impulsado por los datos, es decir, que las propiedades de un conjunto particular de rasgos faciales son los mismos independientemente de quien lo percibe.. Durante siglos, la noción común en esta investigación ha sido que la. belleza está "en el ojo del espectador", que la atracción individual no se puede predecir más allá de nuestro conocimiento de la cultura de una persona en particular, época histórica o historia personal. Sin embargo, el estudio más. TE. reciente nos sugiere que los componentes de la belleza no son arbitrarios.. LI O. Entonces si las personas pueden ponerse de acuerdo en cuáles caras les parecen atractivas y cuáles no, a la hora de juzgar un conjunto de rostros, a. B. IB. continuación, esto es un indicador de que las personas en todas partes del mundo están utilizando los mismos criterios en sus juicios para la evaluación del grado de atractivo. Deseamos saber cuál es el patrón que determina si un rostro es más atractivo o en qué grado puede serlo y si estas respuestas pueden concordar con los resultados obtenidos con un método computacional, eso nos ha llevado a la formulación del problema el cual mostramos en el siguiente punto.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(16) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA ENEL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 16. Planteamiento del Estudio. 1.2 Formulación del problema Considerando la realidad problemática antes mencionada, nos lleva al. S. planteamiento del problema:. 1.3 Hipótesis. SI C. A. ¿Cómo clasificar imágenes de rostro, considerando su grado de atractivo?. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Desarrollando un método basado en técnicas de aprendizaje automático. (SVM, Máquinas de Soporte Vectorial) es posible la clasificación de un conjunto de imágenes de rostros de acuerdo a su grado de atractivo.. 1.4 Objetivos. 1.4.1 Objetivo general. Desarrollar un método usando Máquinas de Aprendizaje (SVM, Máquinas. de Soporte Vectorial) para clasificar automáticamente imágenes faciales según el grado de atractivo.. 1.4.2 Objetivos específicos . Determinar puntos característicos relevantes del rostro, utilizando técnicas. TE. de extracción de características.. Utilizar la triangulación Delaunay para obtener distancias entre estos puntos característicos.. . Definir los índices de entrada de la SVM.. . Analizar el funcionamiento de la Máquina de Aprendizaje (SVM) para el entrenamiento y clasificación de imágenes en base al grado de atractivo. B. IB. LI O. . facial. . Demostrar que no hay diferencia significativa entre los resultados del puntaje obtenido por el método y la de los evaluadores humanos.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(17) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA ENEL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 17. Planteamiento del Estudio. 1.5 Justificación del problema 1.5.1 Justificación Social. A. S. Relacionado a sentimientos y a procesos abstractos del pensamiento, pues. SI C. los seres humanos pueden emitir un juicio, pero no entienden generalmente cómo llegaron a sus conclusiones. Por tanto, en este trabajo, se explora la viabilidad de. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. un enfoque basado en los datos obtenidos de evaluadores humanos para tratar de entender cómo clasificaron un rostro en la escala de 1 a 5 de acuerdo a su grado de atractivo.. 1.5.2 Justificación Tecnológica. Aunque pensemos que la belleza está en quien la aprecia, que es subjetiva,. es una oportunidad para probar los factores que la determinan utilizando métodos computacionales. Hasta ahora, las computadoras se han programado para identificar características faciales básicas, tales como la diferencia entre una mujer y un hombre, incluso para detectar expresiones faciales, pero este método de clasificación permitirá hacer un juicio estético, el cual puede hacer que su uso en. TE. aplicaciones del mundo real sea más eficiente, como por ejemplo en la edición de. LI O. imágenes en forma automática para mejorar su atractivo.. B. IB. 1.5.3 Justificación Económica La presente investigación servirá para la elaboración de un producto. software que puede ser incluido en dispositivos multimedia para trabajo profesional en fotografía y cirugía estética facial. Además de ser punto de partida para la creación de productos mucho más avanzados que sean fuertemente aceptados por las organizaciones como para ser comercializados.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(18) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA ENEL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 18. Planteamiento del Estudio. 1.5.4 Justificación Académica El aplicar conceptos de aprendizaje de máquinas para la clasificación de. S. imágenes de rostros en base a su atractivo, permitirá aportar conocimiento e. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. 1.6 Antecedentes. SI C. Computacional en nuestro país.. A. incentivar a realizar investigaciones y trabajos futuros en el área de Visión. Las aplicaciones en las que se usan imágenes de rostros son muchas. Están. incluidas en teléfonos con video, sistemas de reconocimiento automático facial, simulaciones para estudios psicológicos [4],. e incluso la visualización de. múltiples datos.. Una de las aplicaciones que ha estado disponible por años en el mercado es. el retoque digital de fotografías, cabe señalar que el retoque no es limitado a la manipulación de color y la textura, sino también de eliminación de arrugas y los cambios en la geometría de los rasgos faciales, esta técnica ha sido utilizada para alterar sutilmente las imágenes de celebridades y modelos para mejorar su. TE. apariencia.. LI O. La mayoría de investigaciones hasta la fecha únicamente se han ocupado. sólo de la manipulación de las formas faciales, pero no han evaluado en que. B. IB. patrón se basan las personas para calificar si un rostro es bello o no, pensando en esto se encontró que diferentes estudios han tratado de utilizar métodos computacionales para analizar el atractivo facial. El mismo que ha generado interrogantes en la estética, biología y actualmente en la computación. En el área de la neurología y física se dice que nuestro cerebro recibe marcadas instrucciones que vienen grabadas desde nuestro mismo ADN, y luego miles de factores a lo largo de su vida van marcando y modificando su. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(19) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA ENEL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 19. Planteamiento del Estudio morfología. “El cerebro siempre busca la belleza”, es decir, cuando vemos un rostro que nos agrada es porque simplemente estamos programados para ello;. S. nuestro cerebro busca signos de fertilidad y salud en el sexo contrario [5].. SI C. A. La literatura en psicología contiene varias teorías sobre qué es lo que hace un rostro atractivo, se incluyen características faciales, como la simetría, así como. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. también los factores evolucionistas, sociales, y culturales como en [7].. En los últimos años, avances computacionales han sido desarrollados para. crear imágenes compuestas atractivas con métodos dados en [8], a fin de examinar la relación entre el atractivo facial, la edad y el promedio de rostros. Otros estudios han realizado promedios de rostros con técnicas de morphing por ejemplo, [6].. Con respecto a la simetría que pueden presentar los rostros, hay estudios. como en [15], el cual se determina que la simetría del rostro y la textura de la piel influyen mucho en el atractivo facial en rostros masculinos. También en [16] se ha investigado la relación entre la simetría facial y los niveles del atractivo; 72 participantes evaluaron el atractivo facial de 35 fotos, con grados diversos de. TE. simetría. La simetría facial fue procesada usando diez posiciones faciales. Se. LI O. demostró que hay una relación significativa entre la simetría determinada en el área de la mandíbula y el atractivo facial. Sin embargo, los resultados obtenidos. B. IB. en [16] aún coinciden en que las investigaciones futuras deben determinar otras áreas del rostro además del área de la mandíbula, que influyen en el atractivo con mayor intensidad. Además afirman que su estudio estuvo limitado porque cada fotografía presentaba diferentes estilos y color de cabello, lo que influenciaba al momento de asignar los puntajes de atractivo, perjudicando un juzgamiento solo de la simetría.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(20) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA ENEL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 20. Planteamiento del Estudio Cunningham [18], en una serie de experimentos pidió a 150 varones universitarios estadounidenses, que evaluaran el atractivo y atributos sociales de. S. 50 retratos faciales de mujeres. En el conjunto de los retratos se contaba con. A. veintisiete mujeres que fueron finalistas del certamen Miss Universo. Y Aunque la. SI C. mayoría de las mujeres eran blancas, siete eran negras y seis eran de origen asiático. Así concluyó que la cara simétrica de la mujer es precisamente un signo. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. de belleza.. Si bien no hay pruebas de asegurarse de que las características identificadas. en [18], se hayan visto a través de la historia, Cunningham cree que en culturas tan antiguas como Egipto, la mujer usó maquillaje para imitar o hacer hincapié en estas características, y en la época moderna se hace uso de la cirugía cosmética facial [18].. Con respecto a las calificaciones de las características masculinas, Cunningham abordó este tema en otro estudio. Similares a los hombres, las mujeres valoraban más a los varones con características como tener ojos grandes, pómulos prominentes y un mentón grande, junto con una gran sonrisa.. TE. Las personas son atraídas hacia la belleza de manera innata, con el propósito. LI O. de determinar si la simetría facial es realmente el factor principal del atractivo físico para sujetos sin predisposición hacia la belleza, se han llevado a cabo. B. IB. investigaciones con bebés que, claramente, tienen muy poca o ninguna exposición a la influencia de los medios de comunicación. Entonces, se les mostraron a bebés de entre tres y seis meses de edad, fotos de. una diversidad de rostros de mujeres jóvenes. Los bebés pasaron más tiempo mirando los rostros más simétricos. De esta forma los investigadores concluyeron que el interés por la simetría facial es un factor innato que determina la atracción.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(21) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA ENEL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 21. Planteamiento del Estudio. 1.7 Limitaciones del estudio Las limitaciones del estudio son:. S. El presente estudio está limitado sólo para imágenes frontales de rostros. características:. SI C. A. de mujeres con edades entre los 18 a 30 años con las siguientes. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. - Buena calidad en las imágenes: Nitidez, alto contraste.. - Enfoque en primer plano del rostro de la persona con luz frontal blanca para eliminar las sombras.. - Fondo de la imagen debe ser blanco.. - Las imágenes deben ser tomadas por una cámara fotográfica digital con una resolución de 10Mp como mínimo.. Sólo se evaluarán las características geométricas (distancia entre ojos, cejas, etc.) del rostro más no las no-geométricas (tono de piel, color de cabello, etc.). 1.8 Síntesis organizativa del informe. El informe consta de cinco capítulos los cuales intentan brindar un enfoque global. TE. del proyecto desarrollado. Estos son:. LI O. CAPITULO 1: Planteamiento del estudio, se plantea la problemática a desarrollar.. B. IB. CAPITULO 2: Marco Teórico se describen las bases teóricas empleadas en este proyecto. CAPITULO 3: Materiales y métodos, establecemos el material de estudio y la Metodología empleada en la investigación. CAPITULO 4: Evaluación y Resultados, brindamos los principales resultados obtenidos con fines de probar la hipótesis formulada. CAPITULO 5: Conclusiones y Recomendaciones. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(22) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 22. CAPITULO 2:. A SI C. 2.1 Conceptos Generales. S. MARCO TEÓRICO. El proyecto está enmarcado dentro del campo de la visión computacional,. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. por lo que se van a introducir algunos de los elementos básicos de la representación de imágenes.. 2.1.1Píxel en la Imagen Digital. Píxel, es la abreviatura de las palabras inglesas “picture element”, es el. menor de los elementos de una imagen al que se puede aplicar individualmente un color o una intensidad o que se puede diferenciar de los otros mediante un. B. IB. LI O. TE. determinado procedimiento [Figura 2.1].. Figura 2.1 Representación de un pixel [13]. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(23) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 23. Marco Teórico. 2.1.2Definición de Imagen Digital Una imagen digital se compone de una agrupación de píxeles, cada uno con un. S. valor de intensidad o brillo asociado. Una imagen digital se representa mediante. SI C. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. corresponde con cada píxel en la imagen [Figura 2.2].. A. una matriz bidimensional, de forma que cada elemento de la matriz se. Figura 2.2 a) Imagen original; b) Estructura matricial de la imagen [13]. 2.1.3Clasificación de imágenes digitales Dependiendo del rango de. los. valores. que pueda tomar cada píxel. podemos distinguir los siguientes tipos de imágenes:. TE. 2.1.3.1 Imágenes binarias. LI O. El rango está formado por los valores negro o blanco [0 1] únicamente. En. B. IB. la [Figura 2.3] se muestra una imagen de este tipo.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(24) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 24. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. Marco Teórico. Figura 2.3 Imagen binaria. 2.1.3.2 Imágenes de intensidad. También conocidas como imágenes en escala de grises, existen hasta 256. B. IB. LI O. TE. niveles de grises, por lo que su rango se encuentra entre [0,255]. [Figura 2.4]. Figura 2.4 Imagen en escalas de grises. 2.1.3.3 Imágenes en color Todo color se puede componer a partir de tres componentes básicas. El contenido de cada píxel de la imagen es una terna de valores, un valor por cada componente de color básico. [Figura 2.5]. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(25) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 25. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. Marco Teórico. Figura 2.5 Imagen en color. 2.1.4Representación del color en Imágenes Digitales. El color es un fenómeno perceptual relacionado con la respuesta humana a. diferentes longitudes de onda del espectro visible (400 - 700 nm). Esto se debe a que existen tres tipos de sensores en el ojo que tienen una respuesta relativa diferente de acuerdo a la longitud de onda. Esta combinación de tres señales da la sensación de toda la gama de colores que percibimos.. Un espacio de color es la forma por la que se puede especificar, crear y. TE. visualizar un color. Sólo describiremos tres espacios de color más usados:. LI O. Modelo RGB. El modelo RGB (del inglés Red, Green, Blue) está basado en la síntesis. B. IB. aditiva de las intensidades de luz relativas al rojo, al verde y al azul para conseguir los distintos colores, incluyendo el negro y el blanco. La representación gráfica del modelo RGB se realiza mediante un cubo unitario con los ejes R, G y B [Figura 2.6].. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(26) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 26. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. Marco Teórico. Figura 2.6 Representación gráfica del modelo de color RGB [13]. Las imágenes con modelo RGB contienen tres planos de imágenes. independientes, uno para cada color primario. El procesamiento de imágenes en color, utilizando el modelo RGB, toma sentido cuando las imágenes se expresan naturalmente en términos de estos tres planos.. Actualmente muchas cámaras a color utilizadas para adquirir imágenes. digitales, utilizan el formato RGB. Esto convierte al modelo RGB en un modelo. TE. de gran importancia para el procesamiento de imágenes.. LI O. Modelo HSV:. Las siglas H, S y V corresponden a Tono (hue), Saturación (saturation) y. B. IB. valor (value) respectivamente. También se denomina HSB, siendo B el brillo (brighness).El sistema coordenado es cilíndrico, y el subconjunto de este espacio donde se define el color es una pirámide de base hexagonal, como se puede observar [Figura 2.7].. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(27) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 27. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. Marco Teórico. Figura 2.7 Representación gráfica del modelo de color HSV [13]. El área hexagonal corresponde a un valor de V = 1, conteniendo los. colores más brillantes. El tono se mide como el ángulo alrededor del eje S. El rojo se sitúa a 0º, el verde a los 120º y el azul a los 240º. Los colores complementarios son aquellos que se encuentren a 180º del señalado. El rango de S se extiende desde 0 (coincidiendo con el eje de la pirámide) hasta 1, coincidiendo con el final del área hexagonal de la pirámide.. La obtención de este espacio de color a partir del RGB, se puede realizar. B. IB. LI O. TE. con las ecuaciones 2.1, 2.2 y 2.3:. Donde R, G y B son los valores del canal rojo, verde y azul respectivamente.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(28) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 28. Marco Teórico Modelo YCbCr YCbCr es una codificación no lineal del espacio de color RGB, usado. S. comúnmente en la compresión de imágenes. El color es representado por la. SI C. características colorimétricas del color.. A. luminancia (Y) y por dos valores diferentes de color (Cb y Cr) que son. El parámetro Y indica la luminosidad o la claridad del color (que se. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. pueden ver como un tono de gris), los parámetros Cb y Cr indican el tono del color: Cb ubica el color en una escala entre el azul y el amarillo, Cr indica la ubicación del color entre el rojo y el verde.. La obtención de este espacio de color a partir del RGB, se puede realizar. con las ecuaciones 2.4, 2.5 y 2.6:. Siendo R, G y B son los valores del canal rojo, verde y azul. respectivamente. La sencillez de la transformación y la separación explicita de las. TE. componentes de luminancia y de crominancia del color, hacen a este espacio de. LI O. color un método atractivo para la modelización del color de la piel.. B. IB. 2.2 Procesamiento Digital de las Imágenes El principal objetivo de las técnicas de mejoramiento de imagen es procesar una imagen con el fin de hacerla más adecuada para una determinada aplicación o procesamiento posterior. Depende por tanto del problema específico a resolver el que se emplee una u otra técnica. Los métodos de mejora de imagen se pueden dividir en dos campos diferentes: métodos en el dominio de frecuencias y métodos en el dominio espacial. Los primeros se basan en modificar la transformada de. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(29) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 29. Marco Teórico Fourier de la imagen, mientras que los segundos se basan en manipulaciones directas sobre los píxeles de la imagen.. S. 2.2.1 Binarización. SI C. A. La binarización es una técnica que permite convertir imágenes con niveles de gris, en una imagen binaria (blanco y negro) [41]. De acuerdo a tal técnica, los. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. valores de los píxeles en la imagen de entrada que son menores o iguales a un cierto umbral pre-específicado, son convertidos a negro, mientras que los píxeles con valores mayores al umbral, son convertidos a blanco. En algunas ocasiones se desea realizar una binarización tal que a una banda específica por dos umbrales, se les asigne el color blanco, mientras que los pixeles de la imagen de entrada cuyos valores están fuera de la banda especificada, se les asigne el color negro. Un ejemplo de binarización se muestra en la [Figura 2.8b] donde aparece el resultado obtenido a binarizar la imagen mostrada en la [Figura 2.8a], utilizando. B. IB. LI O. TE. un umbral arbitrario de valor 128.. a). Imagen original. b) Imagen binaria. Figura 2.8 Ejemplo de Binarización [19]. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(30) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 30. Marco Teórico. 2.2.2 Filtrado en Imágenes Filtrado espacial. S. El filtrado espacial es la operación que se aplica a las imágenes para mejorar. A. o suprimir detalles espaciales con el fin de mejorar la interpretación visual.. SI C. Ejemplos comunes incluyen aplicar filtros para mejorar los detalles de bordes en imágenes, o para reducir o eliminar patrones de ruido. El filtrado espacial es una. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. operación "local" en procesamiento de imagen en el sentido de que modifica el valor de cada píxel de acuerdo con los valores de los píxeles que lo rodean. La frecuencia espacial define la magnitud de cambios de los datos por. unidad de distancia en una determinada zona de la imagen. Áreas de la imagen con pequeños cambios o con transiciones graduales en los valores de los datos se denominan áreas de bajas frecuencias. Áreas de grandes cambios o rápidas transiciones se conocen como áreas de altas frecuencias. Así, los filtros espaciales se pueden dividir en tres categorías:. Filtros paso bajo. TE. Enfatizan las bajas frecuencias, suavizando las imágenes y suprimiendo. ruidos. Se trata de asemejar el Nivel de intensidad de cada píxel al nivel de. LI O. intensidad de los píxeles vecinos, reduciendo la variabilidad espacial de la. menor nitidez visual, pero ganando en homogeneidad. Un ejemplo de filtro paso bajo es la matriz que se muestra en la [Matriz 2.1].. B. IB. imagen. Ello produce una pérdida de los bordes, generando una imagen con. Matriz 2.1 Ejemplo de filtro paso bajo [13]. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(31) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 31. Marco Teórico En [Figura 2.9], se realiza una media aritmética de los nueve píxeles que componen la ventana de filtrado, con lo que se reducen los espurios y la. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. variabilidad de la imagen.. Figura 2.9 a) Imagen original; b) Imagen filtrada paso bajo con el filtro de la Matriz 2.1 [13]. Otro tipo de filtro pasa-bajo es el que aplica la mediana en vez de la media.. Es el llamado filtro de mediana, y presenta la ventaja de que como medida estadística, la mediana es menos. sensible. a. valores. extremadamente. desviados y se modifican menos los valores originales, ya que la mediana es en. TE. principio, uno de los valores concretos de la ventana de filtrado.. Filtros paso alto. LI O. Enfatizan las altas frecuencias, para mejorar o afilar las características. lineales como carreteras, fallas, o límites en general. Realizan por tanto el efecto. Un ejemplo de filtro paso alto es la matriz que se muestra en [Matriz 2.2].. B. IB. contrario a los filtros paso-bajos, eliminando estos, las bajas frecuencias.. Matriz 2.2 Ejemplo filtro paso alto [13]. Otra forma de obtener una imagen así filtrada es sustraer a la imagen original, la misma imagen filtrada paso-bajos. Es lógico ya que si a la imagen le. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(32) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 32. Marco Teórico restamos los componentes de baja frecuencia, nos quedaremos con las de alta. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. frecuencia [Figura 2.10].. Figura 2.10 a) Imagen original; b) Imagen filtrada paso alto con el filtro de la Matriz 2.2 [13]. 2.2.3 Filtrado en frecuencia:. En el dominio de frecuencias también puede realizarse el proceso de. filtrado, con mayor grado de comprensión de lo que se está viendo, ya que en una. imagen en el dominio de frecuencias se sabe dónde se encuentran los. distintos rangos de frecuencias. De esta forma, en vez de realizar la convolución, se efectúa su operación correspondiente (Ecuación 2.7) en el dominio de frecuencias: el producto.. TE. Los resultados que se obtienen son muy parecidos a los que se obtienen con. LI O. el filtrado espacial (convolución) pero en este caso se trabaja con otras variables y conceptos diferentes.. B. IB. 2.2.4 Gradiente El gradiente es una medida de cambio en una función, y una imagen puede. ser considerada como un arreglo de muestras de alguna función continua de intensidad de la imagen. Por analogía, los cambios significativos en valores de gris en una imagen pueden detectarse usando una aproximación discreta del gradiente. El gradiente es el equivalente bidimensional de la primera derivada y se define como el vector (Ecuación 2.8):. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(33) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 33. Marco Teórico. A. la función. apunta en la dirección de la máxima tasa de incremento de. , es decir, indica la dirección de la máxima variación de f en. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. (x,y).La magnitud del gradiente, dado por (Ecuación 2.9):. SI C. El vector. S. Hay dos propiedades importantes asociadas con el gradiente:. Iguala a la máxima tasa de incremento de. por unidad de distancia en la. dirección de G. Sin embargo, es común aproximar la magnitud del gradiente por los valores absolutos (Ecuación 2.10):. La magnitud (ó modulo) de G generalmente es referenciada, para simplificar, como gradiente. A partir del análisis de vectores, la dirección del vector gradiente se define como (Ecuación 2.11):. TE. Donde el ángulo es medido con respecto al eje x.. Para imágenes digitales, las derivadas de la ecuación se aproximan mediante las. LI O. siguientes máscaras (aunque un método alternativo es considerar una vecindad de. B. IB. 3x3) [Matriz 2.3] y [Matriz 2.4]:. Matriz 2.3 Mascara de convolución Horizontal. Matriz 2.4 Máscara de convolución Vertical. Los operadores más utilizados son los de Roberts, Prewitt y Sobel .. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(34) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 34. Marco Teórico Detección de bordes Realizan otro tipo de operaciones con los datos, pero siempre con el resultado. S. de enfatizar los bordes que rodean a un objeto en una imagen, para hacerlo más. A. fácil de analizar. Estos filtros típicamente crean una imagen con fondo gris y. imagen.. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. a. Operador Roberts:. SI C. líneas blancas y negras rodeando los bordes de los objetos y características de la. Emplea la diferenciación como método para calcular el grado de separación entre niveles de grises vecinos. Concretamente, y para realizar una diferenciación bidimensional, se efectúa la operación (Ecuación 2.12):. b. Operador Sobel:. El operador de Sobel es un operador de extracción de bordes que usa una. B. IB. LI O. TE. vecindad de 3x3 para el cálculo de gradiente [Figura 2.11]:. Figura 2.11 Detección de bordes usando el operador Sobel. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(35) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 35. Marco Teórico El operador de Sobel es la magnitud del gradiente computado de acuerdo a. A. S. (Ecuación 2.13):. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. Donde las derivadas parciales Sx (Ecuación 2.14), Sy (Ecuación 2.15), son definidas por:. Donde la constante c=2, y el etiquetado de los píxeles vecinos al píxel [i,j] es [Matriz 2.5]:. Matriz 2.5. B. IB. LI O. TE. Sx, Sy pueden implementarse usando las siguientes máscaras de convolución [Matriz 2.6] y [Matriz 2.7]:. Matriz 2.6 Mascara de convolución Horizontal. Matriz 2.7 Máscara de convolución Vertical. Este operador enfatiza los píxeles que están más cercanos al centro de la máscara.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(36) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 36. Marco Teórico c. Operador Prewitt: El operador de Prewitt, al igual que el de Sobel, expande la definición del. S. gradiente en una máscara de 3 x 3 para ser más inmune al ruido, utilizando la. pueden implementarse usando las siguientes máscaras de convolución. SI C. Sy. A. misma ecuación que Sobel, pero con una constante c=1 como se muestra en: Sx,. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. [Matriz 2.8] y [Matriz 2.9]:. Matriz 2.8 Mascara de convolución Horizontal. Matriz 2.9 Máscara de convolución Vertical. A diferencia del operador de Sobel, este operador no otorga una importancia especial a píxeles cercanos al centro de la máscara.. d. Filtro direccional:. TE. Seleccionando adecuadamente los valores del Kernel, podemos obtener el efecto. LI O. de extraer bordes en una determinada dirección, mientras que los bordes en el. B. IB. resto de direcciones no se ven tan resaltados [Figura 2.12]:. Figura 2.12 Imágenes con distintos operadores detectores de bordes. a) Roberts; b) Sobel; c)Laplaciano [13]. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(37) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 37. Marco Teórico Mejora el contraste: Cuando se pretende mejorar el contraste de una imagen se desea que "los. S. píxeles claros se aclaren más" y "los píxeles oscuros se oscurezcan", lo cual es el. A. fundamento para dar mayor nitidez a las formas presentes en la imagen [Figura. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. 2.13].. Figura 2.13 Aumento de contraste [13]. Morfología matemática. Es un método no lineal de procesar imágenes digitales basándose en la forma. Su principal objetivo es la cuantificación de estructuras geométricas. Aquí los filtros también vienen definidos por su máscara, pero no es un máscara de. TE. convolución sino un elemento estructurante.. LI O. a) Erosión:. B. IB. La erosión es lo opuesto a la dilatación; realiza con el fondo lo que la dilatación al primer plano. También en este caso, existe un elemento estructurante que se utiliza para operar con la imagen. Los efectos son de “encogimiento”, “contracción” o “reducción”. Puede ser utilizado para eliminar islas menores en tamaño que el elemento estructurante. Sobre cada píxel de la imagen se superpone el origen del elemento estructurante. Si cada elemento no cero de dicho elemento está contenido en la imagen, entonces el píxel de salida es puesto a 1. Haciendo. como representación de la. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(38) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. DESARROLLO DE UN MÉTODO PARA LA CLASIFICACIÓN AUTOMÁTICA DE IMÁGENES FACIALES BASADA EN EL ATRACTIVO APLICANDO MÁQUINAS DE APRENDIZAJE. 38. Marco Teórico erosión de una imagen A por el elemento estructurante B, como representación de la erosión de una imagen A por el elemento estructurante B, se puede definir. SI C. A. S. (Ecuación 2.16):. Usado en imágenes en escala de grises, la erosión se efectúa tomando el Puede ser usado para. implementar el. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. mínimo de una serie de diferencias.. operador de “mínima vecindad” con la forma de la “vecindad” dada por el elemento estructurante [Figura 2.14].. TE. Figura 2.14 a) Imagen original en escala de grises; b) Imagen erosionada [13]. Una de las aplicaciones más típicas de la erosión es la eliminación de. LI O. detalles irrelevantes. En palabras más sencillas, se puede decir que en general la. de píxeles a eliminar depende del tamaño y la forma del elemento estructurante.. B. IB. operación erosión elimina píxeles en las fronteras de un objeto, donde el número. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
Documento similar
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajo la misma licencia 2.5 Perú.. ii
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajo la misma licencia 2.5
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajo la misma licencia 2.5
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comecial-Compartir bajo la misma licencia 2.5 Perú. Para ver una copia de dicha licencia,
Esta obra ha sido publicada bajo la licencia Creative Commons. Compartir bajo la misma licencia versión Internacional. Para ver una copia de dicha licencia,
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajo la misma licencia 2.5 Perú.. Esta obra ha sido publicada bajo la
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajo la misma licencia 2.5 Perú. Para ver una copia de dicha licencia,
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajo la misma licencia 2.5 Perú.. INDICE