• No se han encontrado resultados

Caracterización basado en histograma multitexton aplicado a Imágenes Biológicas

N/A
N/A
Protected

Academic year: 2020

Share "Caracterización basado en histograma multitexton aplicado a Imágenes Biológicas"

Copied!
162
0
0

Texto completo

(1)UNIVERSIDAD NACIONAL DE SAN AGUSTÍN DE AREQUIPA ESCUELA DE POSTGRADO UNIDAD DE POSTGRADO DE LA FACULTAD DE INGENIERIA DE PRODUCCIÓN Y SERVICIOS. Caracterización basado en Histograma Multitexton aplicado a Imágenes Biológicas Tesis presentada por: M.Cs. Roxana Flores Quispe Para optar el Grado de Doctor en: Ciencias de la Computación Asesor: Dr. Cesar A. Beltrán Castañón Arequipa - Perú 2014.

(2)

(3) A mis pequeños tesoros Werner y Tayra por ser la razón de mi vida.. A Yuber, mi esposo y mejor amigo que siempre está a mi lado brindándome su amor y protección.. A mis padres por su amor y sus sabios consejos y a mis hermanos quienes siempre me demostraron su apoyo incondicional..

(4) Agradecimientos. Quisiera agradecer en primer lugar a Dios, por darme la fortaleza de lograr culminar el presente trabajo.. Mi agradecimiento especial al Dr. Cesar A. Beltrán Castañon, por asesorar el desarrollo de este proyecto e impulsarme en la investigación.. A todos mis profesores del Doctorado en Ciencias de la Computación de la Universidad Nacional de San Agustín de Arequipa, que han contribuido en mi formación con sus conocimientos e inculcarme la importancia de publicar.. Y también al Consejo Nacional de Ciencia, Tecnología e Innovación Tecnológica - CONCYTEC, por el gran apoyo y soporte financiero, y por permitirme ser parte de ellos en calidad de becaria del Doctorado en Ciencias de la Computación.. IV.

(5) Resumen. En la actualidad la implementación de sistemas de recuperación de imágenes basadas en contenido (CBIR) ha permitido implementar múltiples aplicaciones en diversas áreas mostrando buenos resultados, así mismo, en éstos sistemas una de sus principales tareas lo constituye la extracción de características de las imágenes , tarea que puede convertirse en extensa y a su vez compleja, dado que una imagen está formada por un conjunto de píxeles, sin embargo, muchos investigadores han demostrado que es difícil obtener efectos satisfactorios en el análisis de una imagen usando sólo algoritmos simples basados en píxeles. Por ello, en el presente trabajo de investigación se ha utilizado los textones, que representan agrupaciones de píxeles formando un conjunto de patrones emergentes que comparten propiedades comunes sobre toda la imagen, los cuales pueden discriminar características de color y textura simultáneamente. El caso de estudio para el presente trabajo son las imágenes biológicas de huevos de helmintos las cuales han sido identificadas y clasificadas según la especie a la que pertenece. La innovación en esta investigación es el proceso de descubrir la forma de los nuevos textones que están presentes en las imágenes de los huevos de los helmintos con el fin de que sirvan para la discriminación e identificación de las diferentes especies, así mismo esta técnica propuesta ha demostrado ser útil en otros Bancos de Imágenes. Palabras Clave CBIR, Textones, Extracción de características, Vector de características, Matriz de coocurrencia, Matriz texton.. V.

(6) Abstract. Actually the development of the content -based image retrieval (CBIR) systems have allowed to develop multiple applications in different areas showing good results, also in these systems one of the main tasks is the extraction of image features, which may become extensive and complex, since images are composed of pixels, but many researchers have demonstrated that it is difficult to get satisfactory effects on an image analysis using only simple algorithms based on pixels. For that reason, in the present research the use of textons has been proposed. In general textons are defined as a set of blobs or emergent patterns sharing a common property all over the image and it can discriminate to color and texture features simultaneously. The case of study in this work are the biological images of helminth eggs, which have been identified and classified in the species to which they belong. The innovation in this research is in the process to discover the new forms of the textons, which can characterize and discriminate the helminth egg species and also this and also this proposed technique has demostrated satisfactory results in other banks of images. Key Words CBIR, Textons, Feature Extraction, Feature Vector, Co-ocurrence Matrix, Texton Matrix.. VI.

(7) Índice General. Agradecimientos. IV. Resumen. V. Abstract. VI. Lista de Figuras. XI. Lista de Tablas. XVI. 1. Introducción. 1. 1.1. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.1.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.1.2. Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.1.3. Publicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. 2. Extracción de Características de una Imagen. 4. 2.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. 2.2. Definiendo una Imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. 2.3. Extracción de Características de la Imagen . . . . . . . . . . . . . . . . . . . . . .. 5. 2.4. Descriptores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.4.1. Tipos de Descriptores . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.5. Extracción de Características de Color . . . . . . . . . . . . . . . . . . . . . . . .. 7. 2.5.1. Física del Color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8. 2.5.2. Percepción Humana del Color . . . . . . . . . . . . . . . . . . . . . . . .. 9. 2.5.3. Representación Computacional del Color . . . . . . . . . . . . . . . . . .. 9. 2.5.3.1.. Modelos de Espacios de Color orientados a dispositivos . . . . . 12 VII.

(8) ÍNDICE GENERAL 2.5.3.2.. VIII Modelos de Espacios de Color orientados a reproducir la percepción humana . . . . . . . . . . . . . . . . . . . . . . . . . . 12. 2.5.4. Descriptores Computacionales del Color . . . . . . . . . . . . . . . . . . . 13 2.5.4.1.. Histograma de Color . . . . . . . . . . . . . . . . . . . . . . . . 13. 2.5.4.2.. Momentos de Color . . . . . . . . . . . . . . . . . . . . . . . . 13. 2.5.4.3.. Color Dominante . . . . . . . . . . . . . . . . . . . . . . . . . 14. 2.6. Extracción de Características de Textura . . . . . . . . . . . . . . . . . . . . . . . 14 2.7. Métodos para el Análisis de Textura . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.7.1. Enfoque Estadístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.7.2. Enfoque Estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.7.3. Enfoque Espectral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.8. Diferentes Unidades para el Análisis de Textura . . . . . . . . . . . . . . . . . . . 21 2.9. Textura y Color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.9.1. Descriptores Computacionales de la Textura en Color . . . . . . . . . . . . 22 2.9.1.1.. Métodos que Procesan de Manera Separada la Textura y el Color. 23. 2.9.1.2.. Métodos que Procesan de Manera Conjunta la Textura y el Color. 23. 2.10. Consideraciones Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3. Análisis de Textura con Textones. 25. 3.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.2. Textones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.3. Descriptores para el Análisis de Textura con Textones . . . . . . . . . . . . . . . . 27 3.3.1. Descriptor Histograma MultiTexton - MTH . . . . . . . . . . . . . . . . . 38 3.3.1.1.. Matriz de Co-ocurrencia . . . . . . . . . . . . . . . . . . . . . . 38. 3.3.1.2.. Descriptor Matriz de Co-ocurrencia Texton . . . . . . . . . . . . 40. 3.3.1.3.. Técnica del Descriptor MultiTexton Histogram - MTH . . . . . . 44. 3.4. Consideraciones Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4. Helmintos - Parásitos Humanos. 52. 4.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.2. Los Helmintos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.

(9) ÍNDICE GENERAL. IX. 4.3. Ciclo de Vida de los Helmintos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.4. Clasificación de los Helmintos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.4.1. Diagnóstico Computacional de los Helmintos . . . . . . . . . . . . . . . . 58 4.5. Consideraciones Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 5. Resultados. 61. 5.1. Etapas de Desarrollo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.1.1. Repositorio de Imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.1.1.1.. Características Morfológicas de los Helmintos . . . . . . . . . . 64. 5.1.1.2.. Adquisición y Preprocesamiento de Imágenes . . . . . . . . . . 68. 5.1.2. Tratamiento de la imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 5.1.2.1.. Fase: Definición del Espacio de Color . . . . . . . . . . . . . . 71. 5.1.2.2.. Fase: Análisis de la Textura de las Imágenes por Especie . . . . . 75 5.1.2.2.1.. La Detección de la Orientación de Textura . . . . . . . 75. 5.1.2.2.2.. Cuantización de la Textura . . . . . . . . . . . . . . . 81. 5.1.3. Representación de Textones . . . . . . . . . . . . . . . . . . . . . . . . . 81 5.1.3.1.. Primera Propuesta - MTH6 con Textones de 2x2 . . . . . . . . . 82. 5.1.3.2.. Segunda Propuesta - MT9 con Textones de 3x3 . . . . . . . . . 83. 5.1.4. Detección de Textones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.1.4.1.. Detección de Textones usando el Descriptor MTH6 . . . . . . . 87. 5.1.4.2.. Detección de Textones para el Descriptor MTH9 . . . . . . . . . 90. 5.1.5. Correlación Espacial entre Textones . . . . . . . . . . . . . . . . . . . . . 92 5.1.6. Formación del Descriptor MTH . . . . . . . . . . . . . . . . . . . . . . . 96 5.2. Selección de Características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 5.3. Análisis de Rendimiento y Experimentos. . . . . . . . . . . . . . . . . . . . . . . 103. 5.3.1. Identificación de Especies de los Helmintos usando el sistema CBIR . . . . 106 5.3.2. Validación usando Precisión - Cobertura . . . . . . . . . . . . . . . . . . . 110 5.3.3. Validación usando el Algoritmo de Clasificación SVM . . . . . . . . . . . 112 5.4. Extensión de Resultados para la Base de Imágenes Simplicity . . . . . . . . . . . . 121 5.5. Consideraciones Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.

(10) ÍNDICE GENERAL 6. Conclusiones. X 125. 6.1. Trabajos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Referencias bibliográficas. 128. A. Repositorio de Imágenes. 139. B. Descripción del proceso de obtención de Micrografías. 142. C. Vector de Características MTH9. 144.

(11) Lista de Figuras. 2.1. Representación de una imagen con 8 niveles de gris . . . . . . . . . . . . . . . . .. 5. 2.2. Proceso de extracción de características . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.3. Técnicas para la descripción del contenido de una imagen. . . . . . . . . . . . . .. 7. 2.4. Espectro Electromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8. 2.5. Estructura del Ojo Humano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 2.6. Sensibilidad de los conos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.7. Atributos perceptuales de una imagen (a) Valor (b) Tono (c) Saturación . . . . . . . 11 2.8. Segmentación de imagen usando descriptores . . . . . . . . . . . . . . . . . . . . 17 2.9. Procesamiento de Color y de Textura . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.1. Local Binary Pattern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.2. Local Binary Pattern y la medida de contraste C . . . . . . . . . . . . . . . . . . . 29 3.3. Obtención del LBP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.4. Proceso de Modelamiento sobre el LBP . . . . . . . . . . . . . . . . . . . . . . . 31 3.5. Estructura Motif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.6. Estructuras Peano Scan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.7. Representación de características mediante diferencia de colores . . . . . . . . . . 33 3.8. Seis tipos de textones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.9. Proceso de Obtención de la Matriz de Coocurrencia . . . . . . . . . . . . . . . . . 39 3.10. Cuatro orientaciones consideradas en la matriz de co-ocurrencia . . . . . . . . . . 40 3.11. Tipos de textones propuestos para la Matriz de co-ocurrencia texton . . . . . . . . 41 3.12. Proceso de formación de la matriz texton . . . . . . . . . . . . . . . . . . . . . . . 42 3.13. Tipos de textones propuestos en [Liu et al., 2010] y [Liu and Yang, 2009] . . . . . 45 3.14. Proceso de formación de la matriz texton utilizando el MTH . . . . . . . . . . . . 46 3.15. Descriptor MTH para la imagen de elefante en su habitad . . . . . . . . . . . . . . 49 XI.

(12) LISTA DE FIGURAS. XII. 3.16. Descriptores de Textura basados en textones . . . . . . . . . . . . . . . . . . . . . 51 4.1. Esquema general de un Helminto. (a) Trematodo adulto (b) Fasciola Hepática . . . 53 4.2. Ciclo de vida de los parásitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.3. Ciclo de vida del Helminto : Fasciola Hepática . . . . . . . . . . . . . . . . . . . 56 4.4. Clasificación de Helmintos y géneros más comunes . . . . . . . . . . . . . . . . . 58 5.1. Esquema de la caracterización de imágenes biológicas basadas en el Histograma Multitexton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5.2. Huevos de Helmintos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5.3. Proceso de Adquisicion de imágenes. . . . . . . . . . . . . . . . . . . . . . . . . 63. 5.4. Muestras de Huevos de Helmintos en proporción . . . . . . . . . . . . . . . . . . 64 5.5. Helmintos de forma elíptica (a) Uncinaria (b) Trichiuris (c) Fasciola Hepática (d) Enterobius Vermicularis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 5.6. Helmintos de forma ovoíde (a) Uncinaria (b) Fasciola Hepática (c) Diphillovotrium Pacificum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 5.7. Helmintos de forma circular (a) Ascaris (b) Taenia (c) Hymenolepis Nana . . . . . 67 5.8. Localización y detección de parásitos en una micrografía . . . . . . . . . . . . . . 68 5.9. Determinación de formas candidatas a Helmintos en una micrografía . . . . . . . . 69 5.10. Determinación de la forma del Parásito . . . . . . . . . . . . . . . . . . . . . . . . 70 5.11. Esquema interno de la Etapa Tratamiento de la Imagen . . . . . . . . . . . . . . . 71 5.12. Huevo de Helminto de la especie Ascaris representado en el espacio de color RGB. 72. 5.13. Huevo de Helminto de la especie Uncinarias representado en el espacio de color RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 5.14. Huevo de Helminto de la especie Trichuris representado en el espacio de color RGB 73 5.15. Huevo de Helminto de la especie Hymenolepis Nana representado en el espacio de color RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.16. Huevo de Helminto de la especie Diphillovotrium Pacificum representado en el espacio de color RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.17. Huevo de Helminto de la especie Taenia Solium representado en el espacio de color RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74.

(13) LISTA DE FIGURAS. XIII. 5.18. Huevo de Helminto de la especie Fasciola Hepática representado en el espacio de color RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5.19. Huevo de Helminto de la especie Enterobius Vermicularis representado en el espacio de color RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5.20. Ubicación de los pixeles relacionados con los kernels que representan los cambios verticales y horizontales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.21. Extracción de la Orientación de Textura de las especies Ascaris y Uncinaria . . . . 80 5.22. Extracción de la Orientación de Textura de las especies especie Trichuris y Hymenolepis Nana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 5.23. Extracción de la Orientación de Textura de las especie Diphillovotrium Pacificum y Taenia Solium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 5.24. Extracción de la Orientación de Textura de las especies especie Fasciola Hepática y Enterobius Vermicularis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 5.25. Diagrama de la primera propuesta basada en una mejora del MTH . . . . . . . . . 82 5.26. Estructura de los seís textones propuestos . . . . . . . . . . . . . . . . . . . . . . 83 5.27. Buscando la forma del texton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 5.28. Proceso de análisis de ubicación de textones . . . . . . . . . . . . . . . . . . . . . 86 5.29. Ejemplos de posibles formas irregulares de un texton . . . . . . . . . . . . . . . . 87 5.30. Mecanismo de formación de la matriz texton basada en la propuesta de [Liu et al., 2010] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.31. Diagrama de búsqueda de correlación de textones, utilizando la Matriz de Coocurrencia de 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.32. Diagrama de búsqueda de correlación de textones, utilizando la Matriz de Coocurrencia de 45◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.33. Imagen de un Huevo de Helminto de la especie Ascaris y su MTH9 . . . . . . . . 97 5.34. Imagen de un Huevo de Helminto de la especie Trichuris y su MTH9 . . . . . . . . 97 5.35. Imagen de un Huevo de Helminto de la especie Fasciola Hepática y su MTH9 . . . 98 5.36. Análisis de la tendencia de valores en cada característica del descriptor propuesto MTH6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99.

(14) LISTA DE FIGURAS. XIV. 5.37. Análisis de la tendencia de valores en cada característica del descriptor propuesto MTH9. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100. 5.38. Comparación de la performance del sistema CBIR, basada en la dimensionalidad del vector de características, usando el descriptor MTH9 . . . . . . . . . . . . . . 101 5.39. Comparación de la dimensionalidad del vector de características, en un sistema CBIR con Relevancia Feedback . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 5.40. Resultados del Sistema CBIR para una imagen de consulta de la especie Ascaris . . 104 5.41. Resultados del Sistema CBIR para una imagen de consulta de la especie Hymenolepis Nana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 5.42. Resultados del Sistema CBIR para una imagen de consulta de la especie Trichuris . 105 5.43. Resultados del Sistema CBIR para una imagen de consulta de la especie Hymenolepis Nana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 5.44. Identificación de los huevos de los helmintos usando el sistema CBIR . . . . . . . 109 5.45. Precisión/Recuperación: Las relaciones entre las cardinalidades de los conjuntos dan las métricas de éxito del sistema . . . . . . . . . . . . . . . . . . . . . . . . . 110 5.46. Comparación de las Curvas Precisión/ Cobertura para los 3 métodos de extracción de características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 5.47. Resultados de la clasificación para una imagen de consulta de la especie Ascaris . . 120 5.48. Resultados de la clasificación para una imagen de consulta de la especie Trichuris . 121 5.49. Recuperación de imágenes de dinosaurios basado en el descriptor MTH9 para la Base de Datos simplicity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 5.50. Recuperación de imágenes de elefantes basado en el descriptor MTH9 para la Base de Datos simplicity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 A.1. Conjunto de imágenes correspondientes al huevo de Helminto de la especie Ascarias139 A.2. Conjunto de imágenes correspondientes al huevo de Helminto de la especie Uncinarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 A.3. Conjunto de imágenes correspondientes al huevo de Helminto de la especie Trichuris140 A.4. Conjunto de imágenes correspondientes al huevo de Helminto de la especie Hymenolepis Nana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140.

(15) LISTA DE FIGURAS. XV. A.5. Conjunto de imágenes correspondientes al huevo de Helminto de la especie Diphilovotrium Pacificum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 A.6. Conjunto de imágenes correspondientes al huevo de Helminto de la especie Taenia Solium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 A.7. Conjunto de imágenes correspondientes al huevo de Helminto de la especie Fasciola Hepática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 A.8. Conjunto de imágenes correspondientes al huevo de Helminto de la especie Enterobius Vermicularis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.

(16) Lista de Tablas. 2.1. Modelos para el análisis de textura de las imágenes . . . . . . . . . . . . . . . . . 20 3.1. Generación de la Matriz de Coocurrencia Texton . . . . . . . . . . . . . . . . . . 43 4.1. Parásitos encontrados en Restos Arqueológicos en el Perú . . . . . . . . . . . . . . 54 4.2. Características y Filo de los Helmintos en estudio . . . . . . . . . . . . . . . . . . 57 5.1. Resolución de las imágenes por especie . . . . . . . . . . . . . . . . . . . . . . . 63 5.2. Distribución de imágenes por especie . . . . . . . . . . . . . . . . . . . . . . . . 65 5.3. Dimensionalidad del Vector de Características . . . . . . . . . . . . . . . . . . . . 99 5.4. Identificación de Especies de los Helmintos usando la segunda imagen recuperada por el Sistema CBIR basado en el descriptor MTH9 . . . . . . . . . . . . . . . . . 107 5.5. Identificación de Especies usando las tres primeras imágenes recuperadas por el Sistema CBIR basado en el MTH9 . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5.6. Identificación de Especies usando las cinco primeras imágenes recuperadas por el Sistema CBIR basado en el MTH9 . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5.7. Tabla de Contingencia para imágenes relevantes y recuperadas . . . . . . . . . . . 111 5.8. Tabla de Configuración de los parámetros v-fold y gamma para el clasificador MCSVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 5.9. Performance de los descriptores MTH6 y MTH9 propuestos Vs el descriptor MTH usando el clasificador MCSVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 5.10. Matriz de Confusión de diferenciación de los ocho tipos de Huevos de parásitos intestinales, utilizando el clasificador MCSVM con una función Radial para el descriptor propuesto MTH9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117. XVI.

(17) LISTA DE TABLAS. XVII. 5.11. Matriz de Confusión de diferenciación de los ocho tipos de Huevos de parásitos intestinales, utilizando el clasificador MCSVM con una función Radial para el descriptor propuesto MTH6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 5.12. Matriz de Confusión de diferenciación de los ocho tipos de Huevos de parásitos intestinales, utilizando el clasificador MCSVM con una función Radial para el descriptor MTH [Liu et al., 2010] . . . . . . . . . . . . . . . . . . . . . . . . . . 119 C.1. Vector de características del MTH9 para las especies Ascarias (1,2), Uncinarias (249,250), Trichuris (359,360) e Hymenolepis Nana (465,466) . . . . . . . . . . . 144 C.2. Vector de características del MTH9 para las especies : Dyphillobothrium Pacificum (639 y 640), Taenia Solium (998 y 999), Fasciola Hepática (1380 y 1381), Enterobius Vermicularis (1799 y 1800) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145.

(18) Capítulo 1 Introducción. En el contexto de bases de datos de imágenes, reconocer la composición y el contenido de las imágenes no es una tarea sencilla, ya que implica el análisis de la imagen digital en base a sus diferentes características lógicas o de alto nivel, que contiene información de los objetos en la imagen y sus relaciones espaciales y/o físicas o de bajo nivel, que contiene información del color, textura y forma, ya sea con respecto a la imagen completa o de una región previamente determinada. Por lo tanto, la información que se pueda extraer de una imagen puede convertirse en extensa y a su vez compleja, y más aún si se trabaja a nivel de píxeles, considerando su composición por naturaleza; no obstante muchos investigadores han demostrado que es difícil obtener efectos satisfactorios en el análisis de una imagen usando sólo algoritmos simples basados en píxeles [Liu and Yang, 2008], sin embargo, éstos píxeles generalmente se presentan en la imagen agrupados formando un conjunto de patrones o textones emergentes que vendrían a conformar las unidades fundamentales de la textura de la imagen [Julesz, 1981], que a su vez, comparten propiedades comunes sobre toda la imagen, guardando cierta relación espacial entre ellos, lo que permite lograr la extracción de características; sin embargo, definir éstos textones sigue siendo un desafío [Liu and Yang, 2008]. Así mismo, todos los sistemas CBIR que han sido desarrollados, presentan sus propios descriptores [Patiño Escarcina, 2009], [Melchor and Gonzalez, 2001], para representar el contenido visual de la imagen, que se constituyen en una secuencia numérica denominada vector de características [Patiño Escarcina, 2009], los cuales muchas veces son completamente distintos a pesar de que trabajan con las mismas Bases de Datos de Imágenes [Penatti, 2009], obteniendo diferentes resultados en cuanto a su eficiencia, de los cuales pocos o ninguno alcanza el 100 % [Rodríguez, 1.

(19) Introducción. 2. 2008], por lo que el trabajo en éste campo aún no ha sido concluído, es por ello que en la presente investigación se pretende lograr la caracterización de imágenes biológicas basado en el histograma multitexton, específicamente analizando su comportamiento en las imágenes biológicas de huevos de helmintos para su posterior identificación y clasificación de especies. Por otro lado, un factor muy importante está relacionado con la dimensionalidad del vector de características, lo cual influye directamente en el almacenamiento, puesto que, mientras más compacto sea el vector de características, menor es el impacto de los requisitos de almacenamiento, indexación y recuperación de las imágenes en las base de datos, ya que, debido a la gran cantidad de imágenes, uno de los problemas consiste justamente en recuperar la información de manera rápida y precisa.. 1.1.. Objetivos. 1.1.1.. Objetivo General. El objetivo principal que se pretende alcanzar en la presente investigación es:. Proponer un descriptor para la caracterización basada en el histograma multitexton aplicado a imágenes biológicas.. 1.1.2.. Objetivos Específicos. A. Identificar y representar los textones que conforman las imágenes biológicas. B. Desarrollar los procedimientos y técnicas para la extracción de características basada en el histograma MultiTexton. C. Proponer las medidas de similaridad y desempeño adecuadas para el descriptor propuesto. D. Validar el modelo propuesto con el caso de estudio de las imágenes biológicas de huevos de helmintos que serán usadas para su identificación y clasificación de especies..

(20) Introducción. 1.1.3.. 3. Publicaciones. Durante el desarrollo de la presente investigación fueron publicadas las siguientes investigaciones. 1. [Flores-Quispe et al., 2014a] Flores-Quispe, R., Velazco-Paredes, Y., Patiño-Escarcina, R. E., and Beltran-Castanon, C. (2014). Automatic Identification of Human Parasite Eggs Based on Multitexton Histogram Retrieving the Relationships between textons. In Computer Science Society (SCCC), 2014 33th International Conference of the Chilean. 2. [Flores-Quispe et al., 2014b] Flores-Quispe, R., Velazco-Paredes, Y., Patiño-Escarcina, R. E., and Beltran-Castanon, C. (2014). Classification of human parasite eggs based on enhanced multitexton histogram. In 2014 IEEE Colombian Conference on Comunications and Computing - COLCOM 2014, pages 1 – 6. IEEE. 3. [Velazco-Paredes et al., 2011] Velazco-Paredes, Y., Flores-Quispe, R., Patiño-Escarcina, R. E., and Beltran-Castanon, C. (2011). Relevance feedback through the generation of trees for image retrieval based on multitexton histogram. In Computer Science Society (SCCC), 2011 30th International Conference of the Chilean, pages 1 - 7. IEEE. 4. [Rodriguez et al., 2011c] Rodriguez, A., Diaz-Zea, A., Flores, R., Delgado, M., BarriosAranibar, D., and Patino, R. (2011c). Argopecten purpuratus codification based on determination of weight by conversion and adjustment factors. In Computer Science Society (SCCC), 2011 30th International Conference of the Chilean, pages 147 – 152. IEEE. 5. [Rodriguez et al., 2011a] Rodriguez, A., Diaz-Zea, A., Flores, R., Barrios-Aranibar, D., and Patino, R. (2011a). Automatización del proceso de verificación del tamaño del coral de la concha de abanico usando espacios de color. In XXIII Encuentro Chileno de Computación (ECC2011) - Jornadas Chilenas de Computación. 6. [Rodriguez et al., 2011b] Rodriguez, A., Diaz-Zea, A., Flores, R., Barrios-Aranibar, D., and Patino, R. (2011b). Determinación de la trayectoria de paso del venturi para la succión de la branquia de la concha de abanico usando visión computacional. In X Congreso Internacional de la Sociedad Peruana de Computación..

(21) Capítulo 2 Extracción de Características de una Imagen. 2.1.. Consideraciones Iniciales. La extracción de características de una imagen es una etapa muy importante, ya que ésta permite representar las características más elementales de una imagen; las mismas que posibilitan al propio sistema de visión humana identificar y posteriormente clasificar en un nivel semántico los objetos de una determinada escena.. 2.2.. Definiendo una Imagen. Una imagen digital es generalmente el resultado de un proceso de discretización de una imagen de función continua I(x,y); y generalmente es almacenada en un computador en un arreglo bidimensional I(m,n) donde m = 0,1,. Nx - 1 y n = 0,1, Ny - 1; lo cual significa que es almacenado en un arreglo de dimensión Nx *Ny , donde cada elemento del arreglo corresponde a un pixel (elemento de imagen) [Castañón, 2004]. Cuya intensidad de luz denotada por f(x,y); es proporcional al brillo (o nivel de gris) de la imagen en ese punto (x,y) [Rosenfeld and Avinash, 1982]. Así en la figura 2.1, se presenta un arreglo de 4x4 para representar una imagen con 8 niveles de gris. Además cuando la intensidad es cuantizada en “N” niveles discretos (niveles de gris), entonces N es conocida como la profundidad de la imagen, y en consecuencia cada pixel de la imagen en niveles de gris sólo puede tomar valores entre 0 y N-1. A su vez esta profundidad es generalmente una potencia de 2, entonces existirán 2n escalas de gris diferentes. 4.

(22) Extracción de Características. 5. Figura 2.1: Representación de una imagen con 8 niveles de gris. 2.3.. Extracción de Características de la Imagen. Las características más elementales de las imágenes son aquellas que posibilitan al propio sistema de visión humana identificar y posteriormente clasificar en un nivel semántico los objetos de una determinada escena. Asi, cualquier descripción computacional de una imagen parte siempre de un conjunto de características locales [Mora, 2010], las cuales dependen de la tarea a realizar, siendo éstas de muy diversa topología y diversos niveles de complejidad (contornos, blob, líneas, color, textura, entre otros). Una misma característica se puede representar de diferentes maneras, la más común es a través de una medida u operador que proporciona un valor [Fernandez, 2010]. A la representación de una característica se le ha atribuido el nombre de descriptor. Por tanto, una manera de representar computacionalmente una imagen es mediante el conjunto de descriptores que la caracterizan, formando éstos a su vez un vector de características. La Figura 2.2, representa el proceso de extracción de características, donde cada elemento del vector de características Xi representa información relevante capaz de discriminar las imágenes unas de otras en una base de datos [Castañón, 2004]. La necesidad de generar vectores de características es por la dificultad de poder trabajar con el total de información de una imagen. Por ejemplo, si una imagen es de dimensión de 64 x 64; entonces se tendrá un conjunto de 4096 píxeles, para el caso de un CBIR, este número es demasiado alto..

(23) Extracción de Características. 6. Extracción de Características. X1 X2 . . . . Vector de características . . . Xn. Figura 2.2: Proceso de extracción de características. 2.4.. Descriptores. Un descriptor es una función que extrae una característica de la imagen, dando como respuesta un vector de “n” dimensiones, llamado vector de características, V=(V1 ,V2 ,V3 ,...,Vn ), el cual es una representación numérica de una imagen o parte de ella, que caracteriza los aspectos representativos de la misma [Patiño Escarcina, 2009]. Así, una característica es alguna propiedad especial de un objeto que puede ser medida y comparada. Si consideramos que los objetos son imágenes, en este caso las características se definen en cuanto a color, forma, textura, relaciones espaciales, entre otras [Patiño Escarcina, 2009].. 2.4.1.. Tipos de Descriptores. Es posible distinguir diversos tipos de descriptores que permiten realizar un análisis de las imágenes en tres niveles, los cuales son mostrados en la figura 2.3; estos niveles consideran a su vez diferentes capacidades de abstracción [Melchor and Gonzalez, 2001], los cuales son: Nivel 1 - Primitivas Básicas : En este nivel, existe la posibilidad de establecer relaciones entre imágenes en base a valores de color de los puntos, a las texturas que se pueden observar y a los contornos que es posible detectar con diferentes operadores, por lo tanto se constituyen en primitivas básicas el color, la textura y la forma, que a su vez son las características más comunes consideradas por una gran cantidad de sistemas CBIR [Datta et al., 2008]. Varios.

(24) Extracción de Características. 7. algoritmos han sido propuestos por muchos investigadores para extraer el color, la textura y otras características; siendo el color la característica visual más dominante, importante y distinguible. Nivel 2 - Sintáctico : Denominado “reconocimiento de patrones” porque aquí se unen las anteriores informaciones para buscar regiones de mayor entidad y comprobar si se ajustan a reglas de descripción de elementos tipo. Nivel 3 - Semántico : Llamado “reconocimiento de objetos” en el que la complejidad es un poco mayor, al permitir que existan imprecisiones entre la definición del objeto de la realidad a buscar y sus posibles transformaciones sufridas o variaciones de las condiciones de adquisición de la imagen. Top - Down. Reconocimiento de Objetos Manipulación de Objetos Métodos Semánticos y Sintáxticos. Reconocimiento de Patrones Template Matching Shape Analisys. Primitivas Visuales. Contornos. Textura Color. Bottom-up. Estrategias de Aprendizaje y Agrupamiento. Figura 2.3: Técnicas para la descripción del contenido de una imagen Fuente : [Melchor and Gonzalez, 2001]. A lo largo de este capítulo nos centraremos sólo en el estudio de los descriptores de primer nivel, por ser los más utilizados en los sistemas CBIR [Datta et al., 2008].. 2.5.. Extracción de Características de Color. El color ha demostrado ser una característica importante para la realización de diversas tareas visuales, sobre todo en la identificación y en la discriminación de objetos, para el cual en comparación con la textura, sí se tiene una definición clara y existe además, diversas maneras de representar este estímulo visual..

(25) Extracción de Características. 2.5.1.. 8. Física del Color. La luz es un flujo de energía por ondas electromagnéticas de diversas frecuencias. El ojo humano es sensible sólo a un subconjunto de radiaciones electromagnéticas (longitudes de onda) que definen el espectro visual, así en la figura 2.4, se muestra todo el rango de espectro electromagnético. Cuando la luz incide en un objeto, la superficie de éste absorbe la energía de cada longitud de onda con diferente grado dependiendo de su reflectancia. La energía que no es absorbida por el objeto se refleja de diferente manera dependiendo de las propiedades del material del objeto y del ángulo de incidencia de la luz, todo ello junto con la posición del observador determina la percepción del color del objeto.. Figura 2.4: Espectro Electromagnético. Dentro de los modelos que realizan una aproximación del modelo real de reflexión se encuentran el modelo dicromático de reflexión. Según este modelo cuando el material de un objeto es ópticamente no homogéneo y opaco, se produce un fenómeno de reflexión especular y un fenómeno de reflexión difusa. La reflexión especular corresponde a la porción de la luz incidente que es reflejada por la superficie del objeto, cuya dirección de reflexión se concentra alrededor de la dirección simétrica a la dirección de la luz incidente con respecto a la superficie normal. Por otro lado, el fenómeno de reflexión difusa se produce debido a la porción de luz que entra en el material; esta luz es absorbida por las partículas colorantes o pigmentos que se encuentran dentro del material y es reemitida en parte hacia el exterior en todas las direcciones..

(26) Extracción de Características. 2.5.2.. 9. Percepción Humana del Color. En la visón humana la percepción del color se produce por etapas, teniendo cada una de ellas una ubicación diferente en el sistema visual. En la primera fase interviene la retina del ojo, figura 2.5, en esta zona se encuentran millones de células especializadas de varios tipos, llamados fotoreceptores que absorben la luz y la convierten en señales neuronales. Estas señales son procesadas por otras células de la retina antes de que pasen al cerebro a través del nervio óptico.. Figura 2.5: Estructura del Ojo Humano. Existe cuatro tipos de fotoreceptores, tres de ellos son los denominados conos que son los responsables de la visión diurna y del color, mientras que el cuarto tipo son los bastones, estos últimos se activan en intensidades bajas de luz (visión nocturna) ya que son mucho más sensibles a la luz que los conos, pero no contribuyen a la visión del color [Robrtson, 1992]. Según la teoría tricromática, [Wyszecki and Stiles, 1982], cada fotoreceptor es sensible (absorbe) a un conjunto de longitudes de onda concretas de la luz, por lo cual los conos se diferencian en: conos de tipo L (Long Wavelength), de tipo M (Medium Wavelength) y de tipo S (Short Wavelength). En la figura 2.6 se muestra el espectro visual, (rango de frecuencias visible), la sensibilidad de cada uno de los conos reflejando la proporción de luz que absorben en cada longitud de onda.. 2.5.3.. Representación Computacional del Color. El color es una propiedad innata de las imágenes, el cual es ampliamente usado en el análisis de imágenes médicas y microscópicas [Cheng et al., 2001], es por ello que en esta sección se amplia.

(27) Extracción de Características. 10. Figura 2.6: Sensibilidad de los conos. su estudio, basándonos en una representación computacional del mismo. Así, la colorimetría es la ciencia que se ocupa del estudio de como especificar numéricamente el color correspondiente a un estímulo físico y de como medir la diferencia entre colores. Dado que existen tres tipos de fotoreceptores responsables del color, parece adecuado representar al color con tres componentes numéricas. Dentro de la colorimetría éste es el enfoque más extenso y corresponde a la generalización tricromática [Wyszecki and Stiles, 1982], sobre la cual se puede descubrir un conjunto de atributos perceptuales que se detallan a continuación: Valor : El valor de un color depende de la cantidad de luz que emite, es decir, de la cantidad de color blanco o negro que posee en su composición, y se emplea para indicar el grado de claridad u oscuridad de un color, motivo por el cual hablamos de colores claros, brillantes, vivos o por el contrario, de colores apagados u opacos. El tránsito del claro al oscuro se logra a base de añadir cantidades de blanco o negro al color y se conoce como degradado de un color. Para conseguir ambientes o variantes claros, se emplean colores de valor más luminoso (naranja, verde, amarillo), el amarillo se considera el color más brillante, y para obtener situaciones o entornos oscuros se utilizan los de valor menos luminoso (azul, violeta, rojo). El valor también se suele denominar luminosidad, luminancia o brillo. Tono : Es el nombre específico que se da a cada color, el atributo que lo distingue de los demás. Cada tono recibe un nombre (rojo, naranja, amarillo, verde, azul, etc.) y dentro de cada uno tenemos todos sus valores intermedios (verde amarillento, azul verdoso, naranja.

(28) Extracción de Características. 11. rojizo, verde claro) o compuestos. El tono también se suele denominar matiz, cromatismo o tinte. Saturación : La saturación es la propiedad que indica la pureza de un color. Los colores primarios (magenta, amarillo y cian) son los que poseen mayor grado de saturación, mientras que los grises representan los de menor nivel de saturación. Cuando un color pertenece al círculo cromático se dice que está saturado, que tiene el máximo poder de pigmentación, de coloración, pero no siempre nos encontramos con colores puros, sino que se suelen ver compuestos por mezclas complejas, con cantidades desiguales de colores primarios. Para cambiar la saturación de un color hay que mezclarlo con su complementario y, así se obtiene la escala de saturación o de grises. La figura 2.7, muestra una diferenciación de estos atributos perceptuales.. (a). (b). (c). Figura 2.7: Atributos perceptuales de una imagen (a) Valor (b) Tono (c) Saturación. Según, la definición de cada una de las componentes numéricas se derivan diferentes maneras de representar los colores, dando lugar a espacios de color diferentes. Matemáticamente, un espacio de color se define por una base de N componentes vectoriales cuya combinación lineal o no, genera todos los posibles colores que pueden ser representados por ese espacio [Crespo and Ochoa, 2007]. Dependiendo de la aplicación es más adecuado usar unos espacios u otros. De manera muy general los espacios de color se clasifican en: modelos orientados a dispositivos y modelos orientados a reproducir la percepción humana; los primeros están basados en la fisiología de la retina humana, y los otros pretender captar fenómenos preceptuales tales como la luminosidad, el tono y la saturación..

(29) Extracción de Características 2.5.3.1.. 12. Modelos de Espacios de Color orientados a dispositivos. Los modelos orientados a dispositivos han sido utilizados ampliamente en la literatura, el más conocido es el RGB, el cual representa un color mediante la mezcla por adición de los tres colores de luz primarios: rojo (R), verde (G) y azul (B), correspondientes a las funciones de sensibilidad a la luz. Geométricamente el color esta dado por la suma vectorial de sus componentes, aunque el espacio RGB es intuitivo presenta un serio inconveniente: sus tres componentes mezclan información de cromaticidad (color) y luminancia (intensidad). Para paliar este problema se propusieron los espacios YIQ y YUV que separan la luminancia “Y” y la cromaticidad “IQ y UV” respectivamente y que son usados por el estándar NTSC de transmisión de televisión. A partir de la selección de colores primarios y del nivel de referencia, se puede derivar los valores de cada componente, como se muestra en la ecuación 2.1.      0,299 0,587 0,114 R Y           U  = 0,147 −0,289 0,436  G      0,615 −0,515 −0,100 B V 2.5.3.2.. (2.1). Modelos de Espacios de Color orientados a reproducir la percepción humana. Entre los modelos de espacio de color orientados a reproducir la percepción humana destacan el HSI y el XYZ. El primero y sus derivados HSL, HSV y HSB se basan en el modo de percibir los colores que tenemos los humanos, dicho sistema caracteriza el color en términos de tono o tinte (Hue), saturación e intensidad; componentes que se muestran favorables cuando el tono del color es importante para la segmentación. El espacio HSI puede relacionarse con el RGB a través de la transformación no lineal mostrada en la ecuación 2.2. R+G+B I= ; H= 3. ! √ 3 (G − B) min(R, G, B) ; S = 1− (R − G) + (R − B) I. (2.2). En el espacio XYZ cada una de sus componentes primarias de color fueron definidas experimentalmente por la Comisión International de Éclairage CIE, basándose directamente en mediciones de cómo el ojo humano percibe los colores. Los espacios X y Y, L* u* v * y L* a* b*, derivados del XYZ, aíslan la componente de luminancia y además promueven que la sensación de.

(30) Extracción de Características. 13. diferencia percibida entre dos colores sea proporcional a la distancia euclidiana medida entre los puntos que representan esos dos colores en el espacio tridimensional, la ecuación 2.3 muestra una conversion entre este espacio y el espacio de color RGB.      X 0,34 0,222 0,020 R           Y  = 0,43 0,706 0,129 G      Z 0,17 0,071 0,939 B. 2.5.4.. (2.3). Descriptores Computacionales del Color. En esta sección se presenta un resumen de los principales descriptores computacionales, los cuales han sido utilizados en diversas aplicaciones dentro del ámbito de la visión por computador; tales como: los Histogramas de Color, los Momentos de Color y el Color Predominante. 2.5.4.1.. Histograma de Color. Este descriptor caracteriza la distribución de colores en una imagen contabilizando la frecuencia en que aparecen los píxeles de colores. Dado que los espacios de representación de color son tridimensionales existen dos opciones para caracterizar el color: mediante un histograma tridimensional o mediante tres histogramas unidimensionales (un histograma para cada dimensión). Durante la realización de este trabajo se ha utilizado esta última representación, debido a que cada dimensión del espacio de color tiene una contribución diferente en la percepción final del color. 2.5.4.2.. Momentos de Color. Interpreta la distribución de colores en una imagen como una función de distribución de probabilidad y la caracteriza por sus momentos, así el descriptor está compuesto por la media (momento de primer orden), la varianza (momento de segundo orden) y la asimetría (momento de tercer orden), calculados en cada una de las tres dimensiones del espacio de color escogido para representar el color; es por lo tanto, una manera muy compacta de representar el color de una imagen aunque suponga una pérdida en el poder de discriminacion y evita los problemas derivados de la cuantificación que tiene el uso de los histogramas [Rui and Huang, 1999]..

(31) Extracción de Características 2.5.4.3.. 14. Color Dominante. El objetivo de este descriptor es caracterizar la imagen con los colores que predominan en ella. Dentro del estándar MPEG-7 se hallan dos descriptores de este tipo: el primero denominado Dominant Color, el cual está compuesto por un vector que para cada color dominante contiene: el porcentaje de píxeles de ese color, la varianza de colores dentro del color dominante y la coherencia espacial (homogeneidad espacial del color dominante). El segundo descriptor denominado CLD (Color Layout Descriptor) hace un tratamiento más local ya que divide la imagen en 64 bloques de tamaño fijo y en cada bloque se calcula el color representativo utilizado.. 2.6.. Extracción de Características de Textura. La textura es una propiedad muy importante para la caracterización y reconocimiento de imágenes [Haralick et al., 1973], [Unser, 1986], pues juega un rol importante en muchas tareas, tales como: el reconocimiento de objetos, teledetección, tratamiento de imágenes médicas, recuperación de imágenes basadas en contenido, entre otras [Sujatha B., 2013], [Sali and Wolfson, 1992], es por ello, que es considerada en un gran número de investigaciones, así los rasgos de textura han demostrado ser una herramienta importante en la segmentación de la imagen, clasificación de objetos e interpretación de imágenes en una variedad de aplicaciones. Además, la textura es una propiedad innata de todas las superficies, ella contiene información importante acerca del ordenamiento estructural de las mismas y sus relaciones con el ambiente que la rodea; también es descrita como un patrón con algunos tipos de regularidad [Sujatha B., 2013]; por ello, es considerada como una importante característica discriminativa de la imagen y su uso en clasificación digital de imágenes está basado en la necesidad de incluir patrones de variabilidad en el análisis [Kushwaha et al., 1994]. Originalmente el término textura fue adoptado del término textiles, el cual se refería al tejido de varios hilos sueltos, apretos o combinados [Smith and Burns, 1997], no obstante, la textura es aún un concepto abstracto, para ella no existe una definición precisa, que no sea ambigua y tampoco existe un planteamiento matemático formal para su caracterización cuantitativa [Andrade and Niero, 1989]. Uno de los motivos es el que apunta Jain [Jain and Farrokhnia, 1991], al afirmar que la diversidad de texturas naturales y artificiales hace que sea imposible dar una definición.

(32) Extracción de Características. 15. universal. Sin embargo, la mayoría de investigadores consideran la textura como una propiedad inherente a las superficies, que constituye una herramienta útil en la identificación de regiones de interés en una imagen, siendo extremadamente difícil de modelar matemáticamente [Bovik et al., 1990]. A continuación se muestran algunas definiciones del concepto de textura: Richards y Polit (1974) : Es un atributo en el que no tiene componentes enumerables. Halarick (1979) : Se puede describir por el número, tipo de sus primitivas (o elementos que contiene) y por la organización espacial de éstas (aleatoria o estructurada). Sklansky (1978) : Una región de la imagen tiene textura sí un conjunto de estadísticos locales u otras propiedades locales de la imagen son constantes, varían lentamente o son aproximadamente periódicas. Vilrotter y cols (1986) : Puede ser descrita como un patrón de la ordenación espacial de diferentes intensidades (o colores). Unser (1986) : Debe considerarse como una propiedad de la vecindad de un punto de la imagen. Blostein y Ahuja (1989) : Está compuesta por unidades repetitivas, texels (elementos de textura). Turceryan y Jain (1998) : Es una función de la variación espacial de la intensidad de los pixels. Ojala, Pietikäinen y Maenpää (2002) : Es un fenómeno de dos dimensiones que se caracteriza por dos propiedades ortogonales: la estructura espacial (patrón) y contraste (la cantidad de textura local). Basados en las diferentes definiciones podemos considerar a la textura como, patrones homogéneos visuales con algún tipo de regularidad que se distinguen en una región y no en un punto, las cuales están presentes en materiales como: madera, piedras, telas, etc..

(33) Extracción de Características. 16. Así mismo, las texturas no se pueden percibir fácilmente como objetos aislados, pero tienen cualidades tales como: periodicidad, escala, dirección, contraste o representan algunas otras propiedades tales como: suavidad, rugosidad, aspereza [Liu and Yang, 2008], la regularidad de las superficies [Rafael C. Gonzales, 2008]; o una cuantificación de la variación espacial de valores de tono de gris [Balan, 2007]. Nosotros, los interpretadores humanos, estamos capacitados para reconocer intuitivamente texturas diferentes, sin embargo, es muy difícil definir y analizar la textura con precisión por medios digitales [Rodríguez, 2008]. El principal problema es que las texturas en el mundo real son a menudo no uniformes debido a variaciones en la orientación de ésta, a la escala espacial ó a cambios de iluminción [Ojala et al., 2002]. Estas consideraciones han dado lugar en diversos estudios a incorporar la invarianza de estas propiedades. Es por ello que, el análisis de textura ha estado en el foco de interés en las tres últimas décadas. Los psicólogos, biólogos y los investigadores de visión por computadora han tratado de modelar la visión humana de la textura y encontrar reglas matemáticas que puedan determinar, sí la diferencia entre dos regiones es visible o abordando diferentes modelos y métodos de análisis orientados a la obtención de rasgos distintivos de la textura, de los cuales se reportan decenas de descriptores matemáticos [Gutiérrez and Gonzales, 2005]. Los avances obtenidos en este campo justifican el interés creciente que se observa tanto en la clasificación automática de imágenes basadas en descriptores de textura extraídos de las imágenes [Rodríguez, 2008], como en el empleo de ésta en varias formas como: segmentación de la escena en regiones y objetos característicos [Andrade and Niero, 1989], [Sali and Wolfson, 1992], [Turceryan, 1994], [Kamarainen, 2003], [Csurka et al., 2004], clasificación de imágenes [Johnson et al., 2013], reconocimiento de patrones [Kamarainen, 2003], entre otros. En la siguiente figura 2.8, se muestra el reconocimiento de materiales de la superficie [Haralick et al., 1973] y el cálculo de la forma de la superficie [Kanatani and Chou, 1989]..

(34) Extracción de Características. (a). 17. (b). (c). (e). (f). (d). Figura 2.8: Segmentación de imagen usando descriptores. La Figura 2.8 (a) representa un mosaico de 5 texturas naturales del álbum de Brodatz (D77, D55, D24, D84 y D17). En las zonas (b), (c), (d), (e) son cuatro descriptores de textura presentes en el mosaico y que fueron obtenidos con el filtrado de Gabor simple y Energía de Gabor y por último en (f) se muestra la segmentación de imagen usando esos descriptores, por lo tanto, como hemos podido apreciar en estos ejemplos, la textura es una propiedad útil para llevar a cabo la segmentación de imágenes.. 2.7.. Métodos para el Análisis de Textura. Los tres principales enfoques de modelamiento matemático usados en el procesamiento de imágenes para describir la textura de una región son: el enfoque estadístico, el enfoque estructural y el enfoque espectral. El enfoque estadístico, define texturas como procesos estocásticos utilizando características estadísticas, facilitando la caracterización de la textura en términos de suavidad, rugosidad, regularidad, granularidad, etc, las técnicas estructurales definen las texturas como una composición de elementos primitivos bien definidos basados sobre una disposición determinística de los elementos texturales (texels), por ejemplo líneas paralelas y las técnicas espectrales están.

(35) Extracción de Características. 18. basadas en las propiedades del espectro de Fourier y son usadas principalmente para detectar la periodicidad de la imagen identificando picos de energía grandes y picos de energía estrechos en el espectro de las señales [Reed and Dubuf, ], [Rafael C. Gonzales, 2008].. 2.7.1.. Enfoque Estadístico. Aún cuando la textura puede ser aleatoria, pero con ciertas propiedades consistentes, una de las formas para describirla es a través de sus propiedades estadísticas, que facilitan la caracterización de la textura en términos de suavidad, rugosidad, regularidad, granularidad, estos a su vez pueden ser de Primer, Segundo o de Tercer orden. Primer Orden: Las medidas texturales de primer orden son calculadas a partir de los valores de gris originales de la imagen y su frecuencia (histogramas), permitiéndose con ello, obtener los estadísticos de primer orden como la media, la varianza y/o la desviación estándar. El inconveniente en estas medidas es que no se considera la relación entre los píxeles por lo tanto, se pierde la información espacial. Segundo Orden: Son las medidas que consideran la relación de co-ocurrencia entre grupos de dos píxeles de la imagen original y a una distancia dada. Tercer y más Orden: Se consideran las relaciones entre 3 o más píxeles. Si bien su cálculo es teóricamente posible, pero no se implementan porque requieren mucho tiempo de cálculo y su resultado es de difícil interpretación. Dentro de los más relevantes enfoques estadísticos se tiene: las Matrices de Coocurrencia, los Campos aleatorios de Markov y los Métodos de autocorrelación. Además la mayoría de algoritmos suponen que todas las imágenes han sido capturadas bajo la misma orientación, lo cual no siempre se cumple, por lo cual, la clasificación de texturas invariantes a la escala y a la rotación es necesaria en estas aplicaciones.. 2.7.2.. Enfoque Estructural. Los métodos estructurales definen las texturas como una composición de elementos primitivos bien definidos, por ejemplo, líneas paralelas regularmente espaciadas, concibiendo las texturas.

(36) Extracción de Características. 19. reales o naturales, como una distorsión de estas texturas ideales. Otros enfoques pueden considerar a las texturas como una colección de objetos primitivos similares (pero no idénticos) distribuidos con algún patrón de repetición. La caracterización de las texturas bajo este enfoque puede realizarse calculando propiedades estadísticas sobre esta distribución de elementos o las reglas de distorsión y/o ubicación.. 2.7.3.. Enfoque Espectral. Se han aplicado técnicas habituales en el procesamiento de señales, que permiten analizar la imagen, aplicando filtros para obtener características relacionadas con la orientación o la magnitud de los componentes frecuenciales presentes en las texturas. Dentro de estos métodos podemos encontrar los que se aplican en el dominio espacial, mediante la aplicación de operadores de bordes como las máscaras Laplacianas o de Roberts, y las basadas en momentos invariantes. También se han utilizado técnicas aplicadas en el dominio de la transformada de Fourier, la transformada enventanada de Fourier (transformada de Gabor) Filtros de Gabor, la transformada discreta de Wavelet, entre otras. Las técnicas espectrales están basadas en las propiedades del filtrado digital que modifican la composición espectral en la imagen, el espectro de Fourier es usado para detectar la periodicidad global en una imagen identificando picos de energía grandes y picos de energía estrechos en el espectro de potencia de Fourier, el filtrado de Gabor y Wavelet con varias direcciones se usa para detectar la distribución de la energía en la imagen. Teniendo en cuenta estos tres enfoques Rodriguez Gil [Rodríguez, 2008], presenta una tabla en la que, para cada enfoque muestra un conjunto de descriptores..

(37) Extracción de Características. Cuadro 2.1: Modelos para el análisis de textura de las imágenes Modelo. Procedimiento Primer Orden Datos originales de los niveles de gris (NG) Histograma de los niveles de gris Segundo Orden Matriz de coocurrencia de los niveles de gris Diferencia de los niveles de gris. Estadístico. Matriz run-lenght Histograma de la suma y deferencia de los NG Histograma de las diferencias de los NG Espectro de textura Matriz de Textura de Cruce Diagonal (CDTM) Estadística de orden superior Autoregresión Histograma de la imagen a color Función de autocorrelación Estacásticos (o modo aleatorio) Análisis de Componentes Principales Filtrado en el dominio espacial (lineal, no lineal, morfológico) Filtrado utilizando momentos invariantes de orden p + q Filtrado en el dominio del espacio de frecuenncias (Fourier). Espectral. Basados en el espectro de potencia de la Transformada de Fourier Filtrado con filtro de Gabor Filtrado con banco de filtros de Gabor (multicanal) Filtrado wavelets, filtrado wavelets de Gabor. Estructural. Usan patrones primitivos y reglas de localizacion Mosaico de Voronoi Fuente: [Rodríguez, 2008]. 20.

(38) Extracción de Características. 2.8.. 21. Diferentes Unidades para el Análisis de Textura. Los métodos de análisis de textura pueden ser clasificados, a su vez, sobre la base de diferentes unidades de análisis, tales como: [A] El Píxel como unidad de análisis Los rasgos simples de la textura en una imagen pueden ser derivados de las características estadísticas que posee la distribución de los niveles de gris de los píxeles. Haralick y otros [Haralick et al., 1973], calcularon la matriz de co-ocurrencia, en la cual, cada elemento (i, j) de la misma, es la probabilidad que un píxel separado por un desplazamiento fijo δ = (r,θ) de un píxel con nivel de gris i, tenga un nivel de gris j. Weszka y Rosenfeld, [Weszka and Rosenfeld, 1976], calcularon un histograma (diferencias estadísticas) en el que el k-ésimo elemento es la probabilidad de que dos píxeles separados por un desplazamiento δ, tenga una diferencia de nivel de gris k; asi mismo Mary Galloway [Galloway, 1975] calculó la matriz run-length en la que cada elemento (i, j) es la frecuencia con la cual j píxeles de nivel de gris i continúe en la dirección θ. [B] Los Bordes como unidad de análisis Los bordes de una imagen son detectados por un operador de gradiente. Un borde “l” está caracterizado por el valor del borde, su dirección y su tamaño. Los valores promediados de la densidad del borde l, o del tamaño del borde, están correlacionados con la rugosidad (tosquedad) de la textura. La direccionalidad de la textura se puede medir a partir del histograma de la dirección del borde. [C] Los Extremos como unidad de análisis Mitchell y otros, [Mitchell, 2010] usaron los niveles de gris locales mínimo y máximo (extremos) en el análisis de textura. Ambos valores son detectados revisando la matriz de la imagen en las direcciones horizontal y vertical. Un extremo está caracterizado por su tamaño (correspondiente al contraste de la textura) y se calcula la frecuencia de los extremos de diferente tamaño..

(39) Extracción de Características. 2.9.. 22. Textura y Color. Aunque la mayoría de texturas que aparecen en la naturaleza presentan estas dos características simultáneamente, sin embargo, normalmente han sido estudiadas por separado. En los trabajos donde se ha analizado la textura se han limitado a tratar la información de la intensidad y pocos han incorporado la información cromática en los descriptores de textura. Quizás porque atendiendo a la noción de textura, se considera que dos imágenes con los mismos colores pero diferente patrón textural tienen diferentes texturas de color, pero no está claro si dos imágenes teniendo el mismo patrón textural y diferentes colores representan diferentes texturas. Desde diversas disciplinas, como la neurofísica y la psicofísica, sugieren la hipótesis de que el ser humano procesa de manera separada la componente cromática (color) de la componente acromática (textura). Pocos trabajos se centran en estudiar como interaccionan estas dos componentes en el sistema visual humano a la hora de realizar determinadas tareas. Entre estos trabajos figura el trabajo de Finlayson y Tian (1999), quienes realizan un experimento psicofísico para conocer como los humanos determinan la similitud entre patrones textiles de colores, concluyendo en que la interacción entre la textura (patrón) y el color dependen fuertemente del observador, ya que para unos la similitud entre los patrones textiles dependen de los dos aspectos conjuntamente, sin embargo para otros uno de los dos aspectos tiene mayor importancia. Por lo que, se deduce que las personas tienen intrínsecamente diferentes nociones de similitud y que ésta depende del dominio de aplicación.. 2.9.1.. Descriptores Computacionales de la Textura en Color. Los métodos que analizan la textura en color se pueden clasificar en dos. En el primero se procesa separadamente el color y la textura combinando luego la información, mientras que en el segundo se considera el color y la textura como un fenómeno conjunto. En la figura 2.9, se puede apreciar ambos métodos..

(40) Extracción de Características. 23. (a). (b). Figura 2.9: Procesamiento de Color y de Textura (a)de manera separada (b)de manera conjunta Fuente: [Fernandez, 2010]. 2.9.1.1.. Métodos que Procesan de Manera Separada la Textura y el Color. En estos métodos se utiliza un descriptor de color y un descriptor de textura. La combinación entre color y textura se hace a nivel de cálculo de disimilitudes, combinando las distancias obtenidas con cada descriptor por separado o combinando sus vectores de características. Así, por ejemplo [Flickner et al., 1995], suman las distancias obtenidas con el descriptor de color (histograma) y con el descriptor de textura (Tamura); [Liu et al., 2007] en cambio proponen un método automático para ponderar los pesos de las diferentes características de las imágenes, el mismo que depende directamente de su contenido. 2.9.1.2.. Métodos que Procesan de Manera Conjunta la Textura y el Color. Se analiza la textura en todas las componentes del espacio de color y dependiendo del número de procedimientos aplicados en cada componente se diferencian entre dos tipos de enfoques: enfoque unicanal y multicanal. En la mayoría de casos el vector de características resultante se obtiene concatenando los vectores de características obtenidos al aplicar el mismo procedimiento sobre los tres canales del espacio de color escogido. Dentro del enfoque unicanal [Yu et al., 2003], adoptan la transformada local de Fourier como una representación de un esquema de textura y obtienen sobre cada una de las tres componentes del espacio HSV un filtrado con un conjunto de 8 máscaras y calculan los momentos de color (media.

(41) Extracción de Características. 24. y varianza), para describir diferentes aspectos de las relaciones de coocurrencia; que representan la distribución de píxeles de la imagen de color natural. Y dentro del enfoque multicanal podemos encontrar el trabajo desarrollado por [Liu et al., 2010], quien propone un nuevo descriptor “MTH”, el cual analiza la correlación espacial entre colores vecinos usando la información de orientación de textura y la correlación espacial entre orientaciones de textura vecinos usando la información de color, integrando el uso de la matriz de coocurrencia y los histogramas.. 2.10.. Consideraciones Finales. En este capítulo se ha presentado un estudio de la extracción de características (descriptores) de una imagen, para la identificación y posterior clasificación en un nivel semántico los objetos de una determinada escena. Centrándonos sobre todo en los descriptores de bajo nivel (primitivas básicas): color y textura, ya que éstos son los más utilizados en diferentes investigaciones. El color, puesto que, ha demostrado ser una característica importante para la realización de diversas tareas visuales, sobre todo en la identificación y discriminación de objetos; y la textura, ya que, es considerada como una propiedad muy importante para la caracterización y reconocimiento de imágenes [Haralick et al., 1973], [Unser, 1986]; es por ello que esta siendo considerada en un gran número de investigaciones recientes. Finalmente, se ha mencionado algunos descriptores que procesan el color y textura en forma conjunta, siendo el descriptor “MTH” uno de los más representativos por los resultados demostrados [Liu et al., 2010]..

(42) Capítulo 3 Análisis de Textura con Textones. 3.1.. Consideraciones Iniciales. La caracterización de imágenes utilizando unidades elementales o patrones que comparten propiedades comunes sobre toda la imagen ha permitido obtener buenos resultados en la clasificación de imágenes sobre todo cuando éstas son naturales [Liu et al., 2010] [Liu and Yang, 2009], sin embargo, la definición del texton, su estructura, así como el mapeo de las características de bajo nivel de textura y color hacia los textones siguen siendo un desafío y necesitan ser estudiados más profundamente. A lo largo de este capítulo se ofrece una revisión bibliográfica de diferentes investigaciones que se basan en el uso de los textones como descriptor, especialmente el descriptor Histograma Multitexton sobre el cual se sustenta el presente trabajo de investigación.. 3.2.. Textones. Muchos investigadores han demostrado que es difícil obtener efectos satisfactorios en el análisis de una imagen usando sólo algoritmos simples basados en píxeles [Liu and Yang, 2008], por lo cual, la textura de una imagen puede ser descompuesta en unidades elementales a las que se les denomina texton [Julesz, 1981] [Julesz, 1986] o texel. El concepto de texton fue propuesto por Joules, [Julesz, 1981], hace más de 30 años; desde entonces es un concepto muy usado en el análisis de la textura 1 de las imágenes. 1 Basados. en la teoría de textones, la textura puede ser descompuesta en unidades elementales, clases de textones de colores, bloques alargados de anchos específicos, ratios y aspectos de orientación y las terminaciones de manchas alargadas. 25.

Figure

Cuadro 2.1: Modelos para el análisis de textura de las imágenes Modelo Procedimiento
Figura 3.2: Local Binary Pattern y la medida de contraste C (a) Grid (b) Ejemplo (c) Máscara (d) Pesos (e) Cálculo de la medida de constraste
Figura 3.7: Representación de características mediante diferencia de colores (a) Imagen original (b) Distribución de la imagen en grid de 2x2 (c) Localización de textones y tipos de textones (d) Seteando en 0 las zonas correspondientes a los textonres (e)
Figura 3.12: Proceso de formación de la matriz texton (a) Matriz de la Imagen original (b) Cinco textones propuestos (c) y (d) Ubicando textones (e) Matriz Texton
+7

Referencias

Documento similar

The aim of this paper is to provide adaptive morphological filters whose structuring elements are spatially-variant based on the information given by a multiple orientation

3.. after this introduction, Section 2 contains the theoretical part of the paper. Firstly, in Section 2.1 the proposed frame- work to estimate multiple orientations is detailed.

En nuestro caso, usamos una cámara térmica sin refrigeración (FLIR E60). Los datos de salida de este tipo de cámaras son normalmente imágenes en escala de grises con profundidades de

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

Estudiar la viabilidad de un método híbrido con estas características sintácticas y las de bajo nivel (del KMCC-T) es la motivación principal de este capítulo y uno de

A la vista de los resultados, la configuración óptima para el sistema de detección de pájaros en las imágenes de la base de datos es el empleo de una red ResNet-50-FPN que a su

Sin embargo, destacamos la mejora obtenida aplicando el modelo neuronal sobre la representación en el cuello de botella; estos errores son menores que los obtenidos mediante el

Content Adaptation, Image browsing, Image to Video transmoding, Regions of Interest (ROIs), Information fidelity, Visual attention model, Browsing path, Simulated camera