Estudio de la estructura anatómica que conforma la madera mediante análisis multiresolución y morfología
72
0
0
Texto completo
(2) ii.
(3) Agradecimientos Agradecemos primeramente a nuestras familias quienes siempre nos han apoyado, especialmente durante el ciclo universitario, de manera incondicional e incesante. A nuestros compañeros y amigos quienes en cada etapa nos han acompañado y de los cuales hemos aprendido enseñanzas invaluables en el ámbito personal y académico, y finalmente al docente Rodrigo Herrera, quien además de motivarnos a desarrollar este proyecto estuvo guiándonos para poder culminar satisfactoriamente el estudio que aquı́ se presenta.. iii.
(4) iv.
(5) v. Resumen La identificación de una especie maderera requiere un análisis de las caracterı́sticas macroscópicas y microscópicas de una muestra. En el caso de las maderas latifoliadas existen 4 tipos de elementos que componen su estructura: los vasos o poros, el parénquima, los radios y la fibra. En este trabajo se presenta el desarrollo y posterior estudio de un modelo de segmentación de los poros en fotografı́as que representan muestras microscópicas de maderas, en el corte transversal, usando únicamente análisis multiresolución y operaciones morfológicas. Inicialmente se realiza una adecuación y un preprocesamiento a las imágenes con el propósito de mejorar los resultados del modelo. En esta etapa se aplican el recorte sobre las imágenes, la conversión de color a escala de grises y el filtrado gaussiano. Después se emplea la transformada wavelet para realizar un análisis multiresolución. Al usar esta transformación se generan matrices que describen numéricamente la diferencia de los pı́xeles adyacentes que componen los elementos presentes en las imágenes. Sobre estas matrices se realiza un análisis estadı́stico que permita segmentar parcial o totalmente los objetos buscados. Luego, se hace uso de operaciones morfológicas y operaciones lógicas para eliminar los objetos no deseados. Con las matrices obtenidas se hace una reconstrucción de la imagen original usando la transformada inversa de wavelet, y finalmente se evalúan los resultados obtenidos. Se obtuvieron dos conjuntos de resultados para la evaluación. El primero de ellos incluyó todas las imágenes, incluso las que tenı́an defectos en la muestra o errores en la captura. El segundo omitió esas imágenes ya que, a nuestro criterio, no eran aptas para el estudio. Respecto al primer conjunto, con el segundo se obtuvieron resultados más satisfactorios, los cuales en su mayorı́a, tenı́an un valor superior al 80 % del F1 Score, medida que se usó para evaluar el modelo..
(6) vi. Abstract The microanatomy structure of wood is composed by 4 types of cells: vessels or pores, the parenchyma, the spokes and the fiber. Its form, deposition and texture can tell us what the species to wich is it belongs. Its characteristics are studied through a sample taken from the outer part of the wood. The sample represents three planes, wich provide different information about the cells: transverse, tangencial and radial. These planes can be represented in photographs taken from a microscope to be treated as images and be processed. Some works have segmented elements to be able to identify wood with image processing. This work makes a study of a segmentation model, based on multiresolution analysis and morphological operations, using the transversal plane. Starting with the adaptation of the images and using gaussian filter, the decomposition of the image is done using wavelet transform to find the details that make the features and segment the cells. With morphological operations, noise and unwanted elements are eliminated, and finally the images are reconstructed using the wavelet inverse transform. Two sets of results were obtained for the evaluation. The first one included all the images, even those with defects in the sample or errors in the capture. The second one omitted those images which, according to our criteria, were not suitable for study. In comparison to the first set, the second had a more successful result, which mostly was a value greater than 80 % of the F1 Score, a measure that was used for evaluating the model..
(7) Índice general. (1). Índice general Índice de figuras . . . . . . . . . . . . . . . . . . . . . . . . . .. IX. Índice de cuadros . . . . . . . . . . . . . . . . . . . . . . . . . .. XII. 1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. 2 Estado del arte . . . . . . . . . . . . . . . . . . . . . 2.1 Caracterización microanatómicas de maderas . . . . 2.2 Caracterización microanatómica de radios . . . . . . 2.3 Análisis multiresolución en imágenes de maderas . .. . . . .. . . . .. . . . .. . . . .. 6 6 7 8. 3 Marco teórico . . . . . . . . . . . . . . . . . . . . . . 3.1 Anatomı́a de las maderas latifoliadas . . . . . . . . . 3.2 Análisis multiresolución . . . . . . . . . . . . . . . . 3.2.1 Trasformada wavelet . . . . . . . . . . . . . . 3.2.2 Transformación wavelet discreta (DWT) . . .. . . . . .. . . . . .. . . . . .. . . . . .. 9 9 16 16 17. 4 Metodologı́a . . . . . . . . . . . . . . . . . . . . . . . . . . .. 22. 5 Desarrollo . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Acondicionamiento de las imágenes . . . . . . . . . . 5.2 Preprocesamiento de las imágenes . . . . . . . . . . 5.3 Análisis multiresolución . . . . . . . . . . . . . . . . 5.4 Histogramas de las matrices de detalle . . . . . . . .. 24 25 26 27 31. . . . . .. . . . . .. . . . . .. . . . . .. vii.
(8) viii 5.5 5.6. ÍNDICE GENERAL Binarización de las matrices de detalle . . . . . . . . . . . . Operaciones lógicas y operaciones morfológicas . . . . . . .. 6 Resultados . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Sensibilidad o recall . . . . . . . . . . . . . . . . . . 6.2 Valor predictivo positivo o precisión . . . . . . . . . 6.3 F1 Score . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Selección del intervalo de binarización . . . . . . . . 6.5 Discusión . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . .. . . . . . .. . . . . . .. 32 34. . . . . . .. 40 43 43 44 44 46. 7 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . .. 56. Bibliografı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 65.
(9) Índice de figuras. Índice de figuras 1.1 1.2. Maderas conı́fera y latiofoliada. La principal diferencia entre ambas se centra en los poros; la conı́fera carece de ellos.1 . . Tipos de cortes de la madera; en la parte superior el corte transversal, en el medio el tangencial y en la parte inferior el radial.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Imagen microscópica de la madera vista desde el corte transversal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Tipos de radios: A) homogéneos; B) heterogéneos. . . . . . 3.3 Agrupamiento de los poros desde el corte transversal: A) solitarios; B) múltiples; C) arracimados. . . . . . . . . . . . 3.4 Orientación de los poros desde el corte transversal: A) radial; B) bandas tangenciales; C) diagonal. . . . . . . . . . . . . . 3.5 Ejemplos de parénquima axial apotraqueal. . . . . . . . . . 3.6 Ejemplos de parénquima axial en bandas. . . . . . . . . . . 3.7 Ejemplos de parénquima axial paratraqueal. . . . . . . . . . 3.8 Señales wavelet madre más comunes. . . . . . . . . . . . . . 3.9 Representación esquemática del análisis multiresolución de una señal utilizando la DWT. . . . . . . . . . . . . . . . . . 3.10 Mosaico del espacio de frecuencias que corresponde al árbol de estructura de la Figura 3.11 . . . . . . . . . . . . . . . . 3.11 Representación wavelet en forma de árbol de una imagen del banco de muestras. . . . . . . . . . . . . . . . . . . . . . . .. 2. 3. 3.1. 5.1. Imágenes tomadas de la base de datos de la Universidad Distrital. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 10 11 12 13 14 15 15 17 18 20 21. 25 ix.
(10) ÍNDICE DE FIGURAS. x 5.2 5.3. 5.4. 5.5. 5.6. 5.7. 5.8. 5.9. Resultado de acondicionar las imágenes presentadas en la Figura5.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . En la imagen superior izquierda el daño en un poro causado al extraer la muestra y al costado derecho la misma imagen filtrada; en la imagen inferior izquierda el daño sufrido por la muestra debido a un factor externo y al derecho el filtrado de esta. Se observa que al filtrar la imagen, los defectos presentes en cada una de las muestras se difuminan un poco. Matrices de coeficientes representadas como imagen tras aplicar la transformación wavelet. En la parte superior izquierda se representa la matriz de aproximación y en las posteriores se representan los detalles, todos como imagen; la parte superior derecha corresponde a los detalles horizontales, la inferior izquierda a los verticales y la restante a los diagonales. Comparación del mismo objeto en los detalles horizontales entre el primer y el cuarto nivel de la transformación wavelet, respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . Matrices obtenidas al aplicar el cuarto nivel de wavelet ilustradas como imagen. Respecto a las matrices presentadas en el primer nivel, se observa una reducción en los detalles que definen al objeto; esto hace que las regiones pequeñas de pı́xeles, como las que corresponden al parénquima, se hagan despreciables respecto a las regiones grandes. . . . . . . . . En azul se presenta el histograma de los detalles horizontales para el cuarto nivel de wavelet. En color rojo se marca el intervalo de selección de los valores. . . . . . . . . . . . . . Al costado izquierdo una imagen binaria que representa la binarización de la matriz de detalle horizontal; al costado derecho la imagen original. En color se encierran las mismas regiones en cada imagen, donde una contiene las zonas que presentan poca variación entre los valores adyacentes en la matriz y en la otra los poros, respectivamente. . . . . . . . Resultado de aplicar la conjunción (operación de intersección) entre las imágenes binarias presentadas en la Figura 5.8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26. 27. 28. 29. 30. 31. 32. 33.
(11) ÍNDICE DE FIGURAS 5.10 Matrices resultantes de los diferentes niveles de wavelet. En la parte superior izquierda la obtenida en el primer nivel, a la derecha la obtenida en el segundo nivel, en la parte inferior izquierda la obtenida en el tercer nivel y la restante en el cuarto nivel. . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.11 Semilla e imagen a la que se aplica el algoritmo de llenado respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . 5.12 Resultado de la aplicación del algoritmo morfológico de llenado a los poros segmentados. . . . . . . . . . . . . . . . . . 5.13 Matriz obtenida al eliminar los objetos cuya área está conformada por menos de 250 pı́xeles en la imagen presentada en la Figura 5.12. . . . . . . . . . . . . . . . . . . . . . . . 5.14 Imagen resultante de aplicar el modelo sobrepuesta a la original. Las zonas negras corresponden a la segmentación obtenida por el modelo. . . . . . . . . . . . . . . . . . . . . . . 6.1. 6.2. 6.3. 6.4. 6.5. 6.6. Valores promedios de la sensibilidad (S) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . Valores promedios del valor predictivo positivo (V P P ) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma. . . . . . . . . . . . . . . . . . . Valores promedios del F1 Score (F ) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultado para una de las muestras de la especie Xylosma spiculifera (Tul.) Triana & Planch. La falta de enfoque en la imagen provocó que no se detectaran la mayorı́a de los poros. Resultado para una de las muestras de la especie Morella parvifolia (Benth.) Parra-O. Un corte que atraviesa varios poros afectó su forma dificultando la correcta segmentación de las células. . . . . . . . . . . . . . . . . . . . . . . . . . Resultado para una de las muestras de la especie Morella parvifolia (Benth.) Parra-O. El tamaño de algunas células produjo que el algoritmo las detectara como poros, cuando en realidad no lo son. . . . . . . . . . . . . . . . . . . . . .. xi. 35 36 37. 38. 39. 46. 47. 48. 50. 51. 52.
(12) Índice de cuadros. Índice de cuadros 6.1 6.2. 6.3. xii. Algunos datos hallados de la matriz de confusión para cada una de las especies madereras. . . . . . . . . . . . . . . . . . Valores promedios por especies para la sensibilidad, el valor predictivo positivo y el F1 Score. En cada familia se muestra el valor mı́nimo, el promedio y el máximo para cada uno de los cálculos. . . . . . . . . . . . . . . . . . . . . . . . . . . . Cálculos realizados sobre las familias madereras, excluyendo aquellas imágenes que presentaban defectos en la muestra o que tenı́an errores al momento de tomar la fotografı́a. . . .. 42. 49. 54.
(13) Capı́tulo 1. Introducción. Capı́tulo 1. Introducción Desde el descubrimiento del fuego, la madera ha sido una de las materias primas fundamentales en el desarrollo del hombre. Ya sea como fuente de combustible, material de construcción (por ejemplo, edificaciones, medios de transporte, carpinterı́a, entre otros) o elaboración de pulpa para fabricar papel, la industria maderera es uno de los sectores económicos con mayor impacto a nivel mundial. La ubicación geográfica y el medio ambiente en el que se desarrolla una especie arbórea influyen en su estructura celular y anatómica. Según su estructura celular, existen dos tipos de especies de madera: las conı́feras, las cuales se desarrollan en las zonas templadas y polares del planeta; y las latifoliadas, las cuales se desarrollan en las zonas tropicales e intertropicales. A diferencia de las conı́feras, la estructura anatómica de las latifoliadas posee adicionalmente vasos (también llamados poros), los cuales realizan la función conductora de lı́quidos, y fibras, que contribuyen al sostén del árbol. En la Figura 1.1 se observa la diferencia anatómica de ambos tipos de madera, donde se evidencia la carencia de poros en las maderas conı́feras.[1] Debido a su posición geográfica, los paı́ses latinoamericanos poseen valiosos recursos forestales, ya que cuentan con maderas latifoliadas y conı́feras. Estos recursos contribuyen al desarrollo económico de los paı́ses y su bienestar social, y debido a que son recursos renovables, también promueven el cuidado medio ambiental. Sin embargo, en algunos de estos paı́ses la información forestal es escasa o equı́voca, y esto genera que las actividades del hombre ocasionen daño a los bosques y al ecosistema[2]; tal como ocurre 1.
(14) Capı́tulo 1. Introducción en Colombia, donde la deforestación aumentó un 23 % entre los años 2016 y 2017.[3]. Figura 1.1: Maderas conı́fera y latiofoliada. La principal diferencia entre ambas se centra en los poros; la conı́fera carece de ellos.1. En Colombia, el 51,35 % de la superficie está cubierta por bosques naturales, concentrada principalmente en la cuenca del Amazonas y ChocóDarién. Cerca de la mitad de los bosques naturales del paı́s se encuentran en territorios indı́genas, comunidades afrodescendientes y comunidades campesinas. Gran parte de estas zonas se caracterizan por la pobreza, la falta de gobierno, la incursión armada ilegal y la violencia. Como consecuencia de éstas caracterı́sticas, la tala ilegal es una actividad constante en el comercio nacional (para la exportación de la madera se realizan controles exhaustivos, por lo cual las maderas ilegales se comercializan, casi en su totalidad, dentro del paı́s).[4] En el año 2006, las cifras del Banco Mundial indicaban que de la madera que se explota, transporta y comercializa, el 42 % corresponde a tala ilegal. Sin embargo, la WWF (World Wildlife Fund ) hizo un señalamiento en el que indica que la cifra corresponde a un 75 % aproximadamente. Ası́ 1. Imagen tomada de http://www.monografias.com/trabajos75/manual-identificacionmaderas-forestales/manual-identificacion-maderas-forestales2.shtml. 2.
(15) Capı́tulo 1. Introducción mismo, un informe publicado por la WWF en el mismo año indica que el comercio de madera ilegal llega a generar ganancias de hasta 7000 millones de dólares.[5]. Figura 1.2: Tipos de cortes de la madera; en la parte superior el corte transversal, en el medio el tangencial y en la parte inferior el radial.2. Entre los años 2012 y 2014 se realizaron decomisos de madera transportada de forma ilegal donde habı́a alrededor de 273000 m3 de madera. Sin embargo, entre los años 2008 y 2012 se produjeron en promedio 4250000 m3 de madera por año (65 % de latifoliadas y 32 % de conı́feras). Comparando estos datos, es evidente que los controles en el tema maderero son escasos aunque exista una reglamentación sobre el mismo. 2. Imagen tomada de http://www.ebah.com.br/content/ABAAABTdwAA/caracterizacaofisica-desengrosso-pinho. 3.
(16) Capı́tulo 1. Introducción Una de las principales causas de la ineficiencia en los controles sobre la tala ilegal de maderas, es porque en la mayorı́a de ellos la policı́a carece de expertos en el tema que puedan determinar con claridad si las maderas que son transportadas están permitidas talar o no en la región o paı́s. Además de ello, se suma el hecho que para realizar la identificación de la especie maderera se requiere tomar una muestra del tronco y enviarla al laboratorio. A la porción de madera se le aplican las pruebas pertinentes y se determina el tipo de madera, aunque este proceso llega a tardar desde unos dı́as hasta semanas. Adicionalmente, durante este proceso deben considerarse los costos y el tiempo que tarda la muestra en ser transportada. Un método actual para la identificación de la especie maderera consiste en extraer una muestra en forma cúbica con unos cortes ya definidos para su posterior estudio. En la Figura 1.2 se observan los tres tipos de corte: el corte transversal es aquel perpendicular al eje del tronco del árbol; el corte radial está orientado en dirección paralela al eje del árbol, cortando perpendicularmente a los anillos de crecimiento; y el corte tangencial, el cual se orienta de forma paralela al eje del árbol, tangente a los anillos de crecimiento y perpendicular a los radios. Esta muestra se envı́a a un laboratorio, donde se estudia la superficie de cada uno de los cortes realizados para observar la estructura microanátomica de la madera y poderla identificar. En las maderas latifoliadas, los elementos presentes son 4 tipos: los poros, el parénquima axial, el parénquima radial y las fibras. En cada corte se pueden apreciar caracterı́sticas diferentes de los elementos que varı́an según la especie. Las caracterı́sticas más importantes a tener en cuenta para realizar la identificación de la especie arbórea son la forma, el tamaño, el aspecto, la disposición y la manera en que se agrupan.[6] Actualmente, la Universidad Distrital Francisco José de Caldas cuenta con un banco de imágenes correspondientes a muestras de maderas latifoliadas. Utilizando estas muestras y aplicando procesamiento computacional, se podrı́a diseñar un modelo que sirva como base para la construcción, a futuro, de una herramienta que identifique las especies de maderas de manera autónoma. La pregunta que deseamos resolver con nuestro proyecto de grado es: ¿qué tan preciso es un modelo, basado en el análisis multiresolución, para segmentar los elementos, particularmente los poros, que componen una 4.
(17) Capı́tulo 1. Introducción muestra de madera latifoliada empleando el corte transversal?. 5.
(18) Capı́tulo 2. Estado del arte. Capı́tulo 2. Estado del arte Existen varios trabajos realizados sobre segmentación de elementos en maderas conı́feras, pero sobre maderas latifoliadas son escasos; esto se debe a que la segmentación en éstas es mucho más compleja. Además, en la mayorı́a de trabajos sobre maderas latifoliadas no solo se usan herramientas del procesamiento digital de imágenes, sino también algunas de las de inteligencia computacional. En este apartado se mencionarán únicamente aquellos trabajos que involucran solo herramientas del procesamiento digital de imágenes. A continuación se presentan tres trabajos, desarrollados por estudiantes de la Universidad Distrital Francisco José de Caldas, sobre imágenes que representan muestras microanatómicas de madera. Cada uno de los trabajos se enfoca en la segmentación de uno o varios elementos que componen la madera usando diferentes herramientas del procesamiento digital de imágenes. El segundo trabajo lo desarrollan usando el corte tangencial, mientras que los otros dos lo hacen sobre el transversal.. 2.1.. Caracterización microanatómicas de maderas. [7] Este trabajo desarrolla un novedoso sistema que permite obtener caracterı́sticas microanatómicas de 5 especies madereras diferentes, segmentando los elementos a través del procesamiento digital de imágenes. 6.
(19) Capı́tulo 2. Estado del arte Inicialmente se hace un preprocesamiento de la imagen para corregir iluminación no uniforme y aumentar el contraste, usando filtrado homomórfico y análisis multiescala. Ası́ mismo, se corrigen problemas de ruido inherentes al proceso de captura de las muestras. Después se evalúan distintos métodos de segmentación para cada elemento en cuestión. Las principales herramientas usadas para la segmentación son operaciones morfológicas, los algoritmos de k-medias y de agrupamiento por desplazamiento medio, los filtros homomórfico y de Gabor, la transformada wavelet, contornos activos y el muestreador de Gibbs. La precisión alcanzada en la segmentación es del 90 %. Con los elementos separados se realizó un proceso de caracterización, entregando 12 caracterı́sticas de la muestra estudiada, logrando una tasa de acierto cercana al 80 %.. 2.2.. Caracterización microanatómica de radios en la sección tangencial de maderas. [8] Este trabajo plantea un método para la segmentación microanatómica de radios en la sección tangencial de maderas, que utiliza técnicas de procesamiento digital de imágenes. Primero se corrige la iluminación no uniforme presente en las imágenes aplicando filtrado homomórfico y análisis multiescala. Luego, se realiza la segmentación utilizando el Filtro de Gabor, métodos de agrupamiento, morfologı́a matemática y contornos activos. Después, se utilizan los resultados obtenidos en la segmentación para medir ocho caracterı́sticas microanatómicas; para esto se emplean nuevamente técnicas de procesamiento de imágenes tales como transformada watersheed, métodos de agrupamiento, entre otras. La validación de los resultados se hace tomando como referencia las imágenes segmentadas manualmente comparándolas con las obtenidas por el método. El error promedio en la segmentación es de 12 % y la caracterización, también comparada con la obtenida manualmente, presenta una precisión cercana al 80 %. 7.
(20) Capı́tulo 2. Estado del arte. 2.3.. Estudio de la segmentación de imágenes de microestructura anatómica de la madera mediante el análisis multiresolución. [9] Este trabajo presenta un método para segmentar los poros en imágenes microanatómicas de la madera. La metodologı́a planteada se divide en 3 partes: la umbralización estadı́stica, las caracterı́sticas que varı́an con las resoluciones y las regiones ambiguas. En la primera parte se aplica un análisis multiresolución que descompone la imagen en matrices numéricas. Posteriormente se hallan los histogramas de cada una de las matrices y se hace un recorte del 60 % de la desviación estándar sobre la media. Luego se analizan las caracterı́sticas que varı́an respecto al nivel de resolución y que son crı́ticas para realizar la segmentación de las células en cuestión. Estas caracterı́sticas son la conectividad, la densidad y la forma. Finalmente se hace distinción de las regiones ambiguas que aparecen en el proceso de segmentación de poros, sobre las cuales se hace un estudio para explicar por qué aparecen.. 8.
(21) Capı́tulo 3. Marco teórico. Capı́tulo 3. Marco teórico Para el estudio de un modelo capaz de segmentar los elementos de una muestra microscópica de madera utilizando análisis multiresolución, se deben considerar las teorı́as necesarias para poder realizar la caracterización de la muestra y, a partir de esta, diseñar el modelo. Es por esto que la sección abarca dos apartados donde se pretende mostrar los conceptos básicos para el desarrollo del estudio. El primer apartado trata sobre la anatomı́a de las maderas latifoliadas y su composición anatómica; el segundo muestra las herramientas de procesamiento para la implementación del análisis multiresolución en las imágenes.. 3.1.. Anatomı́a de las maderas latifoliadas. La estructura interna de las maderas latifoliadas resulta más compleja y especializada que en el caso de las conı́feras; esto se debe principalmente a que en las maderas latifoliadas aparece un tipo de células conocidas como poros. Sin embargo, el hecho que posea este tipo de células resulta en una caracterı́stica adicional que es muy útil para la clasificación según la familia. [10] La estructura de las maderas latifoliadas se componen principalmente por: Parénquima radial (conocidos como radios) Vasos o poros 9.
(22) Capı́tulo 3. Marco teórico Parénquima axial Fibras. Figura 3.1: Imagen microscópica de la madera vista desde el corte transversal.. La Figura 3.1 es una imagen tı́pica del corte transversal de una madera latifoliada. En esta se aprecian las células previamente mencionadas; las que se asemejan a una circunferencia y se ven en la imagen de color oscuro corresponden a los poros; las que se ubican en posición vertical y atraviesan la imagen son los radios; las que rodean los poros y tienen orientación horizontal son el parénquima axial; el resto de la imagen corresponde principalmente a fibra.. Radios Su función es almacenar y conducir de manera transversal las sustancias nutritivas. Presentan gran variedad de formas, tamaños y número de células que los componen. En las maderas latifoliadas, los radios se caracterizan 10.
(23) Capı́tulo 3. Marco teórico por ser finos y se observan sólo como lı́neas muy delgadas y claras en el plano transversal.. Figura 3.2: Tipos de radios: A) homogéneos; B) heterogéneos.. Los radios pueden ser: Homogéneos: Formados por un único tipo de células. Heterogéneos: Formados por más de un tipo de células. En la Figura 3.2 se observan los tipos de radios mencionados. Tanto en A) como en B) se observa al costado izquierdo los radios vistos desde el corte tangencial y al derecho los radios vistos desde el corte radial.. Poros Los poros son el elemento vascular del árbol ya que se encargan de la circulación de sustancias. Los poros tienen un diámetro que varı́a desde 20 µm hasta 500 µm dependiendo la especie, y junto con su distribución, abundancia y agrupamiento resultan en una importante caracterı́stica para la identificación de la familia. De acuerdo a su agrupamiento los poros pueden ser de tres tipos: Solitarios: Cuando un porcentaje igual o superior al 90 % de los poros se presentan completamente rodeados por otros elementos. 11.
(24) Capı́tulo 3. Marco teórico Múltiples: Cuando se unen dos o más poros, haciendo contacto por sus caras tangenciales y presentando un achatamiento que los hace parecer subdivisiones de un solo poro. Arracimados: Cuando se amontonan tres o más poros haciendo contacto por sus caras radiales y tangenciales.. Figura 3.3: Agrupamiento de los poros desde el corte transversal: A) solitarios; B) múltiples; C) arracimados.. En la Figura 3.3 se muestran tres imágenes que representan cada uno de los tipos de agrupamiento presente en los poros vistos desde el corte transversal. De acuerdo con el comité IAWA3 (1989), en maderas tropicales el agrupamiento más común para los poros es múltiple de 2 a 4, mezclado con una proporción variable de poros solitarios, pudiendo además, encontrarse mezclados poros múltiples con arracimados. El patrón de orientación de los poros en el plano transversal puede ser: Radial: cuando la orientación es paralela a los radios. 3. 12. International Association of Wood Anatomists..
(25) Capı́tulo 3. Marco teórico En bandas tangenciales: orientados aproximadamente paralelos a los anillos de crecimiento y perpendiculares a los radios, formando bandas. Diagonal: cuando los poros se presentan de manera intermedia entre una orientación radial y una tangencial.. Figura 3.4: Orientación de los poros desde el corte transversal: A) radial; B) bandas tangenciales; C) diagonal.. En la Figura 3.4 se pueden ver las diferentes orientaciones que presentan los poros. Éstas orientaciones ocurren frecuentemente combinadas, pudiendo encontrarse orientaciones intermedias entre la tangencial y la diagonal. También ha sido posible observar que maderas con vasos orientados en bandas tangenciales, frecuentemente presentan vasos agrupados (IAWA, 1989).. Parénquima axial También se conoce como parénquima longitudinal. Desempeña la función de almacenamiento en el leño y normalmente en mayor proporción en latifoliadas que en conı́feras. Las células de este tejido son, por lo general, 13.
(26) Capı́tulo 3. Marco teórico. Figura 3.5: Ejemplos de parénquima axial apotraqueal.. de color más claro debido a sus paredes celulares más delgadas. Se han definido tres grandes grupos de parénquima axial: Apotraqueal: cuando las células del parénquima se encuentran entre un 90 % y 95 % aisladas de los poros, sin rodearlos ni entrar en contacto con los mismos (ver Figura 3.5). En bandas: cuando las células del parénquima forman bandas con una extensión variable, que pueden estar en contacto con los poros, y siempre son perpendiculares a los radios (ver Figura 3.6). Paratraqueal: cuando entre el 90 % y el 95 % de las células del parénquima se encuentran rodeando parcial o totalmente los poros (ver Figura 3.7).. Fibra Las fibras son un tipo de célula propia de las maderas latifoliadas, que se caracterizan por ser células alargadas y estrechas. constituyen el mayor 14.
(27) Capı́tulo 3. Marco teórico. Figura 3.6: Ejemplos de parénquima axial en bandas.. porcentaje del leño ya que es todo aquello que no son poros, radios y parénquima axial. Cumplen la función de dar resistencia mecánica al cuerpo. Figura 3.7: Ejemplos de parénquima axial paratraqueal.. de la planta; su volumen y espesor influyen directamente en el peso. 15.
(28) Capı́tulo 3. Marco teórico. 3.2.. Procesamiento de las imágenes utilizando Análisis Multiresolución. Para poder identificar los tipos de células en las muestras microscópicas representadas en imágenes, es necesaria una herramienta que permita visualizar los detalles dentro de la imagen. El análisis multiresolución, conocido por sus siglas en inglés MRA4 , consiste en la representación de una señal (en este caso imágenes) en otros dominios diferentes al espacio para poder examinar su composición y ası́ estudiar la información que contiene.[12] Esta herramienta puede utilizar cualquier tipo de transformación o proyección espacial; sin embargo, para este trabajo es de mayor utilidad la transformación discreta wavelet DWT 5 , la cual por medio de escalado y desplazamiento permite realizar la descomposición de una señal en un conjunto de funciones representadas en una base wavelet ortonormal.. 3.2.1.. Trasformada wavelet. Una wavelet es una señal generada a partir del escalado y desplazamiento de una señal ψ(t), llamada wavelet madre y está definida por: 1 ψs,τ (t) = √ ψ s. . t−τ s. ,. (3.1). donde s es el factor de escala, y τ es el factor de desplazamiento. Las señales wavelet se caracterizan por estar bien localizadas en tiempo y frecuencia. Esto resulta útil ya que hace posible trasladar la señal a lo largo del dominio del tiempo, lo que otorga una mayor precisión en la representación de una señal y por lo tanto una mejor resolución en el tiempo; contrario a la transformación de Fourier, la cual emplea señales sin(x) y cos(x) de longitud infinita para descomponer una señal. Existe una gran variedad de señales wavelet, las cuales se agrupan en familias según sus caracterı́sticas y se escogen dependiendo de la señal y el tipo de análisis que se vaya a realizar. En la Figura 3.8 se muestran algunos ejemplos de las señales wavelet más utilizadas. 4 5. 16. Multi-Resolution Analysis. Discrete Wavelet Transform..
(29) Capı́tulo 3. Marco teórico. Figura 3.8: Señales wavelet madre más comunes.. La transformada wavelet está definida como la descomposición de una señal f (t) en una base de funciones wavelet ψs,τ (t). Esta se define como: Z wf (s, τ ) =. ∗ f (t)ψs,τ (t)dt. (3.2). La transformada permite realizar una proyección en un subespacio vectorial (en este caso el subespacio genera la base de funciones wavelet), en el cual se puedan visualizar otros elementos de la señal que no son muy claros en su representación original. La transformada wavelet es eficiente en el análisis local de la señal ya que la proyección se hace en tiempo o espacio.. 3.2.2.. Transformación wavelet discreta (DWT). Para facilitar la utilidad de la transformada wavelet en imágenes es recomendable utilizar su versión discreta, ya que los datos representados en las imágenes son de carácter discreto, y si bien se puede realizar el análisis con la transformada en su versión continua obteniendo resultados más completos, resulta mucho más sencillo y práctico trabajar con la DWT. 17.
(30) Capı́tulo 3. Marco teórico La discretización de la transformada wavelet consiste en muestrear los parámetros de desplazamiento τ y escalado s. Para evitar que, al representar la traslación de una función wavelet sobre la señal se obtengan representaciones diferentes, por convención se define que s tome valores de escala 2l , creando ası́ las wavelets diádicas. Al ser un muestreo discreto de la wavelet, por convención, el paso de muestreo es ∆τ = 1. Para que el desplazamiento suceda en valores enteros, el parámetro de desplazamiento debe ser un múltiplo entero del factor de escala. τ = (k − 1)s = (k − 1)2l , k = 1, 2, 3.... (3.3). La manera efectiva de implementar la DWT es a través del algoritmo de Mallat, el cual se puede entender como una representación piramidal de diferentes niveles, en la que el nivel más básico es la señal o la imagen original y conforme se asciende de nivel, las aproximaciones tienen cada vez menor resolución espacial. En la práctica es equivalente a ingresar una señal en un banco de filtros multitasa, donde una señal S de tamaño N , pasa por dos filtros, uno pasabajo llamado G y uno pasaalto llamado H. Esto se hace porque la aplicación de los filtros tiene un comportamiento similar a la correlación hecha cuando se aplica la transformación wavelet. Por eso no se habla como tal de la convolución de dos señales, sino de una pseudoconvolución. Los parámetros definidos para cada filtro dependen de la función wavelet madre que se vaya a emplear en el análisis.. Figura 3.9: Representación esquemática del análisis multiresolución de una señal utilizando la DWT.. Al pseudoconvolucionar la señal de entrada con el filtro H se obtiene 18.
(31) Capı́tulo 3. Marco teórico una señal de un subespacio vectorial denominado D1 , la cual corresponde a los coeficientes de detalle. Del mismo modo, al pseudoconvolucionar la señal de entrada con el filtro G se obtiene una señal de un subespacio vectorial A1 , la cual corresponde a los coeficientes de aproximación. Los nuevos subespacios D1 y A1 , de tamaño N/2, son la representación de la señal original S de tamaño N . Dado que el contenido frecuencial de los subespacios generados son el resultado de un submuestreo por un factor de 2 (transformación wavelet diádica), cada proyección cuenta con un reajuste en la longitud a N/2; por consiguiente, para reconstruir la señal original a partir de lo anterior, se necesita remuestrear al doble de la frecuencia.. Uso de la transformada wavelet para el procesamiento digital de imágenes Una imagen se puede definir como una señal bidimensional representada por una función f (x, y), donde x y y son coordenadas en un plano espacial, y la amplitud de f en un par de coordenadas (x, y) es llamada la intensidad o el nivel de gris de la imagen en ese punto. Cuando los valores de x, y y la amplitud de f son valores finitos que se pueden representar en cantidades discretas, podemos hablar de una imagen digital. Los elementos que componen una imagen, los cuales tienen una posición y un valor de intensidad, son llamados pı́xeles. [11] Ahora, teniendo en cuenta lo mencionado en el párrafo anterior, para implementar el algoritmo de Mallat en una imagen se pueden crear cuatro diferentes combinaciones de un filtro pasabajo y uno pasaalto: 1. Usar el filtro pasabajo (BB) a lo largo de los dos ejes. 2. Usar el filtro pasaalto a lo largo del eje x y el pasabajo (BA) a lo largo del eje y. 3. Usar el filtro pasaalto a lo largo del eje y y el pasabajo (AB) a lo largo del eje x. 4. Usar el filtro pasaalto (AA) a lo largo de los dos ejes. Esto resulta en que, en lugar de dividir la imagen en dos componentes, se divide en cuatro componentes. A diferencia del procesamiento de señales, 19.
(32) Capı́tulo 3. Marco teórico ωy. ωx. Figura 3.10: Mosaico del espacio de frecuencias que corresponde al árbol de estructura de la Figura 3.11. en el procesamiento de imágenes se puede sacar provecho de la información extraı́da de cada uno de sus componentes, utilizando la expansión de wavelets empaquetadas [13]. Las wavelets empaquetadas permiten realizar una ampliación sobre cualquier componente, analizando en cada nivel la banda con la energı́a más alta. El árbol que se construye de esa manera es llamado el árbol de estructura. La Figura 3.10 muestra un ejemplo del mosaico del espacio de frecuencias que corresponde al árbol de estructura mostrado en la Figura 20.
(33) Capı́tulo 3. Marco teórico Imagen original. BB BA. AB. AA. BB BA. AB. AA. BB BA ABAA Figura 3.11: Representación wavelet en forma de árbol de una imagen del banco de muestras.. 3.11.. 21.
(34) Capı́tulo 4. Metodologı́a. Capı́tulo 4. Metodologı́a Para la segmentación6 de los objetos correspondientes a poros y radios en las imágenes microscópicas de la madera se realiza el análisis multiresolución, el cual permite estudiar de mejor manera la composición de los pı́xeles que corresponden a los objetos en cuestión. Este análisis permite descomponer una imagen en señales que posibilitan realizar un estudio en diferentes escalas y de manera más sencilla que sobre la imagen original (en el caso de imágenes, las señales obtenidas son matrices). Para la validación del modelo es necesario que, a partir de las matrices obtenidas en diferentes escalas, se pueda hacer una reconstrucción perfecta de la imagen original. El análisis multiresolución se usa para encontrar una escala en la que los pı́xeles correspondientes a los objetos que se quieren segmentar, sean distinguibles respecto a los demás. Es importante resaltar que en este análisis la cantidad de pı́xeles en cada nivel de descomposición se reduce, y en base a ello se escoge el escalado más adecuado para nuestro objetivo. Puesto que se obtienen varias matrices de cada escalado, se empiezan a estudiar los objetos en las matrices de menor resolución procurando segmentar los pı́xeles que se presume, corresponden a los objetos buscados. Dado que la segmentación inicia desde esta escala a partir de una hipótesis, se hace totalmente necesario el uso de cada una de las matrices obtenidas en los demás escalados para confirmar o descartar los pı́xeles de los cuales 6. Proceso en el cual se agrupan pı́xeles cuyas caracterı́sticas representan un objeto, con el fin de extraerlos de la imagen.. 22.
(35) Capı́tulo 4. Metodologı́a se habı́a presumido; de esta manera, no sólo se verifica si los pı́xeles corresponden o no a los objetos buscados, sino que también se van proyectando a la resolución más alta para la reconstrucción a partir de las matrices. Junto con las matrices se utilizan también algoritmos establecidos y operaciones matemáticas que permiten estudiar la forma y la estructura de los objetos que se desean segmentar; estas operaciones reciben el nombre de operaciones morfológicas. Finalmente, una vez se obtienen los objetos que se esperaran segmentar en la imagen original (al realizar la reconstrucción perfecta de la imagen se van marcando los objetos en las diferentes escalas, para que al final se sobrepongan sobre la imagen original), se procede a aplicar criterios que permitan validar el modelo.. 23.
(36) Capı́tulo 5. Desarrollo. Capı́tulo 5. Desarrollo La Facultad de Medio Ambiente de la Universidad Distrital Francisco José de Caldas cuenta con una base de datos de fotografı́as tomadas a muestras microanatómicas de diferentes especies madereras de Bogotá D.C. Para la toma de las muestras se realizó un corte en el tronco del árbol y luego se extrajo una porción cúbica de ésta; la muestra debe poseer esa forma para observar las caracterı́sticas de la madera en los diferentes cortes (transversal, tangencial y radial). Luego, para poder estudiar cada uno de los cortes se deben tomar alrededor de 5 a 10 virutas (o láminas) de cada una de las caras del cubo para observarlas en el microscopio, teniendo especial cuidado de que la cuchilla con la que se realice el corte esté bien afilada para que la viruta salga de manera limpia y no se produzcan daños en la muestra. Sin embargo, el filo de la cuchilla con la que se tomaron las virutas no estaba afilado adecuadamente, lo que ocasionó que algunos de los elementos que componen las muestras presentaran daños. Después se observaron las diferentes virutas de cada corte en el microscopio y se escogieron aquellas cuyos elementos presentaban menos daño para tomar las fotografı́as. Puesto que en su momento las imágenes servı́an como evidencia de laboratorio y no para realizar estudios sobre estas, no existı́an parámetros que definı́an como debı́an ser tomadas las fotografı́as. Por esto, algunas fotografı́as tienen desenfoque e iluminación no uniforme. Por lo anterior, antes de iniciar el desarrollo del trabajo se debe hacer una adecuación de las imágenes que permita realizar el estudio de mejor manera. 24.
(37) Capı́tulo 5. Desarrollo. 5.1.. Acondicionamiento de las imágenes. En la Figura 5.1 se muestra un par de fotografı́as correspondientes a dos especies de la base de datos, las cuales poseen una resolución de 4416×3312 pı́xeles y un aumento óptico ×10. Se observa que las fotografı́as son de color rojizo y tienen un fondo negro que las rodea, y como éstos atributos no tienen relación con la muestra original, se deben eliminar (el color se produce por procesos quı́micos para tinción en el laboratorio, aunque para nuestro estudio, también resalta algunas caracterı́sticas de los elementos).. Figura 5.1: Imágenes tomadas de la base de datos de la Universidad Distrital.. Para eliminar el fondo, se decide realizar un recorte a una porción de la imagen a partir del centro, y de esta manera también se ajustan todas las imágenes a un tamaño fijo (aunque todas las imágenes poseen la misma resolución, algunas tiene mayor proporción de fondo que otras). El tamaño del recorte se escoge de 2048 × 2048 debido a que no solo evitamos el fondo, sino que también sus dimensiones son una potencia de 2; esto facilita la implementación del análisis multiresolución ya que la transformación discreta de wavelet realiza un submuestreo por un factor de 2. La representación del color en la imagen tiene 3 componentes que representan los colores rojo, verde y azul (RGB), con los cuales generalmente se da color a una imagen. Además de ser un color que no corresponde a la muestra original, el procesamiento de una imagen de color es más compleja respecto a una en escala de grises; es por ello que se hace una conversión usando la ecuación 5.1 [15]. 25.
(38) Capı́tulo 5. Desarrollo. Ig = 0,2989 × R + 0,5870 × G + 0,1140 × B,. (5.1). donde Ig es la imagen en escala de grises, y las componentes; R la roja, G la verde y B la azul. La Figura 5.2 muestra el acondicionamiento de las imágenes presentadas en la Figura 5.1. En la ilustración se observa además una iluminación diferente para cada fotografı́a, pero se presume que para el análisis multiresolución éste no es un factor determinante.. Figura 5.2: Resultado de acondicionar las imágenes presentadas en la Figura5.1.. 5.2.. Preprocesamiento de las imágenes. Además del daño al momento de su extracción, hay otros factores que pueden afectar la muestra como enfermedades o traumas sufridos por el tronco (ver Figura 5.3). Una forma para mitigar el impacto que estos factores puedan causar en el estudio del modelo es desenfocar la imagen. De esta manera los pı́xeles que corresponden a daños o traumas en las muestras varı́an su intensidad en relación a los pı́xeles adyacentes, principalmente al interior de los objetos, y al aplicar el análisis multiresolución la incidencia será menor. 26.
(39) Capı́tulo 5. Desarrollo Por lo anterior se decide aplicar un filtro gaussiano [16]. En la Figura 5.3 se observan los daños que tienen algunas muestras y el resultado de aplicar el filtrado.. Figura 5.3: En la imagen superior izquierda el daño en un poro causado al extraer la muestra y al costado derecho la misma imagen filtrada; en la imagen inferior izquierda el daño sufrido por la muestra debido a un factor externo y al derecho el filtrado de esta. Se observa que al filtrar la imagen, los defectos presentes en cada una de las muestras se difuminan un poco.. 5.3.. Análisis multiresolución. En el análisis multiresolución se emplea la transformación wavelet debido a que realiza la descomposición de la imagen por medio de escalado y 27.
(40) Capı́tulo 5. Desarrollo desplazamiento en una base wavelet ortonormal, lo que otorga una mayor precisión en la representación de la imagen y una mejor resolución espacial.. Figura 5.4: Matrices de coeficientes representadas como imagen tras aplicar la transformación wavelet. En la parte superior izquierda se representa la matriz de aproximación y en las posteriores se representan los detalles, todos como imagen; la parte superior derecha corresponde a los detalles horizontales, la inferior izquierda a los verticales y la restante a los diagonales.. La base de funciones wavelet ortonormales son generadas a partir de una wavelet madre, tal y como se explicó previamente en el marco teórico. Para escoger la wavelet madre se debe tener en cuenta el trabajo que se quiere realizar [17]. Como en este proyecto se va a necesitar detección de cambios en la intensidad de los pı́xeles para identificar la presencia de poros, se escoge la wavelet Haar porque es simétrica, lo que la hace muy útil para la detección de bordes. 28.
(41) Capı́tulo 5. Desarrollo Al aplicar la transformación wavelet sobre la imagen de estudio se producen unas matrices que contienen la información de aproximación y de detalles. Cada elemento de la matriz de aproximación permite que, al representarla visualmente, se obtenga una imagen similar a la original pero con dimensiones menores (esto es una consecuencia del submuestreo), mientras que los elementos en los detalles representan cuánta diferencia hay entre dos pı́xeles adyacentes en las diferentes orientaciones (horizontal, vertical y diagonal). A la operación que permite comparar una señal con otra para determinar si son o no parecidas se le conoce como correlación. En la Figura 5.4 se muestra la aplicación del primer nivel de la transformación wavelet a una de las fotografı́as de la base de datos. Dado que ésta es una representación visual de las matrices, se usa la escala de colores de grises para que sean evidentes los detalles que se desean mostrar.. Figura 5.5: Comparación del mismo objeto en los detalles horizontales entre el primer y el cuarto nivel de la transformación wavelet, respectivamente.. En cada una de las matrices de detalles se hacen más evidentes las correspondientes caracterı́sticas de orientación, es decir, en los detalles verticales se hacen más evidentes los radios que en los otros detalles porque su orientación siempre es vertical. Dado que los poros parecen cı́rculos, en todas las matrices de detalle son apreciables estos objetos, sin embargo en los detalles diagonales es más difı́cil observarlos. Por tal motivo, solo se trabaja sobre los detalles horizontales y verticales. Al analizar los detalles obtenidos en el primer nivel de wavelet se decide 29.
(42) Capı́tulo 5. Desarrollo. Figura 5.6: Matrices obtenidas al aplicar el cuarto nivel de wavelet ilustradas como imagen. Respecto a las matrices presentadas en el primer nivel, se observa una reducción en los detalles que definen al objeto; esto hace que las regiones pequeñas de pı́xeles, como las que corresponden al parénquima, se hagan despreciables respecto a las regiones grandes.. profundizar el nivel. El propósito de ello es que, al aumentar el nivel de análisis y disminuir la resolución, los objetos de mayor tamaño se conservan mientras que los de menor tamaño tienden a desaparecer. Es importante tener en cuenta que al aumentar el nivel, la calidad de la forma y la finura de los objetos disminuye. En la Figura 5.5 se muestra el mismo objeto en el primer y cuarto nivel de wavelet, respectivamente. Con cada nivel de profundidad en el análisis se hace un submuestreo y se reduce a la cuarta parte la cantidad de pı́xeles en la imagen. Esto causa 30.
(43) Capı́tulo 5. Desarrollo que cada vez los objetos sean más pequeños conforme se aumenta el nivel; por ejemplo, en el nivel quinto, los objetos se reducen a 1/1024 del tamaño original. Es por esto que se requiere escoger un nivel de profundidad en el que los objetos de estudio permanezcan, mientras que los demás desaparezcan; este nivel es el cuarto. En la Figura 5.6 se presentan las matrices resultantes de aplicar este nivel de wavelet sobre la matriz de aproximación del tercer nivel.. 5.4.. Histogramas de las matrices de detalle. Sobre las matrices de detalle obtenidas en el cuarto nivel se hace un estudio estadı́stico, usando el histograma, para analizar la cantidad de pı́xeles y sus valores.. Figura 5.7: En azul se presenta el histograma de los detalles horizontales para el cuarto nivel de wavelet. En color rojo se marca el intervalo de selección de los valores.. La Figura 5.7 muestra el histograma de los coeficientes de detalle ho31.
(44) Capı́tulo 5. Desarrollo rizontal, el cual se encuentra normalizado para simular una densidad de probabilidad. Como los valores de las matrices de detalles producidas por la transformación wavelet miden la diferencia entre pı́xeles adyacentes, y las variaciones dentro de los objetos suelen ser mı́nimas o nulas, la mayorı́a de los valores cercanos a cero corresponden al interior de los objetos. A partir de esta idea se crea un intervalo de selección de la cantidad de coeficientes a usar para segmentar los objetos en cuestión.. 5.5.. Binarización de las matrices de detalle. La binarización de una imagen es el proceso mediante el cual se crea una imagen binaria, es decir, una imagen que posee únicamente los valores de. Figura 5.8: Al costado izquierdo una imagen binaria que representa la binarización de la matriz de detalle horizontal; al costado derecho la imagen original. En color se encierran las mismas regiones en cada imagen, donde una contiene las zonas que presentan poca variación entre los valores adyacentes en la matriz y en la otra los poros, respectivamente.. cero o uno para cada pı́xel. Un método general para la binarización de una imagen o matriz consiste en establecer un valor umbral que permita agrupar pı́xeles en dos grupos diferentes; un grupo formado por aquellos valores matriciales o de pı́xeles que se encuentren por encima del valor 32.
(45) Capı́tulo 5. Desarrollo umbral, y el otro grupo de los que se encuentren por debajo. La ecuación 5.2 presenta la forma matemática usada generalmente para la binarización. g(x, y) =. 1 → f (x, y) > T , 0 → f (x, y) ≤ T. (5.2). donde g(x, y) es la imagen binaria que se crea, f (x, y) es el valor de la matriz o imagen sobre la que se realiza la binarización y T es el valor umbral escogido. En el modelo propuesto se realiza la binarización sobre las matrices de detalle para extraer los objetos que posean mayor cantidad de pı́xeles, ya que como se habı́a mencionado, las variaciones mı́nimas en las matrices de detalles representan el interior de los objetos. Para ello se escoge, en el. Figura 5.9: Resultado de aplicar la conjunción (operación de intersección) entre las imágenes binarias presentadas en la Figura 5.8.. 33.
(46) Capı́tulo 5. Desarrollo histograma, el valor superior más cercano al 23 % de la población de los datos alrededor de la moda (el dato más repetido). Los valores de la matriz que se encuentren en ese intervalo toman el valor de uno, mientras que los demás de cero. La justificación del porqué se escogió un intervalo del 23 % se presenta en el apartado 6.4 de la sección de resultados. En la Figura 5.7 se ilustra entre dos lı́neas el intervalo mencionado. Se observa que el recorte se hace en los valores más cercanos a 0, ya que la correlación de los pı́xeles que representan los poros es muy alta, es decir, que la variación de intensidad entre ellos es casi nula. Sin embargo, al tener como fundamento un criterio estadı́stico se presenta un error inherente al método que debe ser considerado posteriormente para segmentar de manera más adecuada las células de interés. En la Figura 5.8 se muestra el resultado de la binarización. Las regiones blancas corresponden a los valores en las matrices de detalle que se encontraron dentro del intervalo presentado en la Figura 5.7. También se comprueba visualmente que la mayorı́a de variaciones cercanas a cero corresponden al interior de los poros.. 5.6.. Operaciones lógicas y operaciones morfológicas. El error inherente al método mencionado anteriormente ocurre porque al binarizar la imagen se identifican los pı́xeles cuyos valores son muy parecidos entre sı́, pero además de los poros, el interior de otros elementos también cumplen con esta caracterı́stica. Sin embargo, los diferentes objetos en la imagen poseen atributos únicos para cada caracterı́stica, y es por ello que para discernir los elementos se hace uso de operaciones lógicas y operaciones morfológicas. Para disminuir los pı́xeles que no corresponden a los poros en las imágenes presentadas en la Figura 5.8 se les aplica la operación lógica de conjunción entre ellas, ya que aunque cada imagen contiene diferente información, en ambas son apreciables los poros. El resultado de la operación lógica sobre las imágenes de la Figura 5.8 se visualiza en la Figura 5.9, donde es evidente una clara disminución de zonas blancas correspondientes a parénquima y radios. 34.
(47) Capı́tulo 5. Desarrollo. Figura 5.10: Matrices resultantes de los diferentes niveles de wavelet. En la parte superior izquierda la obtenida en el primer nivel, a la derecha la obtenida en el segundo nivel, en la parte inferior izquierda la obtenida en el tercer nivel y la restante en el cuarto nivel.. Todo el proceso mencionado hasta este momento se realiza en cada uno de los niveles de la transformada, obteniendo ası́ 4 matrices binarias en total (una por cada nivel). En la Figura 5.10 se muestran en la misma resolución las 4 imágenes binarias obtenidas en los diferentes niveles wavelet. Se puede ver que entre mayor sea el nivel wavelet aparecen menos objetos, porque la calidad disminuye. Por esta razón, se decide usar las matrices obtenidas en los tres niveles más altos para descartar objetos, y la de menor nivel para darle una mejor forma a los mismos. Con el fin de descartar objetos se aplica la operación de conjunción 35.
(48) Capı́tulo 5. Desarrollo entre las matrices ya mencionadas. Para dar la forma al objeto se aplica un algoritmo conocido como floodfill o algoritmo de llenado[18], el cual consiste en tomar un pı́xel o una región de ellos, y a través de dilataciones sucesivas hacer que dicha región aumente de tamaño hasta que se abarca toda la región perteneciente al objeto.. Figura 5.11: Semilla e imagen a la que se aplica el algoritmo de llenado respectivamente.. Para aplicar el algoritmo de llenado al modelo propuesto se debe crear la semilla y definir la imagen que determina en que momento se detiene el algoritmo (a esta última le llamaremos criterio de parada). Para ello se hace uso de las imágenes binarias presentadas en la Figura 5.10; para crear la semilla se aplica la conjunción lógica entre las imágenes obtenidas en el 2do ,3er y 4to nivel, y en la imagen resultante se reduce cada objeto a un solo pı́xel; y para el criterio de parada se usa la imagen binaria obtenida a partir del 1er nivel. En la Figura 5.11 se muestran la semilla y el criterio de parada. La Figura 5.12 muestra el resultado de aplicar la operación de llenado en el modelo. En ella se observan principalmente poros, pero debido a que los radios y el parénquima presentan tamaño considerable en algunas imágenes, es necesario eliminar los objetos no deseados. Un estudio en las imágenes evidencia que el tamaño de los poros nunca es menor a 250 pı́xeles, y es por ésta razón que todos los objetos cuya área es menor son eliminados. En la 36.
(49) Capı́tulo 5. Desarrollo. Figura 5.12: Resultado de la aplicación del algoritmo morfológico de llenado a los poros segmentados.. Figura 5.13 se presenta el resultado al eliminar los objetos mencionados. Finalmente se aplica la transformada inversa de wavelets para reconstruir la imagen original; sin embargo, para evidenciar los resultados se modifican los coeficientes de detalle horizontal del primer nivel. La modificación consiste en invertir y multiplicar la imagen binaria presentada en la Figura 5.13 con la de detalles, de forma tal que las zonas segmentadas como poros serán de color negro en la reconstrucción de la imagen. La imagen obtenida del modelo se presenta en la Figura 5.14. En ella se observa que la mayorı́a de poros que no presentaban daño fueron segmentados de manera parcial. Los resultados obtenidos para cada una de las imágenes se presentan en el Anexo 2.. 37.
(50) Capı́tulo 5. Desarrollo. Figura 5.13: Matriz obtenida al eliminar los objetos cuya área está conformada por menos de 250 pı́xeles en la imagen presentada en la Figura 5.12.. 38.
(51) Capı́tulo 5. Desarrollo. Figura 5.14: Imagen resultante de aplicar el modelo sobrepuesta a la original. Las zonas negras corresponden a la segmentación obtenida por el modelo.. 39.
(52) Capı́tulo 6. Resultados. Capı́tulo 6. Resultados El modelo propuesto (al cual se le dirá solamente modelo a partir de ahora) segmenta los pı́xeles que corresponden a los poros en las imágenes. Para que el modelo sea eficaz debe tener una tasa alta de aciertos sobre los objetos que segmenta como poros y que sean poros, ası́ como capaz de discriminar aquellos objetos que pueden tener caracterı́sticas similares a los poros, pero que no lo son. Como la evaluación del modelo se basa en medir las tasas de acierto y de error, y para ello debe existir una comparación, se debe crear una imagen en la que todos los poros se encuentren segmentados de forma adecuada. Por este motivo, con la ayuda de un experto en el tema de la anatomı́a de las maderas, fueron segmentados los poros en cada una de las imágenes para luego ser tomadas como la segmentación ideal. Posteriormente, se realiza la comparación entre la imagen creada y la imagen obtenida por el modelo y, a partir de ellos, se realizan tres medidas. La primera medida es la cantidad de elementos segmentados como poro, y que en efecto son poros; a este valor se le conoce como verdadero positivo (VP ). La segunda medida cuenta la cantidad de poros que existen en la imagen, pero que el modelo no detectó; a este valor se le llama falso negativo (FN ). La tercera medida corresponde al número de elementos que el modelo detectó como poros, pero que en realidad no son poros; a este valor se le denomina falso positivo (FP ).. 40.
(53) Capı́tulo 6. Resultados. Especie Xylosma spiculifera (Tul.) Triana & Planch A Xylosma spiculifera (Tul.) Triana & Planch B Xylosma spiculifera (Tul.) Triana & Planch C Clusia multiflora Kunth Morella parvifolia (Benth.) Parra-O Gaiadendron punctatum (Ruiz & Pav.) G. Don Verbesina crassiramea S.F. Blake Ilex laurina Kunth Solanum cornifolium Dunal A Citharexylum sulcatum Moldenke. Cantidad de imágenes. Verdaderos Positivos (VP ). Falsos Positivos (FP ). Falsos Negativos (FN ). 5. 39.2. 0.4. 9.4. 5. 38.8. 1.4. 3.0. 5. 32.8. 0.4. 16.4. 4. 14.75. 6.25. 0.25. 5. 47.6. 12. 5. 4. 14. 5.25. 0.75. 5. 31.6. 0.6. 15.4. 4. 23.5. 6.75. 2.25. 6. 38.33. 0.33. 14.33. 5. 28. 1.8. 0.8. 41.
(54) Capı́tulo 6. Resultados. Especie Critoniopsis bogotana (Cuatrec.) H. Rob Pictocoma Palicourea cf. angustifolia Kunth Miconia denticulata Naudin Geissanthus andinus Mez Cinchona pubescens Vahl Solanum cornifolium Dunal B. Cantidad de imágenes. Verdaderos Positivos (VP ). Falsos Positivos (FP ). Falsos Negativos (FN ). 5. 30.8. 3.2. 3.8. 6. 67.33. 0.66. 7.33. 5. 38.6. 0.8. 5.2. 6. 35.5. 0.83. 7.5. 5. 14.2. 6.6. 1.6. 5. 26.6. 0.4. 2.4. 3. 40.66. 0.66. 9. Cuadro 6.1: Algunos datos hallados de la matriz de confusión para cada una de las especies madereras.. Posteriormente, con los valores medidos se hacen algunos cálculos que se derivan de la matriz de confusión 1 . Estos cálculos son la sensibilidad (S) y el valor predictivo positivo (V P P ); a partir de estos se calcula un tercer parámetro que se conoce como F1 Score. El Cuadro 6.1 presenta los valores promedio hallados para cada especie. Para calcular el promedio, se hallaron los valores de VP , FN y FP para cada imagen. Luego, por especies, se realizó la sumatoria y se dividió el resultado 1. Una matriz de confusión es una tabla especı́fica diseñada para visualizar el rendimiento de un algoritmo con base en una comparación entre lo que se busca y lo que se obtiene.. 42.
(55) Capı́tulo 6. Resultados entre el total de imágenes. Debido a esto, y aunque los valores de VP , FN y FP son números enteros para cada imagen, los datos mostrados en la tabla se presentan como números reales. El valor de verdaderos negativos (otro parámetro que se incluye en la matriz de confusión, conocido como VN ), no se calculó debido a que el modelo segmenta un tipo de célula en particular, por lo cual no tendrı́a sentido medir los objetos que no son segmentados y que no pertenecen al objeto de estudio.. 6.1.. Sensibilidad o recall. La sensibilidad (S) es la medición de la capacidad que tiene el modelo de segmentación para identificar los casos positivos correctamente. Dicho en otras palabras, es la probabilidad de identificar correctamente un poro. La sensibilidad puede estimarse a partir de la proporción de poros que fueron identificados con el modelo respecto al total de poros, tal como se muestra en la ecuación 6.1.. S=. 6.2.. VP V P + FN. (6.1). Valor predictivo positivo o precisión. El valor predictivo mide la eficacia real del modelo planteado. En el caso del valor predictivo positivo (V P P ), es la probabilidad de que se detecte correctamente un poro si el resultado es positivo. El valor predictivo positivo puede estimarse a partir de la proporción de poros que fueron identificados y que resultaron ser poros respecto al total de poros detectados (el total de poros incluye aquellos que no son poros, pero que fueron contados como poros), como se presenta en la ecuación 6.2.. V PP =. VP VP + FP. (6.2) 43.
(56) Capı́tulo 6. Resultados. 6.3.. F1 Score. El F1 Score, mide la exactitud del modelo. Se considera una medida armónica que combina los valores de la sensibilidad y del valor predictivo positivo. La fórmula general se presenta en la ecuación 6.3. La variable β define el peso que tiene la sensibilidad y el valor predictivo positivo; si β es igual a uno se está dando la misma importancia a la sensibilidad que al valor predictivo positivo; si es menor a 1, se da más importancia a la sensibilidad; y, si es mayor a 1, al valor predictivo positivo. Para evaluar el modelo se escoge β = 1. F 1 = (1 + β 2 ) ·. 6.4.. β2. V PP · S · V PP + S. (6.3). Selección del intervalo de binarización. Como se mencionó en la sección de desarrollo, previo a la binarización de las matrices de detalles, se debe crear un intervalo de selección sobre la población de los coeficientes de dichas matrices. Para comodidad del lector, a partir de ahora se le llamará a este intervalo como intervalo de binarización. El intervalo de binarización de las matrices de detalle se escogió con base en los resultados, es decir, el intervalo se varió para obtener los resultados más apropiados de acuerdo con el propósito del trabajo. Cabe recordar que el intervalo escogido fue del 23 % sobre la población de los coeficientes. Para llegar a este valor, se creó un algoritmo que contó los falsos positivos, los falsos negativos y los verdaderos positivos sobre la imagen binaria previa al cálculo de la transformación inversa wavelet (ver Figura 5.13). Después se aplicó el modelo varias veces para diferentes intervalos, iniciando en un intervalo del 10 % hasta el 40 %, con incrementos del 1 %. Posteriormente, se calculó la sensibilidad, el valor predictivo positivo y el F1 Score y, con base en ello, se escogió el intervalo más adecuado. Al analizar los cálculos obtenidos en cada intervalo y graficarlos, se determinó que el intervalo que ofrece mejores resultados se encuentra entre el 20 % y el 25 % según la especie. En el anexo 1 se encuentran los valores obtenidos de estos porcentajes según la especie. 44.
(57) Capı́tulo 6. Resultados En las Figuras 6.1, 6.2 y 6.3 se muestran las gráficas correspondientes a la sensibilidad, el valor predictivo positivo y el F1 Score, respectivamente. En cada una de ellas se presentan 6 curvas que corresponden a las 17 especies agrupadas por un comportamiento similar: Grupo 1: especies Xylosma spiculifera (Tul.) Triana & Planch A,Xylosma spiculifera (Tul.) Triana & Planch C y Verbesina crassiramea S.F. Blake. Grupo 2: especies Xylosma spiculifera (Tul.) Triana & Planch B, Citharexylum sulcatum Moldenke, Pictocoma, Palicourea cf. angustifolia Kunth y Cinchona pubescens Vahl. Grupo 3: especies Clusia multiflora Kunth y Gaiadendron punctatum (Ruiz & Pav.) G. Don. Grupo 4: especies Morella parvifolia (Benth.) Parra-O y Geissanthus andinus Mez. Grupo 5: especies Ilex laurina Kunth y Critoniopsis bogotana (Cuatrec.) H. Rob. Grupo 6: especies Solanum cornifolium Dunal A, Miconia denticulata Naudin y Solanum cornifolium Dunal B. En la Figura 6.1 se observa que a medida que aumenta el intervalo de binarización la sensibilidad tiende a mejorar. Esto sucede porque la sensibilidad mide la cantidad de elementos correctamente clasificados respecto al total, y al aumentar el intervalo, el resultado presenta mayor cantidad de objetos segmentados independientemente si son o no correctos. Respecto al valor predictivo positivo, en la Figura 6.2 se presentan las gráficas correspondientes a las familias agrupadas. Como el valor predictivo positivo mide la probabilidad de que un elemento sea segmentado correctamente y, al aumentar el intervalo, también lo hace la cantidad de objetos, el valor tiende a disminuir entre más grande sea el intervalo. Las gráficas correspondientes al F1 Score se muestran en la Figura 6.3. Ya que este valor resulta de la mezcla de la sensibilidad y del valor predictivo positivo, y como estos tienden a ser inversamente proporcionales, las gráficas del F1 Score tienen la forma de la sensibilidad al inicio y la del 45.
(58) Capı́tulo 6. Resultados. S. 1. S1 S2 S3 S4 S5 S6. 0.9. Cálculo de la sensibiidad (S). 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 10. 15. 20. 25. 30. 35. 40. Intervalo (%). Figura 6.1: Valores promedios de la sensibilidad (S) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma.. valor predictivo positivo al final. En está gráfica se evidencia que los mejores resultados se encuentran para un intervalo ubicado aproximadamente entre el 20 % y el 25 %. Finalmente, se ordenaron los valores del intervalo con el mejor y segundo mejor resultado para cada especie y se asignó a cada uno un puntaje de 2 y 1, respectivamente. Luego se hizo la sumatoria de puntos y el intervalo con mayor puntaje fue el escogido.. 6.5.. Discusión. Con las ecuaciones anteriormente escritas se realizó el cálculo de cada una de las medidas sobre las imágenes, y posteriormente se promediaron por especies. El modelo se aplicó a un total de 83 imágenes, correspondientes a 15 especies; la especie Xylosma spiculifera (Tul.) Triana & Planch tiene 3 muestras diferentes, ası́ que se tomaron como si fueran 17 especies 46.
(59) Capı́tulo 6. Resultados. VPP. Cálculo del valor predictivo positivo (VPP). 1. VPP1 VPP2 VPP3 VPP4 VPP5 VPP6. 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 10. 15. 20. 25. 30. 35. 40. Intervalo (%). Figura 6.2: Valores promedios del valor predictivo positivo (V P P ) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma.. madereras en total. El cuadro 6.2 presenta los cálculos obtenidos. Como el F1 Score se calculó dando la misma importancia a la sensibilidad que al valor predictivo positivo, se puede tomar como un primer indicador para conocer la eficacia del modelo. Sin embargo, deben ser analizados los otros indicadores ya que en algunos casos la sensibilidad es muy buena pero el valor predictivo no, o viceversa, lo cual no se conoce con el F1 Score. El cuadro 6.2 contiene cada uno de los valores calculados para las especies madereras. El F1 Score en la mayorı́a de los casos es superior a 0,8, lo cual podrı́a indicar que la respuesta del modelo es buena en términos generales, pero si se observan en estos mismos casos los valores de sensibilidad y valor predictivo positivo, es posible que uno de los dos sea muy inferior a lo esperado, como es por el ejemplo el caso de la especie Xylosma spiculifera (Tul.) Triana & Planch C. 47.
(60) Capı́tulo 6. Resultados. Valor-F. 1. F11 F12 F13 F14 F15 F16. 0.9. Cálculo del valor-F. 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 10. 15. 20. 25. 30. 35. 40. Intervalo (%). Figura 6.3: Valores promedios del F1 Score (F ) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma.. Especie. Xylosma spiculifera (Tul.) Triana & Planch A Xylosma spiculifera (Tul.) Triana & Planch B Xylosma spiculifera (Tul.) Triana & Planch C Clusia multiflora Kunth Morella parvifolia (Benth.) Parra-O. 48. Cantidad imágenes. Valor Predictivo. Sensibilidad (S). Valor-F. Positivo (V P P ) min mean max. min. mean. max. min. mean. max. 5. 0.750. 0.804. 0.868. 0.953. 0.991. 1. 0.857. 0.887. 0.929. 5. 0.913. 0.928. 0.944. 0.943. 0.964. 0.981. 0.930. 0.945. 0.962. 5. 0.439. 0.682. 0.857. 0.970. 0.988. 1. 0.610. 0.797. 0.923. 4. 0.944. 0.986. 1. 0.632. 0.709. 0.889. 0.774. 0.821. 0.941. 5. 0.806. 0.910. 0.976. 0.714. 0.796. 1. 0.781. 0.846. 0.968.
(61) Capı́tulo 6. Resultados. Especie. Gaiadendron punctatum (Ruiz & Pav.) G. Don Verbesina crassiramea S.F. Blake Ilex laurina Kunth Solanum cornifolium Dunal A Citharexylum sulcatum Moldenke Critoniopsis bogotana (Cuatrec.) H. Rob Pictocoma Palicourea cf. angustifolia Kunth Miconia denticulata Naudin Geissanthus andinus Mez Cinchona pubescens Vahl Solanum cornifolium Dunal B. Cantidad imágenes. Sensibilidad (S). Valor Predictivo. Valor-F. Positivo (V P P ) min mean max. min. mean. max. min. mean. max. 4. 0.857. 0.943. 1. 0.522. 0.738. 0.889. 0.649. 0.825. 0.941. 5. 0.524. 0.668. 0.830. 0.951. 0.985. 1. 0.687. 0.791. 0.886. 4. 0.871. 0.926. 1. 0.5. 0.751. 1. 0.667. 0.807. 0.961. 6. 0.619. 0.733. 0.837. 0.951. 0.992. 1. .765. 0.841. 0.911. 5. 0.931. 0.973. 1. 0.900. 0.939. 0.971. 0.931. 0.955. 0.981. 5. 0.806. 0.889. 0.947. 0.720. 0.888. 0.977. 0.818. 0.885. 0.954. 6. 0.855. 0.900. 0.933. 0.967. 0.990. 1. 0.920. 0.943. 0.959. 5. 0.809. 0.881. 0.933. 0.947. 0.979. 1. 0.895. 0.927. 0.954. 6. 0.654. 0.839. 0.919. 0.944. 0.976. 1. 0.773. 0.900. 0.944. 5. 0.812. 0.901. 1. 0.636. 0.687. 0.737. 0.743. 0.777. 0.823. 5. 0.852. 0.918. 0.958. 0.961. 0.985. 1. 0.920. 0.950. 0.979. 3. 0.796. 0.819. 0.830. 0.975. 0.984. 1. 0.876. 0.894. 0.907. Cuadro 6.2: Valores promedios por especies para la sensibilidad, el valor predictivo positivo y el F1 Score. En cada familia se muestra el valor mı́nimo, el promedio y el máximo para cada uno de los cálculos.. Si bien el algoritmo realiza la detección de la mayorı́a de los objetos que corresponden a poros, en algunas imágenes no se obtienen los resultados esperados debido a errores en la toma de la muestra o defectos de la imagen. Dentro de los errores de la toma se encuentran principalmente el desenfoque y la iluminación no uniforme, aunque como se dijo inicialmente, esta última no se considera para el desarrollo del modelo. En cuanto a los defectos de la imagen aparecen traumas en algunas muestras, posiblemente por golpes. Otro factor que alteró los resultados del modelo tiene que ver con la porción de la muestra tomada, ya que dependiendo de las estaciones del 49.
(62) Capı́tulo 6. Resultados año, los elementos que componen la anatomı́a de las maderas presentan cambios en algunas de sus caracterı́sticas para adaptarse principalmente a la condiciones de humedad. La Figura 6.4 presenta dos de los problemas anteriores. Por un lado es evidente el desenfoque en la imagen, lo que causa que los bordes y el objeto no sean claramente distinguibles. Esto ocasiona que, al aplicar la trasformación wavelet, el valor de los coeficientes de detalle no midan las diferencias como se esperarı́a. Además, hacia la parte baja de la imagen se nota un ligero cambio en cuanto a las caracterı́sticas de los elementos debido a un cambio de estaciones.. Figura 6.4: Resultado para una de las muestras de la especie Xylosma spiculifera (Tul.) Triana & Planch. La falta de enfoque en la imagen provocó que no se detectaran la mayorı́a de los poros.. 50.
Figure
+7
Documento similar