Estudio de la estructura anatómica que conforma la madera mediante análisis multiresolución y morfología

Texto completo

(1)Universidad Distrital Francisco José de Caldas. Estudio de la estructura anatómica que conforma la madera mediante análisis multiresolución y morfologı́a. Tesis presentada para obtener el tı́tulo de Ingeniero Electrónico presentan:. Norma Constanza Leguizamón Dı́az Manuel Andrés Sánchez Rodrı́guez Asesor: Rodrigo Herrera.

(2) ii.

(3) Agradecimientos Agradecemos primeramente a nuestras familias quienes siempre nos han apoyado, especialmente durante el ciclo universitario, de manera incondicional e incesante. A nuestros compañeros y amigos quienes en cada etapa nos han acompañado y de los cuales hemos aprendido enseñanzas invaluables en el ámbito personal y académico, y finalmente al docente Rodrigo Herrera, quien además de motivarnos a desarrollar este proyecto estuvo guiándonos para poder culminar satisfactoriamente el estudio que aquı́ se presenta.. iii.

(4) iv.

(5) v. Resumen La identificación de una especie maderera requiere un análisis de las caracterı́sticas macroscópicas y microscópicas de una muestra. En el caso de las maderas latifoliadas existen 4 tipos de elementos que componen su estructura: los vasos o poros, el parénquima, los radios y la fibra. En este trabajo se presenta el desarrollo y posterior estudio de un modelo de segmentación de los poros en fotografı́as que representan muestras microscópicas de maderas, en el corte transversal, usando únicamente análisis multiresolución y operaciones morfológicas. Inicialmente se realiza una adecuación y un preprocesamiento a las imágenes con el propósito de mejorar los resultados del modelo. En esta etapa se aplican el recorte sobre las imágenes, la conversión de color a escala de grises y el filtrado gaussiano. Después se emplea la transformada wavelet para realizar un análisis multiresolución. Al usar esta transformación se generan matrices que describen numéricamente la diferencia de los pı́xeles adyacentes que componen los elementos presentes en las imágenes. Sobre estas matrices se realiza un análisis estadı́stico que permita segmentar parcial o totalmente los objetos buscados. Luego, se hace uso de operaciones morfológicas y operaciones lógicas para eliminar los objetos no deseados. Con las matrices obtenidas se hace una reconstrucción de la imagen original usando la transformada inversa de wavelet, y finalmente se evalúan los resultados obtenidos. Se obtuvieron dos conjuntos de resultados para la evaluación. El primero de ellos incluyó todas las imágenes, incluso las que tenı́an defectos en la muestra o errores en la captura. El segundo omitió esas imágenes ya que, a nuestro criterio, no eran aptas para el estudio. Respecto al primer conjunto, con el segundo se obtuvieron resultados más satisfactorios, los cuales en su mayorı́a, tenı́an un valor superior al 80 % del F1 Score, medida que se usó para evaluar el modelo..

(6) vi. Abstract The microanatomy structure of wood is composed by 4 types of cells: vessels or pores, the parenchyma, the spokes and the fiber. Its form, deposition and texture can tell us what the species to wich is it belongs. Its characteristics are studied through a sample taken from the outer part of the wood. The sample represents three planes, wich provide different information about the cells: transverse, tangencial and radial. These planes can be represented in photographs taken from a microscope to be treated as images and be processed. Some works have segmented elements to be able to identify wood with image processing. This work makes a study of a segmentation model, based on multiresolution analysis and morphological operations, using the transversal plane. Starting with the adaptation of the images and using gaussian filter, the decomposition of the image is done using wavelet transform to find the details that make the features and segment the cells. With morphological operations, noise and unwanted elements are eliminated, and finally the images are reconstructed using the wavelet inverse transform. Two sets of results were obtained for the evaluation. The first one included all the images, even those with defects in the sample or errors in the capture. The second one omitted those images which, according to our criteria, were not suitable for study. In comparison to the first set, the second had a more successful result, which mostly was a value greater than 80 % of the F1 Score, a measure that was used for evaluating the model..

(7) Índice general. (1). Índice general Índice de figuras . . . . . . . . . . . . . . . . . . . . . . . . . .. IX. Índice de cuadros . . . . . . . . . . . . . . . . . . . . . . . . . .. XII. 1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. 2 Estado del arte . . . . . . . . . . . . . . . . . . . . . 2.1 Caracterización microanatómicas de maderas . . . . 2.2 Caracterización microanatómica de radios . . . . . . 2.3 Análisis multiresolución en imágenes de maderas . .. . . . .. . . . .. . . . .. . . . .. 6 6 7 8. 3 Marco teórico . . . . . . . . . . . . . . . . . . . . . . 3.1 Anatomı́a de las maderas latifoliadas . . . . . . . . . 3.2 Análisis multiresolución . . . . . . . . . . . . . . . . 3.2.1 Trasformada wavelet . . . . . . . . . . . . . . 3.2.2 Transformación wavelet discreta (DWT) . . .. . . . . .. . . . . .. . . . . .. . . . . .. 9 9 16 16 17. 4 Metodologı́a . . . . . . . . . . . . . . . . . . . . . . . . . . .. 22. 5 Desarrollo . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Acondicionamiento de las imágenes . . . . . . . . . . 5.2 Preprocesamiento de las imágenes . . . . . . . . . . 5.3 Análisis multiresolución . . . . . . . . . . . . . . . . 5.4 Histogramas de las matrices de detalle . . . . . . . .. 24 25 26 27 31. . . . . .. . . . . .. . . . . .. . . . . .. vii.

(8) viii 5.5 5.6. ÍNDICE GENERAL Binarización de las matrices de detalle . . . . . . . . . . . . Operaciones lógicas y operaciones morfológicas . . . . . . .. 6 Resultados . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Sensibilidad o recall . . . . . . . . . . . . . . . . . . 6.2 Valor predictivo positivo o precisión . . . . . . . . . 6.3 F1 Score . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Selección del intervalo de binarización . . . . . . . . 6.5 Discusión . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . .. . . . . . .. . . . . . .. 32 34. . . . . . .. 40 43 43 44 44 46. 7 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . .. 56. Bibliografı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 65.

(9) Índice de figuras. Índice de figuras 1.1 1.2. Maderas conı́fera y latiofoliada. La principal diferencia entre ambas se centra en los poros; la conı́fera carece de ellos.1 . . Tipos de cortes de la madera; en la parte superior el corte transversal, en el medio el tangencial y en la parte inferior el radial.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Imagen microscópica de la madera vista desde el corte transversal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Tipos de radios: A) homogéneos; B) heterogéneos. . . . . . 3.3 Agrupamiento de los poros desde el corte transversal: A) solitarios; B) múltiples; C) arracimados. . . . . . . . . . . . 3.4 Orientación de los poros desde el corte transversal: A) radial; B) bandas tangenciales; C) diagonal. . . . . . . . . . . . . . 3.5 Ejemplos de parénquima axial apotraqueal. . . . . . . . . . 3.6 Ejemplos de parénquima axial en bandas. . . . . . . . . . . 3.7 Ejemplos de parénquima axial paratraqueal. . . . . . . . . . 3.8 Señales wavelet madre más comunes. . . . . . . . . . . . . . 3.9 Representación esquemática del análisis multiresolución de una señal utilizando la DWT. . . . . . . . . . . . . . . . . . 3.10 Mosaico del espacio de frecuencias que corresponde al árbol de estructura de la Figura 3.11 . . . . . . . . . . . . . . . . 3.11 Representación wavelet en forma de árbol de una imagen del banco de muestras. . . . . . . . . . . . . . . . . . . . . . . .. 2. 3. 3.1. 5.1. Imágenes tomadas de la base de datos de la Universidad Distrital. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 10 11 12 13 14 15 15 17 18 20 21. 25 ix.

(10) ÍNDICE DE FIGURAS. x 5.2 5.3. 5.4. 5.5. 5.6. 5.7. 5.8. 5.9. Resultado de acondicionar las imágenes presentadas en la Figura5.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . En la imagen superior izquierda el daño en un poro causado al extraer la muestra y al costado derecho la misma imagen filtrada; en la imagen inferior izquierda el daño sufrido por la muestra debido a un factor externo y al derecho el filtrado de esta. Se observa que al filtrar la imagen, los defectos presentes en cada una de las muestras se difuminan un poco. Matrices de coeficientes representadas como imagen tras aplicar la transformación wavelet. En la parte superior izquierda se representa la matriz de aproximación y en las posteriores se representan los detalles, todos como imagen; la parte superior derecha corresponde a los detalles horizontales, la inferior izquierda a los verticales y la restante a los diagonales. Comparación del mismo objeto en los detalles horizontales entre el primer y el cuarto nivel de la transformación wavelet, respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . Matrices obtenidas al aplicar el cuarto nivel de wavelet ilustradas como imagen. Respecto a las matrices presentadas en el primer nivel, se observa una reducción en los detalles que definen al objeto; esto hace que las regiones pequeñas de pı́xeles, como las que corresponden al parénquima, se hagan despreciables respecto a las regiones grandes. . . . . . . . . En azul se presenta el histograma de los detalles horizontales para el cuarto nivel de wavelet. En color rojo se marca el intervalo de selección de los valores. . . . . . . . . . . . . . Al costado izquierdo una imagen binaria que representa la binarización de la matriz de detalle horizontal; al costado derecho la imagen original. En color se encierran las mismas regiones en cada imagen, donde una contiene las zonas que presentan poca variación entre los valores adyacentes en la matriz y en la otra los poros, respectivamente. . . . . . . . Resultado de aplicar la conjunción (operación de intersección) entre las imágenes binarias presentadas en la Figura 5.8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26. 27. 28. 29. 30. 31. 32. 33.

(11) ÍNDICE DE FIGURAS 5.10 Matrices resultantes de los diferentes niveles de wavelet. En la parte superior izquierda la obtenida en el primer nivel, a la derecha la obtenida en el segundo nivel, en la parte inferior izquierda la obtenida en el tercer nivel y la restante en el cuarto nivel. . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.11 Semilla e imagen a la que se aplica el algoritmo de llenado respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . 5.12 Resultado de la aplicación del algoritmo morfológico de llenado a los poros segmentados. . . . . . . . . . . . . . . . . . 5.13 Matriz obtenida al eliminar los objetos cuya área está conformada por menos de 250 pı́xeles en la imagen presentada en la Figura 5.12. . . . . . . . . . . . . . . . . . . . . . . . 5.14 Imagen resultante de aplicar el modelo sobrepuesta a la original. Las zonas negras corresponden a la segmentación obtenida por el modelo. . . . . . . . . . . . . . . . . . . . . . . 6.1. 6.2. 6.3. 6.4. 6.5. 6.6. Valores promedios de la sensibilidad (S) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . Valores promedios del valor predictivo positivo (V P P ) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma. . . . . . . . . . . . . . . . . . . Valores promedios del F1 Score (F ) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultado para una de las muestras de la especie Xylosma spiculifera (Tul.) Triana & Planch. La falta de enfoque en la imagen provocó que no se detectaran la mayorı́a de los poros. Resultado para una de las muestras de la especie Morella parvifolia (Benth.) Parra-O. Un corte que atraviesa varios poros afectó su forma dificultando la correcta segmentación de las células. . . . . . . . . . . . . . . . . . . . . . . . . . Resultado para una de las muestras de la especie Morella parvifolia (Benth.) Parra-O. El tamaño de algunas células produjo que el algoritmo las detectara como poros, cuando en realidad no lo son. . . . . . . . . . . . . . . . . . . . . .. xi. 35 36 37. 38. 39. 46. 47. 48. 50. 51. 52.

(12) Índice de cuadros. Índice de cuadros 6.1 6.2. 6.3. xii. Algunos datos hallados de la matriz de confusión para cada una de las especies madereras. . . . . . . . . . . . . . . . . . Valores promedios por especies para la sensibilidad, el valor predictivo positivo y el F1 Score. En cada familia se muestra el valor mı́nimo, el promedio y el máximo para cada uno de los cálculos. . . . . . . . . . . . . . . . . . . . . . . . . . . . Cálculos realizados sobre las familias madereras, excluyendo aquellas imágenes que presentaban defectos en la muestra o que tenı́an errores al momento de tomar la fotografı́a. . . .. 42. 49. 54.

(13) Capı́tulo 1. Introducción. Capı́tulo 1. Introducción Desde el descubrimiento del fuego, la madera ha sido una de las materias primas fundamentales en el desarrollo del hombre. Ya sea como fuente de combustible, material de construcción (por ejemplo, edificaciones, medios de transporte, carpinterı́a, entre otros) o elaboración de pulpa para fabricar papel, la industria maderera es uno de los sectores económicos con mayor impacto a nivel mundial. La ubicación geográfica y el medio ambiente en el que se desarrolla una especie arbórea influyen en su estructura celular y anatómica. Según su estructura celular, existen dos tipos de especies de madera: las conı́feras, las cuales se desarrollan en las zonas templadas y polares del planeta; y las latifoliadas, las cuales se desarrollan en las zonas tropicales e intertropicales. A diferencia de las conı́feras, la estructura anatómica de las latifoliadas posee adicionalmente vasos (también llamados poros), los cuales realizan la función conductora de lı́quidos, y fibras, que contribuyen al sostén del árbol. En la Figura 1.1 se observa la diferencia anatómica de ambos tipos de madera, donde se evidencia la carencia de poros en las maderas conı́feras.[1] Debido a su posición geográfica, los paı́ses latinoamericanos poseen valiosos recursos forestales, ya que cuentan con maderas latifoliadas y conı́feras. Estos recursos contribuyen al desarrollo económico de los paı́ses y su bienestar social, y debido a que son recursos renovables, también promueven el cuidado medio ambiental. Sin embargo, en algunos de estos paı́ses la información forestal es escasa o equı́voca, y esto genera que las actividades del hombre ocasionen daño a los bosques y al ecosistema[2]; tal como ocurre 1.

(14) Capı́tulo 1. Introducción en Colombia, donde la deforestación aumentó un 23 % entre los años 2016 y 2017.[3]. Figura 1.1: Maderas conı́fera y latiofoliada. La principal diferencia entre ambas se centra en los poros; la conı́fera carece de ellos.1. En Colombia, el 51,35 % de la superficie está cubierta por bosques naturales, concentrada principalmente en la cuenca del Amazonas y ChocóDarién. Cerca de la mitad de los bosques naturales del paı́s se encuentran en territorios indı́genas, comunidades afrodescendientes y comunidades campesinas. Gran parte de estas zonas se caracterizan por la pobreza, la falta de gobierno, la incursión armada ilegal y la violencia. Como consecuencia de éstas caracterı́sticas, la tala ilegal es una actividad constante en el comercio nacional (para la exportación de la madera se realizan controles exhaustivos, por lo cual las maderas ilegales se comercializan, casi en su totalidad, dentro del paı́s).[4] En el año 2006, las cifras del Banco Mundial indicaban que de la madera que se explota, transporta y comercializa, el 42 % corresponde a tala ilegal. Sin embargo, la WWF (World Wildlife Fund ) hizo un señalamiento en el que indica que la cifra corresponde a un 75 % aproximadamente. Ası́ 1. Imagen tomada de http://www.monografias.com/trabajos75/manual-identificacionmaderas-forestales/manual-identificacion-maderas-forestales2.shtml. 2.

(15) Capı́tulo 1. Introducción mismo, un informe publicado por la WWF en el mismo año indica que el comercio de madera ilegal llega a generar ganancias de hasta 7000 millones de dólares.[5]. Figura 1.2: Tipos de cortes de la madera; en la parte superior el corte transversal, en el medio el tangencial y en la parte inferior el radial.2. Entre los años 2012 y 2014 se realizaron decomisos de madera transportada de forma ilegal donde habı́a alrededor de 273000 m3 de madera. Sin embargo, entre los años 2008 y 2012 se produjeron en promedio 4250000 m3 de madera por año (65 % de latifoliadas y 32 % de conı́feras). Comparando estos datos, es evidente que los controles en el tema maderero son escasos aunque exista una reglamentación sobre el mismo. 2. Imagen tomada de http://www.ebah.com.br/content/ABAAABTdwAA/caracterizacaofisica-desengrosso-pinho. 3.

(16) Capı́tulo 1. Introducción Una de las principales causas de la ineficiencia en los controles sobre la tala ilegal de maderas, es porque en la mayorı́a de ellos la policı́a carece de expertos en el tema que puedan determinar con claridad si las maderas que son transportadas están permitidas talar o no en la región o paı́s. Además de ello, se suma el hecho que para realizar la identificación de la especie maderera se requiere tomar una muestra del tronco y enviarla al laboratorio. A la porción de madera se le aplican las pruebas pertinentes y se determina el tipo de madera, aunque este proceso llega a tardar desde unos dı́as hasta semanas. Adicionalmente, durante este proceso deben considerarse los costos y el tiempo que tarda la muestra en ser transportada. Un método actual para la identificación de la especie maderera consiste en extraer una muestra en forma cúbica con unos cortes ya definidos para su posterior estudio. En la Figura 1.2 se observan los tres tipos de corte: el corte transversal es aquel perpendicular al eje del tronco del árbol; el corte radial está orientado en dirección paralela al eje del árbol, cortando perpendicularmente a los anillos de crecimiento; y el corte tangencial, el cual se orienta de forma paralela al eje del árbol, tangente a los anillos de crecimiento y perpendicular a los radios. Esta muestra se envı́a a un laboratorio, donde se estudia la superficie de cada uno de los cortes realizados para observar la estructura microanátomica de la madera y poderla identificar. En las maderas latifoliadas, los elementos presentes son 4 tipos: los poros, el parénquima axial, el parénquima radial y las fibras. En cada corte se pueden apreciar caracterı́sticas diferentes de los elementos que varı́an según la especie. Las caracterı́sticas más importantes a tener en cuenta para realizar la identificación de la especie arbórea son la forma, el tamaño, el aspecto, la disposición y la manera en que se agrupan.[6] Actualmente, la Universidad Distrital Francisco José de Caldas cuenta con un banco de imágenes correspondientes a muestras de maderas latifoliadas. Utilizando estas muestras y aplicando procesamiento computacional, se podrı́a diseñar un modelo que sirva como base para la construcción, a futuro, de una herramienta que identifique las especies de maderas de manera autónoma. La pregunta que deseamos resolver con nuestro proyecto de grado es: ¿qué tan preciso es un modelo, basado en el análisis multiresolución, para segmentar los elementos, particularmente los poros, que componen una 4.

(17) Capı́tulo 1. Introducción muestra de madera latifoliada empleando el corte transversal?. 5.

(18) Capı́tulo 2. Estado del arte. Capı́tulo 2. Estado del arte Existen varios trabajos realizados sobre segmentación de elementos en maderas conı́feras, pero sobre maderas latifoliadas son escasos; esto se debe a que la segmentación en éstas es mucho más compleja. Además, en la mayorı́a de trabajos sobre maderas latifoliadas no solo se usan herramientas del procesamiento digital de imágenes, sino también algunas de las de inteligencia computacional. En este apartado se mencionarán únicamente aquellos trabajos que involucran solo herramientas del procesamiento digital de imágenes. A continuación se presentan tres trabajos, desarrollados por estudiantes de la Universidad Distrital Francisco José de Caldas, sobre imágenes que representan muestras microanatómicas de madera. Cada uno de los trabajos se enfoca en la segmentación de uno o varios elementos que componen la madera usando diferentes herramientas del procesamiento digital de imágenes. El segundo trabajo lo desarrollan usando el corte tangencial, mientras que los otros dos lo hacen sobre el transversal.. 2.1.. Caracterización microanatómicas de maderas. [7] Este trabajo desarrolla un novedoso sistema que permite obtener caracterı́sticas microanatómicas de 5 especies madereras diferentes, segmentando los elementos a través del procesamiento digital de imágenes. 6.

(19) Capı́tulo 2. Estado del arte Inicialmente se hace un preprocesamiento de la imagen para corregir iluminación no uniforme y aumentar el contraste, usando filtrado homomórfico y análisis multiescala. Ası́ mismo, se corrigen problemas de ruido inherentes al proceso de captura de las muestras. Después se evalúan distintos métodos de segmentación para cada elemento en cuestión. Las principales herramientas usadas para la segmentación son operaciones morfológicas, los algoritmos de k-medias y de agrupamiento por desplazamiento medio, los filtros homomórfico y de Gabor, la transformada wavelet, contornos activos y el muestreador de Gibbs. La precisión alcanzada en la segmentación es del 90 %. Con los elementos separados se realizó un proceso de caracterización, entregando 12 caracterı́sticas de la muestra estudiada, logrando una tasa de acierto cercana al 80 %.. 2.2.. Caracterización microanatómica de radios en la sección tangencial de maderas. [8] Este trabajo plantea un método para la segmentación microanatómica de radios en la sección tangencial de maderas, que utiliza técnicas de procesamiento digital de imágenes. Primero se corrige la iluminación no uniforme presente en las imágenes aplicando filtrado homomórfico y análisis multiescala. Luego, se realiza la segmentación utilizando el Filtro de Gabor, métodos de agrupamiento, morfologı́a matemática y contornos activos. Después, se utilizan los resultados obtenidos en la segmentación para medir ocho caracterı́sticas microanatómicas; para esto se emplean nuevamente técnicas de procesamiento de imágenes tales como transformada watersheed, métodos de agrupamiento, entre otras. La validación de los resultados se hace tomando como referencia las imágenes segmentadas manualmente comparándolas con las obtenidas por el método. El error promedio en la segmentación es de 12 % y la caracterización, también comparada con la obtenida manualmente, presenta una precisión cercana al 80 %. 7.

(20) Capı́tulo 2. Estado del arte. 2.3.. Estudio de la segmentación de imágenes de microestructura anatómica de la madera mediante el análisis multiresolución. [9] Este trabajo presenta un método para segmentar los poros en imágenes microanatómicas de la madera. La metodologı́a planteada se divide en 3 partes: la umbralización estadı́stica, las caracterı́sticas que varı́an con las resoluciones y las regiones ambiguas. En la primera parte se aplica un análisis multiresolución que descompone la imagen en matrices numéricas. Posteriormente se hallan los histogramas de cada una de las matrices y se hace un recorte del 60 % de la desviación estándar sobre la media. Luego se analizan las caracterı́sticas que varı́an respecto al nivel de resolución y que son crı́ticas para realizar la segmentación de las células en cuestión. Estas caracterı́sticas son la conectividad, la densidad y la forma. Finalmente se hace distinción de las regiones ambiguas que aparecen en el proceso de segmentación de poros, sobre las cuales se hace un estudio para explicar por qué aparecen.. 8.

(21) Capı́tulo 3. Marco teórico. Capı́tulo 3. Marco teórico Para el estudio de un modelo capaz de segmentar los elementos de una muestra microscópica de madera utilizando análisis multiresolución, se deben considerar las teorı́as necesarias para poder realizar la caracterización de la muestra y, a partir de esta, diseñar el modelo. Es por esto que la sección abarca dos apartados donde se pretende mostrar los conceptos básicos para el desarrollo del estudio. El primer apartado trata sobre la anatomı́a de las maderas latifoliadas y su composición anatómica; el segundo muestra las herramientas de procesamiento para la implementación del análisis multiresolución en las imágenes.. 3.1.. Anatomı́a de las maderas latifoliadas. La estructura interna de las maderas latifoliadas resulta más compleja y especializada que en el caso de las conı́feras; esto se debe principalmente a que en las maderas latifoliadas aparece un tipo de células conocidas como poros. Sin embargo, el hecho que posea este tipo de células resulta en una caracterı́stica adicional que es muy útil para la clasificación según la familia. [10] La estructura de las maderas latifoliadas se componen principalmente por: Parénquima radial (conocidos como radios) Vasos o poros 9.

(22) Capı́tulo 3. Marco teórico Parénquima axial Fibras. Figura 3.1: Imagen microscópica de la madera vista desde el corte transversal.. La Figura 3.1 es una imagen tı́pica del corte transversal de una madera latifoliada. En esta se aprecian las células previamente mencionadas; las que se asemejan a una circunferencia y se ven en la imagen de color oscuro corresponden a los poros; las que se ubican en posición vertical y atraviesan la imagen son los radios; las que rodean los poros y tienen orientación horizontal son el parénquima axial; el resto de la imagen corresponde principalmente a fibra.. Radios Su función es almacenar y conducir de manera transversal las sustancias nutritivas. Presentan gran variedad de formas, tamaños y número de células que los componen. En las maderas latifoliadas, los radios se caracterizan 10.

(23) Capı́tulo 3. Marco teórico por ser finos y se observan sólo como lı́neas muy delgadas y claras en el plano transversal.. Figura 3.2: Tipos de radios: A) homogéneos; B) heterogéneos.. Los radios pueden ser: Homogéneos: Formados por un único tipo de células. Heterogéneos: Formados por más de un tipo de células. En la Figura 3.2 se observan los tipos de radios mencionados. Tanto en A) como en B) se observa al costado izquierdo los radios vistos desde el corte tangencial y al derecho los radios vistos desde el corte radial.. Poros Los poros son el elemento vascular del árbol ya que se encargan de la circulación de sustancias. Los poros tienen un diámetro que varı́a desde 20 µm hasta 500 µm dependiendo la especie, y junto con su distribución, abundancia y agrupamiento resultan en una importante caracterı́stica para la identificación de la familia. De acuerdo a su agrupamiento los poros pueden ser de tres tipos: Solitarios: Cuando un porcentaje igual o superior al 90 % de los poros se presentan completamente rodeados por otros elementos. 11.

(24) Capı́tulo 3. Marco teórico Múltiples: Cuando se unen dos o más poros, haciendo contacto por sus caras tangenciales y presentando un achatamiento que los hace parecer subdivisiones de un solo poro. Arracimados: Cuando se amontonan tres o más poros haciendo contacto por sus caras radiales y tangenciales.. Figura 3.3: Agrupamiento de los poros desde el corte transversal: A) solitarios; B) múltiples; C) arracimados.. En la Figura 3.3 se muestran tres imágenes que representan cada uno de los tipos de agrupamiento presente en los poros vistos desde el corte transversal. De acuerdo con el comité IAWA3 (1989), en maderas tropicales el agrupamiento más común para los poros es múltiple de 2 a 4, mezclado con una proporción variable de poros solitarios, pudiendo además, encontrarse mezclados poros múltiples con arracimados. El patrón de orientación de los poros en el plano transversal puede ser: Radial: cuando la orientación es paralela a los radios. 3. 12. International Association of Wood Anatomists..

(25) Capı́tulo 3. Marco teórico En bandas tangenciales: orientados aproximadamente paralelos a los anillos de crecimiento y perpendiculares a los radios, formando bandas. Diagonal: cuando los poros se presentan de manera intermedia entre una orientación radial y una tangencial.. Figura 3.4: Orientación de los poros desde el corte transversal: A) radial; B) bandas tangenciales; C) diagonal.. En la Figura 3.4 se pueden ver las diferentes orientaciones que presentan los poros. Éstas orientaciones ocurren frecuentemente combinadas, pudiendo encontrarse orientaciones intermedias entre la tangencial y la diagonal. También ha sido posible observar que maderas con vasos orientados en bandas tangenciales, frecuentemente presentan vasos agrupados (IAWA, 1989).. Parénquima axial También se conoce como parénquima longitudinal. Desempeña la función de almacenamiento en el leño y normalmente en mayor proporción en latifoliadas que en conı́feras. Las células de este tejido son, por lo general, 13.

(26) Capı́tulo 3. Marco teórico. Figura 3.5: Ejemplos de parénquima axial apotraqueal.. de color más claro debido a sus paredes celulares más delgadas. Se han definido tres grandes grupos de parénquima axial: Apotraqueal: cuando las células del parénquima se encuentran entre un 90 % y 95 % aisladas de los poros, sin rodearlos ni entrar en contacto con los mismos (ver Figura 3.5). En bandas: cuando las células del parénquima forman bandas con una extensión variable, que pueden estar en contacto con los poros, y siempre son perpendiculares a los radios (ver Figura 3.6). Paratraqueal: cuando entre el 90 % y el 95 % de las células del parénquima se encuentran rodeando parcial o totalmente los poros (ver Figura 3.7).. Fibra Las fibras son un tipo de célula propia de las maderas latifoliadas, que se caracterizan por ser células alargadas y estrechas. constituyen el mayor 14.

(27) Capı́tulo 3. Marco teórico. Figura 3.6: Ejemplos de parénquima axial en bandas.. porcentaje del leño ya que es todo aquello que no son poros, radios y parénquima axial. Cumplen la función de dar resistencia mecánica al cuerpo. Figura 3.7: Ejemplos de parénquima axial paratraqueal.. de la planta; su volumen y espesor influyen directamente en el peso. 15.

(28) Capı́tulo 3. Marco teórico. 3.2.. Procesamiento de las imágenes utilizando Análisis Multiresolución. Para poder identificar los tipos de células en las muestras microscópicas representadas en imágenes, es necesaria una herramienta que permita visualizar los detalles dentro de la imagen. El análisis multiresolución, conocido por sus siglas en inglés MRA4 , consiste en la representación de una señal (en este caso imágenes) en otros dominios diferentes al espacio para poder examinar su composición y ası́ estudiar la información que contiene.[12] Esta herramienta puede utilizar cualquier tipo de transformación o proyección espacial; sin embargo, para este trabajo es de mayor utilidad la transformación discreta wavelet DWT 5 , la cual por medio de escalado y desplazamiento permite realizar la descomposición de una señal en un conjunto de funciones representadas en una base wavelet ortonormal.. 3.2.1.. Trasformada wavelet. Una wavelet es una señal generada a partir del escalado y desplazamiento de una señal ψ(t), llamada wavelet madre y está definida por: 1 ψs,τ (t) = √ ψ s. . t−τ s. ,. (3.1). donde s es el factor de escala, y τ es el factor de desplazamiento. Las señales wavelet se caracterizan por estar bien localizadas en tiempo y frecuencia. Esto resulta útil ya que hace posible trasladar la señal a lo largo del dominio del tiempo, lo que otorga una mayor precisión en la representación de una señal y por lo tanto una mejor resolución en el tiempo; contrario a la transformación de Fourier, la cual emplea señales sin(x) y cos(x) de longitud infinita para descomponer una señal. Existe una gran variedad de señales wavelet, las cuales se agrupan en familias según sus caracterı́sticas y se escogen dependiendo de la señal y el tipo de análisis que se vaya a realizar. En la Figura 3.8 se muestran algunos ejemplos de las señales wavelet más utilizadas. 4 5. 16. Multi-Resolution Analysis. Discrete Wavelet Transform..

(29) Capı́tulo 3. Marco teórico. Figura 3.8: Señales wavelet madre más comunes.. La transformada wavelet está definida como la descomposición de una señal f (t) en una base de funciones wavelet ψs,τ (t). Esta se define como: Z wf (s, τ ) =. ∗ f (t)ψs,τ (t)dt. (3.2). La transformada permite realizar una proyección en un subespacio vectorial (en este caso el subespacio genera la base de funciones wavelet), en el cual se puedan visualizar otros elementos de la señal que no son muy claros en su representación original. La transformada wavelet es eficiente en el análisis local de la señal ya que la proyección se hace en tiempo o espacio.. 3.2.2.. Transformación wavelet discreta (DWT). Para facilitar la utilidad de la transformada wavelet en imágenes es recomendable utilizar su versión discreta, ya que los datos representados en las imágenes son de carácter discreto, y si bien se puede realizar el análisis con la transformada en su versión continua obteniendo resultados más completos, resulta mucho más sencillo y práctico trabajar con la DWT. 17.

(30) Capı́tulo 3. Marco teórico La discretización de la transformada wavelet consiste en muestrear los parámetros de desplazamiento τ y escalado s. Para evitar que, al representar la traslación de una función wavelet sobre la señal se obtengan representaciones diferentes, por convención se define que s tome valores de escala 2l , creando ası́ las wavelets diádicas. Al ser un muestreo discreto de la wavelet, por convención, el paso de muestreo es ∆τ = 1. Para que el desplazamiento suceda en valores enteros, el parámetro de desplazamiento debe ser un múltiplo entero del factor de escala. τ = (k − 1)s = (k − 1)2l , k = 1, 2, 3.... (3.3). La manera efectiva de implementar la DWT es a través del algoritmo de Mallat, el cual se puede entender como una representación piramidal de diferentes niveles, en la que el nivel más básico es la señal o la imagen original y conforme se asciende de nivel, las aproximaciones tienen cada vez menor resolución espacial. En la práctica es equivalente a ingresar una señal en un banco de filtros multitasa, donde una señal S de tamaño N , pasa por dos filtros, uno pasabajo llamado G y uno pasaalto llamado H. Esto se hace porque la aplicación de los filtros tiene un comportamiento similar a la correlación hecha cuando se aplica la transformación wavelet. Por eso no se habla como tal de la convolución de dos señales, sino de una pseudoconvolución. Los parámetros definidos para cada filtro dependen de la función wavelet madre que se vaya a emplear en el análisis.. Figura 3.9: Representación esquemática del análisis multiresolución de una señal utilizando la DWT.. Al pseudoconvolucionar la señal de entrada con el filtro H se obtiene 18.

(31) Capı́tulo 3. Marco teórico una señal de un subespacio vectorial denominado D1 , la cual corresponde a los coeficientes de detalle. Del mismo modo, al pseudoconvolucionar la señal de entrada con el filtro G se obtiene una señal de un subespacio vectorial A1 , la cual corresponde a los coeficientes de aproximación. Los nuevos subespacios D1 y A1 , de tamaño N/2, son la representación de la señal original S de tamaño N . Dado que el contenido frecuencial de los subespacios generados son el resultado de un submuestreo por un factor de 2 (transformación wavelet diádica), cada proyección cuenta con un reajuste en la longitud a N/2; por consiguiente, para reconstruir la señal original a partir de lo anterior, se necesita remuestrear al doble de la frecuencia.. Uso de la transformada wavelet para el procesamiento digital de imágenes Una imagen se puede definir como una señal bidimensional representada por una función f (x, y), donde x y y son coordenadas en un plano espacial, y la amplitud de f en un par de coordenadas (x, y) es llamada la intensidad o el nivel de gris de la imagen en ese punto. Cuando los valores de x, y y la amplitud de f son valores finitos que se pueden representar en cantidades discretas, podemos hablar de una imagen digital. Los elementos que componen una imagen, los cuales tienen una posición y un valor de intensidad, son llamados pı́xeles. [11] Ahora, teniendo en cuenta lo mencionado en el párrafo anterior, para implementar el algoritmo de Mallat en una imagen se pueden crear cuatro diferentes combinaciones de un filtro pasabajo y uno pasaalto: 1. Usar el filtro pasabajo (BB) a lo largo de los dos ejes. 2. Usar el filtro pasaalto a lo largo del eje x y el pasabajo (BA) a lo largo del eje y. 3. Usar el filtro pasaalto a lo largo del eje y y el pasabajo (AB) a lo largo del eje x. 4. Usar el filtro pasaalto (AA) a lo largo de los dos ejes. Esto resulta en que, en lugar de dividir la imagen en dos componentes, se divide en cuatro componentes. A diferencia del procesamiento de señales, 19.

(32) Capı́tulo 3. Marco teórico ωy. ωx. Figura 3.10: Mosaico del espacio de frecuencias que corresponde al árbol de estructura de la Figura 3.11. en el procesamiento de imágenes se puede sacar provecho de la información extraı́da de cada uno de sus componentes, utilizando la expansión de wavelets empaquetadas [13]. Las wavelets empaquetadas permiten realizar una ampliación sobre cualquier componente, analizando en cada nivel la banda con la energı́a más alta. El árbol que se construye de esa manera es llamado el árbol de estructura. La Figura 3.10 muestra un ejemplo del mosaico del espacio de frecuencias que corresponde al árbol de estructura mostrado en la Figura 20.

(33) Capı́tulo 3. Marco teórico Imagen original. BB BA. AB. AA. BB BA. AB. AA. BB BA ABAA Figura 3.11: Representación wavelet en forma de árbol de una imagen del banco de muestras.. 3.11.. 21.

(34) Capı́tulo 4. Metodologı́a. Capı́tulo 4. Metodologı́a Para la segmentación6 de los objetos correspondientes a poros y radios en las imágenes microscópicas de la madera se realiza el análisis multiresolución, el cual permite estudiar de mejor manera la composición de los pı́xeles que corresponden a los objetos en cuestión. Este análisis permite descomponer una imagen en señales que posibilitan realizar un estudio en diferentes escalas y de manera más sencilla que sobre la imagen original (en el caso de imágenes, las señales obtenidas son matrices). Para la validación del modelo es necesario que, a partir de las matrices obtenidas en diferentes escalas, se pueda hacer una reconstrucción perfecta de la imagen original. El análisis multiresolución se usa para encontrar una escala en la que los pı́xeles correspondientes a los objetos que se quieren segmentar, sean distinguibles respecto a los demás. Es importante resaltar que en este análisis la cantidad de pı́xeles en cada nivel de descomposición se reduce, y en base a ello se escoge el escalado más adecuado para nuestro objetivo. Puesto que se obtienen varias matrices de cada escalado, se empiezan a estudiar los objetos en las matrices de menor resolución procurando segmentar los pı́xeles que se presume, corresponden a los objetos buscados. Dado que la segmentación inicia desde esta escala a partir de una hipótesis, se hace totalmente necesario el uso de cada una de las matrices obtenidas en los demás escalados para confirmar o descartar los pı́xeles de los cuales 6. Proceso en el cual se agrupan pı́xeles cuyas caracterı́sticas representan un objeto, con el fin de extraerlos de la imagen.. 22.

(35) Capı́tulo 4. Metodologı́a se habı́a presumido; de esta manera, no sólo se verifica si los pı́xeles corresponden o no a los objetos buscados, sino que también se van proyectando a la resolución más alta para la reconstrucción a partir de las matrices. Junto con las matrices se utilizan también algoritmos establecidos y operaciones matemáticas que permiten estudiar la forma y la estructura de los objetos que se desean segmentar; estas operaciones reciben el nombre de operaciones morfológicas. Finalmente, una vez se obtienen los objetos que se esperaran segmentar en la imagen original (al realizar la reconstrucción perfecta de la imagen se van marcando los objetos en las diferentes escalas, para que al final se sobrepongan sobre la imagen original), se procede a aplicar criterios que permitan validar el modelo.. 23.

(36) Capı́tulo 5. Desarrollo. Capı́tulo 5. Desarrollo La Facultad de Medio Ambiente de la Universidad Distrital Francisco José de Caldas cuenta con una base de datos de fotografı́as tomadas a muestras microanatómicas de diferentes especies madereras de Bogotá D.C. Para la toma de las muestras se realizó un corte en el tronco del árbol y luego se extrajo una porción cúbica de ésta; la muestra debe poseer esa forma para observar las caracterı́sticas de la madera en los diferentes cortes (transversal, tangencial y radial). Luego, para poder estudiar cada uno de los cortes se deben tomar alrededor de 5 a 10 virutas (o láminas) de cada una de las caras del cubo para observarlas en el microscopio, teniendo especial cuidado de que la cuchilla con la que se realice el corte esté bien afilada para que la viruta salga de manera limpia y no se produzcan daños en la muestra. Sin embargo, el filo de la cuchilla con la que se tomaron las virutas no estaba afilado adecuadamente, lo que ocasionó que algunos de los elementos que componen las muestras presentaran daños. Después se observaron las diferentes virutas de cada corte en el microscopio y se escogieron aquellas cuyos elementos presentaban menos daño para tomar las fotografı́as. Puesto que en su momento las imágenes servı́an como evidencia de laboratorio y no para realizar estudios sobre estas, no existı́an parámetros que definı́an como debı́an ser tomadas las fotografı́as. Por esto, algunas fotografı́as tienen desenfoque e iluminación no uniforme. Por lo anterior, antes de iniciar el desarrollo del trabajo se debe hacer una adecuación de las imágenes que permita realizar el estudio de mejor manera. 24.

(37) Capı́tulo 5. Desarrollo. 5.1.. Acondicionamiento de las imágenes. En la Figura 5.1 se muestra un par de fotografı́as correspondientes a dos especies de la base de datos, las cuales poseen una resolución de 4416×3312 pı́xeles y un aumento óptico ×10. Se observa que las fotografı́as son de color rojizo y tienen un fondo negro que las rodea, y como éstos atributos no tienen relación con la muestra original, se deben eliminar (el color se produce por procesos quı́micos para tinción en el laboratorio, aunque para nuestro estudio, también resalta algunas caracterı́sticas de los elementos).. Figura 5.1: Imágenes tomadas de la base de datos de la Universidad Distrital.. Para eliminar el fondo, se decide realizar un recorte a una porción de la imagen a partir del centro, y de esta manera también se ajustan todas las imágenes a un tamaño fijo (aunque todas las imágenes poseen la misma resolución, algunas tiene mayor proporción de fondo que otras). El tamaño del recorte se escoge de 2048 × 2048 debido a que no solo evitamos el fondo, sino que también sus dimensiones son una potencia de 2; esto facilita la implementación del análisis multiresolución ya que la transformación discreta de wavelet realiza un submuestreo por un factor de 2. La representación del color en la imagen tiene 3 componentes que representan los colores rojo, verde y azul (RGB), con los cuales generalmente se da color a una imagen. Además de ser un color que no corresponde a la muestra original, el procesamiento de una imagen de color es más compleja respecto a una en escala de grises; es por ello que se hace una conversión usando la ecuación 5.1 [15]. 25.

(38) Capı́tulo 5. Desarrollo. Ig = 0,2989 × R + 0,5870 × G + 0,1140 × B,. (5.1). donde Ig es la imagen en escala de grises, y las componentes; R la roja, G la verde y B la azul. La Figura 5.2 muestra el acondicionamiento de las imágenes presentadas en la Figura 5.1. En la ilustración se observa además una iluminación diferente para cada fotografı́a, pero se presume que para el análisis multiresolución éste no es un factor determinante.. Figura 5.2: Resultado de acondicionar las imágenes presentadas en la Figura5.1.. 5.2.. Preprocesamiento de las imágenes. Además del daño al momento de su extracción, hay otros factores que pueden afectar la muestra como enfermedades o traumas sufridos por el tronco (ver Figura 5.3). Una forma para mitigar el impacto que estos factores puedan causar en el estudio del modelo es desenfocar la imagen. De esta manera los pı́xeles que corresponden a daños o traumas en las muestras varı́an su intensidad en relación a los pı́xeles adyacentes, principalmente al interior de los objetos, y al aplicar el análisis multiresolución la incidencia será menor. 26.

(39) Capı́tulo 5. Desarrollo Por lo anterior se decide aplicar un filtro gaussiano [16]. En la Figura 5.3 se observan los daños que tienen algunas muestras y el resultado de aplicar el filtrado.. Figura 5.3: En la imagen superior izquierda el daño en un poro causado al extraer la muestra y al costado derecho la misma imagen filtrada; en la imagen inferior izquierda el daño sufrido por la muestra debido a un factor externo y al derecho el filtrado de esta. Se observa que al filtrar la imagen, los defectos presentes en cada una de las muestras se difuminan un poco.. 5.3.. Análisis multiresolución. En el análisis multiresolución se emplea la transformación wavelet debido a que realiza la descomposición de la imagen por medio de escalado y 27.

(40) Capı́tulo 5. Desarrollo desplazamiento en una base wavelet ortonormal, lo que otorga una mayor precisión en la representación de la imagen y una mejor resolución espacial.. Figura 5.4: Matrices de coeficientes representadas como imagen tras aplicar la transformación wavelet. En la parte superior izquierda se representa la matriz de aproximación y en las posteriores se representan los detalles, todos como imagen; la parte superior derecha corresponde a los detalles horizontales, la inferior izquierda a los verticales y la restante a los diagonales.. La base de funciones wavelet ortonormales son generadas a partir de una wavelet madre, tal y como se explicó previamente en el marco teórico. Para escoger la wavelet madre se debe tener en cuenta el trabajo que se quiere realizar [17]. Como en este proyecto se va a necesitar detección de cambios en la intensidad de los pı́xeles para identificar la presencia de poros, se escoge la wavelet Haar porque es simétrica, lo que la hace muy útil para la detección de bordes. 28.

(41) Capı́tulo 5. Desarrollo Al aplicar la transformación wavelet sobre la imagen de estudio se producen unas matrices que contienen la información de aproximación y de detalles. Cada elemento de la matriz de aproximación permite que, al representarla visualmente, se obtenga una imagen similar a la original pero con dimensiones menores (esto es una consecuencia del submuestreo), mientras que los elementos en los detalles representan cuánta diferencia hay entre dos pı́xeles adyacentes en las diferentes orientaciones (horizontal, vertical y diagonal). A la operación que permite comparar una señal con otra para determinar si son o no parecidas se le conoce como correlación. En la Figura 5.4 se muestra la aplicación del primer nivel de la transformación wavelet a una de las fotografı́as de la base de datos. Dado que ésta es una representación visual de las matrices, se usa la escala de colores de grises para que sean evidentes los detalles que se desean mostrar.. Figura 5.5: Comparación del mismo objeto en los detalles horizontales entre el primer y el cuarto nivel de la transformación wavelet, respectivamente.. En cada una de las matrices de detalles se hacen más evidentes las correspondientes caracterı́sticas de orientación, es decir, en los detalles verticales se hacen más evidentes los radios que en los otros detalles porque su orientación siempre es vertical. Dado que los poros parecen cı́rculos, en todas las matrices de detalle son apreciables estos objetos, sin embargo en los detalles diagonales es más difı́cil observarlos. Por tal motivo, solo se trabaja sobre los detalles horizontales y verticales. Al analizar los detalles obtenidos en el primer nivel de wavelet se decide 29.

(42) Capı́tulo 5. Desarrollo. Figura 5.6: Matrices obtenidas al aplicar el cuarto nivel de wavelet ilustradas como imagen. Respecto a las matrices presentadas en el primer nivel, se observa una reducción en los detalles que definen al objeto; esto hace que las regiones pequeñas de pı́xeles, como las que corresponden al parénquima, se hagan despreciables respecto a las regiones grandes.. profundizar el nivel. El propósito de ello es que, al aumentar el nivel de análisis y disminuir la resolución, los objetos de mayor tamaño se conservan mientras que los de menor tamaño tienden a desaparecer. Es importante tener en cuenta que al aumentar el nivel, la calidad de la forma y la finura de los objetos disminuye. En la Figura 5.5 se muestra el mismo objeto en el primer y cuarto nivel de wavelet, respectivamente. Con cada nivel de profundidad en el análisis se hace un submuestreo y se reduce a la cuarta parte la cantidad de pı́xeles en la imagen. Esto causa 30.

(43) Capı́tulo 5. Desarrollo que cada vez los objetos sean más pequeños conforme se aumenta el nivel; por ejemplo, en el nivel quinto, los objetos se reducen a 1/1024 del tamaño original. Es por esto que se requiere escoger un nivel de profundidad en el que los objetos de estudio permanezcan, mientras que los demás desaparezcan; este nivel es el cuarto. En la Figura 5.6 se presentan las matrices resultantes de aplicar este nivel de wavelet sobre la matriz de aproximación del tercer nivel.. 5.4.. Histogramas de las matrices de detalle. Sobre las matrices de detalle obtenidas en el cuarto nivel se hace un estudio estadı́stico, usando el histograma, para analizar la cantidad de pı́xeles y sus valores.. Figura 5.7: En azul se presenta el histograma de los detalles horizontales para el cuarto nivel de wavelet. En color rojo se marca el intervalo de selección de los valores.. La Figura 5.7 muestra el histograma de los coeficientes de detalle ho31.

(44) Capı́tulo 5. Desarrollo rizontal, el cual se encuentra normalizado para simular una densidad de probabilidad. Como los valores de las matrices de detalles producidas por la transformación wavelet miden la diferencia entre pı́xeles adyacentes, y las variaciones dentro de los objetos suelen ser mı́nimas o nulas, la mayorı́a de los valores cercanos a cero corresponden al interior de los objetos. A partir de esta idea se crea un intervalo de selección de la cantidad de coeficientes a usar para segmentar los objetos en cuestión.. 5.5.. Binarización de las matrices de detalle. La binarización de una imagen es el proceso mediante el cual se crea una imagen binaria, es decir, una imagen que posee únicamente los valores de. Figura 5.8: Al costado izquierdo una imagen binaria que representa la binarización de la matriz de detalle horizontal; al costado derecho la imagen original. En color se encierran las mismas regiones en cada imagen, donde una contiene las zonas que presentan poca variación entre los valores adyacentes en la matriz y en la otra los poros, respectivamente.. cero o uno para cada pı́xel. Un método general para la binarización de una imagen o matriz consiste en establecer un valor umbral que permita agrupar pı́xeles en dos grupos diferentes; un grupo formado por aquellos valores matriciales o de pı́xeles que se encuentren por encima del valor 32.

(45) Capı́tulo 5. Desarrollo umbral, y el otro grupo de los que se encuentren por debajo. La ecuación 5.2 presenta la forma matemática usada generalmente para la binarización. g(x, y) =. 1 → f (x, y) > T , 0 → f (x, y) ≤ T. (5.2). donde g(x, y) es la imagen binaria que se crea, f (x, y) es el valor de la matriz o imagen sobre la que se realiza la binarización y T es el valor umbral escogido. En el modelo propuesto se realiza la binarización sobre las matrices de detalle para extraer los objetos que posean mayor cantidad de pı́xeles, ya que como se habı́a mencionado, las variaciones mı́nimas en las matrices de detalles representan el interior de los objetos. Para ello se escoge, en el. Figura 5.9: Resultado de aplicar la conjunción (operación de intersección) entre las imágenes binarias presentadas en la Figura 5.8.. 33.

(46) Capı́tulo 5. Desarrollo histograma, el valor superior más cercano al 23 % de la población de los datos alrededor de la moda (el dato más repetido). Los valores de la matriz que se encuentren en ese intervalo toman el valor de uno, mientras que los demás de cero. La justificación del porqué se escogió un intervalo del 23 % se presenta en el apartado 6.4 de la sección de resultados. En la Figura 5.7 se ilustra entre dos lı́neas el intervalo mencionado. Se observa que el recorte se hace en los valores más cercanos a 0, ya que la correlación de los pı́xeles que representan los poros es muy alta, es decir, que la variación de intensidad entre ellos es casi nula. Sin embargo, al tener como fundamento un criterio estadı́stico se presenta un error inherente al método que debe ser considerado posteriormente para segmentar de manera más adecuada las células de interés. En la Figura 5.8 se muestra el resultado de la binarización. Las regiones blancas corresponden a los valores en las matrices de detalle que se encontraron dentro del intervalo presentado en la Figura 5.7. También se comprueba visualmente que la mayorı́a de variaciones cercanas a cero corresponden al interior de los poros.. 5.6.. Operaciones lógicas y operaciones morfológicas. El error inherente al método mencionado anteriormente ocurre porque al binarizar la imagen se identifican los pı́xeles cuyos valores son muy parecidos entre sı́, pero además de los poros, el interior de otros elementos también cumplen con esta caracterı́stica. Sin embargo, los diferentes objetos en la imagen poseen atributos únicos para cada caracterı́stica, y es por ello que para discernir los elementos se hace uso de operaciones lógicas y operaciones morfológicas. Para disminuir los pı́xeles que no corresponden a los poros en las imágenes presentadas en la Figura 5.8 se les aplica la operación lógica de conjunción entre ellas, ya que aunque cada imagen contiene diferente información, en ambas son apreciables los poros. El resultado de la operación lógica sobre las imágenes de la Figura 5.8 se visualiza en la Figura 5.9, donde es evidente una clara disminución de zonas blancas correspondientes a parénquima y radios. 34.

(47) Capı́tulo 5. Desarrollo. Figura 5.10: Matrices resultantes de los diferentes niveles de wavelet. En la parte superior izquierda la obtenida en el primer nivel, a la derecha la obtenida en el segundo nivel, en la parte inferior izquierda la obtenida en el tercer nivel y la restante en el cuarto nivel.. Todo el proceso mencionado hasta este momento se realiza en cada uno de los niveles de la transformada, obteniendo ası́ 4 matrices binarias en total (una por cada nivel). En la Figura 5.10 se muestran en la misma resolución las 4 imágenes binarias obtenidas en los diferentes niveles wavelet. Se puede ver que entre mayor sea el nivel wavelet aparecen menos objetos, porque la calidad disminuye. Por esta razón, se decide usar las matrices obtenidas en los tres niveles más altos para descartar objetos, y la de menor nivel para darle una mejor forma a los mismos. Con el fin de descartar objetos se aplica la operación de conjunción 35.

(48) Capı́tulo 5. Desarrollo entre las matrices ya mencionadas. Para dar la forma al objeto se aplica un algoritmo conocido como floodfill o algoritmo de llenado[18], el cual consiste en tomar un pı́xel o una región de ellos, y a través de dilataciones sucesivas hacer que dicha región aumente de tamaño hasta que se abarca toda la región perteneciente al objeto.. Figura 5.11: Semilla e imagen a la que se aplica el algoritmo de llenado respectivamente.. Para aplicar el algoritmo de llenado al modelo propuesto se debe crear la semilla y definir la imagen que determina en que momento se detiene el algoritmo (a esta última le llamaremos criterio de parada). Para ello se hace uso de las imágenes binarias presentadas en la Figura 5.10; para crear la semilla se aplica la conjunción lógica entre las imágenes obtenidas en el 2do ,3er y 4to nivel, y en la imagen resultante se reduce cada objeto a un solo pı́xel; y para el criterio de parada se usa la imagen binaria obtenida a partir del 1er nivel. En la Figura 5.11 se muestran la semilla y el criterio de parada. La Figura 5.12 muestra el resultado de aplicar la operación de llenado en el modelo. En ella se observan principalmente poros, pero debido a que los radios y el parénquima presentan tamaño considerable en algunas imágenes, es necesario eliminar los objetos no deseados. Un estudio en las imágenes evidencia que el tamaño de los poros nunca es menor a 250 pı́xeles, y es por ésta razón que todos los objetos cuya área es menor son eliminados. En la 36.

(49) Capı́tulo 5. Desarrollo. Figura 5.12: Resultado de la aplicación del algoritmo morfológico de llenado a los poros segmentados.. Figura 5.13 se presenta el resultado al eliminar los objetos mencionados. Finalmente se aplica la transformada inversa de wavelets para reconstruir la imagen original; sin embargo, para evidenciar los resultados se modifican los coeficientes de detalle horizontal del primer nivel. La modificación consiste en invertir y multiplicar la imagen binaria presentada en la Figura 5.13 con la de detalles, de forma tal que las zonas segmentadas como poros serán de color negro en la reconstrucción de la imagen. La imagen obtenida del modelo se presenta en la Figura 5.14. En ella se observa que la mayorı́a de poros que no presentaban daño fueron segmentados de manera parcial. Los resultados obtenidos para cada una de las imágenes se presentan en el Anexo 2.. 37.

(50) Capı́tulo 5. Desarrollo. Figura 5.13: Matriz obtenida al eliminar los objetos cuya área está conformada por menos de 250 pı́xeles en la imagen presentada en la Figura 5.12.. 38.

(51) Capı́tulo 5. Desarrollo. Figura 5.14: Imagen resultante de aplicar el modelo sobrepuesta a la original. Las zonas negras corresponden a la segmentación obtenida por el modelo.. 39.

(52) Capı́tulo 6. Resultados. Capı́tulo 6. Resultados El modelo propuesto (al cual se le dirá solamente modelo a partir de ahora) segmenta los pı́xeles que corresponden a los poros en las imágenes. Para que el modelo sea eficaz debe tener una tasa alta de aciertos sobre los objetos que segmenta como poros y que sean poros, ası́ como capaz de discriminar aquellos objetos que pueden tener caracterı́sticas similares a los poros, pero que no lo son. Como la evaluación del modelo se basa en medir las tasas de acierto y de error, y para ello debe existir una comparación, se debe crear una imagen en la que todos los poros se encuentren segmentados de forma adecuada. Por este motivo, con la ayuda de un experto en el tema de la anatomı́a de las maderas, fueron segmentados los poros en cada una de las imágenes para luego ser tomadas como la segmentación ideal. Posteriormente, se realiza la comparación entre la imagen creada y la imagen obtenida por el modelo y, a partir de ellos, se realizan tres medidas. La primera medida es la cantidad de elementos segmentados como poro, y que en efecto son poros; a este valor se le conoce como verdadero positivo (VP ). La segunda medida cuenta la cantidad de poros que existen en la imagen, pero que el modelo no detectó; a este valor se le llama falso negativo (FN ). La tercera medida corresponde al número de elementos que el modelo detectó como poros, pero que en realidad no son poros; a este valor se le denomina falso positivo (FP ).. 40.

(53) Capı́tulo 6. Resultados. Especie Xylosma spiculifera (Tul.) Triana & Planch A Xylosma spiculifera (Tul.) Triana & Planch B Xylosma spiculifera (Tul.) Triana & Planch C Clusia multiflora Kunth Morella parvifolia (Benth.) Parra-O Gaiadendron punctatum (Ruiz & Pav.) G. Don Verbesina crassiramea S.F. Blake Ilex laurina Kunth Solanum cornifolium Dunal A Citharexylum sulcatum Moldenke. Cantidad de imágenes. Verdaderos Positivos (VP ). Falsos Positivos (FP ). Falsos Negativos (FN ). 5. 39.2. 0.4. 9.4. 5. 38.8. 1.4. 3.0. 5. 32.8. 0.4. 16.4. 4. 14.75. 6.25. 0.25. 5. 47.6. 12. 5. 4. 14. 5.25. 0.75. 5. 31.6. 0.6. 15.4. 4. 23.5. 6.75. 2.25. 6. 38.33. 0.33. 14.33. 5. 28. 1.8. 0.8. 41.

(54) Capı́tulo 6. Resultados. Especie Critoniopsis bogotana (Cuatrec.) H. Rob Pictocoma Palicourea cf. angustifolia Kunth Miconia denticulata Naudin Geissanthus andinus Mez Cinchona pubescens Vahl Solanum cornifolium Dunal B. Cantidad de imágenes. Verdaderos Positivos (VP ). Falsos Positivos (FP ). Falsos Negativos (FN ). 5. 30.8. 3.2. 3.8. 6. 67.33. 0.66. 7.33. 5. 38.6. 0.8. 5.2. 6. 35.5. 0.83. 7.5. 5. 14.2. 6.6. 1.6. 5. 26.6. 0.4. 2.4. 3. 40.66. 0.66. 9. Cuadro 6.1: Algunos datos hallados de la matriz de confusión para cada una de las especies madereras.. Posteriormente, con los valores medidos se hacen algunos cálculos que se derivan de la matriz de confusión 1 . Estos cálculos son la sensibilidad (S) y el valor predictivo positivo (V P P ); a partir de estos se calcula un tercer parámetro que se conoce como F1 Score. El Cuadro 6.1 presenta los valores promedio hallados para cada especie. Para calcular el promedio, se hallaron los valores de VP , FN y FP para cada imagen. Luego, por especies, se realizó la sumatoria y se dividió el resultado 1. Una matriz de confusión es una tabla especı́fica diseñada para visualizar el rendimiento de un algoritmo con base en una comparación entre lo que se busca y lo que se obtiene.. 42.

(55) Capı́tulo 6. Resultados entre el total de imágenes. Debido a esto, y aunque los valores de VP , FN y FP son números enteros para cada imagen, los datos mostrados en la tabla se presentan como números reales. El valor de verdaderos negativos (otro parámetro que se incluye en la matriz de confusión, conocido como VN ), no se calculó debido a que el modelo segmenta un tipo de célula en particular, por lo cual no tendrı́a sentido medir los objetos que no son segmentados y que no pertenecen al objeto de estudio.. 6.1.. Sensibilidad o recall. La sensibilidad (S) es la medición de la capacidad que tiene el modelo de segmentación para identificar los casos positivos correctamente. Dicho en otras palabras, es la probabilidad de identificar correctamente un poro. La sensibilidad puede estimarse a partir de la proporción de poros que fueron identificados con el modelo respecto al total de poros, tal como se muestra en la ecuación 6.1.. S=. 6.2.. VP V P + FN. (6.1). Valor predictivo positivo o precisión. El valor predictivo mide la eficacia real del modelo planteado. En el caso del valor predictivo positivo (V P P ), es la probabilidad de que se detecte correctamente un poro si el resultado es positivo. El valor predictivo positivo puede estimarse a partir de la proporción de poros que fueron identificados y que resultaron ser poros respecto al total de poros detectados (el total de poros incluye aquellos que no son poros, pero que fueron contados como poros), como se presenta en la ecuación 6.2.. V PP =. VP VP + FP. (6.2) 43.

(56) Capı́tulo 6. Resultados. 6.3.. F1 Score. El F1 Score, mide la exactitud del modelo. Se considera una medida armónica que combina los valores de la sensibilidad y del valor predictivo positivo. La fórmula general se presenta en la ecuación 6.3. La variable β define el peso que tiene la sensibilidad y el valor predictivo positivo; si β es igual a uno se está dando la misma importancia a la sensibilidad que al valor predictivo positivo; si es menor a 1, se da más importancia a la sensibilidad; y, si es mayor a 1, al valor predictivo positivo. Para evaluar el modelo se escoge β = 1. F 1 = (1 + β 2 ) ·. 6.4.. β2. V PP · S · V PP + S. (6.3). Selección del intervalo de binarización. Como se mencionó en la sección de desarrollo, previo a la binarización de las matrices de detalles, se debe crear un intervalo de selección sobre la población de los coeficientes de dichas matrices. Para comodidad del lector, a partir de ahora se le llamará a este intervalo como intervalo de binarización. El intervalo de binarización de las matrices de detalle se escogió con base en los resultados, es decir, el intervalo se varió para obtener los resultados más apropiados de acuerdo con el propósito del trabajo. Cabe recordar que el intervalo escogido fue del 23 % sobre la población de los coeficientes. Para llegar a este valor, se creó un algoritmo que contó los falsos positivos, los falsos negativos y los verdaderos positivos sobre la imagen binaria previa al cálculo de la transformación inversa wavelet (ver Figura 5.13). Después se aplicó el modelo varias veces para diferentes intervalos, iniciando en un intervalo del 10 % hasta el 40 %, con incrementos del 1 %. Posteriormente, se calculó la sensibilidad, el valor predictivo positivo y el F1 Score y, con base en ello, se escogió el intervalo más adecuado. Al analizar los cálculos obtenidos en cada intervalo y graficarlos, se determinó que el intervalo que ofrece mejores resultados se encuentra entre el 20 % y el 25 % según la especie. En el anexo 1 se encuentran los valores obtenidos de estos porcentajes según la especie. 44.

(57) Capı́tulo 6. Resultados En las Figuras 6.1, 6.2 y 6.3 se muestran las gráficas correspondientes a la sensibilidad, el valor predictivo positivo y el F1 Score, respectivamente. En cada una de ellas se presentan 6 curvas que corresponden a las 17 especies agrupadas por un comportamiento similar: Grupo 1: especies Xylosma spiculifera (Tul.) Triana & Planch A,Xylosma spiculifera (Tul.) Triana & Planch C y Verbesina crassiramea S.F. Blake. Grupo 2: especies Xylosma spiculifera (Tul.) Triana & Planch B, Citharexylum sulcatum Moldenke, Pictocoma, Palicourea cf. angustifolia Kunth y Cinchona pubescens Vahl. Grupo 3: especies Clusia multiflora Kunth y Gaiadendron punctatum (Ruiz & Pav.) G. Don. Grupo 4: especies Morella parvifolia (Benth.) Parra-O y Geissanthus andinus Mez. Grupo 5: especies Ilex laurina Kunth y Critoniopsis bogotana (Cuatrec.) H. Rob. Grupo 6: especies Solanum cornifolium Dunal A, Miconia denticulata Naudin y Solanum cornifolium Dunal B. En la Figura 6.1 se observa que a medida que aumenta el intervalo de binarización la sensibilidad tiende a mejorar. Esto sucede porque la sensibilidad mide la cantidad de elementos correctamente clasificados respecto al total, y al aumentar el intervalo, el resultado presenta mayor cantidad de objetos segmentados independientemente si son o no correctos. Respecto al valor predictivo positivo, en la Figura 6.2 se presentan las gráficas correspondientes a las familias agrupadas. Como el valor predictivo positivo mide la probabilidad de que un elemento sea segmentado correctamente y, al aumentar el intervalo, también lo hace la cantidad de objetos, el valor tiende a disminuir entre más grande sea el intervalo. Las gráficas correspondientes al F1 Score se muestran en la Figura 6.3. Ya que este valor resulta de la mezcla de la sensibilidad y del valor predictivo positivo, y como estos tienden a ser inversamente proporcionales, las gráficas del F1 Score tienen la forma de la sensibilidad al inicio y la del 45.

(58) Capı́tulo 6. Resultados. S. 1. S1 S2 S3 S4 S5 S6. 0.9. Cálculo de la sensibiidad (S). 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 10. 15. 20. 25. 30. 35. 40. Intervalo (%). Figura 6.1: Valores promedios de la sensibilidad (S) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma.. valor predictivo positivo al final. En está gráfica se evidencia que los mejores resultados se encuentran para un intervalo ubicado aproximadamente entre el 20 % y el 25 %. Finalmente, se ordenaron los valores del intervalo con el mejor y segundo mejor resultado para cada especie y se asignó a cada uno un puntaje de 2 y 1, respectivamente. Luego se hizo la sumatoria de puntos y el intervalo con mayor puntaje fue el escogido.. 6.5.. Discusión. Con las ecuaciones anteriormente escritas se realizó el cálculo de cada una de las medidas sobre las imágenes, y posteriormente se promediaron por especies. El modelo se aplicó a un total de 83 imágenes, correspondientes a 15 especies; la especie Xylosma spiculifera (Tul.) Triana & Planch tiene 3 muestras diferentes, ası́ que se tomaron como si fueran 17 especies 46.

(59) Capı́tulo 6. Resultados. VPP. Cálculo del valor predictivo positivo (VPP). 1. VPP1 VPP2 VPP3 VPP4 VPP5 VPP6. 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 10. 15. 20. 25. 30. 35. 40. Intervalo (%). Figura 6.2: Valores promedios del valor predictivo positivo (V P P ) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma.. madereras en total. El cuadro 6.2 presenta los cálculos obtenidos. Como el F1 Score se calculó dando la misma importancia a la sensibilidad que al valor predictivo positivo, se puede tomar como un primer indicador para conocer la eficacia del modelo. Sin embargo, deben ser analizados los otros indicadores ya que en algunos casos la sensibilidad es muy buena pero el valor predictivo no, o viceversa, lo cual no se conoce con el F1 Score. El cuadro 6.2 contiene cada uno de los valores calculados para las especies madereras. El F1 Score en la mayorı́a de los casos es superior a 0,8, lo cual podrı́a indicar que la respuesta del modelo es buena en términos generales, pero si se observan en estos mismos casos los valores de sensibilidad y valor predictivo positivo, es posible que uno de los dos sea muy inferior a lo esperado, como es por el ejemplo el caso de la especie Xylosma spiculifera (Tul.) Triana & Planch C. 47.

(60) Capı́tulo 6. Resultados. Valor-F. 1. F11 F12 F13 F14 F15 F16. 0.9. Cálculo del valor-F. 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 10. 15. 20. 25. 30. 35. 40. Intervalo (%). Figura 6.3: Valores promedios del F1 Score (F ) para cada grupo de especies, en relación al intervalo de selección escogido en el histograma.. Especie. Xylosma spiculifera (Tul.) Triana & Planch A Xylosma spiculifera (Tul.) Triana & Planch B Xylosma spiculifera (Tul.) Triana & Planch C Clusia multiflora Kunth Morella parvifolia (Benth.) Parra-O. 48. Cantidad imágenes. Valor Predictivo. Sensibilidad (S). Valor-F. Positivo (V P P ) min mean max. min. mean. max. min. mean. max. 5. 0.750. 0.804. 0.868. 0.953. 0.991. 1. 0.857. 0.887. 0.929. 5. 0.913. 0.928. 0.944. 0.943. 0.964. 0.981. 0.930. 0.945. 0.962. 5. 0.439. 0.682. 0.857. 0.970. 0.988. 1. 0.610. 0.797. 0.923. 4. 0.944. 0.986. 1. 0.632. 0.709. 0.889. 0.774. 0.821. 0.941. 5. 0.806. 0.910. 0.976. 0.714. 0.796. 1. 0.781. 0.846. 0.968.

(61) Capı́tulo 6. Resultados. Especie. Gaiadendron punctatum (Ruiz & Pav.) G. Don Verbesina crassiramea S.F. Blake Ilex laurina Kunth Solanum cornifolium Dunal A Citharexylum sulcatum Moldenke Critoniopsis bogotana (Cuatrec.) H. Rob Pictocoma Palicourea cf. angustifolia Kunth Miconia denticulata Naudin Geissanthus andinus Mez Cinchona pubescens Vahl Solanum cornifolium Dunal B. Cantidad imágenes. Sensibilidad (S). Valor Predictivo. Valor-F. Positivo (V P P ) min mean max. min. mean. max. min. mean. max. 4. 0.857. 0.943. 1. 0.522. 0.738. 0.889. 0.649. 0.825. 0.941. 5. 0.524. 0.668. 0.830. 0.951. 0.985. 1. 0.687. 0.791. 0.886. 4. 0.871. 0.926. 1. 0.5. 0.751. 1. 0.667. 0.807. 0.961. 6. 0.619. 0.733. 0.837. 0.951. 0.992. 1. .765. 0.841. 0.911. 5. 0.931. 0.973. 1. 0.900. 0.939. 0.971. 0.931. 0.955. 0.981. 5. 0.806. 0.889. 0.947. 0.720. 0.888. 0.977. 0.818. 0.885. 0.954. 6. 0.855. 0.900. 0.933. 0.967. 0.990. 1. 0.920. 0.943. 0.959. 5. 0.809. 0.881. 0.933. 0.947. 0.979. 1. 0.895. 0.927. 0.954. 6. 0.654. 0.839. 0.919. 0.944. 0.976. 1. 0.773. 0.900. 0.944. 5. 0.812. 0.901. 1. 0.636. 0.687. 0.737. 0.743. 0.777. 0.823. 5. 0.852. 0.918. 0.958. 0.961. 0.985. 1. 0.920. 0.950. 0.979. 3. 0.796. 0.819. 0.830. 0.975. 0.984. 1. 0.876. 0.894. 0.907. Cuadro 6.2: Valores promedios por especies para la sensibilidad, el valor predictivo positivo y el F1 Score. En cada familia se muestra el valor mı́nimo, el promedio y el máximo para cada uno de los cálculos.. Si bien el algoritmo realiza la detección de la mayorı́a de los objetos que corresponden a poros, en algunas imágenes no se obtienen los resultados esperados debido a errores en la toma de la muestra o defectos de la imagen. Dentro de los errores de la toma se encuentran principalmente el desenfoque y la iluminación no uniforme, aunque como se dijo inicialmente, esta última no se considera para el desarrollo del modelo. En cuanto a los defectos de la imagen aparecen traumas en algunas muestras, posiblemente por golpes. Otro factor que alteró los resultados del modelo tiene que ver con la porción de la muestra tomada, ya que dependiendo de las estaciones del 49.

(62) Capı́tulo 6. Resultados año, los elementos que componen la anatomı́a de las maderas presentan cambios en algunas de sus caracterı́sticas para adaptarse principalmente a la condiciones de humedad. La Figura 6.4 presenta dos de los problemas anteriores. Por un lado es evidente el desenfoque en la imagen, lo que causa que los bordes y el objeto no sean claramente distinguibles. Esto ocasiona que, al aplicar la trasformación wavelet, el valor de los coeficientes de detalle no midan las diferencias como se esperarı́a. Además, hacia la parte baja de la imagen se nota un ligero cambio en cuanto a las caracterı́sticas de los elementos debido a un cambio de estaciones.. Figura 6.4: Resultado para una de las muestras de la especie Xylosma spiculifera (Tul.) Triana & Planch. La falta de enfoque en la imagen provocó que no se detectaran la mayorı́a de los poros.. 50.