• No se han encontrado resultados

Exploración del uso de la morfología matemática en el tratamiento de imágenes a color

N/A
N/A
Protected

Academic year: 2020

Share "Exploración del uso de la morfología matemática en el tratamiento de imágenes a color"

Copied!
61
0
0

Texto completo

(1)IEL2-2002-II-26. EXPLORACIÓN DEL USO DE LA MORFOLOGÍA MATEMÁTICA EN EL TRATAMIENTO DE IMÁGENES A COLOR. CAMILO VEJARANO ÁLVAREZ. UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA BOGOTÁ, D.C. 2002.

(2) IEL2-2002-II-26. EXPLORACIÓN DEL USO DE LA MORFOLOGÍA MATEMÁTICA EN EL TRATAMIENTO DE IMÁGENES A COLOR. CAMILO VEJARANO ÁLVAREZ. Proyecto de Grado para optar al título de Ingeniero Electrónico. Asesor ALFREDO RESTREPO PALACIOS, Ph.D.. UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA BOGOTÁ, D.C. 2002.

(3) IEL2-2002-II-26. CONTENIDO. Página Lista de abreviaturas más usadas. 6. Resumen. 7. Introducción. 8. 1. Morfología sobre representación vectorial de la imagen. 13. 1.1. Representación vectorial de la imagen. 13. 1.2. Propuesta de ordenamiento condicional de Louverdis et al.. 13. 1.3. Ventajas y problemas. 14. 1.4. Mejoras propuestas. 16. 1.4.1. Operaciones sobre la coordenada de saturación. 16. 1.4.2. Gradiente morfológico con coordenada h circular. 17. 1.5. Conclusiones parciales. 20. 2. Morfología sobre representación escalar de la imagen. 24. 2.1. Motivación e idea general. 24. 2.2. Representación escalar de la imagen. 25. 2.3. Imagen: longitud finita, longitud infinita. 26. 2.4. Operaciones morfológicas. 28 2.

(4) IEL2-2002-II-26. 2.4.1. Erosión. 28. 2.4.2. Dilatación. 31. 2.4.3. Apertura. 32. 2.4.4. Otras operaciones. 33. 2.5. Comentarios sobre los sistemas de color. 33. 2.6. Ejemplo de aplicación. 34. 2.7. Sobre la eficiencia de los algoritmos. 35. 2.8. Conclusiones parciales. 36. 3. Morfología sobre división de la imagen por procesos oponentes de color. 40. 3.1. Introducción. 40. 3.2. División de la imagen por procesos oponentes de color. 40. 3.3. Tratamiento de las zonas de color. 42. 3.4. Reincorporación de la información en la imagen. 42. 3.5. Ejemplo de aplicación. 44. 3.6. Conclusiones parciales. 44. 4. Resumen de Conclusiones. 49. Apéndice 1: Morfología matemática binaria y de escala de grises. 50. Apéndice 2: Sistemas de color. 56. Referencias bibliográficas. 59. 3.

(5) IEL2-2002-II-26. LISTA DE FIGURAS. Página Figura 1: Supresión de ruido con MM con ordenamiento marginal. 12. Figura 2: Dilatación y erosión con ordenamiento marginal. 12. Figura 3: Representación vectorial de una imagen a color. 21. Figura 4: Dilatación vectorial en HSV con coordenada s y s’. 21. Figura 5: Problema de los rojos: explicación. 21. Figura 6: Problema de los rojos: ejemplo. 22. Figura 7: Gradiente morfológico con coordenada h circular. 23. Figura 8: Representación escalar de una imagen a color. 37. Figura 9: Erosión escalar en RGB. 37. Figura 10: Interpretación de la erosión escalar en RGB. 37. Figura 11: Interpretación de la apertura escalar en RGB. 38. Figura 12: Apertura escalar en RGB. 38. Figura 13: Ejemplo de aplicación de la MM escalar. 39. Figura 14: Zonas de color de una imagen. 46. Figura 15: Dilatación de la zona azulada de una imagen. 47. Figura 16: Erosión de la zona amarilleja de una imagen. 47. Figura 17: Ejemplo de aplicación de la MM sobre procesos oponentes. 48. Figura A1.1: Dilatación binaria. 54. Figura A1.2: Erosión binaria. 54. 4.

(6) IEL2-2002-II-26. Figura A1.3: Apertura binaria. 54. Figura A1.4: Cierre binario. 55. Figura A1.5: MM en escala de grises. 55. Figura A1.6: Gradiente morfológico binario interno. 55. Figura A2.1: Sólido de color RGB. 58. Figura A2.2: Sistema de color de Hering. 58. Figura A2.3: Sólido de color HSV. 58. 5.

(7) IEL2-2002-II-26. LISTA DE ABREVIATURAS MÁS USADAS. MM:. Morfología matemática. EE:. Elemento de estructura. h:. Hue, Matiz. s:. Saturation, Saturación. v:. Value, Valor. ASF:. Alternating Sequential Filter. 6.

(8) IEL2-2002-II-26. RESUMEN. Aunque existen definiciones ampliamente aceptadas de morfología matemática (MM) para imágenes binarias y de escala de grises, representadas como conjuntos y funciones esclares respectivamente (ver, por ejemplo [3,4]), no sucede lo mismo para las imágenes a color; la extensión de los operadores morfológicos a éstas no es inmediata. En este trabajo se explora el uso de la MM en imágenes a color y se muestran tres posibles aproximaciones diferentes al tema. La primera de ellas, descrita en el capítulo 1 consiste en analizar la propuesta de Louverdis et al. [5] de morfología sobre una representación vectorial de la imagen en el espacio de color HSV (para una descripción de este espacio, véase el apéndice 2). En ésta, las imágenes son funciones de Z2!Z3 y tienen un grafo que “vive” en Z5. Se propone un cambio del tratamiento de la coordenada s para hacerlo mas coherente con el ordenamiento propuesto y se mejora el problema de detección falsa de bordes con el gradiente morfológico en zonas rojizas de la imagen. Para esto último se combina el ordenamiento condicional con la idea de Hanbury y Serra [6] del tratamiento circular de la coordenada h. En el capítulo 2 se enfoca el problema desde un punto de vista distinto y no tradicional: tratar la imagen a color como una función escalar incorporando el color en una coordenada adicional del dominio de la imagen, sobre esta representación se trabaja una versión de la morfología de grises extendida a funciones con dominio de 3 dimensiones. En este caso las imágenes son funciones con grafo en Z4 y aunque la visualización no es fácil, la propuesta admite algunas interpretaciones intuitivas y tiene la ventaja de ser una morfología de escala de grises que hereda todas las propiedades de los operadores y aporta nuevas capacidades en el tratamiento del color, especialmente en segmentación por características de forma y color. 7.

(9) IEL2-2002-II-26. Finalmente se presenta una aproximación distinta, que guarda cierta relación con los métodos de ordenamiento marginal (tratar los componentes de color de la imagen separadamente), consiste en dividir la imagen en zonas de acuerdo a procesos oponentes de color en el espacio de color de Hering (apéndice 2), realizar operaciones morfológicas en zonas de la imagen y reconstruirla. Este método se describe en el capítulo 3. En todos los casos se busca preservar los aportes de la morfología binaria y de escala de grises en cuanto a tratamiento de forma e intensidad y añadir una forma de tener en cuenta el color como portador importante de información en la imagen. Para este proyecto, el trabajo incluyó el análisis y desarrollo teórico de las diferentes propuestas así como la implantación de los algoritmos en Matlab y la realización de pruebas (cualitativas) sobre diversas imágenes, las más relevantes se incluyen como ejemplos en este documento. En el apéndice 1 se resumen brevemente las definiciones de representación de imágenes binarias y de escala de grises y de los operadores morfológicos en cada una siguiendo la notación de [3]. Para una mejor introducción a la MM pude consultarse [3,4]. En el apéndice 2 se tratan los sistemas de color mencionados en el documento.. 8.

(10) IEL2-2002-II-26. INTRODUCCIÓN. La morfología matemática nació a finales de los años 70 con los trabajos de Matheron [1] y Serra [2] y se ha consolidado como una poderosa técnica útil en la solución de muchos problemas de tratamiento de imágenes. Se basa en un enfoque geométrico que la hace especialmente buena para tratar explícitamente las formas. Las operaciones morfológicas se han definido para imágenes binarias y de escala de grises incluso con dominios de dimensión mayor que 2 (sólidos en un espacio tridimensional, por ejemplo). Las técnicas de MM para el tratamiento y análisis de imágenes binarias y de escala de grises como detectores de bordes con gradientes morfológicos, segmentación. con. la. transformación. Watershed,. filtrado,. granulometrías,. reconocimiento de patrones, etc., se vienen usando con éxito en distintas aplicaciones en el ámbito del tratamiento digital de imágenes [7 -13]. En general las definiciones de MM son abstractas y aplican sobre cualquier cosa que tenga la estructura de retícula completa [1,9] (complete lattice), es decir un conjunto con una relación de orden parcial en el que todo subconjunto no vacío tiene supremo e ínfimo. Para el caso de las imágenes a color se presenta el problema básico de establecer cierta representación de la imagen y sobre ésta, la relación de orden para poder definir el supremo e ínfimo de un conjunto y derivar las operaciones básicas: erosión y dilatación, sobre las que se construyen las demás. Típicamente la representación es la de una función vectorial en la que los distintos componentes (normalmente 3) corresponden a los canales de color de la imagen en cierto espacio de color. Para esta representación hay tres formas. 9.

(11) IEL2-2002-II-26. tradicionales de ordenamiento: orden marginal, orden reducido y orden condicional, cada una de las cuales genera un tipo distinto de morfología. El ordenamiento marginal, que es el más difundido, es sencillamente procesar cada componente de color separadamente con morfología de escala de grises; puede verse que es equivalente a definir el “máximo” (“mínimo”) de un conjunto de vectores como el vector que resulta de tomar los máximos (mínimos) de cada componente. Estos “máximos” y “mínimos” no necesariamente pertenecen al conjunto (no son máximos ni mínimos estrictamente hablando) por lo que la morfología derivada de esta forma puede alterar el balance de color de la imagen; además, al tratar cada componente separadamente, no se tiene en cuenta la relación entre los distintos componentes de color en el elemento de estructura (EE) al hacer operaciones invariantes bajo desplazamientos del mismo (aperturas, cierres). Por otra parte es una forma fácil de aplicar la morfología en imágenes a color y puede servir por ejemplo para la remoción de ruido con filtros morfológicos o ASFs (Alternating Sequential Filter [9]) como se muestra en la figura 1. El conocido programa de edición digital de imágenes Paint Shop Pro, utiliza morfología por ordenamiento marginal en el espacio RGB con elementos de estructura elementales para lograr los efectos visuales de erosión y dilatación (dilate, erode en el programa), con los que agranda las zonas oscuras y claras de la imagen respectivamente; un ejemplo se puede apreciar en la figura 2. El ordenamiento reducido consiste en calcular, para cada píxel de la imagen (que es un vector), un valor escalar y ordenar de acuerdo a dicho valor; dependiendo de qué valor se calcule (por ejemplo la norma del vector) puede resultar una morfología con interpretaciones mas o menos razonables; el problema fundamental de esta propuesta es la posible aparición de múltiples máximos o mínimos en un conjunto. En la práctica son raras las aplicaciones de este tipo de ordenamiento. El problema de múltiples máximos y mínimos lleva a la idea del ordenamiento marginal, que es ordenar los vectores de acuerdo al valor de cierta componente,. 10.

(12) IEL2-2002-II-26. aquellos que tengan el mismo valor (si los hay) se ordenan de acuerdo a otra componente y así sucesivamente. Este tipo de ordenamiento sirvió para definir la morfología para imágenes a color en [5], que se describe con mayor detalle en el capítulo 1; por ahora basta mencionar que el sistema de coordenadas de color que se escoja y el orden de importancia que se les dé en el ordenamiento, es fundamental en las propiedades de la morfología que resulta. Además de estos ordenamientos para la representación vectorial de las imágenes a color, también se puede tratar únicamente ciertas componentes de ella con la MM de escala de grises, el caso evidente es convertir la imagen a color a una de grises (sólo componente de intensidad), pero podría tratarse sólo la componente correspondiente al color de interés según la aplicación. Esta idea está relacionada con el método presentado en el capítulo 3. Estas son las formas más conocidas en que se ha trabajado la MM para imágenes a color, cada una con bondades y problemas; sin embargo aún no se llega a una definición universalmente aceptada como las existentes para imágenes binarias y de grises (esto, debido en parte a que no hay una única representación para una imagen a color), con lo que el tratamiento de imágenes a color sigue siendo un campo de desarrollo activo dentro de la MM en el que seguramente jugará un papel importante el uso de distintos sistemas de coordenadas de color. Adicionalmente, aunque la morfología se define igualmente para funciones con dominio y rango tanto continuo como discreto, en adelante se tratarán únicamente imágenes digitales.. 11.

(13) IEL2-2002-II-26. (a). (b). Figura 1: Supresión de ruido con morfología con ordenamiento marginal. (a) Imagen original. (b) Resultado de apertura y cierre con EE de 2x2.. (a). (b). (c). Figura 2. Dilatación y erosión con ordenamiento marginal. (a) Imagen original. (b),(c) Dilatación y erosión con ordenamiento marginal en RGB.. 12.

(14) IEL2-2002-II-26. MORFOLOGÍA SOBRE REPRESENTACIÓN VECTORIAL DE LA IMAGEN. 1.1 REPRESENTACIÓN VECTORIAL DE LA IMAGEN Como ya se mencionó, la forma más común de representar una imagen a color es como una función vectorial. En este capítulo se considerará como el dominio de la función, un subconjunto de Z2, finito y rectangular y el rango será R3 (o un subconjunto de Z3 en el caso de una máquina digital; la diferencia no es relevante aquí). El conjunto de valores válidos en el rango depende del sistema de color que se utilice: Imagen I : I : D → R 3 , D ⊂ Z 2 Así, a cada punto del dominio de la imagen (píxel) le corresponde un vector de longitud 3 con los valores de las coordenadas de color en el sistema de color que se esté usando (ver figura. 3).. 1.2 PROPUESTA DE ORDENAMIENTO CONDICIONAL DE LOUVERDIS ET AL. Louverdis, Vardavoulia, Andreadis y Tsalides, investigadores de la Democritus University of Thrace, proponen en [5] un ordenamiento condicional en el espacio de color HSV (hue, saturation, value, o matiz, saturación y valor, ver apéndice 2) con el cual definen operaciones morfológicas para imágenes a color y muestran posibles aplicaciones, en particular la detección de bordes con un gradiente morfológico interno. Esta morfología vectorial incluso se ha implementado en Hardware [14].. 13.

(15) IEL2-2002-II-26. Para los detalles formales se remite al lector a la fuente [5], básicamente la propuesta consiste en ordenar los vectores ascendentemente de acuerdo al valor de su coordenada v, los empates se resuelven ordenando descendentemente por su coordenada s y luego ascendentemente por el valor de h. Así, los píxeles mas claros se consideran siempre mayores (resultado de que la coordenada v domine el ordenamiento), para aquellos con igual intensidad se consideran mayores los mas acromáticos (menor saturación). Además del ordenamiento se definen en el artículo las operaciones de suma y resta de vectores (componente a componente), la traslación espacial y la reflexión de una imagen. Con esto se define la erosión y dilatación vectoriales de forma similar a las existentes para escala de grises (estas definiciones están en el apéndice 1), reemplazando el supremo e ínfimo por las versiones vectoriales resultantes del ordenamiento ya descrito.. 1.3 VENTAJAS Y PROBLEMAS Es importante mencionar algunas de las propiedades y características de esta morfología por la relación que tienen con las mejoras propuestas en este capítulo: una ventaja que tiene es que preserva los vectores de la imagen porque el mínimo o máximo de un conjunto pertenecen a él, esto hace que no se introduzcan colores que no estén presentes en la imagen original y permite implementar filtros morfológicos que eliminen ruido en las tres componentes sin alterar el balance de color de la imagen (esta aplicación también se ilustra en la referencia [5]). También, al basar el ordenamiento fundamentalmente en la coordenada v, se trabaja principalmente con la intensidad de la imagen por lo que las dilataciones y erosiones tienen el efecto visual de agrandar las zonas claras y oscuras, respectivamente, de la imagen. De otro lado, el orden condicional también hace que las propiedades de los operadores morfológicos relativas al orden de las imágenes (crecientes, 14.

(16) IEL2-2002-II-26. decrecientes, extensivas, etc., ver apéndice 1) se cumplan, por la misma definición, respecto al ordenamiento usado, pero no necesariamente respecto a las componentes de color; por ejemplo una erosión con un elemento de estructura que contenga el origen es antiextensiva, es decir todos los píxeles del resultado son “menores” que los de la imagen original de acuerdo al orden que se propuso, pero respecto a las distintas componentes de color esto sólo se puede garantizar para la coordenada v (que es la que domina el ordenamiento), las coordenadas s y h del resultado pueden tener valores mayores que los de la imagen original; esto tiene incidencia por ejemplo en el cálculo del gradiente morfológico (ver definición en el apéndice 1) de una imagen. Al igual que cuando se usa un ordenamiento marginal, con esta propuesta los valores relativos de las coordenadas de color del elemento de estructura son irrelevantes al hacer operaciones invariantes a desplazamientos del EE, así, es igual hacer una apertura con un EE de cualquier color, brillante o no (esto es porque los valores que se restan en la erosión se vuelven a sumar en la dilatación y como en toda la vecindad se resta y suma lo mismo, ello no influye en la decisión del máximo o mínimo). El ordenamiento propuesto para las coordenadas v y s puede justificarse intuitivamente, ya que hace que los colores más brillantes y más blancos se consideren mayores, similar a la MM para imágenes de grises, pero por otra parte el matiz sólo importa para diferenciar píxeles con la misma intensidad y saturación y esto relega el color (representado en la coordenada h) al último plano del orden y le da poco peso en la toma de decisiones al comparar vectores, y en cierta forma esto es tratar las imágenes a color de tal forma que el color importe lo menos posible, tal vez no se está aprovechando la información que éste acarrea. Pero además, la coordenada h, que es naturalmente circular (ver figura 5b), se trata de forma lineal, lo que implicó utilizar un origen y un ordenamiento arbitrario de los colores, un problema que ocasiona esto se trata en la sección 1.3.2.. 15.

(17) IEL2-2002-II-26. 1.4 MEJORAS PROPUESTAS 1.4.1 Operaciones sobre la coordenada de saturación Como ya se mencionó, el ordenamiento condicional propuesto en [5] trata la coordenada de saturación descendentemente con la idea de hacer “mayores” los píxeles de la imagen con menor saturación, esto es, mas grisáceos o blancos (o acromáticos). Siendo coherentes con esto, se esperaría que una operación que “agrande” la imagen, como es el caso de las que suman el elemento de estructura, la volviera mas acromática ya que esto indicaría un desplazamiento hacia valores mayores (según el ordenamiento); por ejemplo, una dilatación con un elemento de estructura con valores positivos debería llevar la imagen hacia los tonos grisáceos. Similarmente, las operaciones que restan a la imagen deberían volverla más colorida ya que se considera que esto indica valores menores. Pero aunque la coordenada de saturación se interpreta inversamente en la relación de orden, para las operaciones de suma y resta se trata de forma normal, entonces si el elemento de estructura tiene valores positivos, al sumarlo se incrementa la saturación de la imagen lo que hace que el resultado “decrezca”, contrariamente a lo que sería de esperar según el ordenamiento que se propuso. Una forma de tratar coherentemente la coordenada de saturación en el ordenamiento y en las operaciones es definir una nueva coordenada s’ que se ordena crecientemente y que se suma y resta normalmente. s' = 1 − s. Si s toma valores válidos, es decir en el intervalo [0,1], s’ también está en el intervalo [0,1] y el ordenar s’ ascendentemente es equivalente a ordenar descendentemente s, por lo que no hay cambios en el ordenamiento. Pero en este caso, valores pequeños de s’ sí corresponden a valores pequeños en el ordenamiento, y viceversa, y al sumar (restar) directamente los valores de s’ si se incrementa (decrementa) el valor del píxel de acuerdo al orden usado. Entonces el. 16.

(18) IEL2-2002-II-26. uso de la nueva coordenada s’ sí es coherente con la idea del ordenamiento condicional. Desde luego, para obtener la imagen resultante después de una operación morfológica en valores HSV válidos se usa: s = 1 − s'. Se implementaron los dos tipos de morfología vectorial, esto es, según la definición original y con la coordenada s’. En la figura 4 se puede observar el efecto de las operaciones sobre la coordenada s como se propuso originalmente en [5] y usando la coordenada s’, y cómo el uso de esta última es más consecuente con el ordenamiento cuando el elemento de estructura tiene valores no nulos de saturación: se dilata la imagen (4a) por un elemento de estructura con valor de saturación 0.1, con la propuesta original (4b) la imagen se torna más cromática aunque esto contradice el ordenamiento; usando la coordenada s’ el resultado es el que cabría esperar (4c). En la siguiente sección, que trata de aplicaciones de la morfología vectorial, se usará la implementación con coordenada s’ por ser más coherente.. 1.4.2 Gradiente morfológico con coordenada h circular Otro problema de la propuesta de morfología vectorial que se está considerando, lo ocasiona el tratamiento de la coordenada h. Este tratamiento parece bastante arbitrario y como ya se mencionó, el color se está teniendo en cuenta muy poco; pero el problema particular que atañe a esta sección es el resultado de tratarla linealmente en un gradiente morfológico para la detección de bordes en imágenes a color. El gradiente morfológico interno se obtiene de la diferencia entre la imagen original y la erosión de ésta por el elemento de estructura elemental, en este caso un cuadrado de 3x3 píxeles con valores nulos de matiz, saturación y valor; para. 17.

(19) IEL2-2002-II-26. cada vecindad se toman los máximos de estas diferencias como indicador de la magnitud de la pendiente de la superficie en ese punto. Para el caso de una imagen a color con la morfología que se está considerando, el resultado es una función vectorial con las diferencias en cada componente del espacio HSV, pero como ya se mencionó pueden producirse resultados no válidos (negativos) en las componentes s y h, y en todo caso el color de la imagen resultante no será representativo de los colores de la imagen original sino solamente de las variaciones de color en esta (una especie de falso color). Por esto, una vez calculado el gradiente morfológico, se toma la norma de los vectores resultantes y la imagen de escala de grises que se obtiene tiene intensidades que indican la “intensidad” del borde en la imagen original. Para las coordenadas v y s, que son por naturaleza lineales, aplicar esta definición directamente produce buenos resultados, pero el tratar la coordenada h de forma lineal resulta en el “problema de los rojos” [6]: matices de rojos muy similares aparecen como muy distintos y generan bordes falsos en el gradiente; esto se debe a que hay tonos de rojos con valores cercanos a 0 y cercanos a 1, y al tomar las diferencias linealmente, es decir restando directamente los valores de matiz (h), resulta un valor grande cuando los colores en realidad son parecidos y se marca un borde que visualmente no se percibe. Este problema sucede con los rojos y no con otros matices porque el origen de la coordenada h está por convención en un tono rojizo; si la coordenada de matiz de una imagen se rota para desplazar los colores en ella, el problema puede desaparecer o aparecer en otras zonas (ver figura 6). En la figura 5 se muestra la causa del problema de los rojos sobre una ilustración de la coordenada h: cuando se la trata linealmente, los dos puntos, que corresponden a matices perceptivamente parecidos aparecen a una distancia grande, lo que indicaría un borde debido a un cambio (falso) de color. Este problema fue reconocido por Hanbury y Serra [6] al usar el gradiente morfológico sobre la coordenada h de imágenes a color (pero sólo la coordenada. 18.

(20) IEL2-2002-II-26. h) y lo resolvieron reconociendo que el gradiente utiliza únicamente diferencias de valores, por lo que se puede considerara la coordenada h de forma circular fijando un origen (que en todo caso no será relevante) y utilizando como diferencia de valores de matiz el menor ángulo que forman en la circunferencia (figura 5b). La definición que dan para la diferencia de dos valores h1 y h2 es la siguente:  h1 − h2 , si h1 − h2 ≤ π D(h1 , h2 ) =  2π − h1 − h2 , si h1 − h2 > π. Donde h1 y h2 pertenecen a la circunferencia unitaria S1; para traducirlo a valores en el intervalo [0,1) que son los utilizados normalmente en las representaciones en computador, 2π equivaldría a 1 y π a 0.5. La idea del gradiente morfológico vectorial se puede combinar con la del tratamiento circular de la coordenada h, usando diferencias lineales para los valores de v y s, y ángulos agudos para h, y así resulta un detector de bordes para imágenes a color que puede distinguir cambios tanto en intensidad como en color y que no presenta el problema de los rojos. El algoritmo completo se implantó en en Matlab: se realizó la erosión vectorial y se tomaron las diferencias entre la imagen original y este resultado, linealmente para las coordenadas v y s, y circularmente (ángulo agudo) para la coordenada h. Algunos resultados se muestran en las figura 6 y 7. En la figura 6 puede notarse el problema de los rojos en el fondo que rodea a la virgen y cómo éste desaparece al rotar la coordenada h para llevar la imagen hacia el azul. En la figura 7 se ve la detección falsa de bordes al utilizar la coordenada de matiz de forma lineal (7b) y cómo se corrige el problema al tratarla circularmente (7c), asimismo, cómo se pueden perder bordes en partes de la imagen que tienen cambios apreciables de color pero no de intensidad, si se utiliza un gradiente morfológico tradicional sobre una versión de escala de grises de la imagen (7d).. 19.

(21) IEL2-2002-II-26. 1.5 CONCLUSIONES PARCIALES Con la introducción de la coordenada s’, se mejora un problema de coherencia de la morfología vectorial propuesta en [5], un problema que no es fácil de detectar ya que sólo se presenta al usar elementos de estructura con valores no nulos de saturación. El gradiente morfológico con coordenada h circular es una alternativa a los detectores de bordes existentes para imágenes a color; permite tener en cuenta los cambios de color tanto como los de intensidad y corrige el problema de los rojos que tiene la versión original en [5] tratando la coordenada de matiz linealmente.. 20.

(22) IEL2-2002-II-26. Figura 3: Representación vectorial de una imagen en el espacio RGB. (a). (b). (c). Figura 4: Dilatación en HSV con coordenada s y s’ (a) Imagen original. (b) Dilatación usando la suma directamente sobre la coordenada s (método original). (c) Dilatación usando la suma sobre la coordenada s’ (mejora propuesta). En ambas se usó un EE con s = 0.1. (a). (b) Figura 5: Problema de los rojos: explicación. (a) Coordenada h tratada linealmente. (b) Coordenada h tratada circularmente.. 21.

(23) IEL2-2002-II-26. (a). (b). (c). (d). Figura 6: Problema de los rojos: ejemplo. (a) Imagen original. (b) Imagen con coordenada de matiz rotada. (c),(d) Gradiente morfológico vectorial con coordenada h lineal de las anteriores.. 22.

(24) IEL2-2002-II-26. (a). (b). (d). (c). Figura 7: Gradiente morfológico con coordenada h circular (a) Imagen original. (b) Gradiente morfológico con coordenada h lineal. (c) Gradiente morfológico con coordenada h circular. (d)Gradiente morfológico tradicional sobre versión en escala de grises de la imagen.. 23.

(25) IEL2-2002-II-26. MORFOLOGÍA SOBRE REPRESENTACIÓN ESCALAR DE LA IMAGEN. 2.1 MOTIVACIÓN E IDEA GENERAL En la introducción a este documento se mencionó el hecho de que la morfología para imágenes a color utilizando ordenamiento marginal (tratar cada componente de color separadamente) no tenía en cuenta los valores relativos de las componentes de color del elemento de estructura al hacer operaciones que son invariantes al desplazamiento, esto porque cada componente de la imagen se trata separadamente, cada componente no “sabe” que está pasando con los demás; entonces sería deseable de alguna forma procesarlos todos a la vez, de tal forma que la relación entre los componentes de color de la imagen y el EE sea tenida en cuenta explícitamente. Esta fue la idea que motivó el desarrollo que se expone en este capítulo. En programas como Matlab, una imagen de escala de grises se almacena y trabaja como una matriz de MxN, y es práctica común interpretarla como una función escalar, una superficie definida en un subconjunto de Z2; se asume que el tamaño de la matriz determina el dominio de la imagen y los valores en ella, el rango. Una imagen a color se almacena y trabaja como una matriz de MxNx3, y siguiendo el mismo razonamiento, podría interpretarse como una función escalar, una hipersuperficie definida en un subconjunto de Z3. El grafo de una imagen en esta representación “viviría” en un espacio de dimensión 4 difícil de visualizar, pero lo importante es que como función sigue siendo escalar. Si se aplica la morfología de escala de grises sobre esta representación ¿cuál es el resultado?. 24.

(26) IEL2-2002-II-26. 2.2 REPRESENTACIÓN ESCALAR DE LA IMAGEN La propuesta es entonces, incorporar el color en el dominio de la imagen con una coordenada adicional; una imagen a color tendría dos coordenadas espaciales (filas y columnas) y una coordenada de color en que la longitud sería únicamente 3, es decir toma valores en {0,1,2}, por ejemplo. Imagen I : D → R, D ⊂ Z 3 El significado de los valores de la dimensión de color depende del sistema de color que se esté usando, por ejemplo en el espacio de color RGB se podría asignar en esa dimensión el valor 0 para el rojo, el 1 para el verde y el 2 para el azul, con lo que una imagen de 1x1 píxel amarillo se representaría así: I(0,0,0) = 1. (coordenada espacial 0,0, valor de la componente de color rojo). I(0,0,1) = 1. (coordenada espacial 0,0, valor de la componente de color verde). I(0,0,2) = 0. (coordenada espacial 0,0, valor de la componente de color azul). Mientras que usando la representación vectorial se tendría: I(0,0) = (1,1,0). (píxel 0,0 de color amarillo). Un ejemplo de representación escalar de una imagen se puede ver en la figura 8, la interpretación es que las componentes de color se “apilan” en una dimensión adicional, en este caso hacia adentro de la página; debe notarse que para una imagen de un solo píxel de ancho se requiere una gráfica tridimensional, para imágenes prácticas de MxN no es posible dibujar la representación escalar por ser una función en Z4. Para las coordenadas espaciales el origen del espacio se fija normalmente en la esquena superior izquierda y además rara vez se repara en él, básicamente es irrelevante; para la coordenada de color hay que fijar arbitrariamente el origen y el. 25.

(27) IEL2-2002-II-26. orden de las componentes, esto puede prestarse a distintas interpretaciones como se mostrará en la siguiente sección. Dado que la imagen se representa como una función escalar (sólo que con dominio de dimensión 3), es posible modificar los algoritmos de MM de escala de grises para que funcionen sobre esta representación, extendiéndolos para que tengan en cuenta la dimensión adicional; no hay que introducir una nueva relación de orden.. 2.3 IMAGEN: LONGITUD FINITA, LONGITUD INFINITA Cuando se trabaja la MM a nivel teórico, las imágenes se consideran con dominio Z2, es decir como señales bidimensionales de longitud infinita, aunque normalmente de duración finita, es decir que tienen valores no nulos únicamente en un subconjunto finito del dominio. En este caso, operaciones como la erosión contraen el soporte de la imagen y otras como la dilatación lo agrandan (esto se puede apreciar en los ejemplos de erosiones y dilataciones binarias en el apéndice 1). Al tratar con imágenes digitales en la práctica, se tienen señales de longitud finita, es decir sólo definidas dentro de un rectángulo de NxM en Z2, o en uno de MxNx3 en Z3 para el caso de la representación escalar de imágenes a color. Esto puede presentar dificultades al aplicar operaciones que cambian el dominio de la imagen, en particular se considerará la erosión y la dilatación. El efecto de reducción del soporte de la imagen que causa la erosión puede interpretarse desde el punto de vista de un operador de vecindad; como para calcular la erosión en un punto se necesitan los valores de una vecindad del punto dada por el tamaño del EE, en las fronteras de la imagen hacen falta valores (porque los píxeles de frontera no tienen suficientes vecinos definidos). Normalmente esto se soluciona de dos formas: o se genera una imagen de salida. 26.

(28) IEL2-2002-II-26. mas pequeña dejando sólo los píxeles para los que se tiene la vecindad mencionada, o se suponen valores de píxeles adicionales por fuera del dominio original de la imagen para calcular las vecindades en los puntos cercanos a la frontera (ceros, o un reflejo de la imagen, o una extensión periódica de esta). En lo que atañe a las coordenadas espaciales de la imagen, la diferencia no es grande, en todo caso los elementos de estructura normalmente son pequeños (3x3) y la información mas importante en una imagen no suele encontrarse en las fronteras. La coordenada de color de la representación escalar presenta un problema mayor, y es que la longitud en esa dimensión es 3 y la del EE también, por lo que si se toma la opción de reducir el dominio, una erosión de una imagen de MxNx3 por un elemento de estructura de PxQx3 produciría un resultado de (M-P+1) x (NQ+1) x 1 que no sería una imagen a color según la representación escalar. Por otra parte, si se considera la imagen como de longitud infinita y se suponen valores por fuera de la frontera en la coordenada de color, el resultado sería una imagen con longitud 3 en la dimensión de color pero con una sola componente no nula, y cuál de ellas dependería del origen (arbitrario) que se escoja en la coordenada de color para el EE. Con la dilatación sucede lo contrario, el soporte de la imagen se agranda, con lo cual hay nuevamente dos opciones: o se recorta la imagen de salida para que tenga el mismo tamaño que la de entrada, que equivale a considerarla de longitud infinita de la cual sólo es importante una parte, o se obtiene una imagen de salida mas grande que la de entrada. Y nuevamente las coordenadas espaciales no presentan mayor problema. La interpretación de lo que sucede con la coordenada de color si es problemática: si se agranda la imagen en la coordenada de color, el resultado de una dilatación de una imagen de MxNx3 por un EE de PxQx3 tendría tamaño (M+P-1) x (N+Q-1) x 5, que definitivamente no es una imagen a color válida porque tiene longitud 5 en la coordenada de color. Si por el contrario se recorta la imagen resultante en la coordenada de color, es equivalente a tomar sólo 3 de las. 27.

(29) IEL2-2002-II-26. 5 componentes de color que se obtuvieron con la dilatación, y cuales 3 se tomen depende del origen (de nuevo arbitrario) que se fije en la dimensión de color y el orden que se les asigne a las coordenadas de color en ella. Estos problemas se tratarán en las secciones siguientes con miras a lograr una interpretación más intuitiva, además cabe notar que sólo se presentan si el elemento de estructura es una imagen a color, es decir si tiene longitud 3 en la dimensión de color. De acuerdo a la definición, el elemento de estructura podría tener cualquier longitud en dicha dimensión, por lo que en particular podría ser una imagen de escala de grises (longitud 1 en color) y se evitarían los problemas mencionados. Sin embargo, esta opción es equivalente a la morfología con ordenamiento marginal mencionada en la introducción y por esto no es de interés en este capítulo, lo que es interesante es ver qué pueden aportar las operaciones morfológicas sobre la representación escalar.. 2.4 OPERACIONES MORFOLÓGICAS BÁSICAS A continuación se describen las implementaciones que se hicieron de las operaciones morfológicas básicas, en particular la elección de la forma de tratar la coordenada de color para la dilatación y erosión, los motivos intuitivos que justificaron esa elección y las interpretaciones y propiedades de las operaciones que resultaron. Como se está utilizando una representación escalar para las imágenes, todas estas operaciones se implementaron con una variación de los algoritmos de MM de escala de grises para tener en cuenta la dimensión adicional.. 2.4.1 EROSIÓN La particularidad de la erosión en la representación escalar es que reduce la longitud de la imagen en la dimensión de color, y el resultado puede verse bien. 28.

(30) IEL2-2002-II-26. como una imagen de escala de grises (longitud 1 en dicha dimensión) o como una imagen a color con soporte en sólo una de las componentes de color. En las coordenadas espaciales normalmente se cambia el tamaño de la imagen resultante para hacer que sea igual al de la de entrada; en el caso de la dimensión de color, esto tiene el atractivo de que las operaciones sobre imágenes a color generan también imágenes a color; elegir esta opción resuelve un problema práctico, sin embargo los problemas de interpretación son mayores. La imagen a color que resulta sólo tiene soporte en una de las dimensiones de color, pero qué coordenada sea depende de qué origen se escoja para la imagen y el EE en la dimensión de color. Por ejemplo, si se utiliza el sistema de color RGB y se define el origen de la dimensión de color en el rojo aumentando hacia el azul, el resultado de una erosión será una imagen a color roja únicamente; si el origen se fija en el verde, el resultado será una imagen verde. Pero en ambos casos las superficies resultantes serán iguales, sólo que desplazadas en el color (el desplazar el origen sólo desplaza el resultado, no lo altera de otra forma). Entonces se estaría fijando un origen de forma arbitraria, con el fin de obtener una imagen a color que realmente no lo es, pues sólo contiene la información que tiene una imagen de escala de grises: la de intensidades en una superficie. Por esto se escogió la otra opción, cambiar el tamaño de la imagen de salida en la dimensión de color para obtener un resultado de MxNx1, que se interpreta como una imagen de escala de grises. Aunque pueda parecer extraño que la erosión de una imagen a color por un EE a color produzca un resultado de grises, existe, además de los problemas mencionados anteriormente, otra justificación intuitiva para esta escogencia: en MM binaria y de escala de grises, una de las interpretaciones que se le da a la erosión es que va barriendo la imagen probando y marcando aquellos puntos donde “cabe” el EE dentro de la imagen. Entonces la erosión a color en la representación escalar indica donde “cabe” el EE, que es información esencialmente espacial, por lo que el resultado es una imagen de intensidad; pero el aporte importante en el tema de color es que para determinar si. 29.

(31) IEL2-2002-II-26. el EE “cabe” o no, se tienen en cuenta todas las componentes de color a la vez, lo que hace de esta erosión una herramienta capaz de discriminar objetos en una imagen con base en sus características de color. Para mostrar esto, considere una imagen como la de la figura 9a representada de forma escalar en el espacio de color RGB, si se hace una erosión con un elemento de estructura cuadrado amarillo de 5x5, en la imagen resultante (figura 9b) se marcan las posiciones e intensidades de los objetos amarillos y blancos de tamaño mayor o igual que 5x5, además todos los objetos que sobreviven se encogen por el tamaño del EE (que es el aporte de la MM binaria). Si se hace la misma erosión con un EE blanco, sólo se seleccionan los objetos que tienen blanco o tonos grisáceos (figura 9c). La explicación de este comportamiento se ilustra en la figura 10, en términos de dónde “cabe” el EE y hasta qué “altura” cabe, en el sistema RGB el amarillo es la suma de rojo y verde, entonces el EE amarillo “cabe” en los objetos que tengan rojo y verde, es decir los amarillos y los blancos y grisáceos ya que estos últimos tienen rojo, verde y azul; por esta misma razón, un EE blanco sólo selecciona los blancos y grises (en el sistema RGB). Se puede notar que la erosión efectivamente puede discriminar patrones de forma, intensidad y color, es decir preserva los aportes de la MM binaria y de escala de grises y añade nuevas capacidades para tener en cuenta el color. También es claro que el comportamiento de la erosión con determinado EE depende fundamentalmente del sistema de color que se utilice, este punto se tratará con mayor detalle en la sección 2.5. Se presenta además otro detalle y es que los elementos de estructura con distintas características de color no son, en general, “planos”, y entonces en algunas de las componentes de color tienen valores no nulos, lo cual puede hacer que el resultado de la erosión (y de las demás operaciones morfológicas) tenga valores por fuera del rango válido. En MM de escala de grises este problema se evita usando EE planos, pero como ya se dijo, al introducir el color en un EE esto puede no ser posible. Es importante entonces, tener esta situación en cuenta para. 30.

(32) IEL2-2002-II-26. escoger adecuadamente el elemento de estructura y posiblemente sea necesario truncar los valores no válidos en el resultado. Por otra parte, cabe notar que un EE de estructura a color siempre tiene longitud 3 en la dimensión de color, por lo que (a diferencia de la MM binaria y de grises), un EE de 1x1 píxel sí hace diferencia en las operaciones dependiendo de su color, o mejor, de los valores de sus componentes de color y del sistema de coordenadas que se esté utilizando.. 2.4.2 DILATACIÓN La dilatación presenta el mismo problema de la erosión al cambiar el soporte de la imagen, desafortunadamente no parece admitir una interpretación intuitiva como el caso de la erosión; ninguna de las dos posibles salidas al problema produce resultados satisfactorios. Claramente, si se escoge tratar la imagen como de longitud finita y agrandar el dominio al hacer una dilatación, como ya se mencionó, el resultado de la apertura de una imagen de MxNx3 por un EE de PxQx3 tendría tamaño (M+P-1)x(N+Q1)x5, lo que no puede interpretarse como una imagen a color (mucho menos como de escala de grises). Si de esas 5 componentes de color se toman sólo 3 (que equivale a fijar un origen arbitrario en la coordenada de color), el resultado es una imagen a color en la representación escalar, pero no tiene ninguna interpretación intuitiva. Sin embargo, la dilatación de una imagen de grises por un EE de color si puede verse como “poner” el EE de color en aquellas partes “marcadas” por la imagen de grises, esta propiedad se explota en la apertura.. 31.

(33) IEL2-2002-II-26. 2.4.3 APERTURA La apertura en la representación escalar tiene una interpretación bastante intuitiva en términos de la erosión y la dilatación que la originan: la erosión localiza (en una imagen de escala de grises) los puntos en donde cabe el EE y hasta qué “altura” cabe, y la dilatación pone el EE en esos puntos y alturas (ver figura 11). En este caso funciona porque se está haciendo la dilatación de una imagen de grises por un EE a color. Además, la imagen resultante es una imagen a color que tiene en todos sus puntos la misma relación entre los valores de las distintas coordenadas de color que el EE. En cierta forma, la apertura selecciona la parte de la imagen que es similar al elemento de estructura o, haciendo el símil con un espacio vectorial, “proyecta” la imagen sobre el EE y obtiene la “componente” en la “dirección” del EE. La apertura de una imagen a color por un EE a color produce siempre una imagen a color, y como en el caso de MM de escala de grises, no cambia con desplazamientos del EE, por lo tanto no es necesario preocuparse por la posición del origen en la dimensión de color y además no importa el orden de las coordenadas de color en dicha dimensión. También es idempotente y conserva las propiedades de MM binaria y de grises al seleccionar objetos con determinada forma, pero añade la capacidad de discriminar con base en el color; en la figura 12 se ve el ejemplo de una apertura en el sistema RGB de una flor con un EE morado de 1x1 píxel; puede notarse cómo la apertura extrae algo así como la “parte morada” de la imagen, desde luego determinada totalmente por las características de la primera erosión y estas a su vez por el espacio de color que se está usando; en el sistema RGB, el morado sólo está contenido en las partes moradas y blancas de la flor, pero muy poco en el fondo y las hojas que son las partes que entonces se atenúan fuertemente. Además, al igual que la erosión, la apertura preserva la capacidad de tratar formas heredada de la MM binaria y de grises, con lo cual, si se usa un EE mayor, pueden suavizarse los detalles, por ejemplo.. 32.

(34) IEL2-2002-II-26. 2.4.4 OTRAS OPERACIONES Siguiendo las definiciones, se pueden implementar sobre la representación escalar otras de las operaciones morfológicas, pero algunas de ellas tal vez no tengan interpretaciones intuitivas y otras probablemente no resulten útiles (esto por supuesto depende de la aplicación) así como parece suceder con la dilatación. Además, el hecho de que las operaciones cambien el dominio de la imagen en la coordenada de color limita la viabilidad de algunas aplicaciones como las erosiones y dilataciones iterativas que se usan en algoritmos de esqueletización o las diferencias entre dilataciones y erosiones en gradientes morfológicos. Por otra parte, en este trabajo sólo se han explorado las posibles aplicaciones de las operaciones básicas; en la solución de un problema real podría presentarse la oportunidad de utilizar con provecho algunas más complejas.. 2.5 COMENTARIOS SOBRE LOS SISTEMAS DE COLOR La característica principal de la morfología propuesta sobre la representación escalar de las imágenes es que tiene en cuenta las distintas propiedades de color de los objetos, representadas como los valores que toman las coordenadas en el espacio de color que se esté usando. En el espacio RGB el tono de un color está dado más por la relación entre los distintos componentes que por sus valores absolutos, por lo cual una erosión no puede segmentar, por ejemplo, basándose en intensidades. En el ejemplo de la figura 12 se aprovechó la propiedad de que todos los colores están contenidos en el blanco para seleccionar tanto las partes blancas como las moradas de la flor. El sistema de Hering sí hace explícitos la intensidad y el color en coordenadas distintas, por lo cual se pueden seleccionar patrones con cierto color en intensidad. Sin embargo asigna una dirección privilegiada positiva al rojo y al 33.

(35) IEL2-2002-II-26. amarillo, y la MM no es simétrica ante estas orientaciones (como si lo son los filtros lineales, por ejemplo) por lo que se tratan de forma distinta los colores oponentes. El sistema CMY, por ejemplo puede utilizarse en imágenes con fondo blanco ya que éste es el origen del sistema de coordenadas. Lo que es claro es que distintos sistemas de color hacen explícita diferente información, determinan los resultados de las operaciones morfológicas y la elección adecuada del EE y se prestan mejor a determinadas aplicaciones; incluso es posible que sea necesario utilizar variaciones de los sistemas de color tradicionales (un ejemplo de esto en la siguiente sección) o sistemas totalmente nuevos.. 2.6 EJEMPLO DE APLICACIÓN A continuación se ilustra una posible aplicación de las técnicas expuestas en este capítulo aplicadas a la segmentación de fríjoles en una imagen. También se utilizan operaciones morfológicas tradicionales de escala de grises y binarias y se la utilidad del sistema de color de Hering para hacer explícitas ciertas características de color. La idea es segmentar los fríjoles de las arvejas en la imagen de la figura 13a. Para esto se utiliza el hecho de que los fríjoles son más rojos y más oscuros que el resto de los objetos en la imagen, y se utiliza una versión modificada del sistema de color de Hering invirtiendo la coordenada BW para que crezca hacia lo más oscuro. Se realiza una erosión escalar con un EE rojo oscuro y el resultado se muestra en la figura 13b, esta es la parte mas importante de la segmentación y la que utiliza la MM escalar a color, es de notar que como el fondo es blanco, el sistema RGB no es hubiera sido de mucha utilidad para segmentar. En la figura 13c se hace un cierre de escala de grises para “rellenar” los huecos en los fríjoles, y en la 13d se realiza un umbral que posteriormente se usa. 34.

(36) IEL2-2002-II-26. como máscara en la figura 13e. Como se ve, el resultado es bastante bueno. (Para una aplicación de análisis como granulometría podría ser suficiente con lograr la imagen binaria 13d). 2.7 SOBRE LA EFICIENCIA DE LOS ALGORITMOS En general los algoritmos que implementan la erosión y la dilatación tienen orden de complejidad proporcional al tamaño de la imagen y del elemento de estructura. Si se considera que normalmente el EE es pequeño y su tamaño para una aplicación dada es fijo, entonces las operaciones tienen orden de complejidad MxN (filas x columnas de la imagen). Para este trabajo las distintas rutinas se implantaron como funciones de Matlab, y se compilaron como librerías de encadenamiento directo (dll) de Windows usando el compilador Borland 5.5 con lo que se consiguieron tiempos de ejecución de unos pocos segundos sobre imágenes del orden de 256x256 píxeles (192 kB) en un computador personal. Aunque razonables, estos tiempos todavía están lejos de servir para aplicaciones de procesamiento en tiempo real, y para las operaciones compuestas de usos sucesivos de erosiones y dilataciones, como aperturas, cierres el tiempo aumenta, y para filtros más complejos (como ASFs) en imágenes grandes, puede llegar a ser considerable, del orden de algunos pocos minutos. En todo caso, los algoritmos son esencialmente los mismos de la MM en escala de grises y por tanto pueden optimizarse por ejemplo haciendo erosiones y dilataciones rápidas cuando el EE puede descomponerse apropiadamente [3].. 35.

(37) IEL2-2002-II-26. 2.8 CONCLUSIONES PARCIALES Las operaciones propuestas alteran sustancialmente las características de color de las imágenes, algunas de las operaciones ni siquiera producen imágenes a color como resultado. En general no parecerían adecuadas para el mejoramiento o tratamiento de imágenes para observación humana, en cambio han mostrado aportar en la discriminación de patrones de color preservando las capacidades de tratar formas de las MM binaria y de grises, y pueden ser útiles en aplicaciones de análisis combinadas con otras técnicas de tratamiento de imágenes. Los distintos sistemas de color mostraron ser determinantes en los resultados obtenidos y en las aplicaciones para las que son útiles. La morfología sobre la representación escalar de la imagen es una propuesta novedosa que aún puede ser desarrollada mas, por ejemplo explorando el uso de otros sistemas de color y buscando aplicaciones prácticas.. 36.

(38) IEL2-2002-II-26. (a). (b). Figura 8: Representación escalar de una imagen a color (a) Imagen original de 1x10 píxeles y sus componentes RGB. (b) Representación escalar “apilando” los componentes de color en una dimensión adicional.. (a). (b). (c). Figura 9: Erosión escalar en RGB (a) Imagen original. (b) Erosión escalar con cuadrado amarillo de 5x5. (c) Erosión escalar con cuadrado blanco de 5x5.. (a). (b). (c). Figura 10: Interpretación de la erosión escalar en RGB (a) Imagen original: un píxel blanco, uno morado y uno amarillo. (b) EE amarillo: rojo + verde. (c) Resultado de la erosión, hasta donde “cabe” el EE en la imagen.. 37.

(39) IEL2-2002-II-26. (c). (b). (a). Figura 11: Interpretación de la apertura escalar en RGB (a) Imagen original: un píxel blanco, uno morado y uno amarillo. (b) EE amarillo: rojo + verde. (c) Resultado de la apertura, poner el EE hasta donde “cabe” en la imagen.. (a). (c). Figura 12: Apertura escalar en RGB (a) Imagen original. (b) Apertura escalar en RGB con un EE morado de 1x1 pixel. 38.

(40) IEL2-2002-II-26. (a). (b). (c). (d). (e) Figura 13: Ejemplo de aplicación de la MM escalar. (a) Imagen original. (b) Erosión escalar en sistema de Hering modificado. (c) Cierre en escala de grises. (d) Umbralización. (e) Máscara sobre la imagen original.. 39.

(41) IEL2-2002-II-26. MORFOLOGÍA SOBRE DIVISIÓN DE LA IMAGEN POR PROCESOS OPONENTES DE COLOR. 3.1 INTRODUCCIÓN En este capítulo se propone aplicar las operaciones morfológicas de forma similar al ordenamiento marginal sobre el espacio de Hering, excepto que no se procesan las componentes de color como tales separadamente sino que se define el concepto de zonas de color de la imagen, una división de acuerdo al color que corresponda hasta donde sea posible con una apreciación subjetiva de las zonas con cierto color dominante en la imagen. Se trata la zona deseada independientemente con MM de escala de grises y luego se reincorpora la información de la zona de color en la imagen original de tal forma que el resto de la imagen no se afecte.. 3.2 DIVISIÓN DE LA IMAGEN POR PROCESOS OPONENTES DE COLOR Intuitivamente es sencillo determinar en una imagen que hay zonas de un color predominante; para el procesamiento propuesto se divide la imagen en 4 zonas disyuntas: rojiza, verdosa, azulada y amarilleja, de acuerdo a los colores básicos en el espacio de Hering. La idea es que un píxel de la imagen pertenece a una determinada zona de color si su valor para ese color en coordenadas de Hering es mayor que para todos los demás. Para poder hacer la comparación se consideran los valores negativos de la coordenada Y-B como positivos de azul y los negativos de la coordenada R-G como positivos de verde. Entonces, un píxel pertenece a la zona rojiza si su valor de R-G es mayor que la parte positiva de su valor –(R-G) (verde), que la parte positiva de su valor Y-B. 40.

(42) IEL2-2002-II-26. (amarillo) si la hay y que la parte negativa de su valor –(Y-B) (azul) si la hay. Puede verse que esto es equivalente a comparar el valor R-G con el valor absoluto de Y-B, puesto que este último es una cantidad no negativa que contiene los valores de amarillo y azul, y para que R-G sea mayor que |Y-B| tiene que ser mayor que cero, con lo cual el valor de rojo tiene que ser mayor que el de verde. La zona amarilleja se obtiene de la misma manera, y para las zonas verdosa y azulada se utiliza el negativo de las coordenadas R-G y Y-B respectivamente. Así, si se considera la imagen como función de un subconjunto de Z2 al espacio de Hering, o equivalentemente una tripla de funciones escalares con los valores de R-G, Y-B y BW, las zonas de color serían un conjunto de puntos (x,y) en el dominio de la imagen, junto con el valor de color asociado en ese punto (función escalar definida en esos puntos). Si se denota por (R-G)(x,y), (Y-B)(x,y) los valores de R-G y Y-B respectivamente, en el punto (x,y): Zona rojiza: {( x, y, R( x, y )) : ( R − G )( x, y ) >| (Y − B)( x, y ) |, R( x, y ) = ( R − G )( x, y )} Zona verdosa: {( x, y, G ( x, y )) : −( R − G )( x, y ) >| (Y − B)( x, y ) |, G ( x, y ) = −( R − G )( x, y )} Zona amarilleja: {( x, y, Y ( x, y )) | (Y − B)( x, y ) >| ( R − G )( x, y ) |, Y ( x, y ) = (Y − B)( x, y )} Zona azulada: {( x, y, B( x, y )) | ( R − G )( x, y ) >| (Y − B)( x, y ) |, B( x, y ) = −(Y − B)( x, y )} Debe notarse que esta división garantiza que las zonas son disyuntas, ningún punto (x,y) pertenece a más de una, pero puede dejar píxeles sin asignar a ninguna zona si tienen igual valor (en valor absoluto) en las dos coordenadas de color, es decir que la división que se hace no es una partición de la imagen. En la figura 14 se muestran las distintas zonas de color de una imagen como imágenes de escala de grises, los puntos en negro no pertenecen a la zona. Puede verse cómo el resultado está bastante de acuerdo con lo que subjetivamente se hubiera esperado.. 41.

(43) IEL2-2002-II-26. 3.3 TRATAMIENTO DE LAS ZONAS DE COLOR Con la definición anterior, cada zona de color es una función de intensidades que puede tratarse con todas las operaciones de la morfología de escala de grises para seleccionar o remover características, mejorar conectividad, suavizar, etc. Para hacer este tratamiento hay que tener en cuenta que las zonas no son exactamente imágenes de escala de grises normales, ya que en general no están definidas en todo el dominio de la imagen original, debe recordarse que según la definición en la sección anterior la zona es un conjunto de puntos junto con una función definida únicamente en ellos (en la figura 14 las partes negras no tienen valor 0 sino que no pertenecen a la zona). Esto en teoría no afecta la aplicación de las operaciones morfológicas, pero en la práctica hay que asignar valores no definidos (o grandes negativos) en los puntos que no pertenecen a la zona para lograr el efecto deseado. Por otra parte, las operaciones morfológicas básicas cambian el dominio de la función, por ejemplo las aperturas y erosiones lo contraen y los cierres y dilataciones lo agrandan, esto es importante si se desea reincorporar la información de la zona en la imagen original después de tratarla.. 3.4 REINCORPORACIÓN DE LA INFORMACIÓN EN LA IMAGEN La extracción de las zonas de color y el procesamiento de estas puede servir por si solo en algunas aplicaciones, pero también sería deseable poder cambiar las zonas de color sobre la imagen original, o lo que es equivalente, reincorporar la información en la imagen después del procesamiento. Esto presenta un inconveniente si las operaciones cambian el dominio de la imagen, que es lo que sucede con cualquiera que utilice un EE mayor de 1x1 píxel. En este caso el dominio de la zona de color cambia y hay al menos dos opciones: reemplazar la 42.

(44) IEL2-2002-II-26. información de la imagen con la de la zona de color en los píxeles pertenecientes a la zona de color original o en los pertenecientes a la nueva zona de color (después de procesamiento). En general puede escogerse cualquiera de las dos (incluso otras opciones) dependiendo de la aplicación y del resultado deseado, aquí se tratarán dos casos particulares. El primero corresponde a los procesamientos morfológicos que agrandan el dominio de la zona de color, como dilataciones o cierres, que además resaltan los píxeles pertenecientes a la zona y mejoran la conectividad de esta. En este caso se escogió reemplazar en la imagen original la información de la zona de color después del procesamiento, así se intensifica el color que se dilató y se “rellenan” los “huecos” del color oponente dentro de la zona escogida. Un ejemplo se muestra en la figura 15, la figura 15b corresponde a la zona azulada de la imagen de la figura 15a, en 15c se muestra la zona azulosa dilatada por un EE de 3x3 y altura 0.1, al reincorporar la información de la nueva zona azulada en la imagen original se obtiene el resultado mostrado en la figura 15d. Si se hubiera reemplazado la información sólo en la zona azulada original no se habría obtenido el efecto espacial de agrandar la parte azul de la imagen. El segundo son los procesos que encogen el dominio de la zona de color como aperturas y erosiones, que pueden servir para eliminar objetos pequeños y desacentuar el color en toda la zona. En este caso se escogió reemplazar en la imagen original la información de la zona de color original, así se reduce tanto la intensidad del color como su distribución espacial en la imagen. Un ejemplo se ilustra en la figura 16: se erosionó la zona amarilleja de la imagen con un EE de 3x3 y altura 0.1, puede verse como la zona amarilleja original (16b) se contrae y atenúa (16c); el resultado final, que se muestra en la figura 16d, tiene la zona amarilleja atenuada pero el resto de la imagen no sufrió modificaciones. Además, si se hubiera reincorporado a la imagen sólo la zona amarilleja después de procesar (que es mas pequeña), en los bordes de ésta hubieran quedado zonas con amarillo fuerte que corresponden a la zona amarilleja original.. 43.

(45) IEL2-2002-II-26. En general se consiguen buenos efectos visuales reemplazando en la imagen original: la zona de color después de procesar cuando la operación agranda el dominio de ésta, y la zona de color antes de procesar cuando la operación lo contrae.. 3.5 EJEMPLO DE APLICACIÓN A continuación se ilustra con un ejemplo una posible aplicación de las técnicas descritas para mejorar la visibilidad de unas manchas rojas en una foto de tejido. En el procesamiento de la zona de color se emplean distintas operaciones morfológicas de escala de grises para obtener el resultado. En la figura 17a se muestra la imagen original, que tiene unas manchas rojizas muy tenues y por tanto difíciles de ver; se extrae la zona rojiza que se muestra en la figura 17b, para mejorar la conectividad se hace un cierre con un EE plano circular de radio 10 (figura 17c), con una apertura con EE de 5x5 se eliminan las zonas pequeñas (figura 17d), y con una dilatación se intensifican y agrandan un poco las manchas (figura 17e). El resultado se muestra en la figura 17f, puede observarse que se acentuaron adecuadamente las manchas que eran muy difíciles de ver en la imagen original (pero que se ven si se observa con cuidado).. 3.6 CONCLUSIONES PARCIALES La división de la imagen por procesos oponentes de color está generalmente de acuerdo con la percepción (subjetiva) de zonas con colores dominantes. Las operaciones morfológicas propuestas reincorporando la información de la zona tratada en la imagen original tienen interpretaciones intuitivas en términos de agrandar, reducir, intensificar, atenuar detalles de acuerdo al color.. 44.

(46) IEL2-2002-II-26. Con estas técnicas sólo se tratan las partes de interés de la imagen, las demás no sufren modificaciones, y aún las zonas tratadas no se alteran tanto como para que pierdan sus características esenciales, por esto la morfología sobre esta división resulta útil para mejoramiento de imágenes y resaltado de características.. 45.

(47) IEL2-2002-II-26. (a). (b). (c). (d). (e). Figura 14: Zonas de color de una imagen. (a) Imagen original. (b) Zona rojiza. (c) Zona verdosa. (d) Zona amarilleja. (e) Zona azulada. 46.

(48) IEL2-2002-II-26. (b). (c). (d). (e). Figura 15: Dilatación de la zona azulada de una imagen. (a) Imagen original. (b) Zona azulada. (c) Zona azulada dilatada por un EE de 3x3 y altura 0.1. (d) Imagen resultante. (las imágenes b y c se muestran con colores invertidos para ilustrar mejor los detalles).. (b). (c). (d). (e). Figura 16: Erosión de la zona amarilleja de una imagen. (a) Imagen original. (b) Zona amarilleja. (c) Zona amarilleja erosionada por un EE de 3x3 y altura 0.1. (d) Imagen resultante. (las imágenes b y c se muestran con colores invertidos para ilustrar mejor los detalles).. 47.

(49) IEL2-2002-II-26. (a). (b). (c). (d). (e). (f). Figura 17: Ejemplo de aplicación de MM por procesos oponentes. (a) Imagen original. (b) Zona rojiza (c) Cierre con EE circular radio 10. (d) Apertura EE 5x5. (e) Dilatación EE 3x3 altura 0.1. (f) Imagen resultante. 48.

(50) IEL2-2002-II-26. RESUMEN DE CONCLUSIONES. Se presentan tres distintas alternativas del uso de MM en el tratamiento de imágenes a color. En la primera, se mejoró una propuesta de MM vectorial [5] y se obtuvo un detector de bordes en imágenes a color: el gradiente morfológico en el espacio HSV que permite tener en cuenta los cambios de color tanto como los de intensidad y al tratar la coordenada h circularmente (idea propuesta en [6]), corrige el problema de los rojos que tiene la versión con coordenada h lineal. La segunda es una propuesta original para MM en imágenes a color: una versión de la MM de escala de grises extendida a funciones con dominio de dimensión 3 sobre una representación escalar de las imágenes. Algunas de las operaciones no son fáciles de interpretar o alteran mucho la imagen, sin embargo se encontró que la erosión y apertura son útiles para discriminar patrones de forma y color, lo que representa un aporte adicional sobre la MM binaria y de escala de grises. Por otra parte se vio que los distintos sistemas de color juegan un papel fundamental y abren una gama de posibilidades para escoger el más adecuado de acuerdo a la aplicación. Finalmente se presentó una MM que trabaja sobre una división de la imagen por procesos oponentes de color, las operaciones sólo alteran partes de la imagen y tienen interpretaciones muy intuitivas en términos de cómo alteran las zonas de color de la imagen. En principio se encontró que puede servir en aplicaciones como resaltar o atenuar características de color. Por otra parte, las zonas de color se tratan con MM de escala de grises, por lo que se tiene a disposición toda una serie de herramientas muy bien estudiadas y desarrolladas.. 49.

(51) IEL2-2002-II-26. APÉNDICE 1 – MORFOLOGÍA MATEMÁTICA BINARIA Y DE ESCALA DE GRISES. A continuación se resumen las definiciones más básicas de la MM binaria y de escala de grises, para un tratamiento más completo véanse las referencias [2-4].. DEFINICIONES PREVIAS Un operador σ es creciente si preserva el orden de las imágenes (en imágenes binarias la relación de orden ≤ es la inclusión ⊂ ): A ≤ B → σ ( A) ≤ σ ( B ) Es extensivo si contiene al resultado: A ≤ σ (A) Antiextensivo si está contenido en el resultado: σ ( A) ≤ A E idempotente si aplicarlo más de una vez no produce cambios adicionales en el resultado: σ ( A) = σ (σ ( A)). MORFOLOGÍA BINARIA Una imagen binaria está determinada por el conjunto de píxeles con valor 1 en ella, entonces se representa como el subconjunto del espacio Zn formado por dichos píxeles: Imagen binaria A : A ⊂ Z n La traslación de A esta dada por: Ax = {c ∈ Z n | c = a + x para algún a ∈ A}. 50.

(52) IEL2-2002-II-26. La reflexión de A es: ∨. A = {c ∈ Z n | c = − a para algún a ∈ A} La dilatación de A por el elemento de estructura B equivale a barrer el origen del EE por cada punto de la imagen A (ver figura A1.1) y allí poner el EE: A ⊕ B = δB(A) = U Ba a∈ A. La dilatación conmuta con la unión, es creciente y además extensiva si el EE contiene el origen. La erosión de A por el EE B equivale a marcar con el origen del elemento de estructura los puntos donde éste “cabe” dentro de la imagen (ver figura A1.2): AΘ B = ε B(A) = {x ∈ E N|Bx ⊆ A}. La erosión conmuta con la intersección, es creciente y además antiextensiva si el EE contiene el origen. La apertura de A por el EE B, que es creciente, antiextensiva e idempotente, se define como:. A o B = γ B(A) = ( AΘ B ) ⊕ B La apertura selecciona aquellas partes de la imagen donde es posible encajar el EE (figura A1.3). El cierre, que es creciente, extensivo e idempotente, está dado por:. A • B = ϕ B(A) = ( A ⊕ B)Θ B El cierre tiende a fusionar regiones suficientemente cercanas en la imagen (figura A1.4) mejorando así la conectividad de los objetos.. 51.

(53) IEL2-2002-II-26. La erosión y la dilatación, así como a la apertura y el cierre están relacionados por las relaciones de dualidad: ∨. ∨. ( A ⊕ B ) c = A c Θ B y ( A o B ) c = Ac • B La idea es que lo que un operador le hace a la imagen, su dual (reflejado) lo hace al fondo (el complemento).. MORFOLOGÍA DE ESCALA DE GRISES Una imagen de escala de grises se representa como una función (superficie) que a cada punto del dominio de asigna un valor de intensidad: Imagen de grises f :. f :Zn → R. Si F y H son los subconjuntos de Zn donde están definidas f y h respectivamente, la dilatación de la imagen f por el elemento de estructura h es: f ⊕ h = δh(f) = max{ f ( x − z ) + h( z ) | z ∈ H , x − z ∈ F } Y la erosión de la imagen f por h es: f Θh = ε h ( f ) = min{ f ( x + z ) − h( z )} z∈H. La dilatación (dependiendo del elemento de estructura que se use) agranda las zonas claras de la imagen y la erosión las oscuras (ver figura A1.5). Si el EE que se usa es plano (todos sus valores son 0), la dilatación equivale a un filtro máximo móvil y la erosión a un mínimo, ambos con ventana dada por la forma del EE. La apertura y el cierre se definen igual que para imágenes binarias como composiciones de erosiones y dilataciones.. 52.

(54) IEL2-2002-II-26. GRADIENTES MORFOLÓGICOS Los gradientes morfológicos se consiguen con diferencias entre la imagen y operadores extensivos y antiextensivos sobre ésta. Los tres tipos de gradientes morfológicos más usados se definen así [7]: Gradiente de Beucher: g ( I ) = ( I ⊕ B ) − ( IΘ B ) Gradiente interno: g − ( I ) = I − ( IΘ B) Gradiente externo: g ( I ) = ( I ⊕ B ) − I Donde B es el elemento de estructura elemental de la grilla considerada.. 53.

Referencias

Documento similar

La determinación molecular es esencial para continuar optimizando el abordaje del cáncer de pulmón, por lo que es necesaria su inclusión en la cartera de servicios del Sistema

6 José Carlos Rovira, en su estudio Léxico y creación poética en Miguel Hernández, expone lo que para él simboliza la figura del rayo: “El poeta es rayo que no cesa,

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

En la parte central de la línea, entre los planes de gobierno o dirección política, en el extremo izquierdo, y los planes reguladores del uso del suelo (urbanísticos y

Sanz (Universidad Carlos III-IUNE): "El papel de las fuentes de datos en los ranking nacionales de universidades".. Reuniones científicas 75 Los días 12 y 13 de noviembre

(Banco de España) Mancebo, Pascual (U. de Alicante) Marco, Mariluz (U. de València) Marhuenda, Francisco (U. de Alicante) Marhuenda, Joaquín (U. de Alicante) Marquerie,

Por lo tanto, en base a su perfil de eficacia y seguridad, ofatumumab debe considerarse una alternativa de tratamiento para pacientes con EMRR o EMSP con enfermedad activa

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,