Estudio y desarrollo de un preproceso basado en la difusión no lineal para la segmentación en imágenes

Texto completo

(1)Universidad Politécnica de Madrid E.U. Ingeniería Técnica Industrial. Estudio y desarrollo de un preproceso basado en la difusión no lineal para la segmentación en imágenes Tesis Doctoral. J AVIER S ANGUINO B OTELLA Licenciado en CC. Matemáticas. enero – 2013.

(2)

(3) Departamento de Electrónica, Automática e Informática Industrial E.U. Ingeniería Técnica Industrial. Estudio y desarrollo de un preproceso basado en la difusión no lineal para la segmentación en imágenes.. J AVIER S ANGUINO B OTELLA Licenciado en CC. Matemáticas D IRECTOR : C ARLOS P LATERO D UEÑAS Doctor Ingeniero Industrial. enero – 2013.

(4) Resumen-Abstract. En esta Tesis Doctoral se aborda la utilización de filtros de difusión no lineal para obtener imágenes constantes a trozos como paso previo al proceso de segmentación. En una primera parte se propone un formulación intrínseca para la ecuación de difusión no lineal que proporcione las condiciones de diseño necesarias sobre los filtros de difusión. A partir del marco teórico propuesto, se proporciona una nueva familia de difusividades; éstas son obtenidas a partir de técnicas de difusión no lineal relacionadas con los procesos de difusión regresivos. El objetivo es descomponer la imagen en regiones cerradas que sean homogéneas en sus niveles de grises sin contornos difusos. Asimismo, se prueba que la función de difusividad propuesta satisface las condiciones de un correcto planteamiento semi-discreto. Esto muestra que mediante el esquema semi-implícito habitualmente utilizado, realmente se hace un proceso de difusión no lineal directa, en lugar de difusión inversa, conectando con proceso de preservación de bordes. Bajo estas condiciones establecidas, se plantea un criterio de parada para el proceso de difusión, para obtener imágenes constantes a trozos con un bajo coste computacional. Una vez aplicado todo el proceso al caso unidimensional, se extienden los resultados teóricos, al caso de imágenes en 2D y 3D. Para el caso en 3D, se detalla el esquema numérico para el problema evolutivo no lineal, con condiciones de contorno Neumann homogéneas. Finalmente, se prueba el filtro propuesto para imágenes reales en 2D y 3D y se ilustran los resultados de la difusividad propuesta como método para obtener imágenes constantes a trozos. En el caso de imágenes 3D, se aborda la problemática del proceso previo a la segmentación del hígado, mediante imágenes reales provenientes de Tomografías Axiales Computarizadas (TAC). En ese caso, se obtienen resultados sobre la estimación de los parámetros de la función de difusividad propuesta.. This Ph.D. Thesis deals with the case of using nonlinear diffusion filters to obtain piecewise constant images as a previous process for segmentation techniques. I have first shown an intrinsic formulation for the nonlinear diffusion equation to provide some design conditions on the diffusion filters. According to this theoretical framework, I have proposed a new family of diffusivities; they are obtained from nonlinear diffusion techniques and are related with backward diffusion. Their goal is to split the image in closed contours with a homogenized grey intensity inside and with no blurred edges. It has also proved that the proposed filters satisfy the well-posedness semi-discrete and full discrete scale-space requirements. This shows that by using semi-implicit schemes, a forward nonlinear diffusion equation is solved, instead of a backward nonlinear diffusion equation, connecting with an edgepreserving process. Under the conditions established for the diffusivity and using a stopping criterion I.

(5) for the diffusion time, I have obtained piecewise constant images with a low computational effort. The whole process in the one-dimensional case is extended to the case where 2D and 3D theoretical results are applied to real images. For 3D, develops in detail the numerical scheme for nonlinear evolutionary problem with homogeneous Neumann boundary conditions. Finally, I have tested the proposed filter with real images for 2D and 3D and I have illustrated the effects of the proposed diffusivity function as a method to get piecewise constant images. For 3D I have developed a preprocess for liver segmentation with real images from CT (Computerized Tomography). In this case, I have obtained results on the estimation of the parameters of the given diffusivity function.. II.

(6) Presentación. Esta tesis trata sobre el problema del procesamiento de imágenes como paso previo a la aplicación de técnicas de segmentación. Es por tanto, un trabajo dentro del campo del procesamiento de imágenes. El hecho de presentar esta memoria en el programa de Ingeniería de producción de una Escuela técnica me ha llevado a plantear un trabajo de investigación cuyos resultados tuviesen clara aplicación en situaciones reales. Soy consciente, en todos los años que me he dedicado a la docencia en Escuelas técnicas, del escepticismo de algunos compañeros ingenieros, a la hora de valorar la utilidad práctica del planteamiento, desarrollo y solución de problemas matemáticos relacionados con el mundo de la ingeniería. En este sentido, resulta muy ilustrativa la siguiente anécdota: Érase un individuo montado en un globo aerostático que después de una tormenta se encontraba perdido. Tras un buen rato tratando de orientarse, se percató de que por el campo paseaba un hombre. Sin más demora decidió descender y preguntar en dónde se hallaba. No hay que decir la sorpresa que se llevó el hombre, que paseaba ensimismado en sus pensamientos, al oír una voz desde el cielo –¡¡¡ Oiga buen hombre ¿sabe dónde estoy? !!! – le preguntaban desde el globo. El hombre después de meditar, le contestó – usted está en un globo – Al oír la respuesta el navegante, contestó de inmediato – usted es matemático – La sorpresa del hombre ante la afirmación del piloto fue enorme y dijo – sí en efecto, es verdad ¿cómo lo ha sabido usted?– a lo que le contestó – por tres razones: 1. se ha pensado la respuesta, 2. su respuesta es correcta, 3. su respuesta ¡¡¡ no me sirve para nada !!! y se alejó con el globo maldiciendo su mala suerte. Opino que es fundamental un correcto planteamiento matemático del problema real que se quiere investigar, pues es la puerta de entrada hacia la generalización de la solución, tan importante a la hora de abordar otras situaciones relacionadas. Pero también es cierto, que en un trabajo de investigación, quedarse en aplicaciones puramente académicas a veces resulta insuficiente en un marco tan aplicado, como puede ser este programa de doctorado. Estas consideraciones nos dieron pie a abordar, como tema de esta tesis, el preproceso relacionado con la segmentación automática del hígado, a partir de imágenes obtenidas mediante Tomografía Axial Computarizada (TAC). La segmentación es frecuentemente el primer paso, para diseñar y construir herramientas de asistencia al diagnóstico o a la cirugía, en enfermedades hepáticas. Desafortunadamente, los algoritmos actuales todavía resultan poco robustos, especialmente con la presencia de lesiones hepáticas. A ello hay que añadir el alto coste computacional, lo que complica su integración en la práctica clínica. Durante la elaboración de este trabajo tuve la oportunidad de obtener información directa de médicos y radiólogos del hospital San Carlos y Gregorio Marañón sobre esta problemática, lo que fue muy enriquecedor a la hora de orientar la investigación. Como consecuencia, en esta tesis que presento, una de las finalidades ha sido la aplicación de los resultados obtenidos, a imágenes en 3D generadas a partir de un TAC, con la idea de diagnosticar más III.

(7) fácilmente las posibles lesiones sobre este órgano. Este objetivo no ha sido nada sencillo. La segmentación del hígado sobre imágenes de TAC presenta gran dificultad debido a que los órganos adyacentes al hígado comparten parecidos valores de Unidades Hounsfield (medida de la intensidad radiométrica de las imágenes obtenidas mediante TAC). Esto produce solapamientos del hígado con otros órganos adyacentes, como el corazón y bordes débiles con el costal. El planteamiento y ejecución de la segmentación de una imagen es un proceso complejo, no sólo en la formulación y desarrollo del problema, en la que son fundamentales conceptos del cálculo variacional, análisis funcional, geometría diferencial o cálculo numérico, sino también en la implementación computacional, por la gran cantidad de datos que es necesario procesar. Esta tesis, como ya se ha comentado, aborda el procesamiento de la imagen con la intención de mejorar y acelerar la posterior segmentación, lo que supone una pequeña parte, pero importante de todo el proceso de segmentación. El principio de este trabajo surge a partir de una reunión del profesor Dr. Platero, con un grupo de colegas del Departamento de matemáticas, en la que nos pedía la interpretación de uξξ en la ecuación: ( ) ∇u div ∥∇u∥ = uξξ ∥∇u∥ donde ξ es un vector perpendicular a ∇u. Justificar que uξξ es la proyección de la derivada covariante de ∇u en la dirección de ξ sobre ξ, esto es: def. uξξ = ξ · ∇ξ (∇u) fue mi primera aportación y la puerta de entrada al apasionante mundo de las matemáticas relacionadas con el procesamiento de imágenes. Es por ello, que estaré eternamente agradecido al Prof. Platero por introducirme en este mundo, por dirigirme esta memoria de investigación y sobre todo por su insistencia en validar los resultados obtenidos en problemas reales. No sería justo dejar de mencionar a la profesora Velasco. Su completa disposición a opinar y discutir cualquier concepto que no estuviese suficientemente claro, me ha resultado muy enriquecedor. El desarrollo de esta tesis será como sigue: primeramente se considera un capítulo de localización y planteamiento donde se propone una introducción más detallada sobre la segmentación de una imagen, así como la definición de la parte geométrica y textura de una imagen, que jugará una parte fundamental en este trabajo. Además, se presenta una primera explicación sobre el procedimiento matemático que se pretende desarrollar en este trabajo. Para terminar se exponen los objetivos de esta tesis. El siguiente capítulo consiste en un estado de la técnica, donde se describen otros tipos de procedimientos relacionados con el tema de este trabajo. En el capítulo 3 se establece el marco teórico en dónde se pretende modelizar el concepto de realce para imágenes en 2D y 3D. Además se plantearán las condiciones que deben cumplir las funciones de difusividad para favorecer este realce. Seguidamente se propondrá una función de difusividad original, con la pretensión de que permita pre-procesar la imagen de manera correcta. El capítulo 4 trata de validar matemáticamente la función de difusividad propuesta en el capítulo anterior, para funciones unidimensionales. Asimismo es destacable, la justificación matemática que se hace para argumentar, por qué se utiliza el método semi-implícito y que en estos casos no se hace una difusión regresiva sino directa no lineal. Esta parte es importante porque los resultados teóricos son fácilmente generalizables a más dimensiones. A continuación, se extienden y se validan los resultados en 2D, no sólo teóricamente sino también mediante la aplicación a diferentes imágenes reales. El paso a 3D, se hace el capítulo 6, en la que una vez más se validan y generalizan los resultados obtenidos en 1D y 2D. Se describe además con detalle, la construcción del esquema numérico que se emplea para resolver una ecuación de difusión no lineal. Para la validación experimental, se aborda la problemática del proceso previo a la segmentación del hígado de imágenes procedentes de TAC, en donde además, se obtienen resultados sobre la estimación de los parámetros de la función de difusividad propuesta. Por último se dedica un capítulo a exponer las conclusiones del trabajo y las futuras líneas de investigación.. IV.

(8) Índice general. 1. LOCALIZACIÓN Y PLANTEAMIENTO 1.1. Introducción . . . . . . . . . . . . . . 1.2. Segmentación . . . . . . . . . . . . . 1.3. Geometría y textura de una imagen . 1.4. Planteamiento de la tesis . . . . . . . 1.5. Objetivos del trabajo . . . . . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. 2. ESTADO DE LA TÉCNICA 2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Métodos variacionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1. Descomposición de la imagen en componente geométrica y textura 2.3. Métodos basados en EDP’s . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1. Criterios de Parada . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . .. 1 1 2 7 9 11. . . . . .. 13 13 13 14 18 21. 3. FORMULACIÓN INTRÍNSECA. FUNCIONES DE DIFUSIVIDAD 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Expresión intrínseca de la difusión no lineal . . . . . . . . . . . . . . . . . . 3.2.1. Condiciones para el aumento de contraste en imágenes en R2 y R3 3.3. Funciones de difusividad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2. Función hiperbólica regularizada . . . . . . . . . . . . . . . . . . . . 3.3.3. Función hiperbólica acotada . . . . . . . . . . . . . . . . . . . . . . 3.4. Existencia de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1. Problemas mal propuestos o mal planteados . . . . . . . . . . . . . 3.4.2. Búsqueda de soluciones aproximadas . . . . . . . . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. 25 25 25 29 32 32 34 35 39 39 40. 4. PROBLEMA UNIDIMENSIONAL 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Esquema semi-discreto . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1. Semi-discretización centrada . . . . . . . . . . . . . . . . . . 4.2.2. Semi-discretización desplazada . . . . . . . . . . . . . . . . . 4.2.3. Tipo de semi-discretización empleada . . . . . . . . . . . . . 4.3. Estudio del sistema semi-discreto . . . . . . . . . . . . . . . . . . . . 4.3.1. Existencia y unicidad de solución del sistema semi-discreto 4.4. Discretización temporal . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1. Modelo escala-espacio discreto evolutivo . . . . . . . . . . . . . 4.4.2. Formulación explícita . . . . . . . . . . . . . . . . . . . . . . 4.4.3. Formulación implícita . . . . . . . . . . . . . . . . . . . . . . 4.4.4. Estudio del esquema semi-implícito . . . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. 43 43 43 44 47 49 51 55 58 59 60 62 69. V. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . ..

(9) 4.4.5. Implementación computacional 4.5. Resultados numéricos . . . . . . . . . . 4.5.1. Sin ruido . . . . . . . . . . . . . . 4.5.2. Con ruido . . . . . . . . . . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. 71 71 73 76. 5. PROBLEMA BIDIMENSIONAL 5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Esquema semi-discreto bidimensional . . . . . . . . . . . . . . . . . . 5.3. Condiciones de contorno . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1. Aplicación de las condiciones de contorno sobre el gradiente . 5.3.2. Desacoplamiento del sistema diferencial . . . . . . . . . . . . 5.3.3. Implementación computacional . . . . . . . . . . . . . . . . . 5.4. Discretización temporal . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5. Implementación numérica . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.1. SLOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.2. Implementación alternativa . . . . . . . . . . . . . . . . . . . . 5.6. Resultados numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6.1. Imagen sintética . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6.2. Imágenes reales . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. 81 81 81 86 86 97 99 103 105 105 105 110 110 115. 6. PROBLEMA TRIDIMENSIONAL 6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . 6.2. Esquema semi-discreto tridimensional . . . . . . . . . 6.2.1. Condiciones de contorno . . . . . . . . . . . . 6.2.2. Sistema semi-discreto . . . . . . . . . . . . . . 6.3. Discretización temporal . . . . . . . . . . . . . . . . . 6.3.1. Implementación numérica . . . . . . . . . . . . 6.4. Resultados numéricos . . . . . . . . . . . . . . . . . . 6.4.1. Planteamiento . . . . . . . . . . . . . . . . . . . 6.4.2. Determinación de P y γ . . . . . . . . . . . . . 6.4.3. Resultados . . . . . . . . . . . . . . . . . . . . . 6.4.4. Visualización de algunos resultados obtenidos. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. 121 121 121 129 144 146 147 148 148 148 149 151. . . . . . . .. 161 161 161 161 162 164 165 165. . . . . . . . . . .. 169 169 170 170 171 171 173 174 177 177 178. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . .. 7. CONCLUSIONES Y TRABAJO FUTURO 7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2. Aportación de resultados y discusión . . . . . . . . . . . . . . . . . . 7.2.1. Capítulo 3. Formulación intrínseca. Funciones de difusividad. 7.2.2. Capítulo 4. Problema unidimensional . . . . . . . . . . . . . . 7.2.3. Capítulo 5. Problema bidimensional . . . . . . . . . . . . . . . 7.2.4. Capítulo 6. Problema tridimensional . . . . . . . . . . . . . . . 7.3. Líneas de investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . A. ALGUNOS PRELIMINARES MATEMÁTICOS A.1. Definiciones básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2. Espacios funcionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2.1. Espacios Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2.2. Convolución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2.3. Espacios de Sobolev . . . . . . . . . . . . . . . . . . . . . . . . A.2.4. Espacios de Sobolev de exponente negativo . . . . . . . . . . . A.2.5. Solución débil y espacios de exponente negativo . . . . . . . . A.2.6. Espacios de Sobolev para funciones dependientes del tiempo A.3. Cálculo variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.4. Definiciones matriciales . . . . . . . . . . . . . . . . . . . . . . . . . . VI. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . ..

(10) A.4.1. Matrices irreducibles . . . . . . . . . . . . . . . . . . . A.5. Conceptos tensoriales . . . . . . . . . . . . . . . . . . . . . . . A.5.1. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . A.5.2. Componentes . . . . . . . . . . . . . . . . . . . . . . . A.5.3. Cambio de coordenadas de un tensor . . . . . . . . . A.5.4. Operaciones y tensores especiales . . . . . . . . . . . A.5.5. Formas bilineales y cuadráticas asociadas a un tensor. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. . . . . . . .. 179 180 180 181 183 183 184. B. OPERACIONES RELACIONADAS CON LA DERIVADA COVARIANTE B.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2. Primeras definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.3. Otras derivadas importantes . . . . . . . . . . . . . . . . . . . . . . . . . B.4. Derivadas de órdenes superiores . . . . . . . . . . . . . . . . . . . . . . B.4.1. Derivada de orden 3 . . . . . . . . . . . . . . . . . . . . . . . . . B.5. Derivadas covariantes adicionales . . . . . . . . . . . . . . . . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. 185 185 185 187 189 190 192. C. SOLUCIÓN PARA LA ECUACIÓN DE DIFUSIÓN NO LINEAL C.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.2. Planteamientos estacionarios . . . . . . . . . . . . . . . . . . . C.2.1. Propiedades del operador diferencial . . . . . . . . . . C.2.2. Primeros planteamientos . . . . . . . . . . . . . . . . . C.2.3. Espacios funcionales . . . . . . . . . . . . . . . . . . . . C.3. Estudio de soluciones para el problema estacionario . . . . . . C.3.1. Problema variacional . . . . . . . . . . . . . . . . . . . . C.3.2. Problema generalizado o débil (de contorno) . . . . . . C.4. Problema evolutivo . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. 195 195 195 196 199 200 201 201 204 207. VII. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . ..

(11) CAPÍTULO. 1. LOCALIZACIÓN Y PLANTEAMIENTO. 1.1. Introducción Esta tesis aborda el proceso previo a la segmentación de una imagen. La segmentación constituye un elemento primordial en el campo del procesamiento de una imagen, obtenida a partir de distintos medios (Tomografía Axial Computarizada (TAC), Resonancia Magnética (RM), Microscopía de campo claro, ...). Tiene como objetivo fundamental distinguir los posibles objetos de interés existentes en la imagen inicial. Esto resulta de gran importancia por ejemplo, en las imágenes biomédicas, en las que es necesario delimitar con precisión los diferentes órganos que se muestran en una imagen obtenida por un TAC o una RM. En particular, la segmentación del hígado es básica en la planificación de cirugías de extirpación de tumores o cirugías mínimamente invasivas, así como para diagnóstico y monitorización de pacientes con patologías relacionadas con dicho órgano (véase Heimann et al. [35]). Es habitual que las técnicas de segmentación identifiquen como objetos de interés de una imagen, aquellas que posean una mayor homogeneidad y cierto contraste. Es por tanto esencial, que en las imágenes que vayan a ser segmentadas, los objetos de interés tengan unos bordes claramente definidos.. (a) Imagen inicial. (b) Imagen con bordes detectados. Figura 1.1 – Detección de los objetos de interés. Un ejemplo se muestra en la figura 1.1. Inicialmente se considera una imagen sintética o artificial (fig. 1.1(a)) con unas regiones geométricas homogéneas y cierto contraste entre ellas. Posteriormente en la figura 1.1(b), se presenta la imagen procesada con el detector de Canny [19], en la que se observa el contorno o borde de cada una de las regiones geométricas, identificando así, los objetos de interés. 1.

(12) Capítulo – 1. LOCALIZACIÓN Y PLANTEAMIENTO Así pues, en este trabajo para comprobar la homogeneidad y realce de las regiones de una imagen, se utilizará el Detector de Canny1 , como herramienta para detectar los bordes y poder cuantificar la capacidad de homogeneización y contraste entre regiones. Tiene como propósito independizar el procesado de cualquier estrategia de segmentación.. 1.2.. Segmentación. Aunque este trabajo es acerca del proceso previo a la segmentación, creo que es importante establecer una pequeña introducción. La segmentación puede abordarse desde diferentes técnicas, como son: el método basado en agrupamiento (clustering), el método basado en el histograma, detección de bordes, crecimiento de regiones, registro, etc. Sin embargo, me centraré en el método de segmentación mediante la minimización de funcionales, que se relaciona de manera directa con el trabajo que se presenta en esta tesis. Uno de los primeros pasos para abordar la modelización matemática del problema de segmentación mediante la minimización de funcionales fue establecido por Mumford y Shah [56] en 1989. Sea Ω un conjunto abierto acotado de Rn con n = 2 ó 3 y sea u0 : Rn → R una imagen inicial. Se supondrá sin pérdida de generalidad, 0 6 u0 (x) 6 1 c.t.p.2 con x ∈ Ω. La idea planteada por Mumford y Shah se basa en buscar una aproximación u que varíe de forma suave en cada región, a partir de u0 junto con el conjunto de contornos C ⊂ Ω, que define la partición de la imagen u0 , de manera que minimicen el funcional ∫ ∫ ∫ 2 2 Σ(u, C) = (u0 − u) dx + α ∥∇u∥ dx + β dσ Ω\C. Ω\C. ∫. C. siendo α y β constantes no negativas y C dσ una medida de C (longitud o área). La primera integral expresa, que esta variación u no debe ser muy diferente del valor inicial u0 en las regiones Ω \ C; se trata de un término de fidelidad. La segunda integral pretende homogeneizar las regiones Ω \ C. Por último, con la última integral se trata de minimizar la medida del conjunto C; esto es, si se está en R2 , minimiza una medida de longitud de la curva y en R3 minimiza un área de la superficie. La idea de esta modelización consiste en localizar una imagen similar a la inicial, compuesta de varias regiones con una intensidad casi constante en cada una de ellas. Sin embargo, un inconveniente de este funcional, consiste en su difícil aplicación práctica: trata de minimizar dos elementos de diferente naturaleza. Por una parte el conjunto de discontinuidades, representada por los contornos C y por otra, la función u. Además su falta de diferenciabilidad en los espacios normados adecuados, hace que no pueda aplicarse la ecuación clásica de Euler-Langrange. Por último, resulta muy complicado la discretización del conjunto de discontinuidades C cuando es realmente una incógnita que hay que determinar. Sin embargo, debido al interés del concepto que plantea este funcional, es posible encontrar diferentes aproximaciones que evitan algunas de estas dificultades basadas en teorías de Γ-convergencia (Γconvergence theory) (para una introducción al tema puede consultarse el libro de Aubert y Kornprobst [5] y las referencias allí contenidas). Una alternativa al planteamiento de Mumford y Shah es el modelo de los Contornos activos (Active Contours). Ahora, el objetivo no es encontrar una partición de la imagen, como en el caso anterior, sino detectar automáticamente los contornos de los objetos. La detección de los bordes se basa en la variación de la intensidad entre el fondo de la imagen y el contorno de los objetos. Por tanto, la variación del gradiente de la intensidad u debe ser alta entre la frontera de los objetos que componen la imagen. Es por ello, que en este modelo, el valor ∥∇u(x)∥ se utiliza como detector de bordes en las imágenes. Kass et al. [39] presentan una primera aproximación a esta formulación. La detección de los bordes consiste en obtener contornos deformables c ∈ C, que se adapten a los objetos de una imagen, por medio de la minimización de un funcional de energía J(c) con c ∈ C. En su planteamiento3 , consideran 1. En este trabajo, mientras no se diga lo contrario, se adoptará como criterio, tomar un valor de σ = 1 (desviación típica o estándar del filtro gaussiano) para el detector de Canny [48] 2 Casi por todo punto. Quiere decir, que el conjunto de puntos que no cumple esta condición tiene medida nula, respecto de la Medida de Lebesgue. 3 Se considera en R2 por sencillez, aunque es directamente extendible a R3. 2.

(13) 1.2. Segmentación que el conjunto de bordes de los objetos corresponden a contornos cerrados de clase C 1 a trozos, en R2 . Con respecto a la intensidad, se utiliza una función u : Ω ⊂ R2 → R con ∇u(x) perteneciente al espacio de Sobolev W 1,∞ (Ω) (véase sección A.2 pág. 170). Para asociar a los bordes valores próximos a cero, se define la siguiente función: m : [0, ∞) → (0, ∞) m es derivable y monótona decreciente. m(0) = 1 y lı́m m(r) = 0 r→+∞. a x 7→ m(∥∇u(x)∥) se le denomina función detector de bordes. Un ejemplo típico es m(r) = además, el conjunto C de contornos en R2 de la forma. 1 . 1+r2. Se define. C = {c : [a, b] → Ω / c ∈ C 1 a trozos, con c(a) = c(b)} De esta manera se establece el funcional ∫ b ∫ b ∫ b ′ 2 ′′ 2 J(c) = ∥c (r)∥ dr + β ∥c (r)∥ dr + λ m (∥∇u(c(r))∥) dr a. a. a. Es interesante observar que el tercer término permite, debido a la presencia de la función m, que las curvas sean atraídas por los bordes de los objetos que forman la imagen. El contorno c, como consecuencia de este movimiento adaptativo a los objetos de la imagen mientras se minimiza el funcional de energía, recibe el nombre de snakes. Este planteamiento tiene el inconveniente que no es intrínseco, pues depende de la parametrización c de la curva y además, no puede detectar más de un objeto, que debe ser convexo. A la vista de estas dificultades y otras desde un punto de vista numérico, Caselles et al. [20] presentan el método de los Contornos activos geodésicos (Geodesic Active Contours) que mejoran la idea anterior, considerando la minimización de un funcional que integra únicamente, el detector de bordes m a lo largo del contorno. Esto es, se considera el funcional ∫ b m(∥∇u(c(r))∥) ∥c′ (r)∥ dr Θ(c) = α a. Esta integral expresa una ponderación respecto de la longitud euclídea de la curvas c. La función m es el indicador de bordes. A partir de una curva inicial c0 (r), se pueden detectar los contornos de los objetos de la imagen, mediante la evolución de una familia de curvas c(t, r) a partir de la formulación diferencial del funcional Θ(c) que da lugar a la ecuación ∂c = (κ m − ∇m · n) n ∂t donde κ es la curvatura y n es la normal exterior a la curva c(t, r). Debido a la definición de la función m, la evolución de las curvas se detiene en los bordes de los objetos. De nuevo, un inconveniente de esta formulación es la imposibilidad de un cambio en la topología en la evolución de las curvas. En este sentido, Osher y Sethien [61] plantean el método de los Conjuntos de nivel (Level Set Method) que permite resolver la ecuación anterior de manera óptima permitiendo un cambio de topología en la evolución de las curvas, pudiendo en este caso, detectar más de un objeto (véase Osher y Fedkiw [60]). Por otra parte, una importante simplificación del funcional de Mumford y Shah, es la propuesta planteada por Chan y Vese [24]. En este caso, muestran que su planteamiento equivale al funcional de Mumford y Shah cuando se aplica a funciones constantes a trozos. El modelo se basa, por una parte en la eliminación del valor ∥∇u∥ del funcional, que está relacionado con los bordes de las regiones contenidas en la imagen y por otra, en el término de fidelidad del funcional. Estos términos son sustituidos 3.

(14) Capítulo – 1. LOCALIZACIÓN Y PLANTEAMIENTO por otros, que hacen referencia a la minimización de la varianza de las diferentes intensidades radiométricas, correspondientes a las distintas objetos de interés, generando un modelo de contornos activos se evolucionan de forma que son capaces de adaptarse a estas regiones. Como ejemplo, el funcional para una imagen u0 constituida por dos regiones: una clara y otra oscura, sería: ∫ ∫ Π(C, c1 , c2 ) = µ Long(C) + ν Area(int(C)) + λ1 |u0 (x) − c1 |2 dx + λ2 |u0 (x) − c2 |2 dx int(C). ext(C). donde C es la curva variable, y las constantes c1 y c2 que dependen de C, son los valores medios de la intensidad de u0 en el interior y el exterior de lo que rodea la curva C en su evolución. Los valores µ > 0, ν > 0 y λ1 , λ2 > 0 son constantes. Así pues, se trata de buscar ı́nf. C,c1 ,c2. Π(C, c1 , c2 ). De nuevo, en este caso, la formulación diferencial del funcional da lugar a una ecuación de EulerLagrange del tipo ∂c = Fn ∂t c(0, r) = c0 (r) para cierta función F , que puede resolverse mediante el algoritmo Level Set de manera eficiente. Un ejemplo de este proceso de segmentación se muestra en la figura 1.2. En este caso, se comienza con diferentes curvas de nivel que van evolucionando y modificándose topológicamente hasta que la curva se adapta al contorno de la figura.. (a) Imagen inicial. (b) Evolución del proceso de segmentación de Chan-Vese. Figura 1.2 – Segmentación de Chan-Vese Así pues, se ha visto que para abordar el problema de segmentación de una imagen por medio de la minimización de funcionales hay, grosso modo, dos planteamientos. Por una parte, están aquellos que se guían por la localización de los bordes de las regiones, identificados por una elevada pendiente entre los píxeles contiguos y por otra, los que están dirigidos por las regiones que son constantes a trozos. En cualquier caso, resulta importante que la imagen de entrada esté nítidamente constituida 4.

(15) 1.2. Segmentación por objetos homogéneos y bordes definidos, tal y como muestra la figura 1.1. Sin embargo, la realidad no es así. Los objetos de interés no suelen ser homogéneos y junto con la presencia de ruido, bordes difusos y la necesidad de eliminar ciertos elementos en dichos objetos de interés, hacen que el proceso de segmentación no sea todo lo óptimo que cabría esperar (fig. 1.3).. (a) Imágenes iniciales. (b) Imágenes con bordes detectados. Figura 1.3 – Imágenes reales. Dos ejemplos interesantes se muestran en las figuras 1.4. En este caso, se presentan los resultados de un proceso de segmentación mediante el criterio de Chan-Vese. Inicialmente las imágenes no están previamente procesadas y exhiben un resultado incorrecto (fig. 1.4(a)). En la figura 1.4(b) las imágenes ha sido procesadas previamente, dando lugar a un resultado correcto. 5.

(16) Capítulo – 1. LOCALIZACIÓN Y PLANTEAMIENTO. (a) Segmentación de imágenes sin procesamiento previo. (b) Segmentación de imágenes procesadas. Figura 1.4 – Ejemplo de segmentación sobre imágenes sin procesar y procesadas En esta tesis se quiere precisamente, abordar el proceso previo a la segmentación. Esto es, dada una imagen de media y baja calidad, afectada por la presencia de ruido, contornos borrosos y tal vez con objetos de interés poco definidos o contaminados con pequeños objetos, se pretende procesar para lograr que la segmentación resulte más efectiva. En la figura 1.5 muestra, mediante el Detector de Canny con σ = 1, cómo procesando previamente las imágenes iniciales 1.3, los posibles objetos de interés quedan mucho más homogéneos y definidos lo que facilita la segmentación de las imágenes.. (a) Imágenes procesadas. (b) Imágenes procesadas con bordes detectados. Figura 1.5 – Imágenes reales procesadas. 6.

(17) 1.3. Geometría y textura de una imagen. 1.3. Geometría y textura de una imagen Una vez planteado el interés en desarrollar una transformación de la imagen que facilite el proceso segmentación es coherente que esta modificación sobre la imagen inicial, resalte las formas, la parte geométrica y homogeneice las regiones. Además, debe tratar de eliminar los pequeños detalles y el posible ruido. Es necesario, por tanto proponer un primer marco matemático que permita desarrollar este proceso. En este sentido, es interesante destacar varios trabajos (véase Meyer [53], Vese y Osher [91], Aujol y Chambolle [7], Aujol et al. [6], Aujol et al. [11], Buades et al. [17], entre otros) en donde se propone y se utiliza una división de la imagen en dos componentes: u0 = u + v u0 es la imagen inicial, u modeliza la geometría o las regiones homogéneas (también llamada parte estructural o ‘cartoon’) y v contiene la textura. Una definición precisa y formal de ambas componentes resulta difícil. Generalmente, la textura de una imagen se asocia a aquellos pequeños detalles que aparecen con cierta periodicidad y con una posible naturaleza oscilatoria, que puede asociarse al ruido. Sin embargo, esta definición es en cierta manera imprecisa, pues depende del nivel de escala a la cual se esté observando la imagen. Así una parte estructural en una escala, puede representar textura en otra. Algunos ejemplos pueden verse en las imágenes de la figura 1.6, en donde los rectángulos muestran algunas zonas que se han considerado como textura.. Figura 1.6 – Ejemplos de textura La formulación variacional es el marco natural para determinar ambas componentes y los espacios funcionales el lugar adecuado para situar dichas componentes. A partir de ahora, u0 representará la imagen inicial, definida sobre un dominio acotado Ω y con frontera lipschtiziana (es decir ∂ Ω ∈ C 0,1 ). Típicamente Ω puede representar un rectángulo o un hexaedro. Además se supondrá que u0 está acotada, con lo cual u0 ∈ L∞ (Ω) y puesto que Ω está acotado, u0 ∈ L2 (Ω). Inicialmente, Rudin et al. [80] plantean en el contexto de la eliminación de ruido, el problema de 7.

(18) Capítulo – 1. LOCALIZACIÓN Y PLANTEAMIENTO minimización. (∫. (1.1). ) |D u| +. ı́nf. (u,v)∈BV (Ω)×L2 u0 =u+v. Ω. λ∥v∥2L2. El primer sumando está relacionado con la parte geométrica de la imagen, mientras que el segundo, hace referencia a una medida del ruido. Para modelizar matemáticamente las funciones asociadas a la parte geométrica, se suele utilizar el espacio BV (Ω), que representa el conjunto de las funciones de Variación acotada (Bounded Variation) sobre Ω. Siguiendo la nomenclatura establecida por Chambolle [22] y Aujol et al. [6], este conjunto corresponde a un subespacio de funciones f ∈ L1 (Ω) para las que la siguiente cantidad (llamada Variación total de f ) {∫ } ∫ (1.2) VT (f ) ≡ |D f | = sup f (x) div (ξ(x)) dx ξ∈Cc1 (Ω;Rn ); ∥ξ∥∞ 61. Ω. Ω. es finita. Si f es una función para la cual ∇f (x) ∈ L1 (Ω) entonces la Variación total de f puede expresarse como: ∫ ∫ VT (f ) ≡. |D f | = Ω. ∥∇f (x)∥ dx Ω. Para hacerse una idea del tipo de funciones que pueden ser de Variación acotada, es interesante trabajar en el caso unidimensional. Se tendría entonces, VT (f ) =. sup. n ∑. P ∈P[a,b] i=1. |f (xi ) − f (xi−1 )|. donde P es una partición del conjunto de particiones P[a,b] del intervalo [a, b]. En la figura 1.7 se muestran dos funciones que siendo acotadas en el intervalo [0, 1], no son de Variación acotada, mientras que en la figura 1.8 se muestran dos funciones de Variación acotada en dicho intervalo. 1. 1 0.8. 0.8 0.6 0.6. 0.4 0.2. 0.4. 0 0.2. −0.2 −0.4. 0. −0.6 −0.2 −0.8 −1. 0. 0.2. 0.4. 0.6. (a) f (x) = sen. 0.8. −0.4. 1. (1). 0. 0.2. 0.4. 0.6. (b) f (x) = x · sen. x. 0.8. 1. (1) x. Figura 1.7 – Funciones que no son de Variación acotada en [0, 1] A la vista de estos ejemplos, se observa que las funciones de Variación acotada evitan, en cierta manera, las funciones con oscilaciones de alta frecuencia. Así pues, es razonable pensar que representen adecuadamente la parte geométrica o cartoon de la imagen. Si se aplica la definición (1.2) a la función característica χA { 1 si x ∈ A χA (x) = 0 si x ̸∈ A 8.

(19) 1.4. Planteamiento de la tesis Y 0.9 0.8 0.7 0.6 0.5 0.4 0.3. 0. 1. X. 0.2 0.1 0 −0.1. 0. 0.2. 0.4. 0.6. (b) f (x) = x2 · sen. (a) Función continua a trozos. 0.8. 1. (1) x. Figura 1.8 – Funciones de Variación acotada en [0, 1] siendo A un subconjunto acotado de Ω con frontera suave, puede probarse (véase [5]) que ∫ VT (χA ) = |D χA | = |∂A| Ω. es decir, es igual al perímetro de A o al área de la superficie que es frontera de A. El concepto de Variación Total se aplica a las imágenes con regiones con discontinuidades, que podrían interpretarse como los bordes de dichas regiones. De esta manera, la Variación Total de una imagen cartoon o con regiones constantes a trozos, vendría dada por la suma de las longitudes de sus conjuntos de nivel: ∫ ∞ |Lα (f )| dα < +∞ donde Lα (f ) = {x / f (x) = α} VT = −∞. siendo |Lα (f )| la longitud de Lα (f ). En este sentido, en la figura 1.9 se muestran dos funciones de Variación acotada en 2D, con valores de VT distintos. La imagen de la derecha tiene un menor valor de Variación total, que la de la izquierda. Esto hace que la imagen de la derecha sea más cartoon.. Figura 1.9 – Dos funciones de Variación acotada en 2D. La función de la izda. tiene un valor de VT mayor que la imagen de la derecha, que es más cartoon [67]. 1.4. Planteamiento de la tesis El objetivo de esta tesis consiste en plantear una propuesta que permita eliminar, a partir de las imágenes iniciales, no sólo el ruido inherente en toda adquisición, sino también aquellos elementos que no sean destacables para el proceso de segmentación. Es por ello, que es natural que se esté más interesado 9.

(20) Capítulo – 1. LOCALIZACIÓN Y PLANTEAMIENTO en la parte estructural o cartoon de la imagen, que en la textura. Es decir, se debe buscar un proceso que transforme la imagen inicial en un conjunto de regiones constantes a trozos (piecewise constant regions). Una primera aproximación a este planteamiento, consiste en operar con el funcional que define la parte estructural de la imagen. De esta manera, se comienza con funciones de u ∈ W 1,1 (Ω) y se define el funcional ∫ Ψ(u) = ρ (∥∇u(x)∥) dx Ω. con el propósito de eliminar el ruido, además de homogeneizar los objetos de interés de la imagen, con una nítida distinción de los bordes. Se trata de buscar una ρ adecuada, de manera que no sea necesario utilizar el segundo sumando del modelo de Rudin et al. (1.1). Con esta idea, se plantea el problema de minimizar el funcional ∫ (1.3) mı́n Ψ(u) con Ψ(u) = ρ (∥∇u(x)∥) dx u:Ω→R. Ω. Es conocido que la condición necesaria para encontrar un mínimo del problema anterior, viene dada por la ecuación de Euler–Lagrange: δΨ(u) = 0 Para resolver esta ecuación se aplica el clásico método del descenso del gradiente, consistente en reformular el problema con la idea de encontrar la trayectoria u(t) tal que cumpla: (1.4a) (1.4b). ∂u (x, t) = −δΨ(u(x, t)) ∂t u(x, 0) = u0 (x) Condición inicial. Este planteamiento expresa que para alcanzar el mínimo, se debe seguir un sentido opuesto a la mayor variación de Ψ. Un hecho destacable de esta formulación, consiste en que la introducción artificial de la variable tiempo t (en el sentido que es necesario para facilitar la resolución de la ecuación de Euler–Lagrange), permite describir una evolución continua de la función u hasta que se minimiza Ψ(u). En el contexto de las imágenes, a partir del valor inicial u0 (x), la ecuación evolutiva (1.4) genera una familia de funciones (i.e. imágenes) {u(x, t)}t>0 que representan sucesivas versiones de u0 (x). A medida que t se incrementa, u(x, t) cambia a imágenes más simplificadas Así pues, con la evolución establecida por (1.4) no se crean nuevas estructuras, sino que simplemente se va transformando la inicial. Por este motivo a la variable temporal t se denomina variable de escala (scale variable) (véase Koenderink [43]). Este es el planteamiento que seguiré para desarrollar el trabajo de investigación. Es un procedimiento que se enmarca dentro de los modelos basados en EDP’s (Ecuaciones en Derivadas Parciales) del análisis de imágenes. Así pues, una parte importante de esta tesis, consiste en escoger una Ψ adecuada, de manera que la ecuación (1.4) permita realizar dos procesos, aparentemente contrapuestos. Por una parte, u(t, x) debe representar una versión homogeneizada de u0 (x), esto es, sin ruido y sin textura pero manteniendo una distinción nítida de los bordes. Este hecho resulta problemático, pues los bordes también se caracterizan por tener un elevado valor ∥∇u∥. Si se sustituye la expresión explícita de la primera variación del funcional (1.3) en la ecuación (1.4) se tiene: ( ) ∂u ∇u ′ (x, t) = div ρ (∥∇u∥) · ∂t ∥∇u∥ u(x, 0) = u0 (x) Puesto que el conjunto en donde se quiere resolver la ecuación corresponde a una imagen, el dominio debe ser acotado y por tanto se deben imponer unas condiciones de contorno. Durante el proceso evolutivo establecido no debe haber ningún tipo de transferencia de energía, que pueda modificar las condiciones iniciales. Por ello se plantean unas condiciones de contorno Neumann homogéneas. Así pues, 10.

(21) 1.5. Objetivos del trabajo se considera el conjunto Ω ⊂ Rn como un dominio acotado con ∂ Ω ∈ C 0,1 y se define ΩT ≡ Ω × (0, T ] para cierto valor real T > 0 fijo. De esta manera, se estudia el problema de condiciones iniciales y de contorno: ) (  ∂u ∇u  ′  (x, t) = div ρ (∥∇u∥) · si (x, t) ∈ Ω × (0, T ]   ∥∇u∥  ∂t u(x, 0) = u0 (x) si x ∈ Ω (1.5)    ∂u   (x, t) = 0 si (x, t) ∈ ∂Ω × (0, T ] ∂n que es una ecuación parabólica no lineal. A continuación se propone establecer la relación: (1.6). ρ(s) =. 1 2. ∫. s2. g(t) dt 0. siendo g : R+0 → R+ positiva, decreciente con g ∈ C 1 a trozos y la derivada acotada. Aunque la expresión (1.6) no es original (véase Zeidler [110, pág.522]) su utilización en el contexto del procesamiento de imágenes no es habitual, incluso novedoso (véase Sanguino et al. [82]). Esta expresión permite además, disponer de las relaciones: (1.7). ρ′ (s) = g(s2 ) s. y. ρ′′ (s) = g(s2 ) + 2 g ′ (s2 ) s2. La primera de ellas, junto con (1.5) permite llegar a la formulación: ( )  ∂t u = div g(∥∇u∥2 ) ∇u si (x, t) ∈ Ω × (0, T ]   u(x, 0) = uo (x) si x ∈ Ω Condiciones iniciales (1.8)   ∂n u = 0 si (x, t) ∈ ∂Ω × (0, T ] Condiciones de contorno Se trata de una ecuación de difusión no lineal. El procedimiento que se ha propuesto para obtener una imagen constante a trozos, como paso previo al proceso de segmentación, se realiza dentro del modelo planteado por Perona y Malik [65]. Para ello se debe seleccionar una función de difusividad g adecuada, de manera que no sólo sirva para eliminar el ruido, sino para además sirva para homogeneizar las regiones de interés y obtener una imagen constante a trozos. Aunque el modelo propuesto se puede interpretar como un proceso de eliminación de ruido (a denoising process), la transformación que se desea desarrollar en esta tesis es conceptualmente distinta. El proceso de denoising suele estar asociado a un proceso de fidelidad con el dato inicial, cuestión que no se pretende en este trabajo. Interesa obtener la parte estructural o cartoon de la imagen, sin considerar ningún tipo de fidelidad con la imagen inicial. Esta idea no es nueva, el funcional de Mumford y Shah [56] puede considerarse como el primer intento de descomposición de la imagen en una parte estructural y en textura (véase Buades et al. [17]). Además es posible relacionar este funcional con el proceso de difusión no lineal de Perona-Malik [65] (véase Kawohl [40]).. 1.5. Objetivos del trabajo Una vez establecido con claridad el planteamiento de esta tesis, se pasa a describir los objetivos que se irán alcanzando a lo largo de este documento. Primeramente, se analizarán las condiciones sobre g y por tanto sobre ρ, de manera que el proceso de evolución (1.8) genere imágenes, con regiones claramente homogéneas, pero manteniendo la nitidez de los bordes (piecewise constant regions). En este sentido, en una primera parte se propone un marco teórico intrínseco para la ecuación de difusión no lineal que servirá como base para generalizar las condiciones de realzado a N dimensiones (aportación original en esta tesis). A partir de aquí, con estas condiciones establecidas se sugiere una 11.

(22) Capítulo – 1. LOCALIZACIÓN Y PLANTEAMIENTO función de difusividad cuyo efecto será transformar las imágenes originales en imágenes tipo cartoon (aportación original en esta tesis). A continuación se verifica, para la función de difusividad propuesta, que se cumplen las condiciones para la existencia de solución del sistema de ecuaciones diferenciales ordinarias obtenido al aplicar el Método de las líneas [46] a la ecuación en derivadas parciales (1.8). Se comprueba además, que se trata de un esquema que desarrolla un proceso de transformación dentro de un marco scale-space que deben seguir los procesos de evolutivos de la imagen (véase Weickert [100]), para asegurar la existencia de solución. Una vez discretizado el tiempo, se justifica a partir de esquemas implícitos, que la estabilidad del método numérico está relacionado con el algoritmo iterativo de Picard lo que implica a su vez, que el proceso de numérico de difusión inversa es realmente un proceso numérico de difusión directa no lineal con una función de difusividad que es positiva pero decreciente (aportación original en esta tesis). Por último, la propuesta planteada se aplica tanto a imágenes sintéticas como a imágenes reales en 2D y 3D para tratar de obtener imágenes cartoon.. 12.

(23) CAPÍTULO. 2. ESTADO DE LA TÉCNICA. 2.1. Introducción En este capítulo se presentan otros tipos de técnicas que son factibles para obtener imágenes a trozos, como paso previo al proceso de segmentación.. 2.2. Métodos variacionales La utilización de métodos variacionales para una descomposición de la imagen en una parte geométrica y en otra componente de textura, puede encuadrarse dentro de los llamados problemas inversos (véase Vogel [97], Peyré [66]). Habitualmente, los problemas inversos en procesamiento de imágenes están asociados a un esquema del tipo u0 = Φ u + v donde u0 es la imagen inicial obtenida y Φ es un operador. En el caso discreto, Φ representa un operador lineal de RN en RP con P 6 N , no necesariamente invertible, lo que puede dar lugar a problemas mal propuestos. La idea en este tipo de planteamientos consiste en reconstruir la componente u a partir de la imagen inicial u0 . Dependiendo de las características del operador Φ, aparecen diferentes problemas del procesamiento de imágenes (denoising, de-blurring, super-resolution, inpainting). En nuestro caso, el operador Φ se asocia con el operador identidad (Φ ≡ Id) y el problema inverso se traduce en la formulación { u0 = u + v. donde. u : componente geométrica v : textura+ ruido. La solución que se busca se aproxima mediante la resolución de un problema de minimización convexa del tipo (2.1). u∗ ∈ arg mı́n u∈X1. 1 ∥u0 − u∥2X2 + λ J(u) 2. donde X1 y X2 son espacios de funciones o distribuciones, J(u) un funcional convexo, ∥·∥X2 una medida de fidelidad o similaridad con la solución inicial y λ un parámetro, que pondera las medidas de fidelidad y de homogenización de la solución. 13.

(24) Capítulo – 2. ESTADO DE LA TÉCNICA. 2.2.1.. Descomposición de la imagen en componente geométrica y textura. Los conceptos de componente geométrica o cartoon y componente de textura en una imagen, ya fueron introducidos anteriormente (véase sección 1.3 en la página 7). Seguidamente se presentan algunos ejemplos significativos de este tipo de planteamiento. No obstante, en Buades et al. [17] se muestran una mayor variedad de modelos variacionales. Descomposición TV-L2 Rudin et al. [80] (ROF) plantean un esquema del tipo (2.1), pero en el contexto de la eliminación de ruido en la imagen, es decir la componente v la asocian a un término ruidoso, en lugar de considerarla como la componente asociada a la textura. Así mismo, X1 = BV (Ω), X2 = L2 (Ω) y ∫ |D u|. J(u) = Ω. llamado funcional de Variación total (TV) (Total Variation). Por tanto se debe minimizar la expresión: (∫ |D u| + λ∥u0 −. ı́nf. (u,v)∈BV (Ω)×L2 u0 =u+v. ). Ω. u∥2L2. El primer sumando es un funcional ligado a la parte geométrica de la imagen y el segundo sumando es un funcional asociado, en este caso, al ruido. En las figuras 2.1 y 2.2 se observan los resultados al aplicar este criterio. Uno de los inconvenientes de este modelo radica en la utilización de la norma L2 para la componente del ruido. Al buscar un mínimo en este funcional, la medida de similaridad que representa esta norma, impide que la diferencia entre la imagen inicial u0 y la procesada u, sea elevada. Esto implica que el proceso de minimización se detiene con una imagen procesada u, no muy distinta a la original u0 . Como consecuencia, en la imagen procesada no se elimina la textura de la imagen. Es por ello que este modelo, queda identificado en el contexto de la eliminación del ruido.. Figura 2.1 – Imagen procesada con el modelo T V × L2 . De izda. a decha.: imagen original, imagen cartoon, textura, imagen cartoon con bordes detectados para indicar los objetos de interés para la segmentación.. Figura 2.2 – Imagen procesada con el modelo T V × L2 . De izda. a decha.: imagen original, imagen cartoon, textura, imagen cartoon con bordes detectados para indicar los objetos de interés para la segmentación.. 14.

(25) 2.2. Métodos variacionales Una importante alternativa es propuesta por Meyer [53], que introduce un nuevo espacio funcional para la componente de la textura. A partir de este trabajo se establece un marco variacional general, para poder descomponer la imagen inicial u0 en las componentes u + v, mediante un problema de minimización de funcionales de energía (véase Buades et al. [17]) (2.2). ı́nf. (u,v)∈X1 ×X2 u0 =u+v. {F1 (u) + λ F2 (v)}. donde F1 , F2 > 0 son funcionales y X1 , X2 son espacios de funciones o distribuciones tales que F1 (u) < +∞. y. F2 (v) < +∞ ⇐⇒ (u, v) ∈ X1 × X2. y siendo λ un parámetro que se debe sintonizar, que pondera las medidas de fidelidad y de homogenización de la solución. Se obtendrá una buena modelización por medio del funcional (2.2) cuando para los espacios seleccionados X1 y X2 se cumpla, F1 (u) ≪ F2 (u) y. F1 (v) ≫ F2 (v). siendo u la componente cartoon y v la textura. Sin embargo, en el trabajo de Meyer [53], la mayor dificultad se encuentra en la resolución numérica, pues es difícil plantear un esquema eficiente a partir de los espacios funcionales considerados. Es habitual, que para soslayar este tipo de dificultad, se consideren nuevos esquemas que, en cierta manera, estén relacionados con la propuesta inicial. En este sentido surgen una variedad de alternativas que proporcionan diversos espacios funcionales con características similares a la propuesta por Meyer, pero con esquemas numéricos, que facilitan la descomposición de la imagen (véase por ejemplo, Vese y Osher [95, 96], Aujol et al. [6], Nikolova [57], Chambolle et al. [23], Chambolle [22]). Descomposición TV-H Una notable mejora en el modelo de ROF es introducida por Osher et al. [62] (OSV). En ella utilizan un filtro paso bajo (fig. 2.3) para eliminar las altas frecuencias del espectro de u e introduce la utilización del espacio H −1 (véase subsección A.2.5 en la página 174). En cierta manera, este espacio funcional da mucha más importancia a las bajas frecuencias. La idea es la siguiente: en el dominio de frecuencias, la función 1 W (ξ) = ∥ξ∥ ̸= 0 ∥ξ∥2 está asociada a un filtro paso bajo, y coincide con la inversa de la transformada de fourier del laplaciano −∆. Esto es: F. −∆u(x) = f (x) −→ ∥ξ∥2 û(ξ) = fˆ(ξ) =⇒ û(ξ) =. 1 ˆ F −1 f (ξ) = W (ξ)fˆ(ξ) −→ u(x) = F −1 (W (ξ)·F(f )(ξ)) 2 ∥ξ∥. donde F y F −1 hacen referencia a la transformada y anti-transformada de Fourier, respectivamente. Es habitual utilizar la notación: u(x) = F −1 ( W (ξ) · F(f )(ξ) ) = F −1 (W (ξ)) ∗ f (x) ≡ −∆−1 f (x) Teniendo en cuenta el Teorema de Plancherel, que iguala los productos escalares en L2 entre las funciones en el dominio espacial y el dominio frecuencial, se puede identificar el cálculo de la norma en H −1 como una aplicación de un filtro paso bajo. Esto es, grosso modo ∥f ∥−1 = (f, −∆−1 f )2 = ( f, F −1 (W · F(f )) )2 = (F(f ), W · F (f ))2 = (F(f ), F(−∆−1 f ))2 15.

(26) Capítulo – 2. ESTADO DE LA TÉCNICA. ξ. Figura 2.3 – Ejemplo de un filtro paso bajo en el dominio frecuencial. y cuyo cálculo se determina fácilmente mediante la transformada discreta de Fourier. Así pues, se plantea la minimización del funcional (∫ ) 2 (2.3) ı́nf |D u| + λ∥u0 − u∥−1 (u,v)∈BV (Ω)×H u0 =u+v. Ω. Por tanto, la norma ∥ · ∥−1 mide la similaridad de la componente geométrica entre la imagen inicial u0 y la procesada u. Ello es debido al efecto del filtro paso bajo, que tiende a eliminar las altas frecuencias del espectro de la diferencia u0 − u, en el espacio frecuencial. Posteriormente, Aujol y Gilboa [8, 10] a partir del trabajo de Aujol y Chambolle [7] establecen una formulación más general de la forma (∫ |D u| + λ∥u0 −. ı́nf (u,v)∈BV (Ω)×H u0 =u+v. ). Ω. u∥2H. donde H es un espacio de Hilbert, que depende del modelo considerado. De esta manera, si K es un operador lineal y simétrico, con una serie de propiedades adicionales [8] resulta (f, g)H = (f, Kg)2 Si K = Id, entonces H = L2 , que corresponde al modelo ROF Si K = −∆, entonces H = H 1 (con la norma ∥u∥ = ∥∇u∥2 ) Si K = −∆−1 , entonces H = H −1 , que corresponde al modelo OSV Además Aujol y Chambolle [7] generalizan el método de la proyección para resolver de minimización (2.3), que ya había sido utilizado por Chambolle [22] para el modelo ROF. Una ilustración sobre el planteamiento OSV (2.3) se puede observar en las figuras 2.4 y 2.5.. Figura 2.4 – Imagen procesada con el modelo T V × H −1 . De izda. a decha.: imagen original, imagen cartoon, textura, imagen cartoon con bordes detectados para indicar los objetos de interés para la segmentación.. 16.

(27) 2.2. Métodos variacionales. Figura 2.5 – Imagen procesada con el modelo T V × H −1 . De izda. a decha.: imagen original, imagen cartoon, textura, imagen cartoon con bordes detectados para indicar los objetos de interés para la segmentación.. Descomposición TV-G El modelo (2.3) asociado a un filtro paso bajo es mejorada por Aujol et al. [9] a un filtro rechazo de banda (fig. 2.6). La idea ahora, es establecer una medida de fidelidad de la imagen inicial u0 con la procesada u, no sólo en las regiones más homogénenas de la imagen, sino también en la parte correspondiente a los bordes. Para ello, en el espacio frecuencial, se propone un filtro rechazo de banda que elimine las frecuencias intermedias. El planteamiento es una generalización del caso anterior, esto es (f, g)H = (f, Kg)2 = ( f, F −1 (W · F(g)) )2 = (F(f ), W · F(g))2 = (F(f ), F(Kg))2 siendo K es un operador lineal simétrico y positivo, cuya expresión en el dominio de frecuencias corresponde al filtro rechazo de banda W , es decir F −1 (W (ξ)) ∗ g(x) = Kg(x). ξ. Figura 2.6 – Ejemplo de un filtro rechazo banda en el dominio frecuencial. Los autores proponen la utilización de funciones de Gabor [28] como caracterización del filtro rechazo de banda. En esta situación se establece la minimización del funcional (∫ ) √ 2 ı́nf |D u| + λ∥ K(u0 − u)∥L2 (u,v)∈BV (Ω)×H u0 =u+v. Ω. En las figuras 2.7 y 2.8 se muestran dos ejemplos en los que se utiliza este planteamiento.. 17.

(28) Capítulo – 2. ESTADO DE LA TÉCNICA. Figura 2.7 – Imagen procesada con el modelo T V ×G. De izda. a decha.: imagen original, imagen cartoon, textura, imagen cartooncon bordes detectados para indicar los objetos de interés para la segmentación.. Figura 2.8 – Imagen procesada con el modelo T V ×G. De izda. a decha.: imagen original, imagen cartoon, textura, imagen cartooncon bordes detectados para indicar los objetos de interés para la segmentación.. 2.3.. Métodos basados en EDP’s. La idea de estos modelos se fundamentan en la solución de una ecuación diferencial no lineal de la forma general: ( )  ∂t u + F x, u(x, t), ∇u(x, t), ∇2 u(x, t) = 0 si   u(x, 0) = u0 (x) si (2.4)   ∂n u = 0 si. (x, t) ∈ Ω × (0, T ] x∈Ω. Condiciones iniciales. (x, t) ∈ ∂Ω × (0, T ]. Condiciones de contorno. Una diferencia importante con respecto a los planteamientos variacionales anteriores, está en la presencia del parámetro t. El proceso evolutivo que genera la ecuación (2.4), da lugar a una familia de funciones (imágenes) {u(x, t)}t>0 que representan versiones sucesivas, de la función inicial (imagen inicial) u0 (x). A medida que el valor de t aumenta, se espera que u(x, t) se transforme cada vez más, en imágenes más simplificadas. Por estas razones, a t se le denomina variable de escala. Esta idea de escala, está asociada a la Teoría de escala-espacio (scale-space theory) [43] (véase figura 2.9). En este sentido, es obligado mencionar la importante contribución de Álvarez et al. [2] en la que se establece de manera rigurosa una conexión, entre el análisis escala-espacio y las EDP’s. Partiendo de un conjunto de axiomas muy naturales (basados en propiedades deseables para una imagen), demuestran que la imagen filtrada resultante, necesariamente debe ser la solución de una EDP. Dentro del contexto en el que se quiere plantear este trabajo, se considera como caso particular la ecuación ( )  ∂t u = div g(∥∇u∥2 ) ∇u si (x, t) ∈ Ω × (0, T )   u(x, 0) = uo (x) si x ∈ Ω Condiciones iniciales , (2.5)   ∂n u = 0 si (x, t) ∈ ∂Ω × (0, T ) Condiciones de contorno propuesta inicialmente por Perona y Malik [65]. Este modelo está generalmente, asociado a procesos de difusión-realce de una imagen. Se trata de seleccionar una función adecuada g llamada función de difusividad que permita disminuir el ruido y realzar la imagen manteniendo cierta fidelidad con la 18.

(29) 2.3. Métodos basados en EDP’s. Figura 2.9 – Ejemplo de la noción de escala-espacio. Izda. a decha.: la estructura de la imagen se va simplificando a medida que el tiempo evoluciona. Arriba: difusión lineal. Abajo: difusión TV. original. Es posible, como ya se ha comentado anteriormente (véase sección 1.4 en la página 9), relacionar un funcional del tipo ∫ Ψ(u) = ρ (∥∇u(x)∥) dx Ω. mediante la expresión (véase Sanguino et al. [82]) ρ(s) =. 1 2. ∫. s2. g(t) dt, 0. con la formulación de Perona y Malik (2.5). Esto da lugar a vincular ciertos modelos variacionales con planteamientos en EDP’s. Así pues, a partir de diferentes definiciones para ρ (véase figura 2.10) se pueden considerar distintos procesos de difusión-realce, cuyos efectos pueden observarse en la figura 2.11. En este ejemplo, se ha introducido como imagen test, el hombre de la cámara con ruido gaussiano. En las diferentes imágenes se constatan los resultados con los diferentes criterios expuestos en la figura 2.10. Para realizar el proceso evolutivo se ha considerado un esquema explícito con ∆t = 0.24 y como número de iteraciones niter = 20. Es interesante observar en la figura 2.11, como aquellas funciones ρ, que tienen una naturaleza no convexa, proporcionan mejores resultados en un proceso de difusión-realce. En el apéndice C (pág. 195) se detalla la necesidad de una naturaleza estrictamente convexa de ρ, para asegurar existencia y unicidad al problema (2.5). Esta situación se observa con claridad en 1D. En este caso, la ecuación evolutiva toma la forma: [ ] ∂t u(x, t) = 2 g ′ (u2x ) u2x + g(u2x ) uxx = ρ′′ (|ux |) uxx | {z } | {z } negativo. negativo. En los casos en que ρ es no convexa, corresponde a un problema evolutivo regresivo. Así pues, para funciones ρ no convexas, el problema evolutivo (2.5) se transforma en un problema mal propuesto. En este sentido, Kichenassamy [42] plantea la limitación de soluciones débiles como marco inicial para encontrar soluciones al problema (2.5) e introduce un concepto más general de solución, a partir de una condición inicial de una función no infinitamente derivable sino suave a trozos. Por tanto, la solución a este tipo de problemas debe entenderse en sentido más amplio, dentro del concepto de función medible. Otra alternativa, para abordar la existencia de solución es la propuesta de Catté et al. [21]. Sugieren sustituir en g(∥∇u∥2 ) la expresión del gradiente ∇u por una versión suavizada de la forma: Gσ ∗ ∇u, 19.

(30) Capítulo – 2. ESTADO DE LA TÉCNICA 12. 40 35. 10 30 8 25 6. 20 15. 4 10 2 5 0. 0. 1. 2. 3. 4. 5. 0. 6. 0. 1. 2. 3. 4. 5. 6. √ (b) Sup. mínima [25]: ρ(r) = 2 1 + r2 − 2. (a) Tikhonov [90]: ρ(r) = r2 6. 1.5. 5. 4. 1. 3. 2. 0.5. 1. 0. 0. 1. 2. 3. 4. 5. 0. 6. 0. 1. 2. 3. 4. 5. (d) Perona-Malik [65]: ρ(r) = 1 − e−r. (c) Variación total [80]: ρ(r) = r. 6. 2. /6.25. 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0. 0. 1. 2. 3. 4. 5. (e) Ganan-McClure [29]: ρ(r) =. 6. r2 1+r 2. Figura 2.10 – Distintas funciones ρ siendo Gσ una máscara de Gauss: Gσ =. σ. 1 √. x2. 2π. e− 2 σ2. A partir de aquí presentan el siguiente resultado, siendo c(s) = g(s2 ). √ Teorema 2.3.1 (Catté et al.) Sea c : R+ → R+ decreciente con c(0) = 1 con lı́ms→+∞ c(s) = 0 y s → c( ) s) ( 2 2 suave. ( Gσ la máscara ) de Gauss. Si u0 ∈ L (Ω) entonces existe una única función u(x, t) ∈ C [0, T ]; L (Ω) ∩ 2 1 L (0, T ); H (Ω)) que verifica la ecuación    ∂t u(x, t) − div (c(∥(∇Gσ ∗ u)(x, t)∥) ∇u(x, t)) si (x, t) ∈ Ω × (0, T )  . u(x, 0) = uo (x). si. x∈Ω. ∂n u = 0. si. (x, t) ∈ ∂Ω × (0, T ). ( ) Es más, u ∈ C ∞ Ω × (0, T ) Un inconveniente a este planteamiento es que el hecho de utilizar una regularización mediante la máscara de Gauss, implica una suavización de la estimación del módulo del gradiente de la solución, lo que genera una disminución del contraste en los bordes. Esto supone, por tanto, un proceso contrario al que se pretende plantear, pues la homogeneización y el realzado son técnicas contrapuestas. 20.