TRABAJO
FINAL DE
CARRERA
Ingeniería de descriptores para la detección
automática de vasos sanguíneos en
imágenes de fondo de ojo
Autores: ValeriaDEL RÍO Marcos FRACCHIA
Directores:
Ing. José Ignacio ORLANDO Dra. Mariana DEL FRESNO
Trabajo final de carrera para optar al Título de Ingeniero de Sistemas
de la
Facultad de Ciencias Exactas
Universidad Nacional del Centro de la Provincia de Buenos Aires
Albert Einstein
Las enfermedades oftalmológicas afectan a un amplio sector de la población mundial, causando diversas complicaciones visuales e incluso ceguera. Las enfermedades que mayores casos de ceguera reportan son la retinopatía diabética, la degeneración macular asociada a la edad y el glaucoma, las cuales pueden llegar a ser evitables o contro-ladas en su evolución mediante acciones de prevención y detección temprana. Para ello es necesario diagnosticarlas mediante imágenes de fondo de ojo, que constituyen una modalidad de imagen médica económica y no invasiva ampliamente utilizada en este sentido. En particular, el uso de métodos computacionales que asistan este tipo de diagnóstico permiten complementar la opinión del profesional médico, reducir la variabilidad entre expertos y alcanzar diagnósticos más certeros.
Del amplio conjunto de estos algoritmos, muchos requieren contar con segmentacio-nes de los vasos sanguíneos, ya sea para caracterizar variaciosegmentacio-nes asociadas a la presencia de alguna enfermedad, o para facilitar la detección de estructuras patológicas. Aunque se han propuesto numerosos enfoques para obtener segmentaciones del árbol vascular automáticamente, los mismos presentan dificultades al momento de ser aplicados en contextos reales. Una de las principales razones es que poseen un gran número de parámetros asociados, que no son estables al variar la resolución de las imágenes. Esto plantea la necesidad de ajustarlos de acuerdo a características intrínsecas de la imagen tales como el calibre de los vasos, el diámetro del disco óptico, etc.
El objetivo de este trabajo final es el estudio y desarrollo de un algoritmo de esti-mación de parámetros que contribuya a automatizar el ajuste de un método de seg-mentación existente. El mismo permite, a partir de una serie de parámetros óptimos observados en imágenes de baja resolución, estimar automáticamente su configuración para trabajar sobre imágenes de mayor resolución. Así mismo, se propone una estrategia para realizar un mejor preprocesamiento de las imágenes, a fin de reducir los efectos que artefactos tales como el ruido, la iluminación despareja o la falta de contraste tienen sobre los resultados. Finalmente, se propone una configuración óptima para un méto-do de segmentación previamente desarrollaméto-do, que logra mejoras significativas en los resultados obtenidos en imágenes de alta resolución.
Los experimentos realizados sobre diferentes conjuntos de datos estándar indican que el estimador propuesto permite obtener segmentaciones precisas del árbol vascular en imágenes de alta resolución, mejorando resultados obtenidos previamente utilizando otros enfoques. De igual forma, se demostró el impacto positivo que el método de preprocesamiento tiene sobre diferentes indicadores relevados.
A nuestras familias y amigos por acompañarnos en cada paso incondicionalmente.
A nuestros directores, Nacho y Mariana, por el gran esfuerzo y apoyo brindado.
Resumen V
Agradecimientos VII
1. Introducción 1
1.1. Descripción de la problemática . . . 1
1.2. Organización del trabajo . . . 2
2. Estado del Arte 5 2.1. Análisis de imágenes de la retina . . . 5
2.1.1. Introducción . . . 6
2.1.2. Fotografías de fondo de ojo . . . 12
2.1.3. Herramientas computacionales para análisis de fotografías de fondo de ojo . . . 15
2.2. Segmentación de vasos sanguíneos en imágenes de fondo de ojo . . . 17
2.2.1. Necesidad . . . 17
2.2.2. Métodos existentes . . . 18
3. Materiales 21 3.1. Materiales . . . 21
3.1.1. Datasets utilizados . . . 21
3.2. Configuraciones de losdatasetspara entrenamiento y test . . . 24
3.2.1. Particiones para entrenamiento y test del método de segmentación 24 3.2.2. Partición para evaluación del método de ajuste automático de parámetros . . . 26
3.3. Métricas de calidad . . . 26
4. Métodos 31 4.1. Descripción general . . . 31
4.2. Método de preprocesamiento propuesto . . . 32
4.2.1. Mejora de contraste . . . 32
4.2.2. Corrección del artefacto de iluminación despareja . . . 33
4.2.3. Reducción de ruido . . . 37
4.2.4. Extensión de bordes del FOV . . . 39
4.2.5. Resultados parciales . . . 39
4.2.6. Discusión . . . 42
4.3. Identificación de parámetros . . . 42
4.3.1. Extracción de características . . . 43
4.3.2. Método de segmentación . . . 55
4.4. Ajuste automático de parámetros basado en regresión lineal . . . 59
4.4.1. Estrategia propuesta . . . 59
4.4.2. Optimización de parámetros de los descriptores . . . 61
5. Resultados 69
5.1. Algoritmo de preprocesamiento . . . 69
5.1.1. Análisis cuantitativo . . . 69
5.1.2. Análisis cualitativo . . . 70
5.2. Ajuste automático de parámetros basados en regresión lineal . . . 73
5.3. Resultados de segmentación . . . 76
5.4. Discusión . . . 78
6. Conclusiones 81
De Marcos:
Dedico este trabajo a mis padres, todo lo que logré en esta vida siempre estará dedicado a ellos en primer lugar.
A mis hermanos, Luis y Victoria, esos mejores amigos que no tuve que elegir. Nada sería posible sin su apoyo incondicional.
A mis sobrinos, Milagros, Fabriccio y Tiziano, la luz de energía inagotable que me llena de alegría.
A uno de los mejores regalos que me dio la vida, mi familia. A cuñada, tías, tíos, abuelos, primos y primas, por estar siempre presentes en cada momento de mi vida y apoyarme en todo aspecto de ella.
A todos mis amigos, esas personas que siempre me sacan una sonrisa, me regalan buenos momentos y ayudan a recargar las pilas para afrontar cualquier proyecto al que me enfrente. Por eso y mucho más, les agradezco y dedico este trabajo, sin ellos nunca podría haber llegado a este momento.
A compañeros de la facultad y profesores, que han sido parte de este camino y han contribuido enormemente en mi formación.
De Valeria:
Dedico este trabajo a la memoria de Danila Sello que siempre estuvo apoyandome para que siga adelante.
A mi familia que me acompañó en cada decisión tomada.
A los amigos que me permitió conocer el paso por la universidad.
A mi compañero de vida, Mauro Giamberardino que siempre está acompañando y apoyandome en lo que sea necesario.
Introducción
En la actualidad existen un enorme número de personas en el mundo afectadas por ceguera prevenible a nivel mundial [1]. Entre las principales enfermedades causantes de este tipo de ceguera se encuentran el glaucoma [1], la degeneración macular asociada a la edad y la retinopatía diabética [2]. Si estas afecciones se detectan a tiempo, el riesgo de padecer ceguera se ve significativamente reducido. Sin embargo, las mismas son asintomáticas en sus primeros estadíos, y los pacientes no se percatan de la existencia de las mismas hasta que su grado de avance es tal que los tratamientos son menos efectivos.
Para contribuir al tratamiento de esta problemática, la comunidad científica inter-nacional se encuentra investigando activamente el desarrollo de estrategias compu-tacionales que faciliten la tarea de diagnóstico a partir de imágenes. La modalidad de imagen médica estándar para el monitoreo de estas afecciones es la fotografía de fondo de ojo, que permite inspeccionar la retina a un costo relativamente bajo y de forma no invasiva [3].
Gran parte de los métodos para diagnóstico asistido por computadora a partir de imágenes de fondo de ojo requieren inicialmente la detección de estructuras anatómicas, siendo la principal de ellas el árbol vascular [4]. Aunque existen numerosos trabajos abordando el desarrollo de métodos para segmentar los vasos automáticamente, el área continúa siendo explorada intensamente debido a la enorme dificultad que supone esta tarea, principalmente debido a los numerosos artefactos presentes en las imágenes, tales como el ruido, la iluminación despareja durante la captura, la falta de contraste, la presencia de objetos con intensidades similares, etc.
En este trabajo final se propone una estrategia novedosa para la autocalibración de algunos métodos de caracterización de los píxeles pertenecientes a vasos sanguíneos, en el contexto de un algoritmo de segmentación ya existente. El objetivo es lograr un método totalmente automático, capaz de ajustarse a diferentes resoluciones de imagen, sin la necesidad de un proceso intensivo de exploración de parámetros. Así mismo, se propone un método de preprocesamiento que permite la mejora en la capacidad discriminativa de algunos de los descriptores propuestos en la literatura del área.
En la Sección 1.1 se describe el problema a resolver en un mayor nivel de detalle. La Sección 1.2, por otra parte, describe la organización del presente trabajo final.
1.1.
Descripción de la problemática
La segmentación de los vasos sanguíneos en imágenes de fondo de ojo es crucial para el desarrollo de cualquier herramienta de diagnóstico de enfermedades oftalmológicas asistido por computadora [3]. Una de las primeras etapas en cualquier algoritmo de seg-mentación generalmente es la de caracterizar cada uno de los píxeles de la imagen. Esta caracterización consiste en establecer, mediante un indicador o descriptor cuantitativo, qué tan asociado a un vaso sanguíneo está un píxel, considerando la información de
su entorno. A partir de un conjunto de estos descriptores es posible obtener un vector que, posteriormente, sea utilizado de alguna forma por el método de segmentación para decidir si el mismo está asociado a un píxel perteneciente a un vaso sanguíneo o no.
En los últimos años se han propuesto numerosos enfoques para la caracterización de los píxeles asociados a los vasos sanguíneos [5]. Sin embargo, los mismos requieren ajustar un número muy grande de parámetros, lo que dificulta significativamente su uti-lización en contextos reales. Estos parámetros se asocian por lo general a características intrínsecas de las imágenes tales como el calibre de los vasos sanguíneos presentes en ella, el ángulo del dispositivo de captura (conocido como campo de visión o FOV, por su sigla en inglés), entre otros.
Otra de las dificultades existentes está asociada a la presencia de numerosos artefac-tos en las imágenes. Algunos de ellos son intrínsecos a la captura de la imagen (ruido, iluminación despareja, falta de contraste) y podrían resolverse mediante la repetición en serie de diferentes capturas. Sin embargo, esta tarea no es factible de ser realizada en contextos en los que un número significativo de pacientes debe ser analizado en corto tiempo. En consecuencia, ha habido un especial interés en la comunidad científica por proponer alternativas para mitigar el impacto de estos artefactos en la calidad de los resultados obtenidos posteriormente.
El propósito de este trabajo final es contribuir a la mejora de estos dos inconvenientes. Por un lado, se explora una estrategia automática para el ajuste de los parámetros de una serie de descriptores comúnmente utilizados en el estado del arte para la segmentación de vasos sanguíneos. A tal efecto, se realizó primero un relevamiento de los métodos disponibles en la literatura científica del área y se utilizaron aquellos que mejores re-sultados han ofrecido sobre bases de datos estándar [6-11]. Posteriormente, se efectuó una exploración de sus parámetros más importantes, y un estudio de sensibilidad de los mismos para estudiar las consecuencias de la modificación de sus valores sobre los resultados. Por otro lado, se analizó la utilización de una estrategia de preprocesamiento para reducir los efectos de algunos artefactos habitualmente observados en las imágenes. A partir de estas conclusiones se desarrolló una estrategia de estimación automática de los parámetros basada en regresión lineal. Finalmente, todas estas herramientas pro-puestas fueron evaluadas en el contexto de un algoritmo de segmentación supervisado [12] para estimar los resultados obtenidos sobre imágenes de alta resolución.
1.2.
Organización del trabajo
El presente trabajo final se organiza en una serie de capítulos que abordan los distintos aspectos mencionados en la sección anterior.
En el Capítulo 2 se presenta una breve descripción del estado del arte en materia de procesamiento de imágenes de fondo de ojo, en general, y de segmentación de vasos sanguíneos, en particular. Se incluyen además estadísticas recientes sobre algunas de las enfermedades visuales que se manifiestan a través de cambios en la retina. Por otro lado, se incorpora una descripción detallada acerca de cómo las segmentaciones de los vasos sanguíneos facilitan el desarrollo de modelos automáticos para la detección de dichas enfermedades.
En el Capítulo 4 se detallan las diferentes etapas del algoritmo propuesto. En par-ticular, se abordan las características del método de preprocesamiento desarrollado, los descriptores relevados del estado del arte, la optimización de sus parámetros y la estrategia para su aprendizaje automático.
En el Capítulo 5 se presentan los resultados obtenidos, detallando los datos utilizados para las pruebas y las métricas generadas, y se realiza una evaluación cuantitativa y cualitativa del esquema propuesto.
Estado del Arte
En este capítulo se presenta una revisión de la literatura científica existente sobre análisis computacional de imágenes de fondo de ojo. En particular, en la Sección 2.1 se introducen algunas estadísticas y una descripción acerca del avance de las enfermedades visuales a nivel mundial, destacando aquellas que afectan la retina. Por otro lado, se describen algunas de las tecnologías de captura de imágenes médicas utilizadas para asistir al diagnóstico y tratamiento de estas enfermedades. En la Sección 2.2 se estudia el estado del arte en materia de segmentación de vasos sanguíneos en imágenes de fondo de ojo.
2.1.
Análisis de imágenes de la retina
Según estadísticas de la Organización Mundial de la Salud (OMS), en el mundo hay aproximadamente 285 millones de personas con discapacidad visual, de las cuales 246 millones padecen baja visión y 39 millones son ciegas [1]. Entre los casos de ceguera, un 82 % corresponde a personas de 50 años o más, lo que resulta por demás preocupante teniendo en cuenta el envejecimiento de la población en numerosos países. Por otra parte, la OMS también estima que el número de niños con discapacidad visual asciende a 19 millones, y que alrededor de 1.4 millones de menores de 15 años sufren ceguera ya irreversible, requiriendo intervenciones de rehabilitación visual. Por otra parte, apro-ximadamente un 90 % de la carga mundial de discapacidad visual se concentra en los sectores de bajos ingresos, especialmente debido al menor acceso de la población a la salud y educación [1,13].
No obstante, más allá de las estadísticas anteriores, un dato importante es que el 80 % de los casos de discapacidad visual en el mundo son prevenibles o curables si las enfermedades que la producen son detectadas tempranamente [14]. Por lo tanto, es preciso abordar la exposición a los factores de riesgo y realizar exámenes oculares periódicos que permitan un diagnóstico precoz y un tratamiento oportuno a fin de evitar o retrasar la disminución de la función visual [15].
Entre las principales enfermedades causantes de ceguera prevenible a nivel mundial se encuentran el glaucoma [1], la degeneración macular asociada a la edad y la retinopa-tía diabética [2]. Estas enfermedades afectan principalmente a la retina, que es una capa de tejido ubicada en la parte posterior del ojo, que percibe la luz y envía estas señales al cerebro (Sección 2.1.1).
El análisis de imágenes de la retina es de gran importancia para la detección de enfermedades tanto visuales como sistémicas. Entre las modalidades habitualmente utilizadas en oftalmología para su estudio se destacan las fotografías de fondo de ojo (o retinografías) [4]. Las mismas consisten en imágenes proyectivas a color de la superficie interna del ojo, y son obtenidas a través de una cámara adosada a un microscopio de baja potencia. Por medio de la observación de estas imágenes, los especialistas pueden
examinar la retina y sus componentes de forma no-invasiva, obteniendo información valiosa sobre su estado y posibles alteraciones para el diagnóstico de enfermedades [3]. El avance de la tecnología aplicada a las imágenes digitales y el aumento de la poten-cia de cálculo computacional han favorecido la utilización de técnicas de procesamiento de imágenes en oftalmología [16]. El desarrollo de métodos basados en el análisis de imágenes digitales ofrece numerosas ventajas para cuantificar la existencia o gravedad de enfermedades visuales, principalmente en lo que refiere a la detección de retinopatía diabética, degeneración macular, glaucoma e hipertensión arterial, entre otras [17]. Por medio de herramientas adecuadas, es posible reducir el tiempo y esfuerzo necesarios para realizar la evaluación diagnóstica. Además, de incorporarse a plataformas de te-leoftalmología, por medio de estas facilidades se posibilita el acceso a comunidades alejadas de zonas urbanas o situadas en zonas de riesgo, permitiendo la atención de individuos que padezcan alguna patología en una etapa temprana [18]. Actualmente existen distintas líneas de interés en lo que respecta a la imagenología de la retina, destacándose la búsqueda de herramientas rentables, fáciles de usar y portátiles, que asistan en el análisis y procesamiento de las imágenes para facilitar la detección precoz de problemas visuales [3].
Entre las diferentes áreas de investigación activas, la segmentación de vasos sanguí-neos es una de las más importantes. La segmentación es un proceso mediante el cual se pueden obtener determinadas estructuras dentro de una imagen, como por ejemplo el disco óptico, los vasos sanguíneos, etc. Dado que diversas enfermedades de la retina se manifiestan a través de alteraciones morfológicas en los vasos sanguíneos, es de esperar que contar con segmentaciones precisas del árbol vascular permita mejorar los procesos de detección y análisis de dichas afecciones.
A fin de ampliar estos conceptos, en la Sección 2.1.1 se describe con mayor detalle la anatomía del ojo y las enfermedades que usualmente se manifiestan a través de cambios en la retina, realizando una breve descripción de las tres principales causantes de ceguera prevenible a nivel mundial. En la Sección 2.1.2 se analiza la importancia de la fotografía de fondo ojo, explicando su modo de captura y las ventajas y desventajas que ofrece esta modalidad con respecto a otras. Finalmente, en la Sección 2.1.3 se presentan diferentes herramientas computacionales para el análisis de fotografías de fondo de ojo.
2.1.1. Introducción
El ojo es un órgano complejo formado por diversas estructuras que permiten trans-formar la energía lumínica en señales eléctricas que son enviadas al cerebro para su interpretación. La estructura anatómica del ojo se compone básicamente por la córnea (transparente), la esclera (normalmente blanca), el iris (que da color al ojo) y la pupila, como se puede apreciar en la Figura 2.1. Todas estas partes son visibles desde el exterior y son las responsables de permitir la visión: un rayo de luz pasa a través de la córnea, que enfoca parcialmente la imagen; luego, el mismo atraviesa la cámara anterior, la pupila (que hace las veces de lente y enfoca aún más la imagen), la vítrea y por último se proyecta sobre la retina.
FIGURA2.1: Anatomía del ojo. Vista de sus principales componentes.
FIGURA2.2: Partes que componen la retina.
El disco óptico(también conocido como cabeza del nervio óptico) es una
La máculase puede ver como una mancha amarilla localizada en la parte posterior de la retina, y tiene una extensión aproximada de 5 mm de diámetro. Contiene en su parte central a la fóvea, una pequeña depresión de color más oscuro, con una extensión aproximada de alrededor de 1.5 mm de diámetro. Esta parte es la involucrada en la visión fina de detalles, debido a que es la región donde se concentra la mayor cantidad de conos. Sin embargo, la misma carece de bastones, lo que dificulta discernir estructuras finas bajo malas condiciones de luminosidad [19,21,22].
Los vasos sanguíneosrodean a la fóvea por arriba y por abajo, aunque
den-tro de ella sólo existen pequeños capilares. La microvasculatura retinal es la única parte del sistema circulatorio humano que puede ser visualizada directamente y de forma no invasivain vivo. La retina posee un gran número de vasos sanguíneos encargados de transportar la sangre y oxigenar el ojo. Cuando en una determinada zona los niveles del flujo de sangre y de oxígeno son bajos, el cuerpo reacciona generando una proteína que estimula el crecimiento de nuevos vasos sanguíneos para transportar oxígeno a esas zonas [23,24].
Al igual que otras partes del cuerpo humano, el ojo es susceptible a la aparición de enfermedades. En general, pueden manifestarse dos tipos principales de afecciones: las visuales, que ocurren en la retina, o las sistémicas, que ocurren en el cerebro o el sistema cardiovascular y que se manifiestan a través de cambios en la retina. Muchas de estas enfermedades son usualmente detectadas a través de la inspección ocular de la retina o mediante el uso de sistemas informáticos avanzados basados en procesamiento de imágenes [3]. Entre las más destacadas se incluyen laretinopatía diabética (RD), la
degeneración macular asociada a la edad (DMAE)y elglaucoma.
LaRDes quizá la más conocida de las enfermedades visuales, dado que afecta a 21 millones de personas en el mundo. La misma ocurre como consecuencia de alteraciones microcirculatorias provocadas por la diabetes, que debilita las paredes de los vasos sanguíneos. Afecta a un tercio de los diabéticos y es la principal causa de pérdida de visión en personas de edad avanzada. No obstante, se ha demostrado que, de controlarse la enfermedad de base y examinarse periódicamente la retina, la pérdida de la visión producto de la enfermedad puede prevenirse en un 98 % de los casos [25]. Existen dos tipos de RD:
RD no proliferativa: En ella los vasos sanguíneos de la retina presentan
cambios: algunos disminuyen de tamaño, y otros se agrandan formando micro-aneurismas que entorpecen u obstruyen la circulación de la sangre (Figura 2.3). Estos vasos sanguíneos gotean o se rompen y provocan hemorragias. El suero en el tejido fuera de los vasos produce hinchazón de la retina, lo que técnicamente se conoce como edema retiniano. Cuando el edema se reabsorbe quedan lípidos atrapados en el tejido [26,27].
RD proliferativa: en su evolución hay un fenómeno de isquemia (falta
de aporte oxigenado a las células). La isquemia hace que el tejido estimule la formación de vasos sanguíneos, en un intento por recuperar el aporte sanguíneo, produciendo neoformación de vasos en la superficie de la retina o del nervio óptico. Estos tienen una gran fragilidad, pueden romperse y sangrar dentro del humor vítreo (Figura 2.4), provocando ceguera [26,27].
FIGURA2.3: Retinopatía diabética no proliferativa. Izquierda: ejemplo de retina de un paciente sano. Derecha: ejemplo de una retina con retinopatía
diabética no proliferativa.
FIGURA2.4: Retinopatía diabética proliferativa. Izquierda: ejemplo de imagen con hemorragia vitrea. Derecha: ejemplo de imagen con
neovas-cularización en retina y disco óptico.
Losmicroaneurismasson pequeñas dilataciones en forma de saco ubicadas
en las paredes de las arterias. Los oftalmólogos saben que, si bien se presentan en varios procesos patológicos tales como la hipertensión arterial o la oclusión venosa, son el primer signo característico de la retinopatía diabética.
Lashemorragiasson acumulaciones de sangre en la zona del interior del ojo,
FIGURA2.5: Degeneración Macular. Fotografía de fondo de ojo de un paciente con degeneración macular asociada a la edad.
en el humor vítreo, éste pierde su transparencia y la luz deja de poder atravesarlo, lo que ocasiona la pérdida de visión.
Losexudados durosson depósitos intrarretinianos de lípidos y proteínas,
de color amarillo o blanquecinos, brillantes y con bordes circulares bien definidos. Cuando se encuentran en la zona de la mácula adoptan forma de estrella, y están asociados a una disminución de la agudeza visual.
Losexudados blandosson manchas blanquecinas, difusas, de bordes mal
definidos y de un diámetro similar al del disco óptico. Están principalmente en la capa nerviosa de la retina, en el polo posterior.
LaDMAEes una enfermedad que provoca lesiones en la mácula (Figura 2.5) [29, 30]. Es la causa más frecuente de ceguera en países desarrollados, en personas mayores de 50 años. Esta patología se asocia con la edad y es más frecuente en personas de raza blanca, en mujeres y en personas con antecedentes familiares, con hipercolesterolemia y/o fumadores [31,32].
Existen principalmente dos tipos deDMAE:
Seca o atrófica: se produce cuando las células de la mácula sensibles a la
luz se van deteriorando, haciendo que la visión central se nuble gradualmente en el ojo afectado. A medida que la DMAE seca empeora, se puede observar un punto borroso en el centro de la visión, que con el tiempo puede provocar una pérdida completa de la visión en el ojo afectado. Una de las señales más comunes de la DMAE seca son las drusas, que consisten en depósitos amarillos debajo de la retina. Cuando el número o tamaño de las drusas aumenta, el paciente puede comenzar a observar un punto borroso en la visión.
Húmeda o exudativa:se caracteriza por presentar nuevas formaciones de
vasos sanguíneos que crecen debajo de la mácula. Su evolución es rápida (de días a semanas), y compromete severamente la visión central. Cuando la enfermedad se encuentra en una fase más avanzada puede verse una mancha negra en la zona central de la visión, pudiéndose hacer más oscura y de mayor tamaño cuanto mayor tiempo de evolución tenga.
Elglaucoma, finalmente, es el causante de entre el 10 y 15 % de la ceguera a nivel
FIGURA2.6: Glaucoma. Partes que componen el nervio óptico.
prevalencia (es decir, la proporción de individuos afectados por ella) se estima en un 2 % de la población mayor de 40 años. Los factores de riesgo de glaucoma son la edad avanzada, los antecedentes familiares de glaucoma, la presión intraocular elevada, la utilización de corticoides y los traumatismos oculares, entre otros. Entre estos factores de riesgo, el único que en la actualidad se puede modificar es la presión intraocular alta. El aumento de la presión en el ojo ocurre como resultado de la acumulación de líquido en el globo ocular [33]. El humor acuoso del ojo normalmente circula a través de él, manteniéndolo sano y limpio, y se vacía a través de un desagüe en la parte frontal del ojo. En las personas con glaucoma, este desagüe está bloqueado, lo que provoca la acumulación del líquido y el posterior aumento de la presión ocular. En general, el diagnóstico del glaucoma se realiza analizando cambios en el nervio óptico (Figura 2.6) tales como la reducción del grosor del anillo neuro-retiniano, el crecimiento de la depresión central o cúpula, su asimetría intraocular, la existencia de defectos de capa de fibras nerviosas, la aparición de hemorragias del anillo neuro-retinal o la existencia de vasos sanguíneos con ramificaciones irregulares, en forma de bayoneta [34].
El diagnóstico de las tres enfermedades abordadas anteriormente se realiza usual-mente mediante el uso de imágenes médicas [4]. Existen diferentes modalidades de imagen que permiten la observación de la retina, cada una de las cuales tiene sus ven-tajas y desvenven-tajas en cuanto a su capacidad para capturar y/o cuantificar diferentes patologías. A continuación se describen las tres modalidades más comunes [3]:
Fotografías de fondo de ojo:consisten en fotografías de la retina obtenidas
utilizando una cámara digital convencional adosada a un microscopio de baja po-tencia, conocido como oftalmoscopio. El oftalmoscopio es un dispositivo formado por una serie de espejos y cristales que alumbran la retina sin que la luz se refleje. Para realizar la captura de la imagen suelen utilizarse fármacos para dilatar la pupila, que se depositan en forma de gotas en la superficie ocular. Esto permite una mejor iluminación del interior de la retina. Debido a que estas imágenes son el objeto de estudio de este trabajo final, las mismas se describen en mayor detalle en la Sección 2.1.2.
Angiografía por fluoresceína:permiten estudiar los vasos sanguíneos tanto
FIGURA2.7: Fotografía de fondo de ojo de un paciente sano.
torrente sanguíneo. Mientras tanto, un dispositivo similar a una cámara toma foto-grafías a medida que el tinte va pasando a lo largo de los vasos sanguíneos. Como resultado se obtienen imágenes en las que es posible observar el desplazamiento del tinte, y distinguir arterias y venas de manera eficiente.
Tomografía de coherencia óptica (OCT):es una técnica de imagen
tomo-gráfica óptica, no invasiva y con un costo económico superior a otras técnicas, que permite visualizar tejidos oculares con un nivel de resolución micrométrico, diez veces mayor que al alcanzado por el ultrasonido. Para realizar la OCT se aplican gotas oculares para dilatar la pupila, luego el paciente se sienta frente al dispositivo de captura y descansa la cabeza sobre un soporte para mantenerla inmóvil. Mientras tanto, el equipo realiza un escaneo del ojo que dura entre 10 y 15 minutos utilizando una fuente de luz infrarroja. El resultado es una tomografía 3D de la superficie de la retina, que permite visualizar incluso las diferentes capas celulares. El principal inconveniente de estas imágenes, sin embargo, radica en la cantidad de ruido que presentan.
2.1.2. Fotografías de fondo de ojo
Las fotografías de fondo de ojo (Figura 2.7) permiten obtener representaciones de la retina de gran calidad, lo que contribuye a mejorar su estudio y permite la detección precoz de enfermedades con mayor precisión [35].
FIGURA2.8: Imagen de un paciente realizándose una fotografía de fondo de ojo.
FIGURA2.9: Componentes de la retina, indicados sobre una fotografía de fondo de ojo
ocular y obtener una mejor imagen del fondo del ojo [18]. La Figura 2.8 ilustra el proceso de captura de una de estas imágenes.
Gracias a las imágenes de fondo de ojo pueden observarse las diferentes estructuras internas del globo ocular: la mácula, la retina, el nervio óptico y los vasos sanguíneos, entre otras. En la Figura 2.9 puede apreciarse una imagen tradicional de fondo de ojo y un detalle de cada una de las estructuras anatómicas de la retina. Además, estas imágenes permiten detectar algunas lesiones oculares tales como microaneurismas, hemorragias, exudados blandos o duros, etc. [36]. En la Figura 2.10, por ejemplo, pueden observarse algunas de las lesiones típicas de la retinopatía diabética.
FIGURA2.10: Estructuras patológicas típicas de la retinopatía diabética, observadas en una imagen de fondo de ojo: microaneurismas,
hemorra-gias y vasos sanguíneos tortuosos.
pronto como se obtienen, permitiendo detectar y corregir cualquier error en el proceso fotográfico. Esto permite realizar el seguimiento de la progresión de una enfermedad mediante la revisión de imágenes secuenciales, y que el médico ofrezca educación al paciente respecto a los resultados obtenidos en las imágenes acerca de su salud ocular de manera casi inmediata [37].
FIGURA2.11: Etapas del preprocesamiento digital de imágenes médicas.
2.1.3. Herramientas computacionales para análisis de fotografías de fondo de ojo
Tradicionalmente, los oftalmólogos diagnostican enfermedades examinando visual-mente las imágenes de la retina, buscando posibles anomalías que puedan llegar a existir. Esta actividad es susceptible a errores debido a la subjetividad y capacidad de análisis del médico, así como también a su experiencia y formación [3,4]. Por otra parte, a menu-do los diagnósticos de menu-dos profesionales diferentes pueden ser contradictorios entre sí. Además, si se estudian poblaciones muy grandes, la tarea de análisis manual se vuelve muy tediosa, y el cansancio del analista pasa a convertirse en un factor determinante [3]. El gran volumen de datos que proveen, por ejemplo, las campañas de estudio de poblaciones, ha sido una de las principales razones detrás de la popularización en el uso de técnicas de procesamiento, análisis y visualización de imágenes. En tal sentido, el manejo computacional de imágenes de la retina permite ahorrar carga de trabajo y ayudar a lograr una detección más objetiva por parte de los oftalmólogos. Se han hecho numerosos esfuerzos por caracterizar de forma automática y robusta tanto estructuras anatómicas como patológicas en imágenes de la retina [5], remontándose los primeros intentos al año 1971 [3]. Desde entonces, muchos investigadores han presentado interés en el tema, y han tenido que afrontar diversas dificultades, principalmente relacionadas con el ruido en las imágenes, su iluminación desigual y la enorme variación que existe entre imágenes de diferentes individuos [19].
(A) (B)
FIGURA2.12: Segmentación de vasos sanguíneos en imágenes de fondo de ojo. (a) Imagen de fondo de ojo de una retina sana. (b) Segmentación
del árbol vascular obtenida de manera manual.
tortuosidad, etc.) o fisiológicos (por ejemplo, características de perfusión o composición de un tejido) que permitan evaluar la extensión o distribución de una determinada estructura o patología [5]. Entre otras aplicaciones, con este tipo de procesamientos se puede detectar, por ejemplo, una patología en una imagen de fondo de ojo y analizar su variación en diferentes estadíos de un tratamiento, o extraer alguna estructura anatómica representativa (como los vasos sanguíneos o el disco óptico) para su posterior caracterización y asociación a la presencia o ausencia de una enfermedad [41-43].
La utilización y adaptación de la tecnología a la medicina se puede observar también en la creación de sistemas o algoritmos destinados a realizar el diagnóstico de enferme-dades de forma automática. En la actualidad existen diversas investigaciones realizadas sobre este campo, las cuales se centran en la detección de estructuras patológicas que presentan determinadas enfermedades de la retina [3]. Para asistir al diagnóstico de RD, por ejemplo, se han propuesto inicialmente sistemas basados en la detección de microaneurismas [26,44,45], exudados [27,28,30], hemorragias [46-48] o neovascu-larizaciones [30,46,49]. En lo que refiere a la detección automática de la DMAE, en general los métodos existentes se enfocan en la segmentación de estructuras patológicas tales como las drusas [50-53]. Finalmente, con respecto a los sistemas automáticos para detección de glaucoma, en general los mismos se enfocan en el cómputo de la relación entre el disco óptico y la copa óptica, previa segmentación de ambas estructuras [54]. También existen otras alternativas basadas en el análisis general de las intensidad de las imágenes a través de indicadores de textura [55] u otras propiedades visuales [56,57]. Sin embargo, muchas de estas aplicaciones requieren inicialmente contar con seg-mentaciones de los vasos sanguíneos. Por ejemplo, las lesiones rojas propias de la RD suelen presentar intensidades similares a las de los vasos sanguíneos, lo que propicia la detección de falsos positivos en las intersecciones o bifurcaciones del árbol vascular. Para remediar este inconveniente, a menudo los métodos para detección de lesiones rojas requieren segmentar los vasos sanguíneos primero para luego eliminar potenciales candidatos que ocurran en esas regiones [58]. Así mismo, diversos métodos de caracte-rización de glaucoma a partir del disco óptico necesitan aplicar técnicas deinpainting
2.2.
Segmentación de vasos sanguíneos en imágenes de fondo
de ojo
Como se comentó anteriormente, la segmentación consiste en dividir una imagen en regiones de interés, donde los píxeles que componen cada una de las regiones presentan características similares. Estas regiones pueden estar vinculadas a una estructura patoló-gica en particular, o bien tratarse de estructuras anatómicas concretas. Existen diversos algoritmos de segmentación, tanto para imágenes a color como en escala de grises, los cuales se basan generalmente en analizar la discontinuidad de las intensidades de la imagen o bien en las similitudes entre las diferentes regiones [59,60].
Uno de los problemas abordados en este trabajo final, es el de la segmentación de vasos sanguíneos en imágenes de fondo de ojo. Esta tarea es relevante en varios puntos, para comenzar los vasos sanguíneos constituyen una de las principales referencias anató-micas de la retina, y el análisis de su morfología facilita la detección de otras estructuras tales como el disco óptico o la fovea [5]. Además, diversas enfermedades se manifiestan a través de cambios en la arquitectura y distribución de los vasos sanguíneos [5]. De igual forma, problemas como el de la segmentación de hemorragias y/o microaneuris-mas para la detección de RD, por ejemplo, o del disco óptico en pacientes afectados por glaucoma, requieren la detección inicial de los vasos para diferenciar dichas estructuras entre sí o facilitar su segmentación [61-63].
A fin de contribuir al desarrollo de un algoritmo que permita la extracción eficaz y eficiente de los vasos sanguíneos, se analizan a continuación algunos aspectos importan-tes de este problema. En la Sección 2.2.1 se describe más en detalle el rol que desempeña la segmentación del árbol vascular en el desarrollo de sistemas para el diagnóstico de enfermedades, mencionando algunas investigaciones realizadas al respecto. Además, en la Sección 2.2.2 se presenta un relevamiento sobre distintos enfoques y métodos propuestos en la literatura para abordar el problema.
2.2.1. Necesidad
La evaluación de las características de los vasos sanguíneos juega un rol central en el diagnóstico de diferentes enfermedades. En particular, ciertos indicadores tales como el grosor de los vasos [61-63], su color [59], su reflectividad [64], tortuosidad [23, 65, 66] y/o ramificación anormal [67] se relacionan con la existencia de algún tipo particular de enfermedad [22,68]. Por otro lado, el conocimiento acerca de la ubicación de los vasos puede ayudar en la detección de estructuras patológicas, por ejemplo, al reducir el número de falsos positivos en la detección de microaneurismas o hemorragias (que presentan intensidades similares) [69], o contribuir como guía para la registración de imágenes adquiridas en diferentes instantes de tiempo o en diferentes áreas de la retina [70].
Existe también interés en utilizar los vasos de la retina para identificación biométrica [5]. Debido a la compleja estructura de los capilares que suministran sangre a esta zona, se ha establecido con anterioridad que la retina de cada persona es única. La red de vasos sanguíneos es tan compleja que ni siquiera dos gemelos idénticos comparten un mismo patrón. Aunque pueden alterarse en caso de diabetes, glaucoma o trastornos degenerativos de la retina, típicamente se mantiene sin variación desde el nacimiento hasta la muerte. Un identificador biométrico conocido como escaneo de retina se emplea para mapear los patrones únicos de la retina de una persona [71].
manual de los vasos puede volverse tediosa o incluso imposible [72]. Además, en general, distintos profesionales pueden generar segmentaciones muy distintas de una misma imagen, o incluso un mismo especialista puede dar con resultados diferentes al cabo de un cierto tiempo. El procesamiento y análisis automático de los vasos, por el contrario, permite ahorrar esta carga de trabajo y contribuye a lograr una detección más objetiva y estable respecto a la obtenida por los oftalmólogos. Mediante métodos computacionales se puede realizar la segmentación automáticamente, y utilizar la salida resultante como la entrada de una segunda herramienta desoftwareque se encargue de analizar la segmentación, también de forma automática, para obtener la probabilidad de ocurrencia de alguna determinada patología. De este modo, se pueden etiquetar las imágenes que presenten una alta probabilidad de presencia de alguna patología retinal, para que sean analizadas con más detenimiento por un profesional. Este mecanismo puede ser de gran utilidad para la realización de campañas descreeninga poblaciones de riesgo o a aquellas que no poseen acceso a un servicio de salud, permitiendo realizar controles sin la necesidad del profesionalin situ, sino únicamente del dispositivo de captura [4]. Esto permite encontrar a posibles pacientes en riesgo y derivarlos a un centro de salud para su posterior atención [3].
2.2.2. Métodos existentes
Existe un gran número de algoritmos propuestos en la literatura para resolver el problema de la segmentación de vasos sanguíneos [5]. En general, el mismo puede modelarse como un problema de detección de estructuras elongadas en imágenes 2D. Las estrategias planteadas pueden clasificarse en dos grandes grupos: el de losmétodos supervisadosy el de losno supervisados.
Los algoritmos de segmentación supervisada necesitan de un conjunto de datos conocidos (imágenes con sus píxeles ya segmentados) para clasificar los píxeles de las nuevas imágenes de acuerdo a si pertenecen o no a la estructura de interés [5]. Se basan en el conocimientoa prioride los objetos buscados, y aplican técnicas de optimización que reducen el error sobre los datos de entrenamiento con el objetivo de ajustar un modelo matemático. Finalmente, el modelo es aplicado sobre información de los píxeles en imágenes nuevas para obtener la segmentación de la estructura deseada. Este grupo abarca estrategias de aprendizaje automático (omachine learning) conocidas, tales como
Support Vector Machines(SVMs) [12]. Su principal inconveniente es que requieren datos etiquetados manualmente por profesionales expertos, algo a menudo difícil de conseguir cuando se trata de datos médicos.
Los algoritmos de segmentación no supervisada no requieren de datos anotados. En general, se basan en diseñar un modelo propio que intenta reproducir las características del problema que se desea resolver [5]. Suelen enmarcarse en esta categoría los métodos basados en crecimiento de regiones [73,74], modelos deformables [75,76] o en morfolo-gía matemática [11,77], entre otros. Normalmente, este tipo de enfoques requiere de un tiempo más prolongado para realizar la segmentación, además de que se caracterizan por presentar un gran número de parámetros que deben ajustarse manualmente.
en particular. En [79], por el contrario, se propone un método de umbralado adaptati-vo local, no supervisado, para producir una imagen binaria de los vasos sanguíneos principales, y los fragmentos residuales en ella son clasificados utilizando SVMs para determinar si son o no vasos delgados. Finalmente, en el trabajo de Marínet al.[80] se utilizan Redes Neuronales Artificiales (ANNs) para la clasificación de los píxeles.
En cuanto a los métodos no supervisados, éstos difieren en su gran mayoría en las técnicas utilizadas. En [81] se presenta un método basado en el seguimiento probabi-lístico de los vasos para la segmentación automática de vasos sanguíneos en imágenes de la retina. En [82], por el contrario, se utiliza un método de contornos activos, que considera dos pares de contornos para capturar cada borde de los vasos. En [83] se emplea crecimiento de regiones para lograr una mejora en la definición de la estructura de los vasos sanguíneos segmentados. Por último, en [84] se presenta un algoritmo de segmentación de vasos sanguíneos donde la forma y orientación de los mismos se obtiene mediante la aplicación de un operador morfológico top-hatmultidireccional seguido por el realce de los vasos.
En general, ambos tipos de métodos presentan dificultades e inestabilidades al aplicarse sobre la generalidad de casos que en usualmente se observan en la clínica diaria [5]. Esto se debe principalmente al gran número de parámetros que presenta cada uno de los métodos, y a que los mismos requieren de un ajuste u optimización previa que está relacionado directamente con la resolución u otras características de las imágenes. Para paliar esta situación, se han propuesto algunos enfoques que no han demostrado aún ser lo suficientemente robustos. En [12] se propone utilizar un multiplicadorρbasado en el cociente entre la resolución de la imagen de prueba y la de las imágenes utilizadas al optimizar los parámetros. El valorρes luego multiplicado por todos los parámetros para escalarlos hacia una resolución relativamente próxima. Aunque esta estrategia demostró ser suficiente para atenuar los efectos cuando hay cambios pequeños en la resolución de las imágenes, los resultados obtenidos sobre datos de mucha resolución presentan todavía algunos inconvenientes. Por otro lado, Vostatek
Materiales
En este capítulo se describen en detalle los datos utilizados a lo largo de este tra-bajo final, tanto sea para la calibración del método propuesto como para su posterior evaluación. Además, se detallan los criterios utilizados para evaluar la efectividad del método de segmentación, en acuerdo con la literatura relevante del área. En la Sec-ción 3.1 se describen las imágenes empleadas en cada etapa, detallando los diferentes
datasetsy sus principales características. A continuación, en la Sección 3.2 se describen las configuraciones utilizadas para los conjuntos de entrenamiento y test. Finalmente, en la Sección 3.3 se estudian las métricas de calidad utilizadas para la evaluación de la efectividad del método propuesto.
3.1.
Materiales
Para el entrenamiento, ajuste y validación del método considerado en este trabajo, se utilizaron una serie de bases de datos estándar y abiertas al público, consideradas normalmente para analizar laperformancede algoritmos de procesamiento de imágenes de fondo de ojo. En particular, se emplearon losdatasetsDRIVE, STARE, CHASEDB1, ARIA y HRF, que se describen en la Sección 3.1.1. Por otro lado, en la Sección 3.2 se detallan las particiones de entrenamiento y test realizadas, al igual que una descripción de quédatasetsfueron utilizados para ajustar parámetros y cuáles se utilizaron para evaluar finalmente el método propuesto.
3.1.1. Datasets utilizados
DRIVE [70] consta de un total de 40 imágenes de fondo de ojo, a color. Las fotografías fueron originalmente obtenidas en el marco de un programa descreeningde retinopatía diabética en los Países Bajos. De las 40 imágenes en la base de datos, 7 contienen patologías de algún tipo (entre ellas, exudados, hemorragias y cambios en el epitelio pigmentario). En la Figura 3.1 se presentan ejemplos para un paciente enfermo y uno sano. Las imágenes fueron adquiridas mediante una cámara no midriática Canon CR5 con un FOV de45◦. Cada imagen fue capturada utilizando 8 bits por plano de color, a una resolución de565×584píxeles. El conjunto de 40 imágenes se dividió en un conjunto de entrenamiento y otro de test, ambos con 20 imágenes cada uno. Tres observadores, el primero y segundo autor de [70] y un estudiante de informática relacionado con ambos autores, segmentaron manualmente las imágenes. Todos los observadores fueron entrenados por un oftalmólogo con experiencia. El primer observador segmentó 14 imágenes del conjunto de entrenamiento, mientras que el segundo observador segmentó las otras 6 imágenes. El grupo de imágenes de test fue segmentado en dos ocasiones, resultando en dos conjuntosXeY. El conjuntoXfue segmentado tanto por el primer
FIGURA3.1: Ejemplos de imágenes deldatasetDRIVE: (a) Retina saluda-ble, (b) Retina con lesiones.
y segundo observador (13 y 7 imágenes, respectivamente), mientras el conjuntoY fue segmentado por completo por el tercer observador [5].
STARE [86] consta de un total de 20 imágenes utilizadas comúnmente para eva-luar algoritmos de segmentación de vasos sanguíneos. 10 de las imágenes deldataset
contienen patologías. Todas fueron obtenidas mediante una cámara de fondo de ojo TopCon TRV-50 con un FOV de35◦, a una resolución de605×700píxeles, con 8 bits de color por canal. Dos observadores segmentaron manualmente todo el conjunto de imágenes. El primer observador segmentó10,4 %de los píxeles como vasos, contra el
14,9 %marcados por el segundo observador. La diferencia en la segmentación entre los dos observadores se debe a que el segundo observador segmentó muchos más vasos finos que el primero [5]. En la Figura 3.2 se observan dos imágenes deldatasetSTARE.
CHASEDB1 [87] consta de un conjunto de 28 imágenes, obtenidas de 14 niños, una por ojo. Las mismas fueron tomadas con una cámara de fondo de ojo Nidek Co. Ltd., NM-200-D, con un FOV de30◦y una resolución de999×960píxeles. Para su obtención se utilizó una iluminación suave y un flash. En general, estas imágenes se caracterizan por presentar una iluminación no uniforme del fondo, además de que existe un escaso contraste entre los vasos sanguíneos más delgados y el resto de la retina, y los vasos más anchos sufren de reflejo central [88]. La Figura 3.3 muestra una imagen deldataset
CHASEDB1.
ARIA [89,90] es una base de datos creada en 2006, como parte de una colaboración entre laSt. Paul’s Eye Unit(Royal Liverpool University Hospital Trust, Liverpool, Reino Unido) y el Departamento de Oftalmología y Ciencias Clínicas de la Universidad de
FIGURA3.2: Ejemplos de imágenes deldatasetSTARE: (a) Retina saluda-ble, (b) Retina con lesiones.
FIGURA3.3: Ejemplo de una imagen deldatasetCHASEDB1.
FF450 con un FOV de50◦[5].
HRF [91, 92] es una base de datos de imágenes oftalmológicas montada por la Universidad deErlangen-Nuremberg(Alemania) en cooperación con la Clínica de Oftal-mología Tomas deKubena de Zlin(República Checa). Contiene un total de 45 imágenes, 15 de pacientes sanos, 15 de pacientes con retinopatía diabética y 15 de pacientes con glaucoma (Ver imagen 3.5). Las segmentaciones manuales de los vasos están disponibles para cada imagen, y fueron realizadas por un grupo de expertos que trabajan en el campo de análisis de imágenes de la retina y de médicos de las clínicas oftalmológicas involucradas. Las imágenes se capturaron usando una cámara Canon EOS-20D con un campo de visión de60◦FOV [93]. El tamaño de las imágenes es de3504×2336píxeles, son de 24 bits por píxel y están almacenadas en formato JPEG.
FIGURA3.4: Ejemplo de imágenes deldatasetARIA. De izquierda a de-recha: imágenes con DMAE, de un paciente sano y de un paciente con
diabetes.
FIGURA3.5: Ejemplos de imágenes deldatasetHRF. De izquierda a dere-cha: imágenes con retinopatía diabetica, glaucoma y sana.
utilizó el enfoque presentado en [57], basado en el umbralado el canal de luminosidad de la imagen color convertida al espacio CIElab1.
3.2.
Configuraciones de los
datasets
para entrenamiento y test
Para el ajuste y exploración de cada una de las etapas del algoritmo propuesto se utilizaron los conjuntos de entrenamiento de cada uno de losdatasetsutilizados. En los casos en los que la bibliografía no propone una estrategia estándar de separación de los datos, se introdujo una. En la Sección 3.2.1 se detallan las divisiones utilizadas al momento de ajustar el método de preprocesamiento y los parámetros de los indicadores. Por otro lado, en la Sección 3.2.2 se detalla la separación de dos de los cincodatasets, CHASEDB1 y HRF, para la evaluación del método automático de ajuste de parámetros. Para más información acerca del protocolo de evaluación utilizado, el lector interesado puede referirse al capítulo 5, donde se detallan los resultados obtenidos luego de realizar los experimentos.
3.2.1. Particiones para entrenamiento y test del método de segmentación
De losdatasetsdescriptos en la sección 3.1.1, se utilizó un porcentaje de imágenes para entrenamiento y otro tanto para realizar test por cada uno de los conjuntos. En el caso de DRIVE, el mismo trae por defecto las imágenes separadas en un conjunto de entrenamiento y en un conjunto de test, de modo que se utilizó esa configuración. La
1El espacio de color CIELab es uno de los más populares y utilizados para evaluar el color de un objeto,
TABLA3.1: Resumen de los datos utilizados en este trabajo.
Dataset Nro. de
imágenes Ángulo de apertura del FOV Dimensio-nes Subsets Nro. de expertos
DRIVE 40 45º 565 x 584
Training (20), Test
(20)
3
STARE 20 35º 605 x 700
Patológicas (10), Sanas
(10)
2 (10.4 % , 14.9 %)
ARIA 143 50º 768 x 576
AMD (23), Sanas (61), DR (59)
2 (9.6 % , 8.5 %)
CHASEDB1 28 30º 999 x 960
Ojo izquierdo
(14), Ojo derecho
(14)
2 (10.1 % , 9.7 %)
HRF 45 60º 3504 x 2336
Sanas (15), DR (15), Glaucoma
(15)
2 (10.3 % , 14.8 %)
misma situación ocurre con CHASEDB1, en donde las últimas 8 imágenes constituyen el conjunto de entrenamiento y las 20 restantes el de test.
En el caso de ARIA, se formó un conjunto de entrenamiento y uno de test que contienen imágenes de cada uno de los subconjuntos que lo componen (esto es, imágenes con degeneración macular asociada a la edad, de pacientes de control y de pacientes diabéticos). El primero fue armado por 8 imágenes de un total de 23 imágenes con DMAE, 23 de un total de 61 imágenes sanas y 24 de un total de 59 imágenes con diabetes. Como resultado, se obtuvo un conjunto de entrenamiento formando por un total de 55 imágenes de entrenamiento. El conjunto de test está formado por las imágenes restantes de cada enfermedad, con excepción de las últimas 17 imágenes del conjunto de imágenes de pacientes de control, que fueron descartadas por problemas de iluminación, como puede observarse en la Figura 3.6.
Como en el caso de ARIA, HRF tampoco está dividido en conjuntos de entrenamiento y test, si no que cuenta con un subconjunto de 15 imágenes de pacientes sanos, otro de 15 imágenes de pacientes con glaucoma y otro de 15 imágenes de pacientes con retinopatía diabética. Se procedió entonces a formar los correspondientes conjuntos con la tercera parte de las imágenes de cada enfermedad. De cada conjunto se tomaron las primeras 5 imágenes, formándose un conjunto de 15 imágenes de entrenamiento, mientras que las restantes fueron utilizadas para formar el conjunto de test. Eldataset
STARE contiene 20 imágenes en su totalidad, de las cuales la primera mitad (10) se utilizó para entrenamiento, y la mitad restante se utilizó para test.
FIGURA3.6: Ejemplos de imágenes deldatasetARIA. Imágenes sanas descartadas por problemas de iluminación.
completos durante el ajuste a fin de seguir un protocolo similar al de otros trabajos, en los que los datos de test únicamente son empleados para estimar resultados [12,85].
3.2.2. Partición para evaluación del método de ajuste automático de paráme-tros
Los datasetsutilizados para validación del algoritmo de selección automática de parámetros fueron CHASEDB1 y HRF. Esto se debe principalmente a que estos conjuntos poseen la mayor resolución observada, lo que permite estimar mejor la contribución del estimador de parámetros.
3.3.
Métricas de calidad
Para la evaluación de los algoritmos desarrollados en este trabajo se aplicaron algu-nas de las métricas de calidad más utilizadas en la literatura. En particular, se emplearon curvas ROC y dePrecision/Recall[94] para el ajuste de los parámetros principales de los métodos de preprocesamiento y caracterización de las imágenes, y medidas de calidad de segmentación globales tales como elMatthews Correlation Coefficient[6,84, 95],F1-scoreyG-mean[12]. A continuación se explicarán cada una de ellas.
Cuando se analizan los píxeles de una imagen para determinar si pertenecen a un vaso sanguíneo o no, se presentan dos estados posibles: POSITIVO, si el píxel dado pertenece al vaso, y NEGATIVO, si el píxel no forma parte del mismo [96]. Dado que es muy poco probable que un algoritmo de segmentación funcione sin margen de error, es posible que algunos píxeles sean clasificados como positivos cuando en realidad son negativos, o viceversa. Existen cuatro posibles combinaciones resultantes, entonces:
FALSO POSITIVO(FP, porfalse positive): un píxel se clasifica como parte
de un vaso cuando en realidad no lo es.
FALSO NEGATIVO(FN, porfalse negative): un píxel se clasifica como no
VERDADERO POSITIVO(TP, portrue positive): un píxel se clasifica correc-tamente como parte de un vaso.
VERDADERO NEGATIVO (TN, portrue negative): un píxel se clasifica
correctamente como no perteneciente a un vaso.
En base a las tasas de ocurrencia de estos estados, se pueden obtener diferentes métricas que permitan cuantificar los resultados. En particular, las principales son la sensitividad (Se,sensitivity, también denominada Re, recall), la especificidad (Sp,
specificity) y la precisión (P r,precision). Las mismas están dadas por las ecuaciones:
Se= T P
T P +F N (3.1)
Sp= T N
T N+F P (3.2)
P r = T P
T P +F P (3.3)
LaSepermite medir la capacidad del método para detectar correctamente los vasos sanguíneos. LaSp, por el contrario, determina la capacidad que posee el método de distinguir todas las demás estructuras que no son vasos sanguíneos. En problemas denominados de clase desbalanceada [97], donde la clase positiva (en este caso, vaso) presenta un número significativamente menor de muestras con respecto a la clase negativa (no vaso), laSpno es del todo útil dada la baja influencia que tendrá el término FP en el denominador de la fracción. Por el contrario, laSeno presenta este problema, ya que utiliza en la fracción únicamente los píxeles correspondientes a los vasos. LaP r
permite cuantificar la proporción de píxeles clasificados como vasos sanguíneos que se han identificado correctamente, y al igual que laSe, no involucra TN en su cálculo, lo que la hace también útil en problemas de clases desbalanceadas [12].
Elaccuracy(Acc) es otra de las métricas más utilizadas, aunque es muy sensible a las distribuciones desequilibradas. Por este motivo, existe una tendencia en la actualidad a no aplicarla en problemas de este estilo [97]. Está dada por la ecuación:
Acc= T P +T N
T P +F P +T N +F N (3.4)
Existen métricas de rendimiento global más adecuadas que elAcccuando se presentan clases desbalanceadas. Entre estas, el coeficiente de correlación deMatthews (MCC, Matthews Correlation Coefficient) [6,84,95] es un coeficiente de correlación entre las segmentaciones manuales proporcionadas en losdatasetsutilizados y las segmentaciones logradas mediante el método de segmentación propuesto. La misma está dada por la ecuación:
M CC = p T P/N −S×P
P×S×(1−S)×(1−P) (3.5)
dondeN = T P +T N +F P +F N es el número total de píxeles de la imagen, S = (T P +F N)/N yP = (T P +F P)/N. El MCC devuelve un valor entre−1y+1, donde
+1indica una predicción perfecta,0no es mejor que una predicción al azar, y−1indica una contraposición total entre la predicción y la imagen segmentada provista por el
Otra métrica considerada es laF1-score[12], que representa la media armónica entre
P ryRe:
F1-score= 2·P r·Re
P r+Re (3.6)
Alcanza su valor máximo de 1, cuando la segmentación es perfecta, y su menor valor, 0, cuando la segmentación es totalmente errónea.
Finalmente, una métrica alternativa para estudiar la calidad global de la segmenta-ción es la mediaGo(G-mean), que mide el balance entre laSey laSp:
G-mean=pSe×Sp (3.7)
También está acotada entre 0 y 1, devolviendo 0 si laSeo laSpson nulas y 1 si ambas son 1.
Todas las métricas discutidas hasta aquí adquieren relevancia cuando el propósito es estudiar la calidad de una segmentación binaria. Sin embargo, para evaluar la efectividad de los indicadores utilizados para el realce de alguna estructura de relevancia (en este caso, los vasos sanguíneos), existen algunas métricas alternativas, tales como las curvas ROC o las dePrecision/Recall.
Las curvas ROC (Receiver Operating Characteristic, o Característica Operativa del Receptor) constituyen una representación gráfica que permite observar cómo varía la cantidad de TP frente a la tasa de FP, conforme se varía un umbral de discriminación (valor a partir del cual se decide que un caso es un positivo). El análisis de la curva ROC proporciona herramientas para seleccionar los modelos posiblemente óptimos y descartar modelos subóptimos independientemente del costo de la distribución de las dos clases sobre las que se decide. Para dibujar una curva ROC, sólo son necesarias laSe
y laF P R, o tasa de falsos positivos, que se calcula como1−Sp. La FPR define cuántos resultados positivos son incorrectos de entre todos los casos negativos disponibles durante la prueba. Luego, la curva ROC se grafica con las FPR ySeen los ejes x e y respectivamente, colocando un punto por cadaSey FPR obtenidos para un cierto valor de umbral [98]. La Figura 3.7 presenta una curva de ejemplo. El mejor método posible de caracterización de píxeles como parte de un vaso sanguíneo se situaría en un punto en la esquina superior izquierda, o coordenada (0,1) del espacio ROC, representando un 100 % deSe(ningún falso negativo) y un 100 % también deSp(ningún falso positivo). Por el contrario, una clasificación totalmente aleatoria daría un punto a lo largo de la línea diagonal, también denominada línea de no-discriminación, desde el extremo inferior izquierdo hasta la esquina superior derecha. Un parámetro cuantitativo que comúnmente se utiliza para evaluar la curva es el área bajo la misma (AUC,area under the curve) que tomará valores entre 0 y 1: 1 para una prueba perfecta, 0 para una prueba totalmente inversa, y 0.5 en el caso de una prueba completamente aleatoria [96].
FIGURA3.7: Ejemplo del espacio de una curva ROC.
Métodos
Este trabajo final tiene como principal objetivo proponer una estrategia para el ajuste automático de parámetros de un algoritmo para la segmentación automática de vasos sanguíneos. El propósito es obtener un método capaz de ajustarse a diferentes resoluciones de imagen, con una mínima intervención por parte del usuario. En este capítulo se describen las etapas del algoritmo propuesto. En la Sección 4.1 se presenta en líneas generales el método completo. En la Sección 4.2 se presenta un algoritmo de preprocesamiento que permite reducir los efectos de los artefactos de las imágenes en los resultados de segmentación. En la Sección 4.3 se describen los parámetros identificados del algoritmo de segmentación utilizado, detallando una serie de descriptores relevados y sus parámetros (Sección 4.3.1) y el método de segmentación utilizado (Sección 4.3.2). Finalmente, se desarrolla en la Sección 4.4 la estrategia propuesta para la estimación automática de los parámetros.
4.1.
Descripción general
El método de estimación automática de parámetros propuesto tiene por objetivo librar al usuario de la tediosa tarea de ajustarlos manualmente al momento de segmentar las imágenes.
En particular, el algoritmo que realiza la estimación de parámetros consta de las etapas descriptas en la Figura 4.1: una etapa de preprocesamiento inicialmente adapta las imágenes de entrada1a fin de reducir el efecto nocivo de sus artefactos en la calidad de la segmentación; una etapa subsiguiente de caracterización de píxeles permite extraer una serie de descriptores ofeaturesque describen el nivel de vascularidad de cada uno de los píxeles de la imagen, y finalmente una etapa de entrenamiento de un algoritmo de segmentación basado enconditional random fields(CRFs).
Para la estimación de parámetros, es necesario inicialmente optimizar cada una de las etapas indicadas en la Figura 4.1. Para ello, se realizó un barrido en los parámetros de las diferentes partes del algoritmo de preprocesamiento propuesto y de cada uno de los descriptores utilizados para describir los píxeles, evaluando la calidad de los resultados obtenidos con ellos y registrando los valores óptimos (Sección 4.3). Posteriormente, y a partir de las características de las imágenes medidas de forma manual, se estableció la correlación entre los valores óptimos encontrados y las características anatómicas obser-vadas en las imágenes. Finalmente, con esta información se realizó el ajuste automático de parámetros (Sección 4.4) aplicando el modelo matemático de regresión lineal.
1La imagen de entrada utilizada corresponde siempre al canal verde de la imagen a color original. Esto
se debe a que es la banda que ofrece un mayor contraste entre los vasos sanguíneos y las demás estructuras retiniales [12].
FIGURA4.1: Etapas del algoritmo de estimación de parámetros.
4.2.
Método de preprocesamiento propuesto
Por lo general, las imágenes obtenidas durante la captura presentan dificultades para ser segmentadas en crudo. Los principales problemas tienen que ver con la presencia de ruido, la falta de contraste y la iluminación despareja. Por tal razón, y entendiendo que se trata de una etapa importante en cualquierpipelinede segmentación de imágenes, se propone una estrategia en tres etapas para la mejora de las imágenes de entrada. En primer lugar, se realiza una mejora del contraste, luego se lleva a cabo un proceso de estimación y sustracción del fondo que permite reducir el efecto de la iluminación despareja, y finalmente se aplica un filtro para la reducción del ruido en la imagen. Cada una de estas etapas se describe en los siguientes apartados. De manera adicional, se realiza un proceso de extensión artificial del FOV, habida cuenta de que la aplicación de filtros de extracción de características por lo general produce falsos positivos en el borde del FOV. Así, mediante la simulación de un borde mayor, es posible obtener características que reaccionen positivamente por fuera del FOV y que pueden removerse fácilmente haciendo uso de la correspondiente máscara.
4.2.1. Mejora de contraste
Uno de los principales inconvenientes en las imágenes de fondo de ojo tiene que ver con la falta de contraste de algunos vasos sanguíneos, principalmente los más angostos (Figura 4.2). Cualquier algoritmo de segmentación del árbol vascular necesitará contar con un mejor contraste entre estas estructuras, a fin de obtener mejores resultados. Uno de los filtros más conocidos para realce de contraste es AHE (Adaptive Histogram Equalization, o ecualización adaptativa de histograma). Este método calcula varios histogramas, cada uno correspondiente a una sección distinta de la imagen, y los utiliza para redistribuir sus valores de luminosidad. Debido a esta característica, resulta adecuado para mejorar el contraste local y la definición de los bordes en cada región de la imagen. Sin embargo, AHE tiene una tendencia a amplificar el ruido al aplicarse en regiones homogéneas. Una variante de este método mucho más difundida es la conocida como CLAHE (Contrast Limited Adaptive Histogram Equalization, o ecualización adaptativa del histograma limitada por contraste), la cual reduce el ruido a través de limitar la amplificación. En este caso, el contraste, sobre todo en áreas homogéneas, es limitado para evitar la amplificación de cualquier ruido que pudiera estar presente en la imagen [99]. Muchos trabajos en la literatura han propuesto utilizar esta estrategia a modo de preprocesamiento, de manera de realzar el contraste entre las diversas estructuras de la retina antes de continuar aplicando otras técnicas [85,100,101].
FIGURA 4.2: Problema de bajo contraste. Imagen de fondo de ojo del
datasetARIA, donde se puede observar el bajo contraste entre los vasos más delgados y las demás estructuras de la retina.
4.2.2. Corrección del artefacto de iluminación despareja
Otro de los inconvenientes observados en este tipo de imágenes es la iluminación despareja. En general, este problema se produce como consecuencia de una mala ilumi-nación de la retina al momento de la captura de las imágenes, y podría resolverse de manera sencilla realizando una nueva toma. Sin embargo, es de esperar que un método de segmentación de vasos sanguíneos sea lo suficientemente robusto como para poder lidiar con esta problemática. En general, diferentes autores proponen corregirla con dis-tintas estrategias, más o menos complejas. La mayoría coincide en estimar inicialmente un fondo que se asemeje a la iluminación despareja y posteriormente suprimirlo de la imagen [80].
(A) (B)
FIGURA4.3: Ejemplo de aplicación del filtro CLAHE sobre una imagen de fondo de ojo. (a) Canal verde de la imagen original. (b) Canal verde luego de aplicar el filtro CLAHE. En el área en rojo se observa una mejora
significativa del contraste de los vasos delgados .
(A) (B)
FIGURA4.4: (a) Efecto del filtro CLAHE sobre la iluminación despareja. (b) Ruido sobre un sector de la imagen con filtro CLAHE.
menos sensible a valores extremos. Su inconveniente principal es que posee mayor costo computacional, ya que requiere primero ordenar los diferentes valores de intensidad de los píxeles incluidos en la ventana y determinar luego cuál es el valor central.
En la Figura 4.5 se presentan diferentes estimaciones del fondo, utilizando un filtro de mediana y un filtro de promedio. En ambos casos se usó el tamaño de ventana que mejores resultados de contraste ofrecía al momento de sustraer el fondo. Según puede observarse, el filtro de mediana elimina completamente los vasos sanguíneos, lo que no reduce el contraste del árbol vascular al momento de tomar la diferencia entre la imagen original y el fondo. Por el contrario, el filtro de media conserva algunos vasos, sobre todo aquellos que discurren muy juntos entre sí.
(A)
(B) (C)
FIGURA 4.5: Imágenes de fondo de ojo del dataset ARIA. (a) Imagen original en canal verde. (b) Estimación de fondo con filtro de mediana. (c)
Estimación de fondo con filtro de media.
(A) (B)
(C) (D)
FIGURA 4.6: Sustracción de fondo para estimación mediante filtro de mediana utilizando diferentes tamaños de ventana: (a) 3 píxeles. (b) 25
píxeles, (c) 41 píxeles, (d) 75 píxeles.
En la Figura 4.7 se observa una imagen de fondo de ojo luego de aplicar el filtro de realce, antes y después de suprimir el fondo. Se puede notar que la operación de sustracción de fondo resuelve algunas de las inhomogeneidades producidas por la iluminación difusa y mejora el contraste de los vasos ubicados en el área más oscura. El ruido en la imagen, sin embargo, se ve levemente incrementado, como puede apreciarse en la región patológica.
(A) (B)
FIGURA4.7: Sustracción de fondo para reducir el artefacto de iluminación despareja. (a) Imagen luego de aplicar CLAHE. (b) Imagen luego de