• No se han encontrado resultados

Evaluación de un algoritmo de segmentación de nódulos pulmonares en imágenes de tomografía computarizada basado en la localización automática de un umbral

N/A
N/A
Protected

Academic year: 2021

Share "Evaluación de un algoritmo de segmentación de nódulos pulmonares en imágenes de tomografía computarizada basado en la localización automática de un umbral"

Copied!
72
0
0

Texto completo

(1)

EVALUACIÓN DE UN ALGORITMO DE SEGMENTACIÓN DE NÓDULOS PULMONARES EN IMÁGENES DE TOMOGRAFÍA COMPUTARIZADA BASADO

EN LA LOCALIZACIÓN AUTOMÁTICA DE UN UMBRAL

PEDRO ELÍAS ROMERO NIETO

UNIVERSIDAD DEL MAGDALENA FACULTAD DE INGENIERÍA

INGENIERÍA DE SISTEMAS SANTA MARTA D.T.C.H

(2)

EVALUACIÓN DE UN ALGORITMO DE SEGMENTACIÓN DE NÓDULOS PULMONARES EN IMÁGENES DE TOMOGRAFÍA COMPUTARIZADA BASADO

EN LA LOCALIZACIÓN AUTOMÁTICA DE UN UMBRAL

Autor: Pedro Elías Romero Nieto

PROYECTO DE TESIS PARA OPTAR AL TÍTULO EN INGENIERÍA DE SISTEMAS

Director(a): PhD Idanis Beatriz Díaz Bolaño

UNIVERSIDAD DEL MAGDALENA FACULTAD DE INGENIERÍA

INGENIERÍA DE SISTEMAS SANTA MARTA D.T.C.H

(3)

CONTENIDO

Pág.

INTRODUCCIÓN. ... 8

IMÁGENES DE TOMOGRAFÍA COMPUTARIZADA ... 10

SEGMENTACIÓN DE NÓDULOS PULMONARES ... 12

ANTECEDENTES EN LA DETECCIÓN DE NÓDULOS PULMONARES ... 21

MÉTODO DE DETECCIÓN DE NÓDULOS PULMONARES BASADO EN LA LOCALIZACIÓN AUTOMÁTICA DE UN UMBRAL. ... 28

SEGMENTACIÓN DE VOLUMEN PULMONAR ... 29

DETECCIÓN DE NÓDULOS CANDIDATOS ... 32

REDUCCIÓN DE FALSOS – POSITIVOS ... 43

EVALUACIÓN DEL ALGORITMO DE DETECCIÓN DE NÓDULOS PULMONARES .... 49

IMÁGENES DE TOMOGRAFÍA UTILIZADAS ... 49

CUANTIFICACIÓN DEL ERROR DE SEGMENTACIÓN ... 52

IMPLEMENTACIÓN DEL MÉTODO ... 53

CONCLUSIONES ... 66

(4)

LISTA DE TABLAS

Pág.

Tabla 1. Estadísticas de la colección proporcionada ... 50 Tabla 2. Características de las imágenes proporcionadas en la colección: SPIE-AAPM Lung CT Challenge ... 50 Tabla 3. Características de las imágenes proporcionadas en la colección: ELCAP Public Lung Image ... 51 Tabla 4. Características de la máquina en la que se ejecutó el algoritmo de detección de nódulos pulmonares. ... 53 Tabla 5. Casos de estudio, para prueba del algoritmo de detección de nódulos

pulmonares, en imágenes de tomografía computarizada (TC). ... 54 Tabla 6. Valores medio de coeficiente Sorensen-Dice para cada operación propuesta para la localización del umbral en la detección de nódulos candidatos. ... 56 Tabla 7. Valor de coeficiente Sorensen-Dice promedio para cada tipo de filtrado. ... 58 Tabla 8. . Valor de coeficiente Sorensen-Dice promedio para cada tipo de filtrado, a partir de la comparación de segmentación manual y segmentación automática. ... 58 Tabla 9. Número de nódulos candidatos contra número de nódulos detectados luego de aplicar el algoritmo de filtrado ... 60 Tabla 10. Número de nódulos conocidos (identificados) y detectados automáticamente por caso ... 62 Tabla 11. Diferencia entre nódulos detectados y nódulos verdaderos presentes en cada caso ... 64

(5)

LISTA DE GRÁFICAS

Pág. Gráfico 1. Curva de variación de volumen de los objetos según disminuyen los umbrales en un paso de 10 unidades ... 40 Gráfico 2. Curva de diferencias entre volúmenes consecutivos. ... 41 Gráfico 3. Máximos locales de las diferencias entre volúmenes del intervalo definido. .... 41 Gráfico 4. Coeficiente de Sorensen-Dice para la comparación de la segmentación manual contra la automática, en cada una de las operaciones (media, mediana, máximo, mínimo, punto medio). ... 56 Gráfico 5. Coeficiente Sorensen-Dice de la segmentación manual contra nódulos

detectados automáticamente, variando el método de filtrado (filtrado sencillo, filtrado doble). ... 58 Gráfico 6. Coeficiente de Sorensen-Dice: Segmentación Manual – Segmentación

Automática (Media: 0.8979, std: 0.1179) ... 61 Gráfico 7. Coeficiente de Sorensen-Dice: Segmentación Manual – Nódulos Detectados Automáticamente (Media: 0.2828, std: 0.1215) ... 63

(6)

LISTA DE FIGURAS

Pág.

Figura 1: Nódulo sólido (a). Nódulo parcialmente sólido con densidades periféricas en vidrio deslustrado (b). Nódulo no sólido: opacidad en vidrio deslustrado (c). Nódulo

pequeño circunscrito (Álvarez et al., 2011). ... 12 Figura 2: Nódulos pulmonares circunscritos. ... 14 Figura 3: Nódulo pulmonar detectado y posteriormente segmentado, presentado

volumétricamente. ... 14 Figura 4: Ejemplo de umbralización sobre una imagen en la que se establecen los límites de intensidad dentro de su histograma (Rouss, 2011). ... 17 Figura 5. Clasificación de las técnicas de segmentación volumétricas para nódulos

pulmonares, más destacadas en la literatura. ... 21 Figura 6. Flujo fundamental a seguir por los sistemas de detección de nódulos

pulmonares. ... 28 Figura 7. Estructura del método propuesto e implementado en este trabajo. ... 28 Figura 8. Diagrama de flujo para el algoritmo de segmentación de volumen pulmonar. ... 29 Figura 9. Slice del volumen completo de la imagen TC... 30 Figura 10. Extracción automática de pulmones en imágenes TC. (A) Imagen original. (B) Imagen umbralizada. (C) Extracción de segundos más grandes componentes conectados. (D) Máscara completa del pulmón. (E) Pulmones extraídos. ... 30 Figura 11. Volumen de pulmón segmentado ... 31 Figura 12. Diagrama de flujo para el algoritmo de detección de nódulos candidatos ... 32 Figura 13. Histograma del volumen pulmonar y umbralización del mismo, seleccionando un umbral a partir del histograma ... 35 Figura 14. Histograma del volumen pulmonar e imagen umbralizada del mismo,

seleccionando un valor de umbral desplazado hacia la derecha del pico del histograma. 36 Figura 15. Histograma del volumen pulmonar e imagen resultante al aplicar un umbral desplazado una distancia significativa a la derecha del pico del histograma. ... 37 Figura 16 Secuencia de variación de volumen de objeto hasta alcanzar el equilibrio. ... 39 Figura 17. Diagrama de flujo para el algoritmo de reducción de falsos-positivos, dentro del volumen con los nódulos candidatos. ... 43 Figura 18. Representación de elipse en regiones planas ... 45 Figura 19. Formas que contienen segmentos tipo L y cuadrados ... 46

(7)

RESUMEN

Un sistema de detección asistido por computador puede ayudar a los radiólogos a mejorar su agilidad para detectar nódulos pulmonares en etapas tempranas. La detección temprana de nódulos pulmonares es importante para el diagnóstico y manejo clínico del cáncer de pulmón. En este trabajo se propone e implementa un nuevo método de detección de nódulos pulmonares en imágenes de tomografía computarizada, basado en la técnica de umbralización. Las imágenes de tomografía computarizada es la técnica de imagenología más adecuada actualmente para la detección de nódulos pulmonares. Después de segmentarse el volumen pulmonar, los nódulos candidatos son detectados basados en el hecho de poseer niveles de intensidad superior a estructuras propias del parénquima pulmonar, identificando puntos referentes en la curva del histograma que permiten localizar un valor de umbral. La reducción de falsos-positivos se realiza aplicando un filtrado por características geométricas. El rendimiento del método propuesto es evaluado sobre un conjunto de entrenamiento proporcionado por SPIE-AAPM Lung CT Challenge Database y ELCAP Public Lung Image Database. Se cuenta con un total de 35 nódulos distribuidos entre 16 casos, para los cuales se tiene un ground-truth. La reducción de falsos positivos es significativa, filtrando desde 12380 nódulos candidatos en promedio a 19 nódulos detectados. El método muestra una sensibilidad para la detección de nódulos pulmonares de un 88.6%, teniendo un error de 1 nódulo en los casos donde no se alcanza la detección completa.

Palabras claves: Tomografía Computarizada, Nódulo Pulmonar, Detección de Nódulos Pulmonares, Umbralización.

(8)

8 INTRODUCCIÓN.

El cáncer de pulmón es la primera causa de muertes relacionadas a las diversas formas de cáncer conocidas en el mundo. La mayoría de los pacientes diagnosticados con cáncer de pulmón se encuentran en un estado avanzado (40% en etapa IV, 30% en etapa III), y en los últimos cinco años, la rata de supervivencia ha sido solo de un 16% (Choi, 2014). Mueren más personas a causa del cáncer de pulmón que de colon, mamas, y próstata (los siguientes tres de mayor mortalidad). Normalmente se sugiere terapia con radiación y quimioterapia para el tratamiento del carcinoma pulmonar, sin embargo tan solo un 15% de los casos de cáncer son localizados de forma temprana (El-Baz, 2013).

Para seleccionar el tratamiento de este tipo de cáncer es fundamental hacer una estadificación adecuada, la detección precoz, cuando aún está en la fase de nódulo pulmonar, permitiría una intervención terapéutica más temprana, la que traería consigo un pronóstico más favorable. Por tanto, el diagnostico de los nódulos pulmonares que, además, es importante para la detección de metástasis pulmonares en tumores extra torácicos, continúa siendo un problema clínico de primera magnitud: aunque muchos nódulos pulmonares son benignos (granulomas, etc.), un elevado porcentaje son neoplásicos. De hecho, por encima de los 40 años un nódulo pulmonar solitario recién descubierto –una opacidad redondeada, relativamente bien definida y cuyo diámetro mayor es inferior a 3 cm- puede ser un carcinoma pulmonar asintomático (Souto, 2008).

La detección temprana de nódulos pulmonares para prevenir diagnósticos de cáncer sería de gran ayuda. Esto se podría llevar a cabo con la elaboración de sistemas especializados en detección y diagnostico (CADx, CADe) utilizando imágenes de tomografías computarizadas (TC) las cual es una de las modalidades

(9)

9

más comunes no invasivas para detectar y diagnosticar cáncer de pulmón (Iqbal et al., 2014). Sin embargo, dicha técnica genera varios cientos de imágenes en cada estudio, y origina un problema de información excesiva para el radiólogo, lo que “complica” la detección visual de posibles nódulos pulmonares.

Los sistemas de CAD se han presentado como una ayuda (una segunda opinión) para el radiólogo en la detección precoz de diferentes enfermedades (Souto, 2008). Proporcionarle a un radiólogo una herramienta tecnológica que le permita manipular datos de imágenes de TC, puede ayudarle a mejorar en su habilidad para detectar esos objetos correspondientes a lesiones pulmonares, entre ellos los nódulos, los cuales son los principales indicadores del posible diagnóstico de cáncer (Zhao, 2003).

Un sistema de detección automática de nódulos pulmonares generalmente consiste en tres pasos: segmentación de los pulmones, detección de nódulos candidatos y reducción de falsos positivos (Choi, 2014). Existen diversos sistemas de este tipo, los cuales cumplen con sus objetivos basados también en diversas técnicas del análisis de imágenes, y cada uno alcanza un grado de precisión y efectividad particular.

En el mundo de la investigación en análisis y procesamiento de imágenes médicas, el desarrollo de nuevas técnicas de segmentación (detección) es un ámbito de gran interés. A pesar de las dificultades que han ido surgiendo, se han obtenido resultados que demuestran que es posible encontrar características dentro de las imágenes útiles para determinar la localización de lesiones. Sin embargo, no se le dedica el mismo esfuerzo a la evaluación de los algoritmos implementados. Su precisión, estabilidad y eficiencia, resulta en ocasiones de bajo interés con tal de obtener el resultado final (Panduro, 2010).

(10)

10

En este proyecto se desarrolló un nuevo método o algoritmo para detectar nódulos pulmonares en imágenes de tomografía computarizada (TC), además, se le evaluó su desempeño, en cuanto a detección de los nódulos y reducción de falsos positivos.

En lo que sigue, se tratarán aspectos teóricos relacionados con la temática desarrollada durante el proyecto, con la finalidad de establecer bases que soporten posteriormente la descripción del algoritmo desarrollado.

IMÁGENES DE TOMOGRAFÍA COMPUTARIZADA

La palabra tomografía es derivada de la palabra griega “tomos”, para describir una técnica de rayos x, en la cual se fotografía un solo plano, eliminando las demás estructuras pertenecientes a otros planos. Esta definición ilustra de manera concisa las limitaciones fundamentales de la radiografía convencional (Messay, 2010).

La tomografía computada, surge como la técnica que solventa esas limitaciones de la radiografía convencional. Es un método imagenológico de diagnóstico médico, que permite observar al interior del cuerpo humano, a través de cortes milimétricos transversales al eje cefalo-caudal, mediante el uso de rayos x (Way, 2006).

El principio básico de la tomografía computarizada es que la estructura interna de un objeto puede reconstruirse, a partir de múltiples proyecciones del mismo (Dehmeshki, 2008).

(11)

11

Debido a esta oportunidad que brinda para inspeccionar e identificar objetos al interior del cuerpo, es que se ha convertido actualmente en la técnica de mayor precisión para el reconocimiento de nódulos al interior de los pulmones.

Desde sus primeras apariciones, han aparecido múltiples variaciones, todas con características específicas según los distintos casos de estudio. Tomografía por emisión de positrones (TEP), tomografía computarizada multicortes (multislices) (TCMC), tomografía computarizada de baja dosis (TCBD) y tomografía computarizada de contraste mejorado, son considerados las modalidades de imágenes no invasivas más comunes para detectar y diagnosticar nódulos pulmonares. Imágenes TEP son usadas para distinguir la malignidad del nódulo, es decir, poder discriminar si es maligno o no. Para la detección temprana de los nódulos se acostumbra a usar las imágenes TCMC y TCBD que permiten reconstruir la anatomía y detectar los cambios anatómicos en la región torácica (El-Baz, 2013).

(12)

12

SEGMENTACIÓN DE NÓDULOS PULMONARES

Nódulo Pulmonar:

El nódulo pulmonar solitario (NPS) se define como una opacidad radiológica única , esférica , circunscrita, de diámetro máximo ≤ 30mm, rodeada en su mayor parte por pulmón aireado y no asociada a atelectasia, agrandamiento hiliar o derrame pleural. El NPS puede ser un hallazgo en la radiografía torácica o en la tomografía computarizada (TC) torácica realizada para el estudio de otras patologías o para el cribado diagnóstico del carcinoma pulmonar (CP). La TC detecta nódulos milimétricos (≤ 8mm de diámetro) y nódulos subsólidos (NSS) que se manejan de forma diferente (ver figura 1). Los NSS incluyen tanto los nódulos en vidrio deslustrado como los nódulos parcialmente sólidos que combinan un componente en vidrio deslustrado y otro sólido (Álvarez et al., 2014).

Figura 1: Nódulo sólido (a). Nódulo parcialmente sólido con densidades periféricas en vidrio deslustrado (b). Nódulo no sólido: opacidad en vidrio deslustrado (c). Nódulo pequeño circunscrito (Álvarez et al., 2011).

Un nódulo pulmonar pequeño es usualmente esférico, con un diámetro menor a 1 cm. El nódulo tiene una densidad (atenuación de Tomografía Computarizada (TC)) significativamente mayor que la del contorno del parénquima pulmonar. Kostis (2003), nos dice que los nódulos pueden clasificarse basados en su posición

(13)

13

dentro del pulmón y su relación con los componentes internos de éste mismo. Se definen cuatro clases de nódulos pulmonares:

Bien-Circunscritos: el nódulo es localizado centralmente en el volumen del pulmón, sin conexiones significativas a los vasos.

Vascularizados: el nódulo es localizado centralmente en el pulmón, pero si presenta significativas conexiones con los vasos de su entorno.

Cola-Pleural: el nódulo está cercano a la superficie pleural, conectado por una delgada estructura (“cola pleural”).

Juxtapleural: una porción significativa de la periferia del nódulo está conectada a la superficie del pulmón.

Ayudando un poco a la abstracción del lector, un nódulo pulmonar se vería similar como lo muestra la siguiente imagen.

(14)

14

Figura 2: Nódulos pulmonares circunscritos1.

La visualización de nódulos en imágenes TC y su representación volumétrica una vez detectado corresponde a la imagen:

Figura 3: Nódulo pulmonar detectado y posteriormente segmentado, presentado volumétricamente2.

1Fuente: https://www.healthtap.com/user_questions/625112

(15)

15 Segmentación de imágenes:

Segmentación conlleva a particionar una imagen en un conjunto de regiones homogéneas y significativas, tal que los píxeles en cada región particionada posea un idéntico conjunto de propiedades o atributos. Estos conjuntos de propiedades de la imagen pueden incluir niveles de gris, contraste, valores espectrales, o propiedades de textura. El resultado de una segmentación es un número de regiones homogéneas, las cuales cada una tendrá una sola etiqueta. Una imagen así quedaría definida como un conjunto de regiones que están conectadas y no superpuestas, tal que cada píxel adquiere una etiqueta que lo identifica perteneciente a una región en particular. El conjunto de objetos de interés en una imagen, los cuales son segmentados, son aquellos que generan interés de estudio y por ello se requiere una separación de los otros.

Una segmentación completa de una imagen 𝑅 implica la identificación de un conjunto finitos de regiones 〈𝑅1, 𝑅2, 𝑅3, … , 𝑅𝑛〉 tal que:

1. 𝑅 = 𝑅1 ∪ 𝑅2∪ ⋯ 𝑅𝑛 2. 𝑅𝑖 ∩ 𝑅𝑗 = ∅, ∀ 𝑖 ≠j 3. 𝑃(𝑅𝑖) = 𝑇𝑟𝑢𝑒, ∀ 𝑖

4. 𝑃(𝑅𝑖 ∪ 𝑅𝑗) = 𝐹𝑎𝑙𝑠𝑒, 𝑖 ≠ 𝑗

Existe un número posible de particiones, pero la selección de un conjunto apropiado de regiones, depende de la selección de las propiedades de asociación en la región 𝑃 (Tinku et al., 2005).

(16)

16

Teniendo claridad conceptual acerca de lo que representa la segmentación

de imágenes, se conceptualizarán algunos de los métodos que se tendrán en cuenta más adelante.

Umbralización: Seleccionar objetos o identificar características en una escena o imagen es un requisito importante para cualquier estudio o análisis, nos dice Russ (2011). Tradicionalmente, una forma simple de hacer esto consiste en definir un rango de valores de intensidad en la imagen original, se seleccionan los píxeles que hacen parte del rango correspondiente al frente de la imagen y se apartan los que corresponde al fondo, lo que conlleva a particional la imagen en dos conjuntos, podrían ser blanco y negro o diversos colores según la imagen.

El proceso de selección usualmente se le llama umbralización. Lo que se quiere es determinar un valor de intensidad, llamado umbral (threshold), que separa las clases deseadas. La segmentación se logra agrupando todos los pixeles con mayor intensidad al umbral de una clase, y todos los pixeles en otra clase.

(17)

17

Figura 4: Ejemplo de umbralización sobre una imagen en la que se establecen los límites de intensidad dentro de su histograma (Rouss, 2011).

Morfología Matemática: La palabra morfología significa el estudio de la forma o estructura. En procesamiento de imagen, se usa la morfología matemática con el fin de identificar y extraer descriptores significativos de imagen, basados en propiedades de formas al interior de la imagen. Una de las principales aplicaciones de la morfología matemática se da en la segmentación.

Las operaciones morfológicas pueden ser aplicadas a todo tipo de imágenes, pero se acostumbra en mayor frecuencia a usarse en imágenes binarias, de donde surgen los operadores fundamentales que son: dilatación y erosión. Muchos procesos morfológicos pueden reducirse a secuencia de uso de los operadores.

Normalmente se toma una imagen 𝐴 y un arbitrario elementro estructural 𝐵 y se habla de la dilatación/erosión de 𝐴 por 𝐵.

(18)

18

o Erosión: para llevar a cabo la erosión de una imagen binaria se coloca sucesivamente el pixel central del elemento estructural sobre cada pixel del frente de la imagen (valor 1). Si alguno de los píxeles vecinos se encuentra en el fondo (valor 0), entonces el pixel del frente es llevado al fondo, su valor cambia de 1 a 0.

o Dilatación: En este caso el pixel central del elemento estructural, se coloca sobre cada pixel del fondo de la imagen (valor 0). Si alguno de los vecinos están en el frente (valor 1), entonces el pixel en cuestión se cambia al frente, es decir, cambia de valor 0 a 1.

Esto en el procesamiento de imágenes binarias, si fuese en otro tipo de imagen, los píxeles a transformar, deben cumplir con una propiedad o poseer un determinado atributo (Solomon et al., 2011).

Crecimiento de regiones: Solomon et al. (2011), nos dice que: el crecimiento o cultivo de regiones hace referencia al procedimiento que agrupa pixeles o subregiones en otras más grandes. Iniciando con un conjunto de puntos denominados semilla, las regiones crecen a partir de esos puntos, incluyendo los puntos semillas, los pixeles vecinos que tienen características similares o cumplen con una determinada propiedad o algún atributo similar como intensidad, textura, entre otros, van siendo agregados, extendiendo la región.

Es un proceso iterativo, en el que cada semilla crece de forma iterativa, hasta que los pixeles vecinos sean procesados y por lo tanto se forman distintas regiones limitadas por polígonos.

(19)

19

Los aspectos más sobresalientes del crecimiento de regiones son:

o Selección de la semilla inicial.

o El crecimiento de pixeles basados en una propiedad podrían no conllevar a una buena segmentación.

o Similaridad.

o Área de región.

Modelos Deformables: La idea básica de usar modelos o contornos deformables para la segmentación de imágenes es la de insertar un contorno inicial (o superficie en el caso 3D) en la imagen, y dejarlo evolucionar mientras se somete a diversas restricciones. Con el fin de detectar objetos en la imagen, el contorno debe parar su evolución en el límite del objeto de interés.

El término modelos deformables apareció en 1988 en el trabajo realizado por Terzopoulos y sus colaboradores; sin embargo, la idea de deformar una figura para encontrar formas en una imagen surgió mucho antes con el trabajo de Fischler and Elschlager, los Spring-loaded templates y la técnica de Rubber mask de Widrow.

Snakes fue la técnica de deformación de modelos que dio fama al término modelos deformables y permitió que se volvieran un área activa de investigación en la segmentación de imágenes. Los modelos deformables llamados Snakes o active contour models, son contornos planos deformables basados en la técnica de minimización de energía (Dougherty, 2011).

(20)

20

Watersheds: en la segmentación por watersheds, se parte de la imagen en 2D, en su escala de grises, la cual se considera una superficie topológica, en el cual la localización de un punto se da por sus coordenadas (x, y) y la altura corresponde al nivel de intensidad de la escala de gris del pixel.

Si se riega todo el terreno, se tendrán puntos donde el agua estará en niveles bajos y otros donde se tengan niveles máximos de altura. A medida aumenta el nivel de agua, se construyen especies de represas que impiden que el agua se derrame en cuencas adyacentes, una vez el agua alcanza la altura máxima, el proceso se detiene. Las cuencas que se forman de esta manera son las que determinan diversas regiones dentro de la imagen, llevando a cabo un proceso de segmentación por regiones en la misma. El proceso de construcción de las represas puede llevarse a cabo de diversas maneras.

Una ventaja del método watersheds a comparación de otros, es que lleva a cabo la generación de límites definidos que distinguen las regiones formadas.

(21)

21

ANTECEDENTES EN LA DETECCIÓN DE NÓDULOS PULMONARES

Como se mencionó antes, la detección temprana de nódulos pulmonares, puede incrementar las oportunidades de vida en el paciente, sin embargo, detectar y segmentar el o los nódulo(s) es una tarea realmente complicada. Existe la dificultad de distinguir los nódulos entre otras estructuras internas al pulmón como: vasos sanguíneos, alveolos pulmonares, y otros aspectos relacionados con la imagen (El-Baz, 2013).

En la literatura se encuentran diversos enfoques respecto a las técnicas empleadas para lograr la segmentación volumétrica de nódulos pulmonares. Mahersia (2015), nos proporciona la idea de realizar una clasificación teniendo presente aquellas más referenciadas. La figura 5 nos muestra las categorías, con sus respectivos métodos.

Figura 5. Clasificación de las técnicas de segmentación volumétricas para nódulos pulmonares, más destacadas en la literatura. Técnicas de Segmentación Umbralización (Thresholding) Métodos basados en modelos Métodos basados en formas Modelos deformables Morfología Matemática Métodos basados en regiones Métodos de cuencas (watershed) crecimiento de regiones (region growing) Métodos basados en grafos Corte de grafos (graph-cut)

(22)

22

El algoritmo elaborado para este proyecto se ubica dentro de aquellos que siguen la técnica de umbralización (Thresholding), de ahí que en la figura anterior se resalte el cuadro correspondiente a dicha técnica (cuadro color naranja). Posteriormente se aclarará la forma como se llegó a seleccionar dicha técnica.

Debido a la gran importancia a nivel clínico, el número de artículos reportados en la literatura que tratan el problema de la segmentación de nódulos pulmonares ha aumentado considerablemente. Los avances en la tecnología de tomografía computarizada de alta resolución, desde el año 2000 a la fecha, ha permitido incrementar la tendencia en la investigación de segmentación en 3D, de nódulos pulmonares (El-Baz, 2013).

Thresholding:

El éxito de alcanzar la segmentación de un nódulo pulmonar dentro de un volumen de interés dado de antemano, siguiendo el esquema presentado, radica en la obtención de un apropiado umbral Hounsfield, donde un método que permite llegar a ese dato de forma precisa es expuesto en Zhao et al. (Med. Phys 26. (6) (1999) 889). Siempre y cuando el esquema computacional sea el adecuado, el método se ejecutará de forma eficiente, en este caso, se logra completar la tarea en menos de un segundo, realizando una sola lectura del volumen de datos. En contraste con el método sugerido por Zhao (2003), quien trabaja la segmentación en 2D, éste es un método que realiza la segmentación completamente en 3D (Wiemker, 2001).

Messay (2010), plantea un sistema CAD completamente automático, el cual combina umbralización de intensidad y procesamiento morfológico para detectar y segmentar nódulos candidatos simultáneamente. Se extraen un conjunto de 245

(23)

23

características por cada nódulo candidato segmentado, las cuales se emplean posteriormente para clasificarlo como maligno o benigno. Los clasificadores empleados (Clasificador discriminante lineal Fisher y clasificador cuadrático), se comparan y se opta por emplear el primero de ellos. El sistema alcanza un 80.4% de efectividad en la identificación de los nódulos (115 / 143), usando 40 características seleccionadas, con un promedio de 3 falsos positivos por paciente.

Mathematical Morphology:

Kostis (2003), describe métodos tridimensionales para la segmentación, análisis y caracterización de pequeños nódulos pulmonares a partir de imágenes de tomografías computarizadas, empleando algoritmos de segmentación basados en intensidad y operaciones morfológicas, aplicados según el tipo de nódulo presente. El objetivo de estudio es clasificar los nódulos como malignos o no, teniendo como principal características para ello su rata de crecimiento. La consideración más importante al elegir el tamaño del kernel para el algoritmo aplicado a los nódulos fue que el tamaño de los nódulos y los vasos resultaba variable según el modelo aplicado.

Nuevos métodos automatizados para la segmentación de y evaluación de volumen de lesiones (nódulos) pulmonares sólidas fueron propuestas en el presente estudio. Una de las principales características de la segmentación fue la determinación automatizada de una fuerte erosión óptima para la apertura morfológica. En comparación con el procedimiento al separar las paredes del tórax, esto permitió una robusta segmentación, no solo de nódulos pequeños esféricos, sino también de aquellos de forma irregular, de mayor tamaño extensivamente conectados a la paredes pulmonares (Kuhnigk, 2006).

(24)

24 Deformable Models:

“La segmentación de imágenes fue llevada a cabo con un método de contornos activos tridimensional”, señala Way (2006), en la presentación de su trabajo. El modelo de contornos activos 3D, está basado en uno de dos dimensiones, con la adición de tres nuevas componentes de energía para tomar ventaja de la información 3D. “Nuestros resultados preliminares indican que el uso del modelo de CA (Contornos Activos) 3D, y las características de texturas 3D que rodean al nódulo es un enfoque prometedor para la segmentación y clasificación de nódulos pulmonares. Los volúmenes de los nódulos segmentados por dicho modelo correspondían a valores mayores, a los presentados por los radiólogos”.

Farag (2011), indica lo siguiente en su trabajo: Los resultados obtenidos fueron obtenidos principalmente a partir del estudio que se realizó sobre los nódulos juxta-pleurales, el cual posee una forma, donde se produce la flexión máxima dentro del tejido pulmonar que permite máxima curvatura para representar la ubicación del nódulo. La información obtenida corresponde a una técnica automática que detecta un 70% de los nódulos juxta-pleurales. Este es un método automatizado, el cual se apoya en métodos variaciones y modelos geométricos. Para futuras investigaciones, se requiere emplear el método sobre los otros tipos de nódulos para conocer su comportamiento.

Shape Based Methods:

Choi (2014), presente un descriptor de características basado en formas, para detectar nódulos pulmonares en imágenes de tomografías computarizadas. Luego de segmentar el volumen de los pulmones, se identifican os nódulos candidatos,

(25)

25

extrayendo de ellos los descriptores característicos, siendo refinados empleando un método de eliminación de paredes iterativo (wall elimination method), finalmente con un algoritmo clasificador SVM (Support Vector Machine), entrenado se obtienen los nódulos definitivos y los descartados. El rendimiento del sistema propuesto se evaluó sobre una base de datos LIDC (Lung Image Database Consortium). El método reduce significativamente el número de falsos positivos en nódulos candidatos, alcanza un nivel de sensibilidad de un 97.5%, con solo 6.76% de falsos positivos por paciente.

Diciotti (2011), propone un método de corrección automático aplicado a una primera aproximación de la segmentación del nódulo. El método se basa en un análisis local de la forma de la segmentación inicial, empleando mapeo de distancias geodésicas en 3D. El método tiene la ventaja de refinar localmente la segmentación del nódulo a lo largo de la coyuntura con el vaso sanguíneo, sin modificar los bordes. Se probó empleando una segmentación inicial, obtenida al aplicar un método de umbralización. La validación del algoritmo fue realizada únicamente sobre nódulos pequeños. De la base de datos LIDC (Lung Image Database Consortium), se alcanzó una efectividad del 88.5% (139/157).

Graph-Cut:

“Presentamos un nuevo framework que simultáneamente segmenta y registra un pulmón y un tumor en datos seriales de tomografías computarizadas. Nuestro método asume la transformación no rígida para la deformación del pulmón y la rígida estructura del tumor” (Zheng, 2007). Se emplea una transformación no rígida basada en B-Spline, para modelar la deformación del pulmón, mientras que la aplicación de la aplicación rígida sobre el tumor le preserva su volumen y forma.

(26)

26

Para la segmentación se aplica un algoritmo graph-cut 2D sobre el pulmón y tumor.

Watersheds:

Un método watershed mejorado para segmentar y extraer el parénquima pulmonar, para reducir la sobre segmentación éste algoritmo marca crea una marca en primer plano y el fondo. Se hace uso de un operador “Sobel” sobre la detección de bordes, acompañado de morfología matemática con las operaciones de apertura y cierre. Comparado con otros algoritmos watersheds, éste requiere menor complejidad computacional, parámetros más simples y efectivamente reduce la sobre segmentación.

Region growing:

Dehmeshki (2008) plantea un algoritmo para segmentar diferentes tipos de nódulos pulmonares, incluyendo aquellos de altos y bajo contraste, nódulos vascularizados y nódulos cercanos a las paredes de los pulmones o diafragma. El algoritmo lleva a cabo un crecimiento de región (region-growing), esférica, adaptativa, sobre un mapeo de conectividad difusa en el objeto de interés. La región de crecimiento se ejecuta al interior de una máscara volumétrica, creada a partir de una segmentación inicial adaptativa que identifica el frente (primer plano), y fondo en una ventana de cierto tamaño. Se probó sobre 815 nódulos pulmonares, colocando la semilla en puntos aleatorios, para que sea completamente reproducible. Los resultados fueron validados por un radiólogo calificado, el cual aceptó las segmentaciones en un 84%.

(27)

27

Posterior a esta revisión de la literatura se consideró la técnica cuyo trabajo fuese más referenciado por otros investigadores y presentase un método lo suficientemente explícito que permitirá tomar como base para el desarrollo de nuestro algoritmo.

El trabajo de Zhao (2003), resultó cumple con las características requeridas, sin embargo, se optó por tomarlo solo como un soporte, y realizar modificaciones, por lo que no se está trabajando el mismo método propuesto por este autor.

El siguiente capítulo será dedicado a la descripción detallada del método desarrollado en esta investigación.

(28)

28

MÉTODO DE DETECCIÓN DE NÓDULOS PULMONARES BASADO EN LA LOCALIZACIÓN AUTOMÁTICA DE UN UMBRAL.

El algoritmo propuesto en este trabajo está basado en la técnica de umbralización, lo cual requiere que se realicen tareas propias de esa técnica. Sin embargo, Choi (2014) nos dice, éste al igual que cualquier otro método de detección de nódulos pulmonares debe seguir la siguiente estructura:

Figura 6. Flujo fundamental a seguir por los sistemas de detección de nódulos pulmonares.

Siendo específicos, el algoritmo desarrollado en este trabajo se resume según el siguiente esquema:

Figura 7. Estructura del método propuesto e implementado en este trabajo.

Segmentación de Pulmones Detección de Nódulos Reducción de falsos positivos S e g m e n ta c ión d e P u lm o n e s Extracción del

volumen pulmonar por componentes conectados y operaciones morfológicas D e te c c ión d e N ó d u los C a n d ida to s Localización automática de umbral, basada en máximos locales R e d u c c ión d e Fals o s -P o s it iv o s Características geométricas en 2D y 3D para filtrado de regiones y objetos.

(29)

29 SEGMENTACIÓN DE VOLUMEN PULMONAR

La figura 8, resume el proceso llevado a cabo para obtener la separación del volumen pulmonar, del resto de estructuras presente en la imagen TC.

Figura 8. Diagrama de flujo para el algoritmo de segmentación de volumen pulmonar.

La base de la segmentación del volumen pulmonar involucra la eliminación de componentes conectados distintos a los que constituyen el volumen de interés. Se inicia con la obtención de un valor de umbral aplicando el método de Otsu (Otsu, 1975), el cual tiene como objetivo la separación del parénquima pulmonar de otra estructura anatómica en las imágenes TC. Este umbral se aplica a la imagen original (figura 10 (A)). Seguido del proceso de umbralización se aplica la operación morfológica de apertura sobre el volumen, con el objetivo de separar estructuras que estén muy cercanas al borde de las paredes del pulmón.

Los vóxeles que tienen un nivel de intensidad mayor que el umbral obtenido serán reconocidos como pulmones candidatos y se le asignará el valor de 1,

(30)

30

apareciendo ahora en blanco (figura 10 (B)). Cualquier otro vóxel tomará el valor de 0 y aparecerá en color negro (figura 10 (B)). Debido a sus bajos niveles de intensidad, tanto el parénquima pulmonar y el fondo de la imagen serán clasificados como el “pulmón”, en la imagen binaria resultante.

Figura 9. Slice del volumen completo de la imagen TC.

Figura 10. Extracción automática de pulmones en imágenes TC. (A) Imagen original. (B) Imagen umbralizada. (C) Extracción de segundos más grandes componentes conectados. (D) Máscara completa del pulmón. (E) Pulmones extraídos.

(31)

31

Como el parénquima se encuentra aislado del fondo de la imagen por la pared torácica (chest Wall), esta puede ser identificada al extraer los componentes conectados (i.e., vóxeles conectados geométricamente o agrupados, que tiene valor de intensidad 1 (Di Stefano, 1999)). Como la intensidad de los vasos sanguíneos y bronquios en el pulmón difieren, estructuras con intensidades superiores no son agrupadas e impiden una limpieza de la zona pulmonar, creando una máscara incompleta (figura 10 (C)), es por ello que se aplica la operación morfológica de cierre o clausura, y se realiza un relleno de huecos en el volumen, generando así finalmente una máscara completa (figura 10 (D)), lo que permitirá aplicarla sobre la imagen original para extraer el volumen pulmonar (figura 10 (E)).

(32)

32 Resultado final esperado (figura 11).

Teniendo separado el volumen pulmonar, se procede a realizar uno de los procedimientos más significativos del algoritmo, la detección de nódulos candidatos, es decir, se realizará una selección de aquellos objetos que cumplan con ciertas características para ser considerados posibles nódulos.

DETECCIÓN DE NÓDULOS CANDIDATOS

La figura 12, presenta los pasos a seguir para conseguir el objetivo de esta sección, localizar nódulos candidatos.

Figura 12. Diagrama de flujo para el algoritmo de detección de nódulos candidatos

En este paso se desarrolló un algoritmo 3D, basado en el hecho que los vasos sanguíneos, las paredes bronquiales y los nódulos tienen valores de intensidad superiores respecto a las demás estructuras pulmonares presentes en el parénquima pulmonar (Zhao, 2003).

Después de segmentar el volumen pulmonar, tenemos como región de estudio todo lo correspondiente al parénquima y cada una de las estructuras en su interior.

(33)

33 Obtención de primeros objetos

Si se aplica un valor de umbral al volumen pulmonar, igual al máximo valor de intensidad presente en el mismo, el resultado será una imagen completamente vacía, o en su defecto oscura, todos los vóxeles tendrán valor cero. Después de ese valor máximo de intensidad, se comienzan a obtener los primeros objetos, sin embargo, existe un valor en específico de gran interés y es aquel para el cual aparece el primer o primeros objetos que son de mayor o igual volumen al menor volumen de un nódulo dentro del conjunto de entrenamiento.

Tres parámetros (i.e., el paso de umbral (𝑑𝑡), el umbral inicial, que corresponde al máximo valor de intensidad en todo el volumen, y el menor valor estimado que podría presentar un nódulo pulmonar), son empleados en este algoritmo. Todos los parámetros son determinados experimentalmente. En este trabajo se eligió el paso de umbral 𝑑𝑡 = 10 , se realiza el cálculo computacional, el menor tamaño de un nódulo estimado experimentalmente a partir del conjunto de entrenamiento es de 22 vóxeles.

Una vez se alcance el valor que permita encontrar un objeto que sea de mayor o igual tamaño que el menor valor estimado de un nódulo, se detiene el proceso, proporcionándonos el o los objetos y el último valor de umbral.

(34)

34 Localización automática del umbral

Obtener esos objetos del paso anterior, junto con el valor de umbral que permite identificarlos, constituye un ahorro en tiempo de cómputo para el proceso que sigue.

El hecho que los nódulos pulmonares presenten niveles de intensidad significativos respecto a otras estructuras inmersas en el parénquima pulmonar, permite definir la metodología para establecer los que serían llamados nódulos candidatos.

La curva de histograma para el volumen pulmonar, presenta dos picos bien definidos, un primer pico corresponde a todos los vóxeles correspondientes al fondo de la imagen, que se encuentra en negro (intensidad = 0), y el segundo pico que representa la mayor parte constituyente del volumen pulmonar, el parénquima (ver figura 13).

(35)

35

Figura 13. Histograma del volumen pulmonar y umbralización del mismo, seleccionando un umbral a partir del histograma

El parénquima presenta un nivel de intensidad bastante bajo, pero las estructuras contenidas en su interior no, de ahí que se genere la imagen binaria a la derecha, la cual incluye toda la masa del parénquima y las estructuras internas.

Si nos alejamos del pico del histograma en la figura 13, hacia la derecha, es decir, incrementando los niveles de intensidad de la imagen, comienzan a definirse las estructuras que están inmersas en el parénquima.

(36)

36

Figura 14. Histograma del volumen pulmonar e imagen umbralizada del mismo, seleccionando un valor de umbral desplazado hacia la derecha del pico del histograma.

La figura 14, corrobora lo expresado antes, el marcador del umbral (barra vertical en la imagen del histograma) está desplazado hacia la derecha del pico, la imagen resultante al aplicar ese umbral muestra menor número de objetos, respecto a la imagen anterior (figura 13), esto, porque ahora se están considerando estructuras propiamente inmersas al parénquima pulmonar y no a éste como se hizo antes.

Al seguir desplazándonos hacia la derecha en el histograma, se reducirán el número de objetos presentes en la imagen umbralizada resultante (ver figura 15).

(37)

37

Figura 15. Histograma del volumen pulmonar e imagen resultante al aplicar un umbral desplazado una distancia significativa a la derecha del pico del histograma.

El tener menor número de objetos para esos niveles de intensidad superiores, va de la mano con la afirmación proporcionado por Zhao (2003), acerca de los nódulos pulmonares.

En nuestro caso, realizamos el estudio en sentido contrario, es decir, recorremos el histograma de derecha a izquierda, desde un nivel de intensidad en el cual se obtienen los primeros objetos, como se mencionó antes, hacia un nivel de intensidad bajo en el cual inicien a aparecer las estructuras inmersas en el parénquima, sin incluirlo.

Este proceso se realiza descendiendo el nivel de umbral en un valor fijo, el cual para nuestro algoritmo es de 10 unidades.

(38)

38

A partir de ese primer valor de intensidad comienzan a aparecer nuevos objetos, los cuales se solapan a otro u otros del nivel de intensidad anterior (su volumen incrementa de un nivel a otro). Los objetos en un nivel de intensidad que no se solapan con ningún otro objeto del nivel anterior se consideran objetos nuevos para ese nivel de intensidad.

De un nivel a otro la variación de volumen total de los objetos que cumplen con la condición establecida es leve durante un largo rango de niveles de intensidad, sin embargo, existe una zona en el que ese crecimiento parece frenarse, y así los objetos alcanzan por decirlo de alguna manera un equilibrio en su crecimiento.

Para ilustrar lo que se ha venido describiendo sigamos la figura 16, y dentro de ese conjunto de objetos que presenta, aquel encerrado en el óvalo de color rojo.

Luego de ser alcanzado ese equilibrio, ocurre una variación significativa en el crecimiento de los objetos, esto posiblemente porque se ingresa en esa zona mostrada antes en la que se hacen presentes la mayor cantidad de estructuras internas al parénquima (figuras 14 y 15).

En ese rango podría decirse que habitan aquellos objetos ya completamente definidos (alcanzaron su crecimiento completo), cuyo nivel de intensidad sobresale frente a otros.

(39)

39

Figura 16 Secuencia de variación de volumen de objeto hasta alcanzar el equilibrio.

Ahora una vez definido ese espacio de búsqueda, se puede determinar un valor de intensidad con el cual se logre identificar los denominados nódulos candidatos. Para llevar a cabo esta tarea se establecen extremos en la curva de crecimiento de objetos, en el que a la izquierda se tiene el valor de equilibrio mencionado y a la derecha un valor que restrinja el paso de los niveles de umbral a valores demasiado pequeños, los cuales incluirían objetos que no cumplirían con las características mencionadas (masa del parénquima pulmonar).

(40)

40

Gráfico 1. Curva de variación de volumen de los objetos según disminuyen los umbrales en un paso de 10 unidades

Una vez establecido ese intervalo de volúmenes de los objetos (ver gráfico 1), se presenta uno de los principales problemas a resolver durante el desarrollo de este proyecto, la localización del umbral adecuado que identifique la mayor cantidad de objetos completos, independientes, es decir, que hayan alcanzado su crecimiento total y no estén conectados a otras estructuras, debido a la umbralización. Estos objetos detectados por ese umbral serían los llamados nódulos candidatos.

Teniendo un intervalo de volúmenes de los objetos, se procede a estudiar la variación de esos volúmenes en ese subconjunto. Se calculan las diferencias consecutivas entre estos volúmenes, obteniendo una representación como la siguiente:

(41)

41

Gráfico 2. Curva de diferencias entre volúmenes consecutivos.

Basados en las diferencias entre volúmenes consecutivos presentes en el intervalo definido, la idea ahora es realizar un estudio de los máximos locales en estas diferencias, llegando a obtener valores como estos:

(42)

42

Se han considerado los máximos locales puesto que son aquellos valores en los que se puede distinguir un crecimiento significativo, donde se presentan esos saltos mencionados antes, tales que establecen puntos de equilibrio en el volumen de objetos y seguido se genera una variación abrupta, de esta forma esos puntos siguen resaltando la característica de los nódulos, con la cual se ha venido trabajando desde el inicio.

El principal problema en este punto, es lograr definir, cual de esos máximos locales, se genera en el umbral que estamos buscando. Para ellos se consideraron varias opciones, realizar un cálculo del umbral a partir de la selección de uno de esos máximos o un valor relacionado a esos máximos.

Los cálculos realizados o las hipótesis manejadas fueron cinco, el valor medio entre los máximos locales, la mediana, el máximo, el mínimo y el punto medio del vector de máximos.

El cálculo que nos llevó a valores de umbral más adecuado para nuestro objetivo fue el del valor medio, a este resultado se llegó realizando las pruebas de detección con cada una de las operaciones anteriores. En la sección de resultados se podrá ver la explicación para tal elección.

Se selecciona el valor medio del conjunto de máximos locales y realizamos una búsqueda en los conjuntos de datos previos, con tal de llegar a obtener un índice dentro del vector de umbrales asociados a los volúmenes de los objetos dentro del intervalo definido inicialmente. Localizado el valor de umbral en ese conjunto, se aplica al volumen pulmonar inicial y se identifican aquellos objetos considerados nódulos candidatos.

(43)

43

Lo cual nos conduce ahora, a reducir ese número de nódulos candidatos o también denominados falsos positivos, con el fin de llegar a quedarnos exclusivamente con aquellos objetos que son nódulos pulmonares (nódulos verdaderos).

REDUCCIÓN DE FALSOS – POSITIVOS

Tres etapas definidas para lograr el objetivo de esta última fase, inicia con la introducción de los objetos obtenidos en el paso anterior, a una serie de filtros, basados en características geométricas (figura 17).

Figura 17. Diagrama de flujo para el algoritmo de reducción de falsos-positivos, dentro del volumen con los nódulos candidatos.

En las fases anteriores se aplicaron criterios que involucran características relacionadas con los valores de intensidad que pueden presentar los nódulos al interior del volumen pulmonar, respecto a las otras estructuras también presentes. Sin embargo, hace falta tener presente, aquellas características físicas que distinguen a los nódulos. Para efectos prácticos, los nódulos en la mayoría de ocasiones son considerados entre elipsoidales y esféricos (Zhao, 2003), siendo esta la principal característica física a tener en cuenta durante esta etapa. Otros objetos como los vasos sanguíneos, paredes bronquiales, se llegan a considerar alargados de forma tubular.

(44)

44 Reducción 2D

Como se explicó antes, el volumen pulmonar con el cual se trabaja, puede ser manipulado como una colección de capas consecutivas, porciones o slices, de tal manera, se realiza una revisión de cada una de ellas, en las que se aplican condiciones geométricas que filtrarán algunas regiones (bidimensionales).

Se manejan dos criterios para filtrar regiones en los slices: El criterio del área, y el criterio de la excentricidad.

Recordemos que un nódulo es un objeto tridimensional, pero puede ser representado por medio de particiones bidimensionales, en las que se llegan a obtener tales mediciones.

Criterio del área

A partir de un conjunto de nódulos ya segmentados, el cual se ha denominado conjunto de entrenamiento, se han realizado mediciones de los valores máximos y mínimos de las regiones planas que constituyen a un nódulo pulmonar.

Ésta área corresponde al número de píxeles con valor de intensidad 1 en la región. La condición de restricción es la siguiente:

𝐴𝑀𝐴𝑋 = 72 𝐴𝑀𝐼𝑁 = 6

Valor de área máxima (AMAX) y valor de área mínima (AMIN).

Así todos aquellas regiones que no se encuentren dentro de esos límites, deben ser eliminadas (se les asigna valor de píxel 0) del volumen.

(45)

45 Criterio de la excentricidad 2D

Antes se comentó que los nódulos se aproximas bastante a una geometría esférica, o elipsoidal en la mayoría de los casos, esto nos permite considerar el hecho que si tomamos ese objeto y lo seccionamos en slices (porciones), se tendrán regiones bidimensionales con forma circular o elípticas y como la geometría nos dice que un círculo corresponde a un caso particular de una elipse en el que los semiejes tienen igual longitud, podemos pensar que las regiones planas de los nódulos y de los distintos objetos en general son elipses (figura 18).

Atendiendo al supuesto anterior, se procedió con la respectiva medición de la excentricidad de cada una de esas elipses, donde la excentricidad no es más un cociente entre las longitudes de los semiejes.

Figura 18. Representación de elipse en regiones planas3

Del conjunto de entrenamiento se midieron las excentricidades de las distintas regiones planas en cada nódulo y luego se determinó el máximo valor de excentricidad y el mínimo.

La excentricidad es una medida que oscila entre 0 y 1, indicando la forma que toma la elipse, es decir, si el valor de excentricidad es más cercano a 0, la elipse tiende a ser un círculo, pero si el valor de excentricidad es más cercano a 1, la

(46)

46

elipse tiende a ser un segmento (línea), lo que resulta bastante útil porque nos apoyamos en ese hecho para eliminar regiones alargadas.

El criterio de excentricidad que se maneja es el siguiente:

𝐸𝑀𝐴𝑋 = 0.9276

𝐸𝑀𝐼𝑁 = 0.3695

Las regiones planas que no se encuentren dentro de los límites de excentricidad 2D, serán eliminadas (se les asignará valor de intensidad 0), del volumen pulmonar.

Eliminación de regiones lineales

Dentro de las posibles regiones que se pueden encontrar durante el proceso de filtrado, se tienen aquellas que se presentan como segmentos lineales, o formas geométricas que contienen segmentos, para la reducción de estos segmentos, uno de los criterios a tener en cuenta es el de la excentricidad en 2D, que se explicó antes, ahora en este criterio se tendrá como evaluador una función implementada con la finalidad de eliminar ciertas regiones específicas.

(47)

47 Reducción 3D

En este proceso de filtrado si se tratarán los objetos en su forma natural, es decir, como objetos tridimensionales.

Se manejan tres criterios:

Criterio del volumen

Se realizaron mediciones del volumen en cada uno de los nódulos de entrenamiento, lo que determina el siguiente criterio.

𝑉𝑀𝐴𝑋 = 180 𝑉𝑀𝐼𝑁 = 20

Los objetos que no se encuentren dentro de los límites de volumen, serán eliminados. Este volumen se mide en número de vóxeles.

Criterio de excentricidad 3D

De forma similar como se explicó en el criterio de excentricidad 2D, este caso mide la excentricidad ya no de una elipse sino de un objeto tipo elipsoide,

Antes se medía la excentricidad en el plano xy, por ser una región plana, ahora se medirán dos valores de excentricidad, primero asumiendo que los semiejes se encuentren en el plano xy, sin identificar cual está en cual plano, y luego ese valor de excentricidad en el que uno de los semiejes atraviese el volumen del objeto en el eje z, y el otro semieje, se encuentre en x o y.

(48)

48 Los límites obtenidos son:

𝐸𝑀𝐴𝑋3𝐷 = 0.9 𝐸𝑀𝐼𝑁3𝐷 = 0.6 Criterio de la profundidad

Cada nódulo se divide en porciones y cada una constituye una región plana, ubicada en una posición distinta del eje z, el número de porciones (slices) que le corresponden al nódulo es la medida que se denomina profundidad del objeto.

Las medidas límites establecidas para este criterio son:

𝐸𝑍𝑀𝐴𝑋 = 0.9367 𝐸𝑍𝑀𝐼𝑁 = 0.7385

Igual que en los criterios anteriores, si el objeto no se encuentra dentro de los límites, será eliminado del volumen.

De esta manera se establece un método para reducir falsos-positivos, sin embargo, la realización de reducción 3D seguido de reducción 2D no conduce a resultados muy favorables, y es por ello que se opta por realizar un segundo filtrado, pero ahora invirtiendo el orden, es decir, primero reducción 2D seguido de reducción 3D.

Esta decisión se toma luego de realizar experimentos correspondientes que permitieran evaluar los resultados para cada tipo de filtrado (sencillo y doble). En la sección de resultados se aclaran dudas al respecto.

(49)

49

EVALUACIÓN DEL ALGORITMO DE DETECCIÓN DE NÓDULOS PULMONARES

IMÁGENES DE TOMOGRAFÍA UTILIZADAS

Para la realización de este trabajo fueron seleccionados 16 casos de estudio, los cuales incluyen 35 nódulos, contando con su localización y una segmentación manual (ground-truth), por cada caso. Estos nódulos conocidos, corresponden a la totalidad de nódulos presentes en cada uno de sus casos.

A este conjunto de nódulos conocidos, se les denominará a partir de este momento, conjunto de entrenamiento del algoritmo.

Apoyándonos en las características mencionadas en la sección “Imágenes de Tomografía Computarizada”, se seleccionaron dos bases de datos, la primera proporcionándonos imágenes de tipo TCMC y la segunda de tipo TCBD (pág 12). El algoritmo de segmentación propuesto se aplicó sobre (2) imágenes TCMC y (14) imágenes TCBD. A continuación, se presentan algunos detalles de las bases de datos.

(50)

50

Base de Datos: SPIE-AAPM Lung CT Challenge Estadísticas de la Colección Modalidad CT Número de Pacientes 70 Número de Estudios 70 Número de Series 70 Número de Imágenes 22,489 Tamaño de Imágenes (GB) 12.1

Tabla 1. Estadísticas de la colección proporcionada

La tabla 3 proporciona información del tipo de modalidad, tipo de pacientes y número de imágenes contenidos en esta base de datos. Esta base de datos proporciona un conjunto de 10 imágenes de entrenamiento y 60 para pruebas. Las imágenes de entrenamiento presentan las coordenadas aproximadas de la localización del centroide del nódulo (Samuel, 2015). Las imágenes contenidas en la base de datos presentan las características mencionadas en la Tabla 2.

Características de Imágenes

Formato DICOM

Ancho 512

Alto 512

Profundidad de Bit 12

Tipo de Color Escala de grises Espaciado entre Píxeles 0.7070 , 0.7070

Tabla 2. Características de las imágenes proporcionadas en la colección: SPIE-AAPM Lung CT Challenge

Es importante aclarar que esta base de datos fue acondicionada con la finalidad de ser empleada en la elaboración de sistemas de diagnósticos de nódulos

(51)

51

pulmonares, sin embargo, como se ve en la descripción, cuenta con la información necesaria para nuestro propósito.

Base de Datos: ELCAP Public Lung Image

La base de datos actualmente consiste de un conjunto de 50 imágenes de tomografía computarizadas de baja dosis de radiación (NLST, 2011), de pulmón completo, documentadas. Los slices tienen 1.25 mm de grosor. Se proporcionan la localización de los nódulos detectados por radiólogos.

Las imágenes de esta base de datos presentan las siguientes características consignadas en la tabla 5. Características de Imágenes Formato DICOM Ancho 512 Alto 512 Profundidad de Bit 16

Tipo de Color Escala de grises Espaciado entre Píxeles 0.7070 , 0.7070

Tabla 3. Características de las imágenes proporcionadas en la colección: ELCAP Public Lung Image

La base de datos puede ser accedida con la url:

http://www.via.cornell.edu/lungdb.html, The whole-lung data set (version 1.0, released December 20, 2003).

(52)

52

CUANTIFICACIÓN DEL ERROR DE SEGMENTACIÓN

Para tener una cuantificación comprensiva del error relativo de segmentación respecto a los ground truths, se decidió emplear una métrica de error, el coeficiente de Dice.

Dados 𝐺, 𝑆 ⊂ ℝ3 , denotan el conjunto de puntos de la segmentación ground truth, y la segmentación computada, respectivamente. Se define el coeficiente de Dice así (Kohlberger, 2012):

𝐸𝐷 = 2|𝑆 ⋂ 𝐺| (|𝑆| + |𝐺|)

Asigna 1 a una segmentación perfecta y 0 a una completamente errónea. En las segmentaciones 𝑆 y 𝐺 son representados por superficies.

Esta medida fue desarrollada independientemente por los botánicos Thorval Sørensen (Sørensen, 1948) y Lee Raymond Dice (Dice, 1945), por lo que también se conoce como coeficiente de Sørensen-Dice (tal como será mencionada posteriormente en la presentación de resultados).

En la expresión anterior se determina cuantitativamente la similitud entre los dos conjuntos a comparar (S y G), estableciendo una relación de la abundancia de vóxeles compartidos por las segmentaciones con la abundancia total en ambas muestras.

(53)

53 IMPLEMENTACIÓN DEL MÉTODO

El algoritmo de detección de nódulos pulmonares propuesto fue implementado computacionalmente, empleando el Sistema de Computación Científica Matlab en su versión 8.4 (Matlab, 2014), siendo puesto en ejecución en una computadora con las siguientes características.

Característica Estado

Procesador AMD Athlon II Dual-Core P340 Memoria RAM 3 GB

Disco Duro 320 GB

SO Linux - Ubuntu x64 14.04.1

Tabla 4. Características de la máquina en la que se ejecutó el algoritmo de detección de nódulos pulmonares.

Los casos de estudio fueron seleccionados aleatoriamente, contando con la posibilidad de tener entre 1-4 nódulos (Tabla 4).

Caso Número de Cortes Número de Nódulos Identificados

1 285 1 2 251 1 3 265 3 4 253 2 5 253 3 6 243 1 7 263 1 8 241 3 9 220 2 10 229 2

(54)

54 11 227 1 12 249 4 13 244 4 14 231 2 15 276 3 16 249 2

Tabla 5. Casos de estudio, para prueba del algoritmo de detección de nódulos pulmonares, en imágenes de tomografía computarizada (TC).

Un total de 16 casos y 35 nódulos identificados, tomados como muestras para la evaluación del algoritmo.

Los experimentos realizados para obtener los distintos resultados fueron enfocados en dos categorías. Los resultados obtenidos de los experimentos que permitieron definir procedimientos del algoritmo (Evaluación para definir procedimientos) y los resultados propios de la evaluación del método de detección de nódulos pulmonares. Se cuenta con las segmentaciones manuales (ground truth), segmentaciones automáticas y los objetos detectados luego del filtrado, denominados nódulos pulmonares.

La evaluación completa del algoritmo se enfoca en estos dos aspectos:

 Comparación de la segmentación manual con la segmentación automática de nódulos conocidos.

 Comparación de segmentación manual con total de nódulos detectados automáticamente.

(55)

55 Evaluación para definir procedimientos

En la sección “Detección de Nódulos Candidatos” (pág 35), se eligió el valor promedio de los máximos locales en la curva de diferencia de volúmenes como operación que permite localizar automáticamente el umbral buscado. El experimento llevado a cabo para tomar esa decisión consistió en realizar el cálculo del valor de umbral empleando cinco operaciones: valor medio, mediana, máximo, mínimo, punto medio, de los máximos locales de las diferencias de volúmenes en un intervalo definido. Se obtuvieron nódulos candidatos para cada caso, los cuales se sometieron al filtrado, obteniendo un total de nódulos detectados para cada uno de ellos.

Con esta información se realiza la evaluación siguiendo la medida establecida (coeficiente de Sorensen-Dice).

El gráfico 4 muestra los valores de coeficiente Sorensen-Dice, obtenidos al comparar las segmentaciones manuales con la segmentación de los nódulos verdaderos obtenida automáticamente, luego de aplicar el umbral localizando empleando cada una de las operaciones mencionadas.

(56)

56

Gráfico 4. Coeficiente de Sorensen-Dice para la comparación de la segmentación manual contra la automática, en cada una de las operaciones (media, mediana, máximo, mínimo, punto medio).

Las barras de color azul corresponden a los resultados de la operación valor medio, sobresaliendo ante los demás, alcanzando en la mayoría sino en todos los casos un valor muy cercano a 1.

Operación Valor de Coeficiente Sorensen-Dice

Media 0.8979

Mediana 0.4069

Máximo 0.4805

Mínimo 0.3687

Punto Medio 0.5560

Tabla 6. Valores medio de coeficiente Sorensen-Dice para cada operación propuesta para la localización del umbral en la detección de nódulos candidatos.

(57)

57

El umbral obtenido por el valor medio de los máximos locales en las diferencias de volúmenes para un intervalo definido, resulta ser favorable para el objetivo que se busca con el algoritmo.

El siguiente criterio a definir corresponde a la realización del filtrado de falsos-positivos.

Inicialmente se realizaron filtrados siguiendo cada uno de los criterios explicados, en el orden establecido, primero la reducción 2D, luego reducción 3D, sin embargo, posteriormente se llevaron a cabo pruebas, en las que se realizó un doble filtrado, invirtiendo el segundo, esto es, se realizan reducción 2D seguido de reducción 3D, luego reducción 3D, seguido de reducción 2D. Esto porque se notaron residuos del primer filtrado que no corresponden a objetos sólidos, los cuales pudiesen considerarse nódulos pulmonares, pero cuando se realiza el doble filtrado, además de reducir el número de nódulos detectados, se encuentra que esos objetos, son sólidos y bien definidos.

La evaluación que permite determinar cómo se llevaría a cabo el filtrado estuvo basada también en la medida acordada, obteniendo los siguientes resultados.

(58)

58

Gráfico 5. Coeficiente Sorensen-Dice de la segmentación manual contra nódulos detectados automáticamente, variando el método de filtrado (filtrado sencillo, filtrado doble).

Tipo de Filtrado Coeficiente Sorensen-Dice Filtrado Sencillo 0.0429

Filtrado Doble 0.2828

Tabla 7. Valor de coeficiente Sorensen-Dice promedio para cada tipo de filtrado.

Según el resultado obtenido, el filtrado doble sería más adecuado, su evaluación no es muy sobresaliente, pero aun así, supera en gran magnitud la del filtrado sencillo y esto es favorable para el método, aunque aún no esté dicho todo.

Tipo de Filtrado Coeficiente Sorensen-Dice Filtrado Sencillo 0.9245

Filtrado Doble 0.8979

Tabla 8. . Valor de coeficiente Sorensen-Dice promedio para cada tipo de filtrado, a partir de la comparación de segmentación manual y segmentación automática.

(59)

59

La Tabla 8, en principio indica que aun siendo un poco menor el coeficiente Sorensen-Dice para el filtrado doble, su diferencia respecto al mismo en el filtrado simple, no es grande, lo cual indica que aun en el filtrado doble, la segmentación es muy buena, sin embargo, como ya se vio el resultado de la detección de nódulos luego del filtrado presenta mayor favorabilidad empleando filtrado doble.

Por lo tanto la decisión, es emplear el filtrado doble, como ya se había expresado en la sección correspondiente.

Evaluación del Algoritmo de Detección de Nódulos Pulmonares

El algoritmo se ajustó a los métodos inmediatamente definidos teniendo así los siguientes resultados:

El valor medio de nódulos candidatos obtenidos entre todos los casos es de 12380 nódulos, y el de los nódulos detectados luego de la reducción de falsos-positivos es de 19, alcanzando un 99% en la reducción (Tabla 8), aun así la reducción no fue del todo exitosa, más adelante se entenderá esta situación.

Caso Nódulos Candidatos Nódulos Detectados

1 1839 6 2 2412 4 3 2661 19 4 3630 32 5 3288 20 6 3652 25 7 3045 17

Referencias

Documento similar

Como medida de precaución, puesto que talidomida se encuentra en el semen, todos los pacientes varones deben usar preservativos durante el tratamiento, durante la interrupción

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos

Entre nosotros anda un escritor de cosas de filología, paisano de Costa, que no deja de tener ingenio y garbo; pero cuyas obras tienen de todo menos de ciencia, y aun

por unidad de tiempo (throughput) en estado estacionario de las transiciones.. de una red de Petri

o Si dispone en su establecimiento de alguna silla de ruedas Jazz S50 o 708D cuyo nº de serie figura en el anexo 1 de esta nota informativa, consulte la nota de aviso de la

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que

Las manifestaciones musicales y su organización institucional a lo largo de los siglos XVI al XVIII son aspectos poco conocidos de la cultura alicantina. Analizar el alcance y