Diseño e implementación de un módulo para la anotación de imágenes médicas

(1)

Trabajo de Fin de Grado

Dise˜

no e implementaci´

on de un m´

odulo para la

anotaci´

on de im´

agenes m´edicas

Isaac S´

anchez Ruiz (s10m024),

Grado en Matem´

aticas e Inform´

atica,

Escuela T´

ecnica Superior de Ingenieros Inform´

aticos (ETSIINF),

Universidad Polit´

ecnica de Madrid

(2)

´

_{Indice general}

1. Introducci´on 1

2. Objetivos 6

2.1. Visi´on general del proyecto . . . 6

2.2. Objetivos espec´ıficos de este proyecto de Fin de Grado . . . 8

3. Estado del arte 10 3.1. Conceptos previos . . . 10

3.1.1. Segmentaci´on de im´agenes . . . 10

3.1.2. Proceso de segmentaci´on . . . 12

3.1.3. Caracter´ısticas de las im´agenes PET y CT . . . 13

3.2. T´ecnicas principales de segmentaci´on . . . 18

3.3. Segmentaci´on manual y semiautom´atica . . . 26

3.4. Segmentaci´on autom´atica . . . 28

3.4.1. T´ecnicas de umbralizaci´on . . . 29

3.4.2. T´ecnicas de multiumbralizaci´on . . . 37

4. Metodolog´ıa 40 4.1. T´ecnicas escogidas . . . 40

4.1.1. Umbralizaci´on de Otsu . . . 42

4.1.2. Umbralizaci´on de Ridler-Calvard . . . 45

4.1.3. Umbral fijo de Paulino . . . 46

4.1.4. Umbralizaci´on fija de Erdi . . . 47

4.2. Descripci´on del material de prueba . . . 48

4.2.1. Formato de las im´agenes PET . . . 48

4.2.2. Caracter´ısticas de los pacientes . . . 49

4.3. M´etodos de evaluaci´on . . . 53

5. Resultados 56

(3)

´

_{Indice de figuras}

2.1. Esquema de la visi´on general del proyecto . . . 7

3.1. Ejemplo de imagen CT de t´orax . . . 13

3.2. Ejemplo de imagen PET de paciente con c´ancer de pulm´on . . . 14

3.3. Aplicaci´on de visualizaci´on PET-CT [5] . . . 16

3.4. Ejemplo de h´ıbrido PET-CT 3D . . . 17

3.5. Ejemplo de regi´on sin detectar en CT pero visible en PET [5] . . . 18

3.6. Proceso descrito dehill climbing [1] . . . 22

3.7. Ejemplo de algoritmo de Watershed descrito [1] . . . 23

3.8. (A) imagen original, (B) tras aplicar el operador Sobel, (C y D) tras umbralizar con distintos umbrales [1] . . . 24

3.9. Diferencias en 3 tumores distintos entre varios observadores indicado mediante contornos azules [12] . . . 27

3.10. Diferentes resultados obtenidos en el mismo paciente entre distintas se-millas iniciales (slices 79-85) [8] . . . 28

3.11. Ejemplos de im´agenes umbralizadas en NDT [20] y binarizaci´on de do-cumentos . . . 33

3.12. Esferas 1, 3 y 5 en ambos esc´aneres y los niveles de contraste [17] . . . 34

3.13. Medida de rendimiento de las 12 t´ecnicas probadas [17] . . . 35

4.1. Ejemplos de histogramas bimodales . . . 43

4.2. Segmentaci´on inicial [18] . . . 45

4.3. Esquema del algoritmo de Ridler [18] . . . 46

4.4. Vol´umenes 1 (rojo), 2 (amarillo) e intersecci´on (verde) . . . 51

4.5. Vol´umenes 5 y 6 . . . 51

4.6. Reconstrucci´on 3D de las im´agenes PET . . . 52

5.1. Resultados en varios pacientes . . . 64

(4)

´

_{Indice de cuadros}

4.1. Tabla de SUV m´aximo . . . 49

4.2. Tabla de slices afectados de los pacientes . . . 50

5.1. Umbrales obtenidos con cada t´ecnica sobre el SUV . . . 56

5.2. Resultados de evaluaci´on usando la t´ecnica de Otsu . . . 58

5.3. Evaluaci´on de casos especiales usando Otsu . . . 58

5.4. Resultados de evaluaci´on usando la t´ecnica de Ridler . . . 59

5.5. Evaluaci´on de casos especiales usando Ridler . . . 59

5.6. Resultados de evaluaci´on usando la t´ecnica de Paulino . . . 60

5.7. Evaluaci´on de casos especiales usando Paulino . . . 60

5.8. Resultados de evaluaci´on usando la t´ecnica de Erdi . . . 61

5.9. Evaluaci´on de casos especiales usando Erdi . . . 61

(5)

Resumen

Desde hace tiempo ha habido mucho interés en la automatización de todo tipo de tareas en las que la intervención humana es esencial para que sean completadas con éxito. Esto es de especial interés si además se necesita de personal muy cualificado para ciertas tareas que pueden ser perfectamente reproducibles y, o bien requieren mucha formación, o bien consumen mucho tiempo.

Este proyecto está dirigido a la búsqueda de métodos para automatizar la anotación de imágenes médicas. En concreto, se centra en el apartado de delimitación de las regiones de interés (ROIs) en imágenes de tipo PET siendo éstas usadas con frecuencia junto con las imágenes de tipo CT en el campo de oncolog´ıa para delinear volúmenes afectados por cáncer.

Se pretende con esto ayudar a los hospitales a organizar y estructurar las imágenes de sus pacientes y relacionarlas con las notas cl´ınicas. Esto es lo que llamaremos el proceso de anotación de imágenes y la integración con la anotación de notas cl´ınicas respectivamente.

En este documento nos vamos a centrar en describir cu´ales eran los objetivos ini-ciales, los pasos dados para su consecuci´on y las dificultades encontradas durante el proceso.

De todas las técnicas existentes en la literatura, se han elegido 4 técnicas de segmen-tación, 2 de ellas probadas en pacientes reales y las otras 2 probadas sólo enphantoms

(6)

Abstract

For a long period of time, there has been an increasing interest in automation of tasks where human intervention is needed in order to succeed. This interest is even greater if those tasks must be solved by qualified specialists in the area and the task is reproducible or if the task is too time consuming.

The main objective of this project is to find methods which can help to automate medical image annotation processes. In our specific case, we are willing to delineate regions of interest (ROIs) in PET images which are frequently used simultaneaously with CT images in oncology to determine those volumes that are affected by cancer.

With this process we want to help hospitals organize and structure the images they have from their patient studies and to relate these images to the corpus annotations. We may call this the image annotation process and the integration with the corpus annotation respectively.

In this document we are going to concentrate in the description of the initial ob-jectives, the steps we had to go through and the difficulties we had to face during this process.

From all existing techniques in the literature, 4 segmentation techniques have been chosen, 2 of them were tested in real patients and the other 2 were tested usingphantoms

(7)

Cap´ıtulo 1

Introducci´

on

En la actualidad, el uso de imágenes médicas está muy extendido en el campo de la oncolog´ıa. El uso de imágenes en el diagnóstico y tratamiento de cáncer ayuda a los especialistas a llevar a cabo sus tareas de forma más rápida. Esto es vital en el diagnóstico de pacientes que puedan padecer cáncer ya que la detección temprana de esta enfermedad puede ayudar a llevar a cabo un tratamiento rápido y en consecuencia, reducir los daños que pueda causar e incluso evitar el fallecimiento del paciente.

Las técnicas de obtención de imágenes y los distintos tipos de imágenes médicas que se usan en la actualidad es muy variado. Cada técnica proporciona un tipo de imágenes con caracter´ısticas distintas. Por su naturaleza, ciertas caracter´ısticas se adaptan mejor a ciertos tipos de problemas y, por tanto, el uso de las técnicas está más extendido en unas áreas dentro de oncolog´ıa que en otras.

De las regiones cancer´ıgenas detectadas en las imágenes, se suelen extraer importan-tes datos como la forma, el volumen, la actividad metabólica y la estructura de dicho volumen. La correcta extracción de estos datos depende en mayor o menor medida del tipo de imagen que se esté utilizando.

Por esta razón, la combinación de la información contenida en distintas imágenes es una tendencia cada vez más popular. As´ı, se pretende aprovechar las ventajas que proporcionan los diversos tipos de imágenes y superar, al ser posible, las restricciones que tiene el uso de una sola técnica.

(8)

también existe otra técnica para obtener imágenes que hace uso de ondas acústicas. Esta técnica se conoce como ultrasonido y suele tener aplicación en el diagnóstico de cáncer de mama, próstata y fibrosis del h´ıgado [6]. También son comunes las imágenes de resonancia magnética (MRI) las cuales se usan para detectar cáncer, para estudiar la respuesta a terapia y guiar la terapia de forma m´ınimamente invasiva, entre otros.

Las caracter´ısticas de las imágenes obtenidas a partir de la radiación electromagn´ eti-ca var´ıan dependiendo de la frecuencia de la onda electromagnética. En el espectro de baja frecuencia (entre radiofrecuencia y luz visible), se encuentran técnicas de ob-tención de imágenes como tomograf´ıas cerca del infrarrojo (NIR), imágenes termo- y foto-acústicas; y tomograf´ıa de impedancia eléctrica (EIT). Si bien este tipo de imagen es de utilidad, no son tan comunes como las imágenes de mayor frecuencia ni como las de ultrasonidos, que han sido mencionadas en el párrafo anterior.

Entre las imágenes de alta frecuencia y las de baja frecuencia, se encuentran las imágenes generadas mediante luz visible. Éstas se conocen como imágenes de tipo óptico y han quedado limitadas al uso en endoscopias, catéteres e imágenes superficiales [6].

Por último, las imágenes de alta frecuencia (por encima de la frecuencia del ul-travioleta) son muy comunes y son las que se consideran de tipo ionizante. Imágenes de este tipo son las imágenes basadas en rayos X, las imágenes de medicina nuclear y aquéllas basadas en emisión de positrones (PET). De todos estos tipos de imágenes existen diversos derivados que tienen utilidad en diferentes áreas. Este tipo de imágenes son las que se usan en este trabajo, concretamente las imágenes de tipo PET.

Todas las imágenes que hacen uso de radiación de baja frecuencia y aquéllas que hacen uso del espectro de luz visible, se dice que usan radiación no ionizante, es decir, que la radiación emitida no es capaz de liberar electrones de átomos y moléculas, por lo que se dice que no los ioniza. La radiación ionizante supone un peligro para el paciente puesto que puede destruir y llegar a generar cáncer en tejidos sanos tras un largo per´ıodo de exposición a una fuente de radiación ionizante.

Por otro lado, se están haciendo avances usando distintos tipos de marcadores que parecen prometedores para identificar tumores cancer´ıgenos. Últimamente, ha aumen-tado el uso de marcadores en las imágenes médicas para resaltar y mostrar los efectos del metabolismo, la proliferación y migración de células entre otros [6].

Con esto, hemos introducido los tipos básicos de imágenes y su capacidad, centr´ ando-nos ahora en las imágenes de tipo CT, de PET y, posteriormente, el h´ıbrido PET-CT.

(9)

imágenes que utilizan rayos X. Sin embargo, son distintos de las pruebas de rayos X a las que estamos acostumbrados en casos comunes de traumatismo tales como fracturas o fisuras de huesos. La diferencia reside en que las imágenes CT no son planas, suelen ser tridimensionales o incluso cuatro-dimensionales. Los casos cuatro dimensionales son aquellos en los que se incluye la dimensión del tiempo. Se utiliza en casos en los que haya que observar el comportamiento del tumor tal y como sucede en pacientes con cáncer de pulmón. En estos casos, permite a los especialistas observar el tumor durante todo el ciclo de respiración del paciente. Este tipo de imágenes se conocen como imágenes

anat´omicas debido a su naturaleza tal y como sucede con las im´agenes de rayos X.

Las imágenes de tipo CT se pueden tomar principalmente con dos tipos de escáneres: el c-arm CT que está basado en un brazo que gira alrededor del paciente obteniendo va-rias imágenes desde distintas perspectivas para la reconstrucción 3D [14]; y el multi-slice CT que se basa en grandes áreas de detectores usando tubos de rayos X de alta poten-cia, de esta forma se pueden cubrir grandes volúmenes de tórax y abdomen mientras el paciente aguanta la respiración. También se ha utilizado éste último para escanear el cerebro [6].

Las técnicas de CAD (Computer Aided Diagnostics) usando imágenes CT se han extendido sobre todo para cáncer de pulmón y de colon. En los casos de cáncer de pulmón se identifican a menudo nódulos sanos de los pulmones como cancer´ıgenos. Esto sucede porque el 50 % de las ocasiones, los nódulos son tumores benignos y son casi indistinguibles en CT [6].

En resumen, las imágenes CT tienen el beneficio de las imágenes de rayos X, es decir, una muy alta resolución debido a su naturaleza, pero tienen muy poca sensibilidad y como hemos visto antes, son de tipo ionizante. Y en este tipo de imágenes, los tejidos blandos tienden a ser dif´ıciles de distinguir los unos de los otros tal y como sucede en los nódulos pulmonares.

En cuanto a las im´agenes PET (Positron-Emission Tomography), es un tipo de tomograf´ıa que se obtiene tras haber emitido positrones mediante radioisotopos como

18_F, 11_{C y} 68_{Ga entre otros. El que se utiliza normalmente es el} 18_{F. De hecho, s´}_olo

hay dos marcadores aprobados y ambos hacen uso del 18F. ´Estos son el 18F-FDG que contiene glucosa y se puede usar para marcar el metabolismo; y el 18_F-NaF

2 que se

utiliza para ser incorporado en los huesos [6]. Este tipo de imágenes se clasifican como imágenes metabólicas.

(10)

tumores como medida de la evolución de la enfermedad era inadecuado ya que sólo puede mostrar un retraso en la respuesta a la terapia y no da indicaciones sobre el metabolismo y otros parámetros. Ésta es la principal razón del uso de los marcadores en este tipo de imágenes [6].

En este trabajo, nos vamos a centrar en imágenes de FDG PET, que usan el primer marcador. Este marcador destacará los tumores malignos en la imagen ya que éstos tienden a tener un metabolismo mucho mayor que el de los demás tipos de tejidos. Por tanto, cuando las células cancer´ıgenas consumen el FDG de la sustancia y hay una mayor concentración del radioisótopo 18_{F en dicha zona. ´}_{Este emite positrones que}

son detectados por el esc´aner y as´ı se acaba generando la imagen con mayor brillo o intensidad en torno a esa zona.

Las principales aplicaciones de las imágenes PET incluyen diagnóstico del tumor, estadificación1, detección de reca´ıda, seguimiento y evaluación de respuesta ante la terapia [17]. Las zonas del cuerpo donde las imágenes PET no son útiles son aquéllas ´

areas donde existe una concentración del marcador que no se corresponde con un tumor maligno. Estas áreas comprenden el cerebro, que siempre tiene un metabolismo alto; los riñones, la próstata y la vejiga [6].

En radioterapia, es muy importante conocer la extensión de los tumores malignos y para ello es necesario conocer el volumen de estos tumores. El volumen se puede determinar usando imágenes de tipo PET. El procedimiento incluye la delineación de la zona afectada por parte de un experto y del resultado obtenido, se obtiene el volu-men estimado del tumor. Los volúmenes afectados se conocen como regiones de interés (ROIs) aunque este término se usa también en otras áreas de medicina [17].

Debido a la naturaleza de las imágenes PET, la tarea de delineación manual no es tan sencilla como pueda ser esa misma tarea en otro tipo de volúmenes en CT tal y como sucede con la distinción de huesos y tejidos blandos. Esto se debe a que la resolución espacial de las imágenes PET y el nivel de ruido es relativamente mayor que el existente en las imágenes CT. Por tanto, la determinación precisa de la zona cancer´ıgena y la no cancer´ıgena es una tarea complicada.

Por este motivo, la combinación de imágenes PET y CT es una buena alternativa en el sentido de que se pueden combinar las ventajas de ambos tipos de imágenes. Estas ventajas son la sensibilidad de las imágenes PET usando el marcador 18_F-FDG

para la correcta evaluación del progreso del tumor cancer´ıgeno y la resolución espacial que proporcionan las imágenes CT. As´ı las tareas de diagnosis y prognosis se pueden

(11)

realizar con mayor precisi´on.

Este tipo de imagen se conoce como PET-CT y se consigue realizando las pruebas de PET y CT al mismo tiempo sobre el paciente de forma que no haya variaciones entre ambos tipos de imágenes. Si no se hiciesen simultáneamente, se correr´ıa un alto riesgo de que las dos imágenes no quedasen alineadas y carecer´ıa de sentido combinarlas.

A lo largo de este documento, se revisarán las técnicas encontradas en diversos art´ıculos para delinear las regiones de interés de las imágenes PET, es decir, los vol´ ume-nes afectados por cáncer. Esta revisión se hará en el cap´ıtulo 3 del estado del arte.

En el cap´ıtulo 4 de metodolog´ıa, se procederá a describir las técnicas escogidas para realizar las pruebas de delineación en los pacientes de los que se dispone para este proyecto as´ı como la descripción de las caracter´ısticas del material de prueba.

(12)

Cap´ıtulo 2

Objetivos

2.1. Visi´

on general del proyecto

Este proyecto Fin de Grado se enmarca en uno de los proyectos de investigación que se están desarrollando en el Laboratorio de Análisis de Datos y Simulación (MIDAS) del Centro de Tecnolog´ıa Biomédica de la UPM. El objetivo de este proyecto es la anotación de imágenes médicas junto con la anotación de notas cl´ınicas.

El objetivo general de dicho proyecto es conseguir una herramienta que pueda ayudar a los médicos de los hospitales actuales y, por tanto, con el material actual; a estructurar, la información electrónica disponible de los pacientes de manera automática, para su posterior almacenamiento y consulta. Esta herramienta o herramientas están idealmente compuestas de varios módulos que deber´ıan ser capaces de coordinarse entre s´ı para conseguir el objetivo anterior.

El proyecto consta entonces de las siguientes partes desde un punto de vista general:

Anotaci´on de im´agenes

• Delineaci´on de las regiones de inter´es (ROI)

◦ Delineación a baja resolución espacial usando imágenes PET

◦ Delineación a alta resolución espacial usando imágenes CT a partir de lo obtenido en PET

(13)

• Anotaci´on de las ROI

◦ Asignaci´on de posici´on relativa de cada ROI en el cuerpo

◦ Caracterizaci´on de cada ROI en base a los resultados obtenidos con cada m´odulo

• Integración con el módulo de anotación de notas cl´ınicas

Anotaci´on de notas cl´ınicas

• An´alisis de las notas cl´ınicas del paciente/s

◦ Clasificaci´on de las partes del texto analizadas en base a algoritmos de aprendizaje entrenados con notas anteriores

◦ Continuaci´on de dicho entrenamiento para perfeccionar el modelo

• Estructuraci´on de los datos en una base de datos

En la siguiente (figura 2.1) se puede ver el esquema anterior de forma gr´afica:

Figura 2.1: Esquema de la visi´on general del proyecto

(14)

2.2. Objetivos espec´ıficos de este proyecto de Fin

de Grado

Los objetivos generales del proyecto global han sido señalados en la sección anterior. Este proyecto de Fin de Grado se centra en la delimitación de las regiones de interés (ROI) en las imágenes PET. Ésta es la parte referida en la vista general como delineación a baja resolución.

La parte correspondiente al tratamiento de las imágenes CT no será incluido en este proyecto pero, sin olvidar que los resultados obtenidos deben poder usarse en éstas y en el posterior proceso de combinación o fusión de resultados PET con CT.

Entonces, el objetivo principal de este proyecto es la obtención de los volúmenes cancer´ıgenos correspondientes en las imágenes PET de la manera más precisa dentro de las posibilidades.

Para conseguir este objetivo principal, se definen los siguientes objetivos espec´ıficos:

O1: Estudio de las técnicas utilizadas hasta la fecha para escoger los métodos que, en el tiempo dado, sean los más indicados para resolver el problema.

O2: Definici´on de la arquitectura del m´odulo.

O3: Implementación y desarrollo del submódulo de delineación de ROIs.

O4: Validaci´on de resultados.

O5: Comparaci´on de los resultados con los diversos m´etodos escogidos.

O6: Documentaci´on del m´odulo.

Aparte de estos objetivos espec´ıficos, se pretende, si fuera posible la separación de las diversas ROI en función de los datos de posicionamiento relativo al cuerpo obtenidos mediante otro módulo del proyecto general (objetivoO7). Este objetivo queda entonces como objetivo adicional ya que no es en lo que se centra realmente este proyecto.

(15)

(16)

Cap´ıtulo 3

Estado del arte

En este cap´ıtulo se presentará con mayor detalle lo que se ha revisado en la literatura existente en lo referente al tema de la delimitación de regiones de interés (ROI) en las imágenes de tipo PET.

Posteriormente, se pasará a describir en detalle aquellas técnicas que se han revisado para realizar la tarea de delineación de PET as´ı como los problemas encontrados en la literatura. Las técnicas escogidas para este proyecto y la descripción de la metodolog´ıa usada para realizar las pruebas no se describirán en detalle hasta el cap´ıtulo 4.

3.1. Conceptos previos

3.1.1. Segmentaci´

on de im´

agenes

El primer concepto a revisar es ladelimitación de estas ROI que estamos hablando. Hablaremos indistintamente a lo largo de este documento de delimitación, delineación

y de definici´on de las ROIs ya que en el contexto en el que estamos trabajando, sus significados los consideramos intercambiables.

(17)

imagen en una serie de conjuntos disjuntos1_{. A estos conjuntos disjuntos se les conoce}

comosegmentos en el área de imágenes. Podr´ıamos resumirlo matemáticamente en que segmentar una imagen de cualquier tipo consiste en crear una partición sobre el con-junto de unidades que componen la imagen donde cada parte se corresponde con un segmento.

La unidad en las imágenes sirve para relacionar un fragmento de la imagen único con un dato de nuestro interés. Esto es lo que se conoce en el d´ıa a d´ıa como p´ıxel

si la imagen es de dos dimensiones o vóxel si la imagen es de tres dimensiones. En medicina se suele tratar con ambos tipos de imágenes as´ı que cuando nos refiramos a la unidad en las imágenes hablaremos directamente de vóxeles o p´ıxels dependiendo de las dimensiones de la misma.

El dato de interés que se relaciona con la posición del p´ıxel o del vóxel dependerá de la información que se quiera obtener de la imagen y, por supuesto, de la información que proporcione la imagen. Normalmente, son interesantes datos de color o intensidad del p´ıxel o vóxel en una dimensión. En el caso de ser de interés el color, se suelen usar 3 canales o incluso 4 canales de color, como los conocidos canales RGB (red, green, blue) y RGBA (red, green, blue, alpha). Aunque en las aplicaciones médicas es más común usar tan sólo un canal de intensidad cuyo rango de valores var´ıa entre unos tipos de imágenes y otras. Además depende también del tipo de escáner utilizado. Se suele llamarprofundidad al número de bits que cada p´ıxel puede almacenar, esto afecta a la cantidad de valores distintos que se pueden asociar a un p´ıxel o vóxel en una imagen.

En general, la segmentación de imágenes es útil para extraer caracter´ısticas de la imagen, para hacer medidas en regiones concretas y para mejorar la visualización de las imágenes. En el área de medicina, es interesante distinguir tipos de tejidos distintos como huesos, músculos y venas, y en otras, interesa distinguir tejidos cancer´ıgenos, deformidades de tejidos o lesiones de esclerosis múltiple [1].

Como se puede observar en todos estos casos, el problema se ajusta al problema de segmentación de imágenes ya que, en general, de lo que se está tratando es de distinguir las diferentes regiones de la imagen y clasificarlas acorde con lo que representan en la realidad. La clasificación entonces es importante llevarla a cabo correctamente, aunque la gravedad de las consecuencias por obtener resultados erróneos depende del ámbito en que se esté trabajando.

1_{Recordar que una serie de conjuntos disjuntos cumple que cada uno de los elementos o unidades}

(18)

3.1.2. Proceso de segmentaci´

on

Para poder llevar a cabo el proceso de segmentación de imágenes es necesario saber qué queremos sacar de la imagen o imágenes que queremos segmentar y además, conocer la naturaleza de las mismas puesto que dependiendo de la forma, estructura y distribu-ción de la información que proporcione la imagen, hará faltar resolver la solución del problema siguiendo una estrategia u otra.

Entonces, lo primero que se debe identificar antes del proceso de segmentación es el objetivo que tenemos, es decir, qué información queremos extraer. Una vez identificado, debemos entender cómo se presenta la información en la imagen para elegir unatécnica de segmentación y posteriormente, probarla sobre la imagen o conjunto de imágenes para ver los resultados obtenidos.

En algunas ocasiones, será necesario el uso de múltiples técnicas durante el proceso para conseguir la segmentación deseada [1]. El uso de múltiples técnicas se puede llevar a cabo tanto en paralelo como en secuencia o incluso combinar en paralelo y en secuencia.

Habrá casos en los que las técnicas en secuencia utilizadas no se usen necesaria-mente para la segmentación en s´ı, sino que más bien, se utilizan para adaptar ciertas condiciones de la imagen que no nos son favorables en el posterior proceso de segmen-tación. Estas técnicas previas a la segmentación se conocen en general en el campo de tratamiento de imágenes como técnicas de preprocesamiento. Estas técnicas suelen usarse para reducir la cantidad de información que proporcionan estas imágenes ya que a menudo, contienen más información de la deseada y dificulta la búsqueda de patrones y, por tanto, la segmentación de las imágenes. Por ejemplo, el ruido que suele haber en muchas imágenes dificulta la segmentación de las mismas y hacer uso de ciertas técnicas de preprocesamiento tal y como puede ser el conocido filtro gaussiano pueden ayudar a reducir el ruido de la imagen.

(19)

3.1.3. Caracter´ısticas de las im´

agenes PET y CT

Ahora vamos a describir en más detalle las caracter´ısticas de las imágenes CT y sobre todo PET as´ı como su uso en el tratamiento de pacientes con cáncer y las dificultades a las que se enfrentan los especialistas cuando tienen que delinear tumores cancer´ıgenos usando estos tipos de imágenes.

Como vimos en la introducción, las mayores diferencias presentes en las imágenes PET y CT se daban en su sensibilidad y su resolución. Esto afecta severamente a la nitidez de las imágenes y la facilidad para distinguir las regiones de interés.

Una caracter´ıstica común tanto en las imágenes PET como las imágenes CT es que ambas son tridimensionales y, en ambas pueden abarcar prácticamente todo el cuerpo del paciente, aunque el escáner se hace normalmente tan sólo del tórax y del abdomen de los pacientes. Para hablar de las coordenadas que se manejan en estas imágenes usaremos los ejes X e Y para referirnos a las coordenadas de cada una de las imágenes bidimensionales obtenidas durante el proceso. Cada una de estas imágenes se conoce comoslice y recorren el eje que llamaremos Z cada vez que sea necesario. Cada uno de los slices del paciente se corresponde con un “sección” del mismo en lo que se conoce como planotransversal del cuerpo.

Figura 3.1: Ejemplo de imagen CT de t´orax En oncolog´ıa, las im´agenes CT no son

sufienciente para poder delimitar o deli-near los volúmenes de los tumores can-cer´ıgenos. El problema que se da con las imágenes CT es que no hay marcadores equivalentes a los de PET que puedan ha-cer que los tumores malignos queden co-rrectamente definidos. Sin embargo, al ser imágenes de relativamente alta resolución, los resultados de la delineación ser´ıan bas-tante más precisos aunque también ser´ıa mucho más laborioso. Pero esto no se pue-de aplicar a los volúmenes cancer´ıgenos ya que a la vista de un especialista los teji-dos son prácticamente indistinguibles en muchos casos debido a lo que se acaba de comentar sobre los tejidos blandos.

(20)

delinea-ción es una tarea relativamente sencilla de realizar por un especialista. Por ejemplo, los tejidos óseos son muy fáciles de distinguir frente a los tejidos blandos que pueda haber alrededor (suele haber mucho contraste). No siempre es sencillo automatizar estas tareas ya que en este tipo de imágenes nos podemos encontrar con la presencia de artefactos o simplemente, la dificultad conocida que tienen los algoritmos de reconocimiento de patrones visuales en general.

Dentro del campo de oncolog´ıa, se usan entonces las im´agenes PET ya que son im´agenes en las que el marcador 18_{F-FDG se puede distinguir visual y anal´ıticamente}

de las demás zonas debido al alto contraste. No obstante, como indicamos previamen-te, el problema de estas imágenes es la baja resolución y la presencia de ruido. Esto significa que los segmentos que obtengamos tras hacer el proceso de delineación en es-tas imágenes no serán tan homogéneos como teóricamente deber´ıan ser, con lo cual, es sencillo cometer errores en la delineación automática de este tipo de imágenes.

Figura 3.2: Ejemplo de imagen PET de paciente con c´ancer de pulm´on

En la figura 3.2 se puede observar un ejemplo de imagen PET donde los tonos de color blanco se corresponden con valores de actividad metabólica superiores y los de color negro se corresponden con valores inferiores. Como sabemos, la alta intensidad está directamente relacionada con que el escáner ha recibido muchos positrones de esa zona, lo que significa que hay mucho 18_{F-FDG concentrado en dichos puntos y ello}

(21)

No saber si se trata exactamente de un tumor cancer´ıgeno puede dar muchos pro-blemas a la hora de averiguar qué zonas se deben considerar como falsos positivos. Sin embargo, se sabe de antemano que zonas como el cerebro, los riñones, la próstata y la vejiga, tienen una mayor concentración de marcador (18_{F-FDG) [6]. El cerebro tiene}

mayor concentración puesto que siempre tiene mayor metabolismo. Pero esto no es lo que sucede con los riñones y la vejiga, en estos casos, la mayor concentración de mar-cador se debe a que al realizar el cuerpo la función de excreción, almacena grandes cantidades de 18_{F puesto que la glucosa ya ha sido consumida durante el proceso de}

metabolismo. Por tanto, cuanto más tiempo pase desde que se inyecta el marcador en el paciente, menos disperso está el marcador ya que se da tiempo a que se concentre en las zonas de metabolismo más alto; pero si la cantidad de tiempo transcurrido es demasiado alta, es posible que la mayor parte de marcador quede en la vejiga. En la figura 3.2 se pueden observar todas estas zonas que se acaban de comentar.

En casi todas las técnicas conocidas, no se trabaja directamente con las intensidades de las imágenes obtenidas mediante los escáneres PET. Normalmente, se hace una conversión a otra unidad que ya ha sido introducida anteriormente y que se llama

standard uptake value(SUV). El SUV es una medida también de la actividad metabólica directamente relacionada con la cantidad de actividad metabólica en cada vóxel en función del tiempo, del peso del paciente y de la cantidad de dosis inyectada [6, 24]. No tener en cuenta estos factores puede acarrear problemas ya que dependiendo del caso, los valores obtenidos pueden variar notablemente entre pacientes y se hace más complicada la comparación de los valores en los mismos. Por tanto, el SUV apareció como un intento de unificar de alguna manera los valores obtenidos en todos los pacientes.

El SUV es concretamente una medida de corrección sobre la vida media del marcador por cada unidad de masa corporal y por cada dosis administrada en función del peso del paciente. En otros términos, el SUV se puede expresar como indica la fórmula 3.1 extra´ıda del art´ıculo [24].

SU V = cm

di/w ·

1

d (3.1)

donde cm es la concentraci´on media de marcador en la ROI y se mide en M Bq/g

donde g son gramos y donde M Bq se entiende por millones de Bq (becquerel) que es una medida utilizada en el sistema internacional (SI) para medir la radiactividad; di

es la cantidad de dosis inyectada medida en M Bq, el peso del paciente w medido en gramos y el factor de tiempo de descomposici´on del marcador. Por tanto, con el SUV, se tiene en cuenta el tiempo que ha pasado desde el comienzo de las pruebas en el esc´aner. De hecho, incluso se tiene en cuenta el tiempo transcurrido entre unslice y otro.

(22)

que se encuentra el c´ancer y para ayudar a preveer la evoluci´on de la enfermedad [6].

El problema que tiene el uso del SUV es que la fiabilidad del mismo depende de una serie de factores técnicos y de los pacientes [24, 11]. Factores como el tiempo que transcurre entre el momento de inyección y el momento en el que comienzan las pruebas o como el grado de infiltración del marcador en la zona de inyección pueden afectar la corrección y fiabilidad del SUV, no siendo siempre la medida más indicada [24]. Sin embargo, este medida es la que se ha aceptado comunmente como la más acertada y es la que se suele utilizar en los hospitales actualmente.

Para poder evitar los problemas que tienen las imágenes PET y CT y poder apro-vechar los datos que proporcionan ambos tipos de imágenes, se hace uso del h´ıbrido PET-CT que ya fue introducido al comienzo de este documento. Con las imágenes PET-CT estar´ıamos aprovechando la resolución espacial de las imágenes CT y la sensibilidad de las imágenes PET.

Figura 3.3: Aplicaci´on de visualizaci´on PET-CT [5]

Las imágenes PET-CT se suelen visualizar usando aplicaciones software (ver figura 3.3) que permiten dividir la interfaz de usuario en dos ventanas simultáneamente de forma que en una ventana se muestran los resultados obtenidos por el escáner CT y los obtenidos por el escáner PET. La imagen 3.4 es un ejemplo de cómo se representar´ıa el h´ıbrido PET-CT en tres dimensiones.

(23)

Figura 3.4: Ejemplo de h´ıbrido PET-CT 3D

las imágenes PET y CT al mismo tiempo. Esto es importante ya que si se tuviesen que obtener en dos sesiones de pruebas distintas, se correr´ıa el riesgo de que el paciente no esté alineado de la misma manera en ambas pruebas y entonces, la información es más dif´ıcil de tratar, sobre todo si se hace uso de técnicas automáticas.

La combinación de imágenes PET y CT se hace hoy en d´ıa para evitar problemas que se dan al delinear volúmenes tanto si se hace sólo en PET como si se hace sólo en CT. Los volúmenes delineados en PET garantizan que si el tumor cancer´ıgeno ha sido captado por el escáner, es mucho menos probable que el operador entrenado en delimitación de contornos de tumores cancer´ıgenos en imágenes PET cometa el error de dejar el volumen sin delinear. Pero por otro lado, la baja resolución de las imágenes hace que la definición de los contornos no sea del todo acertada. Delimitar correcta-mente los volúmenes es importante porque en casos como los carcinomas pulmonares no microc´ıticos (non-small-cell lung cancer o NSCLC) es normal que se requiera de ra-dioterapia ya que la quimioterapia no suele servir. Y durante el tratamiento mediante radioterapia, es imprescindible conocer el volumen cancer´ıgeno real con la mayor exac-titud posible puesto que la radioterapia es de tipo ionizante y si se cometen errores, se pueden afectar a zonas sanas pudiendo tener consecuencias graves.

En cuanto a las imágenes CT, el problema reside en que hay ocasiones en las que no se detectan ciertas zonas afectadas porque a la vista de los espacialistas no lo parecen. Sin embargo, se puede conseguir una delineación del tumor mucho más exacta y por consiguiente, la radioterapia tendrá menos efectos nocivos.

(24)

los resultados obtenidos. En la siguiente figura (3.5) se muestra uno de los casos pre-sentados en dicho estudio en los que el operador no detect´o una de las zonas en CT, pero s´ı se detectaron en PET y, por tanto, fueron a˜nadidas posteriormente en PET-CT obteniendo un volumen considerablemente mayor que el anterior.

(a) CT sin detectar (b) PET equivalente

Figura 3.5: Ejemplo de regi´on sin detectar en CT pero visible en PET [5]

Con toda esta introducción de conceptos y técnicas más o menos generales, concluye esta sección y se pasa a revisar las técnicas encontradas en la literatura centrándonos en el área de oncolog´ıa y las imágenes CT y, sobre todo, PET ya que éste es nuestra principal objetivo.

3.2. T´

ecnicas principales de segmentaci´

on

En la sección 3.1.2 hemos visto que una vez que tenemos la imagen adecuada y hemos observado su naturaleza, podemos empezar a buscar una técnica o conjunto de técnicas que nos sean más adecuadas para la segmentación definitiva de la imagen.

(25)

Para facilitar la elección de las técnicas de segmentación, es muy conveniente saber cómo se comportan estas técnicas en el sentido de saber cómo trabajan con la imagen de entrada y que hacen en el resto del procedimiento o algoritmo. Además, hay técnicas que requieren de cierta informción adicional de entrada en mayor o menos medida y, dependiendo del caso, puede que esto nos interese o no. Entonces, al existir muchas técnicas y muchos derivados de éstas, se va a hacer una clasificación que pueda ayudar a distinguir las técnicas por sus caracter´ısticas comunes frente a ciertos criterios de clasificación.

Clasificaremos entonces usando los siguientes criterios de clasificaci´on [1]:

Grado de interacción - según el grado de interacción que requiera la técnica con respecto al usuario. Aunque como se puede comprender, es complicado decidir hasta qué nivel una técnica es completamente automática o si más bien deber´ıa ser vista como semiautomática. En caso de duda, se dará un razonamiento de por qué la clasificamos de una manera o de otra.

Manuales: grado de interacci´on m´aximo.

Semiautom´aticas: requieren ciertos par´ametros que se consideran excesivos como para ser clasificadas en el siguiente grupo.

Automáticas: no requieren interacción en absoluto o bien se requieren tan sólo unos pocos parámetros de menor importancia para la clasificación.

Localización - en este caso estamos refiriéndonos a la localización o posición de la información que la técnica extrae de la imagen.

Globales: que usan toda la informaci´on de la imagen al mismo tiempo.

Locales: basadas en regiones independientes de la imagen pudiendo ser in-cluso un solo p´ıxel o v´oxel.

Nivel de abstracción - al igual que suceder´ıa con el nivel de los lenguajes de progra-mación en función a lo cercanos que son al hardware de la máquina, en nuestro caso nos referimos al nivel de manipulación de la información que se maneja.

Delineación manual: manipulación al nivel más bajo posible, no hay ninguna “capa” de abstracción entre medias.

(26)

Segmentación basada en modelos: técnicas que tratan de relacionar datos usando modelos y, por tanto, aumentando el nivel de abstracción y de signi-ficado a la información extra´ıda. Algunos ejemplos de técnicas de este estilo tales como técnicas multimodales y técnicas de programación dinámica.

Rama de la ciencia - podr´ıamos decir que ésta es la clasificación clásica en el sentido de que se utilizan directamente grupos de técnicas conocidos en otras ramas de la informática.

Clásicas: aquéllas técnicas que se diseñaron espec´ıficamente para el análisis de imágenes en general tales como la umbralización, las basadas en contornos y las basadas en regiones

Basadas en estad´ısticas.

Basadas en l´ogica borrosa (fuzzy logic). Basadas en redes neuronales.

Se hará ahora una breve introducción a las técnicas más populares en segmentación de imágenes médicas sin necesidad de seguir ningún criterio de clasificación espec´ıfico:

Técnicas de umbralización: estas técnicas son las más comunes dentro de las t´ ecni-cas globales [1]. Las técnicas de umbralización consisten en establecer un umbral sobre los valores (intensidad) que pueden tomar los p´ıxeles o vóxeles de la imagen. De esta manera, se distinguen al menos dos clases en función del umbral seleccionado. Estas dos clases son, la clase cuyos p´ıxeles o vóxeles tienen dicho valor por encima del um-bral o igual y la clase de aquéllos que están por debajo de dicho umbral. Aunque esta definición sólo sirve para los casos en los que se usa un solo umbral global, es decir, un ´

unico umbral aplicado a toda la imagen.

En general, podemos definir estas técnicas de la siguiente manera asumiendo que se trabaja sobre un solo canal de intensidad de las imágenes. Las técnicas de umbralización se basan en clasificar todos los p´ıxeles, vóxeles o la unidad en la dimensión que sea siguiendo la fórmula 3.2.

g(¯x) =

(

1 sif(¯x)≥u

0 sif(¯x)< u (3.2)

(27)

La fórmula anterior sólo nos sirve para dar un solo umbral global, sin embargo, existen técnicas que dan umbrales diferentes a cada zona o incluso a cada p´ıxel o vóxel de la imagen. En este caso, bastar´ıa con sustituiru en la fórmula poruh(¯x) donde h(¯x)

ser´ıa una función que nos devuelve el ´ındice del umbral en la lista de umbrales para cada p´ıxel, vóxel o en la dimensión que sea con coordenadas (¯x) en la imagen. Es decir, que se asume además la existencia de una lista de umbrales para llevar a cabo este proceso de segmentación descrito mediante la fórmula.

Por otro lado, hay técnicas de umbralización que se basan en establecer varios um-brales independientes en partes disjuntas de la imagen (umbral local) o que incluso establecen múltiples umbrales para obtener varios segmentos de objeto distintos (siem-pre se entiende que sólo existe un segmento de fondo) en cuyo caso diremos que se trata demultiumbralización la cual será descrita con mayor detalle en la sección 3.4.2.

En conclusión, podemos comprobar que las técnicas de umbralización se centran en buscar diferencias entre intensidades de p´ıxeles o vóxeles para establecer el umbral. Aunque, en realidad, el resultado sigue siendo una agrupación de p´ıxeles o vóxeles con caracter´ısticas similares.

Se mostrarán ejemplos de imágenes obtenidas mediante este tipo de técnica más adelante, concretamente, en la sección 3.4.1.

Técnicas de crecimiento de regiones: las técnicas de crecimiento de regiones en lugar de buscar la diferencia entre p´ıxeles o vóxeles, tratan de agrupar aquéllos que tengan ciertas similitudes en alguna caracter´ıstica. Este tipo de técnica comienza ha-ciendo uso de una semilla (seed en inglés) y un posterior proceso de crecimiento de la región a partir de dicha semilla. La semilla deberá ser un p´ıxel o vóxel que se sabe que pertenece o predice que pertenece a dicha región. La semilla puede ser introducida tanto por un operario en el programa como elegida mediante otro algoritmo [1]. Por tanto, el procedimiento podemos dividirlo en selección de la semilla, crecimiento de la región y determinación del fin del proceso de crecimiento ya que no puede crecer indefinidamente.

(28)

ser evaluados en la siguiente iteraci´on.

La ventaja de este tipo de técnica es que se extraen los p´ıxeles y vóxeles con carac-ter´ısticas similares relativas a la intensidad en cada punto, pero además, se tienen en cuenta las caracter´ısticas espaciales en la imagen. Por esta razón, las regiones obtenidas con estos procedimientos son siempre regiones conexas, lo cual ser´ıa necesario compro-bar en otros tipos de métodos si es que se requieren regiones necesariamente conexas. Por otro lado, una desventaja que presentan es que se obtienen distintos resultados de-pendiendo de qué semilla se elija. Pero no sólo depende de la semilla, también depende enormemente del criterio de homogeneidad que se escoja.

Figura 3.6: Proceso descrito dehill climbing

[1] Un ejemplo de crecimiento de regiones es el uso dehill climbing en la delineación de microcalcificaciones en mamogramas. Para usar esta técnica, se comienza esco-giendo el máximo local que hay en dicha microcalcificación y se usa como semilla. Desde este punto se dibujan de forma ra-dial una serie de l´ıneas con el mismo ´ angu-lo entre todas ellas. Estas l´ıneas determi-nan las direcciones en las que se va a rea-lizar elhill climbing. El hill climbing con-siste en avanzar p´ıxel a p´ıxel en la direc-ción escogida hasta alcanzar un máximo en una función determinada [1]. En este caso, la función representa la inclinación (en el sentido de gradiente) que hay entre unas intensidades y otras. El punto de in-clinación máxima localmente es el punto escogido para cada l´ınea trazada.

Como podemos ver en la figura 3.6, se

escoge el m´aximo local de la zona de mayor intensidad de la imagen y desde ah´ı se alzan 16 l´ıneas equiespaciadas de forma radial para calcular mediante hill climbing

los 16 puntos que hacen de l´ımite de la región. Estos puntos se usan después como semillas para hacer crecer la región hacia dentro, es decir, en este ejemplo el criterio de homogeneidad hace que se escojan p´ıxeles que se acerquen al máximo local tanto espacialmente como en términos de intensidad.

(29)

y la extracción de la superficie del cerebro en otras áreas de imágenes médicas [1].

Algoritmo de Watershed: la segmentación mediante el algoritmo de Watershed está basada en regiones y utiliza la morfolog´ıa de la imagen. De nuevo, se requiere una semilla interior a la futura región, pero además, se debe marcar también la zona a la que pertenece el fondo conocido de la imagen. Para ello, se puede hacer esto, de nuevo, mediante un operador, o bien, mediante un algoritmo que marque ambas cosas automáticamente usando conocimientos previos2 sobre la imagen [1].

(a) Elecci´on del punto interior y del fondo

(b) Algoritmo de Watershed tras aplicar el operador So-bel

Figura 3.7: Ejemplo de algoritmo de Watershed descrito [1]

Este algoritmo funciona intuitivamente de la siguiente forma (figura 3.7). Si asocia-mos la intensidad de los p´ıxeles de la imagen con la altitud de un terreno, la imagen tridimensional resultante ser´ıa la de un terreno con picos, montañas y valles a distintas altitudes. Si pudiésemos sumergir dicho terreno en agua de forma que el eje de altitud del terreno fuese paralelo al eje de profundidad en una bañera, este algoritmo seleccio-nar´ıa los puntos en los que el agua comenzar´ıa a invadir otros valles distintos del valle externo. Es decir, básicamente, este algoritmo es capaz de distinguir los bordes de las “piscinas” que se formar´ıan en el terreno o, lo que es lo mismo, ser´ıa capaz de marcar cordilleras [1]. Análogamente, si simulásemos la caida de gotas de agua en cada uno de los puntos del terreno, podr´ıamos decir que el algoritmo es capaz de detectar qué puntos tienen una vertiente que da a un valle o a otro. Los puntos que lleven al valle donde

(30)

est´a la semilla interior son puntos pertenecientes a la “piscina” que nos interesa, los dem´as pertenecen al fondo.

No todas las imágenes tienen esta caracter´ıstica de que nos interese marcar sus cordilleras, de hecho, es más usual querer delimitar tan sólo la región de mayor inten-sidad de estas imágenes. Por tanto, lo que se puede hacer es convertir dichas imágenes usando el operador Sobel3 _{para obtener una imagen donde la intensidad de los p´ıxeles}

es proporcional a la diferencia de intensidades entre p´ıxeles vecinos, que en este caso, s´ı coinciden con el l´ımite de dicha regi´on [1].

Esta técnica se utiliza en numerosas aplicaciones en imágenes de dos dimensiones. Por ejemplo, es útil para segmentar imágenes microscópicas de la retina. También se ha llegado a implementar una versión tridimensional para analizar imágenes card´ıacas volumétricas [1].

Técnicas basadas en contornos: estas técnicas consisten en usar los contornos detectados en las imágenes para hacer una posterior segmentación de la misma. Al igual que en el caso anterior, lo que se hace es hallar los contornos usando un operador, normalmente basado en elgradiente, tal y como sucede con el operador Sobel (ver figura 3.8 B). Por tanto, la estrategia a seguir es la misma que la de antes, primero se obtienen los bordes de la imagen usando cierto operador y, después, se determina qué bordes nos interesan [1].

Figura 3.8: (A) imagen original, (B) tras aplicar el operador Sobel, (C y D) tras um-bralizar con distintos umbrales [1]

(31)

En este caso, se suele hacer uso de técnicas de umbralización sobre la imagen de gradientes para determinar cuáles son los bordes que nos interesa clasificar como bordes (ver figura 3.8 C). Pero en muchas ocasiones, estos bordes no formarán recintos cerra-dos, lo cual suele ser un requisito imprescindible en este tipo de segmentación. Para poder cerrar los recintos tras haber realizado el proceso anterior, se suele hacer uso de técnicas de postprocesado que cierran dichos recintos. Esto se puede hacer de forma automática, aunque puede resultar ser una situación bastante ambigua. En este caso, será necesario hacer uso de métodos semiautomáticos o completamente manuales [1]. Otra posibilidad es la de usar el operador Laplaciano en lugar de otros operadores, que incluye la información que proporcionan las segundas derivadas.

Estas t´ecnicas suelen presentar problemas en casos de ruido en las im´agenes ya que el ruido puede alterar significativamente los resultados y generar contornos que no nos interesen [1].

Diversas versiones de estos métodos se han utilizado para analizar imágenes m´ edi-cas. Se ha utilizado para detectar las cámaras ventriculares en imágenes de resonancia magnética del corazón, para segmentar imágenes de resonancia magnética del cerebro y para delinear venas [1].

Técnicas multimodales: las técnicas multimodales se basan en utilizar la infor-mación que proporcionan varias imágenes de distinta naturaleza al mismo tiempo. La variedad de la información que proporcionan dichas imágenes depende del tipo de ima-gen que se trate. Podemos estar combinando caracter´ısticas de imágenes que provienen de distintos tipos de escáner (MRI, PET, CT...) o bien podemos estar combinando imágenes del mismo tipo de escáner pero adquiridas en distintos momentos, dándonos información más completa sobre la evolución de la enfermedad en el paciente.

Combinando múltiples técnicas: en el caso de usar varias técnicas lo que te-nemos es una imagen que, en lugar de tener un solo canal de intensidad, tiene varios canales de intensidad (como sucede con las imágenes a color). Para poder sacar la in-formación de estas imágenes correctamente en múltiples imágenes simultáneamente, se suele hacer uso de técnicas conocidas como puede ser k-nearest neighbors (kNN), fuzzy c-means, k-means o las redes de neuronas artificiales (RNA). Además, es importante que estas imágenes tengan poco ruido porque deben corresponderse las unas con las otras. El ruido y otros factores puede hacer que relacionar imágenes sea mucho más complicado [1].

(32)

cerebro en dos versiones distintas de MRI para poder contrastar los tejidos que lo componen [1].

Adquisición en función del tiempo: las técnicas más conocidas para analizar en función del tiempo se conocen comotécnicas de análisis paramétrico. En estas t´ ecni-cas la intensidad de cada elemento se contrasta con el tiempo generando unas gráficas. Se pueden elegir una serie de parámetros como la intensidad máxima y m´ınima que se utilizarán para obtener unas imágenes resultantes y poder hacer el estudio consecuente sobre ellas en función de un solo parámetro. Cada gráfica se analiza asumiendo que las curvas tienen caracter´ısticas similares en el tiempo, es decir, que siguen el mismo patrón [1].

Este tipo de técnica se ha utilizado por ejemplo en segmentación tridimensional de lesiones de esclerósis múltiple en imágenes MRI obtenidas a lo largo del tiempo. Después, se escogen parámetros como por ejemplo, variación de la intesidad en las lesiones conocidas, momento de aparición o momento de desaparición de las mismas. Con esto, se obtienen unas imágenes en las que se pueden observar resaltadas otras lesiones que siguen los patrones establecidos por los parámetros elegidos.

Con esto, se han introducido en menor detalle las técnicas más populares en el mundo del análisis de imágenes médicas, se han proporcionado ciertos ejemplos sobre cómo se aplica determinada versión de la técnica y en qué ámbitos reales se ha probado. Además, se han dado ciertas nociones para entender las ventajas y desventajas que pueden tener estos tipos de técnicas en función de la situación.

3.3. Segmentaci´

on manual y semiautom´

atica

Ahora se procede a introducir tanto la segmentación manual como la semiautom´ ati-ca en imágenes PET y CT en base a lo descrito en la clasificación 3.2. La información adicional que se debe proporcionar en cada técnica var´ıa evidentemente según el con-texto y según la técnica que se esté utilizando. En nuestro caso, en el campo de la oncolog´ıa, las técnicas semiautomáticas suelen requerir información previa acerca de la posición de los volúmenes de cáncer. En muchos casos, basta con introducir un punto interior al volumen.

(33)

de mucha experiencia y de mucho tiempo para llegar a delinear los vol´umenes de la forma m´as correcta posible.

Aunque disponer de un especialista muy entrenado pueda parecer garant´ıa de ob-tención de resultados suficientemente correctos, esto no es del todo cierto. Es conocido el problema de que la delineación manual no es del todo objetiva, es decir, que depende de cada especialista. Esto se le llama variabilidad entre observadores (inter-observer variability) y está ilustrado en la figura 3.9 [24, 12]. Además, también se sabe que exis-te un problema de variabilidad en la delineación manual debido a la configuración del programa que el especialista esté usando [24].

Figura 3.9: Diferencias en 3 tumores distintos entre varios observadores indicado me-diante contornos azules [12]

En el caso de las imágenes CT, también existen problemas para obtener la delinea-ción más correcta posible. De hecho, se suele sobreestimar la extensión del tumor para garantizar que la delineación no queda fuera de la lesión [8].

Para evitar estos problemas se hace uso a menudo de técnicas de crecimiento de regiones. Tal y como se explicó en la sección 3.2, estas técnicas consisten en el uso de al menos una semilla oseed principal la cual se usa como punto de partida para hacer crecer la región hasta el punto que se crea conveniente.

(34)

Figura 3.10: Diferentes resultados obtenidos en el mismo paciente entre distintas semi-llas iniciales (slices 79-85) [8]

3.4. Segmentaci´

on autom´

atica

Los procesos de segmentación automática o sin supervisar son los que vamos a analizar con más detalle en esta sección, sólo que esta vez nos centraremos tan sólo en PET.

(35)

resultado que se pretende, por tanto, en el fondo sigue estando presente un operario. Pero como estos parámetros se pueden conseguir en realidad entrenando un modelo o a través de datos estad´ısticos, al final se pueden considerar como automáticos.

La segmentación automática o, en nuestro caso, la podemos llamar “delineación” automática, presenta varias ventajas especialmente frente a la segmentación manual. Principalmente, podr´ıamos hablar de una ventaja en la falta de variabilidad frente a la que pueda haber entre varios observadores en el caso manual. Evidentemente, esto depende en gran medida en el algoritmo utilizado ya que algoritmos basados en par´ ame-tros aleatorios carecen de rigor tal y como suced´ıa con el crecimiento de regiones (ver 3.10). En este sentido estar´ıamos hablando de una mayor reproducibilidad de las prue-bas puesto que podr´ıan repetirse en distintas ocasiones y siempre obtener los mismos resultados. Como es lógico, esto es algo muy positivo de cara a hacer mediciones y a intentar predecir el comportamiento de las técnicas automáticas en su futuro uso.

Y además de esto, como también es evidente, el hecho de disponer de técnicas au-tomáticas hace que no sea necesario, en nuestro caso, disponer de un operador entrenado ni de que tenga que emplear tanto tiempo en analizar las imágenes y sus respectivos volúmenes cancer´ıgenos.

Ahora procedemos a explicar las distintas técnicas encontradas que potencialmente podr´ıan ser útiles para ser aplicadas a lo que nos concierne que son las imágenes PET y el h´ıbrido PET-CT. También se describirán los problemas encontrados en la revisión de la literatura en los casos que sean necesarios tales como incoherencias o falta de datos sobre los experimentos entre distintas publicaciones.

3.4.1. T´

ecnicas de umbralizaci´

on

Las técnicas de segmentación más populares en análisis de imágenes médicas ya han sido introducidas anteriormente y entre ellas estaba la umbralización (ver 3.2). Por ello nos vamos a centrar más adelante en revisar aquéllas que están disponibles en la literatura pero aplicadas a nuestro campo de estudio de las imágenes PET. Para recordar en qué consisten las técnicas de umbralización desde un punto de vista general ir al párrafo 3.2.

(36)

Umbralizaci´on fija

Entendemos por umbralización fija a aquélla basada en un umbral constante, aun-que también se suele entender como umbralización fija a umbrales fijos pero relativos al rango de valores de la imagen. Entonces, podemos distinguir entre umbrales fijos

absolutos y umbrales fijosrelativos respectivamente.

En la literatura se han propuesto distintos métodos de umbralización fija, aunque sólo se ha propuesto uno de umbralización fija absoluta sobre los valores del SUV (para recordar qué es el SUV, ver la descripción en la subsección 3.1). Este umbral tiene el valor 2,5 sobre el SUV y fue propuesto por Paulino et al. [16]. Este umbral se halló realizando estudios y comparativas sobre tumores malignos en pacientes de cáncer en la cabeza y el cuello.

El problema de los umbrales absolutos para distinguir entre zonas afectadas por cáncer y las zonas no afectadas es que existe cierta inhomogeneidad en los tumores, lo cual puede dificultar la búsqueda de un umbral ideal [24]. Además, puede haber muchos artefactos en las imágenes haciendo que estos métodos no sirvan [24]. De hecho, se ha probado que este método ha fallado en ciertas pruebas [24] y sigue siendo un tema de discusión en el área [24, 13]. No obstante, este método se utiliza habitualmente en los hospitales como primera aproximación al volumen ideal del tumor y posteriormente, si hay cierta inexactitud, se corrige manualmente a partir de lo hallado por esta técnica de umbralización.

Por otro lado, como hemos dicho, existen umbrales que clasificaremos como fijos, pero que son relativos a los valores de intensidad de la imagen. Estos umbrales rela-tivos se empezaron a proponer porque seg´un algunos estudios, el umbral ideal var´ıa dependiedo del tama˜no de la esfera (phantom4_{) que se use para llevar a cabo el estudio}

estad´ıstico, de la relaci´on con la actividad del fondo y de otros factores [24, 4]. Es decir, que como ya se ha dicho, queda demostrado que los umbrales fijos absolutos, no son suficientemente precisos en todos los casos.

El umbral que m´as se suele utilizar en la literatura es el umbral relativo constante del 42 % o, en algunas ocasiones, del 40 %. Este umbral constante se suele aplicar sobre los valores del SUV de la forma descrita en la siguiente ecuaci´on 3.3.

umbral = 0,42×(maximo−m´ınimo) + m´ınimo (3.3)

Es decir, que se aplica el 42 % al m´aximo valor de la imagen para determinar el umbral

4_Los _phantom _{son vol´}_{umenes preparados para hacer pruebas que, en este caso, se rellenan de}

(37)

absoluto [4]. Este estudio fue llevado a cabo por Erdi et al. en el documento [4] donde se asegura que todos los umbrales relativos constantes se encuentran siempre entre el 36 % y el 44 %. Este estudio se llev´o a cabo usando phantoms con forma de esfera de diversos tama˜nos.

Umbralizaci´on din´amica

Entendemos entonces como umbralización dinámica a cualquier técnica que no esté basada en un umbral fijo ya sea relativo o absoluto. En resumen, es lo opuesto a lo que se ha descrito anteriormente.

La umbralización dinámica se puede entender también en mayor o menor medida como “fija” si contiene parámetros constantes que se han obtenido mediante estudios estad´ısticos, normalmente usando l´ıneas de regresión o métodos similares. En otras ocasiones, los parámetros no tienen nada que ver con estudios hechos y tan sólo sirven para guiar al algoritmo y para conseguir unos resultados determinados. Entonces, tal y como se dijo en la clasificación 3.2, éste es uno de aquellos casos de los que no estamos seguros de cómo clasificarlos. Por el momento, diremos que la umbralización fija se da sólo en los casos descritos anteriormente, y los demás los clasificaremos directamente como dinámicas aunque haya dudas presentes.

Ahora separaremos las técnicas de umbralización dinámicas en dos grupos en función de su objetivo de diseño. Distinguiremos entonces técnicas de umbralización dinámicas clásicas y técnicas de umbralización dinámicas de PET.

Umbralización dinámica clásica

Vamos a empezar hablando de las técnicas de umbralización dinámicas clásicas que no se inventaron necesariamente con la idea de que fuesen aplicadas en un campo determinado. Es decir, en cierto sentido son técnicas de umbralización con un enfoque general. Dentro de estas técnicas clásicas, se pueden distinguir distintos tipos según la estrategia que sigan a la hora de realizar los cálculos [20]:

Basadas en la forma del histograma: se analizan las curvas (m´aximos locales, m´ıni-mos locales,...) de los histogramas para determinar el umbral.

(38)

se intentasen clasificar esos dos grupos siguiendo dos distribuciones gaussianas, una para cada grupo. Para que este tipo de umbralizaci´on d´e buenos resultados es importante que el histograma sea suficientemente bimodal [15]. Esto implica que el histograma5 _{debe representar una distribuci´}_{on de las intensidades de la imagen}

de forma que haya un “valle” bien definido entre ambos grupos. Si este valle es inexistente, los resultados no tendr´an por qu´e ser buenos.

Basadas en entrop´ıa: aqu´ellas que analizan la imagen en base a la entrop´ıa de los segmentos de fondo y de objeto, la entrop´ıa de la iamgen binarizada frente a la imagen original o, en general, cualquier derivado que requiera de an´alisis de entrop´ıa para poder decidir sobre los segmentos resultantes.

Basadas en los atributos de los objetos: tratan de buscar similitud entre atribu-tos entre la imagen original y la imagen binarizada resultante tales como el an´ ali-sis de la forma usando l´ogica borrosa (fuzzy), an´alisis de la coincidencia entre los bordes, etc.

M´etodos espaciales: utilizan distribuciones de probabilidad y/o correlaci´on entre p´ıxeles de la imagen para determinar los segmentos.

Métodos locales: este tipo de métodos en lugar de dar un umbral para todos los p´ıxe-les, dan un umbral para cada p´ıxel basándose en caracter´ısticas locales (aquéllas que pertenecen a los vecinos de los p´ıxeles analizados).

Estas técnicas de umbralización son también populares fuera del ámbito de las imágenes médicas. Pueden ser útiles por ejemplo para automatizar tareas de testing no destructivo (NDT) [20]. Puede ser útil en tareas como la detección automática de pequeñas roturas y corrosión del fuselaje de los aviones en imágenes obtenidas mediante corriente Eddy (figura 3.11a). También es común la detección de defectos en plásticos reforzados con fibra de vidrio (GFRP) a través de imágenes de ultrasonidos (figura 3.11b) y en la inspección de circuitos impresos (figura 3.11c). Estas tareas son muy tediosas y requieren de mucha concentración por parte de los operarios que lo hacen manualmente.

Es también muy común el uso de umbralización para labinarización de documentos, es decir, la separación del documento en dos segmentos: el fondo, que corresponde al papel; y el objeto que en este caso corresponde a los caracteres que componen el documento [20]. Este tipo de aplicaciones puede servir para la automatización de tareas de lectura de documentos y su conversión a formato electrónico sin necesidad de un operario (figura 3.11d). Además de las imágenes originales, se muestran las imágenes ya umbralizadas manualmente con el umbral ideal para cada caso.

(39)

(a) Eddy (b) GFRP (c) PCB

(d) Binarizaci´on de un documento y el resulta-do tras umbralizar

Figura 3.11: Ejemplos de im´agenes umbralizadas en NDT [20] y binarizaci´on de docu-mentos

Como estas técnicas se crearon con una visión general, se pueden aplicar a casi cualquier tipo de imagen y pueden dar buenos resultados en general. Todo esto se puede hacer siempre y cuando la imagen cumpla con los requisitos necesarios para poder hacer umbralización, es decir, que la imagen tenga un solo canal de intensidad. Si la imagen tuviese varios canales, habr´ıa que convertirlas primero a imágenes de un solo canal.

(40)

Figura 3.12: Esferas 1, 3 y 5 en ambos esc´aneres y los niveles de contraste [17]

contraste en cada prueba. Las imágenes PET de estosphantoms se obtuvieron usando dos tipos de escáner distintos que tienen distintas caracter´ısticas y producen distintas cantidades de ruido al extraer las imágenes [17].

Para la realización de estas pruebas se siguió el protocolo estándar en cada uno de los escáneres, lo que incluye un proceso de corrección de la atenuación para la obtención de las imágenes finales. Para simular el contraste que se da en imágenes PET ordinarias se inyectó marcador de fondo en el material de prueba de ambas pruebas (las de los dos escáneres) en distintas cantidades siguiendo tres niveles de contraste (también conocido como source-to-background) diferentes (2:1, 4:1 y 8:1). Además, la profundidad de las imágenes obtenidas se pasó de 16 bits a 8 bits [17].

En resumen, en este experimento se generaron un total de 36 pruebas (6 esferas, 3 niveles de contraste y 2 esc´aneres) las cu´ales se pueden observar en la figura 3.12.

(41)

Figura 3.13: Medida de rendimiento de las 12 t´ecnicas probadas [17]

Se utilizaron tres indicadores de rendimiento para comparar los resultados obtenidos con los volúmenes conocidos de las esferas. De estos indicadores se calculó la media para que sirviese de medida de rendimiento definitiva. Según este art´ıculo, las técnicas de

clustering (ver la clasificación 3.4.1 para recordar cuáles son las técnicas declustering) fueron las que dieron los mejores resultados y, en concreto, las técnicas de umbralización de Ridler, Ramesh, Otsu y Yanni dieron mejores resultados que la técnica de 42 % fijo (ver figura 3.13). De hecho, las técnicas de Ridler y de Ramesh fueron las que mejores resultados dieron [17]. Esta medida de rendimiento está basada en una medida del error, por tanto, cuanto más bajos sean los resultados de los indicadores, mejor es el resultado (de nuevo, ver figura 3.13).

Este art´ıculo es el único art´ıculo encontrado que parece hacer una comparativa completa de técnicas clásicas, aunque sólo se centre en la umbralización.

Umbralizaci´on din´amica de PET

(42)

máximo, el valor de SUV medio de los volúmenes de cáncer obtenidos en experimentos previos o la relación entre la intensidad de los valores de fondo y la intensidad de los valores del tumor o tumores cancer´ıgenos.

A menudo estas técnicas se basan en estudios estad´ısticos hechos mediante phan-toms, que, como hemos visto, son volúmenes experimentales expresamente diseñados para hacer estudios de este estilo. En pocas ocasiones se han hecho estudios utilizan-do casos reales y además, los estudios que se han hecho sobre casos reales utilizan volúmenes hallados manualmente por especialistas para contrastar con los volúmenes obtenidos usando técnicas de segmentación. Evidentemente, estos volúmenes usados pa-ra contpa-rastar no tienen por qué ser buenos ya que, como se ha visto en la sección 3.1.3, son subjetivos. Entonces, no hay garant´ıas de que el estudio sea del todo acertado si la validación se basa en resultados manuales [24]. Estos estudios mediantephantoms pue-den tener ruido y simular la heterogeneidad de los casos reales, aunque evipue-dentemente esto no es suficiente ya que los casos reales tienen much´ısima complejidad [24].

En resumen, se han propuesto muchas técnicas de umbralización que utilizan par´ ame-tros obtenidos experimentalmente pero cuyos umbrales var´ıan en base de ciertas carac-ter´ısticas generales de la imagen. Estos parámetros son fijos y se han obtenido para maximizar la precisión de estas técnicas en la delineación de PET. Entonces, ninguna de las siguientes técnicas está pensada para ser aplicadas en un ámbito general y los más probable es que los resultados no sean ni siquiera aceptables si se usan en otras ´

areas.

Ahora se revisarán brevemente algunas de las técnicas de umbralización dinámicas citadas en el documento [24]:

Relación logar´ıtmica con el volumen del tumor: según Biehl et al. (2006) [3] existe una relación logar´ıtmica entre el volumen del tumor y el umbral fijo relativo, obtenido mediante el estudio de volúmenes delineados manualmente en CT en pacientes con NSCLC. Ver la fórmula 3.4.

umbral( %) = 59,1−18,5×log₁₀(volumen del tumor) (3.4) Aunque en el art´ıculo [24] no queda especificado en qué unidad se debe introducir el volumen del tumor, los volúmenes con los que suelen trabajar están en mililitros y lo más probable es que se trate de esa unidad.