Trabajo de Fin de Grado
Dise˜
no e implementaci´
on de un m´
odulo para la
anotaci´
on de im´
agenes m´edicas
Isaac S´
anchez Ruiz (s10m024),
Grado en Matem´
aticas e Inform´
atica,
Escuela T´
ecnica Superior de Ingenieros Inform´
aticos (ETSIINF),
Universidad Polit´
ecnica de Madrid
´
Indice general
1. Introducci´on 1
2. Objetivos 6
2.1. Visi´on general del proyecto . . . 6
2.2. Objetivos espec´ıficos de este proyecto de Fin de Grado . . . 8
3. Estado del arte 10 3.1. Conceptos previos . . . 10
3.1.1. Segmentaci´on de im´agenes . . . 10
3.1.2. Proceso de segmentaci´on . . . 12
3.1.3. Caracter´ısticas de las im´agenes PET y CT . . . 13
3.2. T´ecnicas principales de segmentaci´on . . . 18
3.3. Segmentaci´on manual y semiautom´atica . . . 26
3.4. Segmentaci´on autom´atica . . . 28
3.4.1. T´ecnicas de umbralizaci´on . . . 29
3.4.2. T´ecnicas de multiumbralizaci´on . . . 37
4. Metodolog´ıa 40 4.1. T´ecnicas escogidas . . . 40
4.1.1. Umbralizaci´on de Otsu . . . 42
4.1.2. Umbralizaci´on de Ridler-Calvard . . . 45
4.1.3. Umbral fijo de Paulino . . . 46
4.1.4. Umbralizaci´on fija de Erdi . . . 47
4.2. Descripci´on del material de prueba . . . 48
4.2.1. Formato de las im´agenes PET . . . 48
4.2.2. Caracter´ısticas de los pacientes . . . 49
4.3. M´etodos de evaluaci´on . . . 53
5. Resultados 56
´
Indice de figuras
2.1. Esquema de la visi´on general del proyecto . . . 7
3.1. Ejemplo de imagen CT de t´orax . . . 13
3.2. Ejemplo de imagen PET de paciente con c´ancer de pulm´on . . . 14
3.3. Aplicaci´on de visualizaci´on PET-CT [5] . . . 16
3.4. Ejemplo de h´ıbrido PET-CT 3D . . . 17
3.5. Ejemplo de regi´on sin detectar en CT pero visible en PET [5] . . . 18
3.6. Proceso descrito dehill climbing [1] . . . 22
3.7. Ejemplo de algoritmo de Watershed descrito [1] . . . 23
3.8. (A) imagen original, (B) tras aplicar el operador Sobel, (C y D) tras umbralizar con distintos umbrales [1] . . . 24
3.9. Diferencias en 3 tumores distintos entre varios observadores indicado mediante contornos azules [12] . . . 27
3.10. Diferentes resultados obtenidos en el mismo paciente entre distintas se-millas iniciales (slices 79-85) [8] . . . 28
3.11. Ejemplos de im´agenes umbralizadas en NDT [20] y binarizaci´on de do-cumentos . . . 33
3.12. Esferas 1, 3 y 5 en ambos esc´aneres y los niveles de contraste [17] . . . 34
3.13. Medida de rendimiento de las 12 t´ecnicas probadas [17] . . . 35
4.1. Ejemplos de histogramas bimodales . . . 43
4.2. Segmentaci´on inicial [18] . . . 45
4.3. Esquema del algoritmo de Ridler [18] . . . 46
4.4. Vol´umenes 1 (rojo), 2 (amarillo) e intersecci´on (verde) . . . 51
4.5. Vol´umenes 5 y 6 . . . 51
4.6. Reconstrucci´on 3D de las im´agenes PET . . . 52
5.1. Resultados en varios pacientes . . . 64
´
Indice de cuadros
4.1. Tabla de SUV m´aximo . . . 49
4.2. Tabla de slices afectados de los pacientes . . . 50
5.1. Umbrales obtenidos con cada t´ecnica sobre el SUV . . . 56
5.2. Resultados de evaluaci´on usando la t´ecnica de Otsu . . . 58
5.3. Evaluaci´on de casos especiales usando Otsu . . . 58
5.4. Resultados de evaluaci´on usando la t´ecnica de Ridler . . . 59
5.5. Evaluaci´on de casos especiales usando Ridler . . . 59
5.6. Resultados de evaluaci´on usando la t´ecnica de Paulino . . . 60
5.7. Evaluaci´on de casos especiales usando Paulino . . . 60
5.8. Resultados de evaluaci´on usando la t´ecnica de Erdi . . . 61
5.9. Evaluaci´on de casos especiales usando Erdi . . . 61
Resumen
Desde hace tiempo ha habido mucho inter´es en la automatizaci´on de todo tipo de tareas en las que la intervenci´on humana es esencial para que sean completadas con ´exito. Esto es de especial inter´es si adem´as se necesita de personal muy cualificado para ciertas tareas que pueden ser perfectamente reproducibles y, o bien requieren mucha formaci´on, o bien consumen mucho tiempo.
Este proyecto est´a dirigido a la b´usqueda de m´etodos para automatizar la anotaci´on de im´agenes m´edicas. En concreto, se centra en el apartado de delimitaci´on de las regiones de inter´es (ROIs) en im´agenes de tipo PET siendo ´estas usadas con frecuencia junto con las im´agenes de tipo CT en el campo de oncolog´ıa para delinear vol´umenes afectados por c´ancer.
Se pretende con esto ayudar a los hospitales a organizar y estructurar las im´agenes de sus pacientes y relacionarlas con las notas cl´ınicas. Esto es lo que llamaremos el proceso de anotaci´on de im´agenes y la integraci´on con la anotaci´on de notas cl´ınicas respectivamente.
En este documento nos vamos a centrar en describir cu´ales eran los objetivos ini-ciales, los pasos dados para su consecuci´on y las dificultades encontradas durante el proceso.
De todas las t´ecnicas existentes en la literatura, se han elegido 4 t´ecnicas de segmen-taci´on, 2 de ellas probadas en pacientes reales y las otras 2 probadas s´olo enphantoms
Abstract
For a long period of time, there has been an increasing interest in automation of tasks where human intervention is needed in order to succeed. This interest is even greater if those tasks must be solved by qualified specialists in the area and the task is reproducible or if the task is too time consuming.
The main objective of this project is to find methods which can help to automate medical image annotation processes. In our specific case, we are willing to delineate regions of interest (ROIs) in PET images which are frequently used simultaneaously with CT images in oncology to determine those volumes that are affected by cancer.
With this process we want to help hospitals organize and structure the images they have from their patient studies and to relate these images to the corpus annotations. We may call this the image annotation process and the integration with the corpus annotation respectively.
In this document we are going to concentrate in the description of the initial ob-jectives, the steps we had to go through and the difficulties we had to face during this process.
From all existing techniques in the literature, 4 segmentation techniques have been chosen, 2 of them were tested in real patients and the other 2 were tested usingphantoms
Cap´ıtulo 1
Introducci´
on
En la actualidad, el uso de im´agenes m´edicas est´a muy extendido en el campo de la oncolog´ıa. El uso de im´agenes en el diagn´ostico y tratamiento de c´ancer ayuda a los especialistas a llevar a cabo sus tareas de forma m´as r´apida. Esto es vital en el diagn´ostico de pacientes que puedan padecer c´ancer ya que la detecci´on temprana de esta enfermedad puede ayudar a llevar a cabo un tratamiento r´apido y en consecuencia, reducir los da˜nos que pueda causar e incluso evitar el fallecimiento del paciente.
Las t´ecnicas de obtenci´on de im´agenes y los distintos tipos de im´agenes m´edicas que se usan en la actualidad es muy variado. Cada t´ecnica proporciona un tipo de im´agenes con caracter´ısticas distintas. Por su naturaleza, ciertas caracter´ısticas se adaptan mejor a ciertos tipos de problemas y, por tanto, el uso de las t´ecnicas est´a m´as extendido en unas ´areas dentro de oncolog´ıa que en otras.
De las regiones cancer´ıgenas detectadas en las im´agenes, se suelen extraer importan-tes datos como la forma, el volumen, la actividad metab´olica y la estructura de dicho volumen. La correcta extracci´on de estos datos depende en mayor o menor medida del tipo de imagen que se est´e utilizando.
Por esta raz´on, la combinaci´on de la informaci´on contenida en distintas im´agenes es una tendencia cada vez m´as popular. As´ı, se pretende aprovechar las ventajas que proporcionan los diversos tipos de im´agenes y superar, al ser posible, las restricciones que tiene el uso de una sola t´ecnica.
tambi´en existe otra t´ecnica para obtener im´agenes que hace uso de ondas ac´usticas. Esta t´ecnica se conoce como ultrasonido y suele tener aplicaci´on en el diagn´ostico de c´ancer de mama, pr´ostata y fibrosis del h´ıgado [6]. Tambi´en son comunes las im´agenes de resonancia magn´etica (MRI) las cuales se usan para detectar c´ancer, para estudiar la respuesta a terapia y guiar la terapia de forma m´ınimamente invasiva, entre otros.
Las caracter´ısticas de las im´agenes obtenidas a partir de la radiaci´on electromagn´ eti-ca var´ıan dependiendo de la frecuencia de la onda electromagn´etica. En el espectro de baja frecuencia (entre radiofrecuencia y luz visible), se encuentran t´ecnicas de ob-tenci´on de im´agenes como tomograf´ıas cerca del infrarrojo (NIR), im´agenes termo- y foto-ac´usticas; y tomograf´ıa de impedancia el´ectrica (EIT). Si bien este tipo de imagen es de utilidad, no son tan comunes como las im´agenes de mayor frecuencia ni como las de ultrasonidos, que han sido mencionadas en el p´arrafo anterior.
Entre las im´agenes de alta frecuencia y las de baja frecuencia, se encuentran las im´agenes generadas mediante luz visible. ´Estas se conocen como im´agenes de tipo ´optico y han quedado limitadas al uso en endoscopias, cat´eteres e im´agenes superficiales [6].
Por ´ultimo, las im´agenes de alta frecuencia (por encima de la frecuencia del ul-travioleta) son muy comunes y son las que se consideran de tipo ionizante. Im´agenes de este tipo son las im´agenes basadas en rayos X, las im´agenes de medicina nuclear y aqu´ellas basadas en emisi´on de positrones (PET). De todos estos tipos de im´agenes existen diversos derivados que tienen utilidad en diferentes ´areas. Este tipo de im´agenes son las que se usan en este trabajo, concretamente las im´agenes de tipo PET.
Todas las im´agenes que hacen uso de radiaci´on de baja frecuencia y aqu´ellas que hacen uso del espectro de luz visible, se dice que usan radiaci´on no ionizante, es decir, que la radiaci´on emitida no es capaz de liberar electrones de ´atomos y mol´eculas, por lo que se dice que no los ioniza. La radiaci´on ionizante supone un peligro para el paciente puesto que puede destruir y llegar a generar c´ancer en tejidos sanos tras un largo per´ıodo de exposici´on a una fuente de radiaci´on ionizante.
Por otro lado, se est´an haciendo avances usando distintos tipos de marcadores que parecen prometedores para identificar tumores cancer´ıgenos. ´Ultimamente, ha aumen-tado el uso de marcadores en las im´agenes m´edicas para resaltar y mostrar los efectos del metabolismo, la proliferaci´on y migraci´on de c´elulas entre otros [6].
Con esto, hemos introducido los tipos b´asicos de im´agenes y su capacidad, centr´ ando-nos ahora en las im´agenes de tipo CT, de PET y, posteriormente, el h´ıbrido PET-CT.
im´agenes que utilizan rayos X. Sin embargo, son distintos de las pruebas de rayos X a las que estamos acostumbrados en casos comunes de traumatismo tales como fracturas o fisuras de huesos. La diferencia reside en que las im´agenes CT no son planas, suelen ser tridimensionales o incluso cuatro-dimensionales. Los casos cuatro dimensionales son aquellos en los que se incluye la dimensi´on del tiempo. Se utiliza en casos en los que haya que observar el comportamiento del tumor tal y como sucede en pacientes con c´ancer de pulm´on. En estos casos, permite a los especialistas observar el tumor durante todo el ciclo de respiraci´on del paciente. Este tipo de im´agenes se conocen como im´agenes
anat´omicas debido a su naturaleza tal y como sucede con las im´agenes de rayos X.
Las im´agenes de tipo CT se pueden tomar principalmente con dos tipos de esc´aneres: el c-arm CT que est´a basado en un brazo que gira alrededor del paciente obteniendo va-rias im´agenes desde distintas perspectivas para la reconstrucci´on 3D [14]; y el multi-slice CT que se basa en grandes ´areas de detectores usando tubos de rayos X de alta poten-cia, de esta forma se pueden cubrir grandes vol´umenes de t´orax y abdomen mientras el paciente aguanta la respiraci´on. Tambi´en se ha utilizado ´este ´ultimo para escanear el cerebro [6].
Las t´ecnicas de CAD (Computer Aided Diagnostics) usando im´agenes CT se han extendido sobre todo para c´ancer de pulm´on y de colon. En los casos de c´ancer de pulm´on se identifican a menudo n´odulos sanos de los pulmones como cancer´ıgenos. Esto sucede porque el 50 % de las ocasiones, los n´odulos son tumores benignos y son casi indistinguibles en CT [6].
En resumen, las im´agenes CT tienen el beneficio de las im´agenes de rayos X, es decir, una muy alta resoluci´on debido a su naturaleza, pero tienen muy poca sensibilidad y como hemos visto antes, son de tipo ionizante. Y en este tipo de im´agenes, los tejidos blandos tienden a ser dif´ıciles de distinguir los unos de los otros tal y como sucede en los n´odulos pulmonares.
En cuanto a las im´agenes PET (Positron-Emission Tomography), es un tipo de tomograf´ıa que se obtiene tras haber emitido positrones mediante radioisotopos como
18F, 11C y 68Ga entre otros. El que se utiliza normalmente es el 18F. De hecho, s´olo
hay dos marcadores aprobados y ambos hacen uso del 18F. ´Estos son el 18F-FDG que contiene glucosa y se puede usar para marcar el metabolismo; y el 18F-NaF
2 que se
utiliza para ser incorporado en los huesos [6]. Este tipo de im´agenes se clasifican como im´agenes metab´olicas.
tumores como medida de la evoluci´on de la enfermedad era inadecuado ya que s´olo puede mostrar un retraso en la respuesta a la terapia y no da indicaciones sobre el metabolismo y otros par´ametros. ´Esta es la principal raz´on del uso de los marcadores en este tipo de im´agenes [6].
En este trabajo, nos vamos a centrar en im´agenes de FDG PET, que usan el primer marcador. Este marcador destacar´a los tumores malignos en la imagen ya que ´estos tienden a tener un metabolismo mucho mayor que el de los dem´as tipos de tejidos. Por tanto, cuando las c´elulas cancer´ıgenas consumen el FDG de la sustancia y hay una mayor concentraci´on del radiois´otopo 18F en dicha zona. ´Este emite positrones que
son detectados por el esc´aner y as´ı se acaba generando la imagen con mayor brillo o intensidad en torno a esa zona.
Las principales aplicaciones de las im´agenes PET incluyen diagn´ostico del tumor, estadificaci´on1, detecci´on de reca´ıda, seguimiento y evaluaci´on de respuesta ante la terapia [17]. Las zonas del cuerpo donde las im´agenes PET no son ´utiles son aqu´ellas ´
areas donde existe una concentraci´on del marcador que no se corresponde con un tumor maligno. Estas ´areas comprenden el cerebro, que siempre tiene un metabolismo alto; los ri˜nones, la pr´ostata y la vejiga [6].
En radioterapia, es muy importante conocer la extensi´on de los tumores malignos y para ello es necesario conocer el volumen de estos tumores. El volumen se puede determinar usando im´agenes de tipo PET. El procedimiento incluye la delineaci´on de la zona afectada por parte de un experto y del resultado obtenido, se obtiene el volu-men estimado del tumor. Los vol´umenes afectados se conocen como regiones de inter´es (ROIs) aunque este t´ermino se usa tambi´en en otras ´areas de medicina [17].
Debido a la naturaleza de las im´agenes PET, la tarea de delineaci´on manual no es tan sencilla como pueda ser esa misma tarea en otro tipo de vol´umenes en CT tal y como sucede con la distinci´on de huesos y tejidos blandos. Esto se debe a que la resoluci´on espacial de las im´agenes PET y el nivel de ruido es relativamente mayor que el existente en las im´agenes CT. Por tanto, la determinaci´on precisa de la zona cancer´ıgena y la no cancer´ıgena es una tarea complicada.
Por este motivo, la combinaci´on de im´agenes PET y CT es una buena alternativa en el sentido de que se pueden combinar las ventajas de ambos tipos de im´agenes. Estas ventajas son la sensibilidad de las im´agenes PET usando el marcador 18F-FDG
para la correcta evaluaci´on del progreso del tumor cancer´ıgeno y la resoluci´on espacial que proporcionan las im´agenes CT. As´ı las tareas de diagnosis y prognosis se pueden
realizar con mayor precisi´on.
Este tipo de imagen se conoce como PET-CT y se consigue realizando las pruebas de PET y CT al mismo tiempo sobre el paciente de forma que no haya variaciones entre ambos tipos de im´agenes. Si no se hiciesen simult´aneamente, se correr´ıa un alto riesgo de que las dos im´agenes no quedasen alineadas y carecer´ıa de sentido combinarlas.
A lo largo de este documento, se revisar´an las t´ecnicas encontradas en diversos art´ıculos para delinear las regiones de inter´es de las im´agenes PET, es decir, los vol´ ume-nes afectados por c´ancer. Esta revisi´on se har´a en el cap´ıtulo 3 del estado del arte.
En el cap´ıtulo 4 de metodolog´ıa, se proceder´a a describir las t´ecnicas escogidas para realizar las pruebas de delineaci´on en los pacientes de los que se dispone para este proyecto as´ı como la descripci´on de las caracter´ısticas del material de prueba.
Cap´ıtulo 2
Objetivos
2.1.
Visi´
on general del proyecto
Este proyecto Fin de Grado se enmarca en uno de los proyectos de investigaci´on que se est´an desarrollando en el Laboratorio de An´alisis de Datos y Simulaci´on (MIDAS) del Centro de Tecnolog´ıa Biom´edica de la UPM. El objetivo de este proyecto es la anotaci´on de im´agenes m´edicas junto con la anotaci´on de notas cl´ınicas.
El objetivo general de dicho proyecto es conseguir una herramienta que pueda ayudar a los m´edicos de los hospitales actuales y, por tanto, con el material actual; a estructurar, la informaci´on electr´onica disponible de los pacientes de manera autom´atica, para su posterior almacenamiento y consulta. Esta herramienta o herramientas est´an idealmente compuestas de varios m´odulos que deber´ıan ser capaces de coordinarse entre s´ı para conseguir el objetivo anterior.
El proyecto consta entonces de las siguientes partes desde un punto de vista general:
Anotaci´on de im´agenes
• Delineaci´on de las regiones de inter´es (ROI)
◦ Delineaci´on a baja resoluci´on espacial usando im´agenes PET
◦ Delineaci´on a alta resoluci´on espacial usando im´agenes CT a partir de lo obtenido en PET
• Anotaci´on de las ROI
◦ Asignaci´on de posici´on relativa de cada ROI en el cuerpo
◦ Caracterizaci´on de cada ROI en base a los resultados obtenidos con cada m´odulo
• Integraci´on con el m´odulo de anotaci´on de notas cl´ınicas
Anotaci´on de notas cl´ınicas
• An´alisis de las notas cl´ınicas del paciente/s
◦ Clasificaci´on de las partes del texto analizadas en base a algoritmos de aprendizaje entrenados con notas anteriores
◦ Continuaci´on de dicho entrenamiento para perfeccionar el modelo
• Estructuraci´on de los datos en una base de datos
En la siguiente (figura 2.1) se puede ver el esquema anterior de forma gr´afica:
Figura 2.1: Esquema de la visi´on general del proyecto
2.2.
Objetivos espec´ıficos de este proyecto de Fin
de Grado
Los objetivos generales del proyecto global han sido se˜nalados en la secci´on anterior. Este proyecto de Fin de Grado se centra en la delimitaci´on de las regiones de inter´es (ROI) en las im´agenes PET. ´Esta es la parte referida en la vista general como delineaci´on a baja resoluci´on.
La parte correspondiente al tratamiento de las im´agenes CT no ser´a incluido en este proyecto pero, sin olvidar que los resultados obtenidos deben poder usarse en ´estas y en el posterior proceso de combinaci´on o fusi´on de resultados PET con CT.
Entonces, el objetivo principal de este proyecto es la obtenci´on de los vol´umenes cancer´ıgenos correspondientes en las im´agenes PET de la manera m´as precisa dentro de las posibilidades.
Para conseguir este objetivo principal, se definen los siguientes objetivos espec´ıficos:
O1: Estudio de las t´ecnicas utilizadas hasta la fecha para escoger los m´etodos que, en el tiempo dado, sean los m´as indicados para resolver el problema.
O2: Definici´on de la arquitectura del m´odulo.
O3: Implementaci´on y desarrollo del subm´odulo de delineaci´on de ROIs.
O4: Validaci´on de resultados.
O5: Comparaci´on de los resultados con los diversos m´etodos escogidos.
O6: Documentaci´on del m´odulo.
Aparte de estos objetivos espec´ıficos, se pretende, si fuera posible la separaci´on de las diversas ROI en funci´on de los datos de posicionamiento relativo al cuerpo obtenidos mediante otro m´odulo del proyecto general (objetivoO7). Este objetivo queda entonces como objetivo adicional ya que no es en lo que se centra realmente este proyecto.
Cap´ıtulo 3
Estado del arte
En este cap´ıtulo se presentar´a con mayor detalle lo que se ha revisado en la literatura existente en lo referente al tema de la delimitaci´on de regiones de inter´es (ROI) en las im´agenes de tipo PET.
Posteriormente, se pasar´a a describir en detalle aquellas t´ecnicas que se han revisado para realizar la tarea de delineaci´on de PET as´ı como los problemas encontrados en la literatura. Las t´ecnicas escogidas para este proyecto y la descripci´on de la metodolog´ıa usada para realizar las pruebas no se describir´an en detalle hasta el cap´ıtulo 4.
3.1.
Conceptos previos
3.1.1.
Segmentaci´
on de im´
agenes
El primer concepto a revisar es ladelimitaci´on de estas ROI que estamos hablando. Hablaremos indistintamente a lo largo de este documento de delimitaci´on, delineaci´on
y de definici´on de las ROIs ya que en el contexto en el que estamos trabajando, sus significados los consideramos intercambiables.
imagen en una serie de conjuntos disjuntos1. A estos conjuntos disjuntos se les conoce
comosegmentos en el ´area de im´agenes. Podr´ıamos resumirlo matem´aticamente en que segmentar una imagen de cualquier tipo consiste en crear una partici´on sobre el con-junto de unidades que componen la imagen donde cada parte se corresponde con un segmento.
La unidad en las im´agenes sirve para relacionar un fragmento de la imagen ´unico con un dato de nuestro inter´es. Esto es lo que se conoce en el d´ıa a d´ıa como p´ıxel
si la imagen es de dos dimensiones o v´oxel si la imagen es de tres dimensiones. En medicina se suele tratar con ambos tipos de im´agenes as´ı que cuando nos refiramos a la unidad en las im´agenes hablaremos directamente de v´oxeles o p´ıxels dependiendo de las dimensiones de la misma.
El dato de inter´es que se relaciona con la posici´on del p´ıxel o del v´oxel depender´a de la informaci´on que se quiera obtener de la imagen y, por supuesto, de la informaci´on que proporcione la imagen. Normalmente, son interesantes datos de color o intensidad del p´ıxel o v´oxel en una dimensi´on. En el caso de ser de inter´es el color, se suelen usar 3 canales o incluso 4 canales de color, como los conocidos canales RGB (red, green, blue) y RGBA (red, green, blue, alpha). Aunque en las aplicaciones m´edicas es m´as com´un usar tan s´olo un canal de intensidad cuyo rango de valores var´ıa entre unos tipos de im´agenes y otras. Adem´as depende tambi´en del tipo de esc´aner utilizado. Se suele llamarprofundidad al n´umero de bits que cada p´ıxel puede almacenar, esto afecta a la cantidad de valores distintos que se pueden asociar a un p´ıxel o v´oxel en una imagen.
En general, la segmentaci´on de im´agenes es ´util para extraer caracter´ısticas de la imagen, para hacer medidas en regiones concretas y para mejorar la visualizaci´on de las im´agenes. En el ´area de medicina, es interesante distinguir tipos de tejidos distintos como huesos, m´usculos y venas, y en otras, interesa distinguir tejidos cancer´ıgenos, deformidades de tejidos o lesiones de esclerosis m´ultiple [1].
Como se puede observar en todos estos casos, el problema se ajusta al problema de segmentaci´on de im´agenes ya que, en general, de lo que se est´a tratando es de distinguir las diferentes regiones de la imagen y clasificarlas acorde con lo que representan en la realidad. La clasificaci´on entonces es importante llevarla a cabo correctamente, aunque la gravedad de las consecuencias por obtener resultados err´oneos depende del ´ambito en que se est´e trabajando.
1Recordar que una serie de conjuntos disjuntos cumple que cada uno de los elementos o unidades
3.1.2.
Proceso de segmentaci´
on
Para poder llevar a cabo el proceso de segmentaci´on de im´agenes es necesario saber qu´e queremos sacar de la imagen o im´agenes que queremos segmentar y adem´as, conocer la naturaleza de las mismas puesto que dependiendo de la forma, estructura y distribu-ci´on de la informaci´on que proporcione la imagen, har´a faltar resolver la soluci´on del problema siguiendo una estrategia u otra.
Entonces, lo primero que se debe identificar antes del proceso de segmentaci´on es el objetivo que tenemos, es decir, qu´e informaci´on queremos extraer. Una vez identificado, debemos entender c´omo se presenta la informaci´on en la imagen para elegir unat´ecnica de segmentaci´on y posteriormente, probarla sobre la imagen o conjunto de im´agenes para ver los resultados obtenidos.
En algunas ocasiones, ser´a necesario el uso de m´ultiples t´ecnicas durante el proceso para conseguir la segmentaci´on deseada [1]. El uso de m´ultiples t´ecnicas se puede llevar a cabo tanto en paralelo como en secuencia o incluso combinar en paralelo y en secuencia.
Habr´a casos en los que las t´ecnicas en secuencia utilizadas no se usen necesaria-mente para la segmentaci´on en s´ı, sino que m´as bien, se utilizan para adaptar ciertas condiciones de la imagen que no nos son favorables en el posterior proceso de segmen-taci´on. Estas t´ecnicas previas a la segmentaci´on se conocen en general en el campo de tratamiento de im´agenes como t´ecnicas de preprocesamiento. Estas t´ecnicas suelen usarse para reducir la cantidad de informaci´on que proporcionan estas im´agenes ya que a menudo, contienen m´as informaci´on de la deseada y dificulta la b´usqueda de patrones y, por tanto, la segmentaci´on de las im´agenes. Por ejemplo, el ruido que suele haber en muchas im´agenes dificulta la segmentaci´on de las mismas y hacer uso de ciertas t´ecnicas de preprocesamiento tal y como puede ser el conocido filtro gaussiano pueden ayudar a reducir el ruido de la imagen.
3.1.3.
Caracter´ısticas de las im´
agenes PET y CT
Ahora vamos a describir en m´as detalle las caracter´ısticas de las im´agenes CT y sobre todo PET as´ı como su uso en el tratamiento de pacientes con c´ancer y las dificultades a las que se enfrentan los especialistas cuando tienen que delinear tumores cancer´ıgenos usando estos tipos de im´agenes.
Como vimos en la introducci´on, las mayores diferencias presentes en las im´agenes PET y CT se daban en su sensibilidad y su resoluci´on. Esto afecta severamente a la nitidez de las im´agenes y la facilidad para distinguir las regiones de inter´es.
Una caracter´ıstica com´un tanto en las im´agenes PET como las im´agenes CT es que ambas son tridimensionales y, en ambas pueden abarcar pr´acticamente todo el cuerpo del paciente, aunque el esc´aner se hace normalmente tan s´olo del t´orax y del abdomen de los pacientes. Para hablar de las coordenadas que se manejan en estas im´agenes usaremos los ejes X e Y para referirnos a las coordenadas de cada una de las im´agenes bidimensionales obtenidas durante el proceso. Cada una de estas im´agenes se conoce comoslice y recorren el eje que llamaremos Z cada vez que sea necesario. Cada uno de los slices del paciente se corresponde con un “secci´on” del mismo en lo que se conoce como planotransversal del cuerpo.
Figura 3.1: Ejemplo de imagen CT de t´orax En oncolog´ıa, las im´agenes CT no son
sufienciente para poder delimitar o deli-near los vol´umenes de los tumores can-cer´ıgenos. El problema que se da con las im´agenes CT es que no hay marcadores equivalentes a los de PET que puedan ha-cer que los tumores malignos queden co-rrectamente definidos. Sin embargo, al ser im´agenes de relativamente alta resoluci´on, los resultados de la delineaci´on ser´ıan bas-tante m´as precisos aunque tambi´en ser´ıa mucho m´as laborioso. Pero esto no se pue-de aplicar a los vol´umenes cancer´ıgenos ya que a la vista de un especialista los teji-dos son pr´acticamente indistinguibles en muchos casos debido a lo que se acaba de comentar sobre los tejidos blandos.
delinea-ci´on es una tarea relativamente sencilla de realizar por un especialista. Por ejemplo, los tejidos ´oseos son muy f´aciles de distinguir frente a los tejidos blandos que pueda haber alrededor (suele haber mucho contraste). No siempre es sencillo automatizar estas tareas ya que en este tipo de im´agenes nos podemos encontrar con la presencia de artefactos o simplemente, la dificultad conocida que tienen los algoritmos de reconocimiento de patrones visuales en general.
Dentro del campo de oncolog´ıa, se usan entonces las im´agenes PET ya que son im´agenes en las que el marcador 18F-FDG se puede distinguir visual y anal´ıticamente
de las dem´as zonas debido al alto contraste. No obstante, como indicamos previamen-te, el problema de estas im´agenes es la baja resoluci´on y la presencia de ruido. Esto significa que los segmentos que obtengamos tras hacer el proceso de delineaci´on en es-tas im´agenes no ser´an tan homog´eneos como te´oricamente deber´ıan ser, con lo cual, es sencillo cometer errores en la delineaci´on autom´atica de este tipo de im´agenes.
Figura 3.2: Ejemplo de imagen PET de paciente con c´ancer de pulm´on
En la figura 3.2 se puede observar un ejemplo de imagen PET donde los tonos de color blanco se corresponden con valores de actividad metab´olica superiores y los de color negro se corresponden con valores inferiores. Como sabemos, la alta intensidad est´a directamente relacionada con que el esc´aner ha recibido muchos positrones de esa zona, lo que significa que hay mucho 18F-FDG concentrado en dichos puntos y ello
No saber si se trata exactamente de un tumor cancer´ıgeno puede dar muchos pro-blemas a la hora de averiguar qu´e zonas se deben considerar como falsos positivos. Sin embargo, se sabe de antemano que zonas como el cerebro, los ri˜nones, la pr´ostata y la vejiga, tienen una mayor concentraci´on de marcador (18F-FDG) [6]. El cerebro tiene
mayor concentraci´on puesto que siempre tiene mayor metabolismo. Pero esto no es lo que sucede con los ri˜nones y la vejiga, en estos casos, la mayor concentraci´on de mar-cador se debe a que al realizar el cuerpo la funci´on de excreci´on, almacena grandes cantidades de 18F puesto que la glucosa ya ha sido consumida durante el proceso de
metabolismo. Por tanto, cuanto m´as tiempo pase desde que se inyecta el marcador en el paciente, menos disperso est´a el marcador ya que se da tiempo a que se concentre en las zonas de metabolismo m´as alto; pero si la cantidad de tiempo transcurrido es demasiado alta, es posible que la mayor parte de marcador quede en la vejiga. En la figura 3.2 se pueden observar todas estas zonas que se acaban de comentar.
En casi todas las t´ecnicas conocidas, no se trabaja directamente con las intensidades de las im´agenes obtenidas mediante los esc´aneres PET. Normalmente, se hace una conversi´on a otra unidad que ya ha sido introducida anteriormente y que se llama
standard uptake value(SUV). El SUV es una medida tambi´en de la actividad metab´olica directamente relacionada con la cantidad de actividad metab´olica en cada v´oxel en funci´on del tiempo, del peso del paciente y de la cantidad de dosis inyectada [6, 24]. No tener en cuenta estos factores puede acarrear problemas ya que dependiendo del caso, los valores obtenidos pueden variar notablemente entre pacientes y se hace m´as complicada la comparaci´on de los valores en los mismos. Por tanto, el SUV apareci´o como un intento de unificar de alguna manera los valores obtenidos en todos los pacientes.
El SUV es concretamente una medida de correcci´on sobre la vida media del marcador por cada unidad de masa corporal y por cada dosis administrada en funci´on del peso del paciente. En otros t´erminos, el SUV se puede expresar como indica la f´ormula 3.1 extra´ıda del art´ıculo [24].
SU V = cm
di/w ·
1
d (3.1)
donde cm es la concentraci´on media de marcador en la ROI y se mide en M Bq/g
donde g son gramos y donde M Bq se entiende por millones de Bq (becquerel) que es una medida utilizada en el sistema internacional (SI) para medir la radiactividad; di
es la cantidad de dosis inyectada medida en M Bq, el peso del paciente w medido en gramos y el factor de tiempo de descomposici´on del marcador. Por tanto, con el SUV, se tiene en cuenta el tiempo que ha pasado desde el comienzo de las pruebas en el esc´aner. De hecho, incluso se tiene en cuenta el tiempo transcurrido entre unslice y otro.
que se encuentra el c´ancer y para ayudar a preveer la evoluci´on de la enfermedad [6].
El problema que tiene el uso del SUV es que la fiabilidad del mismo depende de una serie de factores t´ecnicos y de los pacientes [24, 11]. Factores como el tiempo que transcurre entre el momento de inyecci´on y el momento en el que comienzan las pruebas o como el grado de infiltraci´on del marcador en la zona de inyecci´on pueden afectar la correcci´on y fiabilidad del SUV, no siendo siempre la medida m´as indicada [24]. Sin embargo, este medida es la que se ha aceptado comunmente como la m´as acertada y es la que se suele utilizar en los hospitales actualmente.
Para poder evitar los problemas que tienen las im´agenes PET y CT y poder apro-vechar los datos que proporcionan ambos tipos de im´agenes, se hace uso del h´ıbrido PET-CT que ya fue introducido al comienzo de este documento. Con las im´agenes PET-CT estar´ıamos aprovechando la resoluci´on espacial de las im´agenes CT y la sensibilidad de las im´agenes PET.
Figura 3.3: Aplicaci´on de visualizaci´on PET-CT [5]
Las im´agenes PET-CT se suelen visualizar usando aplicaciones software (ver figura 3.3) que permiten dividir la interfaz de usuario en dos ventanas simult´aneamente de forma que en una ventana se muestran los resultados obtenidos por el esc´aner CT y los obtenidos por el esc´aner PET. La imagen 3.4 es un ejemplo de c´omo se representar´ıa el h´ıbrido PET-CT en tres dimensiones.
Figura 3.4: Ejemplo de h´ıbrido PET-CT 3D
las im´agenes PET y CT al mismo tiempo. Esto es importante ya que si se tuviesen que obtener en dos sesiones de pruebas distintas, se correr´ıa el riesgo de que el paciente no est´e alineado de la misma manera en ambas pruebas y entonces, la informaci´on es m´as dif´ıcil de tratar, sobre todo si se hace uso de t´ecnicas autom´aticas.
La combinaci´on de im´agenes PET y CT se hace hoy en d´ıa para evitar problemas que se dan al delinear vol´umenes tanto si se hace s´olo en PET como si se hace s´olo en CT. Los vol´umenes delineados en PET garantizan que si el tumor cancer´ıgeno ha sido captado por el esc´aner, es mucho menos probable que el operador entrenado en delimitaci´on de contornos de tumores cancer´ıgenos en im´agenes PET cometa el error de dejar el volumen sin delinear. Pero por otro lado, la baja resoluci´on de las im´agenes hace que la definici´on de los contornos no sea del todo acertada. Delimitar correcta-mente los vol´umenes es importante porque en casos como los carcinomas pulmonares no microc´ıticos (non-small-cell lung cancer o NSCLC) es normal que se requiera de ra-dioterapia ya que la quimioterapia no suele servir. Y durante el tratamiento mediante radioterapia, es imprescindible conocer el volumen cancer´ıgeno real con la mayor exac-titud posible puesto que la radioterapia es de tipo ionizante y si se cometen errores, se pueden afectar a zonas sanas pudiendo tener consecuencias graves.
En cuanto a las im´agenes CT, el problema reside en que hay ocasiones en las que no se detectan ciertas zonas afectadas porque a la vista de los espacialistas no lo parecen. Sin embargo, se puede conseguir una delineaci´on del tumor mucho m´as exacta y por consiguiente, la radioterapia tendr´a menos efectos nocivos.
los resultados obtenidos. En la siguiente figura (3.5) se muestra uno de los casos pre-sentados en dicho estudio en los que el operador no detect´o una de las zonas en CT, pero s´ı se detectaron en PET y, por tanto, fueron a˜nadidas posteriormente en PET-CT obteniendo un volumen considerablemente mayor que el anterior.
(a) CT sin detectar (b) PET equivalente
Figura 3.5: Ejemplo de regi´on sin detectar en CT pero visible en PET [5]
Con toda esta introducci´on de conceptos y t´ecnicas m´as o menos generales, concluye esta secci´on y se pasa a revisar las t´ecnicas encontradas en la literatura centr´andonos en el ´area de oncolog´ıa y las im´agenes CT y, sobre todo, PET ya que ´este es nuestra principal objetivo.
3.2.
T´
ecnicas principales de segmentaci´
on
En la secci´on 3.1.2 hemos visto que una vez que tenemos la imagen adecuada y hemos observado su naturaleza, podemos empezar a buscar una t´ecnica o conjunto de t´ecnicas que nos sean m´as adecuadas para la segmentaci´on definitiva de la imagen.
Para facilitar la elecci´on de las t´ecnicas de segmentaci´on, es muy conveniente saber c´omo se comportan estas t´ecnicas en el sentido de saber c´omo trabajan con la imagen de entrada y que hacen en el resto del procedimiento o algoritmo. Adem´as, hay t´ecnicas que requieren de cierta informci´on adicional de entrada en mayor o menos medida y, dependiendo del caso, puede que esto nos interese o no. Entonces, al existir muchas t´ecnicas y muchos derivados de ´estas, se va a hacer una clasificaci´on que pueda ayudar a distinguir las t´ecnicas por sus caracter´ısticas comunes frente a ciertos criterios de clasificaci´on.
Clasificaremos entonces usando los siguientes criterios de clasificaci´on [1]:
Grado de interacci´on - seg´un el grado de interacci´on que requiera la t´ecnica con respecto al usuario. Aunque como se puede comprender, es complicado decidir hasta qu´e nivel una t´ecnica es completamente autom´atica o si m´as bien deber´ıa ser vista como semiautom´atica. En caso de duda, se dar´a un razonamiento de por qu´e la clasificamos de una manera o de otra.
Manuales: grado de interacci´on m´aximo.
Semiautom´aticas: requieren ciertos par´ametros que se consideran excesivos como para ser clasificadas en el siguiente grupo.
Autom´aticas: no requieren interacci´on en absoluto o bien se requieren tan s´olo unos pocos par´ametros de menor importancia para la clasificaci´on.
Localizaci´on - en este caso estamos refiri´endonos a la localizaci´on o posici´on de la informaci´on que la t´ecnica extrae de la imagen.
Globales: que usan toda la informaci´on de la imagen al mismo tiempo.
Locales: basadas en regiones independientes de la imagen pudiendo ser in-cluso un solo p´ıxel o v´oxel.
Nivel de abstracci´on - al igual que suceder´ıa con el nivel de los lenguajes de progra-maci´on en funci´on a lo cercanos que son al hardware de la m´aquina, en nuestro caso nos referimos al nivel de manipulaci´on de la informaci´on que se maneja.
Delineaci´on manual: manipulaci´on al nivel m´as bajo posible, no hay ninguna “capa” de abstracci´on entre medias.
Segmentaci´on basada en modelos: t´ecnicas que tratan de relacionar datos usando modelos y, por tanto, aumentando el nivel de abstracci´on y de signi-ficado a la informaci´on extra´ıda. Algunos ejemplos de t´ecnicas de este estilo tales como t´ecnicas multimodales y t´ecnicas de programaci´on din´amica.
Rama de la ciencia - podr´ıamos decir que ´esta es la clasificaci´on cl´asica en el sentido de que se utilizan directamente grupos de t´ecnicas conocidos en otras ramas de la inform´atica.
Cl´asicas: aqu´ellas t´ecnicas que se dise˜naron espec´ıficamente para el an´alisis de im´agenes en general tales como la umbralizaci´on, las basadas en contornos y las basadas en regiones
Basadas en estad´ısticas.
Basadas en l´ogica borrosa (fuzzy logic). Basadas en redes neuronales.
Se har´a ahora una breve introducci´on a las t´ecnicas m´as populares en segmentaci´on de im´agenes m´edicas sin necesidad de seguir ning´un criterio de clasificaci´on espec´ıfico:
T´ecnicas de umbralizaci´on: estas t´ecnicas son las m´as comunes dentro de las t´ ecni-cas globales [1]. Las t´ecnicas de umbralizaci´on consisten en establecer un umbral sobre los valores (intensidad) que pueden tomar los p´ıxeles o v´oxeles de la imagen. De esta manera, se distinguen al menos dos clases en funci´on del umbral seleccionado. Estas dos clases son, la clase cuyos p´ıxeles o v´oxeles tienen dicho valor por encima del um-bral o igual y la clase de aqu´ellos que est´an por debajo de dicho umbral. Aunque esta definici´on s´olo sirve para los casos en los que se usa un solo umbral global, es decir, un ´
unico umbral aplicado a toda la imagen.
En general, podemos definir estas t´ecnicas de la siguiente manera asumiendo que se trabaja sobre un solo canal de intensidad de las im´agenes. Las t´ecnicas de umbralizaci´on se basan en clasificar todos los p´ıxeles, v´oxeles o la unidad en la dimensi´on que sea siguiendo la f´ormula 3.2.
g(¯x) =
(
1 sif(¯x)≥u
0 sif(¯x)< u (3.2)
La f´ormula anterior s´olo nos sirve para dar un solo umbral global, sin embargo, existen t´ecnicas que dan umbrales diferentes a cada zona o incluso a cada p´ıxel o v´oxel de la imagen. En este caso, bastar´ıa con sustituiru en la f´ormula poruh(¯x) donde h(¯x)
ser´ıa una funci´on que nos devuelve el ´ındice del umbral en la lista de umbrales para cada p´ıxel, v´oxel o en la dimensi´on que sea con coordenadas (¯x) en la imagen. Es decir, que se asume adem´as la existencia de una lista de umbrales para llevar a cabo este proceso de segmentaci´on descrito mediante la f´ormula.
Por otro lado, hay t´ecnicas de umbralizaci´on que se basan en establecer varios um-brales independientes en partes disjuntas de la imagen (umbral local) o que incluso establecen m´ultiples umbrales para obtener varios segmentos de objeto distintos (siem-pre se entiende que s´olo existe un segmento de fondo) en cuyo caso diremos que se trata demultiumbralizaci´on la cual ser´a descrita con mayor detalle en la secci´on 3.4.2.
En conclusi´on, podemos comprobar que las t´ecnicas de umbralizaci´on se centran en buscar diferencias entre intensidades de p´ıxeles o v´oxeles para establecer el umbral. Aunque, en realidad, el resultado sigue siendo una agrupaci´on de p´ıxeles o v´oxeles con caracter´ısticas similares.
Se mostrar´an ejemplos de im´agenes obtenidas mediante este tipo de t´ecnica m´as adelante, concretamente, en la secci´on 3.4.1.
T´ecnicas de crecimiento de regiones: las t´ecnicas de crecimiento de regiones en lugar de buscar la diferencia entre p´ıxeles o v´oxeles, tratan de agrupar aqu´ellos que tengan ciertas similitudes en alguna caracter´ıstica. Este tipo de t´ecnica comienza ha-ciendo uso de una semilla (seed en ingl´es) y un posterior proceso de crecimiento de la regi´on a partir de dicha semilla. La semilla deber´a ser un p´ıxel o v´oxel que se sabe que pertenece o predice que pertenece a dicha regi´on. La semilla puede ser introducida tanto por un operario en el programa como elegida mediante otro algoritmo [1]. Por tanto, el procedimiento podemos dividirlo en selecci´on de la semilla, crecimiento de la regi´on y determinaci´on del fin del proceso de crecimiento ya que no puede crecer indefinidamente.
ser evaluados en la siguiente iteraci´on.
La ventaja de este tipo de t´ecnica es que se extraen los p´ıxeles y v´oxeles con carac-ter´ısticas similares relativas a la intensidad en cada punto, pero adem´as, se tienen en cuenta las caracter´ısticas espaciales en la imagen. Por esta raz´on, las regiones obtenidas con estos procedimientos son siempre regiones conexas, lo cual ser´ıa necesario compro-bar en otros tipos de m´etodos si es que se requieren regiones necesariamente conexas. Por otro lado, una desventaja que presentan es que se obtienen distintos resultados de-pendiendo de qu´e semilla se elija. Pero no s´olo depende de la semilla, tambi´en depende enormemente del criterio de homogeneidad que se escoja.
Figura 3.6: Proceso descrito dehill climbing
[1] Un ejemplo de crecimiento de regiones es el uso dehill climbing en la delineaci´on de microcalcificaciones en mamogramas. Para usar esta t´ecnica, se comienza esco-giendo el m´aximo local que hay en dicha microcalcificaci´on y se usa como semilla. Desde este punto se dibujan de forma ra-dial una serie de l´ıneas con el mismo ´ angu-lo entre todas ellas. Estas l´ıneas determi-nan las direcciones en las que se va a rea-lizar elhill climbing. El hill climbing con-siste en avanzar p´ıxel a p´ıxel en la direc-ci´on escogida hasta alcanzar un m´aximo en una funci´on determinada [1]. En este caso, la funci´on representa la inclinaci´on (en el sentido de gradiente) que hay entre unas intensidades y otras. El punto de in-clinaci´on m´axima localmente es el punto escogido para cada l´ınea trazada.
Como podemos ver en la figura 3.6, se
escoge el m´aximo local de la zona de mayor intensidad de la imagen y desde ah´ı se alzan 16 l´ıneas equiespaciadas de forma radial para calcular mediante hill climbing
los 16 puntos que hacen de l´ımite de la regi´on. Estos puntos se usan despu´es como semillas para hacer crecer la regi´on hacia dentro, es decir, en este ejemplo el criterio de homogeneidad hace que se escojan p´ıxeles que se acerquen al m´aximo local tanto espacialmente como en t´erminos de intensidad.
y la extracci´on de la superficie del cerebro en otras ´areas de im´agenes m´edicas [1].
Algoritmo de Watershed: la segmentaci´on mediante el algoritmo de Watershed est´a basada en regiones y utiliza la morfolog´ıa de la imagen. De nuevo, se requiere una semilla interior a la futura regi´on, pero adem´as, se debe marcar tambi´en la zona a la que pertenece el fondo conocido de la imagen. Para ello, se puede hacer esto, de nuevo, mediante un operador, o bien, mediante un algoritmo que marque ambas cosas autom´aticamente usando conocimientos previos2 sobre la imagen [1].
(a) Elecci´on del punto interior y del fondo
(b) Algoritmo de Watershed tras aplicar el operador So-bel
Figura 3.7: Ejemplo de algoritmo de Watershed descrito [1]
Este algoritmo funciona intuitivamente de la siguiente forma (figura 3.7). Si asocia-mos la intensidad de los p´ıxeles de la imagen con la altitud de un terreno, la imagen tridimensional resultante ser´ıa la de un terreno con picos, monta˜nas y valles a distintas altitudes. Si pudi´esemos sumergir dicho terreno en agua de forma que el eje de altitud del terreno fuese paralelo al eje de profundidad en una ba˜nera, este algoritmo seleccio-nar´ıa los puntos en los que el agua comenzar´ıa a invadir otros valles distintos del valle externo. Es decir, b´asicamente, este algoritmo es capaz de distinguir los bordes de las “piscinas” que se formar´ıan en el terreno o, lo que es lo mismo, ser´ıa capaz de marcar cordilleras [1]. An´alogamente, si simul´asemos la caida de gotas de agua en cada uno de los puntos del terreno, podr´ıamos decir que el algoritmo es capaz de detectar qu´e puntos tienen una vertiente que da a un valle o a otro. Los puntos que lleven al valle donde
est´a la semilla interior son puntos pertenecientes a la “piscina” que nos interesa, los dem´as pertenecen al fondo.
No todas las im´agenes tienen esta caracter´ıstica de que nos interese marcar sus cordilleras, de hecho, es m´as usual querer delimitar tan s´olo la regi´on de mayor inten-sidad de estas im´agenes. Por tanto, lo que se puede hacer es convertir dichas im´agenes usando el operador Sobel3 para obtener una imagen donde la intensidad de los p´ıxeles
es proporcional a la diferencia de intensidades entre p´ıxeles vecinos, que en este caso, s´ı coinciden con el l´ımite de dicha regi´on [1].
Esta t´ecnica se utiliza en numerosas aplicaciones en im´agenes de dos dimensiones. Por ejemplo, es ´util para segmentar im´agenes microsc´opicas de la retina. Tambi´en se ha llegado a implementar una versi´on tridimensional para analizar im´agenes card´ıacas volum´etricas [1].
T´ecnicas basadas en contornos: estas t´ecnicas consisten en usar los contornos detectados en las im´agenes para hacer una posterior segmentaci´on de la misma. Al igual que en el caso anterior, lo que se hace es hallar los contornos usando un operador, normalmente basado en elgradiente, tal y como sucede con el operador Sobel (ver figura 3.8 B). Por tanto, la estrategia a seguir es la misma que la de antes, primero se obtienen los bordes de la imagen usando cierto operador y, despu´es, se determina qu´e bordes nos interesan [1].
Figura 3.8: (A) imagen original, (B) tras aplicar el operador Sobel, (C y D) tras um-bralizar con distintos umbrales [1]
En este caso, se suele hacer uso de t´ecnicas de umbralizaci´on sobre la imagen de gradientes para determinar cu´ales son los bordes que nos interesa clasificar como bordes (ver figura 3.8 C). Pero en muchas ocasiones, estos bordes no formar´an recintos cerra-dos, lo cual suele ser un requisito imprescindible en este tipo de segmentaci´on. Para poder cerrar los recintos tras haber realizado el proceso anterior, se suele hacer uso de t´ecnicas de postprocesado que cierran dichos recintos. Esto se puede hacer de forma autom´atica, aunque puede resultar ser una situaci´on bastante ambigua. En este caso, ser´a necesario hacer uso de m´etodos semiautom´aticos o completamente manuales [1]. Otra posibilidad es la de usar el operador Laplaciano en lugar de otros operadores, que incluye la informaci´on que proporcionan las segundas derivadas.
Estas t´ecnicas suelen presentar problemas en casos de ruido en las im´agenes ya que el ruido puede alterar significativamente los resultados y generar contornos que no nos interesen [1].
Diversas versiones de estos m´etodos se han utilizado para analizar im´agenes m´ edi-cas. Se ha utilizado para detectar las c´amaras ventriculares en im´agenes de resonancia magn´etica del coraz´on, para segmentar im´agenes de resonancia magn´etica del cerebro y para delinear venas [1].
T´ecnicas multimodales: las t´ecnicas multimodales se basan en utilizar la infor-maci´on que proporcionan varias im´agenes de distinta naturaleza al mismo tiempo. La variedad de la informaci´on que proporcionan dichas im´agenes depende del tipo de ima-gen que se trate. Podemos estar combinando caracter´ısticas de im´agenes que provienen de distintos tipos de esc´aner (MRI, PET, CT...) o bien podemos estar combinando im´agenes del mismo tipo de esc´aner pero adquiridas en distintos momentos, d´andonos informaci´on m´as completa sobre la evoluci´on de la enfermedad en el paciente.
Combinando m´ultiples t´ecnicas: en el caso de usar varias t´ecnicas lo que te-nemos es una imagen que, en lugar de tener un solo canal de intensidad, tiene varios canales de intensidad (como sucede con las im´agenes a color). Para poder sacar la in-formaci´on de estas im´agenes correctamente en m´ultiples im´agenes simult´aneamente, se suele hacer uso de t´ecnicas conocidas como puede ser k-nearest neighbors (kNN), fuzzy c-means, k-means o las redes de neuronas artificiales (RNA). Adem´as, es importante que estas im´agenes tengan poco ruido porque deben corresponderse las unas con las otras. El ruido y otros factores puede hacer que relacionar im´agenes sea mucho m´as complicado [1].
cerebro en dos versiones distintas de MRI para poder contrastar los tejidos que lo componen [1].
Adquisici´on en funci´on del tiempo: las t´ecnicas m´as conocidas para analizar en funci´on del tiempo se conocen comot´ecnicas de an´alisis param´etrico. En estas t´ ecni-cas la intensidad de cada elemento se contrasta con el tiempo generando unas gr´aficas. Se pueden elegir una serie de par´ametros como la intensidad m´axima y m´ınima que se utilizar´an para obtener unas im´agenes resultantes y poder hacer el estudio consecuente sobre ellas en funci´on de un solo par´ametro. Cada gr´afica se analiza asumiendo que las curvas tienen caracter´ısticas similares en el tiempo, es decir, que siguen el mismo patr´on [1].
Este tipo de t´ecnica se ha utilizado por ejemplo en segmentaci´on tridimensional de lesiones de escler´osis m´ultiple en im´agenes MRI obtenidas a lo largo del tiempo. Despu´es, se escogen par´ametros como por ejemplo, variaci´on de la intesidad en las lesiones conocidas, momento de aparici´on o momento de desaparici´on de las mismas. Con esto, se obtienen unas im´agenes en las que se pueden observar resaltadas otras lesiones que siguen los patrones establecidos por los par´ametros elegidos.
Con esto, se han introducido en menor detalle las t´ecnicas m´as populares en el mundo del an´alisis de im´agenes m´edicas, se han proporcionado ciertos ejemplos sobre c´omo se aplica determinada versi´on de la t´ecnica y en qu´e ´ambitos reales se ha probado. Adem´as, se han dado ciertas nociones para entender las ventajas y desventajas que pueden tener estos tipos de t´ecnicas en funci´on de la situaci´on.
3.3.
Segmentaci´
on manual y semiautom´
atica
Ahora se procede a introducir tanto la segmentaci´on manual como la semiautom´ ati-ca en im´agenes PET y CT en base a lo descrito en la clasificaci´on 3.2. La informaci´on adicional que se debe proporcionar en cada t´ecnica var´ıa evidentemente seg´un el con-texto y seg´un la t´ecnica que se est´e utilizando. En nuestro caso, en el campo de la oncolog´ıa, las t´ecnicas semiautom´aticas suelen requerir informaci´on previa acerca de la posici´on de los vol´umenes de c´ancer. En muchos casos, basta con introducir un punto interior al volumen.
de mucha experiencia y de mucho tiempo para llegar a delinear los vol´umenes de la forma m´as correcta posible.
Aunque disponer de un especialista muy entrenado pueda parecer garant´ıa de ob-tenci´on de resultados suficientemente correctos, esto no es del todo cierto. Es conocido el problema de que la delineaci´on manual no es del todo objetiva, es decir, que depende de cada especialista. Esto se le llama variabilidad entre observadores (inter-observer variability) y est´a ilustrado en la figura 3.9 [24, 12]. Adem´as, tambi´en se sabe que exis-te un problema de variabilidad en la delineaci´on manual debido a la configuraci´on del programa que el especialista est´e usando [24].
Figura 3.9: Diferencias en 3 tumores distintos entre varios observadores indicado me-diante contornos azules [12]
En el caso de las im´agenes CT, tambi´en existen problemas para obtener la delinea-ci´on m´as correcta posible. De hecho, se suele sobreestimar la extensi´on del tumor para garantizar que la delineaci´on no queda fuera de la lesi´on [8].
Para evitar estos problemas se hace uso a menudo de t´ecnicas de crecimiento de regiones. Tal y como se explic´o en la secci´on 3.2, estas t´ecnicas consisten en el uso de al menos una semilla oseed principal la cual se usa como punto de partida para hacer crecer la regi´on hasta el punto que se crea conveniente.
Figura 3.10: Diferentes resultados obtenidos en el mismo paciente entre distintas semi-llas iniciales (slices 79-85) [8]
3.4.
Segmentaci´
on autom´
atica
Los procesos de segmentaci´on autom´atica o sin supervisar son los que vamos a analizar con m´as detalle en esta secci´on, s´olo que esta vez nos centraremos tan s´olo en PET.
resultado que se pretende, por tanto, en el fondo sigue estando presente un operario. Pero como estos par´ametros se pueden conseguir en realidad entrenando un modelo o a trav´es de datos estad´ısticos, al final se pueden considerar como autom´aticos.
La segmentaci´on autom´atica o, en nuestro caso, la podemos llamar “delineaci´on” autom´atica, presenta varias ventajas especialmente frente a la segmentaci´on manual. Principalmente, podr´ıamos hablar de una ventaja en la falta de variabilidad frente a la que pueda haber entre varios observadores en el caso manual. Evidentemente, esto depende en gran medida en el algoritmo utilizado ya que algoritmos basados en par´ ame-tros aleatorios carecen de rigor tal y como suced´ıa con el crecimiento de regiones (ver 3.10). En este sentido estar´ıamos hablando de una mayor reproducibilidad de las prue-bas puesto que podr´ıan repetirse en distintas ocasiones y siempre obtener los mismos resultados. Como es l´ogico, esto es algo muy positivo de cara a hacer mediciones y a intentar predecir el comportamiento de las t´ecnicas autom´aticas en su futuro uso.
Y adem´as de esto, como tambi´en es evidente, el hecho de disponer de t´ecnicas au-tom´aticas hace que no sea necesario, en nuestro caso, disponer de un operador entrenado ni de que tenga que emplear tanto tiempo en analizar las im´agenes y sus respectivos vol´umenes cancer´ıgenos.
Ahora procedemos a explicar las distintas t´ecnicas encontradas que potencialmente podr´ıan ser ´utiles para ser aplicadas a lo que nos concierne que son las im´agenes PET y el h´ıbrido PET-CT. Tambi´en se describir´an los problemas encontrados en la revisi´on de la literatura en los casos que sean necesarios tales como incoherencias o falta de datos sobre los experimentos entre distintas publicaciones.
3.4.1.
T´
ecnicas de umbralizaci´
on
Las t´ecnicas de segmentaci´on m´as populares en an´alisis de im´agenes m´edicas ya han sido introducidas anteriormente y entre ellas estaba la umbralizaci´on (ver 3.2). Por ello nos vamos a centrar m´as adelante en revisar aqu´ellas que est´an disponibles en la literatura pero aplicadas a nuestro campo de estudio de las im´agenes PET. Para recordar en qu´e consisten las t´ecnicas de umbralizaci´on desde un punto de vista general ir al p´arrafo 3.2.
Umbralizaci´on fija
Entendemos por umbralizaci´on fija a aqu´ella basada en un umbral constante, aun-que tambi´en se suele entender como umbralizaci´on fija a umbrales fijos pero relativos al rango de valores de la imagen. Entonces, podemos distinguir entre umbrales fijos
absolutos y umbrales fijosrelativos respectivamente.
En la literatura se han propuesto distintos m´etodos de umbralizaci´on fija, aunque s´olo se ha propuesto uno de umbralizaci´on fija absoluta sobre los valores del SUV (para recordar qu´e es el SUV, ver la descripci´on en la subsecci´on 3.1). Este umbral tiene el valor 2,5 sobre el SUV y fue propuesto por Paulino et al. [16]. Este umbral se hall´o realizando estudios y comparativas sobre tumores malignos en pacientes de c´ancer en la cabeza y el cuello.
El problema de los umbrales absolutos para distinguir entre zonas afectadas por c´ancer y las zonas no afectadas es que existe cierta inhomogeneidad en los tumores, lo cual puede dificultar la b´usqueda de un umbral ideal [24]. Adem´as, puede haber muchos artefactos en las im´agenes haciendo que estos m´etodos no sirvan [24]. De hecho, se ha probado que este m´etodo ha fallado en ciertas pruebas [24] y sigue siendo un tema de discusi´on en el ´area [24, 13]. No obstante, este m´etodo se utiliza habitualmente en los hospitales como primera aproximaci´on al volumen ideal del tumor y posteriormente, si hay cierta inexactitud, se corrige manualmente a partir de lo hallado por esta t´ecnica de umbralizaci´on.
Por otro lado, como hemos dicho, existen umbrales que clasificaremos como fijos, pero que son relativos a los valores de intensidad de la imagen. Estos umbrales rela-tivos se empezaron a proponer porque seg´un algunos estudios, el umbral ideal var´ıa dependiedo del tama˜no de la esfera (phantom4) que se use para llevar a cabo el estudio
estad´ıstico, de la relaci´on con la actividad del fondo y de otros factores [24, 4]. Es decir, que como ya se ha dicho, queda demostrado que los umbrales fijos absolutos, no son suficientemente precisos en todos los casos.
El umbral que m´as se suele utilizar en la literatura es el umbral relativo constante del 42 % o, en algunas ocasiones, del 40 %. Este umbral constante se suele aplicar sobre los valores del SUV de la forma descrita en la siguiente ecuaci´on 3.3.
umbral = 0,42×(maximo−m´ınimo) + m´ınimo (3.3)
Es decir, que se aplica el 42 % al m´aximo valor de la imagen para determinar el umbral
4Los phantom son vol´umenes preparados para hacer pruebas que, en este caso, se rellenan de
absoluto [4]. Este estudio fue llevado a cabo por Erdi et al. en el documento [4] donde se asegura que todos los umbrales relativos constantes se encuentran siempre entre el 36 % y el 44 %. Este estudio se llev´o a cabo usando phantoms con forma de esfera de diversos tama˜nos.
Umbralizaci´on din´amica
Entendemos entonces como umbralizaci´on din´amica a cualquier t´ecnica que no est´e basada en un umbral fijo ya sea relativo o absoluto. En resumen, es lo opuesto a lo que se ha descrito anteriormente.
La umbralizaci´on din´amica se puede entender tambi´en en mayor o menor medida como “fija” si contiene par´ametros constantes que se han obtenido mediante estudios estad´ısticos, normalmente usando l´ıneas de regresi´on o m´etodos similares. En otras ocasiones, los par´ametros no tienen nada que ver con estudios hechos y tan s´olo sirven para guiar al algoritmo y para conseguir unos resultados determinados. Entonces, tal y como se dijo en la clasificaci´on 3.2, ´este es uno de aquellos casos de los que no estamos seguros de c´omo clasificarlos. Por el momento, diremos que la umbralizaci´on fija se da s´olo en los casos descritos anteriormente, y los dem´as los clasificaremos directamente como din´amicas aunque haya dudas presentes.
Ahora separaremos las t´ecnicas de umbralizaci´on din´amicas en dos grupos en funci´on de su objetivo de dise˜no. Distinguiremos entonces t´ecnicas de umbralizaci´on din´amicas cl´asicas y t´ecnicas de umbralizaci´on din´amicas de PET.
Umbralizaci´on din´amica cl´asica
Vamos a empezar hablando de las t´ecnicas de umbralizaci´on din´amicas cl´asicas que no se inventaron necesariamente con la idea de que fuesen aplicadas en un campo determinado. Es decir, en cierto sentido son t´ecnicas de umbralizaci´on con un enfoque general. Dentro de estas t´ecnicas cl´asicas, se pueden distinguir distintos tipos seg´un la estrategia que sigan a la hora de realizar los c´alculos [20]:
Basadas en la forma del histograma: se analizan las curvas (m´aximos locales, m´ıni-mos locales,...) de los histogramas para determinar el umbral.
se intentasen clasificar esos dos grupos siguiendo dos distribuciones gaussianas, una para cada grupo. Para que este tipo de umbralizaci´on d´e buenos resultados es importante que el histograma sea suficientemente bimodal [15]. Esto implica que el histograma5 debe representar una distribuci´on de las intensidades de la imagen
de forma que haya un “valle” bien definido entre ambos grupos. Si este valle es inexistente, los resultados no tendr´an por qu´e ser buenos.
Basadas en entrop´ıa: aqu´ellas que analizan la imagen en base a la entrop´ıa de los segmentos de fondo y de objeto, la entrop´ıa de la iamgen binarizada frente a la imagen original o, en general, cualquier derivado que requiera de an´alisis de entrop´ıa para poder decidir sobre los segmentos resultantes.
Basadas en los atributos de los objetos: tratan de buscar similitud entre atribu-tos entre la imagen original y la imagen binarizada resultante tales como el an´ ali-sis de la forma usando l´ogica borrosa (fuzzy), an´alisis de la coincidencia entre los bordes, etc.
M´etodos espaciales: utilizan distribuciones de probabilidad y/o correlaci´on entre p´ıxeles de la imagen para determinar los segmentos.
M´etodos locales: este tipo de m´etodos en lugar de dar un umbral para todos los p´ıxe-les, dan un umbral para cada p´ıxel bas´andose en caracter´ısticas locales (aqu´ellas que pertenecen a los vecinos de los p´ıxeles analizados).
Estas t´ecnicas de umbralizaci´on son tambi´en populares fuera del ´ambito de las im´agenes m´edicas. Pueden ser ´utiles por ejemplo para automatizar tareas de testing no destructivo (NDT) [20]. Puede ser ´util en tareas como la detecci´on autom´atica de peque˜nas roturas y corrosi´on del fuselaje de los aviones en im´agenes obtenidas mediante corriente Eddy (figura 3.11a). Tambi´en es com´un la detecci´on de defectos en pl´asticos reforzados con fibra de vidrio (GFRP) a trav´es de im´agenes de ultrasonidos (figura 3.11b) y en la inspecci´on de circuitos impresos (figura 3.11c). Estas tareas son muy tediosas y requieren de mucha concentraci´on por parte de los operarios que lo hacen manualmente.
Es tambi´en muy com´un el uso de umbralizaci´on para labinarizaci´on de documentos, es decir, la separaci´on del documento en dos segmentos: el fondo, que corresponde al papel; y el objeto que en este caso corresponde a los caracteres que componen el documento [20]. Este tipo de aplicaciones puede servir para la automatizaci´on de tareas de lectura de documentos y su conversi´on a formato electr´onico sin necesidad de un operario (figura 3.11d). Adem´as de las im´agenes originales, se muestran las im´agenes ya umbralizadas manualmente con el umbral ideal para cada caso.
(a) Eddy (b) GFRP (c) PCB
(d) Binarizaci´on de un documento y el resulta-do tras umbralizar
Figura 3.11: Ejemplos de im´agenes umbralizadas en NDT [20] y binarizaci´on de docu-mentos
Como estas t´ecnicas se crearon con una visi´on general, se pueden aplicar a casi cualquier tipo de imagen y pueden dar buenos resultados en general. Todo esto se puede hacer siempre y cuando la imagen cumpla con los requisitos necesarios para poder hacer umbralizaci´on, es decir, que la imagen tenga un solo canal de intensidad. Si la imagen tuviese varios canales, habr´ıa que convertirlas primero a im´agenes de un solo canal.
Figura 3.12: Esferas 1, 3 y 5 en ambos esc´aneres y los niveles de contraste [17]
contraste en cada prueba. Las im´agenes PET de estosphantoms se obtuvieron usando dos tipos de esc´aner distintos que tienen distintas caracter´ısticas y producen distintas cantidades de ruido al extraer las im´agenes [17].
Para la realizaci´on de estas pruebas se sigui´o el protocolo est´andar en cada uno de los esc´aneres, lo que incluye un proceso de correcci´on de la atenuaci´on para la obtenci´on de las im´agenes finales. Para simular el contraste que se da en im´agenes PET ordinarias se inyect´o marcador de fondo en el material de prueba de ambas pruebas (las de los dos esc´aneres) en distintas cantidades siguiendo tres niveles de contraste (tambi´en conocido como source-to-background) diferentes (2:1, 4:1 y 8:1). Adem´as, la profundidad de las im´agenes obtenidas se pas´o de 16 bits a 8 bits [17].
En resumen, en este experimento se generaron un total de 36 pruebas (6 esferas, 3 niveles de contraste y 2 esc´aneres) las cu´ales se pueden observar en la figura 3.12.
Figura 3.13: Medida de rendimiento de las 12 t´ecnicas probadas [17]
Se utilizaron tres indicadores de rendimiento para comparar los resultados obtenidos con los vol´umenes conocidos de las esferas. De estos indicadores se calcul´o la media para que sirviese de medida de rendimiento definitiva. Seg´un este art´ıculo, las t´ecnicas de
clustering (ver la clasificaci´on 3.4.1 para recordar cu´ales son las t´ecnicas declustering) fueron las que dieron los mejores resultados y, en concreto, las t´ecnicas de umbralizaci´on de Ridler, Ramesh, Otsu y Yanni dieron mejores resultados que la t´ecnica de 42 % fijo (ver figura 3.13). De hecho, las t´ecnicas de Ridler y de Ramesh fueron las que mejores resultados dieron [17]. Esta medida de rendimiento est´a basada en una medida del error, por tanto, cuanto m´as bajos sean los resultados de los indicadores, mejor es el resultado (de nuevo, ver figura 3.13).
Este art´ıculo es el ´unico art´ıculo encontrado que parece hacer una comparativa completa de t´ecnicas cl´asicas, aunque s´olo se centre en la umbralizaci´on.
Umbralizaci´on din´amica de PET
m´aximo, el valor de SUV medio de los vol´umenes de c´ancer obtenidos en experimentos previos o la relaci´on entre la intensidad de los valores de fondo y la intensidad de los valores del tumor o tumores cancer´ıgenos.
A menudo estas t´ecnicas se basan en estudios estad´ısticos hechos mediante phan-toms, que, como hemos visto, son vol´umenes experimentales expresamente dise˜nados para hacer estudios de este estilo. En pocas ocasiones se han hecho estudios utilizan-do casos reales y adem´as, los estudios que se han hecho sobre casos reales utilizan vol´umenes hallados manualmente por especialistas para contrastar con los vol´umenes obtenidos usando t´ecnicas de segmentaci´on. Evidentemente, estos vol´umenes usados pa-ra contpa-rastar no tienen por qu´e ser buenos ya que, como se ha visto en la secci´on 3.1.3, son subjetivos. Entonces, no hay garant´ıas de que el estudio sea del todo acertado si la validaci´on se basa en resultados manuales [24]. Estos estudios mediantephantoms pue-den tener ruido y simular la heterogeneidad de los casos reales, aunque evipue-dentemente esto no es suficiente ya que los casos reales tienen much´ısima complejidad [24].
En resumen, se han propuesto muchas t´ecnicas de umbralizaci´on que utilizan par´ ame-tros obtenidos experimentalmente pero cuyos umbrales var´ıan en base de ciertas carac-ter´ısticas generales de la imagen. Estos par´ametros son fijos y se han obtenido para maximizar la precisi´on de estas t´ecnicas en la delineaci´on de PET. Entonces, ninguna de las siguientes t´ecnicas est´a pensada para ser aplicadas en un ´ambito general y los m´as probable es que los resultados no sean ni siquiera aceptables si se usan en otras ´
areas.
Ahora se revisar´an brevemente algunas de las t´ecnicas de umbralizaci´on din´amicas citadas en el documento [24]:
Relaci´on logar´ıtmica con el volumen del tumor: seg´un Biehl et al. (2006) [3] existe una relaci´on logar´ıtmica entre el volumen del tumor y el umbral fijo relativo, obtenido mediante el estudio de vol´umenes delineados manualmente en CT en pacientes con NSCLC. Ver la f´ormula 3.4.
umbral( %) = 59,1−18,5×log10(volumen del tumor) (3.4) Aunque en el art´ıculo [24] no queda especificado en qu´e unidad se debe introducir el volumen del tumor, los vol´umenes con los que suelen trabajar est´an en mililitros y lo m´as probable es que se trate de esa unidad.