Técnicas bayesianas para tomografía óptica

(1)

Tomograf´ıa ´

Optica

Por

Guido Rodrigo Baez

Trabajo de Tesis para optar al T´ıtulo de Doctor en Matem´atica Computacional e Industrial

Directores: Guillermo Elicabe

Juan Pomarico

Centro de Investigaciones en F´ısica e Ingenier´ıa del Centro de la Provincia de Buenos Aires (UNCPBA - CONICET - CICPBA)

Facultad de Ciencias Exactas

Universidad Nacional del Centro de la Prov. de Bs. As.

(2)

(3)

(4)

Agradecimientos

Quiero agradecer a las personas que me acompañaron estos años de trabajo doctoral. Primero que todo, quiero agradecer a mi familia, Brenda, mi madre Marta, José y Mariano, siempre dispuestos a acompañarme en todo momento. Luego quiero agradecer a mis direc-tores, Dr. Juan Pomarico y Dr. Guillermo Elicabe, por guiarme en el inicio de este camino que es el camino de la investigación cient´ıfica. Su gu´ıa y amistad resultaron ser herramientas fundamentales, además de su experticia y predisposición ante eventuales problemas. Tam-bién quiero agradecer a todo el grupo de Óptica Biomédica del Centro de Investigaciones en F´ısica e Ingenier´ıa del Centro de la Provincia de Buenos Aires por su buena predisposición y alegr´ıa diaria. Finalmente, aprovecho para agradecer a la Facultad de Ciencias Exactas de la Universidad Nacional del Centro de la Provincia de Buenos Aires.

(5)

(6)

´

_{Indice general}

Agradecimientos 3

´_{Indice de figuras} ₁₅

´_{Indice de tablas} ₁₆

Resumen 18

Abstract 21

Introducci´on 24

1. Sobre las modalidades de la Tomograf´ıa ´Optica 29

1.1. Resumen . . . 30

1.2. Sistemas Frequency-domain . . . 31

1.3. Sistemas Time-domain . . . 33

1.3.1. Instrumentaci´on para experimentaci´on en el dominio del tiempo . . . 37

2. Sobre el Problema Directo 43 2.1. Resumen . . . 44

2.2. Introducci´on . . . 45

2.3. Ecuaci´on de Transferencia Radiativa . . . 47

(7)

3. Sobre el Problema Inverso 59

3.1. Resumen . . . 60

3.2. Problemas inversos determin´ısiticos . . . 61

3.2.1. Descomposici´on en valores singulares . . . 62

3.2.2. Cuadrados m´ınimos en problemas lineales . . . 64

3.2.3. Regularizaci´on de Tikhonov: caso lineal . . . 65

3.2.4. El caso no-lineal. . . 68

3.2.5. Regularizaci´on de Tikhonov no-lineal . . . 68

3.3. Problemas Inversos Estad´ısticos . . . 69

3.3.1. Otros modelos expl´ıcitos de verosimilitud . . . 74

3.3.2. Construcci´on de distribuciones a priori . . . 76

3.3.3. Campos Aleatorios de Markov . . . 77

3.3.4. Informaci´on a posteriori . . . 79

3.4. Cadenas de Markov de Monte Carlo . . . 84

3.4.1. Construcción del Kernel mediante el algoritmo de Metropolis-Hastings 87 3.4.2. Implementación de la técnica de Metropolis-Hastings . . . 90

3.4.3. Metropolis-Hastings de n´ucleo adaptativo. . . 97

3.4.4. Criterio de convergencia . . . 98

3.5. Filtro de Kalman Extendido . . . 100

3.5.1. Problemas inversos no estacionarios . . . 100

3.5.2. Modelos de Observaci´on y Evoluci´on . . . 100

3.5.3. Filtro de Kalman . . . 104

3.5.4. Filtro de Kalman Extendido . . . 112

3.5.5. Error de modelo. . . 115

4. Adquisici´on y procesamiento de datos 124 4.1. Resumen . . . 125

4.2. Adquisici´on de datos . . . 126

4.3. Calibraci´on . . . 128

4.4. Estimaci´on de las propiedades para un medio homog´eneo . . . 134

(8)

4.5.1. Simulaciones computacionales . . . 143

4.5.2. Experimento sobre fantoma . . . 147

5. Resultados 153

Conclusiones y Trabajos futuros 164

(9)

´

_{Indice de figuras}

1.1. Esquema representativo de un sistema CCD. Una fuente (Laser) inyecta luz

en un medio mediante una fibra ´optica (F.O). Una c´amara de CCD colecta la

luz emergente desde la cara opuesta. . . 32

1.2. Esquema representativo de los datos que se colectan en un sistema FD. Una

fuente de amplitudA0 modulada a la frecuenciaω se inyecta dentro del medio

turbio. En la salida, se compara la se˜nal de salida (con amplitud A1) con la

de entrada not´andose cambios en la amplitud y en la fase. . . 32

1.3. Esquema representativo de un sistema FD. Los generadores de radiofrecuencias

se utilizan para comparar los datos con la referencia. Las siglas indican lo

siguiente: amp, amplificador. Mixer: mezclador. DC source: fuente DC. LPF:

filtro pasa-bajos. PC: computadora. PMT: fotomultiplicador. . . 34

1.4. Esquema experimental de un sistema TCSPC. Se emite radiaci´on por un

per´ıodo de tiempo muy corto que sale desde el l´aser y viaja a trav´es de la

fibra ´optica (FO). Atraviesa el medio turbio y es colectada por otra fibra que

lleva la luz observada hacia un fotomultiplicador (PMT), que lo lleva hacia el

(10)

1.5. Izquierda: variaciones de tres pulsos te´oricos cuando el valor deµaes 0,02,0,01

y 0,005mm−1. El valor de µ0_s es 2mm−1. Se puede ver que la pendiente de la curva logar´ıtimica es más pronunciada cuando mayor es el valor deµa, esto se debe a que a mayor absorción, mayor probabilidad de pérdida de fotones lentos (los que tienen que recorrer caminos más largos para llegar al detector), lo que

se traduce en menos luz en el detector. Derecha: variaciones de tres pulsos

te´oricos cuando el valor deµ0_s es 3,2 y 1mm−1_{. El valor de}_µ

aes 0,01mm−1.Se

puede observar que cuandoµ0_sdecrece, el flanco ascendente tiene una pendiente m´as pronunciada. Esto se debe que, al haber menos eventos de scattering, los

fotones llegan m´as r´apidamente al detector. La geometr´ıa utilizada es un slab

de 35mm de espesor. . . 35

2.1. Diagrama del problema directo. Dado el operadorH :P → F que devuelve la fluencia a partir del conjunto de par´ametros, y el operadorP :F → M, que a

partir de la fluencia devuelve la medida que se realiza en el borde. El modelo

directo es la funci´onF :P → M que, a partir de un conjunto de par´ametros devuelve una medida en el contorno del medio que se desea estudiar.. . . 46

2.2. Ejemplo de una malla bidimensional con elementos triangulares. La

circunfe-rencia es de radio 30 mm . . . 55

2.3. Distribuci´on de detectores correspondiente a la malla de la figura 2.2. La fuente

est´a ligeramente dentro del medio para que la fuente sea is´otropa. . . 55

2.4. Logaritmo de la soluci´on de la ecuaci´on diferencial correspondiente a la fuente

de la figura 2.3. Para calcular los datos de la figura 2.5 se debe aplicar el

operador de medida que proyecta en los detectores. . . 56

2.5. De izquierda a derecha: log amplitud y fase medida en los detectores de la

figura 2.3 . . . 56

2.6. Ejemplo de la photon measurement density function obtenida entre la fuente

(11)

3.1. Esquema de un problema directo y uno inverso. En el problema directo, dado

un elemento f ∈ X se obtiene un elemento g ∈ Y mediante el operador K, pero un problema inverso requiere obtener, dado g ∈ Y un elemento f ∈ X. Observar que no est´a definido un operador, por ahora.. . . 62

3.2. Muestras aleatorias de una funci´on que tiene saltos de discontinuidad de

po-sición desconocida. En los gráficos de arriba es posible ver claramente saltos de gran magnitud, mientras que en los gráficos inferiores los saltos son más

peque˜nos. . . 78

3.3. Ejemplo de distribuci´on propuesta. En el ejemplo a) tenemos una distribuci´on Gaussiana con distintas matrices de covarianza y distintos centros. En a) la

distribución propuesta es simétrica y amplia. En b) c) y d) la distribución

pro-puesta tiene orientaci´on. En c) puede verse que la orientaci´on puede repercutir

en la tasa de aceptaci´on. en d) se puede ver que casi cualquier candidato es

bueno. . . 91

3.4. Distribución objetivo de nuestro ejemplo la función es la de la ecuación 3.126 95

3.5. Muestras obtenidas a partir del m´etodo de MH para distintos valores de δ. a)

δ= 0,05,γ = 0,01. b)δ= 5,γ = 0,89. c)δ = 1,γ = 0,16. d)δ= 0,5,γ = 0,32. Puede observarse que la distribuci´on es mejor cubierta en d). La cantidad de

muestras es, en todos los casos N = 5000 . . . 95

3.6. Ejemplo de burn-in. Observar que hasta alrededor de la muestra 500, la cadena

oscila enormemente, dando informaci´on que no corresponde a la distribuci´on

objetivo. . . 96

3.7. Cadenas de la variablex utilizadas para construir la distribución objetivo con la misma configuración utilizada en la figura 3.5. a) se observa alta correlación

debido a una lenta convergencia. b) Se observa que se acepta lentamente,

debido a un δ muy grande. c) y d) cadenas aceptables. . . 96

3.8. Esquema operativo del proceso de filtrado bayesiano. . . 115

3.9. Muestra aleatoria con las posiciones que toman valores aleatorios (marcados

con una cruz). Con el conocimiento obtenido se forma la muestra con el

(12)

4.1. Diagrama de flujo del programa de medici´on desarrollado en LabView_r. . . 127

4.2. Esquema del sistema de fijaci´on de las fibras al sistema de traslaci´on. Hay un

sistema para la fuente como para el detector. . . 128

4.3. Logaritmo de los valores singulares ordenados de mayor a menor. El n´umero de condici´on es κ(A) = 35740 . . . 131

4.4. Muestras aleatorias de nuestra distribuci´on a priori para obtener soluciones suaves. . . 132

4.5. Resultado del proceso de calibraci´on. Los datos sin calibrar son aquellos que

no pertenecen al modelo que estamos utilizando (como un experimento de

laboratorio, por ejemplo). Los datos de referencia se construyen utilizando el

modelo de DA definido antes con las propiedades ´opticas definidas. . . 134

4.6. Logaritmo de la Funci´on instrumento. El tiempo de exposici´on es de cinco

segundos. El hombro hacia la derecha se debe a la forma del pulso l´aser.. . . 135

4.7. Fantoma utilizado en el experimento de laboratorio (arriba) y su

representa-ci´on computacional (abajo). . . 136

4.8. Ejemplo de una medida temporal. . . 136

4.9. Funci´on deconvolucionada mediante el MAP de la distribuci´on a posteriori 4.14.137

4.10. Distribuci´on a posteriori de los par´ametros µa vs µ0s. La media condicional es

ˆ

µa= 0,0115 y ˆµ0_s = 2,67. El per´ıodo de burn-in fue de 35000 muestras. . . 138

4.11. Histogramas marginales de los par´ametrosµa, µ0s, construidos con las muestras

que se utilizaron en la figura 4.10 . . . 138

4.12. Esquema de simulaci´on computacional: a) Dominio con los valores a recuperar

y b) Configuraci´on de fuentes y detectores. Las dimensiones se encuentran en

mm. . . 144

4.13. Ejemplo creado a partir de una distribucióna priori gaussiana suavizada para el parámetro de absorciónµa . . . 145

4.14. Esquema de generaci´on de muestras aleatorias. Se generan muestras en una

malla regular x(r), de all´ı a la malla original xo la cual, finalmente, se env´ıa a la malla reducida xi mediante la aplicaci´on P . . . 147

4.15. Soporte de la distribuci´on objetivo recuperada para la recuperaci´on de las

(13)

4.16. Soporte de la distribuci´on objetivo recuperada para la recuperaci´on de las

propiedades ´opticas del fantoma del que se extrajo la inclusi´on 2. . . 148

4.17. Histogramas marginales a posteriori correspondientes a las propiedades ´opticas

del fantoma del que se extrajo la inclusi´on 1. . . 148

4.18. Histogramas marginales a posteriori correspondientes a las propiedades ´opticas

del fantoma del que se extrajo la inclusi´on 2. . . 149

4.19. Esquema de la configuraci´on experimental mostrando el paralelep´ıpedo

hos-pedador y las áreas exploradas por el sistema de fuentes y detectores. El haz láser fue escaneado en las posiciones marcadas con “X”y la fibra óptica de

colecci´on escanea las posiciones indicadas con “O”. La luz colectada es guiada

hasta el fotomultiplicador (PMT) el cual se encuentra conectado al sistema

TCSPC. No se muestran las inclusiones para tener mayor claridad.. . . 150

4.20. Geometr´ıa del subdominio del fantoma mostrando la ubicaci´on de las dos

incluciones. El subdominio tiene dimensiones 45mm×45mm×33mm. . . . 150

4.21. Vista en perspectiva de la geometr´ıa del subdominio del fantoma mostrando

la ubicaci´on de las dos incluciones. . . 151

5.1. Reconstrucciones de las simulaciones 2D con distintos valores de covarianza en

el dominio de reconstrucciones. Las matrices de covarianza son las de la imagen

5.2 y en el mismo orden. Los valores de la funci´on de m´erito son: e(x) = a) 0,2647, b) 0,1615, c) 0,1289, d) 0,1305, e) 0,1267, f) 0,1293, g) 0,1283 y h) 0,1283, respectivamente. . . 155

5.2. Reconstrucciones con distintos valores de covarianza. Las matrices de

cova-rianzas iniciales son P0 =diag(α) con α= b) 101, c) 100 ,d) 10−1, e) 10−2, f)

(14)

5.3. Recuperación número 2. Arriba: Reconstrucción de un tubo que atraviesa el

medio con propiedades ´opticas de la mitad del fondo (µainc =

1

2µa0). Izquierda:

original. Derecha: reconstrucci´on. Abajo: gr´afico 1D de las reconstrucciones.

El valor de la funci´on de m´erito es e = 0,1319. El nivel de ruido de los datos es del 1 %. Notar que los artifacts cerca de las fuentes y los detectores son

producto del ruido de las mediciones. Efectivamente, siguen las trayectorias

de las bananas que comunican una determinada fuente con un determinado

detector. . . 157

5.4. Recuperación número 3. Arriba: Reconstrucción de un medio que tiene dos

niveles de fondo. En el lado izquierdo el valor del fondo es 0,02 y en el derecho 0,01. Cada sección posee una pequeña inclusión ligeramente menos absorbente que el fondo.). Izquierda: original. Derecha: reconstrucción. Abajo: gráfico 1D

de las reconstrucciones. El valor de la funci´on de m´erito ese= 0,1395. El nivel de ruido de los datos es del 1 %. . . 157

5.5. Recuperación número 4. Arriba: Reconstrucción de un medio que tiene dos

niveles de fondo. Cada sección posee una pequeña inclusión y, además, en

la sección derecha se agrega una inclusión de mayor tamaño. Las propiedades

´

opticas son las mismas que las del gr´afico 5.4, pero la inclusi´on que se encuentra

ubicada arriba a la derecha es m´as absorbente que el fondo). Izquierda: original.

Derecha: reconstrucci´on. Abajo: gr´afico 1D de las reconstrucciones. El valor

de la funci´on de m´erito ese = 0,1434. El nivel de ruido de los datos es del 1 %.158

5.6. Reconstrucci´on de datos simulados: comparaci´on de reconstrucciones del par´

ame-tro µa con el m´etodo EKF (columna de la izquierda) vs reconstrucciones reali-zadas con el paquete NIRFAST (columna derecha para tres niveles diferentes

de ruido aditivo y gaussiano. De arriba a abajo, 0,5 %, 1 % and 2 %. No se utilizaron filtros entre las interaciones en ning´un caso. . . 158

(15)

5.8. Izquierda: reconstrucci´on sin el enfoque de Error de Modelo utilizando una

ma-lla gruesa con 341 nodos y 618 elementos triangulares. Derecha: reconstrucci´on

con el enfoque de Error de Modelo utilizando la misma malla. El tiempo medio

de iteraci´on es de 0.43 segundos. El nivel de ruido establecido es de 3 %. . . . 161

5.9. Reconstrucci´on de los coeficientes de absorci´on relativos a partir de los datos

experimentales obtenidos del fantoma. De izquierda a derecha y de arriba a

abajo, los cortes del dominio reconstruido en el plano XY. El plano Z = 0 corresponde al corte donde el l´aser entra al medio. La separaci´on entre cortes

consecutivos es ∆z = (33/24)mm≈1,3mm. . . 162

5.10. Reconstrucci´on de los coeficientes de scattering reducido relativo a partir de

datos experimentales obtenidos del fantoma. Sigue el mismo orden que la figura

5.9 . . . 162

(16)

´

_{Indice de tablas}

5.1. Bondad de la reconstrucci´on con EKF y NIRFAST . . . 160

5.2. Comparaci´on del n´umero de iteraciones y tiempo de CPU para las

(17)

(18)

(19)

Resumen

La Tomograf´ıa Óptica es una técnica de diagnóstico por imágenes no invasiva que se mantiene en constante desarrollo. Esto se debe, principalmente, a que utiliza radiación no ionizante, lo que permitir´ıa un uso periódico sin consecuencias ulteriores, y a la portabilidad y costos reducidos que exhibe cuando se la compara con otras modalidades, como son la Tomograf´ıa Computada y la Resonancia Magnética. Como contraparte de estas ventajas, el problema de reconstrucción tomográfica en Tomograf´ıa Óptica es no lineal y mal propuesto, lo que indica que los modelos lineales son útiles hasta cierto punto, y pequeños errores en los datos medidos pueden generar grandes errores en la reconstrucción, respectivamente. Se han desarrollado múltiples aproximaciones basadas, principalmente, en modelos lineales, pero pocas aproximaciones no lineales que, además, permitan incorporar en sus enfoques la naturaleza del ruido de medición.

(20)

(21)

(22)

Abstract

Diffuse Optical Tomography is a non invasive imaging technique that keeps a constant development. This is due to, mainly, the use of non ionizing radiation allowing a periodic use without further consequences, and the portability and reduced costs that shows when compa-red to Computed Tomography or Magnetic Resonance Imaging. However, the reconstruction problem is non linear and ill-posed, meaning that linear models have limited use, and slight errors in the data can lead to high errors in the reconstruction. Many approaches have been considered, especially for linear models, and not so many for non linear approaches that may consider the nature of the measurement noise.

(23)

(24)

Introducci´

on

El estudio de la propagación de la luz en tejidos biológicos es un tema de creciente interés en el campo de la f´ısica médica. Desde los comienzos de la teor´ıa de la transferencia radiativa [1],[2] y a partir de los primeros análisis mamográficos y funcionales que utilizaron radiación lum´ınica[3],[4], los intentos por determinar las propiedades ópticas de los tejidos se han ido multiplicando.

Existe, actualmente, una gran variedad de métodos orientados al estudio de tejidos vivos. Entre ellos, el monitoreo por rayos X, el monitoreo por ultrasonido, la tomograf´ıa computada, la resonancia magnética, etc. Estas técnicas cuentan con un alto grado de resolución espacial y proveen información precisa de las estucturas internas que se analizan, aunque, en general, no son capaces de caracterizar los tejidos estudiados. Sin embargo cuando en una mamograf´ıa se detectan objetos extraños, los métodos anteriores no permiten distinguir entre un quiste, un tumor, una bola de grasa, etc. As´ı, muchas veces es necesario realizar una intervención quirúrgica (biopsia) para decidir sobre la malignidad del objeto detectado. Esto cuesta dinero y tiempo de recuperación para el paciente, además de consecuencias psicológicas debido al stress producto de esta incertidumbre. Por otra parte, técnicas que utilizan radiación ionizante pueden alterar la materia viva al interactuar con ella y provocar, eventualmente, malformaciones (tumores); la resonancia magnética requiere del uso de superconductores, que son muy costosos de fabricar y mantener. Por último, el equipamiento necesario para la aplicación de varios de estos métodos de monitoreo y detección suele ser de gran tamaño y dif´ıcil de trasladar.

(25)

base a estas consideraciones, el uso de la radiación visible se presenta como una de las al-ternativas más prometedoras. Su aplicación al estudio de los tejidos vivos es posible cuando se trabaja en longitudes de onda del infrarrojo cercano (NIR). En esta región del espectro electromagnético, denominada ventana terapéutica[5], los tejidos vivos presentan una baja absorción relativa.

En los últimos 40 años, el desarrollo de nuevas tecnolog´ıas ha impulsado el empleo de técnicas ópticas en medicina. En particular, la aparición del láser ha generado un notable aumento de las aplicaciones cl´ınicas de técnicas ópticas. Entre las diversas posibilidades que ofrece el uso de radiación visible se encuentran la tomograf´ıa óptica, la topograf´ıa óptica, la tomograf´ıa óptica de fluorescencia, la bioluminiscencia y el monitoreo funcional, entre otras. Este último, en particular, permite medir el nivel de oxigenación en sangre de distintos ´

organos y analizar la actividad metab´olica local.

Desde el punto de vista de la propagación de la luz, los tejidos se comportan como medios turbios que hacen que la radiación en el NIR se vuelva rápidamente difusa en su interior. La difusión dificulta, en gran medida, la identificación de estructuras internas debido a la pérdida de resolución espacial. En parte esto se debe a que la ecuación de difusión, herramienta principal de este enfoque, es una ecuación que trabaja con promedios y, por lo tanto, el detalle a pequeña escala no puede obtenerse únicamente a partir de ella. En este proceso es necesario, además, tener en cuenta los efectos de: la longitud de onda de la radiación incidente, los componentes e interfases presentes en el medio (y en la superficie, si correspondiere), la geometr´ıa, etc, y su efecto sobre las mediciones.

(26)

en su naturaleza integro-diferencial cuya solución requiere un poder de cómputo muy grande, lo que no la hace práctico para tomograf´ıa.

La formulación del problema tomográfico involucra técnicas matemáticas de complejidad creciente. Mayormente, se plantean problemas del tipo regularización de Tikhonov, tanto lineales como no-lineales. Estos últimos utilizan técnicas de tipo Levenberg-Marquardt y Gauss-Newton. Estos son enfoques determin´ısticos, donde se busca una solución puntual al problema. Sin embargo, en general, se puede tener a disposición información adicional que pueda ayudarnos a obtener soluciones con las propiedades deseadas. Dicho de esta manera, la información previa puede funcionar como sesgo (como cuando tenemos información previa estructural, como una imagen obtenida por otra modalidad). Además, cuando la información adicional es agregada en forma de propiedades de las soluciones estamos priorizando aquellas con las caracter´ısticas de la información disponible. Esto requiere de la habilidad de mode-lar tal información de manera que las técnicas determin´ısticas permitan incorporarla lo cual es, mayormente, complejo. Aqu´ı es donde técnicas no determin´ısticas, como las estocásticas, entran en acción pues disponen de otro tipo de herramientas para evaluar esta información. La herramienta principal que utiliza esta rama de las matemáticas, llamada Problemas In-versos Estocásticos y Computacionales, es el teorema de Bayes, que actualiza el estado de la información mediante este resultado.

(27)

(28)

(29)

Cap´ıtulo 1

Sobre las modalidades de la

(30)

1.1. Resumen

(31)

1.2. Sistemas Frequency-domain

Los sistemas de imágenes en el dominio de la frecuencia para DOT utilizan luz de intensi-dad modulada a altas frecuencias (unos pocos cientos de megahertz). Esto permite medir la amplitud y el cambio de fase de la señal incidente relativa a la señal original, lo cual provee la base para la tomograf´ıa en el dominio de la frecuencia. Fishkin [6] y Patterson [7] presentaron parte del trabajo inicial sobre el cual se desarrolla esta tecnolog´ıa. Con el uso de este enfo-que, junto con un modelo de propagación de luz difusa [8], es posible reconstruir imágenes de absorción y scattering en tejidos in vivo. Además, repitiendo esto en múltiples longitu-des de onda, es posible la recuperación de secuencias funcionales1_{, dado que los absorbentes}

principales (llamados cromóforos) en los tejidos son la hemoglobina(Hb) y deoxyhemoglobi-na(HbO). Jobsis [2] mostró, en 1977, que utilizando dos longitudes de onda apropiadas, es posible monitorear las concentraciones de Hb y HbO. Siguiendo esta l´ınea, varios investiga-dores comenzaron a utilizar enfoques multiwavelength (múltiples longitudes de onda) para recuperar las propiedades ópticas de los cromóforos primarios tales como HbO, Hb, agua y l´ıpidos y lo utilizaron para monitorear cambios en la fisiolog´ıa de la mama [9],[10] [11], el cerebro [12],[13], y otros [14]. Como ya se mencionó anteriormente, las técnicas de medición empleadas en imágenes de óptica difusa pueden organizarse en tres categor´ıas, Onda con-tinua (CW, por sus siglas en inglés Continous-wave) que involucra medidas independientes del tiempo, Frecuency-domain, en el dominio de la frecuencia, y Time-domain, en el dominio del tiempo. Desde un punto de vista experimental, los sistemas CW son los más sencillos de implementar dado que no necesitan respuestas de corto tiempo. Esto reduce los costos de equipamiento y permite obtener grandes cantidades de datos a partir de cámaras basadas en charged coupled devices (CCD). En la figura1.1 se ve un diagrama del funcionamiento de un sistema CW donde se puede observar una fuente en contacto con la superficie del medio de análisis y, en el extremo opuesto del medio, múltiples detectores (en una cámara) colectan la luz transmitida hasta la respectiva posición. La fuente puede ser, por ejemplo un laser de diodos.

(32)

Laser

F.O.

Medio Turbio

Cámara

CCD

Figura 1.1: Esquema representativo de un sistema CCD. Una fuente (Laser) inyecta luz en un medio mediante una fibra ´

optica (F.O). Una c´amara de CCD colecta la luz emergente desde la cara opuesta.

La desventaja que posee esta técnica es que si bien puede localizar objetos dentro de un determinado medio [15], no permite caracterizarlos en términos de sus propiedades ópticas [16]. Para ello, los sitemas Time-domain y Frequency-domain mejoran dramáticamente la capacidad del sistema, pero con mayor costo. El principio básico de un sistema Frequency-domain se puede ver en la figura 1.2.

Medio Turbio

w

_Mod

w

_Mod

Corrimiento de fase

A

₀

A

₀

A

₁

Figura 1.2:Esquema representativo de los datos que se colectan en un sistema FD. Una fuente de amplitudA0 modulada a

la frecuencia ω se inyecta dentro del medio turbio. En la salida, se compara la se˜nal de salida (con amplitudA1) con la de

entrada not´andose cambios en la amplitud y en la fase.

(33)

medida que la onda sinusoidal se propaga a través del medio, el camino extendido, debido a la presencia de part´ıculas que difunden la luz, retrasa la fase de la señal modulada. Tras salir del tejido, la onda sinusoidal es atenuada y tiene la fase modificada comparada con la señal incidente. Los cambios medibles en la amplitud y fase contienen información respecto a las propiedades de absorción y de desparramamiento (scattering) del volumen irradiado y, cuando los datos medidos están apropiadamente calibrados, es posible recuperar los valores de esas propiedades ópticas.

Un ejemplo de un sistema Frequency-domain operando en heterodyning2 _{se puede}

obser-var en la figura1.3. Aqu´ı, dos generadores RF (radio frecuencia) se utilizan, uno funcionando a 100 MHz y el otro trabajando a 100,001 MHz. El ejemplo de la figura 1.3 es una versión simplificada de un modelo real. En la práctica, un arreglo de fuentes en diferentes longitu-des de onda pueden utilizarse secuencialmente y los detectores se pueden paralelizar para incrementar la velocidad de adquisición de datos. También es posible incorporar iluminación paralela expandiendo el arreglo de moduladores RF e introduciendo diferentes offsets de fase o frecuencias de modulación para cada canal de láseres. Estas técnicas fueron utilizadas en [17], [18], [19].

1.3. Sistemas Time-domain

El otro sistema posible de colección de datos es el dado por los sistemas Time-domain. Cuando un pulso de luz (que llamaremos pulso, de ahora en adelante) entra en el medio difusivo, sufre una serie de cambios debido a las propiedades ópticas del mismo. Por supuesto, estos fenómenos son los mismos que ocurren en cualquiera de las modalidades, sin embargo, la diferencia está en la manera de verlos, es decir, la información que colectan los detectores es distinta. En particular, el pulso se ensancha y se retrasa y, midiendo esto, podemos obtener información sobre lo que ocurre dentro del medio, respecto a sus propiedades ópticas. Ésta es la idea principal respecto a las técnicas Time-domain, que son, en cierto sentido, análogas a los sistemas de domain. Precisamente, los datos obtenidos en los sistemas

Frequency-2_{Heterodyning requiere dos generadores de se˜}_{nales operando a frecuencias}_f

(34)

RF Gen. RF Gen.

Mixer

Ref. Data

Amp.

L.P.F. PMT Medium

PC Laser DC Source

Figura 1.3: Esquema representativo de un sistema FD. Los generadores de radiofrecuencias se utilizan para comparar los datos con la referencia. Las siglas indican lo siguiente: amp, amplificador. Mixer: mezclador. DC source: fuente DC. LPF: filtro pasa-bajos. PC: computadora. PMT: fotomultiplicador.

domain son la transformada de Fourier de los datos en Time-domain en una determinada longitud de onda (más adelante mostraremos esto precisamente). De esta manera, los datos obtenidos mediante técnicas de Time-domain, contienen información de todas las longitudes de onda de modulación. Además, contienen información de los momentos de la distribución de tiempos3 _{y pueden detectar informaci´}_{on acerca de posibles errores de medici´}_{on tales como}

poco contacto y posibles reflexiones.

Cuando un pulso de luz (de picosegundos de duración) se transmite a través de un medio altamente difusivo como un tejido biológico, la distribución temporal de fotones es conocida como temporal point spread function (TPSF). Un esquema se puede observar en la figura

1.4. La forma de esta distribución contiene información sobre las propiedades ópticas de los tejidos [20], como puede verse en la figura 1.5.

(35)

Láser

FO

PMT

FO

0200400 01234567810-5 020001234567810-5

Medioturbio

40060080010001200 60080010001200

TCSPC

Figura 1.4: Esquema experimental de un sistema TCSPC. Se emite radiación por un per´ıodo de tiempo muy corto que sale desde el láser y viaja a través de la fibra óptica (FO). Atraviesa el medio turbio y es colectada por otra fibra que lleva la luz

observada hacia un fotomultiplicador (PMT), que lo lleva hacia el sistema TCSPC, que permite su obtenci´on y visualizaci´on

para su an´alisis.

0 5 10 15

Tiempo (ns) -60 -50 -40 -30 -20 -10 0

Logaritmo de la transmitancia

Variaciones respecto a _a

a = 0.02

a = 0.01

a = 0.005

0 5 10 15

Tiempo (ns) -60 -50 -40 -30 -20 -10 0

Variaciones respecto a _s

s = 3

s = 2

s = 1

Figura 1.5:Izquierda: variaciones de tres pulsos te´oricos cuando el valor deµa es0,02,0,01y0,005mm−1. El valor deµ0s es

2mm−1_{. Se puede ver que la pendiente de la curva logar´ıtimica es m´}_{as pronunciada cuando mayor es el valor de}_µ

a, esto se

debe a que a mayor absorción, mayor probabilidad de pérdida de fotones lentos (los que tienen que recorrer caminos más largos

para llegar al detector), lo que se traduce en menos luz en el detector. Derecha: variaciones de tres pulsos te´oricos cuando el

valor deµ0

ses3,2y1mm−1. El valor deµaes0,01mm−1.Se puede observar que cuandoµ0sdecrece, el flanco ascendente tiene

una pendiente más pronunciada. Esto se debe que, al haber menos eventos de scattering, los fotones llegan más rápidamente

al detector. La geometr´ıa utilizada es un slab de 35mm de espesor.

(36)

separar, mediante compuertas controladas por tiempo, aquellos fotones que sal´ıan r´ apida-mente y que se asum´ıa que recorr´ıan la menor distancia a través del medio. Tales fotones son menos desparramados que aquellos que tardan más en llegar, de manera que su trayec-toria puede ser modelada, con buena aproximación, con l´ıneas rectas, realizando un análisis directo y utilizando la transformada de Radon, as´ı como se realiza en tomograf´ıa computada [21]. Sin embargo, la cantidad de fotones que pueden ser medidos a través de medios con ancho relevante es muy pequeña4_{, y este enfoque fue abandonado para vol´}_{umenes grandes}

de tejido. Recientemente, estos fotones han sido utilizados en pequeños animales, donde el ancho es pequeño [22], permitiendo colectar un número razonable de fotones cuasi-bal´ısticos. Algunos intentos más sofisticados de medir toda la TPSF fueron hechas por Hebden [23] quien discut´ıa el uso de cámaras y sistemas time-to-amplitude converter (TAC). De estas técnicas la más habitual es la basada en sistemas de conteo de fotones correlacionados en el tiempo (time-correlated-single-photon counting -TCSPC-), los cuales dan medidas flexibles de tiempo de llegada de fotones con altas tasas de cuentas y buena resolución temporal [24]. Estos sistemas se utilizan, en general, junto con detectores de tipo tubo fotomultiplicador (PMT Photomultiplier tube). En este trabajo se utilizará este enfoque.

Si bien los sistemas de Frequency-domain son rápidos y relativamente más baratos que los sitemas de Time-domain, éste último posee algunas ventajas que lo hacen atractivo:

Las medidas en Time-domain se pueden realizar con detectores de tipo fotomultiplica-dores y fuentes pulsadas laser, llevando a la máxima sensibilidad posible. Los sistemas TCSPC son el único camino de medir luz a través de medios de gran volumen en donde tal vez sólo unos pocos fotones por segundo puedan medirse.

La TPSF contiene componentes de frecuencia temporal hasta varios GHz, de manera que una medida time-domain incluye información de un amplio rango de frecuencias en comparación con sistemas frequency-domain que sólo funcionan en una única frecuen-cia. Habiendo dicho esto, la TPSF es suave, de manera que no es claro qué información adicional provee (que la curva sea suave enmascara posible información de alta frecuen-cia que no se pueda extraer con claridad).

4_B´_{asicamente, los bal´ısticos son la fracci´}_{on exp (}₋₍_µ

a+µs)L), conL el espesor de la paralelep´ıpedo en

(37)

El fenómeno conocido comoPhase-wrappingpuede ocurrir en sistemas de tipo frequency-domain si el cambio de fase es mayor a 2π. Esto puede eludirse reduciendo la frecuencia de modulación al costo de reducir el contraste de la medida y reduciendo la máxima frecuencia que puede utilizarse para penetrar el medio.

La TSPF puede procesarse para dar algunos tipos de datos diferentes de la intensidad y el tiempo medio de vuelo de fotones (equivalente a la intesidad y la fase de un sistema de frequency-domain). Schweiger y Arridge [25] mostraron que algunos tipos de datos pueden mejorar la discriminación entre absorción y scattering. Sin embargo, dado que los tipos de datos de orden superior son más sensibles al pequeño número de fotones que llegan más tarde, y éstos son más sensibles al ruido, no han sido aplicados con ´

exito, a´un.

Quizás la ventaja menos ponderada de la técnica time-domain es su habilidad de identi-ficar datos pobres. Los datos experimentales, especialmente los datos de cl´ınica, pueden verse contaminados con luz espuria, la cual se encuentra correlacionada con las medidas, lo que dificulta sacarla en el caso de medidas hechas por control temporal de compuer-tas. Este ruido puede venir de error de instrumentación o, más comunmente, de luz que se filtra alrededor del medio que se quiere estudiar. Éste es un problema particular de geometr´ıas complejas o cuando los conectores ópticos no se mantienen sobre la super-ficie del medio de manera robusta [26]. Por ejemplo, cuando se conectan fibras sobre un medio a analizar y la conexión no es correcta, en el sentido que algo de luz espuria pueda entrar a las fibras se puede manifestar como parte de la TPSF. Tales artefactos pueden llevar a errores en los cálculos de intensidad y de tiempo medio de vuelo de los fotones. Y, por lo tanto, a errores de reconstrucción. La técnica time-domain permite detectar estos posibles problemas.

1.3.1. Instrumentaci´

on para experimentaci´

on en el dominio del

tiempo

(38)

siste-mas TCSPC y sistesiste-mas de compuertas. Ambos poseen buena sensibilidad y buena resolución temporal, pero son relativamente lentos y costosos (comparados con sistemas frequency-domain). Los sistemas de compuertas funcionan midiendo la luz dentro de un intervalo corto de tiempo. La TPSF se construye midiendo a diferentes retardos de tiempo. Este enfoque es menos costoso que los sistemas TCSPC y, en particular, el costo y los tiempos de adquisición no escalan con el número de canales, permitiendo tener muchos detectores a costo de perder un poco de información.

Principio de operaci´on de los sistemas TCSPC

Los sistemas TCSPC funcionan, básicamente, midiendo los tiempos de llegada de fotones individuales. Esto requiere de un sistema de detección capaz de identificar la llegada de un fotón, distinguirlo de un evento de ruido electrónico, medir su tiempo de llegada y luego guardar ese tiempo de manera conveniente. Además, la probabilidad de detectar un fotón en un per´ıodo de conteo simple debe ser mucho menor que uno. Si esta condición se satisface, podemos descontar la posibilidad de tener dos fotones llegando en el mismo per´ıodo, y no tenemos que compensar errores que pudieran ocurrir en ese caso [24].

(39)

Una manera alternativa de medir los tiempo de llegada es utilizar un TAC. Cuando un pulso se detecta, el TAC comienza a cargar un capacitor. El pulso de referencia detiene la carga, de manera que el voltaje a través del TAC es proporcional al tiempo entre los dos pulsos. Esta señal se la amplifica y se la env´ıa a un conversor analógico-digital (ADC), el cual alimenta un banco de memoria que ensambla el histograma. El PTA es más costoso que el TAC pero también es más preciso.

Estos sistemas de primera generación son precisos y sensibles, pero grandes y relativa-mente lentos. También son unidimensionales en el sentido que mide los tiempos de llegada de un sólo tren de fotones. Los dispositivos TCSPC de segunda generación [24],[29] combinan los CFD y los PTA (o, equivalentemente, los CFD, TAC y ADC) en un único circuito, el cual es montado en una PC. Esto conlleva un incremento en la velocidad en un factor 100 y una reducción de tamaño de un orden similar. La reducción de tamaño es atractivo para los sistemas con potencial a cl´ınica.

Otra ventaja de este enfoque es que puede ser descrito como multidimensional. Esto quiere decir que cuando se detecta un fotón, su tiempo de llegada no es llevado meramente a memoria, sino que puede ser enviado a una ubicación particular controlada por el usuario. De esta manera, una sola unidad TCSPC puede grabar a partir de múltiples detectores y múltiples fuentes. Esto puede ser útil para distinguir entre distintas longitudes de onda (de la fuente o del detector), diferentes ubicaciones de fuentes y detectores, o las coordenadas x-y de un sistema de escaneo. Esto requiere una señal extra de un router que, por ejemplo, pueda incluir una señal que muestre qué detector midió el fotón particular y que luego se asegure que los datos de ese fotón se enruten al banco de memoria apropiado.

(40)

Fuentes de luz

Las fuentes de luz para los sistemas de time-domain se determinan tanto por los requeri-mientos de las TCSPC como por el objetivo del experimento. Las longitudes de onda suelen rondar los 800 nm y, casi siempre, entre 600 nm y 1000 nm. La selecci´on de la longitud de onda ´

optima es compleja y no completamente comprendida [31], pues depende del crom´oforo que se desea detectar. La potencia debe ser tal que no da˜ne el medio. Los sistemas time-domain requieren que las fuentes sean pulsadas.

Existen dos enfoques. Mayormente, se utilizan láseres de diodos. Son lo suficientemente baratos para que cada fibra correspondiente a una fuente pueda tener su propio laser, por lo que no es necesario, en general, el multiplexado. Están disponibles en varias longitudes de onda con anchos de banda angostos y son sencillas de controlar electrónicamente. Se los suelen utilizar en los sistemas ópticos de time-domain [32], [33], [34]. Sin embargo, la potencia promedio disponible para pulsos muy cortos en el infrarrojo cercano (NIR) está limitada a unos mW (hasta 50mW).

Otros tipos de laser pueden proveer mucha m´as potencia, pero pueden requerir realinear o recalibrar tras un peque˜no movimiento, lo que podr´ıa ser inaceptable en sistemas portables.

Detectores

En tomograf´ıa óptica, necesitamos poder guardar las TPSF a partir de medidas de baja intensidad con gran precisión. La duración de la TPSF es del orden de unos pocos nanosegun-dos, para poder resolver esto, la función respuesta instrumental (IRF) del detector deber´ıa ser de unos pocos picosegundos o menos aunque, en la práctica, no siempre se poseen tales sistemas. Más aún, la estabilidad de la IRF respecto del tiempo debe ser menor que los cam-bios en el tamaño de la señal que se está midiendo. En ciertas ocasiones, el tiempo de vuelo puede ser de sólo unos pocos picosegundos, de manera que adquirir la estabilidad adecuada puede ser desafiante. Además, estamos midiendo luz difusa de baja intensidad y, para poder colectar la cantidad de luz que sea necesaria, se necesita un detector con gran área de colec-ción. Por lo tanto, necesitamos detectores estables y sensibles, que sean eficientes en el NIR y con rápida IRF.

(41)

Sistemas TCSPC

Hemos presentado el principio general de los sistemas TCSPC, ahora veremos los dos tipos utilizados en tomograf´ıa de ´optica difusa: con todos los canales totalmente paralelizados o compartiendo canales escaneando la fuente, el detector o ambos.

El Monstir utiliza el primer enfoque. Aún cuando utiliza un único láser, su salida pasa a través de un switch de 32 salidas as´ı que la luz se env´ıa a 32 canales paralelos. Las fibras de las fuentes y los detectores se combinan con fibras coaxiales, las cuales pueden proveer o colectar luz. Esto permite un procedimiento de calibración sencillo [35] y reduce a la mitad el número de conexiones que debe hacerse a la cabeza o el busto escaneados. Una fibra se utiliza para llevar la luz mientras las 31 restantes colectan la luz que emerge luego de viajar a través del cuerpo. Cada fibra detectora transmite luz a un microchannel-plate photomultiplier tube (MCP-PMT) el cual tiene un transit-time spread (TTS) más corto comparado a un PMT estándar, llevando a una IRF más de ancho medio menor5 _{y a estabilidad temporal mejorada.}

Treinta y dos atenuadores reducen la intesidad de las fuentes más intensas, para prevenir la saturación de los detectores y reducir el rango dinámico de la luz medida.

El segundo enfoque es el que se utiliza, por ejemplo, en los grupos de investigación de Berl´ın ([36], [33]) y Milan ([37], [34]), as´ı como en la compañia Advanced Research Techno-logies Inc [38]. Los sistemas de Berl´ın y Milán utilizan como fuente un láser de diodos en cada longitud de onda de interés, el cual se multiplexa en un único tren de pulsos que viaja a través de la fibra fuente. Los datos se colectan utilizando una fibra que escanea en la cara opuesta a la fuente, o por un número pequeño de fuentes que están desplazados fuera del eje del detector. Las fibras de las fuentes y los detectores se mueven a través del área de interés (a lo alto y ancho del área de interés), los que se utilizan en una mama gentilmente presionada. Los datos se colectan a intervalos de 1 mm. Ambos sistemas utilizan PMT, los cuales proveen una señal que debe ser procesada por un sistema TCSPC en una PC.

5_{En pos de la claridad, la IRF puede verse como una}_{point spread function}_{, en el sentido que una medida} es de la forma

m=i∗f

(42)

(43)

Cap´ıtulo 2

(44)

2.1. Resumen

(45)

2.2. Introducci´

on

En las últimas dos décadas, se han realizado avances respecto al modelado de la propa-gación de luz en medios turbios, como puede verse, principalmente, en el ya clásico trabajo de Ishimaru donde se exploran varios modelos para diversas geometr´ıas [39]. Estos avances gu´ıan el desarrollo de técnicas ópticas tomográficas, las cuales dependen de la habilidad de modelar, apropiadamente, la interacción de la luz con el tejido biológico. En general, estas técnicas utilizan luz en el infrarrojo cercano (NIR) en las longitudes de onda de 600nm -900nm para penetrar el tejido biológico y obtener imágenes funcionales ([31], [40], [41]). La propagación de la luz en NIR está gobernada por la distribución espacial de los coeficientes de absorción yscattering,µay µs, respectivamente. Los coeficientes de scattering toman valores en el rango de µs = 20,· · · ,200cm−1 ([42], [43]). También se suele utilizar el coeficiente de scattering reducido µ0_s = (1−g)µs, siendo g el coseno medio de scattering, también llamado factor de anisotrop´ıa, de evento de scattering simple. T´ıpicamente, este factor ronda entre 0.8 y 0.98. Las moléculas absorben radiación a determinadas longitudes de onda, y se las deno-minan genéricamente cromóforos, dentro de un tejido que puede causar absorción en varias longitudes de onda. El coeficiente de absorción var´ıa, en los cromóforos endógenos t´ıpicos de los medios biológicos, entreµa= 0,01 a 0,5cm−1 en el NIR ([44], [45], [46], [47]). Ejemplos de cromóforos endógenos son: la hemoglobina, citocromas, flavinas y porfirinas. Diferencias en la concentración y contenido de los cromóforos conllevan a diferentes coeficientes de absorción

µa(r) conr ∈Ω, donde Ω es el medio de inter´es.

(46)

la distribución de luz Φ(r) con r ∈ ∂Ω, precisamente en la ubicación de los detectores, el esquema puede verse en la figura 2.1. A partir de estos datos, intentaremos, en los cap´ıtulos siguientes utilizar rutinas de recuperación para saber cuáles son los valores de las funciones

µa(r) yµs(r).

H

P

F

P

F

M

Figura 2.1: Diagrama del problema directo. Dado el operadorH :P → F que devuelve la fluencia a partir del conjunto de

par´ametros, y el operador P:F → M, que a partir de la fluencia devuelve la medida que se realiza en el borde. El modelo

directo es la funci´onF :P → Mque, a partir de un conjunto de par´ametros devuelve una medida en el contorno del medio

que se desea estudiar.

Estas rutinas de recuperación pertenecen a la rama de las matemáticas llamada Teor´ıa de Problemas Inversos, los cuales, en general, involucran la resolución de un problema de optimización. A las lecturas del detector predichas por un modelo directo (o forward) en la superficie del tejido se las compara constantemente contra las lecturas del detector definiendo una función objetivo, originalmente, la norma L2 del error. Se minimiza la función objetivo

(47)

2.3. Ecuaci´

on de Transferencia Radiativa

El problema directo de Propagación de Luz en Tejidos Biológicos se modela a partir de la Ecuación de Transferencia Radiativa [58], [59], [39], [60] (RTE por sus siglas en inglés), que es una alternativa heur´ıstica a la teor´ıa rigurosa definida por las ecuaciones de Maxwell. Esta ecuación se resuelve, usualmente, mediante métodos numéricos dado que no existen soluciones anal´ıticas de esta ecuación para geometr´ıas complejas y medios no homogéneos en sus propiedades ópticas. Estos métodos numéricos pueden ser aproximaciones de órdenes bajos de la RTE, tales como la aproximación difusiva, o aproximaciones de órden superior como, por ejemplo, discrete ordinates method (Sn) o el método de expansión en armónicos esféricos (Pn) [61]. La aproximación difusiva se utiliza ampliamente en tejidos en donde

µ0_s >> µa (este es el llamado régimen difusivo), como son, por ejemplo, la mama femenina o el tejido muscular [62]. Sin embargo, la aproximación difusiva presenta limitaciones en geometr´ıas pequeñas, tejidos con alta absorción y tejido con zonas de vac´ıo (óptico) [63], como pueden ser las zonas de muy baja absorción y scattering (como los quistes, fluido cerebro-espinal, etc). En estos casos, se suelen utilizar aproximaciones de orden superior ([64], [65]). En general, se suele utilizar una discretización espacial del dominio para resolver la ecuación con técnicas como el método de diferencias finitas, volúmenes finitos o el método de elementos finitos. En el caso de RTE independiente del tiempo, los trabajos de Klose ([66]), Hielscher ([14], [67], [68]) y Tarvainen ([69],[70] y [71]) desarrollaron técnicas numéricas que involucran las aproximaciones mencionadas, as´ı como aproximaciones h´ıbridas Difusión-Transporte en regiones donde la aproximación difusiva no es aplicable.

En el caso dependiente del tiempo, los trabajos de Dorn [72], Boulanger y Charette [73][74], Ren [75] y [76], Abdoulaev y Hielshcer [77], Abdoulaev [78], Kim and Hielscher [79], Klose and Larsen [80], fueron utilizados tanto en el r´egimen puramente temporal as´ı como en el dominio de la frecuencia.

Desarrollaremos brevemente el planteo del problema de la RTE; precisamente: sea Ω⊂_Rn un dominio simplemente conexo, es decir, sin agujeros, con un borde al menos suave a trozos

(48)

de s∈ Sn−1_{(la bola unitaria en}

Rn) sigue la ecuaci´on de balance: s· ∇Φ(x, s) +µtΦ(x, s) =µs

Z

Sn−1

f(s, s0)Φ(x, s0)ds0+q(x, s0) (2.1)

donde Φ(x, s) es la densidad de part´ıculas en la posiciónx que viajan en direccións, q es el término fuente,µa es el parámetro de absorción, µs el coeficiente de scattering, el coeficiente de transposrte µt = µa +µs y f es el kernel de scattering, en general, rotacionalmente invariante, es decir, f(s, s0) =f(s·s0). Usualmente, se utiliza el kernel de Henyey-Greenstein [81] definido de la siguiente manera:

f(s, s0) = 1−g

2

2(n−1)π(1 +g2₋₂_g₍_s_·_s0₎₎n/2. (2.2)

En general, asumiremos que todos los par´ametros son estrictamente positivos y n es la di-mensi´on del espacio de coordenadas. Para determinar las condiciones de contorno de la RTE definimos el vector normal a la superficie ∂Ω como n(x) con x ∈∂Ω y Γ+ (respectivamente Γ−) = {(x, s)∈∂Ω×Sn−1 _:_s_·_n _≥₀₍_≤₀₎_} _{como el borde saliente (entrante) y} _n

i(n0)

co-mo el ´ındice de refracción del medio (entorno). De esta manera la condición de contorno de reflexión para (2.1) es

Φ(x, s) = R(x, s, s0)Φ(x, s0) (2.3)

para (x, s)∈Γ−, (x, s0)∈Γ+_{, donde} _s0 _{refiere a la direcci´}_{on angular en} _x _{en el borde que se}

refleja en s cuando ni 6= n0, y R corresponde a la tasa de energ´ıa reflejada a trav´es de las

ecuaciones de Fresnel usuales en una frontera con cambio de ´ındice de refracci´on. Cuando no hay tal cambio, nos encontramos con la condici´on de borde vac´ıo, con R= 0.

Para no desviarnos del tema central no entraremos aqu´ı en detalles de existencia y unicidad que muestran las condiciones en las cuales existe una única solución de2.1. El lector interesado puede referirse al apéndice .

(49)

aproxima-damente, 100 veces mayor que el coeficiente de absorci´on, y, la distancia fuente-detector es mayor a _µ10

s, haciendo una aproximación por armónicos esféricos y teniendo en cuenta

sola-mente los términos isotrópicos y linealmente anisotrópicos (como se puede ver en el apéndice) se llega a la ecuación de difusión, la cual escribiremos en el dominio de la frecuencia:

(

∇ ·(D(x)· ∇I(x, w))−(µa− iω_c) (x)I(x, w) = 0, x∈Ω/∂Ω

I(x, w) + 2AD(x)∂I ∂bn

=S(x, w), x∈∂Ω (2.4) donde D(x) = ₃₍_µ 1

a(x)+µ0x(x)) con µ

0

s(x) = µs(1−g) es el coeficiente de scattering reducido y g es el factor de anisotrop´ıa. Aes el coeficiente de Fresnel que incorpora el cambio de ´ındice de refracción en el borde aire-tejido y _bn es el vector normal a Ω en x. Una de las ventajas que presenta esta ecuación es que tiene soluciones anal´ıticas en un buen número de geometr´ıas, y además permite agregar inclusiones dentro del volumen difusivo. Éstas pretenden simular la existencia de lesiones (tumores, quistes, etc) que puedan estar presentes en el interior del tejido saludable. Desde el punto de vista numérico, no es necesario calcular la influencia an-gular lo que hace que, en los enfoques numéricos, la complejidad computacional disminuye dramáticamente, útil para problemas de geometr´ıas arbitrarias en problemas numéricos. Da-do que las geometr´ıas que nos interesan son arbitrarias, nos enfocaremos en la resolución de un modelo numérico mediante el método de Elementos Finitos (FEM) y cómo, a partir de ´

el, podemos calcular tambi´en el Jacobiano.

Elementos Finitos y la aproximaci´

on difusiva

(50)

autores han discutido sobre las implementaciones en FEM de la DA [86], [87], [88], [89], [90], [91], [92],[93].

La formulaci´on variacional para la DA nos dice que φ ∈_H1_{(Ω) es soluci´}_{on de la ecuaci´}_on

de difusi´on en forma d´ebil si satisface [86]

Z

Ω

Ψ

−∇ ·D∇+µa+

iω v φdr = Z Ω

Ψq0dr,∀Ψ∈H1(Ω) (2.5)

Utilizando la formula de Green

Z

Ω

v∇ · ∇udr=−

Z

∇

γ∇u· ∇vdr+

Z

∂Ω

vγ∇u·ndS (2.6)

podemos reescribir 2.5 como

Z

Ω

D∇Φ· ∇Ψdr−

Z

∂Ω

1

2vΦΨdS+

Z

Ω

µaΦΨdr+

iω c

Z

Ω

ΦΨdr (2.7)

=

Z

Ω

q0Φdr+

Z

∂Ω −2As

v ΦdS (2.8)

con As un coeficiente que mide la p´erdida producto de los reflejos internos del borde [94]. En el trabajo de Kolehmainen [95] se muestra que este razonamiento nos lleva a utilizar1 _la

medida

Γ(r, ω) = − 1

2As

Φ(r, ω) (2.9)

Para construir la aproximación en elementos finitos para Φ, se aproxima la solución con una función polinomial a trozos

Φh = Nn

X

i=1

φiψi ∈Xh ⊂H1(Ω) (2.10)

donde Xh ₌ _span_{_ψ

i|i= 1,· · · , Nn} y ψi son las funciones base de la malla de elementos finitos Ω =TNe

l=1Ωl. Insertando la aproximaci´on2.10en2.7y utilizando las funciones nodales

(51)

{ψj|j = 1,· · · , Nn} como funciones test, llegamos a la ecuaci´on

(K(D) +C(µa) +R+iωZ)Φh =G+E (2.11) con las entradas del sistema definidas por

Ki,j =

Z

Ω

D∇ψi· ∇ψjdr (2.12)

Ci,j =

Z

Ω

µaψiψjdr (2.13)

Zi,j =

1

c

Z

Ω

1

2AφiφjdS (2.14)

Los vectores fuente en el lado derecho de 2.11 depende del modelo de fuente que utilicemos. Para el caso de fuente difusa los vectores E y G son de la forma

Ej = 0, Gj =

Z

∂Ω −2Γs

As

ψjdS (2.15)

dado que este modelo asume que no hay fuentes internas, tenemos que q0 = 0. En el caso de

fuente colimadas los vectores son

Ej =

Z

Ω

q0ψjdr, Gj = 0 (2.16)

dado que el modelo asume que Γs = 0 y las fuentes del bordes se las modela como fuentes isotr´opicas que est´an dentro del medio una distancia de z0 = _µ10

s. La soluci´on formal a este

problema es

Φh_k = (K(D) +C(µa) +R+iωZ)

−1

(G+E) (2.17)

El vector de medida

Γ(k) =Γ₁(k),· · · ,Γ(_Mk) T

(2.18) (Γs es la corriente difusa del borde) en la ubicaci´on de los detectores se obtiene haciendo

(52)

con H es una matriz tal que

Di,n=

(

− 1

2A , si el nodoNn se encuentra en la posici´on del detector i-´esimo

0 , en otro caso

(2.20) Finalmente, la cantidad medible en los sistemas frequency-domain en la posición del j-ésimo detector es el cambio de fase y la amplitud de la modulación (la amplitud A.C.) de la medida compleja Γk_j(ω) [91],[96],[23],[97] que es

z_i,phasek = arg(Γk_j(ω)) = =(Γ k j(ω))

<(Γk j(ω))

(2.21)

z_i,ampk = |Γk_j(ω)| (2.22) que es la cantidad que se compara contra las medidas en las secciones siguientes. Es impor-tante, tambi´en para m´as adelante, notar que, si tenemos una medida en el dominio temporal Γk_j(t) se puede obtener la medida en el dominio de la frecuencia haciendo:

Γk_j(ω) =

Z

Γk_j(t) exp(−iωt)dt (2.23)

es decir, mediante la transformada de Fourier.

Algunas observaciones respecto a este modelo de aproximación que deben hacerse son: Dado que la aproximación difusiva utiliza únicamente dos términos de la expansión en armónicos esféricos, que contienen información isotrópica y linealmente anisotrópica, no es aplicable en todas las situaciones, aunque es útil en algunas circunstancias. Primero, necesitamos que µa << µ0s y que la fuente se encuentre a algunos caminos libres promedios (_µ10

s) de los detectores [90],[59]. Esto hace que su aplicabilidad en

situaciones donde existe un “vac´ıo” como ocurre en el caso de los quistes, hacen que la efectividad de la ecuaci´on de difusi´on se vea limitada, sin embargo, todav´ıa puede aplicarse en algunas situaciones [98].

(53)

radiaci´on, que viola el principio de causalidad, por lo que no da buenas aproximaciones a tiempos cortos[90].

2.3.1. Matriz jacobiana

Para poder resolver, posteriormente, el problema tomográfico, precisamos poder determi-nar la construcción del jacobiano. El no hacerlo podr´ıa aumentar la complejidad computacio-nal dado que tendr´ıamos que evaluar el modelo tantas veces como al menos el doble de la cantidad de parámetros a estudiar, lo que podr´ıa hacer prohibitiva su aplicabilidad. Supon-gamos que las funciones (µa, D) son aproximadas como en la forma2.10 y que las funciones base ψ(mD), ψm(µa) son conocidas. El jacobiano debe tener la forma

J =

   

∂F1(D,µa)

∂D1 · · ·

∂F1(D,µa)

∂D_Mk

∂F1(D,µa)

∂µa,1 · · ·

∂F1(D,µa)

∂µa,Mµ

· · · ·

∂FS(D,µa)

∂D1 · · ·

∂FS(D,µa)

∂D_Mk

∂FS(D,µa)

∂µa,1 · · ·

∂FS(D,µa)

∂µa,Mµ     (2.24)

donde Fk(µa, D) es el modelo directo para la fuentek-´esima.

Para calcular los elementos de la matriz J, debemos notar que utilizando las aproxima-ciones polinomiales a trozos antes mencionados las matrices K y C se pueden escribir como

Ki,j = Mk

X

m=1

DkK

(m)

i,j , Ci,j = Mµ

X

m=1 µa,kC

(m)

i,j (2.25)

donde

K_i,j(m) =

Z

Ω

ψ_mD∇ψi· ∇ψjdr (2.26)

C_i,j(m) =

Z

Ω

ψ_mµψi·ψjdr (2.27)

(54)

las expansiones en polinomios a trozos, llegamos a

(K(D) +C(µa) +R+iωZ)

∂Φh j

∂Dm

= −K(m)Φh (2.28) (K(D) +C(µa) +R+iωZ) ∂Φ

h k

∂µa,m

= −C(m)Φh (2.29)

donde asumimos que las derivadas de las fuentes respecto de las propiedades ópticas son cero y Φj corresponde a la fluencia de la fuente del j-ésimo par fuente-detector. Para calcular las celdas de la matriz jacobiana, debemos calcular la medida 2.19 y llamándoloM al operador que transforma la fluencia en medida. Precisamente

∂Fj

∂Dm

= M ∂Φ

h j

∂Dm

!

(2.30)

∂Fj

∂µa,m

= M

∂Φh_k

∂µa,m

(2.31)

De esta manera, pudimos calcular todas las celdas de la matriz jacobiana. Es posible calcu-larlas más eficientemente mediante diferenciación adjunta [99],[90]. En la figura 2.2 vemos una malla construida para un ejemplo bidimensional de radio 30 mm, en la figura 2.3 se puede ver la distribución de detectores respecto a una fuente, la figura 2.4 permite ver el logaritmo de la solución de la ecuación diferencial para un medio homogéneo de propiedades ´

(55)

-30 -20 -10 0 10 20 30

X [mm]

-30 -20 -10 0 10 20 30

Y [mm]

Figura 2.2:Ejemplo de una malla bidimensional con elementos triangulares. La circunferencia es de radio30mm

-30 -20 -10 0 10 20 30

x (mm)

-30 -20 -10 0 10 20 30

y [mm]

Fuente Detector

(56)

-12 -10 -8 -6 -4 -2 0

Figura 2.4:Logaritmo de la soluci´on de la ecuaci´on diferencial correspondiente a la fuente de la figura2.3. Para calcular los

datos de la figura2.5se debe aplicar el operador de medida que proyecta en los detectores.

0 5 10 15

Número de detector

-16 -14 -12 -10 -8 -6 -4

-2 Log Amp

0 5 10 15

Número de detector

-1.6 -1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2

0 Fase

(57)

-0.05 0 0.05 0.1 0.15 0.2 0.25

Figura 2.6:Ejemplo de la photon measurement density function obtenida entre la fuente y un detector cualquiera

Hasta aqu´ı tenemos las herramientas esenciales para resolver el problema tomogr´afico, en lo que al modelo directo respecta.

Una observación final que vale la pena mencionar es la justificación de por qué desarrollar modelos frequency-domain en vez de time-domain , siendo que, como hemos visto, los últimos tienen mayor información disponible. Desde el punto de vista de las técnicas de reconstruc-ción, los sistemas time domain requieren la resolución de múltiples problemas lineales, con una alta complejidad computacional. Considerando una discretización temporal dempuntos, la complejidad es la de resolver m problemas como los que resolvemos en frequency-domain lo que, por el momento, resulta poco práctico.

(58)

(59)

Cap´ıtulo 3

(60)

3.1. Resumen

(61)

3.2. Problemas inversos determin´ısiticos

En esta secci´on, trataremos problemas inversos desde el punto de vista determin´ıstico y finito-dimensional. Denotaremos a la cantidad de inter´es como f = (f1,· · · , fm) ∈ Rm y al

vector de datos por g = (g1,· · · , gn)∈Rn.

Supondremos que f y g est´an relacionados mediante una aplicaci´on conocida K :_Rm _→

Rn

de manera que

g =K(f) (3.1)

Si el modelo es lineal, podemos escribirlo de la siguiente manera

g =Kf (3.2)

donde K ∈ _Rn×m_{. La utilidad del operador (o modelo)} _K_{, es la de indicar la observaci´}_on _g dada la cantidad (posiblemente no observable) f. En general, el problema directo está bien propuesto en el sentido que la solucióng existe, es única, y pequeñas perturbaciones enf no generan grandes perturbaciones eng. Supondremos que nuestro modeloK es bien propuesto. El correspondiente problema inverso para las ecuaciones 3.2 y 3.1 es, dado un conjunto de datos g, determinar f tal que las identidades mencionadas se verifican. Los problemas inver-sos como 3.2 no son mal propuestos en s´ı mismos 1. Sin embargo, cuando el problema lineal proviene de una discretización de un problema continuo, los errores de discretización pueden que el problema sea sensible a los errores presentes en los datos. Esto se verá en la sección5

(62)

K

X Y

? f

g

Figura 3.1: Esquema de un problema directo y uno inverso. En el problema directo, dado un elementof ∈X se obtiene un

elementog∈Y mediante el operadorK, pero un problema inverso requiere obtener, dadog∈Y un elementof∈X. Observar

que no est´a definido un operador, por ahora.

Nuestro problema de inter´es es no-lineal, sin embargo, cuando tal no-linealidad no es muy intensa, trataremos el problema como uno localmente lineal, dado que m´etodos del tipo Newton se basan en linealizaciones del operador K.

3.2.1. Descomposici´

on en valores singulares

El rango (o espacio columna) de una matrizK :_Rm _→

Rn se define como:

R(K) ={g ∈_Rn_|_g ₌_Kf_{para alg´}_un_f _∈

Rm} (3.3)

y el n´ucleo se define como:

N(K) = {f ∈_Rm_|_Kf _{= 0}_} _(3.4) entonces, _Rm ₌_N₍_K₎L

N(K)⊥ y _Rn ₌_R₍_K₎L

R(K)⊥ donde ⊥ denota el complemento ortogonal[103].

(63)

define como

K =U SVT (3.5)

donde

S =

"

Σr 0 0 0

#

(3.6) con Σr=Diag(σ1,· · · , σr), σ1 ≥σ2 ≥ · · · ≥σryr= m´ın(n, m). Las columnasui ∈Rm,vi ∈

Rn de las matrices U = (u1,· · ·, un)∈ Rm×m y V = (v1,· · · , vn)∈ Rn×n son ortonormales. Desde un punto de vista geométrico, una tal transformación lineal realiza una transformación ortogonal en el espacio de salida, realiza expansiones y compresiones (y la correspondiente extensión al espacio de llegada) y otra transformación ortogonal en el espacio de llegada. Además, los cuatro subespacios fundamentales de la matriz K quedan determinados por tales matrices, a saber2

R(KT_{) =} _gen_{_v

1,· · · , vr}

N(K) =gen{vr+1,· · · , vn}

R(K) = gen{u1,· · · , ur}

N(KT_{) =}_gen_{_u

r+1,· · ·, um}

notese, además, que R(KT_{) =} _N₍_K₎⊥ _y _R₍_NT_{) =} _R₍_K₎T El número de condición de la matriz K puede definirse como

cond(K) = ||K||||K ||= σ1

σr

(3.7)

donde K es la matriz pseudo-inversa3 _de _K_{. Es posible clasificar la naturaleza de la mala}

condici´on de K:

El problema es de rango deficiente si r < min(m, n) 2_gen₍_x

1,· · · , xn) =z∈Rk :z=Pni=1aixi paraa1,· · · , an ∈R 3_{La matriz pseudo inversa puede definirse simplemente como}_K−₌P

i|σi>0

1

σiviu

T

i donde los vectoresvi

(64)

SiN(K) = {0}peroKtiene algunos valores cercanos a cero, por ejemplo,{σk+1,· · · , σr} con un salto claro entre estos y los primeros {σ1,· · · , σk} en el espectro. En este caso, la matriz K contiene r−k vectores casi linealmente dependientes y el problema es de rango deficiente num´erico.

Un problema inverso discreto se caracteriza por tener un espectro que decae a cero sin un salto notable. Al no haber un salto claro, la noci´on de rango deficiente num´erico es difusa.

Estas situaciones se caracterizan por tener n´umeros de condici´on elevados.

3.2.2. Cuadrados m´ınimos en problemas lineales

En general, tendremos que g /∈ Im(K), de manera que Kf − g 6= 0. Intentaremos, entonces, encontrar una solución que esté lo más cerca posible deg. El método de cuadrados m´ınimos es una de las técnicas usuales y directas.

Aqu´ı, el objetivo es encontrar una estimaci´on al problema4

fLS = argm´ın f∈X

ζ(f) (3.8)

donde ζ(f) = ||g−Kf||2 _y _||_._||₌_||_._|| 2.

El vector que se encuentra a m´ınima distancia se obtiene resolviendo el sistema de ecuaciones normales

KT(Kf −g) = 0 (3.9)

y cuando el problema es no lineal, derivando respecto a f se obtiene:

L(f) = ||K(f)−g||2 _(3.10)

= K(f)TK(f)−2K(f)Tg+gTg (3.11)

∂L

∂f = 2J

T_{J f} ₋₂_JT_g _{= 0} _(3.12)

JTJ f = JTg (3.13)

4_argm´ın

c∈X(g) corresponde al argumento que miniza la expresi´on g, recorriendo el espacio de posibles