• No se han encontrado resultados

Técnicas bayesianas para tomografía óptica

N/A
N/A
Protected

Academic year: 2020

Share "Técnicas bayesianas para tomografía óptica"

Copied!
205
0
0

Texto completo

(1)

Tomograf´ıa ´

Optica

Por

Guido Rodrigo Baez

Trabajo de Tesis para optar al T´ıtulo de Doctor en Matem´atica Computacional e Industrial

Directores: Guillermo Elicabe

Juan Pomarico

Centro de Investigaciones en F´ısica e Ingenier´ıa del Centro de la Provincia de Buenos Aires (UNCPBA - CONICET - CICPBA)

Facultad de Ciencias Exactas

Universidad Nacional del Centro de la Prov. de Bs. As.

(2)
(3)
(4)

Agradecimientos

Quiero agradecer a las personas que me acompa˜naron estos a˜nos de trabajo doctoral. Primero que todo, quiero agradecer a mi familia, Brenda, mi madre Marta, Jos´e y Mariano, siempre dispuestos a acompa˜narme en todo momento. Luego quiero agradecer a mis direc-tores, Dr. Juan Pomarico y Dr. Guillermo Elicabe, por guiarme en el inicio de este camino que es el camino de la investigaci´on cient´ıfica. Su gu´ıa y amistad resultaron ser herramientas fundamentales, adem´as de su experticia y predisposici´on ante eventuales problemas. Tam-bi´en quiero agradecer a todo el grupo de ´Optica Biom´edica del Centro de Investigaciones en F´ısica e Ingenier´ıa del Centro de la Provincia de Buenos Aires por su buena predisposici´on y alegr´ıa diaria. Finalmente, aprovecho para agradecer a la Facultad de Ciencias Exactas de la Universidad Nacional del Centro de la Provincia de Buenos Aires.

(5)
(6)

´

Indice general

Agradecimientos 3

´Indice de figuras 15

´Indice de tablas 16

Resumen 18

Abstract 21

Introducci´on 24

1. Sobre las modalidades de la Tomograf´ıa ´Optica 29

1.1. Resumen . . . 30

1.2. Sistemas Frequency-domain . . . 31

1.3. Sistemas Time-domain . . . 33

1.3.1. Instrumentaci´on para experimentaci´on en el dominio del tiempo . . . 37

2. Sobre el Problema Directo 43 2.1. Resumen . . . 44

2.2. Introducci´on . . . 45

2.3. Ecuaci´on de Transferencia Radiativa . . . 47

(7)

3. Sobre el Problema Inverso 59

3.1. Resumen . . . 60

3.2. Problemas inversos determin´ısiticos . . . 61

3.2.1. Descomposici´on en valores singulares . . . 62

3.2.2. Cuadrados m´ınimos en problemas lineales . . . 64

3.2.3. Regularizaci´on de Tikhonov: caso lineal . . . 65

3.2.4. El caso no-lineal. . . 68

3.2.5. Regularizaci´on de Tikhonov no-lineal . . . 68

3.3. Problemas Inversos Estad´ısticos . . . 69

3.3.1. Otros modelos expl´ıcitos de verosimilitud . . . 74

3.3.2. Construcci´on de distribuciones a priori . . . 76

3.3.3. Campos Aleatorios de Markov . . . 77

3.3.4. Informaci´on a posteriori . . . 79

3.4. Cadenas de Markov de Monte Carlo . . . 84

3.4.1. Construcci´on del Kernel mediante el algoritmo de Metropolis-Hastings 87 3.4.2. Implementaci´on de la t´ecnica de Metropolis-Hastings . . . 90

3.4.3. Metropolis-Hastings de n´ucleo adaptativo. . . 97

3.4.4. Criterio de convergencia . . . 98

3.5. Filtro de Kalman Extendido . . . 100

3.5.1. Problemas inversos no estacionarios . . . 100

3.5.2. Modelos de Observaci´on y Evoluci´on . . . 100

3.5.3. Filtro de Kalman . . . 104

3.5.4. Filtro de Kalman Extendido . . . 112

3.5.5. Error de modelo. . . 115

4. Adquisici´on y procesamiento de datos 124 4.1. Resumen . . . 125

4.2. Adquisici´on de datos . . . 126

4.3. Calibraci´on . . . 128

4.4. Estimaci´on de las propiedades para un medio homog´eneo . . . 134

(8)

4.5.1. Simulaciones computacionales . . . 143

4.5.2. Experimento sobre fantoma . . . 147

5. Resultados 153

Conclusiones y Trabajos futuros 164

(9)

´

Indice de figuras

1.1. Esquema representativo de un sistema CCD. Una fuente (Laser) inyecta luz

en un medio mediante una fibra ´optica (F.O). Una c´amara de CCD colecta la

luz emergente desde la cara opuesta. . . 32

1.2. Esquema representativo de los datos que se colectan en un sistema FD. Una

fuente de amplitudA0 modulada a la frecuenciaω se inyecta dentro del medio

turbio. En la salida, se compara la se˜nal de salida (con amplitud A1) con la

de entrada not´andose cambios en la amplitud y en la fase. . . 32

1.3. Esquema representativo de un sistema FD. Los generadores de radiofrecuencias

se utilizan para comparar los datos con la referencia. Las siglas indican lo

siguiente: amp, amplificador. Mixer: mezclador. DC source: fuente DC. LPF:

filtro pasa-bajos. PC: computadora. PMT: fotomultiplicador. . . 34

1.4. Esquema experimental de un sistema TCSPC. Se emite radiaci´on por un

per´ıodo de tiempo muy corto que sale desde el l´aser y viaja a trav´es de la

fibra ´optica (FO). Atraviesa el medio turbio y es colectada por otra fibra que

lleva la luz observada hacia un fotomultiplicador (PMT), que lo lleva hacia el

(10)

1.5. Izquierda: variaciones de tres pulsos te´oricos cuando el valor deµaes 0,02,0,01

y 0,005mm−1. El valor de µ0s es 2mm−1. Se puede ver que la pendiente de la curva logar´ıtimica es m´as pronunciada cuando mayor es el valor deµa, esto se debe a que a mayor absorci´on, mayor probabilidad de p´erdida de fotones lentos (los que tienen que recorrer caminos m´as largos para llegar al detector), lo que

se traduce en menos luz en el detector. Derecha: variaciones de tres pulsos

te´oricos cuando el valor deµ0s es 3,2 y 1mm−1. El valor deµ

aes 0,01mm−1.Se

puede observar que cuandoµ0sdecrece, el flanco ascendente tiene una pendiente m´as pronunciada. Esto se debe que, al haber menos eventos de scattering, los

fotones llegan m´as r´apidamente al detector. La geometr´ıa utilizada es un slab

de 35mm de espesor. . . 35

2.1. Diagrama del problema directo. Dado el operadorH :P → F que devuelve la fluencia a partir del conjunto de par´ametros, y el operadorP :F → M, que a

partir de la fluencia devuelve la medida que se realiza en el borde. El modelo

directo es la funci´onF :P → M que, a partir de un conjunto de par´ametros devuelve una medida en el contorno del medio que se desea estudiar.. . . 46

2.2. Ejemplo de una malla bidimensional con elementos triangulares. La

circunfe-rencia es de radio 30 mm . . . 55

2.3. Distribuci´on de detectores correspondiente a la malla de la figura 2.2. La fuente

est´a ligeramente dentro del medio para que la fuente sea is´otropa. . . 55

2.4. Logaritmo de la soluci´on de la ecuaci´on diferencial correspondiente a la fuente

de la figura 2.3. Para calcular los datos de la figura 2.5 se debe aplicar el

operador de medida que proyecta en los detectores. . . 56

2.5. De izquierda a derecha: log amplitud y fase medida en los detectores de la

figura 2.3 . . . 56

2.6. Ejemplo de la photon measurement density function obtenida entre la fuente

(11)

3.1. Esquema de un problema directo y uno inverso. En el problema directo, dado

un elemento f ∈ X se obtiene un elemento g ∈ Y mediante el operador K, pero un problema inverso requiere obtener, dado g ∈ Y un elemento f ∈ X. Observar que no est´a definido un operador, por ahora.. . . 62

3.2. Muestras aleatorias de una funci´on que tiene saltos de discontinuidad de

po-sici´on desconocida. En los gr´aficos de arriba es posible ver claramente saltos de gran magnitud, mientras que en los gr´aficos inferiores los saltos son m´as

peque˜nos. . . 78

3.3. Ejemplo de distribuci´on propuesta. En el ejemplo a) tenemos una distribuci´on Gaussiana con distintas matrices de covarianza y distintos centros. En a) la

distribuci´on propuesta es sim´etrica y amplia. En b) c) y d) la distribuci´on

pro-puesta tiene orientaci´on. En c) puede verse que la orientaci´on puede repercutir

en la tasa de aceptaci´on. en d) se puede ver que casi cualquier candidato es

bueno. . . 91

3.4. Distribuci´on objetivo de nuestro ejemplo la funci´on es la de la ecuaci´on 3.126 95

3.5. Muestras obtenidas a partir del m´etodo de MH para distintos valores de δ. a)

δ= 0,05,γ = 0,01. b)δ= 5,γ = 0,89. c)δ = 1,γ = 0,16. d)δ= 0,5,γ = 0,32. Puede observarse que la distribuci´on es mejor cubierta en d). La cantidad de

muestras es, en todos los casos N = 5000 . . . 95

3.6. Ejemplo de burn-in. Observar que hasta alrededor de la muestra 500, la cadena

oscila enormemente, dando informaci´on que no corresponde a la distribuci´on

objetivo. . . 96

3.7. Cadenas de la variablex utilizadas para construir la distribuci´on objetivo con la misma configuraci´on utilizada en la figura 3.5. a) se observa alta correlaci´on

debido a una lenta convergencia. b) Se observa que se acepta lentamente,

debido a un δ muy grande. c) y d) cadenas aceptables. . . 96

3.8. Esquema operativo del proceso de filtrado bayesiano. . . 115

3.9. Muestra aleatoria con las posiciones que toman valores aleatorios (marcados

con una cruz). Con el conocimiento obtenido se forma la muestra con el

(12)

4.1. Diagrama de flujo del programa de medici´on desarrollado en LabViewr. . . 127

4.2. Esquema del sistema de fijaci´on de las fibras al sistema de traslaci´on. Hay un

sistema para la fuente como para el detector. . . 128

4.3. Logaritmo de los valores singulares ordenados de mayor a menor. El n´umero de condici´on es κ(A) = 35740 . . . 131

4.4. Muestras aleatorias de nuestra distribuci´on a priori para obtener soluciones suaves. . . 132

4.5. Resultado del proceso de calibraci´on. Los datos sin calibrar son aquellos que

no pertenecen al modelo que estamos utilizando (como un experimento de

laboratorio, por ejemplo). Los datos de referencia se construyen utilizando el

modelo de DA definido antes con las propiedades ´opticas definidas. . . 134

4.6. Logaritmo de la Funci´on instrumento. El tiempo de exposici´on es de cinco

segundos. El hombro hacia la derecha se debe a la forma del pulso l´aser.. . . 135

4.7. Fantoma utilizado en el experimento de laboratorio (arriba) y su

representa-ci´on computacional (abajo). . . 136

4.8. Ejemplo de una medida temporal. . . 136

4.9. Funci´on deconvolucionada mediante el MAP de la distribuci´on a posteriori 4.14.137

4.10. Distribuci´on a posteriori de los par´ametros µa vs µ0s. La media condicional es

ˆ

µa= 0,0115 y ˆµ0s = 2,67. El per´ıodo de burn-in fue de 35000 muestras. . . 138

4.11. Histogramas marginales de los par´ametrosµa, µ0s, construidos con las muestras

que se utilizaron en la figura 4.10 . . . 138

4.12. Esquema de simulaci´on computacional: a) Dominio con los valores a recuperar

y b) Configuraci´on de fuentes y detectores. Las dimensiones se encuentran en

mm. . . 144

4.13. Ejemplo creado a partir de una distribuci´ona priori gaussiana suavizada para el par´ametro de absorci´onµa . . . 145

4.14. Esquema de generaci´on de muestras aleatorias. Se generan muestras en una

malla regular x(r), de all´ı a la malla original xo la cual, finalmente, se env´ıa a la malla reducida xi mediante la aplicaci´on P . . . 147

4.15. Soporte de la distribuci´on objetivo recuperada para la recuperaci´on de las

(13)

4.16. Soporte de la distribuci´on objetivo recuperada para la recuperaci´on de las

propiedades ´opticas del fantoma del que se extrajo la inclusi´on 2. . . 148

4.17. Histogramas marginales a posteriori correspondientes a las propiedades ´opticas

del fantoma del que se extrajo la inclusi´on 1. . . 148

4.18. Histogramas marginales a posteriori correspondientes a las propiedades ´opticas

del fantoma del que se extrajo la inclusi´on 2. . . 149

4.19. Esquema de la configuraci´on experimental mostrando el paralelep´ıpedo

hos-pedador y las ´areas exploradas por el sistema de fuentes y detectores. El haz l´aser fue escaneado en las posiciones marcadas con “X”y la fibra ´optica de

colecci´on escanea las posiciones indicadas con “O”. La luz colectada es guiada

hasta el fotomultiplicador (PMT) el cual se encuentra conectado al sistema

TCSPC. No se muestran las inclusiones para tener mayor claridad.. . . 150

4.20. Geometr´ıa del subdominio del fantoma mostrando la ubicaci´on de las dos

incluciones. El subdominio tiene dimensiones 45mm×45mm×33mm. . . . 150

4.21. Vista en perspectiva de la geometr´ıa del subdominio del fantoma mostrando

la ubicaci´on de las dos incluciones. . . 151

5.1. Reconstrucciones de las simulaciones 2D con distintos valores de covarianza en

el dominio de reconstrucciones. Las matrices de covarianza son las de la imagen

5.2 y en el mismo orden. Los valores de la funci´on de m´erito son: e(x) = a) 0,2647, b) 0,1615, c) 0,1289, d) 0,1305, e) 0,1267, f) 0,1293, g) 0,1283 y h) 0,1283, respectivamente. . . 155

5.2. Reconstrucciones con distintos valores de covarianza. Las matrices de

cova-rianzas iniciales son P0 =diag(α) con α= b) 101, c) 100 ,d) 10−1, e) 10−2, f)

(14)

5.3. Recuperaci´on n´umero 2. Arriba: Reconstrucci´on de un tubo que atraviesa el

medio con propiedades ´opticas de la mitad del fondo (µainc =

1

2µa0). Izquierda:

original. Derecha: reconstrucci´on. Abajo: gr´afico 1D de las reconstrucciones.

El valor de la funci´on de m´erito es e = 0,1319. El nivel de ruido de los datos es del 1 %. Notar que los artifacts cerca de las fuentes y los detectores son

producto del ruido de las mediciones. Efectivamente, siguen las trayectorias

de las bananas que comunican una determinada fuente con un determinado

detector. . . 157

5.4. Recuperaci´on n´umero 3. Arriba: Reconstrucci´on de un medio que tiene dos

niveles de fondo. En el lado izquierdo el valor del fondo es 0,02 y en el derecho 0,01. Cada secci´on posee una peque˜na inclusi´on ligeramente menos absorbente que el fondo.). Izquierda: original. Derecha: reconstrucci´on. Abajo: gr´afico 1D

de las reconstrucciones. El valor de la funci´on de m´erito ese= 0,1395. El nivel de ruido de los datos es del 1 %. . . 157

5.5. Recuperaci´on n´umero 4. Arriba: Reconstrucci´on de un medio que tiene dos

niveles de fondo. Cada secci´on posee una peque˜na inclusi´on y, adem´as, en

la secci´on derecha se agrega una inclusi´on de mayor tama˜no. Las propiedades

´

opticas son las mismas que las del gr´afico 5.4, pero la inclusi´on que se encuentra

ubicada arriba a la derecha es m´as absorbente que el fondo). Izquierda: original.

Derecha: reconstrucci´on. Abajo: gr´afico 1D de las reconstrucciones. El valor

de la funci´on de m´erito ese = 0,1434. El nivel de ruido de los datos es del 1 %.158

5.6. Reconstrucci´on de datos simulados: comparaci´on de reconstrucciones del par´

ame-tro µa con el m´etodo EKF (columna de la izquierda) vs reconstrucciones reali-zadas con el paquete NIRFAST (columna derecha para tres niveles diferentes

de ruido aditivo y gaussiano. De arriba a abajo, 0,5 %, 1 % and 2 %. No se utilizaron filtros entre las interaciones en ning´un caso. . . 158

(15)

5.8. Izquierda: reconstrucci´on sin el enfoque de Error de Modelo utilizando una

ma-lla gruesa con 341 nodos y 618 elementos triangulares. Derecha: reconstrucci´on

con el enfoque de Error de Modelo utilizando la misma malla. El tiempo medio

de iteraci´on es de 0.43 segundos. El nivel de ruido establecido es de 3 %. . . . 161

5.9. Reconstrucci´on de los coeficientes de absorci´on relativos a partir de los datos

experimentales obtenidos del fantoma. De izquierda a derecha y de arriba a

abajo, los cortes del dominio reconstruido en el plano XY. El plano Z = 0 corresponde al corte donde el l´aser entra al medio. La separaci´on entre cortes

consecutivos es ∆z = (33/24)mm≈1,3mm. . . 162

5.10. Reconstrucci´on de los coeficientes de scattering reducido relativo a partir de

datos experimentales obtenidos del fantoma. Sigue el mismo orden que la figura

5.9 . . . 162

(16)

´

Indice de tablas

5.1. Bondad de la reconstrucci´on con EKF y NIRFAST . . . 160

5.2. Comparaci´on del n´umero de iteraciones y tiempo de CPU para las

(17)
(18)
(19)

Resumen

La Tomograf´ıa ´Optica es una t´ecnica de diagn´ostico por im´agenes no invasiva que se mantiene en constante desarrollo. Esto se debe, principalmente, a que utiliza radiaci´on no ionizante, lo que permitir´ıa un uso peri´odico sin consecuencias ulteriores, y a la portabilidad y costos reducidos que exhibe cuando se la compara con otras modalidades, como son la Tomograf´ıa Computada y la Resonancia Magn´etica. Como contraparte de estas ventajas, el problema de reconstrucci´on tomogr´afica en Tomograf´ıa ´Optica es no lineal y mal propuesto, lo que indica que los modelos lineales son ´utiles hasta cierto punto, y peque˜nos errores en los datos medidos pueden generar grandes errores en la reconstrucci´on, respectivamente. Se han desarrollado m´ultiples aproximaciones basadas, principalmente, en modelos lineales, pero pocas aproximaciones no lineales que, adem´as, permitan incorporar en sus enfoques la naturaleza del ruido de medici´on.

(20)
(21)
(22)

Abstract

Diffuse Optical Tomography is a non invasive imaging technique that keeps a constant development. This is due to, mainly, the use of non ionizing radiation allowing a periodic use without further consequences, and the portability and reduced costs that shows when compa-red to Computed Tomography or Magnetic Resonance Imaging. However, the reconstruction problem is non linear and ill-posed, meaning that linear models have limited use, and slight errors in the data can lead to high errors in the reconstruction. Many approaches have been considered, especially for linear models, and not so many for non linear approaches that may consider the nature of the measurement noise.

(23)
(24)

Introducci´

on

El estudio de la propagaci´on de la luz en tejidos biol´ogicos es un tema de creciente inter´es en el campo de la f´ısica m´edica. Desde los comienzos de la teor´ıa de la transferencia radiativa [1],[2] y a partir de los primeros an´alisis mamogr´aficos y funcionales que utilizaron radiaci´on lum´ınica[3],[4], los intentos por determinar las propiedades ´opticas de los tejidos se han ido multiplicando.

Existe, actualmente, una gran variedad de m´etodos orientados al estudio de tejidos vivos. Entre ellos, el monitoreo por rayos X, el monitoreo por ultrasonido, la tomograf´ıa computada, la resonancia magn´etica, etc. Estas t´ecnicas cuentan con un alto grado de resoluci´on espacial y proveen informaci´on precisa de las estucturas internas que se analizan, aunque, en general, no son capaces de caracterizar los tejidos estudiados. Sin embargo cuando en una mamograf´ıa se detectan objetos extra˜nos, los m´etodos anteriores no permiten distinguir entre un quiste, un tumor, una bola de grasa, etc. As´ı, muchas veces es necesario realizar una intervenci´on quir´urgica (biopsia) para decidir sobre la malignidad del objeto detectado. Esto cuesta dinero y tiempo de recuperaci´on para el paciente, adem´as de consecuencias psicol´ogicas debido al stress producto de esta incertidumbre. Por otra parte, t´ecnicas que utilizan radiaci´on ionizante pueden alterar la materia viva al interactuar con ella y provocar, eventualmente, malformaciones (tumores); la resonancia magn´etica requiere del uso de superconductores, que son muy costosos de fabricar y mantener. Por ´ultimo, el equipamiento necesario para la aplicaci´on de varios de estos m´etodos de monitoreo y detecci´on suele ser de gran tama˜no y dif´ıcil de trasladar.

(25)

base a estas consideraciones, el uso de la radiaci´on visible se presenta como una de las al-ternativas m´as prometedoras. Su aplicaci´on al estudio de los tejidos vivos es posible cuando se trabaja en longitudes de onda del infrarrojo cercano (NIR). En esta regi´on del espectro electromagn´etico, denominada ventana terap´eutica[5], los tejidos vivos presentan una baja absorci´on relativa.

En los ´ultimos 40 a˜nos, el desarrollo de nuevas tecnolog´ıas ha impulsado el empleo de t´ecnicas ´opticas en medicina. En particular, la aparici´on del l´aser ha generado un notable aumento de las aplicaciones cl´ınicas de t´ecnicas ´opticas. Entre las diversas posibilidades que ofrece el uso de radiaci´on visible se encuentran la tomograf´ıa ´optica, la topograf´ıa ´optica, la tomograf´ıa ´optica de fluorescencia, la bioluminiscencia y el monitoreo funcional, entre otras. Este ´ultimo, en particular, permite medir el nivel de oxigenaci´on en sangre de distintos ´

organos y analizar la actividad metab´olica local.

Desde el punto de vista de la propagaci´on de la luz, los tejidos se comportan como medios turbios que hacen que la radiaci´on en el NIR se vuelva r´apidamente difusa en su interior. La difusi´on dificulta, en gran medida, la identificaci´on de estructuras internas debido a la p´erdida de resoluci´on espacial. En parte esto se debe a que la ecuaci´on de difusi´on, herramienta principal de este enfoque, es una ecuaci´on que trabaja con promedios y, por lo tanto, el detalle a peque˜na escala no puede obtenerse ´unicamente a partir de ella. En este proceso es necesario, adem´as, tener en cuenta los efectos de: la longitud de onda de la radiaci´on incidente, los componentes e interfases presentes en el medio (y en la superficie, si correspondiere), la geometr´ıa, etc, y su efecto sobre las mediciones.

(26)

en su naturaleza integro-diferencial cuya soluci´on requiere un poder de c´omputo muy grande, lo que no la hace pr´actico para tomograf´ıa.

La formulaci´on del problema tomogr´afico involucra t´ecnicas matem´aticas de complejidad creciente. Mayormente, se plantean problemas del tipo regularizaci´on de Tikhonov, tanto lineales como no-lineales. Estos ´ultimos utilizan t´ecnicas de tipo Levenberg-Marquardt y Gauss-Newton. Estos son enfoques determin´ısticos, donde se busca una soluci´on puntual al problema. Sin embargo, en general, se puede tener a disposici´on informaci´on adicional que pueda ayudarnos a obtener soluciones con las propiedades deseadas. Dicho de esta manera, la informaci´on previa puede funcionar como sesgo (como cuando tenemos informaci´on previa estructural, como una imagen obtenida por otra modalidad). Adem´as, cuando la informaci´on adicional es agregada en forma de propiedades de las soluciones estamos priorizando aquellas con las caracter´ısticas de la informaci´on disponible. Esto requiere de la habilidad de mode-lar tal informaci´on de manera que las t´ecnicas determin´ısticas permitan incorporarla lo cual es, mayormente, complejo. Aqu´ı es donde t´ecnicas no determin´ısticas, como las estoc´asticas, entran en acci´on pues disponen de otro tipo de herramientas para evaluar esta informaci´on. La herramienta principal que utiliza esta rama de las matem´aticas, llamada Problemas In-versos Estoc´asticos y Computacionales, es el teorema de Bayes, que actualiza el estado de la informaci´on mediante este resultado.

(27)
(28)
(29)

Cap´ıtulo 1

Sobre las modalidades de la

(30)

1.1.

Resumen

(31)

1.2.

Sistemas Frequency-domain

Los sistemas de im´agenes en el dominio de la frecuencia para DOT utilizan luz de intensi-dad modulada a altas frecuencias (unos pocos cientos de megahertz). Esto permite medir la amplitud y el cambio de fase de la se˜nal incidente relativa a la se˜nal original, lo cual provee la base para la tomograf´ıa en el dominio de la frecuencia. Fishkin [6] y Patterson [7] presentaron parte del trabajo inicial sobre el cual se desarrolla esta tecnolog´ıa. Con el uso de este enfo-que, junto con un modelo de propagaci´on de luz difusa [8], es posible reconstruir im´agenes de absorci´on y scattering en tejidos in vivo. Adem´as, repitiendo esto en m´ultiples longitu-des de onda, es posible la recuperaci´on de secuencias funcionales1, dado que los absorbentes

principales (llamados crom´oforos) en los tejidos son la hemoglobina(Hb) y deoxyhemoglobi-na(HbO). Jobsis [2] mostr´o, en 1977, que utilizando dos longitudes de onda apropiadas, es posible monitorear las concentraciones de Hb y HbO. Siguiendo esta l´ınea, varios investiga-dores comenzaron a utilizar enfoques multiwavelength (m´ultiples longitudes de onda) para recuperar las propiedades ´opticas de los crom´oforos primarios tales como HbO, Hb, agua y l´ıpidos y lo utilizaron para monitorear cambios en la fisiolog´ıa de la mama [9],[10] [11], el cerebro [12],[13], y otros [14]. Como ya se mencion´o anteriormente, las t´ecnicas de medici´on empleadas en im´agenes de ´optica difusa pueden organizarse en tres categor´ıas, Onda con-tinua (CW, por sus siglas en ingl´es Continous-wave) que involucra medidas independientes del tiempo, Frecuency-domain, en el dominio de la frecuencia, y Time-domain, en el dominio del tiempo. Desde un punto de vista experimental, los sistemas CW son los m´as sencillos de implementar dado que no necesitan respuestas de corto tiempo. Esto reduce los costos de equipamiento y permite obtener grandes cantidades de datos a partir de c´amaras basadas en charged coupled devices (CCD). En la figura1.1 se ve un diagrama del funcionamiento de un sistema CW donde se puede observar una fuente en contacto con la superficie del medio de an´alisis y, en el extremo opuesto del medio, m´ultiples detectores (en una c´amara) colectan la luz transmitida hasta la respectiva posici´on. La fuente puede ser, por ejemplo un laser de diodos.

(32)

Laser

F.O.

Medio Turbio

Cámara

CCD

Figura 1.1: Esquema representativo de un sistema CCD. Una fuente (Laser) inyecta luz en un medio mediante una fibra ´

optica (F.O). Una c´amara de CCD colecta la luz emergente desde la cara opuesta.

La desventaja que posee esta t´ecnica es que si bien puede localizar objetos dentro de un determinado medio [15], no permite caracterizarlos en t´erminos de sus propiedades ´opticas [16]. Para ello, los sitemas Time-domain y Frequency-domain mejoran dram´aticamente la capacidad del sistema, pero con mayor costo. El principio b´asico de un sistema Frequency-domain se puede ver en la figura 1.2.

Medio Turbio

w

Mod

w

Mod

Corrimiento de fase

A

0

A

0

A

1

Figura 1.2:Esquema representativo de los datos que se colectan en un sistema FD. Una fuente de amplitudA0 modulada a

la frecuencia ω se inyecta dentro del medio turbio. En la salida, se compara la se˜nal de salida (con amplitudA1) con la de

entrada not´andose cambios en la amplitud y en la fase.

(33)

medida que la onda sinusoidal se propaga a trav´es del medio, el camino extendido, debido a la presencia de part´ıculas que difunden la luz, retrasa la fase de la se˜nal modulada. Tras salir del tejido, la onda sinusoidal es atenuada y tiene la fase modificada comparada con la se˜nal incidente. Los cambios medibles en la amplitud y fase contienen informaci´on respecto a las propiedades de absorci´on y de desparramamiento (scattering) del volumen irradiado y, cuando los datos medidos est´an apropiadamente calibrados, es posible recuperar los valores de esas propiedades ´opticas.

Un ejemplo de un sistema Frequency-domain operando en heterodyning2 se puede

obser-var en la figura1.3. Aqu´ı, dos generadores RF (radio frecuencia) se utilizan, uno funcionando a 100 MHz y el otro trabajando a 100,001 MHz. El ejemplo de la figura 1.3 es una versi´on simplificada de un modelo real. En la pr´actica, un arreglo de fuentes en diferentes longitu-des de onda pueden utilizarse secuencialmente y los detectores se pueden paralelizar para incrementar la velocidad de adquisici´on de datos. Tambi´en es posible incorporar iluminaci´on paralela expandiendo el arreglo de moduladores RF e introduciendo diferentes offsets de fase o frecuencias de modulaci´on para cada canal de l´aseres. Estas t´ecnicas fueron utilizadas en [17], [18], [19].

1.3.

Sistemas Time-domain

El otro sistema posible de colecci´on de datos es el dado por los sistemas Time-domain. Cuando un pulso de luz (que llamaremos pulso, de ahora en adelante) entra en el medio difusivo, sufre una serie de cambios debido a las propiedades ´opticas del mismo. Por supuesto, estos fen´omenos son los mismos que ocurren en cualquiera de las modalidades, sin embargo, la diferencia est´a en la manera de verlos, es decir, la informaci´on que colectan los detectores es distinta. En particular, el pulso se ensancha y se retrasa y, midiendo esto, podemos obtener informaci´on sobre lo que ocurre dentro del medio, respecto a sus propiedades ´opticas. ´Esta es la idea principal respecto a las t´ecnicas Time-domain, que son, en cierto sentido, an´alogas a los sistemas de domain. Precisamente, los datos obtenidos en los sistemas

Frequency-2Heterodyning requiere dos generadores de se˜nales operando a frecuenciasf

(34)

RF Gen. RF Gen.

Mixer

Mixer

Ref. Data

Amp.

L.P.F. PMT Medium

PC Laser DC Source

Figura 1.3: Esquema representativo de un sistema FD. Los generadores de radiofrecuencias se utilizan para comparar los datos con la referencia. Las siglas indican lo siguiente: amp, amplificador. Mixer: mezclador. DC source: fuente DC. LPF: filtro pasa-bajos. PC: computadora. PMT: fotomultiplicador.

domain son la transformada de Fourier de los datos en Time-domain en una determinada longitud de onda (m´as adelante mostraremos esto precisamente). De esta manera, los datos obtenidos mediante t´ecnicas de Time-domain, contienen informaci´on de todas las longitudes de onda de modulaci´on. Adem´as, contienen informaci´on de los momentos de la distribuci´on de tiempos3 y pueden detectar informaci´on acerca de posibles errores de medici´on tales como

poco contacto y posibles reflexiones.

Cuando un pulso de luz (de picosegundos de duraci´on) se transmite a trav´es de un medio altamente difusivo como un tejido biol´ogico, la distribuci´on temporal de fotones es conocida como temporal point spread function (TPSF). Un esquema se puede observar en la figura

1.4. La forma de esta distribuci´on contiene informaci´on sobre las propiedades ´opticas de los tejidos [20], como puede verse en la figura 1.5.

(35)

Láser

FO

PMT

PMT

FO

FO

0200400 01234567810-5 020001234567810-5

Medioturbio

40060080010001200 60080010001200

TCSPC

Figura 1.4: Esquema experimental de un sistema TCSPC. Se emite radiaci´on por un per´ıodo de tiempo muy corto que sale desde el l´aser y viaja a trav´es de la fibra ´optica (FO). Atraviesa el medio turbio y es colectada por otra fibra que lleva la luz

observada hacia un fotomultiplicador (PMT), que lo lleva hacia el sistema TCSPC, que permite su obtenci´on y visualizaci´on

para su an´alisis.

0 5 10 15

Tiempo (ns) -60 -50 -40 -30 -20 -10 0

Logaritmo de la transmitancia

Variaciones respecto a a

a = 0.02

a = 0.01

a = 0.005

0 5 10 15

Tiempo (ns) -60 -50 -40 -30 -20 -10 0

Variaciones respecto a s

s = 3

s = 2

s = 1

Figura 1.5:Izquierda: variaciones de tres pulsos te´oricos cuando el valor deµa es0,02,0,01y0,005mm−1. El valor deµ0s es

2mm−1. Se puede ver que la pendiente de la curva logar´ıtimica es m´as pronunciada cuando mayor es el valor deµ

a, esto se

debe a que a mayor absorci´on, mayor probabilidad de p´erdida de fotones lentos (los que tienen que recorrer caminos m´as largos

para llegar al detector), lo que se traduce en menos luz en el detector. Derecha: variaciones de tres pulsos te´oricos cuando el

valor deµ0

ses3,2y1mm−1. El valor deµaes0,01mm−1.Se puede observar que cuandoµ0sdecrece, el flanco ascendente tiene

una pendiente m´as pronunciada. Esto se debe que, al haber menos eventos de scattering, los fotones llegan m´as r´apidamente

al detector. La geometr´ıa utilizada es un slab de 35mm de espesor.

(36)

separar, mediante compuertas controladas por tiempo, aquellos fotones que sal´ıan r´ apida-mente y que se asum´ıa que recorr´ıan la menor distancia a trav´es del medio. Tales fotones son menos desparramados que aquellos que tardan m´as en llegar, de manera que su trayec-toria puede ser modelada, con buena aproximaci´on, con l´ıneas rectas, realizando un an´alisis directo y utilizando la transformada de Radon, as´ı como se realiza en tomograf´ıa computada [21]. Sin embargo, la cantidad de fotones que pueden ser medidos a trav´es de medios con ancho relevante es muy peque˜na4, y este enfoque fue abandonado para vol´umenes grandes

de tejido. Recientemente, estos fotones han sido utilizados en peque˜nos animales, donde el ancho es peque˜no [22], permitiendo colectar un n´umero razonable de fotones cuasi-bal´ısticos. Algunos intentos m´as sofisticados de medir toda la TPSF fueron hechas por Hebden [23] quien discut´ıa el uso de c´amaras y sistemas time-to-amplitude converter (TAC). De estas t´ecnicas la m´as habitual es la basada en sistemas de conteo de fotones correlacionados en el tiempo (time-correlated-single-photon counting -TCSPC-), los cuales dan medidas flexibles de tiempo de llegada de fotones con altas tasas de cuentas y buena resoluci´on temporal [24]. Estos sistemas se utilizan, en general, junto con detectores de tipo tubo fotomultiplicador (PMT Photomultiplier tube). En este trabajo se utilizar´a este enfoque.

Si bien los sistemas de Frequency-domain son r´apidos y relativamente m´as baratos que los sitemas de Time-domain, ´este ´ultimo posee algunas ventajas que lo hacen atractivo:

Las medidas en Time-domain se pueden realizar con detectores de tipo fotomultiplica-dores y fuentes pulsadas laser, llevando a la m´axima sensibilidad posible. Los sistemas TCSPC son el ´unico camino de medir luz a trav´es de medios de gran volumen en donde tal vez s´olo unos pocos fotones por segundo puedan medirse.

La TPSF contiene componentes de frecuencia temporal hasta varios GHz, de manera que una medida time-domain incluye informaci´on de un amplio rango de frecuencias en comparaci´on con sistemas frequency-domain que s´olo funcionan en una ´unica frecuen-cia. Habiendo dicho esto, la TPSF es suave, de manera que no es claro qu´e informaci´on adicional provee (que la curva sea suave enmascara posible informaci´on de alta frecuen-cia que no se pueda extraer con claridad).

4asicamente, los bal´ısticos son la fracci´on exp ((µ

a+µs)L), conL el espesor de la paralelep´ıpedo en

(37)

El fen´omeno conocido comoPhase-wrappingpuede ocurrir en sistemas de tipo frequency-domain si el cambio de fase es mayor a 2π. Esto puede eludirse reduciendo la frecuencia de modulaci´on al costo de reducir el contraste de la medida y reduciendo la m´axima frecuencia que puede utilizarse para penetrar el medio.

La TSPF puede procesarse para dar algunos tipos de datos diferentes de la intensidad y el tiempo medio de vuelo de fotones (equivalente a la intesidad y la fase de un sistema de frequency-domain). Schweiger y Arridge [25] mostraron que algunos tipos de datos pueden mejorar la discriminaci´on entre absorci´on y scattering. Sin embargo, dado que los tipos de datos de orden superior son m´as sensibles al peque˜no n´umero de fotones que llegan m´as tarde, y ´estos son m´as sensibles al ruido, no han sido aplicados con ´

exito, a´un.

Quiz´as la ventaja menos ponderada de la t´ecnica time-domain es su habilidad de identi-ficar datos pobres. Los datos experimentales, especialmente los datos de cl´ınica, pueden verse contaminados con luz espuria, la cual se encuentra correlacionada con las medidas, lo que dificulta sacarla en el caso de medidas hechas por control temporal de compuer-tas. Este ruido puede venir de error de instrumentaci´on o, m´as comunmente, de luz que se filtra alrededor del medio que se quiere estudiar. ´Este es un problema particular de geometr´ıas complejas o cuando los conectores ´opticos no se mantienen sobre la super-ficie del medio de manera robusta [26]. Por ejemplo, cuando se conectan fibras sobre un medio a analizar y la conexi´on no es correcta, en el sentido que algo de luz espuria pueda entrar a las fibras se puede manifestar como parte de la TPSF. Tales artefactos pueden llevar a errores en los c´alculos de intensidad y de tiempo medio de vuelo de los fotones. Y, por lo tanto, a errores de reconstrucci´on. La t´ecnica time-domain permite detectar estos posibles problemas.

1.3.1.

Instrumentaci´

on para experimentaci´

on en el dominio del

tiempo

(38)

siste-mas TCSPC y sistesiste-mas de compuertas. Ambos poseen buena sensibilidad y buena resoluci´on temporal, pero son relativamente lentos y costosos (comparados con sistemas frequency-domain). Los sistemas de compuertas funcionan midiendo la luz dentro de un intervalo corto de tiempo. La TPSF se construye midiendo a diferentes retardos de tiempo. Este enfoque es menos costoso que los sistemas TCSPC y, en particular, el costo y los tiempos de adquisici´on no escalan con el n´umero de canales, permitiendo tener muchos detectores a costo de perder un poco de informaci´on.

Principio de operaci´on de los sistemas TCSPC

Los sistemas TCSPC funcionan, b´asicamente, midiendo los tiempos de llegada de fotones individuales. Esto requiere de un sistema de detecci´on capaz de identificar la llegada de un fot´on, distinguirlo de un evento de ruido electr´onico, medir su tiempo de llegada y luego guardar ese tiempo de manera conveniente. Adem´as, la probabilidad de detectar un fot´on en un per´ıodo de conteo simple debe ser mucho menor que uno. Si esta condici´on se satisface, podemos descontar la posibilidad de tener dos fotones llegando en el mismo per´ıodo, y no tenemos que compensar errores que pudieran ocurrir en ese caso [24].

(39)

Una manera alternativa de medir los tiempo de llegada es utilizar un TAC. Cuando un pulso se detecta, el TAC comienza a cargar un capacitor. El pulso de referencia detiene la carga, de manera que el voltaje a trav´es del TAC es proporcional al tiempo entre los dos pulsos. Esta se˜nal se la amplifica y se la env´ıa a un conversor anal´ogico-digital (ADC), el cual alimenta un banco de memoria que ensambla el histograma. El PTA es m´as costoso que el TAC pero tambi´en es m´as preciso.

Estos sistemas de primera generaci´on son precisos y sensibles, pero grandes y relativa-mente lentos. Tambi´en son unidimensionales en el sentido que mide los tiempos de llegada de un s´olo tren de fotones. Los dispositivos TCSPC de segunda generaci´on [24],[29] combinan los CFD y los PTA (o, equivalentemente, los CFD, TAC y ADC) en un ´unico circuito, el cual es montado en una PC. Esto conlleva un incremento en la velocidad en un factor 100 y una reducci´on de tama˜no de un orden similar. La reducci´on de tama˜no es atractivo para los sistemas con potencial a cl´ınica.

Otra ventaja de este enfoque es que puede ser descrito como multidimensional. Esto quiere decir que cuando se detecta un fot´on, su tiempo de llegada no es llevado meramente a memoria, sino que puede ser enviado a una ubicaci´on particular controlada por el usuario. De esta manera, una sola unidad TCSPC puede grabar a partir de m´ultiples detectores y m´ultiples fuentes. Esto puede ser ´util para distinguir entre distintas longitudes de onda (de la fuente o del detector), diferentes ubicaciones de fuentes y detectores, o las coordenadas x-y de un sistema de escaneo. Esto requiere una se˜nal extra de un router que, por ejemplo, pueda incluir una se˜nal que muestre qu´e detector midi´o el fot´on particular y que luego se asegure que los datos de ese fot´on se enruten al banco de memoria apropiado.

(40)

Fuentes de luz

Las fuentes de luz para los sistemas de time-domain se determinan tanto por los requeri-mientos de las TCSPC como por el objetivo del experimento. Las longitudes de onda suelen rondar los 800 nm y, casi siempre, entre 600 nm y 1000 nm. La selecci´on de la longitud de onda ´

optima es compleja y no completamente comprendida [31], pues depende del crom´oforo que se desea detectar. La potencia debe ser tal que no da˜ne el medio. Los sistemas time-domain requieren que las fuentes sean pulsadas.

Existen dos enfoques. Mayormente, se utilizan l´aseres de diodos. Son lo suficientemente baratos para que cada fibra correspondiente a una fuente pueda tener su propio laser, por lo que no es necesario, en general, el multiplexado. Est´an disponibles en varias longitudes de onda con anchos de banda angostos y son sencillas de controlar electr´onicamente. Se los suelen utilizar en los sistemas ´opticos de time-domain [32], [33], [34]. Sin embargo, la potencia promedio disponible para pulsos muy cortos en el infrarrojo cercano (NIR) est´a limitada a unos mW (hasta 50mW).

Otros tipos de laser pueden proveer mucha m´as potencia, pero pueden requerir realinear o recalibrar tras un peque˜no movimiento, lo que podr´ıa ser inaceptable en sistemas portables.

Detectores

En tomograf´ıa ´optica, necesitamos poder guardar las TPSF a partir de medidas de baja intensidad con gran precisi´on. La duraci´on de la TPSF es del orden de unos pocos nanosegun-dos, para poder resolver esto, la funci´on respuesta instrumental (IRF) del detector deber´ıa ser de unos pocos picosegundos o menos aunque, en la pr´actica, no siempre se poseen tales sistemas. M´as a´un, la estabilidad de la IRF respecto del tiempo debe ser menor que los cam-bios en el tama˜no de la se˜nal que se est´a midiendo. En ciertas ocasiones, el tiempo de vuelo puede ser de s´olo unos pocos picosegundos, de manera que adquirir la estabilidad adecuada puede ser desafiante. Adem´as, estamos midiendo luz difusa de baja intensidad y, para poder colectar la cantidad de luz que sea necesaria, se necesita un detector con gran ´area de colec-ci´on. Por lo tanto, necesitamos detectores estables y sensibles, que sean eficientes en el NIR y con r´apida IRF.

(41)

Sistemas TCSPC

Hemos presentado el principio general de los sistemas TCSPC, ahora veremos los dos tipos utilizados en tomograf´ıa de ´optica difusa: con todos los canales totalmente paralelizados o compartiendo canales escaneando la fuente, el detector o ambos.

El Monstir utiliza el primer enfoque. A´un cuando utiliza un ´unico l´aser, su salida pasa a trav´es de un switch de 32 salidas as´ı que la luz se env´ıa a 32 canales paralelos. Las fibras de las fuentes y los detectores se combinan con fibras coaxiales, las cuales pueden proveer o colectar luz. Esto permite un procedimiento de calibraci´on sencillo [35] y reduce a la mitad el n´umero de conexiones que debe hacerse a la cabeza o el busto escaneados. Una fibra se utiliza para llevar la luz mientras las 31 restantes colectan la luz que emerge luego de viajar a trav´es del cuerpo. Cada fibra detectora transmite luz a un microchannel-plate photomultiplier tube (MCP-PMT) el cual tiene un transit-time spread (TTS) m´as corto comparado a un PMT est´andar, llevando a una IRF m´as de ancho medio menor5 y a estabilidad temporal mejorada.

Treinta y dos atenuadores reducen la intesidad de las fuentes m´as intensas, para prevenir la saturaci´on de los detectores y reducir el rango din´amico de la luz medida.

El segundo enfoque es el que se utiliza, por ejemplo, en los grupos de investigaci´on de Berl´ın ([36], [33]) y Milan ([37], [34]), as´ı como en la compa˜nia Advanced Research Techno-logies Inc [38]. Los sistemas de Berl´ın y Mil´an utilizan como fuente un l´aser de diodos en cada longitud de onda de inter´es, el cual se multiplexa en un ´unico tren de pulsos que viaja a trav´es de la fibra fuente. Los datos se colectan utilizando una fibra que escanea en la cara opuesta a la fuente, o por un n´umero peque˜no de fuentes que est´an desplazados fuera del eje del detector. Las fibras de las fuentes y los detectores se mueven a trav´es del ´area de inter´es (a lo alto y ancho del ´area de inter´es), los que se utilizan en una mama gentilmente presionada. Los datos se colectan a intervalos de 1 mm. Ambos sistemas utilizan PMT, los cuales proveen una se˜nal que debe ser procesada por un sistema TCSPC en una PC.

5En pos de la claridad, la IRF puede verse como unapoint spread function, en el sentido que una medida es de la forma

m=i∗f

(42)
(43)

Cap´ıtulo 2

(44)

2.1.

Resumen

(45)

2.2.

Introducci´

on

En las ´ultimas dos d´ecadas, se han realizado avances respecto al modelado de la propa-gaci´on de luz en medios turbios, como puede verse, principalmente, en el ya cl´asico trabajo de Ishimaru donde se exploran varios modelos para diversas geometr´ıas [39]. Estos avances gu´ıan el desarrollo de t´ecnicas ´opticas tomogr´aficas, las cuales dependen de la habilidad de modelar, apropiadamente, la interacci´on de la luz con el tejido biol´ogico. En general, estas t´ecnicas utilizan luz en el infrarrojo cercano (NIR) en las longitudes de onda de 600nm -900nm para penetrar el tejido biol´ogico y obtener im´agenes funcionales ([31], [40], [41]). La propagaci´on de la luz en NIR est´a gobernada por la distribuci´on espacial de los coeficientes de absorci´on yscattering,µay µs, respectivamente. Los coeficientes de scattering toman valores en el rango de µs = 20,· · · ,200cm−1 ([42], [43]). Tambi´en se suele utilizar el coeficiente de scattering reducido µ0s = (1−g)µs, siendo g el coseno medio de scattering, tambi´en llamado factor de anisotrop´ıa, de evento de scattering simple. T´ıpicamente, este factor ronda entre 0.8 y 0.98. Las mol´eculas absorben radiaci´on a determinadas longitudes de onda, y se las deno-minan gen´ericamente crom´oforos, dentro de un tejido que puede causar absorci´on en varias longitudes de onda. El coeficiente de absorci´on var´ıa, en los crom´oforos end´ogenos t´ıpicos de los medios biol´ogicos, entreµa= 0,01 a 0,5cm−1 en el NIR ([44], [45], [46], [47]). Ejemplos de crom´oforos end´ogenos son: la hemoglobina, citocromas, flavinas y porfirinas. Diferencias en la concentraci´on y contenido de los crom´oforos conllevan a diferentes coeficientes de absorci´on

µa(r) conr ∈Ω, donde Ω es el medio de inter´es.

(46)

la distribuci´on de luz Φ(r) con r ∈ ∂Ω, precisamente en la ubicaci´on de los detectores, el esquema puede verse en la figura 2.1. A partir de estos datos, intentaremos, en los cap´ıtulos siguientes utilizar rutinas de recuperaci´on para saber cu´ales son los valores de las funciones

µa(r) yµs(r).

H

P

F

P

F

M

Figura 2.1: Diagrama del problema directo. Dado el operadorH :P → F que devuelve la fluencia a partir del conjunto de

par´ametros, y el operador P:F → M, que a partir de la fluencia devuelve la medida que se realiza en el borde. El modelo

directo es la funci´onF :P → Mque, a partir de un conjunto de par´ametros devuelve una medida en el contorno del medio

que se desea estudiar.

Estas rutinas de recuperaci´on pertenecen a la rama de las matem´aticas llamada Teor´ıa de Problemas Inversos, los cuales, en general, involucran la resoluci´on de un problema de optimizaci´on. A las lecturas del detector predichas por un modelo directo (o forward) en la superficie del tejido se las compara constantemente contra las lecturas del detector definiendo una funci´on objetivo, originalmente, la norma L2 del error. Se minimiza la funci´on objetivo

(47)

2.3.

Ecuaci´

on de Transferencia Radiativa

El problema directo de Propagaci´on de Luz en Tejidos Biol´ogicos se modela a partir de la Ecuaci´on de Transferencia Radiativa [58], [59], [39], [60] (RTE por sus siglas en ingl´es), que es una alternativa heur´ıstica a la teor´ıa rigurosa definida por las ecuaciones de Maxwell. Esta ecuaci´on se resuelve, usualmente, mediante m´etodos num´ericos dado que no existen soluciones anal´ıticas de esta ecuaci´on para geometr´ıas complejas y medios no homog´eneos en sus propiedades ´opticas. Estos m´etodos num´ericos pueden ser aproximaciones de ´ordenes bajos de la RTE, tales como la aproximaci´on difusiva, o aproximaciones de ´orden superior como, por ejemplo, discrete ordinates method (Sn) o el m´etodo de expansi´on en arm´onicos esf´ericos (Pn) [61]. La aproximaci´on difusiva se utiliza ampliamente en tejidos en donde

µ0s >> µa (este es el llamado r´egimen difusivo), como son, por ejemplo, la mama femenina o el tejido muscular [62]. Sin embargo, la aproximaci´on difusiva presenta limitaciones en geometr´ıas peque˜nas, tejidos con alta absorci´on y tejido con zonas de vac´ıo (´optico) [63], como pueden ser las zonas de muy baja absorci´on y scattering (como los quistes, fluido cerebro-espinal, etc). En estos casos, se suelen utilizar aproximaciones de orden superior ([64], [65]). En general, se suele utilizar una discretizaci´on espacial del dominio para resolver la ecuaci´on con t´ecnicas como el m´etodo de diferencias finitas, vol´umenes finitos o el m´etodo de elementos finitos. En el caso de RTE independiente del tiempo, los trabajos de Klose ([66]), Hielscher ([14], [67], [68]) y Tarvainen ([69],[70] y [71]) desarrollaron t´ecnicas num´ericas que involucran las aproximaciones mencionadas, as´ı como aproximaciones h´ıbridas Difusi´on-Transporte en regiones donde la aproximaci´on difusiva no es aplicable.

En el caso dependiente del tiempo, los trabajos de Dorn [72], Boulanger y Charette [73][74], Ren [75] y [76], Abdoulaev y Hielshcer [77], Abdoulaev [78], Kim and Hielscher [79], Klose and Larsen [80], fueron utilizados tanto en el r´egimen puramente temporal as´ı como en el dominio de la frecuencia.

Desarrollaremos brevemente el planteo del problema de la RTE; precisamente: sea Ω⊂Rn un dominio simplemente conexo, es decir, sin agujeros, con un borde al menos suave a trozos

(48)

de s∈ Sn−1(la bola unitaria en

Rn) sigue la ecuaci´on de balance: s· ∇Φ(x, s) +µtΦ(x, s) =µs

Z

Sn−1

f(s, s0)Φ(x, s0)ds0+q(x, s0) (2.1)

donde Φ(x, s) es la densidad de part´ıculas en la posici´onx que viajan en direcci´ons, q es el t´ermino fuente,µa es el par´ametro de absorci´on, µs el coeficiente de scattering, el coeficiente de transposrte µt = µa +µs y f es el kernel de scattering, en general, rotacionalmente invariante, es decir, f(s, s0) =f(s·s0). Usualmente, se utiliza el kernel de Henyey-Greenstein [81] definido de la siguiente manera:

f(s, s0) = 1−g

2

2(n−1)π(1 +g22g(s·s0))n/2. (2.2)

En general, asumiremos que todos los par´ametros son estrictamente positivos y n es la di-mensi´on del espacio de coordenadas. Para determinar las condiciones de contorno de la RTE definimos el vector normal a la superficie ∂Ω como n(x) con x ∈∂Ω y Γ+ (respectivamente Γ−) = {(x, s)∈∂Ω×Sn−1 :s·n 0(0)} como el borde saliente (entrante) y n

i(n0)

co-mo el ´ındice de refracci´on del medio (entorno). De esta manera la condici´on de contorno de reflexi´on para (2.1) es

Φ(x, s) = R(x, s, s0)Φ(x, s0) (2.3)

para (x, s)∈Γ−, (x, s0)∈Γ+, donde s0 refiere a la direcci´on angular en x en el borde que se

refleja en s cuando ni 6= n0, y R corresponde a la tasa de energ´ıa reflejada a trav´es de las

ecuaciones de Fresnel usuales en una frontera con cambio de ´ındice de refracci´on. Cuando no hay tal cambio, nos encontramos con la condici´on de borde vac´ıo, con R= 0.

Para no desviarnos del tema central no entraremos aqu´ı en detalles de existencia y unicidad que muestran las condiciones en las cuales existe una ´unica soluci´on de2.1. El lector interesado puede referirse al ap´endice .

(49)

aproxima-damente, 100 veces mayor que el coeficiente de absorci´on, y, la distancia fuente-detector es mayor a µ10

s, haciendo una aproximaci´on por arm´onicos esf´ericos y teniendo en cuenta

sola-mente los t´erminos isotr´opicos y linealmente anisotr´opicos (como se puede ver en el ap´endice) se llega a la ecuaci´on de difusi´on, la cual escribiremos en el dominio de la frecuencia:

(

∇ ·(D(x)· ∇I(x, w))−(µa− iωc) (x)I(x, w) = 0, x∈Ω/∂Ω

I(x, w) + 2AD(x)∂I ∂bn

=S(x, w), x∈∂Ω (2.4) donde D(x) = 3(µ 1

a(x)+µ0x(x)) con µ

0

s(x) = µs(1−g) es el coeficiente de scattering reducido y g es el factor de anisotrop´ıa. Aes el coeficiente de Fresnel que incorpora el cambio de ´ındice de refracci´on en el borde aire-tejido y bn es el vector normal a Ω en x. Una de las ventajas que presenta esta ecuaci´on es que tiene soluciones anal´ıticas en un buen n´umero de geometr´ıas, y adem´as permite agregar inclusiones dentro del volumen difusivo. ´Estas pretenden simular la existencia de lesiones (tumores, quistes, etc) que puedan estar presentes en el interior del tejido saludable. Desde el punto de vista num´erico, no es necesario calcular la influencia an-gular lo que hace que, en los enfoques num´ericos, la complejidad computacional disminuye dram´aticamente, ´util para problemas de geometr´ıas arbitrarias en problemas num´ericos. Da-do que las geometr´ıas que nos interesan son arbitrarias, nos enfocaremos en la resoluci´on de un modelo num´erico mediante el m´etodo de Elementos Finitos (FEM) y c´omo, a partir de ´

el, podemos calcular tambi´en el Jacobiano.

Elementos Finitos y la aproximaci´

on difusiva

(50)

autores han discutido sobre las implementaciones en FEM de la DA [86], [87], [88], [89], [90], [91], [92],[93].

La formulaci´on variacional para la DA nos dice que φ ∈H1(Ω) es soluci´on de la ecuaci´on

de difusi´on en forma d´ebil si satisface [86]

Z

Ψ

−∇ ·D∇+µa+

iω v φdr = Z Ω

Ψq0dr,∀Ψ∈H1(Ω) (2.5)

Utilizando la formula de Green

Z

v∇ · ∇udr=−

Z

γ∇u· ∇vdr+

Z

∂Ω

vγ∇u·ndS (2.6)

podemos reescribir 2.5 como

Z

D∇Φ· ∇Ψdr−

Z

∂Ω

1

2vΦΨdS+

Z

µaΦΨdr+

iω c

Z

ΦΨdr (2.7)

=

Z

q0Φdr+

Z

∂Ω −2As

v ΦdS (2.8)

con As un coeficiente que mide la p´erdida producto de los reflejos internos del borde [94]. En el trabajo de Kolehmainen [95] se muestra que este razonamiento nos lleva a utilizar1 la

medida

Γ(r, ω) = − 1

2As

Φ(r, ω) (2.9)

Para construir la aproximaci´on en elementos finitos para Φ, se aproxima la soluci´on con una funci´on polinomial a trozos

Φh = Nn

X

i=1

φiψi ∈Xh ⊂H1(Ω) (2.10)

donde Xh = span{ψ

i|i= 1,· · · , Nn} y ψi son las funciones base de la malla de elementos finitos Ω =TNe

l=1Ωl. Insertando la aproximaci´on2.10en2.7y utilizando las funciones nodales

(51)

{ψj|j = 1,· · · , Nn} como funciones test, llegamos a la ecuaci´on

(K(D) +C(µa) +R+iωZ)Φh =G+E (2.11) con las entradas del sistema definidas por

Ki,j =

Z

D∇ψi· ∇ψjdr (2.12)

Ci,j =

Z

µaψiψjdr (2.13)

Zi,j =

1

c

Z

1

2AφiφjdS (2.14)

Los vectores fuente en el lado derecho de 2.11 depende del modelo de fuente que utilicemos. Para el caso de fuente difusa los vectores E y G son de la forma

Ej = 0, Gj =

Z

∂Ω −2Γs

As

ψjdS (2.15)

dado que este modelo asume que no hay fuentes internas, tenemos que q0 = 0. En el caso de

fuente colimadas los vectores son

Ej =

Z

q0ψjdr, Gj = 0 (2.16)

dado que el modelo asume que Γs = 0 y las fuentes del bordes se las modela como fuentes isotr´opicas que est´an dentro del medio una distancia de z0 = µ10

s. La soluci´on formal a este

problema es

Φhk = (K(D) +C(µa) +R+iωZ)

−1

(G+E) (2.17)

El vector de medida

Γ(k) =Γ1(k),· · · ,Γ(Mk) T

(2.18) (Γs es la corriente difusa del borde) en la ubicaci´on de los detectores se obtiene haciendo

(52)

con H es una matriz tal que

Di,n=

(

− 1

2A , si el nodoNn se encuentra en la posici´on del detector i-´esimo

0 , en otro caso

(2.20) Finalmente, la cantidad medible en los sistemas frequency-domain en la posici´on del j-´esimo detector es el cambio de fase y la amplitud de la modulaci´on (la amplitud A.C.) de la medida compleja Γkj(ω) [91],[96],[23],[97] que es

zi,phasek = arg(Γkj(ω)) = =(Γ k j(ω))

<(Γk j(ω))

(2.21)

zi,ampk = |Γkj(ω)| (2.22) que es la cantidad que se compara contra las medidas en las secciones siguientes. Es impor-tante, tambi´en para m´as adelante, notar que, si tenemos una medida en el dominio temporal Γkj(t) se puede obtener la medida en el dominio de la frecuencia haciendo:

Γkj(ω) =

Z

Γkj(t) exp(−iωt)dt (2.23)

es decir, mediante la transformada de Fourier.

Algunas observaciones respecto a este modelo de aproximaci´on que deben hacerse son: Dado que la aproximaci´on difusiva utiliza ´unicamente dos t´erminos de la expansi´on en arm´onicos esf´ericos, que contienen informaci´on isotr´opica y linealmente anisotr´opica, no es aplicable en todas las situaciones, aunque es ´util en algunas circunstancias. Primero, necesitamos que µa << µ0s y que la fuente se encuentre a algunos caminos libres promedios (µ10

s) de los detectores [90],[59]. Esto hace que su aplicabilidad en

situaciones donde existe un “vac´ıo” como ocurre en el caso de los quistes, hacen que la efectividad de la ecuaci´on de difusi´on se vea limitada, sin embargo, todav´ıa puede aplicarse en algunas situaciones [98].

(53)

radiaci´on, que viola el principio de causalidad, por lo que no da buenas aproximaciones a tiempos cortos[90].

2.3.1.

Matriz jacobiana

Para poder resolver, posteriormente, el problema tomogr´afico, precisamos poder determi-nar la construcci´on del jacobiano. El no hacerlo podr´ıa aumentar la complejidad computacio-nal dado que tendr´ıamos que evaluar el modelo tantas veces como al menos el doble de la cantidad de par´ametros a estudiar, lo que podr´ıa hacer prohibitiva su aplicabilidad. Supon-gamos que las funciones (µa, D) son aproximadas como en la forma2.10 y que las funciones base ψ(mD), ψm(µa) son conocidas. El jacobiano debe tener la forma

J =

   

∂F1(D,µa)

∂D1 · · ·

∂F1(D,µa)

∂DMk

∂F1(D,µa)

∂µa,1 · · ·

∂F1(D,µa)

∂µa,Mµ

· · · ·

∂FS(D,µa)

∂D1 · · ·

∂FS(D,µa)

∂DMk

∂FS(D,µa)

∂µa,1 · · ·

∂FS(D,µa)

∂µa,Mµ     (2.24)

donde Fk(µa, D) es el modelo directo para la fuentek-´esima.

Para calcular los elementos de la matriz J, debemos notar que utilizando las aproxima-ciones polinomiales a trozos antes mencionados las matrices K y C se pueden escribir como

Ki,j = Mk

X

m=1

DkK

(m)

i,j , Ci,j = Mµ

X

m=1 µa,kC

(m)

i,j (2.25)

donde

Ki,j(m) =

Z

ψmD∇ψi· ∇ψjdr (2.26)

Ci,j(m) =

Z

ψmµψi·ψjdr (2.27)

(54)

las expansiones en polinomios a trozos, llegamos a

(K(D) +C(µa) +R+iωZ)

∂Φh j

∂Dm

= −K(m)Φh (2.28) (K(D) +C(µa) +R+iωZ) ∂Φ

h k

∂µa,m

= −C(m)Φh (2.29)

donde asumimos que las derivadas de las fuentes respecto de las propiedades ´opticas son cero y Φj corresponde a la fluencia de la fuente del j-´esimo par fuente-detector. Para calcular las celdas de la matriz jacobiana, debemos calcular la medida 2.19 y llam´andoloM al operador que transforma la fluencia en medida. Precisamente

∂Fj

∂Dm

= M ∂Φ

h j

∂Dm

!

(2.30)

∂Fj

∂µa,m

= M

∂Φhk

∂µa,m

(2.31)

De esta manera, pudimos calcular todas las celdas de la matriz jacobiana. Es posible calcu-larlas m´as eficientemente mediante diferenciaci´on adjunta [99],[90]. En la figura 2.2 vemos una malla construida para un ejemplo bidimensional de radio 30 mm, en la figura 2.3 se puede ver la distribuci´on de detectores respecto a una fuente, la figura 2.4 permite ver el logaritmo de la soluci´on de la ecuaci´on diferencial para un medio homog´eneo de propiedades ´

(55)

-30 -20 -10 0 10 20 30

X [mm]

-30 -20 -10 0 10 20 30

Y [mm]

Figura 2.2:Ejemplo de una malla bidimensional con elementos triangulares. La circunferencia es de radio30mm

-30 -20 -10 0 10 20 30

x (mm)

-30 -20 -10 0 10 20 30

y [mm]

Fuente Detector

(56)

-12 -10 -8 -6 -4 -2 0

Figura 2.4:Logaritmo de la soluci´on de la ecuaci´on diferencial correspondiente a la fuente de la figura2.3. Para calcular los

datos de la figura2.5se debe aplicar el operador de medida que proyecta en los detectores.

0 5 10 15

Número de detector

-16 -14 -12 -10 -8 -6 -4

-2 Log Amp

0 5 10 15

Número de detector

-1.6 -1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2

0 Fase

(57)

-0.05 0 0.05 0.1 0.15 0.2 0.25

Figura 2.6:Ejemplo de la photon measurement density function obtenida entre la fuente y un detector cualquiera

Hasta aqu´ı tenemos las herramientas esenciales para resolver el problema tomogr´afico, en lo que al modelo directo respecta.

Una observaci´on final que vale la pena mencionar es la justificaci´on de por qu´e desarrollar modelos frequency-domain en vez de time-domain , siendo que, como hemos visto, los ´ultimos tienen mayor informaci´on disponible. Desde el punto de vista de las t´ecnicas de reconstruc-ci´on, los sistemas time domain requieren la resoluci´on de m´ultiples problemas lineales, con una alta complejidad computacional. Considerando una discretizaci´on temporal dempuntos, la complejidad es la de resolver m problemas como los que resolvemos en frequency-domain lo que, por el momento, resulta poco pr´actico.

(58)
(59)

Cap´ıtulo 3

(60)

3.1.

Resumen

(61)

3.2.

Problemas inversos determin´ısiticos

En esta secci´on, trataremos problemas inversos desde el punto de vista determin´ıstico y finito-dimensional. Denotaremos a la cantidad de inter´es como f = (f1,· · · , fm) ∈ Rm y al

vector de datos por g = (g1,· · · , gn)∈Rn.

Supondremos que f y g est´an relacionados mediante una aplicaci´on conocida K :Rm

Rn

de manera que

g =K(f) (3.1)

Si el modelo es lineal, podemos escribirlo de la siguiente manera

g =Kf (3.2)

donde K ∈ Rn×m. La utilidad del operador (o modelo) K, es la de indicar la observaci´on g dada la cantidad (posiblemente no observable) f. En general, el problema directo est´a bien propuesto en el sentido que la soluci´ong existe, es ´unica, y peque˜nas perturbaciones enf no generan grandes perturbaciones eng. Supondremos que nuestro modeloK es bien propuesto. El correspondiente problema inverso para las ecuaciones 3.2 y 3.1 es, dado un conjunto de datos g, determinar f tal que las identidades mencionadas se verifican. Los problemas inver-sos como 3.2 no son mal propuestos en s´ı mismos 1. Sin embargo, cuando el problema lineal proviene de una discretizaci´on de un problema continuo, los errores de discretizaci´on pueden que el problema sea sensible a los errores presentes en los datos. Esto se ver´a en la secci´on5

(62)

K

X Y

? f

g

Figura 3.1: Esquema de un problema directo y uno inverso. En el problema directo, dado un elementof ∈X se obtiene un

elementog∈Y mediante el operadorK, pero un problema inverso requiere obtener, dadog∈Y un elementof∈X. Observar

que no est´a definido un operador, por ahora.

Nuestro problema de inter´es es no-lineal, sin embargo, cuando tal no-linealidad no es muy intensa, trataremos el problema como uno localmente lineal, dado que m´etodos del tipo Newton se basan en linealizaciones del operador K.

3.2.1.

Descomposici´

on en valores singulares

El rango (o espacio columna) de una matrizK :Rm

Rn se define como:

R(K) ={g ∈Rn|g =Kfpara alg´unf

Rm} (3.3)

y el n´ucleo se define como:

N(K) = {f ∈Rm|Kf = 0} (3.4) entonces, Rm =N(K)L

N(K)⊥ y Rn =R(K)L

R(K)⊥ donde ⊥ denota el complemento ortogonal[103].

(63)

define como

K =U SVT (3.5)

donde

S =

"

Σr 0 0 0

#

(3.6) con Σr=Diag(σ1,· · · , σr), σ1 ≥σ2 ≥ · · · ≥σryr= m´ın(n, m). Las columnasui ∈Rm,vi ∈

Rn de las matrices U = (u1,· · ·, un)∈ Rm×m y V = (v1,· · · , vn)∈ Rn×n son ortonormales. Desde un punto de vista geom´etrico, una tal transformaci´on lineal realiza una transformaci´on ortogonal en el espacio de salida, realiza expansiones y compresiones (y la correspondiente extensi´on al espacio de llegada) y otra transformaci´on ortogonal en el espacio de llegada. Adem´as, los cuatro subespacios fundamentales de la matriz K quedan determinados por tales matrices, a saber2

R(KT) = gen{v

1,· · · , vr}

N(K) =gen{vr+1,· · · , vn}

R(K) = gen{u1,· · · , ur}

N(KT) =gen{u

r+1,· · ·, um}

notese, adem´as, que R(KT) = N(K)y R(NT) = R(K)T El n´umero de condici´on de la matriz K puede definirse como

cond(K) = ||K||||K ||= σ1

σr

(3.7)

donde K es la matriz pseudo-inversa3 de K. Es posible clasificar la naturaleza de la mala

condici´on de K:

El problema es de rango deficiente si r < min(m, n) 2gen(x

1,· · · , xn) =z∈Rk :z=Pni=1aixi paraa1,· · · , an ∈R 3La matriz pseudo inversa puede definirse simplemente comoK=P

i|σi>0

1

σiviu

T

i donde los vectoresvi

(64)

SiN(K) = {0}peroKtiene algunos valores cercanos a cero, por ejemplo,{σk+1,· · · , σr} con un salto claro entre estos y los primeros {σ1,· · · , σk} en el espectro. En este caso, la matriz K contiene r−k vectores casi linealmente dependientes y el problema es de rango deficiente num´erico.

Un problema inverso discreto se caracteriza por tener un espectro que decae a cero sin un salto notable. Al no haber un salto claro, la noci´on de rango deficiente num´erico es difusa.

Estas situaciones se caracterizan por tener n´umeros de condici´on elevados.

3.2.2.

Cuadrados m´ınimos en problemas lineales

En general, tendremos que g /∈ Im(K), de manera que Kf − g 6= 0. Intentaremos, entonces, encontrar una soluci´on que est´e lo m´as cerca posible deg. El m´etodo de cuadrados m´ınimos es una de las t´ecnicas usuales y directas.

Aqu´ı, el objetivo es encontrar una estimaci´on al problema4

fLS = argm´ın f∈X

ζ(f) (3.8)

donde ζ(f) = ||g−Kf||2 y ||.||=||.|| 2.

El vector que se encuentra a m´ınima distancia se obtiene resolviendo el sistema de ecuaciones normales

KT(Kf −g) = 0 (3.9)

y cuando el problema es no lineal, derivando respecto a f se obtiene:

L(f) = ||K(f)−g||2 (3.10)

= K(f)TK(f)−2K(f)Tg+gTg (3.11)

∂L

∂f = 2J

TJ f 2JTg = 0 (3.12)

JTJ f = JTg (3.13)

4argm´ın

c∈X(g) corresponde al argumento que miniza la expresi´on g, recorriendo el espacio de posibles

Referencias

Documento similar

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

El nuevo Decreto reforzaba el poder militar al asumir el Comandante General del Reino Tserclaes de Tilly todos los poderes –militar, político, económico y gubernativo–; ampliaba

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

Por PEDRO A. EUROPEIZACIÓN DEL DERECHO PRIVADO. Re- laciones entre el Derecho privado y el ordenamiento comunitario. Ca- racterización del Derecho privado comunitario. A) Mecanismos

La estructura de esta Tesis es la siguiente: en el Capítulo 1 se realiza una introducción con ejemplos de aplicaciones de los contornos activos y el estado de la técnica con las

En primer lugar, sería interesante obtener las matrices del sistema para e ≥ 3, así como extender los modelos a funciones de forma distintas a las consideradas en este trabajo..

La idea básica propuesta en este trabajo es la integración de correspondencias geométricas mediante dos métodos diferentes: el método de resultante global y el método de