Tomograf´ıa ´
Optica
Por
Guido Rodrigo Baez
Trabajo de Tesis para optar al T´ıtulo de Doctor en Matem´atica Computacional e Industrial
Directores: Guillermo Elicabe
Juan Pomarico
Centro de Investigaciones en F´ısica e Ingenier´ıa del Centro de la Provincia de Buenos Aires (UNCPBA - CONICET - CICPBA)
Facultad de Ciencias Exactas
Universidad Nacional del Centro de la Prov. de Bs. As.
Agradecimientos
Quiero agradecer a las personas que me acompa˜naron estos a˜nos de trabajo doctoral. Primero que todo, quiero agradecer a mi familia, Brenda, mi madre Marta, Jos´e y Mariano, siempre dispuestos a acompa˜narme en todo momento. Luego quiero agradecer a mis direc-tores, Dr. Juan Pomarico y Dr. Guillermo Elicabe, por guiarme en el inicio de este camino que es el camino de la investigaci´on cient´ıfica. Su gu´ıa y amistad resultaron ser herramientas fundamentales, adem´as de su experticia y predisposici´on ante eventuales problemas. Tam-bi´en quiero agradecer a todo el grupo de ´Optica Biom´edica del Centro de Investigaciones en F´ısica e Ingenier´ıa del Centro de la Provincia de Buenos Aires por su buena predisposici´on y alegr´ıa diaria. Finalmente, aprovecho para agradecer a la Facultad de Ciencias Exactas de la Universidad Nacional del Centro de la Provincia de Buenos Aires.
´
Indice general
Agradecimientos 3
´Indice de figuras 15
´Indice de tablas 16
Resumen 18
Abstract 21
Introducci´on 24
1. Sobre las modalidades de la Tomograf´ıa ´Optica 29
1.1. Resumen . . . 30
1.2. Sistemas Frequency-domain . . . 31
1.3. Sistemas Time-domain . . . 33
1.3.1. Instrumentaci´on para experimentaci´on en el dominio del tiempo . . . 37
2. Sobre el Problema Directo 43 2.1. Resumen . . . 44
2.2. Introducci´on . . . 45
2.3. Ecuaci´on de Transferencia Radiativa . . . 47
3. Sobre el Problema Inverso 59
3.1. Resumen . . . 60
3.2. Problemas inversos determin´ısiticos . . . 61
3.2.1. Descomposici´on en valores singulares . . . 62
3.2.2. Cuadrados m´ınimos en problemas lineales . . . 64
3.2.3. Regularizaci´on de Tikhonov: caso lineal . . . 65
3.2.4. El caso no-lineal. . . 68
3.2.5. Regularizaci´on de Tikhonov no-lineal . . . 68
3.3. Problemas Inversos Estad´ısticos . . . 69
3.3.1. Otros modelos expl´ıcitos de verosimilitud . . . 74
3.3.2. Construcci´on de distribuciones a priori . . . 76
3.3.3. Campos Aleatorios de Markov . . . 77
3.3.4. Informaci´on a posteriori . . . 79
3.4. Cadenas de Markov de Monte Carlo . . . 84
3.4.1. Construcci´on del Kernel mediante el algoritmo de Metropolis-Hastings 87 3.4.2. Implementaci´on de la t´ecnica de Metropolis-Hastings . . . 90
3.4.3. Metropolis-Hastings de n´ucleo adaptativo. . . 97
3.4.4. Criterio de convergencia . . . 98
3.5. Filtro de Kalman Extendido . . . 100
3.5.1. Problemas inversos no estacionarios . . . 100
3.5.2. Modelos de Observaci´on y Evoluci´on . . . 100
3.5.3. Filtro de Kalman . . . 104
3.5.4. Filtro de Kalman Extendido . . . 112
3.5.5. Error de modelo. . . 115
4. Adquisici´on y procesamiento de datos 124 4.1. Resumen . . . 125
4.2. Adquisici´on de datos . . . 126
4.3. Calibraci´on . . . 128
4.4. Estimaci´on de las propiedades para un medio homog´eneo . . . 134
4.5.1. Simulaciones computacionales . . . 143
4.5.2. Experimento sobre fantoma . . . 147
5. Resultados 153
Conclusiones y Trabajos futuros 164
´
Indice de figuras
1.1. Esquema representativo de un sistema CCD. Una fuente (Laser) inyecta luz
en un medio mediante una fibra ´optica (F.O). Una c´amara de CCD colecta la
luz emergente desde la cara opuesta. . . 32
1.2. Esquema representativo de los datos que se colectan en un sistema FD. Una
fuente de amplitudA0 modulada a la frecuenciaω se inyecta dentro del medio
turbio. En la salida, se compara la se˜nal de salida (con amplitud A1) con la
de entrada not´andose cambios en la amplitud y en la fase. . . 32
1.3. Esquema representativo de un sistema FD. Los generadores de radiofrecuencias
se utilizan para comparar los datos con la referencia. Las siglas indican lo
siguiente: amp, amplificador. Mixer: mezclador. DC source: fuente DC. LPF:
filtro pasa-bajos. PC: computadora. PMT: fotomultiplicador. . . 34
1.4. Esquema experimental de un sistema TCSPC. Se emite radiaci´on por un
per´ıodo de tiempo muy corto que sale desde el l´aser y viaja a trav´es de la
fibra ´optica (FO). Atraviesa el medio turbio y es colectada por otra fibra que
lleva la luz observada hacia un fotomultiplicador (PMT), que lo lleva hacia el
1.5. Izquierda: variaciones de tres pulsos te´oricos cuando el valor deµaes 0,02,0,01
y 0,005mm−1. El valor de µ0s es 2mm−1. Se puede ver que la pendiente de la curva logar´ıtimica es m´as pronunciada cuando mayor es el valor deµa, esto se debe a que a mayor absorci´on, mayor probabilidad de p´erdida de fotones lentos (los que tienen que recorrer caminos m´as largos para llegar al detector), lo que
se traduce en menos luz en el detector. Derecha: variaciones de tres pulsos
te´oricos cuando el valor deµ0s es 3,2 y 1mm−1. El valor deµ
aes 0,01mm−1.Se
puede observar que cuandoµ0sdecrece, el flanco ascendente tiene una pendiente m´as pronunciada. Esto se debe que, al haber menos eventos de scattering, los
fotones llegan m´as r´apidamente al detector. La geometr´ıa utilizada es un slab
de 35mm de espesor. . . 35
2.1. Diagrama del problema directo. Dado el operadorH :P → F que devuelve la fluencia a partir del conjunto de par´ametros, y el operadorP :F → M, que a
partir de la fluencia devuelve la medida que se realiza en el borde. El modelo
directo es la funci´onF :P → M que, a partir de un conjunto de par´ametros devuelve una medida en el contorno del medio que se desea estudiar.. . . 46
2.2. Ejemplo de una malla bidimensional con elementos triangulares. La
circunfe-rencia es de radio 30 mm . . . 55
2.3. Distribuci´on de detectores correspondiente a la malla de la figura 2.2. La fuente
est´a ligeramente dentro del medio para que la fuente sea is´otropa. . . 55
2.4. Logaritmo de la soluci´on de la ecuaci´on diferencial correspondiente a la fuente
de la figura 2.3. Para calcular los datos de la figura 2.5 se debe aplicar el
operador de medida que proyecta en los detectores. . . 56
2.5. De izquierda a derecha: log amplitud y fase medida en los detectores de la
figura 2.3 . . . 56
2.6. Ejemplo de la photon measurement density function obtenida entre la fuente
3.1. Esquema de un problema directo y uno inverso. En el problema directo, dado
un elemento f ∈ X se obtiene un elemento g ∈ Y mediante el operador K, pero un problema inverso requiere obtener, dado g ∈ Y un elemento f ∈ X. Observar que no est´a definido un operador, por ahora.. . . 62
3.2. Muestras aleatorias de una funci´on que tiene saltos de discontinuidad de
po-sici´on desconocida. En los gr´aficos de arriba es posible ver claramente saltos de gran magnitud, mientras que en los gr´aficos inferiores los saltos son m´as
peque˜nos. . . 78
3.3. Ejemplo de distribuci´on propuesta. En el ejemplo a) tenemos una distribuci´on Gaussiana con distintas matrices de covarianza y distintos centros. En a) la
distribuci´on propuesta es sim´etrica y amplia. En b) c) y d) la distribuci´on
pro-puesta tiene orientaci´on. En c) puede verse que la orientaci´on puede repercutir
en la tasa de aceptaci´on. en d) se puede ver que casi cualquier candidato es
bueno. . . 91
3.4. Distribuci´on objetivo de nuestro ejemplo la funci´on es la de la ecuaci´on 3.126 95
3.5. Muestras obtenidas a partir del m´etodo de MH para distintos valores de δ. a)
δ= 0,05,γ = 0,01. b)δ= 5,γ = 0,89. c)δ = 1,γ = 0,16. d)δ= 0,5,γ = 0,32. Puede observarse que la distribuci´on es mejor cubierta en d). La cantidad de
muestras es, en todos los casos N = 5000 . . . 95
3.6. Ejemplo de burn-in. Observar que hasta alrededor de la muestra 500, la cadena
oscila enormemente, dando informaci´on que no corresponde a la distribuci´on
objetivo. . . 96
3.7. Cadenas de la variablex utilizadas para construir la distribuci´on objetivo con la misma configuraci´on utilizada en la figura 3.5. a) se observa alta correlaci´on
debido a una lenta convergencia. b) Se observa que se acepta lentamente,
debido a un δ muy grande. c) y d) cadenas aceptables. . . 96
3.8. Esquema operativo del proceso de filtrado bayesiano. . . 115
3.9. Muestra aleatoria con las posiciones que toman valores aleatorios (marcados
con una cruz). Con el conocimiento obtenido se forma la muestra con el
4.1. Diagrama de flujo del programa de medici´on desarrollado en LabViewr. . . 127
4.2. Esquema del sistema de fijaci´on de las fibras al sistema de traslaci´on. Hay un
sistema para la fuente como para el detector. . . 128
4.3. Logaritmo de los valores singulares ordenados de mayor a menor. El n´umero de condici´on es κ(A) = 35740 . . . 131
4.4. Muestras aleatorias de nuestra distribuci´on a priori para obtener soluciones suaves. . . 132
4.5. Resultado del proceso de calibraci´on. Los datos sin calibrar son aquellos que
no pertenecen al modelo que estamos utilizando (como un experimento de
laboratorio, por ejemplo). Los datos de referencia se construyen utilizando el
modelo de DA definido antes con las propiedades ´opticas definidas. . . 134
4.6. Logaritmo de la Funci´on instrumento. El tiempo de exposici´on es de cinco
segundos. El hombro hacia la derecha se debe a la forma del pulso l´aser.. . . 135
4.7. Fantoma utilizado en el experimento de laboratorio (arriba) y su
representa-ci´on computacional (abajo). . . 136
4.8. Ejemplo de una medida temporal. . . 136
4.9. Funci´on deconvolucionada mediante el MAP de la distribuci´on a posteriori 4.14.137
4.10. Distribuci´on a posteriori de los par´ametros µa vs µ0s. La media condicional es
ˆ
µa= 0,0115 y ˆµ0s = 2,67. El per´ıodo de burn-in fue de 35000 muestras. . . 138
4.11. Histogramas marginales de los par´ametrosµa, µ0s, construidos con las muestras
que se utilizaron en la figura 4.10 . . . 138
4.12. Esquema de simulaci´on computacional: a) Dominio con los valores a recuperar
y b) Configuraci´on de fuentes y detectores. Las dimensiones se encuentran en
mm. . . 144
4.13. Ejemplo creado a partir de una distribuci´ona priori gaussiana suavizada para el par´ametro de absorci´onµa . . . 145
4.14. Esquema de generaci´on de muestras aleatorias. Se generan muestras en una
malla regular x(r), de all´ı a la malla original xo la cual, finalmente, se env´ıa a la malla reducida xi mediante la aplicaci´on P . . . 147
4.15. Soporte de la distribuci´on objetivo recuperada para la recuperaci´on de las
4.16. Soporte de la distribuci´on objetivo recuperada para la recuperaci´on de las
propiedades ´opticas del fantoma del que se extrajo la inclusi´on 2. . . 148
4.17. Histogramas marginales a posteriori correspondientes a las propiedades ´opticas
del fantoma del que se extrajo la inclusi´on 1. . . 148
4.18. Histogramas marginales a posteriori correspondientes a las propiedades ´opticas
del fantoma del que se extrajo la inclusi´on 2. . . 149
4.19. Esquema de la configuraci´on experimental mostrando el paralelep´ıpedo
hos-pedador y las ´areas exploradas por el sistema de fuentes y detectores. El haz l´aser fue escaneado en las posiciones marcadas con “X”y la fibra ´optica de
colecci´on escanea las posiciones indicadas con “O”. La luz colectada es guiada
hasta el fotomultiplicador (PMT) el cual se encuentra conectado al sistema
TCSPC. No se muestran las inclusiones para tener mayor claridad.. . . 150
4.20. Geometr´ıa del subdominio del fantoma mostrando la ubicaci´on de las dos
incluciones. El subdominio tiene dimensiones 45mm×45mm×33mm. . . . 150
4.21. Vista en perspectiva de la geometr´ıa del subdominio del fantoma mostrando
la ubicaci´on de las dos incluciones. . . 151
5.1. Reconstrucciones de las simulaciones 2D con distintos valores de covarianza en
el dominio de reconstrucciones. Las matrices de covarianza son las de la imagen
5.2 y en el mismo orden. Los valores de la funci´on de m´erito son: e(x) = a) 0,2647, b) 0,1615, c) 0,1289, d) 0,1305, e) 0,1267, f) 0,1293, g) 0,1283 y h) 0,1283, respectivamente. . . 155
5.2. Reconstrucciones con distintos valores de covarianza. Las matrices de
cova-rianzas iniciales son P0 =diag(α) con α= b) 101, c) 100 ,d) 10−1, e) 10−2, f)
5.3. Recuperaci´on n´umero 2. Arriba: Reconstrucci´on de un tubo que atraviesa el
medio con propiedades ´opticas de la mitad del fondo (µainc =
1
2µa0). Izquierda:
original. Derecha: reconstrucci´on. Abajo: gr´afico 1D de las reconstrucciones.
El valor de la funci´on de m´erito es e = 0,1319. El nivel de ruido de los datos es del 1 %. Notar que los artifacts cerca de las fuentes y los detectores son
producto del ruido de las mediciones. Efectivamente, siguen las trayectorias
de las bananas que comunican una determinada fuente con un determinado
detector. . . 157
5.4. Recuperaci´on n´umero 3. Arriba: Reconstrucci´on de un medio que tiene dos
niveles de fondo. En el lado izquierdo el valor del fondo es 0,02 y en el derecho 0,01. Cada secci´on posee una peque˜na inclusi´on ligeramente menos absorbente que el fondo.). Izquierda: original. Derecha: reconstrucci´on. Abajo: gr´afico 1D
de las reconstrucciones. El valor de la funci´on de m´erito ese= 0,1395. El nivel de ruido de los datos es del 1 %. . . 157
5.5. Recuperaci´on n´umero 4. Arriba: Reconstrucci´on de un medio que tiene dos
niveles de fondo. Cada secci´on posee una peque˜na inclusi´on y, adem´as, en
la secci´on derecha se agrega una inclusi´on de mayor tama˜no. Las propiedades
´
opticas son las mismas que las del gr´afico 5.4, pero la inclusi´on que se encuentra
ubicada arriba a la derecha es m´as absorbente que el fondo). Izquierda: original.
Derecha: reconstrucci´on. Abajo: gr´afico 1D de las reconstrucciones. El valor
de la funci´on de m´erito ese = 0,1434. El nivel de ruido de los datos es del 1 %.158
5.6. Reconstrucci´on de datos simulados: comparaci´on de reconstrucciones del par´
ame-tro µa con el m´etodo EKF (columna de la izquierda) vs reconstrucciones reali-zadas con el paquete NIRFAST (columna derecha para tres niveles diferentes
de ruido aditivo y gaussiano. De arriba a abajo, 0,5 %, 1 % and 2 %. No se utilizaron filtros entre las interaciones en ning´un caso. . . 158
5.8. Izquierda: reconstrucci´on sin el enfoque de Error de Modelo utilizando una
ma-lla gruesa con 341 nodos y 618 elementos triangulares. Derecha: reconstrucci´on
con el enfoque de Error de Modelo utilizando la misma malla. El tiempo medio
de iteraci´on es de 0.43 segundos. El nivel de ruido establecido es de 3 %. . . . 161
5.9. Reconstrucci´on de los coeficientes de absorci´on relativos a partir de los datos
experimentales obtenidos del fantoma. De izquierda a derecha y de arriba a
abajo, los cortes del dominio reconstruido en el plano XY. El plano Z = 0 corresponde al corte donde el l´aser entra al medio. La separaci´on entre cortes
consecutivos es ∆z = (33/24)mm≈1,3mm. . . 162
5.10. Reconstrucci´on de los coeficientes de scattering reducido relativo a partir de
datos experimentales obtenidos del fantoma. Sigue el mismo orden que la figura
5.9 . . . 162
´
Indice de tablas
5.1. Bondad de la reconstrucci´on con EKF y NIRFAST . . . 160
5.2. Comparaci´on del n´umero de iteraciones y tiempo de CPU para las
Resumen
La Tomograf´ıa ´Optica es una t´ecnica de diagn´ostico por im´agenes no invasiva que se mantiene en constante desarrollo. Esto se debe, principalmente, a que utiliza radiaci´on no ionizante, lo que permitir´ıa un uso peri´odico sin consecuencias ulteriores, y a la portabilidad y costos reducidos que exhibe cuando se la compara con otras modalidades, como son la Tomograf´ıa Computada y la Resonancia Magn´etica. Como contraparte de estas ventajas, el problema de reconstrucci´on tomogr´afica en Tomograf´ıa ´Optica es no lineal y mal propuesto, lo que indica que los modelos lineales son ´utiles hasta cierto punto, y peque˜nos errores en los datos medidos pueden generar grandes errores en la reconstrucci´on, respectivamente. Se han desarrollado m´ultiples aproximaciones basadas, principalmente, en modelos lineales, pero pocas aproximaciones no lineales que, adem´as, permitan incorporar en sus enfoques la naturaleza del ruido de medici´on.
Abstract
Diffuse Optical Tomography is a non invasive imaging technique that keeps a constant development. This is due to, mainly, the use of non ionizing radiation allowing a periodic use without further consequences, and the portability and reduced costs that shows when compa-red to Computed Tomography or Magnetic Resonance Imaging. However, the reconstruction problem is non linear and ill-posed, meaning that linear models have limited use, and slight errors in the data can lead to high errors in the reconstruction. Many approaches have been considered, especially for linear models, and not so many for non linear approaches that may consider the nature of the measurement noise.
Introducci´
on
El estudio de la propagaci´on de la luz en tejidos biol´ogicos es un tema de creciente inter´es en el campo de la f´ısica m´edica. Desde los comienzos de la teor´ıa de la transferencia radiativa [1],[2] y a partir de los primeros an´alisis mamogr´aficos y funcionales que utilizaron radiaci´on lum´ınica[3],[4], los intentos por determinar las propiedades ´opticas de los tejidos se han ido multiplicando.
Existe, actualmente, una gran variedad de m´etodos orientados al estudio de tejidos vivos. Entre ellos, el monitoreo por rayos X, el monitoreo por ultrasonido, la tomograf´ıa computada, la resonancia magn´etica, etc. Estas t´ecnicas cuentan con un alto grado de resoluci´on espacial y proveen informaci´on precisa de las estucturas internas que se analizan, aunque, en general, no son capaces de caracterizar los tejidos estudiados. Sin embargo cuando en una mamograf´ıa se detectan objetos extra˜nos, los m´etodos anteriores no permiten distinguir entre un quiste, un tumor, una bola de grasa, etc. As´ı, muchas veces es necesario realizar una intervenci´on quir´urgica (biopsia) para decidir sobre la malignidad del objeto detectado. Esto cuesta dinero y tiempo de recuperaci´on para el paciente, adem´as de consecuencias psicol´ogicas debido al stress producto de esta incertidumbre. Por otra parte, t´ecnicas que utilizan radiaci´on ionizante pueden alterar la materia viva al interactuar con ella y provocar, eventualmente, malformaciones (tumores); la resonancia magn´etica requiere del uso de superconductores, que son muy costosos de fabricar y mantener. Por ´ultimo, el equipamiento necesario para la aplicaci´on de varios de estos m´etodos de monitoreo y detecci´on suele ser de gran tama˜no y dif´ıcil de trasladar.
base a estas consideraciones, el uso de la radiaci´on visible se presenta como una de las al-ternativas m´as prometedoras. Su aplicaci´on al estudio de los tejidos vivos es posible cuando se trabaja en longitudes de onda del infrarrojo cercano (NIR). En esta regi´on del espectro electromagn´etico, denominada ventana terap´eutica[5], los tejidos vivos presentan una baja absorci´on relativa.
En los ´ultimos 40 a˜nos, el desarrollo de nuevas tecnolog´ıas ha impulsado el empleo de t´ecnicas ´opticas en medicina. En particular, la aparici´on del l´aser ha generado un notable aumento de las aplicaciones cl´ınicas de t´ecnicas ´opticas. Entre las diversas posibilidades que ofrece el uso de radiaci´on visible se encuentran la tomograf´ıa ´optica, la topograf´ıa ´optica, la tomograf´ıa ´optica de fluorescencia, la bioluminiscencia y el monitoreo funcional, entre otras. Este ´ultimo, en particular, permite medir el nivel de oxigenaci´on en sangre de distintos ´
organos y analizar la actividad metab´olica local.
Desde el punto de vista de la propagaci´on de la luz, los tejidos se comportan como medios turbios que hacen que la radiaci´on en el NIR se vuelva r´apidamente difusa en su interior. La difusi´on dificulta, en gran medida, la identificaci´on de estructuras internas debido a la p´erdida de resoluci´on espacial. En parte esto se debe a que la ecuaci´on de difusi´on, herramienta principal de este enfoque, es una ecuaci´on que trabaja con promedios y, por lo tanto, el detalle a peque˜na escala no puede obtenerse ´unicamente a partir de ella. En este proceso es necesario, adem´as, tener en cuenta los efectos de: la longitud de onda de la radiaci´on incidente, los componentes e interfases presentes en el medio (y en la superficie, si correspondiere), la geometr´ıa, etc, y su efecto sobre las mediciones.
en su naturaleza integro-diferencial cuya soluci´on requiere un poder de c´omputo muy grande, lo que no la hace pr´actico para tomograf´ıa.
La formulaci´on del problema tomogr´afico involucra t´ecnicas matem´aticas de complejidad creciente. Mayormente, se plantean problemas del tipo regularizaci´on de Tikhonov, tanto lineales como no-lineales. Estos ´ultimos utilizan t´ecnicas de tipo Levenberg-Marquardt y Gauss-Newton. Estos son enfoques determin´ısticos, donde se busca una soluci´on puntual al problema. Sin embargo, en general, se puede tener a disposici´on informaci´on adicional que pueda ayudarnos a obtener soluciones con las propiedades deseadas. Dicho de esta manera, la informaci´on previa puede funcionar como sesgo (como cuando tenemos informaci´on previa estructural, como una imagen obtenida por otra modalidad). Adem´as, cuando la informaci´on adicional es agregada en forma de propiedades de las soluciones estamos priorizando aquellas con las caracter´ısticas de la informaci´on disponible. Esto requiere de la habilidad de mode-lar tal informaci´on de manera que las t´ecnicas determin´ısticas permitan incorporarla lo cual es, mayormente, complejo. Aqu´ı es donde t´ecnicas no determin´ısticas, como las estoc´asticas, entran en acci´on pues disponen de otro tipo de herramientas para evaluar esta informaci´on. La herramienta principal que utiliza esta rama de las matem´aticas, llamada Problemas In-versos Estoc´asticos y Computacionales, es el teorema de Bayes, que actualiza el estado de la informaci´on mediante este resultado.
Cap´ıtulo 1
Sobre las modalidades de la
1.1.
Resumen
1.2.
Sistemas Frequency-domain
Los sistemas de im´agenes en el dominio de la frecuencia para DOT utilizan luz de intensi-dad modulada a altas frecuencias (unos pocos cientos de megahertz). Esto permite medir la amplitud y el cambio de fase de la se˜nal incidente relativa a la se˜nal original, lo cual provee la base para la tomograf´ıa en el dominio de la frecuencia. Fishkin [6] y Patterson [7] presentaron parte del trabajo inicial sobre el cual se desarrolla esta tecnolog´ıa. Con el uso de este enfo-que, junto con un modelo de propagaci´on de luz difusa [8], es posible reconstruir im´agenes de absorci´on y scattering en tejidos in vivo. Adem´as, repitiendo esto en m´ultiples longitu-des de onda, es posible la recuperaci´on de secuencias funcionales1, dado que los absorbentes
principales (llamados crom´oforos) en los tejidos son la hemoglobina(Hb) y deoxyhemoglobi-na(HbO). Jobsis [2] mostr´o, en 1977, que utilizando dos longitudes de onda apropiadas, es posible monitorear las concentraciones de Hb y HbO. Siguiendo esta l´ınea, varios investiga-dores comenzaron a utilizar enfoques multiwavelength (m´ultiples longitudes de onda) para recuperar las propiedades ´opticas de los crom´oforos primarios tales como HbO, Hb, agua y l´ıpidos y lo utilizaron para monitorear cambios en la fisiolog´ıa de la mama [9],[10] [11], el cerebro [12],[13], y otros [14]. Como ya se mencion´o anteriormente, las t´ecnicas de medici´on empleadas en im´agenes de ´optica difusa pueden organizarse en tres categor´ıas, Onda con-tinua (CW, por sus siglas en ingl´es Continous-wave) que involucra medidas independientes del tiempo, Frecuency-domain, en el dominio de la frecuencia, y Time-domain, en el dominio del tiempo. Desde un punto de vista experimental, los sistemas CW son los m´as sencillos de implementar dado que no necesitan respuestas de corto tiempo. Esto reduce los costos de equipamiento y permite obtener grandes cantidades de datos a partir de c´amaras basadas en charged coupled devices (CCD). En la figura1.1 se ve un diagrama del funcionamiento de un sistema CW donde se puede observar una fuente en contacto con la superficie del medio de an´alisis y, en el extremo opuesto del medio, m´ultiples detectores (en una c´amara) colectan la luz transmitida hasta la respectiva posici´on. La fuente puede ser, por ejemplo un laser de diodos.
Laser
F.O.
Medio Turbio
Cámara
CCD
Figura 1.1: Esquema representativo de un sistema CCD. Una fuente (Laser) inyecta luz en un medio mediante una fibra ´
optica (F.O). Una c´amara de CCD colecta la luz emergente desde la cara opuesta.
La desventaja que posee esta t´ecnica es que si bien puede localizar objetos dentro de un determinado medio [15], no permite caracterizarlos en t´erminos de sus propiedades ´opticas [16]. Para ello, los sitemas Time-domain y Frequency-domain mejoran dram´aticamente la capacidad del sistema, pero con mayor costo. El principio b´asico de un sistema Frequency-domain se puede ver en la figura 1.2.
Medio Turbio
w
Modw
ModCorrimiento de fase
A
0A
0A
1Figura 1.2:Esquema representativo de los datos que se colectan en un sistema FD. Una fuente de amplitudA0 modulada a
la frecuencia ω se inyecta dentro del medio turbio. En la salida, se compara la se˜nal de salida (con amplitudA1) con la de
entrada not´andose cambios en la amplitud y en la fase.
medida que la onda sinusoidal se propaga a trav´es del medio, el camino extendido, debido a la presencia de part´ıculas que difunden la luz, retrasa la fase de la se˜nal modulada. Tras salir del tejido, la onda sinusoidal es atenuada y tiene la fase modificada comparada con la se˜nal incidente. Los cambios medibles en la amplitud y fase contienen informaci´on respecto a las propiedades de absorci´on y de desparramamiento (scattering) del volumen irradiado y, cuando los datos medidos est´an apropiadamente calibrados, es posible recuperar los valores de esas propiedades ´opticas.
Un ejemplo de un sistema Frequency-domain operando en heterodyning2 se puede
obser-var en la figura1.3. Aqu´ı, dos generadores RF (radio frecuencia) se utilizan, uno funcionando a 100 MHz y el otro trabajando a 100,001 MHz. El ejemplo de la figura 1.3 es una versi´on simplificada de un modelo real. En la pr´actica, un arreglo de fuentes en diferentes longitu-des de onda pueden utilizarse secuencialmente y los detectores se pueden paralelizar para incrementar la velocidad de adquisici´on de datos. Tambi´en es posible incorporar iluminaci´on paralela expandiendo el arreglo de moduladores RF e introduciendo diferentes offsets de fase o frecuencias de modulaci´on para cada canal de l´aseres. Estas t´ecnicas fueron utilizadas en [17], [18], [19].
1.3.
Sistemas Time-domain
El otro sistema posible de colecci´on de datos es el dado por los sistemas Time-domain. Cuando un pulso de luz (que llamaremos pulso, de ahora en adelante) entra en el medio difusivo, sufre una serie de cambios debido a las propiedades ´opticas del mismo. Por supuesto, estos fen´omenos son los mismos que ocurren en cualquiera de las modalidades, sin embargo, la diferencia est´a en la manera de verlos, es decir, la informaci´on que colectan los detectores es distinta. En particular, el pulso se ensancha y se retrasa y, midiendo esto, podemos obtener informaci´on sobre lo que ocurre dentro del medio, respecto a sus propiedades ´opticas. ´Esta es la idea principal respecto a las t´ecnicas Time-domain, que son, en cierto sentido, an´alogas a los sistemas de domain. Precisamente, los datos obtenidos en los sistemas
Frequency-2Heterodyning requiere dos generadores de se˜nales operando a frecuenciasf
RF Gen. RF Gen.
Mixer
Mixer
Ref. Data
Amp.
L.P.F. PMT Medium
PC Laser DC Source
Figura 1.3: Esquema representativo de un sistema FD. Los generadores de radiofrecuencias se utilizan para comparar los datos con la referencia. Las siglas indican lo siguiente: amp, amplificador. Mixer: mezclador. DC source: fuente DC. LPF: filtro pasa-bajos. PC: computadora. PMT: fotomultiplicador.
domain son la transformada de Fourier de los datos en Time-domain en una determinada longitud de onda (m´as adelante mostraremos esto precisamente). De esta manera, los datos obtenidos mediante t´ecnicas de Time-domain, contienen informaci´on de todas las longitudes de onda de modulaci´on. Adem´as, contienen informaci´on de los momentos de la distribuci´on de tiempos3 y pueden detectar informaci´on acerca de posibles errores de medici´on tales como
poco contacto y posibles reflexiones.
Cuando un pulso de luz (de picosegundos de duraci´on) se transmite a trav´es de un medio altamente difusivo como un tejido biol´ogico, la distribuci´on temporal de fotones es conocida como temporal point spread function (TPSF). Un esquema se puede observar en la figura
1.4. La forma de esta distribuci´on contiene informaci´on sobre las propiedades ´opticas de los tejidos [20], como puede verse en la figura 1.5.
Láser
FO
PMT
PMT
FO
FO
0200400 01234567810-5 020001234567810-5Medioturbio
40060080010001200 60080010001200TCSPC
Figura 1.4: Esquema experimental de un sistema TCSPC. Se emite radiaci´on por un per´ıodo de tiempo muy corto que sale desde el l´aser y viaja a trav´es de la fibra ´optica (FO). Atraviesa el medio turbio y es colectada por otra fibra que lleva la luz
observada hacia un fotomultiplicador (PMT), que lo lleva hacia el sistema TCSPC, que permite su obtenci´on y visualizaci´on
para su an´alisis.
0 5 10 15
Tiempo (ns) -60 -50 -40 -30 -20 -10 0
Logaritmo de la transmitancia
Variaciones respecto a a
a = 0.02
a = 0.01
a = 0.005
0 5 10 15
Tiempo (ns) -60 -50 -40 -30 -20 -10 0
Variaciones respecto a s
s = 3
s = 2
s = 1
Figura 1.5:Izquierda: variaciones de tres pulsos te´oricos cuando el valor deµa es0,02,0,01y0,005mm−1. El valor deµ0s es
2mm−1. Se puede ver que la pendiente de la curva logar´ıtimica es m´as pronunciada cuando mayor es el valor deµ
a, esto se
debe a que a mayor absorci´on, mayor probabilidad de p´erdida de fotones lentos (los que tienen que recorrer caminos m´as largos
para llegar al detector), lo que se traduce en menos luz en el detector. Derecha: variaciones de tres pulsos te´oricos cuando el
valor deµ0
ses3,2y1mm−1. El valor deµaes0,01mm−1.Se puede observar que cuandoµ0sdecrece, el flanco ascendente tiene
una pendiente m´as pronunciada. Esto se debe que, al haber menos eventos de scattering, los fotones llegan m´as r´apidamente
al detector. La geometr´ıa utilizada es un slab de 35mm de espesor.
separar, mediante compuertas controladas por tiempo, aquellos fotones que sal´ıan r´ apida-mente y que se asum´ıa que recorr´ıan la menor distancia a trav´es del medio. Tales fotones son menos desparramados que aquellos que tardan m´as en llegar, de manera que su trayec-toria puede ser modelada, con buena aproximaci´on, con l´ıneas rectas, realizando un an´alisis directo y utilizando la transformada de Radon, as´ı como se realiza en tomograf´ıa computada [21]. Sin embargo, la cantidad de fotones que pueden ser medidos a trav´es de medios con ancho relevante es muy peque˜na4, y este enfoque fue abandonado para vol´umenes grandes
de tejido. Recientemente, estos fotones han sido utilizados en peque˜nos animales, donde el ancho es peque˜no [22], permitiendo colectar un n´umero razonable de fotones cuasi-bal´ısticos. Algunos intentos m´as sofisticados de medir toda la TPSF fueron hechas por Hebden [23] quien discut´ıa el uso de c´amaras y sistemas time-to-amplitude converter (TAC). De estas t´ecnicas la m´as habitual es la basada en sistemas de conteo de fotones correlacionados en el tiempo (time-correlated-single-photon counting -TCSPC-), los cuales dan medidas flexibles de tiempo de llegada de fotones con altas tasas de cuentas y buena resoluci´on temporal [24]. Estos sistemas se utilizan, en general, junto con detectores de tipo tubo fotomultiplicador (PMT Photomultiplier tube). En este trabajo se utilizar´a este enfoque.
Si bien los sistemas de Frequency-domain son r´apidos y relativamente m´as baratos que los sitemas de Time-domain, ´este ´ultimo posee algunas ventajas que lo hacen atractivo:
Las medidas en Time-domain se pueden realizar con detectores de tipo fotomultiplica-dores y fuentes pulsadas laser, llevando a la m´axima sensibilidad posible. Los sistemas TCSPC son el ´unico camino de medir luz a trav´es de medios de gran volumen en donde tal vez s´olo unos pocos fotones por segundo puedan medirse.
La TPSF contiene componentes de frecuencia temporal hasta varios GHz, de manera que una medida time-domain incluye informaci´on de un amplio rango de frecuencias en comparaci´on con sistemas frequency-domain que s´olo funcionan en una ´unica frecuen-cia. Habiendo dicho esto, la TPSF es suave, de manera que no es claro qu´e informaci´on adicional provee (que la curva sea suave enmascara posible informaci´on de alta frecuen-cia que no se pueda extraer con claridad).
4B´asicamente, los bal´ısticos son la fracci´on exp (−(µ
a+µs)L), conL el espesor de la paralelep´ıpedo en
El fen´omeno conocido comoPhase-wrappingpuede ocurrir en sistemas de tipo frequency-domain si el cambio de fase es mayor a 2π. Esto puede eludirse reduciendo la frecuencia de modulaci´on al costo de reducir el contraste de la medida y reduciendo la m´axima frecuencia que puede utilizarse para penetrar el medio.
La TSPF puede procesarse para dar algunos tipos de datos diferentes de la intensidad y el tiempo medio de vuelo de fotones (equivalente a la intesidad y la fase de un sistema de frequency-domain). Schweiger y Arridge [25] mostraron que algunos tipos de datos pueden mejorar la discriminaci´on entre absorci´on y scattering. Sin embargo, dado que los tipos de datos de orden superior son m´as sensibles al peque˜no n´umero de fotones que llegan m´as tarde, y ´estos son m´as sensibles al ruido, no han sido aplicados con ´
exito, a´un.
Quiz´as la ventaja menos ponderada de la t´ecnica time-domain es su habilidad de identi-ficar datos pobres. Los datos experimentales, especialmente los datos de cl´ınica, pueden verse contaminados con luz espuria, la cual se encuentra correlacionada con las medidas, lo que dificulta sacarla en el caso de medidas hechas por control temporal de compuer-tas. Este ruido puede venir de error de instrumentaci´on o, m´as comunmente, de luz que se filtra alrededor del medio que se quiere estudiar. ´Este es un problema particular de geometr´ıas complejas o cuando los conectores ´opticos no se mantienen sobre la super-ficie del medio de manera robusta [26]. Por ejemplo, cuando se conectan fibras sobre un medio a analizar y la conexi´on no es correcta, en el sentido que algo de luz espuria pueda entrar a las fibras se puede manifestar como parte de la TPSF. Tales artefactos pueden llevar a errores en los c´alculos de intensidad y de tiempo medio de vuelo de los fotones. Y, por lo tanto, a errores de reconstrucci´on. La t´ecnica time-domain permite detectar estos posibles problemas.
1.3.1.
Instrumentaci´
on para experimentaci´
on en el dominio del
tiempo
siste-mas TCSPC y sistesiste-mas de compuertas. Ambos poseen buena sensibilidad y buena resoluci´on temporal, pero son relativamente lentos y costosos (comparados con sistemas frequency-domain). Los sistemas de compuertas funcionan midiendo la luz dentro de un intervalo corto de tiempo. La TPSF se construye midiendo a diferentes retardos de tiempo. Este enfoque es menos costoso que los sistemas TCSPC y, en particular, el costo y los tiempos de adquisici´on no escalan con el n´umero de canales, permitiendo tener muchos detectores a costo de perder un poco de informaci´on.
Principio de operaci´on de los sistemas TCSPC
Los sistemas TCSPC funcionan, b´asicamente, midiendo los tiempos de llegada de fotones individuales. Esto requiere de un sistema de detecci´on capaz de identificar la llegada de un fot´on, distinguirlo de un evento de ruido electr´onico, medir su tiempo de llegada y luego guardar ese tiempo de manera conveniente. Adem´as, la probabilidad de detectar un fot´on en un per´ıodo de conteo simple debe ser mucho menor que uno. Si esta condici´on se satisface, podemos descontar la posibilidad de tener dos fotones llegando en el mismo per´ıodo, y no tenemos que compensar errores que pudieran ocurrir en ese caso [24].
Una manera alternativa de medir los tiempo de llegada es utilizar un TAC. Cuando un pulso se detecta, el TAC comienza a cargar un capacitor. El pulso de referencia detiene la carga, de manera que el voltaje a trav´es del TAC es proporcional al tiempo entre los dos pulsos. Esta se˜nal se la amplifica y se la env´ıa a un conversor anal´ogico-digital (ADC), el cual alimenta un banco de memoria que ensambla el histograma. El PTA es m´as costoso que el TAC pero tambi´en es m´as preciso.
Estos sistemas de primera generaci´on son precisos y sensibles, pero grandes y relativa-mente lentos. Tambi´en son unidimensionales en el sentido que mide los tiempos de llegada de un s´olo tren de fotones. Los dispositivos TCSPC de segunda generaci´on [24],[29] combinan los CFD y los PTA (o, equivalentemente, los CFD, TAC y ADC) en un ´unico circuito, el cual es montado en una PC. Esto conlleva un incremento en la velocidad en un factor 100 y una reducci´on de tama˜no de un orden similar. La reducci´on de tama˜no es atractivo para los sistemas con potencial a cl´ınica.
Otra ventaja de este enfoque es que puede ser descrito como multidimensional. Esto quiere decir que cuando se detecta un fot´on, su tiempo de llegada no es llevado meramente a memoria, sino que puede ser enviado a una ubicaci´on particular controlada por el usuario. De esta manera, una sola unidad TCSPC puede grabar a partir de m´ultiples detectores y m´ultiples fuentes. Esto puede ser ´util para distinguir entre distintas longitudes de onda (de la fuente o del detector), diferentes ubicaciones de fuentes y detectores, o las coordenadas x-y de un sistema de escaneo. Esto requiere una se˜nal extra de un router que, por ejemplo, pueda incluir una se˜nal que muestre qu´e detector midi´o el fot´on particular y que luego se asegure que los datos de ese fot´on se enruten al banco de memoria apropiado.
Fuentes de luz
Las fuentes de luz para los sistemas de time-domain se determinan tanto por los requeri-mientos de las TCSPC como por el objetivo del experimento. Las longitudes de onda suelen rondar los 800 nm y, casi siempre, entre 600 nm y 1000 nm. La selecci´on de la longitud de onda ´
optima es compleja y no completamente comprendida [31], pues depende del crom´oforo que se desea detectar. La potencia debe ser tal que no da˜ne el medio. Los sistemas time-domain requieren que las fuentes sean pulsadas.
Existen dos enfoques. Mayormente, se utilizan l´aseres de diodos. Son lo suficientemente baratos para que cada fibra correspondiente a una fuente pueda tener su propio laser, por lo que no es necesario, en general, el multiplexado. Est´an disponibles en varias longitudes de onda con anchos de banda angostos y son sencillas de controlar electr´onicamente. Se los suelen utilizar en los sistemas ´opticos de time-domain [32], [33], [34]. Sin embargo, la potencia promedio disponible para pulsos muy cortos en el infrarrojo cercano (NIR) est´a limitada a unos mW (hasta 50mW).
Otros tipos de laser pueden proveer mucha m´as potencia, pero pueden requerir realinear o recalibrar tras un peque˜no movimiento, lo que podr´ıa ser inaceptable en sistemas portables.
Detectores
En tomograf´ıa ´optica, necesitamos poder guardar las TPSF a partir de medidas de baja intensidad con gran precisi´on. La duraci´on de la TPSF es del orden de unos pocos nanosegun-dos, para poder resolver esto, la funci´on respuesta instrumental (IRF) del detector deber´ıa ser de unos pocos picosegundos o menos aunque, en la pr´actica, no siempre se poseen tales sistemas. M´as a´un, la estabilidad de la IRF respecto del tiempo debe ser menor que los cam-bios en el tama˜no de la se˜nal que se est´a midiendo. En ciertas ocasiones, el tiempo de vuelo puede ser de s´olo unos pocos picosegundos, de manera que adquirir la estabilidad adecuada puede ser desafiante. Adem´as, estamos midiendo luz difusa de baja intensidad y, para poder colectar la cantidad de luz que sea necesaria, se necesita un detector con gran ´area de colec-ci´on. Por lo tanto, necesitamos detectores estables y sensibles, que sean eficientes en el NIR y con r´apida IRF.
Sistemas TCSPC
Hemos presentado el principio general de los sistemas TCSPC, ahora veremos los dos tipos utilizados en tomograf´ıa de ´optica difusa: con todos los canales totalmente paralelizados o compartiendo canales escaneando la fuente, el detector o ambos.
El Monstir utiliza el primer enfoque. A´un cuando utiliza un ´unico l´aser, su salida pasa a trav´es de un switch de 32 salidas as´ı que la luz se env´ıa a 32 canales paralelos. Las fibras de las fuentes y los detectores se combinan con fibras coaxiales, las cuales pueden proveer o colectar luz. Esto permite un procedimiento de calibraci´on sencillo [35] y reduce a la mitad el n´umero de conexiones que debe hacerse a la cabeza o el busto escaneados. Una fibra se utiliza para llevar la luz mientras las 31 restantes colectan la luz que emerge luego de viajar a trav´es del cuerpo. Cada fibra detectora transmite luz a un microchannel-plate photomultiplier tube (MCP-PMT) el cual tiene un transit-time spread (TTS) m´as corto comparado a un PMT est´andar, llevando a una IRF m´as de ancho medio menor5 y a estabilidad temporal mejorada.
Treinta y dos atenuadores reducen la intesidad de las fuentes m´as intensas, para prevenir la saturaci´on de los detectores y reducir el rango din´amico de la luz medida.
El segundo enfoque es el que se utiliza, por ejemplo, en los grupos de investigaci´on de Berl´ın ([36], [33]) y Milan ([37], [34]), as´ı como en la compa˜nia Advanced Research Techno-logies Inc [38]. Los sistemas de Berl´ın y Mil´an utilizan como fuente un l´aser de diodos en cada longitud de onda de inter´es, el cual se multiplexa en un ´unico tren de pulsos que viaja a trav´es de la fibra fuente. Los datos se colectan utilizando una fibra que escanea en la cara opuesta a la fuente, o por un n´umero peque˜no de fuentes que est´an desplazados fuera del eje del detector. Las fibras de las fuentes y los detectores se mueven a trav´es del ´area de inter´es (a lo alto y ancho del ´area de inter´es), los que se utilizan en una mama gentilmente presionada. Los datos se colectan a intervalos de 1 mm. Ambos sistemas utilizan PMT, los cuales proveen una se˜nal que debe ser procesada por un sistema TCSPC en una PC.
5En pos de la claridad, la IRF puede verse como unapoint spread function, en el sentido que una medida es de la forma
m=i∗f
Cap´ıtulo 2
2.1.
Resumen
2.2.
Introducci´
on
En las ´ultimas dos d´ecadas, se han realizado avances respecto al modelado de la propa-gaci´on de luz en medios turbios, como puede verse, principalmente, en el ya cl´asico trabajo de Ishimaru donde se exploran varios modelos para diversas geometr´ıas [39]. Estos avances gu´ıan el desarrollo de t´ecnicas ´opticas tomogr´aficas, las cuales dependen de la habilidad de modelar, apropiadamente, la interacci´on de la luz con el tejido biol´ogico. En general, estas t´ecnicas utilizan luz en el infrarrojo cercano (NIR) en las longitudes de onda de 600nm -900nm para penetrar el tejido biol´ogico y obtener im´agenes funcionales ([31], [40], [41]). La propagaci´on de la luz en NIR est´a gobernada por la distribuci´on espacial de los coeficientes de absorci´on yscattering,µay µs, respectivamente. Los coeficientes de scattering toman valores en el rango de µs = 20,· · · ,200cm−1 ([42], [43]). Tambi´en se suele utilizar el coeficiente de scattering reducido µ0s = (1−g)µs, siendo g el coseno medio de scattering, tambi´en llamado factor de anisotrop´ıa, de evento de scattering simple. T´ıpicamente, este factor ronda entre 0.8 y 0.98. Las mol´eculas absorben radiaci´on a determinadas longitudes de onda, y se las deno-minan gen´ericamente crom´oforos, dentro de un tejido que puede causar absorci´on en varias longitudes de onda. El coeficiente de absorci´on var´ıa, en los crom´oforos end´ogenos t´ıpicos de los medios biol´ogicos, entreµa= 0,01 a 0,5cm−1 en el NIR ([44], [45], [46], [47]). Ejemplos de crom´oforos end´ogenos son: la hemoglobina, citocromas, flavinas y porfirinas. Diferencias en la concentraci´on y contenido de los crom´oforos conllevan a diferentes coeficientes de absorci´on
µa(r) conr ∈Ω, donde Ω es el medio de inter´es.
la distribuci´on de luz Φ(r) con r ∈ ∂Ω, precisamente en la ubicaci´on de los detectores, el esquema puede verse en la figura 2.1. A partir de estos datos, intentaremos, en los cap´ıtulos siguientes utilizar rutinas de recuperaci´on para saber cu´ales son los valores de las funciones
µa(r) yµs(r).
H
P
F
P
F
M
Figura 2.1: Diagrama del problema directo. Dado el operadorH :P → F que devuelve la fluencia a partir del conjunto de
par´ametros, y el operador P:F → M, que a partir de la fluencia devuelve la medida que se realiza en el borde. El modelo
directo es la funci´onF :P → Mque, a partir de un conjunto de par´ametros devuelve una medida en el contorno del medio
que se desea estudiar.
Estas rutinas de recuperaci´on pertenecen a la rama de las matem´aticas llamada Teor´ıa de Problemas Inversos, los cuales, en general, involucran la resoluci´on de un problema de optimizaci´on. A las lecturas del detector predichas por un modelo directo (o forward) en la superficie del tejido se las compara constantemente contra las lecturas del detector definiendo una funci´on objetivo, originalmente, la norma L2 del error. Se minimiza la funci´on objetivo
2.3.
Ecuaci´
on de Transferencia Radiativa
El problema directo de Propagaci´on de Luz en Tejidos Biol´ogicos se modela a partir de la Ecuaci´on de Transferencia Radiativa [58], [59], [39], [60] (RTE por sus siglas en ingl´es), que es una alternativa heur´ıstica a la teor´ıa rigurosa definida por las ecuaciones de Maxwell. Esta ecuaci´on se resuelve, usualmente, mediante m´etodos num´ericos dado que no existen soluciones anal´ıticas de esta ecuaci´on para geometr´ıas complejas y medios no homog´eneos en sus propiedades ´opticas. Estos m´etodos num´ericos pueden ser aproximaciones de ´ordenes bajos de la RTE, tales como la aproximaci´on difusiva, o aproximaciones de ´orden superior como, por ejemplo, discrete ordinates method (Sn) o el m´etodo de expansi´on en arm´onicos esf´ericos (Pn) [61]. La aproximaci´on difusiva se utiliza ampliamente en tejidos en donde
µ0s >> µa (este es el llamado r´egimen difusivo), como son, por ejemplo, la mama femenina o el tejido muscular [62]. Sin embargo, la aproximaci´on difusiva presenta limitaciones en geometr´ıas peque˜nas, tejidos con alta absorci´on y tejido con zonas de vac´ıo (´optico) [63], como pueden ser las zonas de muy baja absorci´on y scattering (como los quistes, fluido cerebro-espinal, etc). En estos casos, se suelen utilizar aproximaciones de orden superior ([64], [65]). En general, se suele utilizar una discretizaci´on espacial del dominio para resolver la ecuaci´on con t´ecnicas como el m´etodo de diferencias finitas, vol´umenes finitos o el m´etodo de elementos finitos. En el caso de RTE independiente del tiempo, los trabajos de Klose ([66]), Hielscher ([14], [67], [68]) y Tarvainen ([69],[70] y [71]) desarrollaron t´ecnicas num´ericas que involucran las aproximaciones mencionadas, as´ı como aproximaciones h´ıbridas Difusi´on-Transporte en regiones donde la aproximaci´on difusiva no es aplicable.
En el caso dependiente del tiempo, los trabajos de Dorn [72], Boulanger y Charette [73][74], Ren [75] y [76], Abdoulaev y Hielshcer [77], Abdoulaev [78], Kim and Hielscher [79], Klose and Larsen [80], fueron utilizados tanto en el r´egimen puramente temporal as´ı como en el dominio de la frecuencia.
Desarrollaremos brevemente el planteo del problema de la RTE; precisamente: sea Ω⊂Rn un dominio simplemente conexo, es decir, sin agujeros, con un borde al menos suave a trozos
de s∈ Sn−1(la bola unitaria en
Rn) sigue la ecuaci´on de balance: s· ∇Φ(x, s) +µtΦ(x, s) =µs
Z
Sn−1
f(s, s0)Φ(x, s0)ds0+q(x, s0) (2.1)
donde Φ(x, s) es la densidad de part´ıculas en la posici´onx que viajan en direcci´ons, q es el t´ermino fuente,µa es el par´ametro de absorci´on, µs el coeficiente de scattering, el coeficiente de transposrte µt = µa +µs y f es el kernel de scattering, en general, rotacionalmente invariante, es decir, f(s, s0) =f(s·s0). Usualmente, se utiliza el kernel de Henyey-Greenstein [81] definido de la siguiente manera:
f(s, s0) = 1−g
2
2(n−1)π(1 +g2−2g(s·s0))n/2. (2.2)
En general, asumiremos que todos los par´ametros son estrictamente positivos y n es la di-mensi´on del espacio de coordenadas. Para determinar las condiciones de contorno de la RTE definimos el vector normal a la superficie ∂Ω como n(x) con x ∈∂Ω y Γ+ (respectivamente Γ−) = {(x, s)∈∂Ω×Sn−1 :s·n ≥0(≤0)} como el borde saliente (entrante) y n
i(n0)
co-mo el ´ındice de refracci´on del medio (entorno). De esta manera la condici´on de contorno de reflexi´on para (2.1) es
Φ(x, s) = R(x, s, s0)Φ(x, s0) (2.3)
para (x, s)∈Γ−, (x, s0)∈Γ+, donde s0 refiere a la direcci´on angular en x en el borde que se
refleja en s cuando ni 6= n0, y R corresponde a la tasa de energ´ıa reflejada a trav´es de las
ecuaciones de Fresnel usuales en una frontera con cambio de ´ındice de refracci´on. Cuando no hay tal cambio, nos encontramos con la condici´on de borde vac´ıo, con R= 0.
Para no desviarnos del tema central no entraremos aqu´ı en detalles de existencia y unicidad que muestran las condiciones en las cuales existe una ´unica soluci´on de2.1. El lector interesado puede referirse al ap´endice .
aproxima-damente, 100 veces mayor que el coeficiente de absorci´on, y, la distancia fuente-detector es mayor a µ10
s, haciendo una aproximaci´on por arm´onicos esf´ericos y teniendo en cuenta
sola-mente los t´erminos isotr´opicos y linealmente anisotr´opicos (como se puede ver en el ap´endice) se llega a la ecuaci´on de difusi´on, la cual escribiremos en el dominio de la frecuencia:
(
∇ ·(D(x)· ∇I(x, w))−(µa− iωc) (x)I(x, w) = 0, x∈Ω/∂Ω
I(x, w) + 2AD(x)∂I ∂bn
=S(x, w), x∈∂Ω (2.4) donde D(x) = 3(µ 1
a(x)+µ0x(x)) con µ
0
s(x) = µs(1−g) es el coeficiente de scattering reducido y g es el factor de anisotrop´ıa. Aes el coeficiente de Fresnel que incorpora el cambio de ´ındice de refracci´on en el borde aire-tejido y bn es el vector normal a Ω en x. Una de las ventajas que presenta esta ecuaci´on es que tiene soluciones anal´ıticas en un buen n´umero de geometr´ıas, y adem´as permite agregar inclusiones dentro del volumen difusivo. ´Estas pretenden simular la existencia de lesiones (tumores, quistes, etc) que puedan estar presentes en el interior del tejido saludable. Desde el punto de vista num´erico, no es necesario calcular la influencia an-gular lo que hace que, en los enfoques num´ericos, la complejidad computacional disminuye dram´aticamente, ´util para problemas de geometr´ıas arbitrarias en problemas num´ericos. Da-do que las geometr´ıas que nos interesan son arbitrarias, nos enfocaremos en la resoluci´on de un modelo num´erico mediante el m´etodo de Elementos Finitos (FEM) y c´omo, a partir de ´
el, podemos calcular tambi´en el Jacobiano.
Elementos Finitos y la aproximaci´
on difusiva
autores han discutido sobre las implementaciones en FEM de la DA [86], [87], [88], [89], [90], [91], [92],[93].
La formulaci´on variacional para la DA nos dice que φ ∈H1(Ω) es soluci´on de la ecuaci´on
de difusi´on en forma d´ebil si satisface [86]
Z
Ω
Ψ
−∇ ·D∇+µa+
iω v φdr = Z Ω
Ψq0dr,∀Ψ∈H1(Ω) (2.5)
Utilizando la formula de Green
Z
Ω
v∇ · ∇udr=−
Z
∇
γ∇u· ∇vdr+
Z
∂Ω
vγ∇u·ndS (2.6)
podemos reescribir 2.5 como
Z
Ω
D∇Φ· ∇Ψdr−
Z
∂Ω
1
2vΦΨdS+
Z
Ω
µaΦΨdr+
iω c
Z
Ω
ΦΨdr (2.7)
=
Z
Ω
q0Φdr+
Z
∂Ω −2As
v ΦdS (2.8)
con As un coeficiente que mide la p´erdida producto de los reflejos internos del borde [94]. En el trabajo de Kolehmainen [95] se muestra que este razonamiento nos lleva a utilizar1 la
medida
Γ(r, ω) = − 1
2As
Φ(r, ω) (2.9)
Para construir la aproximaci´on en elementos finitos para Φ, se aproxima la soluci´on con una funci´on polinomial a trozos
Φh = Nn
X
i=1
φiψi ∈Xh ⊂H1(Ω) (2.10)
donde Xh = span{ψ
i|i= 1,· · · , Nn} y ψi son las funciones base de la malla de elementos finitos Ω =TNe
l=1Ωl. Insertando la aproximaci´on2.10en2.7y utilizando las funciones nodales
{ψj|j = 1,· · · , Nn} como funciones test, llegamos a la ecuaci´on
(K(D) +C(µa) +R+iωZ)Φh =G+E (2.11) con las entradas del sistema definidas por
Ki,j =
Z
Ω
D∇ψi· ∇ψjdr (2.12)
Ci,j =
Z
Ω
µaψiψjdr (2.13)
Zi,j =
1
c
Z
Ω
1
2AφiφjdS (2.14)
Los vectores fuente en el lado derecho de 2.11 depende del modelo de fuente que utilicemos. Para el caso de fuente difusa los vectores E y G son de la forma
Ej = 0, Gj =
Z
∂Ω −2Γs
As
ψjdS (2.15)
dado que este modelo asume que no hay fuentes internas, tenemos que q0 = 0. En el caso de
fuente colimadas los vectores son
Ej =
Z
Ω
q0ψjdr, Gj = 0 (2.16)
dado que el modelo asume que Γs = 0 y las fuentes del bordes se las modela como fuentes isotr´opicas que est´an dentro del medio una distancia de z0 = µ10
s. La soluci´on formal a este
problema es
Φhk = (K(D) +C(µa) +R+iωZ)
−1
(G+E) (2.17)
El vector de medida
Γ(k) =Γ1(k),· · · ,Γ(Mk) T
(2.18) (Γs es la corriente difusa del borde) en la ubicaci´on de los detectores se obtiene haciendo
con H es una matriz tal que
Di,n=
(
− 1
2A , si el nodoNn se encuentra en la posici´on del detector i-´esimo
0 , en otro caso
(2.20) Finalmente, la cantidad medible en los sistemas frequency-domain en la posici´on del j-´esimo detector es el cambio de fase y la amplitud de la modulaci´on (la amplitud A.C.) de la medida compleja Γkj(ω) [91],[96],[23],[97] que es
zi,phasek = arg(Γkj(ω)) = =(Γ k j(ω))
<(Γk j(ω))
(2.21)
zi,ampk = |Γkj(ω)| (2.22) que es la cantidad que se compara contra las medidas en las secciones siguientes. Es impor-tante, tambi´en para m´as adelante, notar que, si tenemos una medida en el dominio temporal Γkj(t) se puede obtener la medida en el dominio de la frecuencia haciendo:
Γkj(ω) =
Z
Γkj(t) exp(−iωt)dt (2.23)
es decir, mediante la transformada de Fourier.
Algunas observaciones respecto a este modelo de aproximaci´on que deben hacerse son: Dado que la aproximaci´on difusiva utiliza ´unicamente dos t´erminos de la expansi´on en arm´onicos esf´ericos, que contienen informaci´on isotr´opica y linealmente anisotr´opica, no es aplicable en todas las situaciones, aunque es ´util en algunas circunstancias. Primero, necesitamos que µa << µ0s y que la fuente se encuentre a algunos caminos libres promedios (µ10
s) de los detectores [90],[59]. Esto hace que su aplicabilidad en
situaciones donde existe un “vac´ıo” como ocurre en el caso de los quistes, hacen que la efectividad de la ecuaci´on de difusi´on se vea limitada, sin embargo, todav´ıa puede aplicarse en algunas situaciones [98].
radiaci´on, que viola el principio de causalidad, por lo que no da buenas aproximaciones a tiempos cortos[90].
2.3.1.
Matriz jacobiana
Para poder resolver, posteriormente, el problema tomogr´afico, precisamos poder determi-nar la construcci´on del jacobiano. El no hacerlo podr´ıa aumentar la complejidad computacio-nal dado que tendr´ıamos que evaluar el modelo tantas veces como al menos el doble de la cantidad de par´ametros a estudiar, lo que podr´ıa hacer prohibitiva su aplicabilidad. Supon-gamos que las funciones (µa, D) son aproximadas como en la forma2.10 y que las funciones base ψ(mD), ψm(µa) son conocidas. El jacobiano debe tener la forma
J =
∂F1(D,µa)
∂D1 · · ·
∂F1(D,µa)
∂DMk
∂F1(D,µa)
∂µa,1 · · ·
∂F1(D,µa)
∂µa,Mµ
· · · ·
∂FS(D,µa)
∂D1 · · ·
∂FS(D,µa)
∂DMk
∂FS(D,µa)
∂µa,1 · · ·
∂FS(D,µa)
∂µa,Mµ (2.24)
donde Fk(µa, D) es el modelo directo para la fuentek-´esima.
Para calcular los elementos de la matriz J, debemos notar que utilizando las aproxima-ciones polinomiales a trozos antes mencionados las matrices K y C se pueden escribir como
Ki,j = Mk
X
m=1
DkK
(m)
i,j , Ci,j = Mµ
X
m=1 µa,kC
(m)
i,j (2.25)
donde
Ki,j(m) =
Z
Ω
ψmD∇ψi· ∇ψjdr (2.26)
Ci,j(m) =
Z
Ω
ψmµψi·ψjdr (2.27)
las expansiones en polinomios a trozos, llegamos a
(K(D) +C(µa) +R+iωZ)
∂Φh j
∂Dm
= −K(m)Φh (2.28) (K(D) +C(µa) +R+iωZ) ∂Φ
h k
∂µa,m
= −C(m)Φh (2.29)
donde asumimos que las derivadas de las fuentes respecto de las propiedades ´opticas son cero y Φj corresponde a la fluencia de la fuente del j-´esimo par fuente-detector. Para calcular las celdas de la matriz jacobiana, debemos calcular la medida 2.19 y llam´andoloM al operador que transforma la fluencia en medida. Precisamente
∂Fj
∂Dm
= M ∂Φ
h j
∂Dm
!
(2.30)
∂Fj
∂µa,m
= M
∂Φhk
∂µa,m
(2.31)
De esta manera, pudimos calcular todas las celdas de la matriz jacobiana. Es posible calcu-larlas m´as eficientemente mediante diferenciaci´on adjunta [99],[90]. En la figura 2.2 vemos una malla construida para un ejemplo bidimensional de radio 30 mm, en la figura 2.3 se puede ver la distribuci´on de detectores respecto a una fuente, la figura 2.4 permite ver el logaritmo de la soluci´on de la ecuaci´on diferencial para un medio homog´eneo de propiedades ´
-30 -20 -10 0 10 20 30
X [mm]
-30 -20 -10 0 10 20 30
Y [mm]
Figura 2.2:Ejemplo de una malla bidimensional con elementos triangulares. La circunferencia es de radio30mm
-30 -20 -10 0 10 20 30
x (mm)
-30 -20 -10 0 10 20 30
y [mm]
Fuente Detector
-12 -10 -8 -6 -4 -2 0
Figura 2.4:Logaritmo de la soluci´on de la ecuaci´on diferencial correspondiente a la fuente de la figura2.3. Para calcular los
datos de la figura2.5se debe aplicar el operador de medida que proyecta en los detectores.
0 5 10 15
Número de detector
-16 -14 -12 -10 -8 -6 -4
-2 Log Amp
0 5 10 15
Número de detector
-1.6 -1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2
0 Fase
-0.05 0 0.05 0.1 0.15 0.2 0.25
Figura 2.6:Ejemplo de la photon measurement density function obtenida entre la fuente y un detector cualquiera
Hasta aqu´ı tenemos las herramientas esenciales para resolver el problema tomogr´afico, en lo que al modelo directo respecta.
Una observaci´on final que vale la pena mencionar es la justificaci´on de por qu´e desarrollar modelos frequency-domain en vez de time-domain , siendo que, como hemos visto, los ´ultimos tienen mayor informaci´on disponible. Desde el punto de vista de las t´ecnicas de reconstruc-ci´on, los sistemas time domain requieren la resoluci´on de m´ultiples problemas lineales, con una alta complejidad computacional. Considerando una discretizaci´on temporal dempuntos, la complejidad es la de resolver m problemas como los que resolvemos en frequency-domain lo que, por el momento, resulta poco pr´actico.
Cap´ıtulo 3
3.1.
Resumen
3.2.
Problemas inversos determin´ısiticos
En esta secci´on, trataremos problemas inversos desde el punto de vista determin´ıstico y finito-dimensional. Denotaremos a la cantidad de inter´es como f = (f1,· · · , fm) ∈ Rm y al
vector de datos por g = (g1,· · · , gn)∈Rn.
Supondremos que f y g est´an relacionados mediante una aplicaci´on conocida K :Rm →
Rn
de manera que
g =K(f) (3.1)
Si el modelo es lineal, podemos escribirlo de la siguiente manera
g =Kf (3.2)
donde K ∈ Rn×m. La utilidad del operador (o modelo) K, es la de indicar la observaci´on g dada la cantidad (posiblemente no observable) f. En general, el problema directo est´a bien propuesto en el sentido que la soluci´ong existe, es ´unica, y peque˜nas perturbaciones enf no generan grandes perturbaciones eng. Supondremos que nuestro modeloK es bien propuesto. El correspondiente problema inverso para las ecuaciones 3.2 y 3.1 es, dado un conjunto de datos g, determinar f tal que las identidades mencionadas se verifican. Los problemas inver-sos como 3.2 no son mal propuestos en s´ı mismos 1. Sin embargo, cuando el problema lineal proviene de una discretizaci´on de un problema continuo, los errores de discretizaci´on pueden que el problema sea sensible a los errores presentes en los datos. Esto se ver´a en la secci´on5
K
X Y
? f
g
Figura 3.1: Esquema de un problema directo y uno inverso. En el problema directo, dado un elementof ∈X se obtiene un
elementog∈Y mediante el operadorK, pero un problema inverso requiere obtener, dadog∈Y un elementof∈X. Observar
que no est´a definido un operador, por ahora.
Nuestro problema de inter´es es no-lineal, sin embargo, cuando tal no-linealidad no es muy intensa, trataremos el problema como uno localmente lineal, dado que m´etodos del tipo Newton se basan en linealizaciones del operador K.
3.2.1.
Descomposici´
on en valores singulares
El rango (o espacio columna) de una matrizK :Rm →
Rn se define como:
R(K) ={g ∈Rn|g =Kfpara alg´unf ∈
Rm} (3.3)
y el n´ucleo se define como:
N(K) = {f ∈Rm|Kf = 0} (3.4) entonces, Rm =N(K)L
N(K)⊥ y Rn =R(K)L
R(K)⊥ donde ⊥ denota el complemento ortogonal[103].
define como
K =U SVT (3.5)
donde
S =
"
Σr 0 0 0
#
(3.6) con Σr=Diag(σ1,· · · , σr), σ1 ≥σ2 ≥ · · · ≥σryr= m´ın(n, m). Las columnasui ∈Rm,vi ∈
Rn de las matrices U = (u1,· · ·, un)∈ Rm×m y V = (v1,· · · , vn)∈ Rn×n son ortonormales. Desde un punto de vista geom´etrico, una tal transformaci´on lineal realiza una transformaci´on ortogonal en el espacio de salida, realiza expansiones y compresiones (y la correspondiente extensi´on al espacio de llegada) y otra transformaci´on ortogonal en el espacio de llegada. Adem´as, los cuatro subespacios fundamentales de la matriz K quedan determinados por tales matrices, a saber2
R(KT) = gen{v
1,· · · , vr}
N(K) =gen{vr+1,· · · , vn}
R(K) = gen{u1,· · · , ur}
N(KT) =gen{u
r+1,· · ·, um}
notese, adem´as, que R(KT) = N(K)⊥ y R(NT) = R(K)T El n´umero de condici´on de la matriz K puede definirse como
cond(K) = ||K||||K ||= σ1
σr
(3.7)
donde K es la matriz pseudo-inversa3 de K. Es posible clasificar la naturaleza de la mala
condici´on de K:
El problema es de rango deficiente si r < min(m, n) 2gen(x
1,· · · , xn) =z∈Rk :z=Pni=1aixi paraa1,· · · , an ∈R 3La matriz pseudo inversa puede definirse simplemente comoK−=P
i|σi>0
1
σiviu
T
i donde los vectoresvi
SiN(K) = {0}peroKtiene algunos valores cercanos a cero, por ejemplo,{σk+1,· · · , σr} con un salto claro entre estos y los primeros {σ1,· · · , σk} en el espectro. En este caso, la matriz K contiene r−k vectores casi linealmente dependientes y el problema es de rango deficiente num´erico.
Un problema inverso discreto se caracteriza por tener un espectro que decae a cero sin un salto notable. Al no haber un salto claro, la noci´on de rango deficiente num´erico es difusa.
Estas situaciones se caracterizan por tener n´umeros de condici´on elevados.
3.2.2.
Cuadrados m´ınimos en problemas lineales
En general, tendremos que g /∈ Im(K), de manera que Kf − g 6= 0. Intentaremos, entonces, encontrar una soluci´on que est´e lo m´as cerca posible deg. El m´etodo de cuadrados m´ınimos es una de las t´ecnicas usuales y directas.
Aqu´ı, el objetivo es encontrar una estimaci´on al problema4
fLS = argm´ın f∈X
ζ(f) (3.8)
donde ζ(f) = ||g−Kf||2 y ||.||=||.|| 2.
El vector que se encuentra a m´ınima distancia se obtiene resolviendo el sistema de ecuaciones normales
KT(Kf −g) = 0 (3.9)
y cuando el problema es no lineal, derivando respecto a f se obtiene:
L(f) = ||K(f)−g||2 (3.10)
= K(f)TK(f)−2K(f)Tg+gTg (3.11)
∂L
∂f = 2J
TJ f −2JTg = 0 (3.12)
JTJ f = JTg (3.13)
4argm´ın
c∈X(g) corresponde al argumento que miniza la expresi´on g, recorriendo el espacio de posibles