Simulaci´ on estoc´ astica - Optimización de sondas en autómatas moleculares para el diagnóstic

En ocasiones, cuando se desea entender el funcionamiento de un fenómeno natural (e.g. el proceso de transcripción y traducción de genes en células), es necesario poderlo replicar y generar datos para poderlo analizar. Es por eso que se utilizan herramientas matemáticas para modelar, y por ende, predecir un fenómeno. Sin embargo, existen casos donde la problemática es demasiado compleja o su comportamiento es aleatorio,

Algoritmo 2 Nondomitaded Sorting Genetic Algorithm II. Entrada: M individuos y N generaciones

Salida: Conjunto de soluciones no dominadas

1: P ←random(M) . Poblaci´on inicial de tama~no M

2: para t= 0 →N hacer .Iterar N n´um. de generaciones

3: R ←P ∪Q . Combinar la poblaci´on de padres e hijos

4: FR←fast dominated sort(R) . Obtener los frentes no dominados 5: Pt+1 = Ø, j = 1

6: mientras |Pt+1|+|Fj| ≤M hacer . Iterar hasta completar Pt+1

7: crowding distance assigment(Fj) .Calcular la distancia de

.amontonamiento en Fi

8: Pt+1←Pt+1∪Fj . incluir el frente a la poblaci´on

9: j ←j+ 1

10: fin mientras

11: Sort(Fi,≺n) . Ordenar de manera descendiente

. Seg´un ≺n 12: Pt+1 =Pt+1∪Fi[1 : (N − |Pt+1|)] .Escoger los primeros . (N − |Pt+1|) elementos de Fi 13: Qt+1 = make new population(Pt+1) .Seleccionar, mutar y

. cruzar para generar descendencia

14: fin para

por lo que un análisis matemático exacto es imposible. A estos tipos de problemas se les conoce como anal´ıticamente intratables. No obstante, esto no significa que el problema no puede ser entendido, sino que se requiere de una nueva herramienta: el análisis estocástico. Con la ayuda de una computadora, es posible simular la evolución de un fenómeno al efectuarlo varias veces y estudiando los datos percibidos. Un ejemplo de aplicación lo encontramos en el modelado de cinética en redes bioqu´ımicas con el algoritmo de Gillespie (Wilkinson, 2006).

3.8.1. Algoritmo de Gillespie

En un sistema de reacciones qu´ımicas con v reacciones, se sabe que la propensidad de un tipo de reacci´oni eshi(x, ci), dondexes una especie dada yci es la constante de

velocidad de la reaccióni. La propensidad de que una reacción de algún tipo ocurra es: h0(x, c)≡ v X i=1 hi(x, ci). (24)

El tiempo para que la siguiente reacci´on ocurra es exp (h0(x, c)), y es una variable alea-

toria con probabilidad proporcional a hi(x, ci) e independiente del tiempo del siguiente

evento. Esto es, la reacci´oni tendr´a lugar con probabilidad hi(x, ci)/h0(x, c), donde es

utilizado el tiempo para la siguiente reacción j, el sistema puede ser actualizado y la simulación puede continuar. A este tipo de simulación por eventos discretos se le conoce como el algoritmo de Gillespie. El pseudocódigo se resume de la siguiente manera: Algoritmo 3 Algoritmo de Gillespie.

Entrada: Constantes de reacción estocásticas c1. . . . , cm, población molecular incial

x1, . . . , xn 1: t←0

2: mientras t < Tmax hacer 3: para t = 0→N hacer

4: Calcular la propensidadhi(x, ci) basado en el estado actual,x. 5: fin para

6: Calcular h0(x, c)≡

i=1hi(x, ci), la propensidad de reacci´on combinada. 7: Simular el tiempo para la siguiente reacci´on, t0 ←Exp(h0(x, c)).

8: t :=t+t0.

9: Simular el ´ındice de reacci´on, j, seg´un hi(x, ci)/h0(x, c), i= 1,2, . . . , v.

10: x:=x+S(j) . donde S(j) denota la j-´esima columna

. de la matriz de estequiometr´ıaS.

Cap´ıtulo 4. C´omputo biomolecular

El cómputo biomolecular es un área interdisciplinaria que combina conocimientos de diferentes ciencias como la biolog´ıa, la f´ısica, las matemáticas, las ciencias computacio- nales y la nanotecnolog´ıa. La finalidad de esta área es la construcción de dispositivos moleculares con base en concentraciones de moléculas orgánicas que ante un est´ımulo externo se auto-ensamblen y se organicen de manera programada y lógica como respues- ta a ese est´ımulo. La manera en la cual estos dispositivos realizan estas dos acciones, ya sea por medio de operaciones de laboratorio o por las propiedades de auto-organización inherentes a las biomoléculas, son las diferentes vertientes de investigación del área, las cuales se explicarán más adelante.

4.1. El experimento de Adleman

Adleman (1994) fue el primero en explorar el poder de cómputo en biomolécu- las, planteado orriginalmente por Feynman (1961), al implementar un algoritmo para solucionar uno de los problemas combinatorios dif´ıciles, el problema del camino hamil- toniano (HPP), perteneciente a la clase NP-Completo. En el HPP, se busca encontrar un camino en un grafo dirigido iniciando y terminando en vértices espec´ıficos, visitando cada uno de los vértices en el grafo una sola vez. Al pertenecer a la clase NP-completo, actualmente no es posible solucionar este problema mediante computadoras digitales convencionales utilizando un algoritmo de fuerza bruta. Adleman, codificando el problema en cadenas de ADN y utilizando operaciones biológicas, resolvió un caso del HPP de 7 vértices en tiempo lineal. Adleman representó la información del grafo de la siguiente manera: cada vertice vi es representado por un oligonucleótido, mientras

que cada arista eij, la cual conecta el v´ertice vi al v´ertice vj, es representado por un

oligonucle´otido complementario a la segunda mitad del extremo 30 de la secuencia de

vi, y de la primera mitad del extremo 50 del v´ertice vj. El algoritmo de Adleman es el

Generar una biblioteca combinatoria de soluciones.

Remover todos los caminos con vértices de inicio inválidos o con vértices finales inválidos.

Remover todos los caminos que no contienen exactamente n vértices. Remover todos los caminos con dos o más vértices repetidos.

Leer los caminos Hamiltonianos encontrados, si existen.

La biblioteca combinatoria de caminos se crea por la hibridación y unión de todos los oligonucleótidos que codifican vértices y aristas. En el paso 2, los caminos correctos se amplifican mediante PCR utilizando los primers correspondientes. Despúes, en el paso 3, los caminos que contienen exactamente n vértices son extra´ıdos por electroforesis en gel. El paso 4 requiere un ciclo de filtrado lineal en el número de vértices: por cada vérticevi, el producto resultante del paso anterior es desnaturalizado, para quevi pueda

hibridar, y posteriormente retenido mediante purificaci´on por afinidad. Finalmente, el producto se ampl´ıfica utilizando PCR y las soluciones se detectan por electroforesis en gel.

In document Optimización de sondas en autómatas moleculares para el diagnóstico y tratamiento de la fibrosis quísticaProbe optimization in molecular automaton for diagnostic and treatment of cystic fibrosis (página 50-54)