En ocasiones, cuando se desea entender el funcionamiento de un fen´omeno natural (e.g. el proceso de transcripci´on y traducci´on de genes en c´elulas), es necesario poderlo replicar y generar datos para poderlo analizar. Es por eso que se utilizan herramientas matem´aticas para modelar, y por ende, predecir un fen´omeno. Sin embargo, existen casos donde la problem´atica es demasiado compleja o su comportamiento es aleatorio,
Algoritmo 2 Nondomitaded Sorting Genetic Algorithm II. Entrada: M individuos y N generaciones
Salida: Conjunto de soluciones no dominadas
1: P ←random(M) . Poblaci´on inicial de tama~no M
2: para t= 0 →N hacer .Iterar N n´um. de generaciones
3: R ←P ∪Q . Combinar la poblaci´on de padres e hijos
4: FR←fast dominated sort(R) . Obtener los frentes no dominados 5: Pt+1 = Ø, j = 1
6: mientras |Pt+1|+|Fj| ≤M hacer . Iterar hasta completar Pt+1
7: crowding distance assigment(Fj) .Calcular la distancia de
.amontonamiento en Fi
8: Pt+1←Pt+1∪Fj . incluir el frente a la poblaci´on
9: j ←j+ 1
10: fin mientras
11: Sort(Fi,≺n) . Ordenar de manera descendiente
. Seg´un ≺n 12: Pt+1 =Pt+1∪Fi[1 : (N − |Pt+1|)] .Escoger los primeros . (N − |Pt+1|) elementos de Fi 13: Qt+1 = make new population(Pt+1) .Seleccionar, mutar y
. cruzar para generar descendencia
14: fin para
por lo que un an´alisis matem´atico exacto es imposible. A estos tipos de problemas se les conoce como anal´ıticamente intratables. No obstante, esto no significa que el problema no puede ser entendido, sino que se requiere de una nueva herramienta: el an´alisis estoc´astico. Con la ayuda de una computadora, es posible simular la evoluci´on de un fen´omeno al efectuarlo varias veces y estudiando los datos percibidos. Un ejemplo de aplicaci´on lo encontramos en el modelado de cin´etica en redes bioqu´ımicas con el algoritmo de Gillespie (Wilkinson, 2006).
3.8.1. Algoritmo de Gillespie
En un sistema de reacciones qu´ımicas con v reacciones, se sabe que la propensidad de un tipo de reacci´oni eshi(x, ci), dondexes una especie dada yci es la constante de
velocidad de la reacci´oni. La propensidad de que una reacci´on de alg´un tipo ocurra es: h0(x, c)≡ v X i=1 hi(x, ci). (24)
El tiempo para que la siguiente reacci´on ocurra es exp (h0(x, c)), y es una variable alea-
toria con probabilidad proporcional a hi(x, ci) e independiente del tiempo del siguiente
evento. Esto es, la reacci´oni tendr´a lugar con probabilidad hi(x, ci)/h0(x, c), donde es
utilizado el tiempo para la siguiente reacci´on j, el sistema puede ser actualizado y la simulaci´on puede continuar. A este tipo de simulaci´on por eventos discretos se le conoce como el algoritmo de Gillespie. El pseudoc´odigo se resume de la siguiente manera: Algoritmo 3 Algoritmo de Gillespie.
Entrada: Constantes de reacci´on estoc´asticas c1. . . . , cm, poblaci´on molecular incial
x1, . . . , xn 1: t←0
2: mientras t < Tmax hacer 3: para t = 0→N hacer
4: Calcular la propensidadhi(x, ci) basado en el estado actual,x. 5: fin para
6: Calcular h0(x, c)≡
Pv
i=1hi(x, ci), la propensidad de reacci´on combinada. 7: Simular el tiempo para la siguiente reacci´on, t0 ←Exp(h0(x, c)).
8: t :=t+t0.
9: Simular el ´ındice de reacci´on, j, seg´un hi(x, ci)/h0(x, c), i= 1,2, . . . , v.
10: x:=x+S(j) . donde S(j) denota la j-´esima columna
. de la matriz de estequiometr´ıaS.
Cap´ıtulo 4. C´omputo biomolecular
El c´omputo biomolecular es un ´area interdisciplinaria que combina conocimientos de diferentes ciencias como la biolog´ıa, la f´ısica, las matem´aticas, las ciencias computacio- nales y la nanotecnolog´ıa. La finalidad de esta ´area es la construcci´on de dispositivos moleculares con base en concentraciones de mol´eculas org´anicas que ante un est´ımulo externo se auto-ensamblen y se organicen de manera programada y l´ogica como respues- ta a ese est´ımulo. La manera en la cual estos dispositivos realizan estas dos acciones, ya sea por medio de operaciones de laboratorio o por las propiedades de auto-organizaci´on inherentes a las biomol´eculas, son las diferentes vertientes de investigaci´on del ´area, las cuales se explicar´an m´as adelante.
4.1. El experimento de Adleman
Adleman (1994) fue el primero en explorar el poder de c´omputo en biomol´ecu- las, planteado orriginalmente por Feynman (1961), al implementar un algoritmo para solucionar uno de los problemas combinatorios dif´ıciles, el problema del camino hamil- toniano (HPP), perteneciente a la clase NP-Completo. En el HPP, se busca encontrar un camino en un grafo dirigido iniciando y terminando en v´ertices espec´ıficos, visitando cada uno de los v´ertices en el grafo una sola vez. Al pertenecer a la clase NP-completo, actualmente no es posible solucionar este problema mediante computadoras digitales convencionales utilizando un algoritmo de fuerza bruta. Adleman, codificando el pro- blema en cadenas de ADN y utilizando operaciones biol´ogicas, resolvi´o un caso del HPP de 7 v´ertices en tiempo lineal. Adleman represent´o la informaci´on del grafo de la siguiente manera: cada vertice vi es representado por un oligonucle´otido, mientras
que cada arista eij, la cual conecta el v´ertice vi al v´ertice vj, es representado por un
oligonucle´otido complementario a la segunda mitad del extremo 30 de la secuencia de
vi, y de la primera mitad del extremo 50 del v´ertice vj. El algoritmo de Adleman es el
siguiente:
Generar una biblioteca combinatoria de soluciones.
Remover todos los caminos con v´ertices de inicio inv´alidos o con v´ertices finales inv´alidos.
Remover todos los caminos que no contienen exactamente n v´ertices. Remover todos los caminos con dos o m´as v´ertices repetidos.
Leer los caminos Hamiltonianos encontrados, si existen.
La biblioteca combinatoria de caminos se crea por la hibridaci´on y uni´on de todos los oligonucle´otidos que codifican v´ertices y aristas. En el paso 2, los caminos correctos se amplifican mediante PCR utilizando los primers correspondientes. Desp´ues, en el paso 3, los caminos que contienen exactamente n v´ertices son extra´ıdos por electroforesis en gel. El paso 4 requiere un ciclo de filtrado lineal en el n´umero de v´ertices: por cada v´erticevi, el producto resultante del paso anterior es desnaturalizado, para quevi pueda
hibridar, y posteriormente retenido mediante purificaci´on por afinidad. Finalmente, el producto se ampl´ıfica utilizando PCR y las soluciones se detectan por electroforesis en gel.