Universidad de Los Andes
Proyecto de Tesis de Pregrado
Estad´ısticas y Ruido Intr´ınseco
de la Expresi´
on Gen´
etica
Roberto Mor´
an Tovar
supervisado por
Juan Manuel Pedraza Leal Ph.D
´
Indice general
1. Introducci´on 5
1.1. Motivaci´on . . . 10
2. Ruido Intr´ınseco en la Expresi´on Gen´etica 13 2.1. Primer acercamiento a un an´alisis estoc´astico . . . 15
2.1.1. Ecuaci´on Maestra . . . 16
2.1.2. Ecuaci´on de Langevin . . . 20
2.1.3. M´etodos especiales para c´alculo de ruido de un sistema 23
2.2. Consideraciones sobre el proceso de Transcripci´on . . . 27
2.2.1. Ruido Telegr´afico . . . 28
2.2.2. Efecto de Gestaci´on y transcripci´on por r´afagas . . . . 34
2.3. Consideraciones sobre el proceso de Traducci´on . . . 46
2.3.1. Traducci´on por R´afagas . . . 48
3. Simulaciones y An´alisis Num´erico 53
4. Conclusiones 65
Pois-son 69
B. Ecuaci´on Maestra 73
Resumen
La Expresi´on Gen´etica puede definirse como el flujo de informaci´on desde
el ADN hasta las prote´ınas. El proceso consiste de una serie de reacciones
bioqu´ımicas, las cuales ocurren con cierta probabilidad. Esto hace que todo
el proceso sea fundamentalmente estoc´astico y, por ende, que sea necesario
abordar su estudio con el uso de herramientas probabil´ısticas. El modelo
mas simple consiste en un proceso de transcripci´on constante, un proceso de
traducci´on constante por numero de mol´eculas de ARN y tasas efectivas de
degradaci´on para las “especies” involucradas. En este trabajo se presentan
expresiones anal´ıticas para las distribuciones de probabilidad de las
“espe-cies” en el estado estable. Sumado a esto, se presentan modelos de ruido,
los cuales incluyen consideraciones especiales que hacen mas complejos los
Abstract
We can define the Genetic Expression as the flow of information from the
DNA to the proteins. The process consists of a series of biochemical
reac-tions that occur with some probability. This cause the whole process to be
fundamentally stochastic and for that reason is necessary to use probabilistic
tools to study it. The simplest model consists of a transcription process at
constant rate, a translation process at constant rate per ARN molecule and
finally, effective rates of degradation for the species involved in the process. In
this work, we present analytical expressions for the probability distributions
of the different species at the steady state. Additionally, we present models
of noise that take into account new considerations about the transcription
Agradecimientos
A mis padres por el apoyo incondicional en mi camino. A mi gu´ıa acad´
emi-co Juan Manuel Pedraza por todos sus emi-consejos y ayuda en mi formaci´on. A
Michael H¨ogele por sus comentarios y recomendaciones. A todas las
perso-nas que han hecho que mi paso por la Universidad haya sido un gran viaje a
Cap´ıtulo 1
Introducci´
on
Buscar leyes fundamentales de la naturaleza es tal vez uno de los
objeti-vos principales de la F´ısica. Encontrar principios que nos permitan entender
y predecir fen´omenos en el mundo en el que vivimos. Sumado a esto,
escri-birlos en el lenguaje de las matem´aticas, para los que nos reconocemos como
los herederos de las ideas de Galileo, es fundamental. Dentro de la f´ısica es
posible encontrar distintos campos que se especializan en distintas clases de
fen´omenos. Est´a la F´ısica de Part´ıculas Elementales, la F´ısica de la
Mate-ria Condensada, la F´ısica At´omica, la Astrof´ısica, la Biof´ısica, por nombrar
algunas.
En este momento, me gustar´ıa referirme al campo al cual pertenece este
trabajo: La Biof´ısica. Es tal vez el mas interdisciplinar de todos, pues se
comunica constantemente con distintas ciencias naturales como la Biolog´ıa, la
Microbiologia, la Qu´ımica, entre otras. Quiz´a por esta misma raz´on, muchas
desarrolla, e incluso, en algunas ocasiones, la consideran un campo de la
Biolog´ıa y no de la F´ısica. Debido a esto, me gustar´ıa introducir mi trabajo
de grado en F´ısica, explicando lo que considero como el campo de la Biofisica.
El estudio del fen´omeno de la vida por parte de los F´ısicos no es algo
nuevo; se conoce de trabajos en Biof´ısica desde el siglo XIX. Se podr´ıa decir
que el inicio del inter´es de los F´ısicos por la Biolog´ıa empieza intentando
entender el cuerpo humano, especialmente los ´organos de los sentidos. ´Areas
de la medicina, como la Fisiolog´ıa, se vieron beneficiadas por la incursi´on de
f´ısicos. Tal vez uno de los casos mas reconocidos es el del F´ısico Hermann
von Helmholtz, famoso por sus estudios en Electromagnetismo y la ecuaci´on
diferencial que lleva su nombre. Durante su vida, tambi´en incursion´o en el
campo de la Fisiolog´ıa y estudi´o la Ley de la Conservaci´on de la energ´ıa
en el metabolismo de los m´usculos y estableci´o leyes matem´aticas para el
sentido de la vista, la percepci´on visual del espacio, la vision de colores,
entre otros temas relacionados con la luz y nuestra forma de percibirla [1].
Al igual que Herlmholtz, muchos otros f´ısicos, sobre todo del campo de la
termodin´amica, intentaron brindarle explicaciones a fen´omenos relacionados
con la vida desde una perspectiva de las leyes universales de la F´ısica y
haciendo uso del lenguaje de las matem´aticas.
Ya en el siglo XX, quiz´a el f´ısico mas recordado por hablar acerca del
fen´omenos de la vida fue el alem´an Erwin Schroedinger, el mismo creador de
la Mec´anica Cu´antica en su formulaci´on de funciones de onda y famoso por
la ecuaci´on que lleva su nombre y gobierna la evoluci´on temporal en sistema
el libro titulado What is life? [2], Schroedinger abord´o el problema de la
vida y la gen´etica usando conceptos como entrop´ıa, cristales aperi´odicos,
energ´ıa, entre otros, propios de la mec´anica estad´ıstica y la termodin´amica.
Su trabajo fueron revolucionarios, no por sus resultados, sino por su enfoque
y perspectiva hacia el fen´omeno de la vida.
He nombrado estos ejemplo para mostrar c´omo ha sido la influencia de
la F´ısica en la Biolog´ıa, y principalmente, cu´al ha sido, es y debe ser la
forma en la que es vista la Biof´ısica. Los aportes han sido incalculables y
el entendimiento de la vida, vista incluso como un estado de la materia con
determinadas propiedades, ha crecido gracias al esfuerzo de f´ısicos que se
han dejado maravillar por el incre´ıble mundo de los seres vivos. Citando a
W. Bialek de su libro Biophysics, cuando habla sobre Bragg y su grupo de
investigaci´on de la estructura de mol´eculas biol´ogicas en Cambridge:
Para decir en pocas palabras una historia larga y gloriosa, ellos
lo lograron, incluso mas all´a del sue˜no mas osado de Bragg, y uno
de los art´ıculos cient´ıficos mas importantes de la biolog´ıa del siglo
XX fue escrito en un departamento de F´ısica [3].
Entre muchos de los fen´omenos de la vida que han interesado a los f´ısicos
en su labor cient´ıfica, he escogido la Expresi´on Gen´etica como objeto de
estudio de este trabajo. Por un lado, debido a que es el tema de experticia de
mi asesor. Por otro, dada su importancia, como proceso fundamental, en el
incre´ıble fen´omeno de la vida. Ocurre en todas las formas conocidas de vida
y es, salvo peque˜nas distinciones, el proceso mas universal que comparten los
La Expresi´on Gen´etica, flujo de informaci´on desde el ADN hasta las
pro-te´ınas, es uno de los procesos fundamentales de la biolog´ıa molecular y ha
sido estudiada y caracterizada desde hace mediados del siglo XX. Este
proce-so est´a basado en reacciones bioqu´ımicas, las cuales dependen del encuentro
aleatorio de sus reactivos y cierta probabilidad de interacci´on entre ellos.
Por estas razones, podemos decir que la expresi´on gen´etica es un proceso
fundamentalmente estoc´astico.
Sumado al hecho de ser un proceso estoc´astico, tambi´en es un proceso que
involucra un bajo n´umero de copias de mol´eculas para su funcionamiento.
Generalmente, en una c´elula encontramos no mas de ocho copias de un gen
(ADN); por cada gen, el n´umero promedio de ARN mensajero (mARN) es
aproximadamente cinco copias y el de prote´ınas ronda las cinco mil copias.
Esto quieres decir que el tratamiento que debemos darle a esta clase de
sistemas difiere de, por ejemplo, la mayor´ıa de casos que encontramos en la
F´ısica Estad´ıstica, en donde el numero de part´ıculas en un sistema es del
orden del n´umero de Avogadro.
Este ´ultimo hecho, hace que sea de vital importancia el estudio de todas
las caracter´ısticas estoc´asticas de este proceso, ya que en muchos de los casos
las fluctuaciones se alejan bastante de los valores esperados y la descripci´on
determinista, la cual modela los comportamientos promedio de los sistemas,
no nos brinda informaci´on suficiente. Se hace necesario conocer los diferentes
momentos y cumulantes del sistema, para as´ı poder tener una descripci´on
Los valores promedio del n´umero de mol´eculas involucradas en este
pro-ceso (ADN, ARN, prote´ınas, etc) pueden ser modelados mediante el uso de
las ecuaciones diferenciales propias de la cin´etica molecular. En este sentido,
encontramos ecuaciones cl´asicas como la ecuaci´on de din´amica enzim´atica
de Michaelis-Menten, la ecuaci´on de Hill, entre otras. Dichas ecuaciones nos
permiten modelar de manera apropiada el comportamiento promedio de los
procesos involucrados en la expresi´on gen´etica, sirviendo como primer
acerca-miento al estudio cuantitativo de ´esta. Por esta raz´on, es importante entender
su significado y c´omo ´estas se relacionan con los modelos estoc´asticos, objetos
de estudio de este trabajo.
El uso de modelos estoc´asticos no es nuevo en el estudio cuantitativo de
la expresi´on gen´etica. Podemos encontrar estudios te´oricos de la
estocastici-dad de este proceso desde 1970 [4]. Sin embargo, por mucho tiempo no fue
f´acil comprobar experimentalmente muchos de los resultados, ya que ´estos
requer´ıan poder observar en tiempo real las fluctuaciones de una celular
indi-vidual, o la cuantificaci´on de la concentraci´on de mol´eculas especificas en una
poblaci´on celular. Gracias a recientes avances experimentales en este
senti-do [5], hoy en d´ıa es posible medir estas cantidades y por eso ha retornasenti-do
el inter´es de muchos cient´ıficos al estudio cuantitativos de procesos a nivel
celular, como lo es la expresi´on gen´etica [6].
La F´ısica ha sido un gran actor en este proceso de entendimiento del
com-portamiento estoc´astico de la expresi´on gen´etica. Concretamente, los m´
eto-dos usaeto-dos en la mec´anica estad´ıstica han sido aplicados de manera exitosa
involucradas en la expresi´on gen´etica. Como ejemplo, podemos encontrar el
uso del m´etodo de la ecuaci´on maestra, el m´etodo de la ecuaci´on de Langevin,
la ecuaci´on de Foker-Planck, la teor´ıa de colas, entre otras.
Dado lo anterior, este razonamiento f´ısico del problema se han
encontra-do con algunos restos, no muy comunes en la F´ısica, a la hora de proponer
modelos exitosos y fehacientes de la realidad. Dada la complejidad de los
sistemas biol´ogicos, la descripci´on de los procesos involucrados depende de
una gran cantidad de par´ametros. Por su lado, muchos los par´ametros
de-penden considerablemente de las condiciones globales en las que se encuentra
el sistema y por tanto sus fluctuaciones siguen modelos de ruido global. Por
el lado experimental, los retos est´an en que muchos de los par´ametros no
son ajustables al deseo del cient´ıfico y esto genera una incertidumbre mayor
en los resultados. Por otro lado, por el lado te´orico, uno de los principales
problemas radica en la pobre descripci´on disponible de los par´ametros.
1.1.
Motivaci´
on
Una de las aplicaciones mas importantes a los modelos estoc´asticos de la
expresi´on gen´etica es el entendimiento de fen´omenos de diversidad fenot´ıpica
en poblaciones isog´enicas. Dado el car´acter estoc´astico de este proceso, c´
elu-las gen´eticamente id´enticas dentro de una poblaci´on pueden tener diferentes
cantidades de prote´ınas en un tiempo dado, incluso cuando sus condiciones
son las mismas. Esto, a su vez, genera diversidad fenot´ıpica en la poblaci´on y,
en algunos casos, es utilizado por las c´elulas para favorecer su supervivencia
mas importantes en este sentido es la persistencia bacteriana. Este fen´omeno
consiste en el repentino cambio de algunas bacterias de una poblaci´on a un
estado latente [8]. En ´este estado, al parecer, presentan niveles metab´olicos
lo suficientemente bajos como para evadir el efecto de Antibi´oticos. ´Este
re-pentino cambio podr´ıa deberse a las fluctuaciones en los niveles de prote´ınas
pertenecientes a sistemas de Toxina-Antitoxina. Esto les permite a las
bacte-rias tener diferentes estado fenot´ıpicos incluso siendo gen´eticamente iguales.
Sumado a esto, el entendimiento de los procesos biol´ogicos a nivel
molecu-lar y el proceso en t´ecnicas experimentales sofisticadas para el tratamiento y
la cuantificaci´on de procesos a nivel celular, han permitido el surgimiento de
la Biolog´ıa Sint´etica. Esta es una muy reciente ´area del conocimiento que se
mueve entre los campos de la f´ısica, la biolog´ıa, la qu´ımica y la ingenier´ıa. Su
principal objetivo es utilizar las partes que constituyen los circuitos gen´eticos
de los organismos para crear nuevas redes gen´eticas funcionales. Se aleja, por
ejemplo, de la ingenier´ıa gen´etica en tanto que la mayor´ıa de estructuras
usa-das pasan a cumplir funciones completamente diferentes a las que cumpl´ıan
en sus organismos de origen.
Las aplicaciones de la Biolog´ıa Sint´etica son incalculables. Hoy en d´ıa se
desarrollan proyectos en temas de Medio Ambiente, de Medicina, de
Alimen-tos, de Energ´ıas, por nombrar algunos. Uno de los problemas mas grandes
que enfrentan los desarrolladores de nuevos organismos es la falta de robustez
y control sobre los sistemas debido a los altos niveles de ruido que presentan.
Por esta raz´on, se hace necesario el estudio y entendimiento de dicho ruido;
Este trabajo tiene como objetivo presentar un repaso sobre los principales
temas y t´ecnicas anal´ıticas y num´ericas concernientes al ruido y las
estadifi-cas de las mol´eculas involucradas en la Expresi´on Gen´etica. Se presentan los
m´etodos b´asicos y mas usados haciendo uso de unmodelo de juguete de la
Ex-presi´on Gen´etica. Posteriormente, se realizan algunas consideraciones sobre
los sub-procesos que conforman la Expresi´on Gen´etica en su totalidad. Dichas
consideraciones ayudan a ejemplificar, por un lado, las distintas formas en
las que la c´elulas logran controlar el ruido, y por otro, algunos fen´omenos que
otorgan fluctuaciones fundamentales a las mol´eculas involucradas. Sumado
a esto, se presentan simulaciones computacionales que permiten visualizar y
corroborar algunos de los resultados anal´ıticos mencionados.
Este documento est´a pensado como un texto pedag´ogico para cualquier
estudiante de pregrado en f´ısica1 e interesado en Biof´ısica, espec´ıficamente en modelos estoc´asticos de la Expresi´on Gen´etica. Contiene algunos Ap´endices
en los que se tratan temas generales que ayudan a comprender muchas de las
herramientas usadas en el estudio de la misma. Espero sea de su agrado y se
cumplan mis objetivos.
Cap´ıtulo 2
Ruido Intr´ınseco en la
Expresi´
on Gen´
etica
Para el estudio del ruido intr´ınseco y de la estad´ıstica de las mol´eculas
involucradas en la expresi´on gen´etica, empezaremos por trabajar sobre el
modelo mas sencillo posible. ´Este consistir´a de un n´umero fijo de secuencias
de un gen en la c´elula, de los cuales, mediante el proceso de transcripci´on,
se producen ARN mensajeros (ARNm, r) a una tasa constante kr. A su vez, en los Ribosomas se traducen las prote´ınas (p) a una tasa kp por el n´umero de ARNm. Sumado a esto, los ARNm y las prote´ınas se degradan a
tasas efectivas γr y γp respectivamente (Figura 2.1). A medida que avanza el trabajo, agregaremos nuevas consideraciones al modelo. Estas nos permitir´an
recrear y entender algunos procesos que ocurren en las diferentes etapas de
Figura 2.1: Modelo Simple para la Expresi´on Gen´etica
Para realizar el an´alisis determinista asumiremos las mol´eculas de ARNm
y las prote´ınas como funciones del tiempo: r(t) y p(t). Seg´un la Figura 2.1
, podemos escribir las siguientes ecuaciones diferenciales para modelar el
proceso:
˙
r(t) = kr−γrr (2.1a)
˙
p(t) =kpr−γpp (2.1b)
En estado estacionario, tenemos que los valores para el n´umero de mol´
ecu-las de ARN y prote´ınas son
r0 =
kr
γr
(2.2a)
p0 =
krkp
γrγp
2.1.
Primer acercamiento a un an´
alisis estoc´
asti-co
Como ya hemos mencionado, la expresi´on gen´etica es un proceso
funda-mentalmente estoc´astico. Por esta raz´on, es importante realizar un estudio
de sus caracter´ısticas asumiendo sus componentes (ARNm, Prote´ınas, etc)
como variables aleatorias. El siguiente paso es darle una interpretaci´on a las
tasas de creaci´on y degradaci´on del modelo determinista.
Supongamos que tenemos una tasa k de ocurrencia de un evento
(produc-ci´on, degradaci´on, interacci´on, etc). En un tiempo lo suficientemente largo
L el numero de eventos ocurridos en promedio ser´a kT. Ahora dividamos
este intervalo en N intervalos mas peque˜nos. Cada intervalo es de longitud T
N. Ahora tenemos que la proporci´on de eventos en cada intervalo mas pe-que˜no es kT
N. Si hacemos N tender a infinito, definimos dt = l´ımN→∞ T N y normalizamos correctamente, podemos entender la expresi´on kdt como la
probabilidad de ocurrencia del evento en el intervalo dt. En este sentido, k
es entendido como una cierta densidad de probabilidad. Esto ultimo nos
per-mitir´a escribir una ecuaci´on que nos de la probabilidad de tener un numero
2.1.1.
Ecuaci´
on Maestra
Para nuestro modelo (Figura 2.1), la ecuaci´on maestra para los ARNm y
las proteinas tendr´a la siguiente forma (Ver Ap´endice B):
˙
Pr,p(t) =−Pr,p(t)(kr+γrr)−Pr,p(t)(kpr+γpp) +Pr−1,pkr+Pr+1,pγr(r+ 1) +Pr,p−1kpr+Pr,p+1γp(p+ 1)
(2.3)
Con esta ecuaci´on tenemos dos opciones: Hallar los momentos y cumulantes
de Pr,p(t) sin necesidad de resolver completamente para la distribuci´on o resolver completamente la ecuaci´on para Pr,p(t). Por lo general, la primera opci´on es mas accesible y la segunda tiene a ser dif´ıcil de abordar. En el caso
de nuestro modelo trabajaremos en las dos, en el estado estable del sistema.
Momentos y Cumulantes en el estado estable
Recordemos la definici´on para la funci´on generadora de Momentos
F(z1, z2, ..., zn, t) =
X
n1,n2,...,nN
zn1
1 z n2
2 ...z nN
N Pn1,n2,...,nN(t), (2.4)
en dondeni son lasN variables aleatorias de nuestro sistema y la suma corre sobre todos los valores que cada uno puede tomar (de 0 a ∞). Esta funci´on
tiene las siguientes propiedades:
F
z1,z2,...,zN=1
= 1 (2.5a)
∂F ∂zi
z1,z2,...,zN=1
=hnii (2.5b)
∂2F ∂zi∂zj
z1,z2,...,zN=1
Para nuestro sistema, la funci´on generadora de momentos esta dada por:
F(r, p, t) =X r,p
zrrzppPr,p(t) (2.6)
Partiendo de la Ecuaci´on 2.3, podemos encontrar la derivada de la funci´on
ge-neradora de momentos para nuestro sistema. Multiplicando por las variables
zni
i y sumando sobre todos los valores de los ni tenemos [9], ˙
F(r, p, t) = kr(zr−1)F+kpzr(zp−1)
∂F ∂zr
−γr(zr−1)
∂F ∂zr
−γp(zp−1)
∂F ∂zp
(2.7)
En el estado estable, ˙F(r, p, t) = 0, tenemos,
0 =kr(zr−1)F +kpzr(zp−1)
∂F ∂zr
−γr(zr−1)
∂F ∂zr
−γp(zp−1)
∂F ∂zp
(2.8)
Ahora, podemos derivar la ecuaci´on 2.8 con respecto azr,
0 =kr
F + (zr−1)
∂F ∂zr
+kp(zp−1)
∂F ∂zr
+zr
∂2F
∂z2 r
−γr
∂F ∂zr
+ (zr−1)
∂2F ∂z2 r
−γp(zp −1)
∂2F ∂zrzp
,
(2.9)
y evaluar en zr =zp = 1. De esta manera obtenemos,
0 =kr−γrhri
hri= kr
γr
(2.10)
en dondehrisignifica el primer momento de la variabler en el estado estable.
Para obtener las fluctuaciones en el numero de RNAm volvemos a derivar la
ecuaci´on 2.9 con respecto a zr. Reescribamos ´esta ecuaci´on de la siguiente manera,
0 =kr
F + (zr−1)
∂F ∂zr
+
kpzr(zp−1)−γr(zr−1)
∂2F
∂z2 r +
kp(zp−1)−γr
∂F ∂zr
−γp(zp−1)
∂2F
∂zrzp
Ahora derivando con respecto a zr y reorganizando los t´erminos tenemos,
kr
− ∂F
∂zr
+ (1−zr)
∂2F
∂z2 r
−kr
∂F ∂zr
=kp(zp−1)
∂2F
∂z2 r
+zr
∂3F
∂z3 r
−γr
∂2F ∂z2 r
+ (zr−1)
∂3F ∂z3 r
+kp(zp−1)
∂2F ∂z2 r
−γr
∂2F
∂z2 r
−γp(zp−1)
∂3F
∂z2 r∂zp
(2.12)
Ahora evaluando en zr =zp = 1 obtenemos,
−2kr
r
=−2γr
r2 − r (2.13)
Reorganizando los t´erminos tenemos,
(−2kr−2γr)
r=−2γr
r2
. (2.14)
Utilizando el resultado de la ecuaci´on 2.10 para r tenemos,
r2
= 2kr+ 2γr 2γr
r
= 2kr+ 2γr 2γr
kr
γr
= (kr+γr)kr
γ2 r
. (2.15)
Entonces tenemos que las fluctuaciones en r son
r2
−
r2 = (kr+γr)kr
γ2 r − k 2 r γ2 r
= kr
γr
=δr2. (2.16) Para el caso de los ARNm, hemos demostrado que el promedio
r
es igual
a la varianza δr2. Debido a ´este resultado y al hecho de que la creaci´on y destrucci´on de mol´eculas de ARNm son procesos independientes en el
tiem-po, podemos pensar que la distribuci´on de probabilidad para r en el estado
estable es Poisson de la siguiente manera
Pr =
µr r!e
−µ
(2.17)
con µ= kr
γr. Vamos a ver que es posible mostrar este resultado solucionando la ecuacion 2.3 completamente para el estado estable.
Distribucion de probabilidad en el estado estable
En este momento es importante identificar que es posible escribir la
ecua-ci´on maestra para la distribuci´on de probabilidad de las mol´eculas de ARNm
de manera independiente a la correspondiente a prote´ınas. Esto debido a que,
en un gen constitutivo (no regulado), el n´umero de ARNm no depende del
n´umero de prote´ınas. En este sentido, podemos escribir la ecuaci´on maestra
para los ARNm de la siguiente manera
˙
Pr(t) = −Pr(t)(kr+γrr) +Pr−1(t)kr+Pr+1(t)γr(r+ 1). (2.18) En el estado estable tenemos,
0 = −Pr(kr+γrr) +Pr−1kr+Pr+1γr(r+ 1). (2.19) Si dividimos la ecuaci´on anterior por γr y usamos el resultado de la ecua-ci´on 2.10 tenemos
0 =−Pr(
r+r) +Pr−1
r+Pr+1(r+ 1). (2.20)
Reorganizando la ecuaci´on anterior tenemos
Prr−Pr−1
r=Pr+1(r+ 1)−Pr
r (2.21)
Esta ´ultima ecuaci´on debe ser verdad para todo r. Entonces podemos decir
que cada lado de la ecuaci´on debe ser igual a una constanteK.
Prr−Pr−1
r=K. (2.22)
Ahora sumando sobre todos los valores que toma r tenemos
X
r
Prr−
r X
r
ComoPr est´a bien normalizada, entonces tenemos
r−
r =K = 0. (2.24)
Utilizando la ecuaci´on 2.24 en la ecuaci´on 2.22 tenemos
Pr =
r
r Pr−1 =
r2
r(r−1)Pr−2 =
r3
r(r−1)(r−2)Pr−3 =...=
rr
r! P0 (2.25) Sumando la ecuaci´on 2.25 sobre todos los valores de r tenemos
X
r
Pr =P0
X
r
rr
r! (2.26)
El lado izquierda de la ecuaci´on anterior es igual a 1 por normalizaci´on y el
lado derecho es la series de potencias para la funci´on exponencial. Entonces
tenemos que P0 =e
−r
y por ende tenemos
Pr =
rr r! e
−r
(2.27)
Reconocemos la expresi´on de la ecuaci´on2.27 como una distribuci´on de
Pois-son y esto concuerda con lo encontrado en la ecuaci´on 2.17.
2.1.2.
Ecuaci´
on de Langevin
Otra forma de encontrar las propiedades de sistemas estoc´asticos es el
m´etodo de la ecuaci´on de Langevin. Este formalismo fue introducido por P.
Langevin poco despu´es de que A. Einstein hiciera su trabajo sobre
movimien-to Browniano, como m´etodo alternativo para obtener los mismos resultados.
El m´etodo consiste en adicionar un t´ermino de ruido a las ecuaciones
a las ecuaciones 2.2. De esta manera, obtenemos las siguientes ecuaciones,
˙
r(t) = kr−γrr+qrr (2.28a) ˙
p(t) =kpr−γpp+qpp (2.28b)
ε(t) = 0 ; ε(t)ε(t+τ) =δ(τ). (2.28c)
La ecuaci´on 2.28c nos presenta las caracter´ısticas que imponemos al ruido
en el problema. En este caso, las condiciones son las de ruido blanco1. Para empezar el an´alisis, definiremos la variable δr = r− < r > que representa
la distancia de la variable aleatoria r de su valor promedio. Derivando esta
expresi´on tenemos lo siguiente
˙
δr = ˙r−< r >˙ = (kr−γrr+qrr)−(kr−γr< r >) = −γrδr+qrr, (2.29)
˙
δr+γrδr =qrr. (2.30)
A continuaci´on, procederemos a resolver esta ecuaci´on diferencial usando la
transformada de Fourier. Transformando la ecuaci´on 2.30 tenemos
iωδrˆ(ω) +γrδrˆ(ω) =qrˆr(ω). (2.31)
ˆ
δr(ω) = qrˆr(ω)
iω+γr
. (2.32)
1El ruido blanco se caracteriza porque la variable aleatoria no posee ning´un tipo de
correlaci´on estad´ıstica en el tiempo. Muchos procesos estoc´asticos pueden tener como caracter´ıstica ruido blanco y por esta raz´on el hecho de imponer este tipo de ruido no determina las caracter´ısticas estad´ısticas del proceso en su totalidad.
Tomando el cuadrado de la normal y luego el valor promedio de la expresi´on
anterior tenemos
<|δrˆ(ω)|2 >=< qrˆr(ω) iω+γr
qrˆr(ω)
−iω+γr
> (2.33a)
= q
2 r
ω2+γ2 r
<ˆr(ω) ˆr(ω)> (2.33b)
Ahora tomamos la transformada inversa para obtener lo siguiente
< δr2 >= 1 2π
Z
R q2
r
ω2+γ2 r
eiωtdω (2.34)
Esta integral puede ser evaluada ent = 0 por el teorema de Wiener-Khintchine [10].
Tenemos entonces
< δr2 >= 1 2π
Z
R qr2 ω2+γ2
r
dω = q 2 r 2γr
(2.35)
Como ya demostramos que la variableren estado estable sigue una
distribu-ci´on de Poisson2 (Ecuaci´on 2.27), entonces tenemos que < δr2 >= < r >¯ = kr
γr y por tanto
q2 r 2γr
= kr
γr
(2.36)
lo que implica que
qr2 = 2kr. (2.37)
2Esta propiedad del sistema no se deriva del proceso realizado en esta secci´on y por
tanto no es una consecuencia de la ecuaci´on de Langevin tal y como fue planteada al inicio de la secci´on. Tambi´en es importante agregar que aunque la variablerfue tomada como continua durante el desarrollo, las propiedades encontradas son v´alidas para el proceso que pretendemos modelar (variable discreta y definida positiva) gracias a la generalidad de la ecuaci´on de Langevin y del ruido blanco.
La importancia de este ´ultimo resultado esta en que qr describe la fuerza del ruido impuesto en la ecuaci´on de Langevin y hemos demostrado que este
caso es proporcional a la constante de producci´on de mol´eculas de ARN kr.
2.1.3.
M´
etodos especiales para c´
alculo de ruido de un
sistema
A partir de lo aprendido en las secciones anteriores, en esta secci´on
dis-cutiremos un m´etodo especial que nos permite encontrar las caracter´ısticas
estad´ısticas de los sistemas estudiado. Dicho m´etodo nos entrega una
gene-ralizaci´on a procesos de n “especies” que interactuan mediante reacciones
qu´ımicas y en donde la cantidad xi de cada “especie” cambia en el tiempo por medio de procesos de creaci´on y degradaci´on.
Empecemos el an´alisis suponiendo un sistema compuesto por n“especies”
y representemos el vector estado del sistema como~x= (xq, ..., xn). Dado esto, podemos escribir la ecuacion maestra del sistema de la siguiente manera:
∂tP(~x, t) =
X
k
rk(~x−~sk)P(~x−~sk)−rk(~x)P(~x) (2.38)
en donde rk son las diferentes reacciones que ocurren, ~sk es el vector que representa el tama˜no del salto en cada “especie” debido a lak−´esima reacci´on
y P la distribuci´on de probabilidad del n´umero de las n “especies”.
Podemos definir los flujos cambio de la i−´esima “especie” de la siguiente
manera
Ji =Ji+−J
−
i =
X
k
y la matriz de covarianzas como
Cij =Cov(xi, xj). (2.40) Multiplicando por~xla ecuaci´on 2.38, sumando sobre todo los valores posibles
de~x y usando la definici´on de la ecuaci´on 2.39 tenemos lo siguiente
X
~ x
∂t~xP(~x, t) =
X ~ x X k ~
xrk(~x−~sk)P(~x−~sk)−
X ~ x X k ~
xrk(~x)P(~x)
(2.41a)
∂th~xi=
X
~ x
X
k
(~x+~sk−~sk)rk(~x−~sk)P(~x−~sk)−
X ~ x X k ~
xrk(~x)P(~x)
(2.41b)
∂th~xi=
X
k
X
~x
~skrr(~x)P(~x) (2.41c)
∂th~xi=
* X
k
~skrr(~x)
+
(2.41d)
∂th~xi=
D
~
JE. (2.41e)
De manera similar, usando las ecuaciones 2.38, 2.39 y 2.40 podemos
de-ducir la siguiente expresi´on
∂tC =
J(~x− h~zi)T +
(~x− h~zi)JT
+hBi (2.42)
en donde Bij =
P
ks k
iskjrk(~x). La ecuaciones 2.41e y 2.42 gobiernan la evoluci´on temporal de los valores promedios y las covarianzas del sistema
de las n “especies”.
Cuando las tasas de reacci´on son lineales en las variables de estado,
pode-mos escribir la matriz total de flujos de cambio como
en donde la matriz K es la matriz Jacobiana para los cambios en los valores
promedio. Definiendoηij = Cij
(hxiihxji) se puede demostrar la siguiente ecuaci´on
M η+ηMT =D (2.44)
en donde D es la versi´on normalizada de B y M es una versi´on normalizada
de K. Estas matrices dependen tanto de las tasas de reacci´on rk como de los tama˜nos de cambio en dichas reacciones~sk. Para nuestro caso de estudio, en donde supondremos que la creaci´on y destrucci´on de mol´eculas sucede de
una en una, entonces podemos encontrar que
Dij = 2
τihxii
(2.45a)
Mij =
Hij
τi
(2.45b)
Hij =
∂ln Ji−/Ji+ ∂lnxj
. (2.45c)
Teniendo estos resultados podemos investigar el caso mas sencillo de
nues-tro modelos de la Figura 2.1. En este caso tenemos las siguientes reacciones:
r kr
−−→r+ 1 (2.46a)
r−γ−r→r r−1 (2.46b)
p−−→kpp p+ 1 (2.46c)
en dondeγi = τ1i. A partir de las reacciones 2.46 podemos definir los siguientes flujos de cambio:
Jr+=kr (2.47a)
Jr−=γrr=
r τr
(2.47b)
Jp+=kpr (2.47c)
Jp−=γpp=
p τp
. (2.47d)
Dado estos flujos de cambio, se puede verificar f´acilmente lo siguiente
D=
2 τrhri 0
0 τph2pi
H =
1 0
−1 1
M =
1 τr 0
−1 τp
1 τp
. (2.48)
Usando estos resultados y la ecuaci´on 2.44 tenemos
M η+ηMT =D (2.49a)
1 τr 0
−1 τp 1 τp
ηrr ηrp
ηpr ηpp
+
ηrr ηrp
ηpr ηpp
1 τr −
1 τp 0 τ1
p = 2 τrhri 0
0 τph2pi
.
(2.49b)
Esto anterior nos entrega el siguiente sistema de cuatro ecuaciones:
ηrr
τr + ηrr
τr
= 2
τrhri
(2.50a)
−ηrr
τp
+ηrp
τp
+ηpr
τr
= 0 (2.50b)
ηpr
τr
− ηrr
τ2 +ηrp
τp
= 0 (2.50c)
−ηrp
τp
+ηpp
τp
− ηpr
τp
+ηpp
τp
= 2
τphpi
. Como podemos ver, de las cuatro ecuaciones 2.50, solo tres son
indepen-dientes. La ecuaciones 2.50b y 2.50c son la misma. Esto debido al car´acter
sim´etrico de la ecuaci´on matricial 2.44. A partir de la ecuaci´on 2.50a tenemos
que
ηrr ≡ηr = 1
hri. (2.51)
Sumado a esto, de la ecuaci´on 2.50b tenemos que
ηrp =
ηr
τp 1
1 τp +
1 τr
=
1
hri
τr
τr+τp
. (2.52)
Por ´ultimo, de la ecuaci´on 2.50d tenemos que
ηpp≡ηp = 1
hpi +ηrp =
1
hpi+
1
hri
τr
τr+τp
(2.53)
Como podemos ver, la ecuaci´on 2.51 corresponde al ruido t´ıpico de una
varia-ble aleatoria con distribucion de Poisson, lo cual concuerda con lo encontrado
anteriormente para las mol´eculas de ARN. Para el caso de las proteinas,
te-nemos un ruido que nos muestra que en este caso, la variable se distribuye de
forma mas dispersa que una distribuci´on de Poisson. Como ya hemos
anali-zado, esta diferencia se debe al ruido heredado de las mol´eculas de ARN, al
estar estas tambi´en descritas por un proceso estoc´astico, y tiene en cuenta la
diferencia en los tiempos de vida media de las dos “especies”.
2.2.
Consideraciones sobre el proceso de
Trans-cripci´
on
La transcripci´on es el proceso mediante el cual se producen mol´eculas de
de-pende de variables como el encuentro aleatorio de la Enzima ARN Polimerasa
con el lugar correcto del ADN (Promotor), la probabilidad de interacci´on de
estos dos, factores de transcripci´on reguladores, entre otro. En el caso mas
sencillo analizado anteriormente, tenemos una tasa constantekr de produc-ci´on de mol´eculas de ARNm la cual puede se pensada como una tasa efectiva
que promedia todas las fluctuaciones producidas por los pasos intermedios
mencionados. Sin embargo, vale la pena estudiar el efecto de estos distintos
procesos sobre las caracter´ısticas estad´ısticas de lo n´umero de mol´eculas. En
esta secci´on, exploraremos algunos de los proceso que pueden afectar
consi-derablemente el ruido y dem´as propiedades estad´ısticas de nuestro sistema.
2.2.1.
Ruido Telegr´
afico
3Existen prote´ınas que pueden regular la afinidad del ADN para ser trans-crito. Pueden tanto favorecer (activadores) como desfavorecer (represores) el
proceso de transcripci´on. Usualmente, estas fluctuaciones son promediadas
debido a que se asume que la escala temporal en la que ocurren las
transi-ciones de estado de la regi´on operadora del ADN son muy peque˜nas. Esto
permite asumir el estado del ADN como estable en el tiempo. Normalmente,
este an´alisis nos conduce a la conocida ecuaci´on de Hill,
1
1 + (KX)n. (2.54)
3Esta secci´on est´a basada en el articulo de Thomas B. Kepler and Timothy C.
Els-ton [11]. Se han reproducido los c´alculos y las simulaciones para corroborar los resultados. Sumado a esto, se ha ampliado el an´alisis para incluir el ruido por las fluctuaciones de los factores de transcripci´on antes de considerar las fluctuaciones en la regi´on operadora del promotor.
la cual modela el tiempo promedio que el ADN pasa activo (o inactivo) en
funci´on de la concentraci´on de la mol´ecula reguladora X. De esta manera, es
posible modelar la tasa de producci´on de ARN de un gen en funci´on de su
mol´ecula reguladora. (Ver Figura 2.2).
Figura 2.2: Funci´on de Hill para distintos par´ametros.K = 4000,n = 2,4,6,8
Sin embargo, si las fluctuaciones en la regi´on operadora no ocurren lo
sufi-cientemente r´apido, el tiempo que ´esta pasa en cada uno de los estados puede
alejarse bastante de la curva de Hill. Por esta raz´on, es necesario estudiar el
proceso de activaci´on y desactivaci´on del ADN, y de esta manera,
encon-trar sus consecuencias sobre la estad´ıstica del n´umero de ARN y prote´ınas
correspondiente.
Podemos considerar entonces un modelo en el cual el ADN puede fluctuar
entre un estado activo a un inactivo a una tasa constante Kh1 y del estado inactivo al activo a una tasa constante Kh0. Se tiene como condici´on que
kr1, y en el estado inactivo se producen ARNm a una tasa constantekr0. (Ver Figura 2.3). (Que pasa cuando se asume tasas de transici´on r´apidas entre los
dos estados).Las mol´eculas de ARNm se degradan a una tasa efectiva γr. Ahora nos concentraremos en entender el rol que juegan las fluctuaciones
de la regi´on operadora en el proceso de transcripci´on y c´omo afectan la
estad´ıstica del n´umero de ARNm.
Figura 2.3: Esquema que muestra dos distintos estados de la regi´on operadora
del promotor en el ADN.
Para empezar, podemos plantear las siguientes ecuaciones para la
evo-luci´on en el tiempo (Ver Ap´endice B) de la distribuci´on conjunta de
pro-babilidad Ps
r(t) del n´umero de ARNm y el estado del operador. En este caso, tenemos la variable r que representa el n´umero de ARNm y la
s ={0 = inactivo,1 =activo}.
dPr0(t)
dt =−(Kh0+γrr+kr0)P
0
r +Kh1Pr1+kr0Pr0−1+γr(r+ 1)Pr+10 (2.55a)
dP1 r(t)
dt =−(Kh1+γrr+kr0)P
1
r +Kh0Pr0+kr1Pr1−1+γr(r+ 1)Pr+11 (2.55b)
La ecuaci´on 2.55 puede ser escrita de forma mas compacta como
dPs r(t)
dt =krs
Prs−1−Prs
+γr
(r+1)Pr+1s −rPrs
+K
hsˆPrˆs−hsPrs
(2.56)
en donde ˆs= (s+ 1)mod1. Para cada estado del operador, podemos definir los momentos parciales estad´ısticos as´ı
rns=X r
rnPrs (2.57)
Lo momentos totales podemos definirlos como la suma de los momentos
par-ciales pesados por las probabilidades de estar en cada uno de los estados.
Para calcular estas probabilidades podemos hacer el siguiente an´alisis:
Su-pongamos que tenemos la siguiente reacci´on,
O0 −)−−Kh−−*−o
Kh1
O1 (2.58)
De la ecuaci´on anterior podemos escribir el cambio en el tiempo para O0 de la siguiente forma
˙
O0 =Kh1O1−Kh0O0 (2.59a)
La ecuaci´on 2.59b es la condici´on de normalizaci´on. En estado estable y
haciendo uso de la normalizaci´on tenemos lo siguiente
O0h0 =O1h1 (2.60a)
O0h0 = (1−O0)h1
O0 =
h1
h1+h0
=h1 (2.60b)
Podemos realizar el mismo an´alisis y encontrar queO1 =h0. De esta manera, ulizando la ecuaci´on 2.60b podemos escribir los momentos totales como
rn=h1
rn0+h0
rn1 (2.61)
Calculemos el primer momento rns en el estado estable. Usando la ecua-ci´on 2.56, multiplicando todos los t´erminos por r y sumando sobre todos los
valores der tenemos
X
r
rdP
s r(t)
dt =krs
X
r
rPrs−1−X
r
rPrs
+γr
X
r
r(r+ 1)Pr+1s −X
r
r2Prs
(2.62a)
+K
hˆs
X
r
rPrsˆ−hs
X
r
rPrs
A partir de la ecuaci´on 2.62, podemos construir la siguiente ecuaci´on
su-mando y restando t´erminos
drs dt =krs
X
r
(r−1)Prs−1+X r
Prs−1−X
r
rPrs
+γr
X
r
(r+ 1)2Pr+1s −X
r
(r+ 1)Pr+1s −X
r
r2Prs
+K
hˆs
X
r
rPrsˆ−hs
X
r
rPrs
De la ´ultima ecuaci´on tenemos lo siguiente
drs dt =krs
rs+ 1−
rs
+γr
r2 s− r s− r2 s +K
hˆs
r
ˆ s−hs
r
s
(2.64a)
drs
dt =krs−γr
rs+Khˆs
rˆs−Khs
rs (2.64b)
De la ecuaci´on 2.61 tenemos que
drn
dt =h1 drn
0
dt +h0 drn
1
dt . (2.65)
Usando las ecuaciones 2.64b y 2.65 tenemos
dr
dt =hˆskrs−hsˆγr
rs+hsˆKhsˆ
rsˆ−hˆsKhs
rs
+hskrˆs−hsγr
rˆs+hsKhs
rs−hsKhˆs
rsˆ (2.66a) = (hsˆkrs+hskrˆs)−γr(hsˆ
rs+hs
rˆs) (2.66b)
Para cancelar los otros cuatro t´erminos se utiliza la ecuaci´on 2.60a. De esta
manera, utilizando la ecuaci´on 2.66b en el estado estable tenemos
0 =(hˆskrs+hshrˆs)−γr(hˆs
rs+hs
rsˆ)
hˆs
rs+hs
rˆs ≡
r = (hsˆkrs+hskrˆs)
γr
(2.67a)
De manera similar, podemos encontrar la varianza en el estado estable
obteniendo
σ2
r =hri+hshˆs
krs−krˆs
γr
2
γr
γr+K
Usando estos resultados calculamos el ruido para las mol´eculas de ARN como
η2 r =
σ2 r
hri2
= 1
hri +hshsˆ
γr
γr+K
krs−krˆs
hsˆkrs+hskrˆs
2
(2.69)
Como podemos ver, la expresi´on para el ruido de las mol´eculas de ARN
tiene el t´ermino t´ıpico de un proceso de Poisson
1
hri
. Adicional a esto,
apa-rece un t´ermino que incluye los par´ametros involucrados en las fluctuaciones
de la regi´on operadora del ADN. De la misma ecuaci´on, podemos ver que
cuando K >> 1, este t´ermino tiende a cero y recuperamos el proceso de
Poisson.
Los resultado ac´a obtenidos nos dan un indicio de que las fluctuaciones de
la regi´on operadora del ADN pueden llegar a ser considerables en el c´alculo
del ruido y las estadificas de mol´eculas de ARN y prote´ınas. Esto quiere decir
que la aproximaci´on por funci´on de Hill, en donde se promedian todas estas
fluctuaciones por el hecho ocurrir en una escala de tiempo mucho mas baja
que la vida media de mol´eculas de ARN y prote´ınas, no siempre es adecuada.
2.2.2.
Efecto de
Gestaci´
on
y transcripci´
on por r´
afagas
En la aproximaci´on mas sencilla, cada proceso de producci´on y
degrada-ci´on de mol´eculas de ARN es independiente de lo ocurrido en el pasado. En
este sentido, es posible demostrar que el tiempo que pasa entre la ocurrencia
de cada evento es una variable aleatoria continua distribuida
exponencial-mente.4
4Esta es la ´unica distribuci´on que cumple la condici´on de falta de memoria en el caso
En la mayor´ıa de los casos estudiados experimentalmente, se ha
encontra-do concordancia con distribuciones de Poisson para el n´umero de mol´eculas
resultantes de la transcripci´on. Sin embargo, existen algunos sistemas en los
que los intervalos de tiempo entre eventos no siguen una distribuci´on
expo-nencial. Esto se debe a que cada evento de transcripci´on requiere de varios
pasos intermedios, los cuales individualmente si pueden ser considerados
co-mo independientes del pasado. De manera mas espec´ıfica, existen casos en los
que la maduraci´on del ADN necesaria para ser transcrito requiere de varios
pasos intermedios que involucran la interacci´on de diferentes mol´eculas
com-plementarias que le permiten a la ARN Polimerasa elongar la nueva hebra
de ARN a partir del templado de ADN. Esto hace que el lapso de tiempo
entre eventos de transcripci´on sea la suma de distintos tiempo distribuido de
manera exponencial. Esto ultimo se traduce en una distribuci´on diferente de
exponencial para los lapsos de tiempo entre eventos de transcripci´on.
A continuaci´on realizaremos el an´alisis y la reproducci´on de los c´alculos
realizados por Pedraza et al. [12] Empezaremos el an´alisis pensando el
pro-blema de la siguiente manera: Supongamos que tenemos una sucesi´on de
eventos de creaci´on. Sea f(t) la distribuci´on de probabilidad de que ocurra
un evento de creaci´on en un tiempotdesde el ´ultimo evento. Seanel n´umero
de eventos de creaci´on desde t = 0. De esta manera, podemos decir que la
probabilidadP(t=T)dt de que ocurra un evento ent=T es igual af(T)dt.
det=T es igual a R0T f(t)dt. Usando esto podemos decir lo siguiente
P(n= 0|t =T) = P(t > T) = 1−
Z T
0
f(t)dt ≡1−F(T) (2.70a)
P(n= 1|t =T) = Z
t1
P(t=t1)P(t > T −t1)dt1 (2.70b)
= Z T
0
f(t1) (1−F(T −t1))dt1 =f ∗(1−F)|T. (2.70c)
La ecuaci´on 2.70a nos dice que la probabilidad de que la cantidad de eventos
ocurridos sea cero (n = 0) dado que el tiempo est =T es igual a la
probabi-lidad de que el evento ocurra en un tiempo posterior at=T, y por tanto es
simplemente el complemento deP(t < T). La ecuaci´on 2.70c nos dice que la
probabilidad de que la cantidad de eventos ocurridos sea uno (n = 1) dado
que el tiempo es t =T es igual la probabilidad de que ocurra un evento en
t=t1 y no ocurran ning´un otro evento ent > T−t1, todo esto sumado sobre todos los posibles valores parat1 entre 0 yT. La expresi´on a la derecha de la ´
ultima igualdad es el producto de convoluci´on entre las funcionesf y (1−F).
Siguiendo este razonamiento, y usando inducci´on se puede demostrar que
A continuaci´on, usando la transformada de Laplace, tenemos
L {f(t)}= ˆf(s) (2.72a)
L {F(t)}= ˆF(s) = 1
s
ˆ
f(s) (2.72b)
L {P(0|t)}= ˆP(0|s) = 1
s
ˆ
f(s) (2.72c)
L {P(n|t)}= ˆP(n|s) = ˆf(s) ˆP(n−1|t) (2.72d)
= ˆf(s) ˆf(s) ˆP(n−2|t) =...=fˆ(s) n
ˆ
P(0|s) (2.72e)
= 1
s
ˆ
f(s) n
1−fˆ(s) (2.72f)
Ahora procederemos a definir la funci´on generadora de momentosG(z, t)5 y su respectiva transformada de Laplace L {G(z, t)}= ˆG(z, s)
G(z, t) = ∞ X
n=0
znP(n|t) (2.73a)
ˆ
G(z, s) = ∞ X
n=0
znPˆ(n|s) = 1
s
1−fˆ(s) ∞ X
n=0
znfˆ(s)n (2.73b)
En donde usamos el resultado de la ecuaci´on 2.72f en la ecuaci´on 2.73b.
Como las propiedades interesantes de la funci´on generadora de momentos se
tienen cuando esta es evaluada en z = 1 y dado que ˆf 61, podemos escribir
la parte derecha de la ´ultima igualdad de la ecuaci´on 2.73b como una serie
geom´etrica, y por tanto tenemos
ˆ
G(z, s) = 1
s
1−fˆ(s)
1−zfˆ(s). (2.74)
5En la secci´on 2.1.1 usamos F para definir la funci´on generadora de momentos. Sin
embargo, en esta secci´on usamos G ya que F ya fue usada para otra definici´on en la ecuaci´on 2.70a
Ahora usaremos las propiedades de ˆG(z, s) para calcular algunas
propie-dades de la variable aleatoria n en el espacio de Laplace. Tenemos entonces
para hˆnis
hnˆis= ∂
∂z
ˆ
G(z, s)|z=1 = 1
s
1−fˆ(s)
1−zfˆ(s)2 ˆ
f(s)|z=1 (2.75a)
= 1
s
ˆ
f(s)
1−fˆ(s) (2.75b)
y para hnˆ2i
s− hnˆis tenemos
ˆ
n2s− hnˆis= ∂ 2
∂z2Gˆ(z, s)|z=1 (2.76a)
= 1
s
ˆ
f(s)1−fˆ(s)
1−zfˆ(s)
4 fˆ(s)2
1−zfˆ(s)
|z=1 (2.76b)
= 2
s
ˆ
f(s)2
1−fˆ(s)
2. (2.76c)
En este momento solo necesitamos de tomar la transformada inversa de
Laplace de estas expresiones para hallar la media y la varianza en el dominio
temporal. Sin embargo, nos enfrentamos con un problema: Por la definici´on
de la tranformada de Laplace fˆ(s) =R0∞f(t)e−stdt, vemos que ˆ
f(0) = Z ∞
0
f(t)dt= 1 (2.77a)
d ds
ˆ
f(s)|0 =
Z ∞
0
d dse
−stf(t)dt| s =−
Z ∞
0
tf(t)dt=− hti (2.77b)
d2
ds2fˆ(s)|0 =
Z ∞
0
d2 ds2e
−st
f(t)dt|s =
Z ∞
0
t2f(t)dt=t2 (2.77c) Por la ecuaci´on 2.77a tenemos que 1−fˆ(s) −→ 0 cuando s −→ 0 y
ecuaciones 2.75 y 2.76 divergen en este l´ımite. Para esto es necesario integrar
usando variable compleja y calcular los residuos a segundo y tercer orden en
s = 0. Se tiene entonces que6
hnit=L−1{hnˆis}= 1 2πi
I
est1 s
ˆ
f(s)
1−fˆ(s)ds (2.78a)
= t
hti +K1 (2.78b)
n2−nt=L−1
ˆ
n2−nˆs = 1 2πi
I
est2 s
ˆ
f(s) 2
1−fˆ(s)2
ds (2.78c)
= t 2
hti +
4t
hti
h
t2i 2hti2 −1
+ 2 1−ht
2i
hti2 +
3ht2i2 4hti4 +
ht3i 3hti3
!
.
(2.78d)
Teniendo estos resultados, podemos escribir una expresi´on para la varianza
como
σ2n=n2t− hni2t = t
hti
ht2i hti2 −1
+K2 (2.79)
Hasta el momento, el an´alisis solo ha incluido el efecto de tener una
dis-tribuci´on indeterminada de tiempos entre eventos de creaci´on sobre la
es-tad´ıstica del n´umero de dichos eventos. Como podemos ver, cuando dicha
distribuci´on es exponencial, caracter´ıstica de una taza constante de creaci´on,
las constantesK1yK2se hacen cero y se tiene simplemente queηt2 = σ2
t hti2 = 1. Este ser´ıa el caso l´ımite que se ha trabajado en los modelos mas simples de
transcripci´on.
6Los detalles del c´alculo de los residuos ser´an presentados en una nueva versi´on de este
Ahora, se incluir´a el efecto de tener transcripci´on por r´afagas (mas de una
mol´ecula por evento de creaci´on) y su efecto sobre la estad´ıstica de n´umero
de eventos y n´umero total de mol´eculas. Seabla variable aleatoria que define
el tama˜no de la r´afaga en cada evento de creaci´on. Definimos la variable
aleatoria x como
x= n
X
i=o
bi (2.80)
en donde el l´ımite superior de la suma n representa la cantidad de eventos
de creaci´on que han ocurrido. Podemos definir as´ı la probabilidad de tener
un total dea mol´eculas creadas de la siguiente manera
Px(x=a) =
∞ X
n=0
Px(x=a|n)P(n). (2.81)
Sumado a esto, podemos definir la funci´on caracter´ıstica R(r) como
R(r) =hexrix = ∞ X
a=0
exrPx(x=a) (2.82a)
= ∞ X a=0 ∞ X n=0
exrPx(x=a|n)P(n) (2.82b)
= ∞ X
n=0
hexrix|nP(n) = ∞ X
n=0
ebrbnP(n) (2.82c)
= ebrbn
e (2.82d)
En dondehib significa el promedio con respecto a la distribuci´on de tama˜nos de r´afagas yhiesignifica el promedio con respecto a la distribuci´on de n´umero de eventos. La segunda igualdad en la ecuaci´on 2.82c est´a justificada ya que
al expresarx como la suma de las variables bi, la exponencial pasa a ser una productoria y en donde cada factor esta igualmente distribuido y por eso el
promedio sera el mismo. A continuaci´on, usaremos las siguientes propiedades
interesantes de la funci´on caracter´ıstica
hxi= d
drR(r)|r=0 (2.83a)
x2 = d
2
dr2R(r)|r=0 (2.83b) y las aplicaremos al resultado obtenido en la ecuaci´on 2.82d. De esto
obte-nemos
hxi= d
dr
ebrbn
e|r=0 =
D
n ebrbn−1bebrE
e
|r=0 (2.84a)
=hnhbibie =hniehbib (2.84b)
x2 = d 2 dr2 ebr b n
e|r=0 (2.84c)
= D
n(n−1) ebrbn−2 bebrb2+n ebrbn−1b2ebrb
E
e|r=0 (2.84d)
=(n2−n)e(hbib)2+hnie
b2b. (2.84e)
Usando los resultados de las ecuaciones 2.84b y 2.84e podemos calcular
σx2 =hx2i − hx2i2
σ2x=(n2−n)e(hbib)2+hnie
b2b− hni2ehbi2b (2.85a) = n2− hni2
hbi2+ b2− hbi2
hni (2.85b)
=σn2hbi2+σ2bhni. (2.85c) Ahora podemos calcular el ruido ηx2 = σx2
hxi2 usando los resultados anteriores
η2x= σ 2 nhbi
2 (hniehbib)2 +
σ2 b hni
(hniehbib)2 (2.86a) =η2n+ η
2 b
Si consideramos tiempos largos t para el proceso, podemos decir que el
pro-medio para la variablex es aproximadamente el promedio de la variable que
representa el tama˜no de la r´afaga de creaci´onb por la cantidad de intervalos
(hxi = hbi t
hti).Usando los resultados de las ecuaciones 2.78 y 2.79 tenemos que
ηn2 = σ 2 n
hxi2 =
ηt2
hni (2.87)
Usando las ecuaci´on 2.86b y 2.87 tenemos
ηx2 = η 2 t
hni+
η2b
hni =
hbi(ηt2+ηb2)
hxi (2.88)
Hasta ahora, este an´alisis corresponde exclusivamente a un proceso de
creaci´on de mol´eculas. Ahora se incluir´an los procesos de degradaci´on para
completar el an´alisis. Para esto consideraremos un procesos de divisi´on
celu-lar y lo modecelu-laremos mediante un proceso de partici´on binomial instant´aneo.
Si inicialmente se tenian y mol´eculas en la c´elula, podemos escribir la
pro-babilidad de tener x 6 y mol´eculas en una fracci´on r del volumen original
como
P(x|y) =
y x
rx(1−r)y−x. (2.89)
Ahora definamosPAr(y) como al probabilidad de tenery mol´eculas antes de la divisi´on y PDr(x) como la probabilidad de tener x mol´eculas despu´es de la divisi´on. Si fijamos la fracci´onr del volumen inicial total tenemos:
PDr(x) =
∞ X
y=0
P(x|y)PAr(y) =
∞ X y=0 y x
Podemos definir la funci´on generadora de momentos para la distribuci´on
definida en la ecuaci´on 2.90 como
GDr(z) =
∞ X x=0 zx ∞ X y=0
P(x|y)PAr(y) (2.91a)
= ∞ X y=0 ∞ X x=0 y x
(zr)x(1−r)y−xPAr(y) (2.91b)
= ∞ X
y=0
(zr+ (1−r))yPAr(y). (2.91c)
Consideremos ahora un proceso de crecimiento de la c´elula, el cual
transcu-rre entre dos divisiones consecutivas. Como la probabilidad de creaci´on de
mol´eculas, en este caso, es independiente de n´umero actual de mol´eculas,
entonces la distribuci´on de probabilidad al final de esta etapa de crecimiento
PAr(x) ser´a la convoluci´on de la distribuci´on al principio del intervaloPDr(x) con la distribuci´on de probabilidad del proceso de creaci´on de mol´eculas
PCτ(x) ≡ PT ot(x)|t=τ. Debido a esto, utilizando el hecho de que la funci´on generadora de momentos de una convoluci´on de dos distribuciones es el
pro-ducto de las funciones de generadoras de momentos correspondientes tenemos
GAr(z) =GDr(z)GCτ(z). (2.92)
Para obtener los diferentes momentos de la distribuci´onPAr(x) procedemos a derivar y utilizar las propiedades de la funci´on generadora de momentos.
De esta manera, tenemos que
hxiAr = ∂
∂zPAr(x)|z=1 =
GDr(z)
∂
∂zGCτ(z) +GCτ(z) ∂
∂xGDr(z)
z=1 (2.93a)
Sumado a esto, tambi´en podemos calcular lo siguiente
hxiDr= ∂
∂zPDr(x)|z=1 = ∂ ∂z
∞ X
x=0
(zr+ (1−r))xPAr(x)|z=1 (2.94a)
= ∞ X
x=0
xrPAr(x) =rhxiAr. (2.94b)
Juntando los resultados de la ecuaciones 2.93 y 2.94 tenemos que el promedio
de mol´eculas antes de la divisi´on est´a dado por
hxiAr = hxiCτ
1−r (2.95)
y que el promedio de mol´eculas despu´es de la divisi´on est´a dado por
hxiDr = rhxiCτ
1−r =rhxiAr (2.96)
Para calcular las varianzas, utilizamos las segundas derivadas de las funciones
generadoras de momentos, obteniendo para las mol´eculas antes de la divisi´on
que
σAr = 1 1−r2σ
2 Cτ +
r
1 +rhxiAr (2.97)
y para las mol´eculas despu´es de la divisi´on que
σDr=
r2
1−r2σ 2 Cτ+
1
1 +rhxiDr. (2.98)
Calculando el ruido en ambos instantes como ηx = σ
2
x
hxi tenemos que
η2Ar = 1−r 1 +rη
2 Cτ+
r
1 +r
1
hxiAr (2.99a)
ηDr2 = 1−r 1 +rη
2 Cτ+
1 1 +r
1
hxiDr. (2.99b)
Para recrear el proceso de decaimiento continuo podemos utilizar los
tenemos que el n´umero promedio de mol´eculas creadas corresponde al n´
ume-ro pume-romedio que ser´an reemplazadas despu´es de la divisi´on. De acuerdo a
esto tenemos
hxiCτ =hxiAr(1−r). (2.100)
Utilizando la ecuaci´on 2.100 en la ecuaci´on 2.88 tenemos
η2Cτ = hbi(η 2 t +η2b)
hxiCτ =
1 1−r
hbi(ηt2+ηb2)
hxiAr . (2.101)
En este l´ımite, tambi´en tenemos que
l´ım
r−→1hxiDr= l´ımr−→1rhxiAr ≡ hxi (2.102)
. El resultado final que queremos es el ruidoη2 del n´umero de mol´eculas justo antes de la divisi´on en el l´ımite cuandor −→1. Utilizando la ecuaciones 2.99a
y 2.101 tenemos entonces
η2 = l´ım r−→1η
2
Ar = l´ım r−→1
1 1 +r
hbi(η2t +η2b)
hxiAr +
r
1 +r
1
hxiAr (2.103a)
= hbi(η 2
t +ηb2) + 1
2hxi . (2.103b)
La ecuaci´on 2.103b nos muestra el t´ermino de ruido introducido a un proceso
de creaci´on y destrucci´on debido a procesos degestaci´ony creaci´on por medio
Figura 2.4: A. Se muestra una simulaci´on en donde se presentan las variables
aleatoriasT y b, la cuales representan los efectos degestaci´on y creaci´on por
r´afagas. B. Se muestra un proceso real en el cual el ADN en S. cerevisiae
requiere de varios subprocesos para madurar y permitir que la Polimerasa II
realice la transcripci´on. Esto genera tiempos entre eventos de transcripci´on
que no se distribuyen exponencialmente. Sumado a esto, una vez se inicia
la transcripci´on, se produce una r´afaga de moleculas de ARN de tama˜no b
en un periodo corto de tiempo. Esto genera un efecto de transcripci´on por
r´afagas. [12]
2.3.
Consideraciones sobre el proceso de
Tra-ducci´
on
El resultado del proceso de Traducci´on son las prote´ınas, las cuales son
consideradas como las unidades estructurales y funcionales de las c´elulas.
Sumado a esto, las prote´ınas son las m´ınimas unidades usadas en los
ex-perimento que pretenden medir fluctuaciones de la expresi´on gen´etica de las
ume-ro de pume-rote´ınas son las mas importantes a estudiar.
El ruido sobre el nivel de prote´ınas es la suma de diferentes t´erminos
prove-nientes de todo el proceso de expresi´on gen´etica (ruido intr´ınseco) y algunos
provenientes de factores externos (ruido global). Sin embargo, en esta
sec-ci´on nos concentraremos en algunos hechos importantes sobre el proceso de
traducci´on y su efecto sobre las fluctuaciones sobre el nivel de prote´ınas.
En un primer acercamiento a la estad´ıstica de prote´ınas, es v´alido asumir
que, debido a la diferencia de escalas de tiempo, el n´umero de mol´eculas de
ARN permanece en su valor medio de manera constante. Esta visi´on del
pro-blema no presenta propro-blemas con el comportamiento del valor promedio del
n´umero de prote´ınas. Sin embargo, a la hora del c´alculo de las fluctuaciones,
aparecen algunos problemas. Volviendo a la ecuaci´on 2.2, podemos ver que,
si reemplazamos el valor de r en el t´ermino de producci´on de las prote´ınas
por su valor promedio< r >= kr
γr, reducimos el problema de la estad´ıstica del n´umero de prote´ınas al problema ya resuelto para el n´umero de mol´eculas de
ARN en la secci´on 2.1.1. Esto resultar´ıa en una distribuci´on de Poisson para
el n´umero de prote´ınas. Sin embargo, los resultados experimentales han
mos-trado que la cantidad de prote´ınas en una c´elula no sigue una distribuci´on
de Poisson. Esto ha llevado a diversos estudios mas detallados del proceso
de traducci´on en las c´elulas, los cuales han permitido entender mejor toda la
2.3.1.
Traducci´
on por R´
afagas
En este caso, usaremos nuevamente el modelo de expresi´on gen´etica de
la Figura 2.1, sin embargo, el an´alisis ser´a diferente. Como ya mencionamos
antes, es v´alido asumir el n´umero de mol´eculas de ARN en su estado estable
para ciertas escalas temporales. Sumado a esto, es importante tener en cuenta
el siguiente aspecto: Durante el tiempo de vida de una mol´ecula de ARNm,
´esta es traducida por los Ribosomas varias veces en prote´ınas. Este hecho
crea un efecto de producci´on de prote´ınas por r´afagas y afecta de manera
considerable las fluctuaciones del n´umero de ´estas. En esta secci´on
trabaja-remos sobre el art´ıculo de [13]. Reproducimos los c´alculos mas importantes
y analizamos los resultamos obtenidos.
Para empezar nuestro an´alisis, asumiremos que las mol´eculas de ARNm se
encuentran en estado estable. Esto se puede justificar ya que el tiempo medio
de vida de ´estas en mucho menor que el de las prote´ınas. En este sentido,
entenderemos la producci´on de prote´ınas como eventos aleatorios
indepen-dientes, en lo cuales se produce un n´umero distribuido exponencialmente de
mol´eculas (r´afagas). Esta distribuci´on exponencial del n´umero de prote´ınas
producidas en cada r´afaga ha sido observada experimentalmente [5] . En este
acercamiento al proceso de traducci´on, es importante distinguir dos
cantida-des. La primera esb= kp
γr
que puede ser entendida como el n´umero promedio
de prote´ınas producidas durante la vida media de una mol´ecula de RNAm.
La segunda cantidad es α = kr
γp
que representa el n´umero de r´afagas por
ciclo7. Por otro lado, en este caso resolveremos el problema para la variable
continua x(t) = Vp, en donde p corresponde al n´umero de prote´ınas y V al volumen de la c´elula. Seg´un lo anterior y el esquema de la Figura 2.1
tene-mos que la ecuaci´on maestra para la distribuci´on de probabilidadP(x, t) est´a
dada por8
∂P(x)
∂t = ∂
∂x[γpxP(x)] +kr
Z x
0
w(x, x0)P(x0)dx0 (2.104)
El primer t´ermino de la ecuaci´on 2.104 se refiere al cambio en de la
concen-traci´onxde prote´ınas debido a procesos como diluci´on, crecimiento celular o
degradaci´on. La informaci´on sobre estos procesos esta codificada en la
cons-tante efectiva γp. El segundo t´ermino se refiere a la creaci´on de prote´ınas mediante r´afagas. Tenemos que w(x, x0) = w(x|x0) −δ(x − x0), en donde
w(x|x0) representa la posibilidad de que luego de la r´afaga de producci´on la
concentraci´on de prote´ınas seaxdado que antes erax0. El t´ermino deδ(x−x0)
aparece por la producci´on de prote´ınas a partir de una concentraci´onxinicial.
Asumiremos que el tama˜no de la r´afaga de producci´on (x−x0) es
indepen-diente del estado actual de la concentraci´on x0 de prote´ınas y que sigue una
distribuci´onv(x, x0). Por esta raz´on, podemos escribirw(x, x0) =w(x−x0) =
v(x −x0)− δ(x− x0). Si ahora analizamos la ecuaci´on 2.104 en el estado
8Esta expresi´on resulta de llevar la Ecuaci´on Maestra t´ıpica del proceso a un l´ımite