Estadísticas y ruido intrínseco de la expresión genética

(1)

Universidad de Los Andes

Proyecto de Tesis de Pregrado

Estad´ısticas y Ruido Intr´ınseco

de la Expresi´

on Gen´

etica

Roberto Mor´

an Tovar

supervisado por

Juan Manuel Pedraza Leal Ph.D

(2)

(3)

´

_{Indice general}

1. Introducci´on 5

1.1. Motivaci´on . . . 10

2. Ruido Intr´ınseco en la Expresión Genética 13 2.1. Primer acercamiento a un análisis estocástico . . . 15

2.1.1. Ecuaci´on Maestra . . . 16

2.1.2. Ecuaci´on de Langevin . . . 20

2.1.3. M´etodos especiales para c´alculo de ruido de un sistema 23

2.2. Consideraciones sobre el proceso de Transcripci´on . . . 27

2.2.1. Ruido Telegr´afico . . . 28

2.2.2. Efecto de Gestación y transcripción por ráfagas . . . . 34

2.3. Consideraciones sobre el proceso de Traducci´on . . . 46

2.3.1. Traducci´on por R´afagas . . . 48

3. Simulaciones y An´alisis Num´erico 53

4. Conclusiones 65

(4)

Pois-son 69

B. Ecuaci´on Maestra 73

(5)

Resumen

La Expresión Genética puede definirse como el flujo de información desde

el ADN hasta las prote´ınas. El proceso consiste de una serie de reacciones

bioqu´ımicas, las cuales ocurren con cierta probabilidad. Esto hace que todo

el proceso sea fundamentalmente estoc´astico y, por ende, que sea necesario

abordar su estudio con el uso de herramientas probabil´ısticas. El modelo

mas simple consiste en un proceso de transcripci´on constante, un proceso de

traducci´on constante por numero de mol´eculas de ARN y tasas efectivas de

degradaci´on para las “especies” involucradas. En este trabajo se presentan

expresiones anal´ıticas para las distribuciones de probabilidad de las

“espe-cies” en el estado estable. Sumado a esto, se presentan modelos de ruido,

los cuales incluyen consideraciones especiales que hacen mas complejos los

(6)

Abstract

We can define the Genetic Expression as the flow of information from the

DNA to the proteins. The process consists of a series of biochemical

reac-tions that occur with some probability. This cause the whole process to be

fundamentally stochastic and for that reason is necessary to use probabilistic

tools to study it. The simplest model consists of a transcription process at

constant rate, a translation process at constant rate per ARN molecule and

finally, effective rates of degradation for the species involved in the process. In

this work, we present analytical expressions for the probability distributions

of the different species at the steady state. Additionally, we present models

of noise that take into account new considerations about the transcription

(7)

(8)

Agradecimientos

A mis padres por el apoyo incondicional en mi camino. A mi gu´ıa acad´

emi-co Juan Manuel Pedraza por todos sus emi-consejos y ayuda en mi formaci´on. A

Michael H¨ogele por sus comentarios y recomendaciones. A todas las

perso-nas que han hecho que mi paso por la Universidad haya sido un gran viaje a

(9)

(10)

Cap´ıtulo 1

Introducci´

on

Buscar leyes fundamentales de la naturaleza es tal vez uno de los

objeti-vos principales de la F´ısica. Encontrar principios que nos permitan entender

y predecir fen´omenos en el mundo en el que vivimos. Sumado a esto,

escri-birlos en el lenguaje de las matem´aticas, para los que nos reconocemos como

los herederos de las ideas de Galileo, es fundamental. Dentro de la f´ısica es

posible encontrar distintos campos que se especializan en distintas clases de

fen´omenos. Est´a la F´ısica de Part´ıculas Elementales, la F´ısica de la

Mate-ria Condensada, la F´ısica At´omica, la Astrof´ısica, la Biof´ısica, por nombrar

algunas.

En este momento, me gustar´ıa referirme al campo al cual pertenece este

trabajo: La Biof´ısica. Es tal vez el mas interdisciplinar de todos, pues se

comunica constantemente con distintas ciencias naturales como la Biolog´ıa, la

Microbiologia, la Qu´ımica, entre otras. Quiz´a por esta misma raz´on, muchas

(11)

desarrolla, e incluso, en algunas ocasiones, la consideran un campo de la

Biolog´ıa y no de la F´ısica. Debido a esto, me gustar´ıa introducir mi trabajo

de grado en F´ısica, explicando lo que considero como el campo de la Biofisica.

El estudio del fen´omeno de la vida por parte de los F´ısicos no es algo

nuevo; se conoce de trabajos en Biof´ısica desde el siglo XIX. Se podr´ıa decir

que el inicio del inter´es de los F´ısicos por la Biolog´ıa empieza intentando

entender el cuerpo humano, especialmente los ´organos de los sentidos. ´Areas

de la medicina, como la Fisiolog´ıa, se vieron beneficiadas por la incursi´on de

f´ısicos. Tal vez uno de los casos mas reconocidos es el del F´ısico Hermann

von Helmholtz, famoso por sus estudios en Electromagnetismo y la ecuaci´on

diferencial que lleva su nombre. Durante su vida, tambi´en incursion´o en el

campo de la Fisiolog´ıa y estudi´o la Ley de la Conservaci´on de la energ´ıa

en el metabolismo de los músculos y estableció leyes matemáticas para el

sentido de la vista, la percepci´on visual del espacio, la vision de colores,

entre otros temas relacionados con la luz y nuestra forma de percibirla [1].

Al igual que Herlmholtz, muchos otros f´ısicos, sobre todo del campo de la

termodin´amica, intentaron brindarle explicaciones a fen´omenos relacionados

con la vida desde una perspectiva de las leyes universales de la F´ısica y

haciendo uso del lenguaje de las matem´aticas.

Ya en el siglo XX, quiz´a el f´ısico mas recordado por hablar acerca del

fen´omenos de la vida fue el alem´an Erwin Schroedinger, el mismo creador de

la Mecánica Cuántica en su formulación de funciones de onda y famoso por

la ecuaci´on que lleva su nombre y gobierna la evoluci´on temporal en sistema

(12)

el libro titulado What is life? [2], Schroedinger abord´o el problema de la

vida y la gen´etica usando conceptos como entrop´ıa, cristales aperi´odicos,

energ´ıa, entre otros, propios de la mec´anica estad´ıstica y la termodin´amica.

Su trabajo fueron revolucionarios, no por sus resultados, sino por su enfoque

y perspectiva hacia el fen´omeno de la vida.

He nombrado estos ejemplo para mostrar c´omo ha sido la influencia de

la F´ısica en la Biolog´ıa, y principalmente, cu´al ha sido, es y debe ser la

forma en la que es vista la Biof´ısica. Los aportes han sido incalculables y

el entendimiento de la vida, vista incluso como un estado de la materia con

determinadas propiedades, ha crecido gracias al esfuerzo de f´ısicos que se

han dejado maravillar por el incre´ıble mundo de los seres vivos. Citando a

W. Bialek de su libro Biophysics, cuando habla sobre Bragg y su grupo de

investigación de la estructura de moléculas biológicas en Cambridge:

Para decir en pocas palabras una historia larga y gloriosa, ellos

lo lograron, incluso mas all´a del sue˜no mas osado de Bragg, y uno

de los art´ıculos cient´ıficos mas importantes de la biolog´ıa del siglo

XX fue escrito en un departamento de F´ısica [3].

Entre muchos de los fen´omenos de la vida que han interesado a los f´ısicos

en su labor cient´ıfica, he escogido la Expresi´on Gen´etica como objeto de

estudio de este trabajo. Por un lado, debido a que es el tema de experticia de

mi asesor. Por otro, dada su importancia, como proceso fundamental, en el

incre´ıble fen´omeno de la vida. Ocurre en todas las formas conocidas de vida

y es, salvo peque˜nas distinciones, el proceso mas universal que comparten los

(13)

La Expresión Genética, flujo de información desde el ADN hasta las

pro-te´ınas, es uno de los procesos fundamentales de la biolog´ıa molecular y ha

sido estudiada y caracterizada desde hace mediados del siglo XX. Este

proce-so est´a basado en reacciones bioqu´ımicas, las cuales dependen del encuentro

aleatorio de sus reactivos y cierta probabilidad de interacci´on entre ellos.

Por estas razones, podemos decir que la expresi´on gen´etica es un proceso

fundamentalmente estoc´astico.

Sumado al hecho de ser un proceso estoc´astico, tambi´en es un proceso que

involucra un bajo n´umero de copias de mol´eculas para su funcionamiento.

Generalmente, en una c´elula encontramos no mas de ocho copias de un gen

(ADN); por cada gen, el n´umero promedio de ARN mensajero (mARN) es

aproximadamente cinco copias y el de prote´ınas ronda las cinco mil copias.

Esto quieres decir que el tratamiento que debemos darle a esta clase de

sistemas difiere de, por ejemplo, la mayor´ıa de casos que encontramos en la

F´ısica Estad´ıstica, en donde el numero de part´ıculas en un sistema es del

orden del n´umero de Avogadro.

Este ´ultimo hecho, hace que sea de vital importancia el estudio de todas

las caracter´ısticas estoc´asticas de este proceso, ya que en muchos de los casos

las fluctuaciones se alejan bastante de los valores esperados y la descripci´on

determinista, la cual modela los comportamientos promedio de los sistemas,

no nos brinda informaci´on suficiente. Se hace necesario conocer los diferentes

momentos y cumulantes del sistema, para as´ı poder tener una descripci´on

(14)

Los valores promedio del n´umero de mol´eculas involucradas en este

pro-ceso (ADN, ARN, prote´ınas, etc) pueden ser modelados mediante el uso de

las ecuaciones diferenciales propias de la cin´etica molecular. En este sentido,

encontramos ecuaciones clásicas como la ecuación de dinámica enzimática

de Michaelis-Menten, la ecuaci´on de Hill, entre otras. Dichas ecuaciones nos

permiten modelar de manera apropiada el comportamiento promedio de los

procesos involucrados en la expresi´on gen´etica, sirviendo como primer

acerca-miento al estudio cuantitativo de ´esta. Por esta raz´on, es importante entender

su significado y cómo éstas se relacionan con los modelos estocásticos, objetos

de estudio de este trabajo.

El uso de modelos estoc´asticos no es nuevo en el estudio cuantitativo de

la expresión genética. Podemos encontrar estudios teóricos de la

estocastici-dad de este proceso desde 1970 [4]. Sin embargo, por mucho tiempo no fue

f´acil comprobar experimentalmente muchos de los resultados, ya que ´estos

requer´ıan poder observar en tiempo real las fluctuaciones de una celular

indi-vidual, o la cuantificación de la concentración de moléculas especificas en una

poblaci´on celular. Gracias a recientes avances experimentales en este

senti-do [5], hoy en d´ıa es posible medir estas cantidades y por eso ha retornasenti-do

el inter´es de muchos cient´ıficos al estudio cuantitativos de procesos a nivel

celular, como lo es la expresi´on gen´etica [6].

La F´ısica ha sido un gran actor en este proceso de entendimiento del

com-portamiento estocástico de la expresión genética. Concretamente, los m´

eto-dos usaeto-dos en la mec´anica estad´ıstica han sido aplicados de manera exitosa

(15)

involucradas en la expresi´on gen´etica. Como ejemplo, podemos encontrar el

uso del método de la ecuación maestra, el método de la ecuación de Langevin,

la ecuaci´on de Foker-Planck, la teor´ıa de colas, entre otras.

Dado lo anterior, este razonamiento f´ısico del problema se han

encontra-do con algunos restos, no muy comunes en la F´ısica, a la hora de proponer

modelos exitosos y fehacientes de la realidad. Dada la complejidad de los

sistemas biol´ogicos, la descripci´on de los procesos involucrados depende de

una gran cantidad de par´ametros. Por su lado, muchos los par´ametros

de-penden considerablemente de las condiciones globales en las que se encuentra

el sistema y por tanto sus fluctuaciones siguen modelos de ruido global. Por

el lado experimental, los retos est´an en que muchos de los par´ametros no

son ajustables al deseo del cient´ıfico y esto genera una incertidumbre mayor

en los resultados. Por otro lado, por el lado te´orico, uno de los principales

problemas radica en la pobre descripci´on disponible de los par´ametros.

1.1. Motivaci´

on

Una de las aplicaciones mas importantes a los modelos estoc´asticos de la

expresión genética es el entendimiento de fenómenos de diversidad fenot´ıpica

en poblaciones isogénicas. Dado el carácter estocástico de este proceso, c´

elu-las genéticamente idénticas dentro de una población pueden tener diferentes

cantidades de prote´ınas en un tiempo dado, incluso cuando sus condiciones

son las mismas. Esto, a su vez, genera diversidad fenot´ıpica en la poblaci´on y,

en algunos casos, es utilizado por las c´elulas para favorecer su supervivencia

(16)

mas importantes en este sentido es la persistencia bacteriana. Este fen´omeno

consiste en el repentino cambio de algunas bacterias de una poblaci´on a un

estado latente [8]. En ´este estado, al parecer, presentan niveles metab´olicos

lo suficientemente bajos como para evadir el efecto de Antibi´oticos. ´Este

re-pentino cambio podr´ıa deberse a las fluctuaciones en los niveles de prote´ınas

pertenecientes a sistemas de Toxina-Antitoxina. Esto les permite a las

bacte-rias tener diferentes estado fenot´ıpicos incluso siendo gen´eticamente iguales.

Sumado a esto, el entendimiento de los procesos biol´ogicos a nivel

molecu-lar y el proceso en t´ecnicas experimentales sofisticadas para el tratamiento y

la cuantificaci´on de procesos a nivel celular, han permitido el surgimiento de

la Biolog´ıa Sint´etica. Esta es una muy reciente ´area del conocimiento que se

mueve entre los campos de la f´ısica, la biolog´ıa, la qu´ımica y la ingenier´ıa. Su

principal objetivo es utilizar las partes que constituyen los circuitos gen´eticos

de los organismos para crear nuevas redes gen´eticas funcionales. Se aleja, por

ejemplo, de la ingenier´ıa gen´etica en tanto que la mayor´ıa de estructuras

usa-das pasan a cumplir funciones completamente diferentes a las que cumpl´ıan

en sus organismos de origen.

Las aplicaciones de la Biolog´ıa Sint´etica son incalculables. Hoy en d´ıa se

desarrollan proyectos en temas de Medio Ambiente, de Medicina, de

Alimen-tos, de Energ´ıas, por nombrar algunos. Uno de los problemas mas grandes

que enfrentan los desarrolladores de nuevos organismos es la falta de robustez

y control sobre los sistemas debido a los altos niveles de ruido que presentan.

Por esta raz´on, se hace necesario el estudio y entendimiento de dicho ruido;

(17)

Este trabajo tiene como objetivo presentar un repaso sobre los principales

temas y t´ecnicas anal´ıticas y num´ericas concernientes al ruido y las

estadifi-cas de las moléculas involucradas en la Expresión Genética. Se presentan los

m´etodos b´asicos y mas usados haciendo uso de unmodelo de juguete de la

Ex-presi´on Gen´etica. Posteriormente, se realizan algunas consideraciones sobre

los sub-procesos que conforman la Expresi´on Gen´etica en su totalidad. Dichas

consideraciones ayudan a ejemplificar, por un lado, las distintas formas en

las que la c´elulas logran controlar el ruido, y por otro, algunos fen´omenos que

otorgan fluctuaciones fundamentales a las mol´eculas involucradas. Sumado

a esto, se presentan simulaciones computacionales que permiten visualizar y

corroborar algunos de los resultados anal´ıticos mencionados.

Este documento est´a pensado como un texto pedag´ogico para cualquier

estudiante de pregrado en f´ısica1 _{e interesado en Biof´ısica, espec´ıficamente en} modelos estocásticos de la Expresión Genética. Contiene algunos Apéndices

en los que se tratan temas generales que ayudan a comprender muchas de las

herramientas usadas en el estudio de la misma. Espero sea de su agrado y se

cumplan mis objetivos.

(18)

Cap´ıtulo 2

Ruido Intr´ınseco en la

Expresi´

on Gen´

etica

Para el estudio del ruido intr´ınseco y de la estad´ıstica de las mol´eculas

involucradas en la expresi´on gen´etica, empezaremos por trabajar sobre el

modelo mas sencillo posible. Éste consistirá de un número fijo de secuencias

de un gen en la c´elula, de los cuales, mediante el proceso de transcripci´on,

se producen ARN mensajeros (ARNm, r) a una tasa constante kr. A su vez, en los Ribosomas se traducen las prote´ınas (p) a una tasa kp por el n´umero de ARNm. Sumado a esto, los ARNm y las prote´ınas se degradan a

tasas efectivas γr y γp respectivamente (Figura 2.1). A medida que avanza el trabajo, agregaremos nuevas consideraciones al modelo. Estas nos permitir´an

recrear y entender algunos procesos que ocurren en las diferentes etapas de

(19)

Figura 2.1: Modelo Simple para la Expresi´on Gen´etica

Para realizar el an´alisis determinista asumiremos las mol´eculas de ARNm

y las prote´ınas como funciones del tiempo: r(t) y p(t). Seg´un la Figura 2.1

, podemos escribir las siguientes ecuaciones diferenciales para modelar el

proceso:

˙

r(t) = kr−γrr (2.1a)

˙

p(t) =kpr−γpp (2.1b)

En estado estacionario, tenemos que los valores para el n´umero de mol´

ecu-las de ARN y prote´ınas son

r0 =

kr

γr

(2.2a)

p0 =

krkp

γrγp

(20)

2.1. Primer acercamiento a un an´

alisis estoc´

asti-co

Como ya hemos mencionado, la expresi´on gen´etica es un proceso

funda-mentalmente estoc´astico. Por esta raz´on, es importante realizar un estudio

de sus caracter´ısticas asumiendo sus componentes (ARNm, Prote´ınas, etc)

como variables aleatorias. El siguiente paso es darle una interpretaci´on a las

tasas de creaci´on y degradaci´on del modelo determinista.

Supongamos que tenemos una tasa k de ocurrencia de un evento

(produc-ción, degradación, interacción, etc). En un tiempo lo suficientemente largo

L el numero de eventos ocurridos en promedio ser´a kT. Ahora dividamos

este intervalo en N intervalos mas peque˜nos. Cada intervalo es de longitud T

N. Ahora tenemos que la proporci´on de eventos en cada intervalo mas pe-que˜no es kT

N. Si hacemos N tender a infinito, definimos dt = l´ımN→∞ T N y normalizamos correctamente, podemos entender la expresi´on kdt como la

probabilidad de ocurrencia del evento en el intervalo dt. En este sentido, k

es entendido como una cierta densidad de probabilidad. Esto ultimo nos

per-mitir´a escribir una ecuaci´on que nos de la probabilidad de tener un numero

(21)

2.1.1. Ecuaci´

on Maestra

Para nuestro modelo (Figura 2.1), la ecuaci´on maestra para los ARNm y

las proteinas tendr´a la siguiente forma (Ver Ap´endice B):

˙

Pr,p(t) =−Pr,p(t)(kr+γrr)−Pr,p(t)(kpr+γpp) +Pr−1,pkr+Pr+1,pγr(r+ 1) +Pr,p−1kpr+Pr,p+1γp(p+ 1)

(2.3)

Con esta ecuaci´on tenemos dos opciones: Hallar los momentos y cumulantes

de Pr,p(t) sin necesidad de resolver completamente para la distribución o resolver completamente la ecuación para Pr,p(t). Por lo general, la primera opción es mas accesible y la segunda tiene a ser dif´ıcil de abordar. En el caso

de nuestro modelo trabajaremos en las dos, en el estado estable del sistema.

Momentos y Cumulantes en el estado estable

Recordemos la definici´on para la funci´on generadora de Momentos

F(z1, z2, ..., zn, t) =

X

n1,n2,...,nN

zn1

1 z n2

2 ...z nN

N Pn1,n2,...,nN(t), (2.4)

en dondeni son lasN variables aleatorias de nuestro sistema y la suma corre sobre todos los valores que cada uno puede tomar (de 0 a ∞). Esta funci´on

tiene las siguientes propiedades:

F

z1,z2,...,zN=1

= 1 (2.5a)

∂F ∂zi

z1,z2,...,zN=1

=hnii (2.5b)

∂2F ∂zi∂zj

z1,z2,...,zN=1

(22)

Para nuestro sistema, la funci´on generadora de momentos esta dada por:

F(r, p, t) =X r,p

z_rrz_ppPr,p(t) (2.6)

Partiendo de la Ecuaci´on 2.3, podemos encontrar la derivada de la funci´on

ge-neradora de momentos para nuestro sistema. Multiplicando por las variables

zni

i y sumando sobre todos los valores de los ni tenemos [9], ˙

F(r, p, t) = kr(zr−1)F+kpzr(zp−1)

∂F ∂zr

−γr(zr−1)

∂F ∂zr

−γp(zp−1)

∂F ∂zp

(2.7)

En el estado estable, ˙F(r, p, t) = 0, tenemos,

0 =kr(zr−1)F +kpzr(zp−1)

∂F ∂zr

−γr(zr−1)

∂F ∂zr

−γp(zp−1)

∂F ∂zp

(2.8)

Ahora, podemos derivar la ecuaci´on 2.8 con respecto azr,

0 =kr

F + (zr−1)

∂F ∂zr

+kp(zp−1)

∂F ∂zr

+zr

∂2_F

∂z2 r

−γr

∂F ∂zr

+ (zr−1)

∂2F ∂z2 r

−γp(zp −1)

∂2F ∂zrzp

,

(2.9)

y evaluar en zr =zp = 1. De esta manera obtenemos,

0 =kr−γrhri

hri= kr

γr

(2.10)

en dondehrisignifica el primer momento de la variabler en el estado estable.

Para obtener las fluctuaciones en el numero de RNAm volvemos a derivar la

ecuación 2.9 con respecto a zr. Reescribamos ésta ecuación de la siguiente manera,

0 =kr

F + (zr−1)

∂F ∂zr

+

kpzr(zp−1)−γr(zr−1)

∂2_F

∂z2 r +

kp(zp−1)−γr

∂F ∂zr

−γp(zp−1)

∂2_F

∂zrzp

(23)

Ahora derivando con respecto a zr y reorganizando los t´erminos tenemos,

kr

− ∂F

∂zr

+ (1−zr)

∂2_F

∂z2 r

−kr

∂F ∂zr

=kp(zp−1)

∂2_F

∂z2 r

+zr

∂3_F

∂z3 r

−γr

∂2F ∂z2 r

+ (zr−1)

∂3F ∂z3 r

+kp(zp−1)

∂2F ∂z2 r

−γr

∂2_F

∂z2 r

−γp(zp−1)

∂3_F

∂z2 r∂zp

(2.12)

Ahora evaluando en zr =zp = 1 obtenemos,

−2kr

r

=−2γr

r2 − r (2.13)

Reorganizando los t´erminos tenemos,

(−2kr−2γr)

r=−2γr

r2

. (2.14)

Utilizando el resultado de la ecuaci´on 2.10 para r tenemos,

r2

= 2kr+ 2γr 2γr

r

= 2kr+ 2γr 2γr

kr

γr

= (kr+γr)kr

γ2 r

. (2.15)

Entonces tenemos que las fluctuaciones en r son

r2

−

r2 = (kr+γr)kr

γ2 r − k 2 r γ2 r

= kr

γr

=δr2. (2.16) Para el caso de los ARNm, hemos demostrado que el promedio

r

es igual

a la varianza δr2. Debido a éste resultado y al hecho de que la creación y destrucción de moléculas de ARNm son procesos independientes en el

tiem-po, podemos pensar que la distribuci´on de probabilidad para r en el estado

estable es Poisson de la siguiente manera

Pr =

µr r!e

−µ

(2.17)

con µ= kr

γr. Vamos a ver que es posible mostrar este resultado solucionando la ecuacion 2.3 completamente para el estado estable.

(24)

Distribucion de probabilidad en el estado estable

En este momento es importante identificar que es posible escribir la

ecua-ción maestra para la distribución de probabilidad de las moléculas de ARNm

de manera independiente a la correspondiente a prote´ınas. Esto debido a que,

en un gen constitutivo (no regulado), el n´umero de ARNm no depende del

n´umero de prote´ınas. En este sentido, podemos escribir la ecuaci´on maestra

para los ARNm de la siguiente manera

˙

Pr(t) = −Pr(t)(kr+γrr) +Pr−1(t)kr+Pr+1(t)γr(r+ 1). (2.18) En el estado estable tenemos,

0 = −Pr(kr+γrr) +Pr−1kr+Pr+1γr(r+ 1). (2.19) Si dividimos la ecuaci´on anterior por γr y usamos el resultado de la ecua-ci´on 2.10 tenemos

0 =−Pr(

r+r) +Pr−1

r+Pr+1(r+ 1). (2.20)

Reorganizando la ecuaci´on anterior tenemos

Prr−Pr−1

r=Pr+1(r+ 1)−Pr

r (2.21)

Esta ´ultima ecuaci´on debe ser verdad para todo r. Entonces podemos decir

que cada lado de la ecuaci´on debe ser igual a una constanteK.

Prr−Pr−1

r=K. (2.22)

Ahora sumando sobre todos los valores que toma r tenemos

X

r

Prr−

r X

r

(25)

ComoPr est´a bien normalizada, entonces tenemos

r−

r =K = 0. (2.24)

Utilizando la ecuaci´on 2.24 en la ecuaci´on 2.22 tenemos

Pr =

r

r Pr−1 =

r2

r(r−1)Pr−2 =

r3

r(r−1)(r−2)Pr−3 =...=

rr

r! P0 (2.25) Sumando la ecuaci´on 2.25 sobre todos los valores de r tenemos

X

r

Pr =P0

X

r

rr

r! (2.26)

El lado izquierda de la ecuaci´on anterior es igual a 1 por normalizaci´on y el

lado derecho es la series de potencias para la funci´on exponencial. Entonces

tenemos que P0 =e

−r

y por ende tenemos

Pr =

rr r! e

−r

(2.27)

Reconocemos la expresión de la ecuación2.27 como una distribución de

Pois-son y esto concuerda con lo encontrado en la ecuaci´on 2.17.

2.1.2. Ecuaci´

on de Langevin

Otra forma de encontrar las propiedades de sistemas estoc´asticos es el

m´etodo de la ecuaci´on de Langevin. Este formalismo fue introducido por P.

Langevin poco despu´es de que A. Einstein hiciera su trabajo sobre

movimien-to Browniano, como m´etodo alternativo para obtener los mismos resultados.

El m´etodo consiste en adicionar un t´ermino de ruido a las ecuaciones

(26)

a las ecuaciones 2.2. De esta manera, obtenemos las siguientes ecuaciones,

˙

r(t) = kr−γrr+qrr (2.28a) ˙

p(t) =kpr−γpp+qpp (2.28b)

ε(t) = 0 ; ε(t)ε(t+τ) =δ(τ). (2.28c)

La ecuaci´on 2.28c nos presenta las caracter´ısticas que imponemos al ruido

en el problema. En este caso, las condiciones son las de ruido blanco1. Para empezar el an´alisis, definiremos la variable δr = r− < r > que representa

la distancia de la variable aleatoria r de su valor promedio. Derivando esta

expresi´on tenemos lo siguiente

˙

δr = ˙r−< r >˙ = (kr−γrr+qrr)−(kr−γr< r >) = −γrδr+qrr, (2.29)

˙

δr+γrδr =qrr. (2.30)

A continuaci´on, procederemos a resolver esta ecuaci´on diferencial usando la

transformada de Fourier. Transformando la ecuaci´on 2.30 tenemos

iωδrˆ(ω) +γrδrˆ(ω) =qrˆr(ω). (2.31)

ˆ

δr(ω) = qrˆr(ω)

iω+γr

. (2.32)

1_{El ruido blanco se caracteriza porque la variable aleatoria no posee ning´}_{un tipo de}

correlación estad´ıstica en el tiempo. Muchos procesos estocásticos pueden tener como caracter´ıstica ruido blanco y por esta razón el hecho de imponer este tipo de ruido no determina las caracter´ısticas estad´ısticas del proceso en su totalidad.

(27)

Tomando el cuadrado de la normal y luego el valor promedio de la expresi´on

anterior tenemos

<|δrˆ(ω)|2 >=< qrˆr(ω) iω+γr

qrˆr(ω)

−iω+γr

> (2.33a)

= q

2 r

ω2₊_γ2 r

<ˆr(ω) ˆr(ω)> (2.33b)

Ahora tomamos la transformada inversa para obtener lo siguiente

< δr2 >= 1 2π

Z

R q2

r

ω2₊_γ2 r

eiωtdω (2.34)

Esta integral puede ser evaluada ent = 0 por el teorema de Wiener-Khintchine [10].

Tenemos entonces

< δr2 >= 1 2π

Z

R q_r2 ω2₊_γ2

r

dω = q 2 r 2γr

(2.35)

Como ya demostramos que la variableren estado estable sigue una

distribu-ci´on de Poisson2 _(Ecuaci´_{on 2.27), entonces tenemos que} _{< δr}2 _>₌ _{< r >}_¯ ₌ kr

γr y por tanto

q2 r 2γr

= kr

γr

(2.36)

lo que implica que

q_r2 = 2kr. (2.37)

2_{Esta propiedad del sistema no se deriva del proceso realizado en esta secci´}_{on y por}

tanto no es una consecuencia de la ecuación de Langevin tal y como fue planteada al inicio de la sección. También es importante agregar que aunque la variablerfue tomada como continua durante el desarrollo, las propiedades encontradas son válidas para el proceso que pretendemos modelar (variable discreta y definida positiva) gracias a la generalidad de la ecuación de Langevin y del ruido blanco.

(28)

La importancia de este ´ultimo resultado esta en que qr describe la fuerza del ruido impuesto en la ecuaci´on de Langevin y hemos demostrado que este

caso es proporcional a la constante de producci´on de mol´eculas de ARN kr.

2.1.3. M´

etodos especiales para c´

alculo de ruido de un

sistema

A partir de lo aprendido en las secciones anteriores, en esta secci´on

dis-cutiremos un m´etodo especial que nos permite encontrar las caracter´ısticas

estad´ısticas de los sistemas estudiado. Dicho m´etodo nos entrega una

gene-ralizaci´on a procesos de n “especies” que interactuan mediante reacciones

qu´ımicas y en donde la cantidad xi de cada “especie” cambia en el tiempo por medio de procesos de creaci´on y degradaci´on.

Empecemos el an´alisis suponiendo un sistema compuesto por n“especies”

y representemos el vector estado del sistema como~x= (xq, ..., xn). Dado esto, podemos escribir la ecuacion maestra del sistema de la siguiente manera:

∂tP(~x, t) =

X

k

rk(~x−~sk)P(~x−~sk)−rk(~x)P(~x) (2.38)

en donde rk son las diferentes reacciones que ocurren, ~sk es el vector que representa el tamaño del salto en cada “especie” debido a lak−ésima reacción

y P la distribuci´on de probabilidad del n´umero de las n “especies”.

Podemos definir los flujos cambio de la i−´esima “especie” de la siguiente

manera

Ji =Ji+−J

−

i =

X

k

(29)

y la matriz de covarianzas como

Cij =Cov(xi, xj). (2.40) Multiplicando por~xla ecuaci´on 2.38, sumando sobre todo los valores posibles

de~x y usando la definici´on de la ecuaci´on 2.39 tenemos lo siguiente

X

~ x

∂t~xP(~x, t) =

X ~ x X k ~

xrk(~x−~sk)P(~x−~sk)−

X ~ x X k ~

xrk(~x)P(~x)

(2.41a)

∂th~xi=

X

~ x

X

k

(~x+~sk−~sk)rk(~x−~sk)P(~x−~sk)−

X ~ x X k ~

xrk(~x)P(~x)

(2.41b)

∂th~xi=

X

k

X

~x

~skrr(~x)P(~x) (2.41c)

∂th~xi=

* X

k

~skrr(~x)

+

(2.41d)

∂th~xi=

D

~

JE. (2.41e)

De manera similar, usando las ecuaciones 2.38, 2.39 y 2.40 podemos

de-ducir la siguiente expresi´on

∂tC =

J(~x− h~zi)T +

(~x− h~zi)JT

+hBi (2.42)

en donde Bij =

P

ks k

iskjrk(~x). La ecuaciones 2.41e y 2.42 gobiernan la evoluci´on temporal de los valores promedios y las covarianzas del sistema

de las n “especies”.

Cuando las tasas de reacci´on son lineales en las variables de estado,

pode-mos escribir la matriz total de flujos de cambio como

(30)

en donde la matriz K es la matriz Jacobiana para los cambios en los valores

promedio. Definiendoηij = Cij

(hxiihxji) se puede demostrar la siguiente ecuaci´on

M η+ηMT =D (2.44)

en donde D es la versi´on normalizada de B y M es una versi´on normalizada

de K. Estas matrices dependen tanto de las tasas de reacción rk como de los tamaños de cambio en dichas reacciones~sk. Para nuestro caso de estudio, en donde supondremos que la creación y destrucción de moléculas sucede de

una en una, entonces podemos encontrar que

Dij = 2

τihxii

(2.45a)

Mij =

Hij

τi

(2.45b)

Hij =

∂ln J_i−/J_i+ ∂lnxj

. (2.45c)

Teniendo estos resultados podemos investigar el caso mas sencillo de

nues-tro modelos de la Figura 2.1. En este caso tenemos las siguientes reacciones:

r kr

−−→r+ 1 (2.46a)

r−γ−r→r r−1 (2.46b)

p−−→kpp p+ 1 (2.46c)

(31)

en dondeγi = _τ1_i. A partir de las reacciones 2.46 podemos definir los siguientes flujos de cambio:

J_r+=kr (2.47a)

J_r−=γrr=

r τr

(2.47b)

J_p+=kpr (2.47c)

J_p−=γpp=

p τp

. (2.47d)

Dado estos flujos de cambio, se puede verificar f´acilmente lo siguiente

D= 



2 τrhri 0

0 _τ_ph2_p_i 

 H =





1 0

−1 1



 M =





1 τr 0

−1 τp

1 τp



. (2.48)

Usando estos resultados y la ecuaci´on 2.44 tenemos

M η+ηMT =D (2.49a)





1 τr 0

−1 τp 1 τp    

ηrr ηrp

ηpr ηpp



+ 



ηrr ηrp

ηpr ηpp



 



1 τr −

1 τp 0 _τ1

p  =   2 τrhri 0

0 _τ_ph2_p_i 

.

(2.49b)

Esto anterior nos entrega el siguiente sistema de cuatro ecuaciones:

ηrr

τr + ηrr

τr

= 2

τrhri

(2.50a)

−ηrr

τp

+ηrp

τp

+ηpr

τr

= 0 (2.50b)

ηpr

τr

− ηrr

τ2 +ηrp

τp

= 0 (2.50c)

−ηrp

τp

+ηpp

τp

− ηpr

τp

+ηpp

τp

= 2

τphpi

(32)

. Como podemos ver, de las cuatro ecuaciones 2.50, solo tres son

indepen-dientes. La ecuaciones 2.50b y 2.50c son la misma. Esto debido al car´acter

simétrico de la ecuación matricial 2.44. A partir de la ecuación 2.50a tenemos

que

ηrr ≡ηr = 1

hri. (2.51)

Sumado a esto, de la ecuaci´on 2.50b tenemos que

ηrp =

ηr

τp 1

1 τp +

1 τr

=

1

hri

τr

τr+τp

. (2.52)

Por ´ultimo, de la ecuaci´on 2.50d tenemos que

ηpp≡ηp = 1

hpi +ηrp =

1

hpi+

1

hri

τr

τr+τp

(2.53)

Como podemos ver, la ecuaci´on 2.51 corresponde al ruido t´ıpico de una

varia-ble aleatoria con distribucion de Poisson, lo cual concuerda con lo encontrado

anteriormente para las mol´eculas de ARN. Para el caso de las proteinas,

te-nemos un ruido que nos muestra que en este caso, la variable se distribuye de

forma mas dispersa que una distribuci´on de Poisson. Como ya hemos

anali-zado, esta diferencia se debe al ruido heredado de las mol´eculas de ARN, al

estar estas tambi´en descritas por un proceso estoc´astico, y tiene en cuenta la

diferencia en los tiempos de vida media de las dos “especies”.

2.2. Consideraciones sobre el proceso de

Trans-cripci´

on

La transcripci´on es el proceso mediante el cual se producen mol´eculas de

(33)

de-pende de variables como el encuentro aleatorio de la Enzima ARN Polimerasa

con el lugar correcto del ADN (Promotor), la probabilidad de interacci´on de

estos dos, factores de transcripci´on reguladores, entre otro. En el caso mas

sencillo analizado anteriormente, tenemos una tasa constantekr de produc-ci´on de mol´eculas de ARNm la cual puede se pensada como una tasa efectiva

que promedia todas las fluctuaciones producidas por los pasos intermedios

mencionados. Sin embargo, vale la pena estudiar el efecto de estos distintos

procesos sobre las caracter´ısticas estad´ısticas de lo n´umero de mol´eculas. En

esta secci´on, exploraremos algunos de los proceso que pueden afectar

consi-derablemente el ruido y dem´as propiedades estad´ısticas de nuestro sistema.

2.2.1. Ruido Telegr´

afico

3_{Existen prote´ınas que pueden regular la afinidad del ADN para ser} trans-crito. Pueden tanto favorecer (activadores) como desfavorecer (represores) el

proceso de transcripci´on. Usualmente, estas fluctuaciones son promediadas

debido a que se asume que la escala temporal en la que ocurren las

transi-ciones de estado de la regi´on operadora del ADN son muy peque˜nas. Esto

permite asumir el estado del ADN como estable en el tiempo. Normalmente,

este an´alisis nos conduce a la conocida ecuaci´on de Hill,

1

1 + (K_X)n. (2.54)

3_{Esta secci´}_{on est´}_{a basada en el articulo de Thomas B. Kepler and Timothy C.}

Els-ton [11]. Se han reproducido los cálculos y las simulaciones para corroborar los resultados. Sumado a esto, se ha ampliado el análisis para incluir el ruido por las fluctuaciones de los factores de transcripción antes de considerar las fluctuaciones en la región operadora del promotor.

(34)

la cual modela el tiempo promedio que el ADN pasa activo (o inactivo) en

función de la concentración de la molécula reguladora X. De esta manera, es

posible modelar la tasa de producci´on de ARN de un gen en funci´on de su

mol´ecula reguladora. (Ver Figura 2.2).

Figura 2.2: Funci´on de Hill para distintos par´ametros.K = 4000,n = 2,4,6,8

Sin embargo, si las fluctuaciones en la regi´on operadora no ocurren lo

sufi-cientemente r´apido, el tiempo que ´esta pasa en cada uno de los estados puede

alejarse bastante de la curva de Hill. Por esta raz´on, es necesario estudiar el

proceso de activaci´on y desactivaci´on del ADN, y de esta manera,

encon-trar sus consecuencias sobre la estad´ıstica del n´umero de ARN y prote´ınas

correspondiente.

Podemos considerar entonces un modelo en el cual el ADN puede fluctuar

entre un estado activo a un inactivo a una tasa constante Kh1 y del estado inactivo al activo a una tasa constante Kh0. Se tiene como condici´on que

(35)

kr1, y en el estado inactivo se producen ARNm a una tasa constantekr0. (Ver Figura 2.3). (Que pasa cuando se asume tasas de transici´on r´apidas entre los

dos estados).Las mol´eculas de ARNm se degradan a una tasa efectiva γr. Ahora nos concentraremos en entender el rol que juegan las fluctuaciones

de la región operadora en el proceso de transcripción y cómo afectan la

estad´ıstica del n´umero de ARNm.

Figura 2.3: Esquema que muestra dos distintos estados de la regi´on operadora

del promotor en el ADN.

Para empezar, podemos plantear las siguientes ecuaciones para la

evo-lución en el tiempo (Ver Apéndice B) de la distribución conjunta de

pro-babilidad Ps

r(t) del n´umero de ARNm y el estado del operador. En este caso, tenemos la variable r que representa el n´umero de ARNm y la

(36)

s ={0 = inactivo,1 =activo}.

dP_r0(t)

dt =−(Kh0+γrr+kr0)P

0

r +Kh1Pr1+kr0Pr0−1+γr(r+ 1)Pr+10 (2.55a)

dP1 r(t)

dt =−(Kh1+γrr+kr0)P

1

r +Kh0Pr0+kr1Pr1−1+γr(r+ 1)Pr+11 (2.55b)

La ecuaci´on 2.55 puede ser escrita de forma mas compacta como

dPs r(t)

dt =krs

P_rs₋₁−P_rs

+γr

(r+1)P_r+1s −rP_rs

+K

hsˆPrˆs−hsPrs

(2.56)

en donde ˆs= (s+ 1)mod1. Para cada estado del operador, podemos definir los momentos parciales estad´ısticos as´ı

rn_s=X r

rnP_rs (2.57)

Lo momentos totales podemos definirlos como la suma de los momentos

par-ciales pesados por las probabilidades de estar en cada uno de los estados.

Para calcular estas probabilidades podemos hacer el siguiente an´alisis:

Su-pongamos que tenemos la siguiente reacci´on,

O₀ −₎−−Kh₋₋*₋o

Kh1

O₁ (2.58)

De la ecuaci´on anterior podemos escribir el cambio en el tiempo para O0 de la siguiente forma

˙

O0 =Kh1O1−Kh0O0 (2.59a)

(37)

La ecuación 2.59b es la condición de normalización. En estado estable y

haciendo uso de la normalizaci´on tenemos lo siguiente

O0h0 =O1h1 (2.60a)

O0h0 = (1−O0)h1

O0 =

h1

h1+h0

=h1 (2.60b)

Podemos realizar el mismo an´alisis y encontrar queO1 =h0. De esta manera, ulizando la ecuaci´on 2.60b podemos escribir los momentos totales como

rn=h1

rn₀+h0

rn₁ (2.61)

Calculemos el primer momento rn_s en el estado estable. Usando la ecua-ci´on 2.56, multiplicando todos los t´erminos por r y sumando sobre todos los

valores der tenemos

X

r

rdP

s r(t)

dt =krs

X

r

rP_rs₋₁−X

r

rP_rs

+γr

X

r

r(r+ 1)P_r+1s −X

r

r2P_rs

(2.62a)

+K

hˆs

X

r

rP_rsˆ−hs

X

r

rP_rs

A partir de la ecuaci´on 2.62, podemos construir la siguiente ecuaci´on

su-mando y restando t´erminos

dr_s dt =krs

X

r

(r−1)P_rs₋₁+X r

P_rs₋₁−X

r

rP_rs

+γr

X

r

(r+ 1)2P_r+1s −X

r

(r+ 1)P_r+1s −X

r

r2P_rs

+K

hˆs

X

r

rP_rsˆ−hs

X

r

rP_rs

(38)

De la ´ultima ecuaci´on tenemos lo siguiente

dr_s dt =krs

r_s+ 1−

r_s

+γr

r2 s− r s− r2 s +K

hˆs

r

ˆ s−hs

r

s

(2.64a)

dr_s

dt =krs−γr

r_s+Khˆs

r_ˆ_s−Khs

r_s (2.64b)

De la ecuaci´on 2.61 tenemos que

drn

dt =h1 drn

0

dt +h0 drn

1

dt . (2.65)

Usando las ecuaciones 2.64b y 2.65 tenemos

dr

dt =hˆskrs−hsˆγr

r_s+hsˆKhsˆ

r_s_ˆ−hˆsKhs

r_s

+hskrˆs−hsγr

r_ˆ_s+hsKhs

r_s−hsKhˆs

r_s_ˆ (2.66a) = (hsˆkrs+hskrˆs)−γr(hsˆ

r_s+hs

r_ˆ_s) (2.66b)

Para cancelar los otros cuatro t´erminos se utiliza la ecuaci´on 2.60a. De esta

manera, utilizando la ecuaci´on 2.66b en el estado estable tenemos

0 =(hˆskrs+hshrˆs)−γr(hˆs

r_s+hs

r_s_ˆ)

hˆs

r_s+hs

r_ˆ_s ≡

r = (hsˆkrs+hskrˆs)

γr

(2.67a)

De manera similar, podemos encontrar la varianza en el estado estable

obteniendo

σ2

r =hri+hshˆs

krs−krˆs

γr

2

γr

γr+K

(39)

Usando estos resultados calculamos el ruido para las mol´eculas de ARN como

η2 r =

σ2 r

hri2

= 1

hri +hshsˆ

γr

γr+K

krs−krˆs

hsˆkrs+hskrˆs

2

(2.69)

Como podemos ver, la expresi´on para el ruido de las mol´eculas de ARN

tiene el t´ermino t´ıpico de un proceso de Poisson

1

hri

. Adicional a esto,

apa-rece un t´ermino que incluye los par´ametros involucrados en las fluctuaciones

de la regi´on operadora del ADN. De la misma ecuaci´on, podemos ver que

cuando K >> 1, este t´ermino tiende a cero y recuperamos el proceso de

Poisson.

Los resultado ac´a obtenidos nos dan un indicio de que las fluctuaciones de

la regi´on operadora del ADN pueden llegar a ser considerables en el c´alculo

del ruido y las estadificas de mol´eculas de ARN y prote´ınas. Esto quiere decir

que la aproximaci´on por funci´on de Hill, en donde se promedian todas estas

fluctuaciones por el hecho ocurrir en una escala de tiempo mucho mas baja

que la vida media de mol´eculas de ARN y prote´ınas, no siempre es adecuada.

2.2.2. Efecto de

Gestaci´

on

y transcripci´

on por r´

afagas

En la aproximaci´on mas sencilla, cada proceso de producci´on y

degrada-ci´on de mol´eculas de ARN es independiente de lo ocurrido en el pasado. En

este sentido, es posible demostrar que el tiempo que pasa entre la ocurrencia

de cada evento es una variable aleatoria continua distribuida

exponencial-mente.4

4_{Esta es la ´}_{unica distribuci´}_{on que cumple la condici´}_{on de falta de memoria en el caso}

(40)

En la mayor´ıa de los casos estudiados experimentalmente, se ha

encontra-do concordancia con distribuciones de Poisson para el n´umero de mol´eculas

resultantes de la transcripci´on. Sin embargo, existen algunos sistemas en los

que los intervalos de tiempo entre eventos no siguen una distribuci´on

expo-nencial. Esto se debe a que cada evento de transcripci´on requiere de varios

pasos intermedios, los cuales individualmente si pueden ser considerados

co-mo independientes del pasado. De manera mas espec´ıfica, existen casos en los

que la maduraci´on del ADN necesaria para ser transcrito requiere de varios

pasos intermedios que involucran la interacci´on de diferentes mol´eculas

com-plementarias que le permiten a la ARN Polimerasa elongar la nueva hebra

de ARN a partir del templado de ADN. Esto hace que el lapso de tiempo

entre eventos de transcripci´on sea la suma de distintos tiempo distribuido de

manera exponencial. Esto ultimo se traduce en una distribuci´on diferente de

exponencial para los lapsos de tiempo entre eventos de transcripci´on.

A continuación realizaremos el análisis y la reproducción de los cálculos

realizados por Pedraza et al. [12] Empezaremos el an´alisis pensando el

pro-blema de la siguiente manera: Supongamos que tenemos una sucesi´on de

eventos de creaci´on. Sea f(t) la distribuci´on de probabilidad de que ocurra

un evento de creación en un tiempotdesde el último evento. Seanel número

de eventos de creaci´on desde t = 0. De esta manera, podemos decir que la

probabilidadP(t=T)dt de que ocurra un evento ent=T es igual af(T)dt.

(41)

det=T es igual a R₀T f(t)dt. Usando esto podemos decir lo siguiente

P(n= 0|t =T) = P(t > T) = 1−

Z T

0

f(t)dt ≡1−F(T) (2.70a)

P(n= 1|t =T) = Z

t1

P(t=t1)P(t > T −t1)dt1 (2.70b)

= Z T

0

f(t1) (1−F(T −t1))dt1 =f ∗(1−F)|T. (2.70c)

La ecuaci´on 2.70a nos dice que la probabilidad de que la cantidad de eventos

ocurridos sea cero (n = 0) dado que el tiempo est =T es igual a la

probabi-lidad de que el evento ocurra en un tiempo posterior at=T, y por tanto es

simplemente el complemento deP(t < T). La ecuaci´on 2.70c nos dice que la

probabilidad de que la cantidad de eventos ocurridos sea uno (n = 1) dado

que el tiempo es t =T es igual la probabilidad de que ocurra un evento en

t=t1 y no ocurran ning´un otro evento ent > T−t1, todo esto sumado sobre todos los posibles valores parat1 entre 0 yT. La expresi´on a la derecha de la ´

ultima igualdad es el producto de convoluci´on entre las funcionesf y (1−F).

Siguiendo este razonamiento, y usando inducci´on se puede demostrar que

(42)

A continuaci´on, usando la transformada de Laplace, tenemos

L {f(t)}= ˆf(s) (2.72a)

L {F(t)}= ˆF(s) = 1

s

ˆ

f(s) (2.72b)

L {P(0|t)}= ˆP(0|s) = 1

s

ˆ

f(s) (2.72c)

L {P(n|t)}= ˆP(n|s) = ˆf(s) ˆP(n−1|t) (2.72d)

= ˆf(s) ˆf(s) ˆP(n−2|t) =...=fˆ(s) n

ˆ

P(0|s) (2.72e)

= 1

s

ˆ

f(s) n

1−fˆ(s) (2.72f)

Ahora procederemos a definir la funci´on generadora de momentosG(z, t)5 y su respectiva transformada de Laplace L {G(z, t)}= ˆG(z, s)

G(z, t) = ∞ X

n=0

znP(n|t) (2.73a)

ˆ

G(z, s) = ∞ X

n=0

znPˆ(n|s) = 1

s

1−fˆ(s) ∞ X

n=0

znfˆ(s)n (2.73b)

En donde usamos el resultado de la ecuaci´on 2.72f en la ecuaci´on 2.73b.

Como las propiedades interesantes de la funci´on generadora de momentos se

tienen cuando esta es evaluada en z = 1 y dado que ˆf ₆1, podemos escribir

la parte derecha de la ´ultima igualdad de la ecuaci´on 2.73b como una serie

geom´etrica, y por tanto tenemos

ˆ

G(z, s) = 1

s

1−fˆ(s)

1−zfˆ(s). (2.74)

5_{En la secci´}_{on 2.1.1 usamos} _F _{para definir la funci´}_{on generadora de momentos. Sin}

embargo, en esta sección usamos G ya que F ya fue usada para otra definición en la ecuación 2.70a

(43)

Ahora usaremos las propiedades de ˆG(z, s) para calcular algunas

propie-dades de la variable aleatoria n en el espacio de Laplace. Tenemos entonces

para hˆni_s

hnˆi_s= ∂

∂z

ˆ

G(z, s)|z=1 = 1

s

1−fˆ(s)

1−zfˆ(s)2 ˆ

f(s)|z=1 (2.75a)

= 1

s

ˆ

f(s)

1−fˆ(s) (2.75b)

y para hnˆ2_i

s− hnˆis tenemos

ˆ

n2_s− hnˆi_s= ∂ 2

∂z2Gˆ(z, s)|z=1 (2.76a)

= 1

s

ˆ

f(s)1−fˆ(s)

1−zfˆ(s)

4 fˆ(s)2

1−zfˆ(s)

|z=1 (2.76b)

= 2

s

ˆ

f(s)2

1−fˆ(s)

2. (2.76c)

En este momento solo necesitamos de tomar la transformada inversa de

Laplace de estas expresiones para hallar la media y la varianza en el dominio

temporal. Sin embargo, nos enfrentamos con un problema: Por la definici´on

de la tranformada de Laplace fˆ(s) =R₀∞f(t)e−stdt, vemos que ˆ

f(0) = Z ∞

0

f(t)dt= 1 (2.77a)

d ds

ˆ

f(s)|0 =

Z ∞

0

d dse

−st_f₍_t₎_dt_| s =−

Z ∞

0

tf(t)dt=− hti (2.77b)

d2

ds2fˆ(s)|0 =

Z ∞

0

d2 ds2e

−st

f(t)dt|s =

Z ∞

0

t2f(t)dt=t2 (2.77c) Por la ecuaci´on 2.77a tenemos que 1−fˆ(s) −→ 0 cuando s −→ 0 y

(44)

ecuaciones 2.75 y 2.76 divergen en este l´ımite. Para esto es necesario integrar

usando variable compleja y calcular los residuos a segundo y tercer orden en

s = 0. Se tiene entonces que6

hni_t=L−1{hnˆis}= 1 2πi

I

est1 s

ˆ

f(s)

1−fˆ(s)ds (2.78a)

= t

hti +K1 (2.78b)

n2−n_t=L−1

ˆ

n2−nˆ_s = 1 2πi

I

est2 s

ˆ

f(s) 2

1−fˆ(s)2

ds (2.78c)

= t 2

hti +

4t

hti

_h

t2_i 2hti2 −1

+ 2 1−ht

2_i

hti2 +

3ht2_i2 4hti4 +

ht3_i 3hti3

!

.

(2.78d)

Teniendo estos resultados, podemos escribir una expresi´on para la varianza

como

σ2_n=n2_t− hni2_t = t

hti

ht2i hti2 −1

+K2 (2.79)

Hasta el momento, el an´alisis solo ha incluido el efecto de tener una

dis-tribuci´on indeterminada de tiempos entre eventos de creaci´on sobre la

es-tad´ıstica del n´umero de dichos eventos. Como podemos ver, cuando dicha

distribuci´on es exponencial, caracter´ıstica de una taza constante de creaci´on,

las constantesK1yK2se hacen cero y se tiene simplemente queηt2 = σ2

t hti2 = 1. Este ser´ıa el caso l´ımite que se ha trabajado en los modelos mas simples de

transcripci´on.

6_{Los detalles del c´}_{alculo de los residuos ser´}_{an presentados en una nueva versi´}_{on de este}

(45)

Ahora, se incluirá el efecto de tener transcripción por ráfagas (mas de una

molécula por evento de creación) y su efecto sobre la estad´ıstica de número

de eventos y n´umero total de mol´eculas. Seabla variable aleatoria que define

el tamaño de la ráfaga en cada evento de creación. Definimos la variable

aleatoria x como

x= n

X

i=o

bi (2.80)

en donde el l´ımite superior de la suma n representa la cantidad de eventos

de creaci´on que han ocurrido. Podemos definir as´ı la probabilidad de tener

un total dea mol´eculas creadas de la siguiente manera

Px(x=a) =

∞ X

n=0

Px(x=a|n)P(n). (2.81)

Sumado a esto, podemos definir la funci´on caracter´ıstica R(r) como

R(r) =hexri_x = ∞ X

a=0

exrPx(x=a) (2.82a)

= ∞ X a=0 ∞ X n=0

exrPx(x=a|n)P(n) (2.82b)

= ∞ X

n=0

hexri_x_|_nP(n) = ∞ X

n=0

ebr_bnP(n) (2.82c)

= ebr_bn

e (2.82d)

En dondehi_b significa el promedio con respecto a la distribución de tamaños de ráfagas yhi_esignifica el promedio con respecto a la distribución de número de eventos. La segunda igualdad en la ecuación 2.82c está justificada ya que

al expresarx como la suma de las variables bi, la exponencial pasa a ser una productoria y en donde cada factor esta igualmente distribuido y por eso el

(46)

promedio sera el mismo. A continuaci´on, usaremos las siguientes propiedades

interesantes de la funci´on caracter´ıstica

hxi= d

drR(r)|r=0 (2.83a)

x2 = d

2

dr2R(r)|r=0 (2.83b) y las aplicaremos al resultado obtenido en la ecuaci´on 2.82d. De esto

obte-nemos

hxi= d

dr

ebr_bn

e|r=0 =

D

n ebr_bn−1bebrE

e

|r=0 (2.84a)

=hnhbi_bi_e =hni_ehbi_b (2.84b)

x2 = d 2 dr2 ebr b n

e|r=0 (2.84c)

= D

n(n−1) ebr_bn−2 bebr_b2+n ebr_bn−1b2ebr_b

E

e|r=0 (2.84d)

=(n2−n)_e(hbi_b)2+hni_e

b2_b. (2.84e)

Usando los resultados de las ecuaciones 2.84b y 2.84e podemos calcular

σ_x2 =hx2i − hx2i2

σ2_x=(n2−n)_e(hbi_b)2+hni_e

b2_b− hni2_ehbi2_b (2.85a) = n2− hni2

hbi2+ b2− hbi2

hni (2.85b)

=σ_n2hbi2+σ2_bhni. (2.85c) Ahora podemos calcular el ruido η_x2 = σx2

hxi2 usando los resultados anteriores

η2_x= σ 2 nhbi

2 (hni_ehbi_b)2 +

σ2 b hni

(hni_ehbi_b)2 (2.86a) =η2_n+ η

2 b

(47)

Si consideramos tiempos largos t para el proceso, podemos decir que el

pro-medio para la variablex es aproximadamente el promedio de la variable que

representa el tamaño de la ráfaga de creaciónb por la cantidad de intervalos

(hxi = hbi t

hti).Usando los resultados de las ecuaciones 2.78 y 2.79 tenemos que

η_n2 = σ 2 n

hxi2 =

η_t2

hni (2.87)

Usando las ecuaci´on 2.86b y 2.87 tenemos

η_x2 = η 2 t

hni+

η2_b

hni =

hbi(η_t2+η_b2)

hxi (2.88)

Hasta ahora, este an´alisis corresponde exclusivamente a un proceso de

creación de moléculas. Ahora se incluirán los procesos de degradación para

completar el an´alisis. Para esto consideraremos un procesos de divisi´on

celu-lar y lo modecelu-laremos mediante un proceso de partici´on binomial instant´aneo.

Si inicialmente se tenian y mol´eculas en la c´elula, podemos escribir la

pro-babilidad de tener x ₆ y mol´eculas en una fracci´on r del volumen original

como

P(x|y) =

y x

rx(1−r)y−x. (2.89)

Ahora definamosPAr(y) como al probabilidad de tenery moléculas antes de la división y PDr(x) como la probabilidad de tener x moléculas después de la división. Si fijamos la fracciónr del volumen inicial total tenemos:

PDr(x) =

∞ X

y=0

P(x|y)PAr(y) =

∞ X y=0 y x

(48)

Podemos definir la funci´on generadora de momentos para la distribuci´on

definida en la ecuaci´on 2.90 como

GDr(z) =

∞ X x=0 zx ∞ X y=0

P(x|y)PAr(y) (2.91a)

= ∞ X y=0 ∞ X x=0 y x

(zr)x(1−r)y−xPAr(y) (2.91b)

= ∞ X

y=0

(zr+ (1−r))yPAr(y). (2.91c)

Consideremos ahora un proceso de crecimiento de la c´elula, el cual

transcu-rre entre dos divisiones consecutivas. Como la probabilidad de creaci´on de

moléculas, en este caso, es independiente de número actual de moléculas,

entonces la distribuci´on de probabilidad al final de esta etapa de crecimiento

PAr(x) será la convolución de la distribución al principio del intervaloPDr(x) con la distribución de probabilidad del proceso de creación de moléculas

PCτ(x) ≡ PT ot(x)|t=τ. Debido a esto, utilizando el hecho de que la funci´on generadora de momentos de una convoluci´on de dos distribuciones es el

pro-ducto de las funciones de generadoras de momentos correspondientes tenemos

GAr(z) =GDr(z)GCτ(z). (2.92)

Para obtener los diferentes momentos de la distribuci´onPAr(x) procedemos a derivar y utilizar las propiedades de la funci´on generadora de momentos.

De esta manera, tenemos que

hxi_Ar = ∂

∂zPAr(x)|z=1 =

GDr(z)

∂

∂zGCτ(z) +GCτ(z) ∂

∂xGDr(z)

z=1 (2.93a)

(49)

Sumado a esto, tambi´en podemos calcular lo siguiente

hxi_Dr= ∂

∂zPDr(x)|z=1 = ∂ ∂z

∞ X

x=0

(zr+ (1−r))xPAr(x)|z=1 (2.94a)

= ∞ X

x=0

xrPAr(x) =rhxi_Ar. (2.94b)

Juntando los resultados de la ecuaciones 2.93 y 2.94 tenemos que el promedio

de moléculas antes de la división está dado por

hxi_Ar = hxiCτ

1−r (2.95)

y que el promedio de moléculas después de la división está dado por

hxi_Dr = rhxiCτ

1−r =rhxiAr (2.96)

Para calcular las varianzas, utilizamos las segundas derivadas de las funciones

generadoras de momentos, obteniendo para las mol´eculas antes de la divisi´on

que

σAr = 1 1−r2σ

2 Cτ +

r

1 +rhxiAr (2.97)

y para las moléculas después de la división que

σDr=

r2

1−r2σ 2 Cτ+

1

1 +rhxiDr. (2.98)

Calculando el ruido en ambos instantes como ηx = σ

2

x

hxi tenemos que

η2_Ar = 1−r 1 +rη

2 Cτ+

r

1 +r

1

hxi_Ar (2.99a)

η_Dr2 = 1−r 1 +rη

2 Cτ+

1 1 +r

1

hxi_Dr. (2.99b)

Para recrear el proceso de decaimiento continuo podemos utilizar los

(50)

tenemos que el n´umero promedio de mol´eculas creadas corresponde al n´

ume-ro pume-romedio que serán reemplazadas después de la división. De acuerdo a

esto tenemos

hxi_Cτ =hxi_Ar(1−r). (2.100)

Utilizando la ecuaci´on 2.100 en la ecuaci´on 2.88 tenemos

η2_Cτ = hbi(η 2 t +η2b)

hxi_Cτ =

1 1−r

hbi(η_t2+η_b2)

hxi_Ar . (2.101)

En este l´ımite, tambi´en tenemos que

l´ım

r−→1hxiDr= l´ımr−→1rhxiAr ≡ hxi (2.102)

. El resultado final que queremos es el ruidoη2 _{del n´}_{umero de mol´}_{eculas justo} antes de la divisi´on en el l´ımite cuandor −→1. Utilizando la ecuaciones 2.99a

y 2.101 tenemos entonces

η2 = l´ım r−→1η

2

Ar = l´ım r−→1

1 1 +r

hbi(η2_t +η2_b)

hxi_Ar +

r

1 +r

1

hxi_Ar (2.103a)

= hbi(η 2

t +ηb2) + 1

2hxi . (2.103b)

La ecuaci´on 2.103b nos muestra el t´ermino de ruido introducido a un proceso

de creación y destrucción debido a procesos degestacióny creación por medio

(51)

Figura 2.4: A. Se muestra una simulaci´on en donde se presentan las variables

aleatoriasT y b, la cuales representan los efectos degestaci´on y creaci´on por

r´afagas. B. Se muestra un proceso real en el cual el ADN en S. cerevisiae

requiere de varios subprocesos para madurar y permitir que la Polimerasa II

realice la transcripci´on. Esto genera tiempos entre eventos de transcripci´on

que no se distribuyen exponencialmente. Sumado a esto, una vez se inicia

la transcripción, se produce una ráfaga de moleculas de ARN de tamaño b

en un periodo corto de tiempo. Esto genera un efecto de transcripci´on por

r´afagas. [12]

2.3. Consideraciones sobre el proceso de

Tra-ducci´

on

El resultado del proceso de Traducci´on son las prote´ınas, las cuales son

consideradas como las unidades estructurales y funcionales de las c´elulas.

Sumado a esto, las prote´ınas son las m´ınimas unidades usadas en los

ex-perimento que pretenden medir fluctuaciones de la expresi´on gen´etica de las

(52)

ume-ro de pume-rote´ınas son las mas importantes a estudiar.

El ruido sobre el nivel de prote´ınas es la suma de diferentes t´erminos

prove-nientes de todo el proceso de expresi´on gen´etica (ruido intr´ınseco) y algunos

provenientes de factores externos (ruido global). Sin embargo, en esta

sec-ci´on nos concentraremos en algunos hechos importantes sobre el proceso de

traducci´on y su efecto sobre las fluctuaciones sobre el nivel de prote´ınas.

En un primer acercamiento a la estad´ıstica de prote´ınas, es v´alido asumir

que, debido a la diferencia de escalas de tiempo, el n´umero de mol´eculas de

ARN permanece en su valor medio de manera constante. Esta visi´on del

pro-blema no presenta propro-blemas con el comportamiento del valor promedio del

n´umero de prote´ınas. Sin embargo, a la hora del c´alculo de las fluctuaciones,

aparecen algunos problemas. Volviendo a la ecuaci´on 2.2, podemos ver que,

si reemplazamos el valor de r en el t´ermino de producci´on de las prote´ınas

por su valor promedio< r >= kr

γr, reducimos el problema de la estad´ıstica del número de prote´ınas al problema ya resuelto para el número de moléculas de

ARN en la secci´on 2.1.1. Esto resultar´ıa en una distribuci´on de Poisson para

el n´umero de prote´ınas. Sin embargo, los resultados experimentales han

mos-trado que la cantidad de prote´ınas en una c´elula no sigue una distribuci´on

de Poisson. Esto ha llevado a diversos estudios mas detallados del proceso

de traducci´on en las c´elulas, los cuales han permitido entender mejor toda la

(53)

2.3.1. Traducci´

on por R´

afagas

En este caso, usaremos nuevamente el modelo de expresi´on gen´etica de

la Figura 2.1, sin embargo, el an´alisis ser´a diferente. Como ya mencionamos

antes, es válido asumir el número de moléculas de ARN en su estado estable

para ciertas escalas temporales. Sumado a esto, es importante tener en cuenta

el siguiente aspecto: Durante el tiempo de vida de una mol´ecula de ARNm,

´esta es traducida por los Ribosomas varias veces en prote´ınas. Este hecho

crea un efecto de producci´on de prote´ınas por r´afagas y afecta de manera

considerable las fluctuaciones del número de éstas. En esta sección

trabaja-remos sobre el art´ıculo de [13]. Reproducimos los c´alculos mas importantes

y analizamos los resultamos obtenidos.

Para empezar nuestro an´alisis, asumiremos que las mol´eculas de ARNm se

encuentran en estado estable. Esto se puede justificar ya que el tiempo medio

de vida de ´estas en mucho menor que el de las prote´ınas. En este sentido,

entenderemos la producci´on de prote´ınas como eventos aleatorios

indepen-dientes, en lo cuales se produce un n´umero distribuido exponencialmente de

moléculas (ráfagas). Esta distribución exponencial del número de prote´ınas

producidas en cada r´afaga ha sido observada experimentalmente [5] . En este

acercamiento al proceso de traducci´on, es importante distinguir dos

cantida-des. La primera esb= kp

γr

que puede ser entendida como el n´umero promedio

de prote´ınas producidas durante la vida media de una mol´ecula de RNAm.

La segunda cantidad es α = kr

γp

que representa el n´umero de r´afagas por

ciclo7_{. Por otro lado, en este caso resolveremos el problema para la variable}

(54)

continua x(t) = _Vp, en donde p corresponde al número de prote´ınas y V al volumen de la célula. Según lo anterior y el esquema de la Figura 2.1

tene-mos que la ecuación maestra para la distribución de probabilidadP(x, t) está

dada por8

∂P(x)

∂t = ∂

∂x[γpxP(x)] +kr

Z x

0

w(x, x0)P(x0)dx0 (2.104)

El primer t´ermino de la ecuaci´on 2.104 se refiere al cambio en de la

concen-traci´onxde prote´ınas debido a procesos como diluci´on, crecimiento celular o

degradaci´on. La informaci´on sobre estos procesos esta codificada en la

cons-tante efectiva γp. El segundo término se refiere a la creación de prote´ınas mediante ráfagas. Tenemos que w(x, x0) = w(x|x0) −δ(x − x0), en donde

w(x|x0) representa la posibilidad de que luego de la r´afaga de producci´on la

concentraci´on de prote´ınas seaxdado que antes erax0. El t´ermino deδ(x−x0)

aparece por la producci´on de prote´ınas a partir de una concentraci´onxinicial.

Asumiremos que el tamaño de la ráfaga de producción (x−x0) es

indepen-diente del estado actual de la concentraci´on x0 de prote´ınas y que sigue una

distribuci´onv(x, x0). Por esta raz´on, podemos escribirw(x, x0) =w(x−x0) =

v(x −x0)− δ(x− x0). Si ahora analizamos la ecuaci´on 2.104 en el estado

8_{Esta expresi´}_{on resulta de llevar la Ecuaci´}_{on Maestra t´ıpica del proceso a un l´ımite}