LA ESTABILIDAD DE LA MOLÉCULA DEL ADN

Texto completo

(1)

LA ESTABILIDAD DE LA MOLÉCULA DEL ADN

Autor: Dr. José Alejandro Gutiérrez Fernández. alejoguti@yahoo.com Coautor: Lic. Abel Amaro Villareal. abel@softel.cu

Coautor: Lic. Yarielda Yolanda Cruz Quiros. yarielda.cruz@yahoo.com

Dr. José Alejandro Gutiérrez Fernández. Empresa SOFTEL. Cuba. Lic. Abel Amaro Villareal. Empresa SOFTEL. Cuba.

Lic. Yarielda Yolanda Cruz Quiros. Universidad Técnica de Panamá. Panamá. - Instituto Superior de Ciencias y Tecnologías Aplicadas. Cuba

Resumen

En el presente trabajo se plantea una hipótesis sobre la estabilidad de los genes y a partir de un modelo que describe el movimiento de la cadena del ADN es obtenida la fórmula de Gibss para calcular su entropía, la cual es aplicada a algunos genes de la Escherichia Coli K12 así como a algunas cadenas generadas aleatoriamente y que codifican las mismas secuencia de aminoácidos que los genes, comparándose los resultados, obteniéndose que para la muestra analizada, la entropía de los genes es mayor que la de las cadenas generadas, encontrándose estos mas cercanos al estado de equilibrio.

Introducción.

El ADN es una macromolécula compuesta por dos cadenas de bases nitrogenadas unidas por puentes de hidrógeno, en cada cadena hay moléculas de fosfato y azúcar, un esquema se muestra en la Figura 1. Las bases nitrogenadas son la adenina ( ), la citosina ( c ), la guanina (

a

g) y la timina (t). La doble hélice está compuesta de forma tal que si en una cadena, en una posición se encuentra una adenina, en la posición correspondiente de la otra cadena se encuentra una timina y si en una cadena, en una posición hay una citosina, en la otra hay una guanina.

En la cadena de ADN existen partes (genes) que codifican las secuencias de aminoácidos, ya sean estas polipéptidos o proteínas (ver Figura 2), así como otras partes de las cuales hasta el momento no se conocen completamente sus funciones. Simplificando el mecanismo de transcripción, en el gen cada grupo de tres bases consecutivas y no superpuestos (codón) codifica un aminoácido. Como son 64 codones, de los cuales, según el código Standard tres identifican el fin del gen, entonces hay 61 codones para codificar 20 aminoácidos, lo que lógicamente implica que existen casos en que varios codones codifican el mismo aminoácido. De acuerdo a lo anterior, la misma secuencia de aminoácidos puede ser codificada por varias secuencias diferentes de bases nitrogenadas; por ejemplo: el primer gen de la Escherichia Coli K12 contiene 66 bases de las cuales, 63 codifican 21 aminoácidos y tres pertenecen al codón de parada (ver Figura 3).

(2)

De acuerdo a la composición de la secuencia de aminoácidos mostrada en la Figura 3, esta puede ser generada por 19,327′352,832 secuencias diferentes de bases nitrogenadas, pero en la cadena de ADN hay una y la pregunta a responder es:

Figura 2: Relación entre el gen y la proteína (polipéptido).

¿Porqué en la cadena de ADN se encuentra en la actualidad la secuencia de bases que se muestra en la figura y no otra?

Figura 3: Gen thrL de la Escherichia Coli K12

Precisamente, el objetivo del presente trabajo es tratar de dar una explicación lógica a esa pregunta.

(3)

El Modelo teórico para el análisis.

Para responder la pregunta planteada hemos considerado que la molécula de ADN es un sistema aislado el cual se mueve en un espacio de dimensiones ( es la longitud de la cadena) y en cada dimensión puede ocupar una de cuatro posiciones diferentes ( , ,

N N

a c g, t ). Así el estado del sistema estará definido por el conjunto de las posiciones que ocupa en cada una de las dimensiones, además la posición que ocupa el sistema en un instante de tiempo en una dimensión es independiente de la posición que ocupe en la misma dimensión en otro instante y la posición que ocupa el sistema en una dimensión es independiente de la que ocupe en otra.

Por considerarlo aislado, durante la evolución, el movimiento espontáneo del sistema será hacia el estado de equilibrio, o sea en la dirección del aumento de su estabilidad. Precisamente con el modelo pretendemos describir ese movimiento espontáneo.

Ya que se ha considerado la independencia entre las posibles posiciones que pudiera tener el sistema en un espacio de dimensiones y que en cada dimensión sólo puede adoptar una de cuatro posiciones discretas, la cantidad de combinaciones que puedan realizarse (W ) viene dada por:

N

= = 4 1 ! ! i i n N W Donde: ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ ≡ ≡ ≡ ≡ ADN de uencia la en t de Cantidad n ADN de uencia la en g de Cantidad n ADN de uencia la en c de Cantidad n ADN de uencia la en a de Cantidad n sec sec sec sec 4 3 2 1

Aplicando logaritmos neperianos, dividiendo por y multiplicando por la constante de Boltzman ( N 23 10 38 , 1 × − = k ⎢⎣⎥⎦K Joule

o ) en ambos miembros así como después de algunas transformaciones se obtiene: i i i x x k W k ln ln 4 1

= − = ⎥⎦ ⎤ ⎢⎣ ⎡ K Joule o Donde N n

xi = i es la fracción de bases de un mismo tipo en la secuencia de bases que codifica el gen.

(4)

En la ecuación anterior, el miembro de la izquierda es la entropía de Boltzman y el de la derecha es el caso particular cuando el sistema sólo puede encontrarse en un conjunto finito de estados discretos obtenida por Gibss.

O sea: i i i x x k S ln 4 1

= − = ⎥⎦ ⎤ ⎢⎣ ⎡ K Joule o 1

En la ecuación anterior es posible demostrar que si una cadena de ADN está compuesta por un solo tipo de base nitrogenada, su entropía es cero, por lo cual es altamente inestable siendo una cadena prácticamente imposible. También la entropía tiene un máximo cuando las fracciones de todas las bases son iguales (x1 = x2 =x3 =x4 ).

El experimento.

Con el modelo descrito, el movimiento hacia el equilibrio del genoma sólo puede estudiarse si se tienen muestras del mismo en diferentes instantes de tiempo, separados estos instantes por un tiempo prolongado o por una gran cantidad de ciclos de vida. Por desgracia hasta el momento no tenemos estos datos. Pero si es posible analizar en un genoma de un organismo que haya pasado por una gran cantidad de ciclos de vida la estabilidad de sus genes y compararla con otras posibles cadenas que podrían codificar la misma secuencia de aminoácidos, considerando que para llegar al estado actual debe haber pasado por alguna de las cadenas generadas.

Como en el modelo se ha considerado que:

1. La molécula de ADN es un sistema el cual se mueve en un espacio de dimensiones.

N 2. En cada dimensión puede ocupar una de cuatro posiciones diferentes ( , , a c g,

t ).

3. La posición que ocupe el sistema en un instante de tiempo en una dimensión es independiente de la posición que ocupe en la misma dimensión en otro instante. 4. La posición que ocupe el sistema en una dimensión es independiente de la que

ocupe en otra dimensión.

Es posible, conociendo, la secuencia de aminoácidos a codificar y empleando un generador de números aleatorios, generar diferentes cadenas que codifiquen la misma secuencia de aminoácidos y a cada cadena calcularle la Entropía por la Fórmula 1. Como una medida del alejamiento de la posición de equilibrio se ha empleado la redundancia porcentual:

(5)

100 max max × ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − = S S S R

[ ]

%

La entropía máxima es:

23 max ln4 1,94 10 − × = = k S ⎢⎣⎥⎦K Joule o

El genoma seleccionado es el de la Escherichia Coli K12 disponible en NCBI el cual está libre de caracteres que no pertenecen al alfabeto

{

a,c,g,t

}

. Además es un organismo muy estudiado. El método de Montecarlo empleado fue implementado en Excel y programado en Visual Basic.

Hasta el momento han sido estudiados cinco genes, los datos de los cuales se muestra en la Tabla 1. No. Gen S 23 10 ×

[

× K−1

]

Joule o R

[ ]

% Cadenas Generadas

[

Cantidad

]

1 thrL 1,874803 3,401096 50 000 2 thrA 1,936275 0,233794 25 000 3 thrB 1,923493 0,892343 25 000 4 thrC 1,936706 0,211549 25 000 5 yaaA 1,939968 0,043511 25 000

Tabla 1: Datos de los genes analizados.

En la tabla se aprecia que el gen mas alejado de la posición de equilibrio es el primero pero a menos del 3,5 % de distancia de ella.

En el Gráfico 1 se muestran las Entropías de los genes. 1,87 1,88 1,89 1,9 1,91 1,92 1,93 1,94 1,95 0 1 2 3 4 5 6 Gen S

(6)

A continuación se muestran los resultados obtenidos.

Gen 1.

Fueron generadas 50 000 cadenas, En el Gráfico 2 se muestran los valores de entropía del gen y de las 10 cadenas de mayor entropía entre las generadas apreciándose que la cadena de mayor entropía es la que se encuentra en la actualidad formando el gen ya que mientras esta se encuentra a una distancia del estado de equilibrio de un 3,4 %, la mas cercana de las 50 000 generadas se encuentra a un 5,9 %.

1,820000 1,830000 1,840000 1,850000 1,860000 1,870000 1,880000 0 2 4 6 8 10

Cade nas ge ne radas S

12

Gráfico 2: Resultados de las 10 cadenas de mayor entropía generadas para el gen 1.

Gen 2.

Fueron generadas 25 000 cadenas, En el Gráfico 3 se muestran los valores de entropía del gen y de las 10 cadenas de mayor entropía entre las generadas apreciándose que la cadena de mayor entropía es la que se encuentra en la actualidad formando el gen ya que mientras esta se encuentra a una distancia del estado de equilibrio de un 0,23 %, la mas cercana de las 25 000 generadas se encuentra a un 1,69 %.

1,900000 1,905000 1,910000 1,915000 1,920000 1,925000 1,930000 1,935000 1,940000 0 2 4 6 8 10

Cade nas ge ne radas S

(7)

Gráfico 3: Resultados de las 10 cadenas de mayor entropía generadas para el gen 2.

Gen 3.

Fueron generadas 25 000 cadenas, En el Gráfico 4 se muestran los valores de entropía del gen y de las 10 cadenas de mayor entropía entre las generadas apreciándose que la cadena de mayor entropía es la que se encuentra en la actualidad formando el gen ya que mientras esta se encuentra a una distancia del estado de equilibrio de un 0,89 %, la mas cercana de las 25 000 generadas se encuentra a un 1,52 %.

1,900000 1,905000 1,910000 1,915000 1,920000 1,925000 1,930000 1,935000 1,940000 0 2 4 6 8 10

Cade nas ge ne radas S

12

Gráfico 4: Resultados de las 10 cadenas de mayor entropía generadas para el gen 3.

Gen 4.

Fueron generadas 25 000 cadenas, En el Gráfico 5 se muestran los valores de entropía del gen y de las 10 cadenas de mayor entropía entre las generadas apreciándose que la cadena de mayor entropía es la que se encuentra en la actualidad formando el gen ya que mientras esta se encuentra a una distancia del estado de equilibrio de un 0,21 %, la mas cercana de las 25 000 generadas se encuentra a un 2,05 %.

1,895000 1,900000 1,905000 1,910000 1,915000 1,920000 1,925000 1,930000 1,935000 1,940000 0 2 4 6 8 10

Cade nas ge ne radas S

(8)

Gen 5.

Fueron generadas 25 000 cadenas, En el Gráfico 6 se muestran los valores de entropía del gen y de las 10 cadenas de mayor entropía entre las generadas apreciándose que la cadena de mayor entropía es la que se encuentra en la actualidad formando el gen ya que mientras esta se encuentra a una distancia del estado de equilibrio de un 0,04 %, la mas cercana de las 25 000 generadas se encuentra a un 2,51 %.

1,880000 1,890000 1,900000 1,910000 1,920000 1,930000 1,940000 1,950000 0 2 4 6 8 10

Cade nas ge ne radas S

12

Gráfico 6: Resultados de las 10 cadenas de mayor entropía generadas para el gen 5.

Conclusiones.

En el trabajo, a partir del modelo descrito, de acuerdo a sus restricciones y para la muestra analizada; se ha encontrado que existe una regularidad relacionada con que las cadenas de los genes que se encuentran en el genoma en la actualidad, son las más estables si se comparan con secuencias de bases nitrogenadas que codifican la misma secuencia de aminoácidos que el gen. El trabajo aún continúa comprobándose nuevos genes.

Bibliografía.

1. Crick, F.H.C.: The genetic code. The Cronian Lecture 1966. Cavendish Laboratory. Cambridge. England. 1966.

2. Crick, F.H.C. y otros: Codes without commas. Cavendish Laboratory. Cambridge. England. 1957.

3. Crick, F.H.C.; Watson, J.D.: The complementary structure of deoxyribonucleic acid. Cavendish Laboratory. Cambridge. England. 1953.

4. Feller, W.: An Introduction to Probability Theory and its Applications. Instituto del Libro. La Habana. 1969.

5. Kolmogorov, A.N. y otros: Introducción a la Teoría de las Probabilidades. Editorial Nauta. 1982.

6. Landau, L. y otros: Curso de Física General. Editorial Mir. Moscú. 1979.

7. Pugachov, V.S.: Introducción a la Teoría de las Probabilidades. Editorial Mir. Moscú. 1973.

(9)

8. Shannon, C.E.: A Mathematical Theory of Communication. The Bell System Technical Journal. Vol 27. 1947.

9. Terlietski, Y.P.: Física Estadística. Editorial Ciencia y Técnica. La Habana. 1971.

10. Watson, J.D.; Crack, F.H.C. The structure of DNA. Cavendish Laboratory. Cambridge. England.

Figure

Actualización...

Referencias

Actualización...

Related subjects :