• No se han encontrado resultados

Algunos aspectos de la organización y evolución del genoma procariota

N/A
N/A
Protected

Academic year: 2022

Share "Algunos aspectos de la organización y evolución del genoma procariota"

Copied!
61
0
0

Texto completo

(1)

Algunos aspectos de la organización y evolución del genoma procariota

Héctor Musto

[email protected]

(2)

Microbios (bacterias y archaea)

90%

de la biomasa terrestre

es microbiana!

(3)

“Todo lo que hacen los eucariotes lo inventaron primero los microbios”

Marc Chippaux

Etc, etc, etc…

(4)

Pero, además…

Microbios: primeras formas de vida sobre la Tierra!

Importantísimos determinantes de salud/enfermedad Fertilizan los suelos y purifican las aguas

Poseen la mayor diversidad genética y bioquímica en toda la biósfera

Gobiernan los ciclos de numerosos nutrientes y elementos

Colonizan TODOS los ambientes posibles (incluso los “extremos”…) Componentes fundamentales de TODOS los sistemas biológicos

Modelan constantemente la faz de la Tierra (desde hace 3.8 Ga)!

Seres vivos más abundantes en el planeta!

Son los actores principales de la BIOTECNOLOGIA

(5)

Estructura del genoma bacteriano

(6)

Tamaño Geometría Número Ploidía

Composición de bases

Concepto de cromosoma en bacterias

Estructura del genoma bacteriano

(7)

Qué es un cromosoma bacteriano???

Molécula circular de ADN (“desnudo”) libre en citoplasma

Un sólo replicón ( ori y ter en extremos opuestos) Portador de genes “esenciales” (idem)

Transferencia vertical (una célula parental a descendientes) Secuencia y estructura poco variables a nivel de especie Gran tamaño (por contraposición con plásmidos)

Localización aleatoria y dispersa en el citoplasma bacteriano (nucleoide) Ausencia de estructuras organizadoras/compactadoras

Sujeto a la acción de fuerzas evolutivas que lo remodelan

Una única copia por célula (“monoploidía”)

(8)

Número de procariotas secuenciados

• Archaeas: 332

• Bacterias: 4862

Datos tomados del GenBank el 8/9/2014.

Solamente se consideran genomas completos, correctamente

anotados!!!

(9)

Organización General

(10)

Escalas en las que nos movemos

(11)

Genes

(12)

0 2 4 6 8 10 12 14 16 18 20

Count

0 1000 2000 3000 4000 5000 6000 7000

Genes

Archaeas

0 10 20 30 40 50 60 70 80 90

Count

0 2000 4000 6000 8000 10000

Genes

Bacterias

Número de genes por especie

(13)

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500

Genes

0 1 2 3 4 5 6

Size (Mb)

Y = 336,261 + 893,963 * X; R^2 = ,944

Archaeas

0 2000 4000 6000 8000 10000 12000

Genes

0 2 4 6 8 10 12 14 16

Size (Mb)

Y = 207,664 + 871,39 * X; R^2 = ,971

Bacterias

Correlación entre tamaño del genoma y

número de genes

(14)

Tamaño medio de genes (en aas)

(15)
(16)

0 10 20 30 40 50 60 70 80 90

Count

10 20 30 40 50 60 70 80

GC%

Bacterias

Contenido de GC en procariotas

0 2 4 6 8 10 12

Count

10 20 30 40 50 60 70 80

GC%

Archaea

(17)

20 30 40 50 60 70 80

GC% Actinobacteria Aquificae Armatimonadetes Bacteroidetes/Chlorobi group Caldiserica Chlamydiae/Verrucomicrobia group Chloroflexi Chrysiogenetes Cyanobacteria Deferribacteres Deinococcus-Thermus Dictyoglomi Elusimicrobia Fibrobacteres/Acidobacteria group Firmicutes Fusobacteria Gemmatimonadetes Nitrospirae Planctomycetes Proteobacteria Spirochaetes Synergistetes Tenericutes Thermodesulfobacteria Thermotogae

CONTENIDO EN GC

20 30 40 50 60 70 80

GC% Crenarchaeota Euryarchaeota

(18)
(19)

GC skew

Historia de su descubrimiento

(G-C)/(G+C)

(20)

GCskew

- 0, 25 - 0, 20 - 0, 15 - 0, 10 - 0, 05 0, 00 0, 05 0, 10 0, 15 0, 20 0, 25

1 15 29 43 57 71 85 99 113 127 141 155 169 183 197

GCskewAc

-10,00 -8,00 -6,00 -4,00 -2,00 0,00 2,00 4,00 6,00

1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199

(21)
(22)
(23)

“GC skew”

1) Rápida identificación de las hebras líder y lagging de la replicación

2) Identificación aproximada de secuencias

“ori” y “ter”

3) Exceso de genes en la hebra líder

4) Prácticamente todos los genes de alta

expresión se ubican en la hebra líder

5) Rearreglos

(24)
(25)
(26)
(27)

Tamaño del Genoma

0 10 20 30 40 50 60 70 80

Count

0 2 4 6 8 10 12 14 16

Size (Mb)

Bacteria

0 5 10 15 20 25

Count

0 2 4 6 8 10 12 14 16

Size (Mb)

Archaea

(28)

0 1 2 3 4 5 6 7 8 9 10

Size (Mb) Actinobacteria Aquificae Armatimonadetes Bacteroidetes/Chlorobi group Caldiserica Chlamydiae/Verrucomicrobia group Chloroflexi Chrysiogenetes Cyanobacteria Deferribacteres Deinococcus-Thermus Dictyoglomi Elusimicrobia Fibrobacteres/Acidobacteria group Firmicutes Fusobacteria Gemmatimonadetes Nitrospirae Planctomycetes Proteobacteria Spirochaetes Synergistetes Tenericutes Thermodesulfobacteria Thermotogae

TAMAÑO DEL GENOMA

0 1 2 3 4 5 6 7 8 9 10

Crenarchaeota Euryarchaeota

(29)

-,600 ,179 -,600 -3,348 ,0008 ,086 ,004 ,570 24,477 <,0001 Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

Regression Coefficients Size (Mb) vs. GC%

0 2 4 6 8 10 12 14 16

Size (Mb)

10 20 30 40 50 60 70 80

GC%

Y = -,6 + ,086 * X; R^2 = ,325

(30)

-9,625 1,738 -9,625 -5,537 <,0001

,221 ,026 ,583 8,458 <,0001

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10 12 14

Size (Mb)

40 45 50 55 60 65 70 75 80

GC%

Y = -9,625 + ,221 * X; R^2 = ,34

Actinobacterias

2,973 1,018 2,973 2,920 ,0046

,024 ,023 ,118 1,047 ,2984

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10 12 14

Size (Mb)

20 30 40 50 60 70 80

GC%

Y = 2,973 + ,024 * X; R^2 = ,014

Bacteroidetes

10,078 2,210 10,078 4,560 ,0002

-,095 ,048 -,396 -1,978 ,0612

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10 12 14

Size (Mb)

20 30 40 50 60 70 80

GC%

Y = 10,078 - ,095 * X; R^2 = ,157

Cianobacteria

-3,850 1,150 -3,850 -3,348 ,0044

,136 ,026 ,804 5,228 ,0001

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 1 2 3 4 5 6 7 8

Size (Mb)

20 30 40 50 60 70

GC%

Y = -3,85 + ,136 * X; R^2 = ,646

Chlamydiae

(31)

2,475 ,433 2,475 5,716 <,0001

,016 ,010 ,105 1,579 ,1157

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10 12

Size (Mb)

20 30 40 50 60 70 80

GC%

Y = 2,475 + ,016 * X; R^2 = ,011

Firmicutes

,389 ,752 ,389 ,517 ,6062

,065 ,018 ,307 3,516 ,0006

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10 12

Size (Mb)

20 30 40 50 60 70 80

GC%

Y = ,389 + ,065 * X; R^2 = ,094

Bacilli

3,796 ,464 3,796 8,176 <,0001

-,010 ,011 -,093 -,943 ,3480

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10 12

Size (Mb)

20 30 40 50 60 70 80

GC%

Y = 3,796 - ,01 * X; R^2 = ,009

Clostridium

(32)

-1,917 ,290 -1,917 -6,610 <,0001

,114 ,005 ,697 21,161 <,0001

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10 12

Size (Mb)

20 30 40 50 60 70 80

GC%

Y = -1,917 + ,114 * X; R^2 = ,486

Proteobacteria

(33)

-,353 ,430 -,353 -,821 ,4125

,088 ,009 ,603 10,406 <,0001

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10

Size (Mb)

10 20 30 40 50 60 70 80

GC%

Y = -,353 + ,088 * X; R^2 = ,363 Gammaproteobacteria

-3,281 ,901 -3,281 -3,641 ,0005

,145 ,017 ,712 8,307 <,0001

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10

Size (Mb)

10 20 30 40 50 60 70 80

GC%

Y = -3,281 + ,145 * X; R^2 = ,507 DeltaEpsilon

-3,904 1,113 -3,904 -3,509 ,0008

,145 ,018 ,690 7,971 <,0001

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10

Size (Mb)

10 20 30 40 50 60 70 80

GC%

Y = -3,904 + ,145 * X; R^2 = ,476 Betaproteobacteria

-2,774 ,441 -2,774 -6,294 <,0001

,123 ,008 ,789 15,268 <,0001

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 2 4 6 8 10

Size (Mb)

10 20 30 40 50 60 70 80

GC%

Y = -2,774 + ,123 * X; R^2 = ,623 Alphaproteobacteria

(34)

0 1 2 3 4 5 6

Size (Mb)

20 25 30 35 40 45 50 55 60 65 70

GC%

Y = 2,551 - ,014 * X; R^2 = ,083

CRENARCHEOTAS

2,551 ,396 2,551 6,443 <,0001

-,014 ,008 -,288 -1,698 ,0991

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 1 2 3 4 5 6

Size (Mb)

20 25 30 35 40 45 50 55 60 65 70

GC%

Y = ,35 + ,047 * X; R^2 = ,308

EURYARCHAEOTA

,350 ,397 ,350 ,880 ,3816

,047 ,008 ,555 5,886 <,0001

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

0 1 2 3 4 5 6

Size (Mb)

20 25 30 35 40 45 50 55 60 65 70

GC%

Y = ,655 + ,037 * X; R^2 = ,187

ARCHAEAS

,655 ,353 ,655 1,855 ,0663

,037 ,007 ,432 5,076 <,0001

Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept

GC%

(35)

0 1 2 3 4 5 6 7 8 9 10

Units

Genome Size

Anaerobic Aerobic 0

2 4 6 8 10 12

Count

0 2 4 6 8 10 12

Genome Size

AEROBICOS

ANAEROBICOS

0 2 4 6 8 10 12 14

Count

0 2 4 6 8 10 12

Genome Size

(36)

20 30 40 50 60 70 80

G C C ont ent

0 1 2 3 4 5 6 7 8 9 10

Genome Size Y = 34,922 + 3,93 * X; R^2 = ,299

All species

20 30 40 50 60 70 80

G C C ont ent

0 1 2 3 4 5 6 7 8 9 10

Genome Size

Y = 38,594 + 3,825 * X; R^2 = ,319

Aerobic, N = 87

20 30 40 50 60 70 80

G C C ont ent

0 1 2 3 4 5 6 7 8 9 10

Genome Size

Y = 41,492 + 1,266 * X; R^2 = ,026

Anaerobic, N = 51

(37)

“Causas” de la variación del contenido

en GC

(38)

La gran variación en el contenido en GC genómico ha sido explicado por dos hipótesis mutuamente excluyentes: la seleccionista y la neutralista

Las primeras tienen en común que asumen que el GC% es una forma de adaptación a alguna(s?)

condiciones ecológicas o fisiológicas, mientras que la interpretación neutralista establece que las

variaciones encontradas se deben sólo a

diferentes sesgos mutacionales.

(39)

Sesgo mutacional:

a = u/v ; donde u = tasa de mutación de GC => AT v = tasa de mutación de AT => GC

Papel de las enzimas relacionadas con el metabo-

lismo del ADN (replicación, reparación, recom-

binación, etc.)

(40)

Históricamente, la mayoría de las hipótesis seleccionistas estaban limitadas a ciertos géneros, por ejemplo:

* Un incremento en GC% sería ventajoso para organismos expuestos a la radiación UV (Singer

& Ames, 1970).

* Las bacterias fijadoras de nitrógeno tienen niveles de GC% más altos que organismos

cercanos filogenéticamente, pero no fijadores

(McEwan et al ., 1998).

(41)

Dado que estas propuestas estaban limitadas a ciertos géneros, no pueden ser consideradas como fuerzas se- lectivas que influyen el GC% genómico en todos los

procariotas.

Por lo tanto, entre los principales argumentos en favor de la interpretación neutralista era que “no physiological or ecological trait in common among

prokaryotes with similar genomic composition has yet been found”

(Gautier, 2000).

(42)

Sin embargo, esto ha cambiado en los últimos años.

Discutiremos brevemente algunos hallazgos recientes que apoyan la visión seleccionista en este problema.

a) Procariotas parásitos b) Aerobiosis

c) Temperatura óptima de crecimiento

d) Relación entre el tamaño del genoma y el conteni-

do en GC%.

(43)
(44)

En este trabajo, se muestra que “genomes of bacteria that rely on their

hosts for survival (obligatory pathogens or symbionts) tend to be AT-rich”.

(45)

Los autores sugieren que “the higher energy cost and limited availability of G and C over A and T/U could be a basis for the understanding of these

differences”.

(46)

Disponibilidad (in E. coli ):

ATP = 3.5 mM

GTP = 1.9 mM

UTP = 2.0 mM

CTP = 1.2 mM

(47)

Es importante recalcar que estos hallazgos se aplican no sólo a parásitos, sino a otros elementos genéticos auto replicantes, no

esenciales, como plásmidos, transposones y

fagos.

(48)
(49)
(50)
(51)
(52)

*Es bien sabido que aunque las Especies Reactivas del Oxígeno (ROS) atacan todas las bases, la más

frecuentemente modificada es la G (8-oxo-guanine). Este nucleótido modificado induce transversiones G => T,

lo cual vuelve paradójico el aumento en GC!!

Además, se sabe que las transiciones GC => AT, y las transversiones GC => TA son las mutaciones más

comunes a partir del daño oxidativo al ADN.

*El caso del ADN mitocondrial de los mamíferos

(53)

Entonces, desde el punto de vista

estrictamente mutacionista, uno debería

esperar niveles de GC más bajos en los

procariotas aerobios!!!

(54)
(55)
(56)

Temperatura óptima de crecimiento (Topt)

y el contenido en GC%

(57)

Clasificación de los organismos de acuerdo a su Topt

• Psicrófilos < 20 °C

• Mesófilos 20 °C - 45 °C

• Termófilos 45 °C – 80 °C

• Hipertermófilos > 80 °C

(58)
(59)

Correlación entre Topt y el contenido en GC genómico

,25 ,35 ,45 ,55 ,65 ,75

GC

0 20 40 60 80 100

T opt

(60)

Bacillaceae Halobacteriaceae

(61)

Algunas conclusiones…

1) Probablemente conocemos los tamaños máximos y mínimos entre los procariotas

2) Conocemos también los valores máximos y mínimos en el contenido en GC

3) Conocemos que el aumento en el tamaño de los genomas se debe a la adaptación a nichos

complejos y cambiantes

4) Existe una vinculación entre GC, tamaño y

relación con el oxígeno

Referencias

Documento similar