Algunos aspectos de la organización y evolución del genoma procariota
Héctor Musto
[email protected]
Microbios (bacterias y archaea)
90%
de la biomasa terrestre
es microbiana!
“Todo lo que hacen los eucariotes lo inventaron primero los microbios”
Marc Chippaux
Etc, etc, etc…
Pero, además…
Microbios: primeras formas de vida sobre la Tierra!
Importantísimos determinantes de salud/enfermedad Fertilizan los suelos y purifican las aguas
Poseen la mayor diversidad genética y bioquímica en toda la biósfera
Gobiernan los ciclos de numerosos nutrientes y elementos
Colonizan TODOS los ambientes posibles (incluso los “extremos”…) Componentes fundamentales de TODOS los sistemas biológicos
Modelan constantemente la faz de la Tierra (desde hace 3.8 Ga)!
Seres vivos más abundantes en el planeta!
Son los actores principales de la BIOTECNOLOGIA
Estructura del genoma bacteriano
Tamaño Geometría Número Ploidía
Composición de bases
Concepto de cromosoma en bacterias
Estructura del genoma bacteriano
Qué es un cromosoma bacteriano???
Molécula circular de ADN (“desnudo”) libre en citoplasma
Un sólo replicón ( ori y ter en extremos opuestos) Portador de genes “esenciales” (idem)
Transferencia vertical (una célula parental a descendientes) Secuencia y estructura poco variables a nivel de especie Gran tamaño (por contraposición con plásmidos)
Localización aleatoria y dispersa en el citoplasma bacteriano (nucleoide) Ausencia de estructuras organizadoras/compactadoras
Sujeto a la acción de fuerzas evolutivas que lo remodelan
Una única copia por célula (“monoploidía”)
Número de procariotas secuenciados
• Archaeas: 332
• Bacterias: 4862
Datos tomados del GenBank el 8/9/2014.
Solamente se consideran genomas completos, correctamente
anotados!!!
Organización General
Escalas en las que nos movemos
Genes
0 2 4 6 8 10 12 14 16 18 20
Count
0 1000 2000 3000 4000 5000 6000 7000
Genes
Archaeas
0 10 20 30 40 50 60 70 80 90
Count
0 2000 4000 6000 8000 10000
Genes
Bacterias
Número de genes por especie
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500
Genes
0 1 2 3 4 5 6
Size (Mb)
Y = 336,261 + 893,963 * X; R^2 = ,944
Archaeas
0 2000 4000 6000 8000 10000 12000
Genes
0 2 4 6 8 10 12 14 16
Size (Mb)
Y = 207,664 + 871,39 * X; R^2 = ,971
Bacterias
Correlación entre tamaño del genoma y
número de genes
Tamaño medio de genes (en aas)
0 10 20 30 40 50 60 70 80 90
Count
10 20 30 40 50 60 70 80
GC%
Bacterias
Contenido de GC en procariotas
0 2 4 6 8 10 12
Count
10 20 30 40 50 60 70 80
GC%
Archaea
20 30 40 50 60 70 80
GC% Actinobacteria Aquificae Armatimonadetes Bacteroidetes/Chlorobi group Caldiserica Chlamydiae/Verrucomicrobia group Chloroflexi Chrysiogenetes Cyanobacteria Deferribacteres Deinococcus-Thermus Dictyoglomi Elusimicrobia Fibrobacteres/Acidobacteria group Firmicutes Fusobacteria Gemmatimonadetes Nitrospirae Planctomycetes Proteobacteria Spirochaetes Synergistetes Tenericutes Thermodesulfobacteria Thermotogae
CONTENIDO EN GC
20 30 40 50 60 70 80
GC% Crenarchaeota Euryarchaeota
GC skew
Historia de su descubrimiento
(G-C)/(G+C)
GCskew
- 0, 25 - 0, 20 - 0, 15 - 0, 10 - 0, 05 0, 00 0, 05 0, 10 0, 15 0, 20 0, 25
1 15 29 43 57 71 85 99 113 127 141 155 169 183 197
GCskewAc
-10,00 -8,00 -6,00 -4,00 -2,00 0,00 2,00 4,00 6,00
1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199
“GC skew”
1) Rápida identificación de las hebras líder y lagging de la replicación
2) Identificación aproximada de secuencias
“ori” y “ter”
3) Exceso de genes en la hebra líder
4) Prácticamente todos los genes de alta
expresión se ubican en la hebra líder
5) Rearreglos
Tamaño del Genoma
0 10 20 30 40 50 60 70 80
Count
0 2 4 6 8 10 12 14 16
Size (Mb)
Bacteria
0 5 10 15 20 25
Count
0 2 4 6 8 10 12 14 16
Size (Mb)
Archaea
0 1 2 3 4 5 6 7 8 9 10
Size (Mb) Actinobacteria Aquificae Armatimonadetes Bacteroidetes/Chlorobi group Caldiserica Chlamydiae/Verrucomicrobia group Chloroflexi Chrysiogenetes Cyanobacteria Deferribacteres Deinococcus-Thermus Dictyoglomi Elusimicrobia Fibrobacteres/Acidobacteria group Firmicutes Fusobacteria Gemmatimonadetes Nitrospirae Planctomycetes Proteobacteria Spirochaetes Synergistetes Tenericutes Thermodesulfobacteria Thermotogae
TAMAÑO DEL GENOMA
0 1 2 3 4 5 6 7 8 9 10
Crenarchaeota Euryarchaeota
-,600 ,179 -,600 -3,348 ,0008 ,086 ,004 ,570 24,477 <,0001 Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
Regression Coefficients Size (Mb) vs. GC%
0 2 4 6 8 10 12 14 16
Size (Mb)
10 20 30 40 50 60 70 80
GC%
Y = -,6 + ,086 * X; R^2 = ,325
-9,625 1,738 -9,625 -5,537 <,0001
,221 ,026 ,583 8,458 <,0001
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10 12 14
Size (Mb)
40 45 50 55 60 65 70 75 80
GC%
Y = -9,625 + ,221 * X; R^2 = ,34
Actinobacterias
2,973 1,018 2,973 2,920 ,0046
,024 ,023 ,118 1,047 ,2984
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10 12 14
Size (Mb)
20 30 40 50 60 70 80
GC%
Y = 2,973 + ,024 * X; R^2 = ,014
Bacteroidetes
10,078 2,210 10,078 4,560 ,0002
-,095 ,048 -,396 -1,978 ,0612
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10 12 14
Size (Mb)
20 30 40 50 60 70 80
GC%
Y = 10,078 - ,095 * X; R^2 = ,157
Cianobacteria
-3,850 1,150 -3,850 -3,348 ,0044
,136 ,026 ,804 5,228 ,0001
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 1 2 3 4 5 6 7 8
Size (Mb)
20 30 40 50 60 70
GC%
Y = -3,85 + ,136 * X; R^2 = ,646
Chlamydiae
2,475 ,433 2,475 5,716 <,0001
,016 ,010 ,105 1,579 ,1157
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10 12
Size (Mb)
20 30 40 50 60 70 80
GC%
Y = 2,475 + ,016 * X; R^2 = ,011
Firmicutes
,389 ,752 ,389 ,517 ,6062
,065 ,018 ,307 3,516 ,0006
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10 12
Size (Mb)
20 30 40 50 60 70 80
GC%
Y = ,389 + ,065 * X; R^2 = ,094
Bacilli
3,796 ,464 3,796 8,176 <,0001
-,010 ,011 -,093 -,943 ,3480
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10 12
Size (Mb)
20 30 40 50 60 70 80
GC%
Y = 3,796 - ,01 * X; R^2 = ,009
Clostridium
-1,917 ,290 -1,917 -6,610 <,0001
,114 ,005 ,697 21,161 <,0001
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10 12
Size (Mb)
20 30 40 50 60 70 80
GC%
Y = -1,917 + ,114 * X; R^2 = ,486
Proteobacteria
-,353 ,430 -,353 -,821 ,4125
,088 ,009 ,603 10,406 <,0001
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10
Size (Mb)
10 20 30 40 50 60 70 80
GC%
Y = -,353 + ,088 * X; R^2 = ,363 Gammaproteobacteria
-3,281 ,901 -3,281 -3,641 ,0005
,145 ,017 ,712 8,307 <,0001
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10
Size (Mb)
10 20 30 40 50 60 70 80
GC%
Y = -3,281 + ,145 * X; R^2 = ,507 DeltaEpsilon
-3,904 1,113 -3,904 -3,509 ,0008
,145 ,018 ,690 7,971 <,0001
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10
Size (Mb)
10 20 30 40 50 60 70 80
GC%
Y = -3,904 + ,145 * X; R^2 = ,476 Betaproteobacteria
-2,774 ,441 -2,774 -6,294 <,0001
,123 ,008 ,789 15,268 <,0001
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 2 4 6 8 10
Size (Mb)
10 20 30 40 50 60 70 80
GC%
Y = -2,774 + ,123 * X; R^2 = ,623 Alphaproteobacteria
0 1 2 3 4 5 6
Size (Mb)
20 25 30 35 40 45 50 55 60 65 70
GC%
Y = 2,551 - ,014 * X; R^2 = ,083
CRENARCHEOTAS
2,551 ,396 2,551 6,443 <,0001
-,014 ,008 -,288 -1,698 ,0991
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 1 2 3 4 5 6
Size (Mb)
20 25 30 35 40 45 50 55 60 65 70
GC%
Y = ,35 + ,047 * X; R^2 = ,308
EURYARCHAEOTA
,350 ,397 ,350 ,880 ,3816
,047 ,008 ,555 5,886 <,0001
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 1 2 3 4 5 6
Size (Mb)
20 25 30 35 40 45 50 55 60 65 70
GC%
Y = ,655 + ,037 * X; R^2 = ,187
ARCHAEAS
,655 ,353 ,655 1,855 ,0663
,037 ,007 ,432 5,076 <,0001
Coefficient Std. Error Std. Coeff. t-Value P-Value Intercept
GC%
0 1 2 3 4 5 6 7 8 9 10
Units
Genome Size
Anaerobic Aerobic 0
2 4 6 8 10 12
Count
0 2 4 6 8 10 12
Genome Size
AEROBICOS
ANAEROBICOS
0 2 4 6 8 10 12 14
Count
0 2 4 6 8 10 12
Genome Size