Sección 1. Introducción general y objetivos
B. CutA
B.2. De PII a la superfamilia PII
Desde que se descubrió que E. coli tiene dos genes parálogos para proteínas PII (glnB y glnK) fue patente que las proteínas PII constituían una familia de al menos estos dos elementos (Xu et al., 1998; Thomas et al., 2000). Con la secuenciación de genomas se definieron tres subtipos de proteínas PII (Arcondéguy et al., 2001): i) GlnB, que controla a la GS, con cuyo gen generalmente forma un operón , coexpresándose con él, (Arcondéguy et al., 2001), ii) GlnK, cuyo gen se asocia al del canal de amonio AmtB al que controla (Radchenko et al., 2014), y iii) NifI, cuyo gen se asocia al operón multicistrónico de la nitrogenasa en arqueas y bacterias fijadoras de N2 (Arcondéguy et al., 2001). Esta familia se amplió más recientemente (Sant’Anna et al., 2009) con proteínas con identidad de secuencia reconocible y significativa con los tipos anteriores, aunque no encuadrables en los mismos. Para estos genes y proteínas se generó el nuevo grupo PII-NG (Fig. 5). Los genes para el grupo PII- NG con frecuencia se localizan junto a genes para transportadores de metales pesados (Sant’Anna et al., 2009).
La familia ampliada de PII forma parte de una superfamilia más extensa (Kinch y Grishin, 2002) construida tras un rastreo centrado en las proteínas canónicas de tipo PII que hizo uso transitivo de Blast-P. La superfamilia se compone de 7 grupos, de los que un grupo central al que denominaron grupo II
Figura 5. Clasificación de
la superfamilia PII propuesta por Sant’Anna et al. (2009)
14
incluye secuencias de la familia clásica PII. Las búsquedas encadenadas mediante Blast-P relacionaron los grupos IV y Va con la familia PII clásica vía similitudes con los grupos intermedios III y V, respectivamente (Fig. 6) (Kinch y Grishin, 2002).
Es de particular interés que para la identificación del grupo IV se utilizaron tanto criterios de similitud de secuencia (que dieron puntuaciones débiles de similitud con el grupo III y solo para la mitad C-terminal de las proteínas de los grupos III y IV) como la predicción de fold estructural, que arrojó para uno de los miembros del grupo IV la máxima nota para el fold ferredoxina de la
Figura 6. Superfamilia PII, de acuerdo con Kinch y Grishin (2002). Las flechas negras
indican que la detección del grupo se ha producido por Blast usando en la búsqueda las proteínas del grupo del que procede la flecha. Las flechas azules indican que la detección del grupo se ha producido por Blast y alineamiento de los grupos incluidos en el recuadro azul de línea discontinua. Las flechas granate indican que el grupo se ha detectado por Blast de secuencias individuales del grupo de procedencia e la flecha. Los identificadores COG se refieren a grupos de genes ortólogos de diferentes organismos que pueden encontrarse en la base de datos EggNOG (http://eggnogdb.embl.de/#/app/results). Modificado de (Kinch y Grishin 2002) con autorización de Wiley.
15
proteína spliceosomal U1A [archivo del Protein Data Bank (PDB) 1URN, cadena A]. Dado que esta proteína exhibe con pequeñas diferencias el mismo plegamiento que PII [patrón de estructura secundaria de tipo ferredoxina, (βαβ)2], este hallazgo dio mayor robustez a la adscripción del grupo IV a la superfamilia de PII. Este grupo IV es de particular interés para nosotros porque lo constituyen las proteínas CutA, objeto del Capítulo 3 de la Sección 2 de esta Tesis.
En el detallado trabajo de Kinch y Grishin (2002) se concluyó que los diferentes miembros de la superfamilia deberían ser homotrímeros con arquitecturas similares a PII, cuya estructura se había determinado ya por entonces (Cheah et al., 1994). También se predijo que en base a la comparación de secuencias era posible que mantuvieran la cavidad utilizada por PII para la unión de un nucleótido de adenina y de 2-oxoglutarato/ATP. Ambas conclusiones fueron corroboradas para la proteína CutA cuando se determinaron las estructuras de CutA de E.coli y rata (Arnesano et al., 2003).
Los estudios de conservación de secuencia de Kinch y Grishin (2002) también aportaron evidencias en contra de que el ATP fuera un ligando de las proteínas de la superfamilia que no pertenecían al grupo II. En resumen, se concluía que el sitio de unión de ligando parecía estar conservado en los trímeros de la superfamilia, pero que la especificidad del sitio debería variar. También señalaron en el caso de los miembros de los grupos III y IV que el sitio potencial de unión de ligando exhibía residuos cargados e invariantes en esos grupos. Igualmente, identificaron para estos grupos residuos conservados en el canal central del trímero, lo que les llevó a plantear la posibilidad de que las proteínas del grupo IV tuvieran alguna función de canal (Kinch y Grishin, 2002).
Más recientemente, Forchhammer y Lüddecke (2016) han sometido a análisis la familia de proteínas PII mediante comparación de las estructuras de
16
proteínas de esta familia depositadas en la base de datos PDB. En su estudio, la superfamilia comprende dos grupos, uno (Fig. 7, Proteínas PII) de proteínas que presentan tanto identidad estructural y carácter homotrimérico como identidad de secuencia significativa con proteínas PII genuinas (sin aplicación de un procedimiento transitivo a través de parálogos intermedios como hicieron Kinch y Grishin) y otro (Fig. 7, Proteínas con plegamiento tipo PII) que incluye proteínas con similitud estructural pero sin identidad significativa de secuencia con PII clásica. El primer grupo incluye proteínas de los subtipos GlnB, GlnK y NifI. El segundo incluye las proteínas de tipo CutA que, como ya se ha dicho, son objeto de una parte de este trabajo de tesis. Este grupo también incluye proteínas como PstA o DarA (Gundlach et al., 2015), que unen AMP cíclico, así como SbtB (Forchhammer y Lüddecke, 2016), un posible componente regulador de un transportador de bicarbonato dependiente de sodio (Shibata et al., 2002).
Todas estas proteínas comparten el ser homotrímeros de una subunidad de 100-170 aminoácidos [con excepciones representadas por proteínas del grupo III de Kinch y Grishin (2002), que son proteínas multidominio uno de cuyos
Figura 7. Clasificación de los miembros de la superfamilia PII propuesta por
17
dominios se corresponde con una proteína de esta superfamilia], en las que cada polipéptido presenta un plegamiento tipo ferredoxina (βαβ)2, ensamblándose el trímero por continuidad de sus hojas beta, que conforma una hoja β molecular cerrada de carácter tronco-cónico, con un poro-túnel central, mientras que las hélices α recubren externamente esa hoja β cerrada (Forchhammer y Lüddecke, 2016).
En resumen, tanto la comparación cuidadosa de secuencias aumentada con la predicción estructural (Kinch y Grishin, 2002) como el análisis primariamente estructural (Forchhammer y Ludeckke, 2016) confluyen en establecer que CutA es un miembro de la superfamilia PII. A continuación, pasamos a introducir los conocimientos existentes sobre la proteína CutA, que en dos de sus formas bacterianas es objeto de parte de esta memoria de Tesis.