ESTUDIO I: Caracterización de la proteína nsP1a/4 de astrovirus
3.2 Material y métodos
3.3.2 Análisis proteómicos computacionales.
Con el fin de obtener información sobre las posibles modificaciones post- traduccionales que podría sufrir la proteína nsP1a/4 y sobre otras características de la proteína, se utilizaron varios programas bioinformáticos de predicción para realizar un análisis proteómico computacional de dicha proteína. Las secuencias que se utilizaron en este análisis fueron las 5 secuencias del genoma completo de HAstV correspondientes a 4 serotipos diferentes. Los resultados se resumen en la Fig. 3.4.
Fig. 3.4 Representación esquemática del ORF1a de HAstV. (A) Variabilidad genética a lo largo de la
región codificante para nsP1a, estimada por el parámetro Pi (Jukes-Cantor) utilizando el programa DnaSP. Las posiciones hacen referencia a los nucleótidos en la cepa HAstV-1 de Oxford (Núm. acceso L23513).(B) Diagrama del producto nsP1a total. Las posiciones de aminoácido hacen referencia a la misma cepa). TM: Hélices transmembrana; PRO: motivo proteasa; NLS: región de localización nuclear; IRE: epítopo inmunoreactivo; CC: coiled coil; HVR: región hipervariable. Las flechas en negro indican potenciales lugares de corte, dependientes tanto de la proteasa vírica (pro) como de proteasas celulares (?). (C) Predicción de la estructura secundaria de la proteína nsP1a/4. A la izquierda
se muestran tanto las conformaciones en hélices α como láminas β, codificadas también por colores.
Las potenciales modificaciones post-traduccionales están representadas mediante símbolos (*: fosforilación en Ser/Thr; #: fosforilación en Tyr; ^: glicosilación en Asn), así como también los clusters de aminoácidos ácidos (A) y las estructuras coiled coil (CC).
El análisis de la estructura secundaria de la proteína reveló la presencia de muchas
? pro pro HV R V /A409 410 Q /567T568E654/I655 pro IRE TM TM TM TM 1 920 PRO TM CC CC CC * * * * * * ^ # #*# # C
Básicos Ácidos Pro-Gln
CC CC A A ##A # A * Ácidos * NL S A /H174 175 # # * * * *
A
B
C
Pi 0 0.18 nt 2829 nt 873. Caracterización de la proteína nsP1a/4 de astrovirus
60
descrito con anterioridad (Jonassen et al., 2003). Las estructuras coiled coil desempeñan una gran variedad de funciones, entre las cuales se encuentran la formación de grandes estructuras rígidas, la formación del esqueleto de complejos de regulación o incluso la unión al ADN (Lupas, 1996). En los resultados de nuestro análisis, la proporción de residuos aminoacídicos a los que no les fue asignada una determinada conformación de estructura secundaria fue mayor para la región del ORF1a centro de nuestro estudio, que para otras regiones del genoma, lo cual sugiere un mayor grado de flexibilidad estructural asociada a esta región. Además, también se pudieron describir motivos potenciales de modificación post-traduccional, tales como dos lugares de glicosilación en Asn y numerosos lugares de fosforilación en Ser/Thr (proteína kinasa C (PKC) o caseína kinasa II (CKII)) y de fosforilación en Tyr.
A raíz del análisis comparativo entre la composición de aminoácidos de la proteína nsP1a/4 y otras proteínas víricas, pudieron definirse varios dominios: un cluster de aminoácidos básicos, ubicado entre los aa 665-686 de nsP1a y que corresponde a la señal NLS previamente identificada (12 Lys+Arg en una región de 22 aa, 54.5%); un dominio acídico cargado negativamente ubicado entre los aa 690-749 de nsP1a (25 Asp+Glu en una región de 60 aa, 41.6%); una región rica en prolinas y glutaminas ubicada entre los aa 755-818 de nsP1a (11 Pro y 9 Gln en una región de 64 aa, 17.2% y 14.1%, respectivamente); y un dominio acídico ubicado entre los aa 821-890 de nsP1a (15 Asp+Glu en una región de 70 aa, 21.4%) (las posiciones de aa hacen referencia a la cepa de HAstV-1 de referencia, núm. acceso L23513). En general, las regiones ricas en aminoácidos ácidos, prolinas y glutaminas, en las cuales no se describe ninguna secuencia consenso, se han asociado a motivos presentes en dominios de factores de transcripción (Mermod et al., 1989). Además, también se detectó un elevado número de clusters de aminoácidos ácidos compuestos por al menos 4 aminoácidos de naturaleza ácida seguidos (A).
Cabe destacar que todos los motivos descritos a lo largo de la proteína nsP1a/4 estaban altamente conservados entre los diferentes serotipos, a excepción de la región hipervariable de aproximadamente 65 aa, ubicada entre las posiciones 758-823 de nsP1a (Núm. acceso L23513). Entre los diferentes serotipos de HAstV, esta región hipervariable varía enormemente tanto en longitud como en composición de aminoácidos, y el número y posición de los potenciales lugares de fosforilación también son muy variables (ver más adelante), lo cual sugiere que dichos motivos podrían desempeñar diferentes funciones biológicas según las distintas variantes de la proteína nsP1a/4.
Con el objetivo de identificar proteínas de otras familias víricas con cierto grado de similitud con la proteína nsP1a/4 de HAstV, se realizó una búsqueda computacional de homologías utilizando el programa BLAST. A diferencia de otras proteínas no estructurales, las cuales muestran grandes homologías con proteínas de otros virus ARN de polaridad positiva, todas las proteínas resultantes de la búsqueda únicamente mostraron niveles de
homología y similitud relativamente débiles. Los resultados más relevantes fueron proteínas de familias víricas que pertenecen tanto a la superfamilia picornavirus-like como alphavirus-
like. Concretamente, una región de 45 aa (aa 803-847 de L23513) mostró homología con el
dominio N-terminal de la poliproteína codificada por el RNA2 del grapevine fanleaf virus de la familia de virus de plantas Comoviridae, con un 42% de similitud (Núm. acceso P18474). Otra región de 18 aa (aa757-774 de L23513) mostró homología con la proteína no estructural nsP3 de Mayaro virus, miembro de la familia Alphaviridae, con un 61% de similitud (Núm. acceso AAL79763). Una característica interesante compartida por ambas proteínas es que su función está relacionada con la formación del complejo de replicación del ARN.
3.3.3 Análisis de la variabilidad genética: asociación entre subgenotipo y carga