El conjunto de estructuras calculadas para As-p18 proporciona modelos que mejor satisfacen las restricciones experimentales, a la vez que respetan la geometría de la estructura covalente proteica, exhibiendo valores de energía aceptables. Todos estos aspectos son revisados durante el proceso de validación que evalúa la calidad de las estructuras y la consistencia del modelo en términos estadísticos.
Selección de Estructuras o Ensemble
Una característica de la determinación de estructuras por RMN es que las restricciones empleadas durante el cálculo consideran rangos más que valores concretos para distancias, ángulos, etc. En consecuencia el resultado al que se arriba no es una estructura única, sino más bien una familia de confórmeros (o ensemble) que satisfacen los datos experimentales de una manera igualmente satisfactoria.
Para la elección de los confórmeros que integrarán el ensemble existe más de un criterio. Si bien no existe un consenso, los dos métodos más utilizados se basan o bien en el número de violaciones de restricciones experimentales o en la energía que reporta cada modelo (Spronk et al., 2004). Siguiendo este último criterio, pueden seleccionarse aquellos modelos cuyas energías estén por debajo de un punto de corte arbitrario. En el último paso de iteración durante el cálculo de As-p18 in vacuo, pudo observarse que la energía no presentaba un aumento significativo para los 60 primeros modelos (Figura 4.10). De esta manera se seleccionaron los 20 modelos que presentaron los valores experimentales de energía más bajos para la suma de los términos ENOE y ERDC.
Eligiendo las primeras 20 de 100, no solo escogemos un número manejable de estructuras para el ensemble, sino que además es de esperar que –dado que el número de violaciones por estructura es muy bajo– arribemos a una selección igualmente compatible con el criterio alternativo mencionado anteriormente (Spronk et al., 2004). Este conjunto de estructuras se sometió seguidamente a un refinamiento en solvente explícito (water refinement) y los 20 modelos resultantes se emplearon para el ensemble final de As-p18.
Ajuste del Ensemble de As-p18 a las Restricciones Experimentales
La precisión de las estructuras determinadas está directamente relacionada al número de restricciones experimentales empleadas durante el cálculo. De esta manera, cuantas más restricciones se incluyan, mayor será la resolución alcanzada (Nabuurs et al., 2004). Las estadísticas de las restricciones experimentales se resumen en la Tabla 4.7
Figura 4.10. Gráfico de las 100 estructuras de As-p18 calculadas en la iteración 8 ordenadas en forma ascendente según la energía total. Contribuciones NOE+RDC (barras azules). Energía total (barras naranjas).
Tabla 4.7. Estadísticas de las Restricciones Experimentales. Datos estadísticos provenientes de los 20 confórmeros refinados en agua. El número de violaciones se indica como un promedio por estructura.
0 500 1000 1500 2000 2500 3000 0 10 20 30 40 50 60 70 80 90 100 Estructuras En e rgía ( kc al m ol -1 ) NOE+RDC Total
Restricciones de Distancia NOE
Restricciones NOE 4529 Ambiguas 1687 No ambiguas 2842 Intra-residuo 1395 Inter-residuo 1447 Secuenciales (|i-j| = 1) 636 Medio alcance (1 < |i-j| < 5) 225 Largo alcance (|i-j| > 5) 586 Violaciones por estructura > 0.5 Å 0.05 Violaciones por estructura > 0.3 Å 2.90 RMSD de Rectricciones de Distancia 0.023Å Otras Restricciones
RDCs 113
Factor Q 0.33
Puentes de Hidrógeno 108
A fin de valorar cualitativamente la precisión de la familia de confórmeros, se cargaron las 20 estructuras del ensemble en el programa Pymol. Se examinó visualmente la variación entre modelos y pudo apreciarse que las cadenas principales, con claros elementos de estructura secundaria, eran prácticamente superponibles (Figura 4.11).
Sin embargo, esto no fue así para las regiones que ocupan los extremos de la secuencia y para las incluidas entre los residuos 48-55, 106-112, que coinciden con los loops entre las hebras β-B/β-C y β-G/β-H, respectivamente. Para estas regiones, se ve una mayor dispersión en el espacio cartesiano, reflejando la menor cantidad de restricciones en esa área, pudiendo esto último ser atribuido, en algunos casos, a procesos dinámicos (ver Capítulo 5).
Análogamente, para una evaluación cuantitativa de la similitud de las estructuras en el ensemble, se calculó la desviación estándar (RMSD) de las coordenadas atómicas de cada estructura en relación a una estructura media no sesgada generada a partir del la familia de confórmeros. Se utilizó el programa UWMN (UnWeightedMeaN; M. Hartshorn y L. Cuevas, Universidad de York) para crear una matriz de distancias promedio entre los átomos de todos los modelos del ensemble. Seguidamente esta
Figura 4.11. Visión estereoscópica de los 20 modelos superpuestos de As-p18. Se muestra el esqueleto aminoacídico coloreado desde el azul (N-terminal) al rojo (C-terminal). Imagen creada con el software PyMOLTM .
matriz de distancia se proyecta de nuevo en un espacio tridimensional para producir una estructura media no sesgada.
Se calculó el valor de RMSD para los átomos pesados totales y de la cadena principal, y para la totalidad de los Ca, tanto para la secuencia de As-p18 madura –sin tag–, como para los residuos pertenecientes a segmentos estructurados. Estos últimos se definieron en base a los elementos de estructura secundaria, excluyendo los loops y segmentos N- y C-terminales.
El análisis de restricciones y RMSD por residuo, revela una correlación lógica donde las regiones estructuradas definidas del conjunto se caracterizan por un elevado número de restricciones NOE, mientras que los loops (en especial el loop entre los residuos 48 y 55) y los segmentos N- y C-terminales tienen escasos NOEs (Figura 4.12), que consisten principalmente en restricciones de corto alcance, secuenciales.
1-143 Regiones estructuradas
Átomos pesados totales 0.88 0.77
Átomos pesados cadena principal 0.53 0.41
Ca 0.55 0.42
RMSD respecto a la estructura promedio (Å)
Tabla 4.8. RMSD calculado con el software UWMN para la proteína completa sin tag y para las regiones estructuradas. Residuos seleccionados como parte de regiones estructuradas: 5-7; 10-17; 19-26; 31-38; 42-47; 56-61; 66-72; 75-82; 85-96; 99-105; 113-121; 124-131; y 134-141.
Calidad Geométrica del Ensemble de As-p18
Para evaluar la calidad geométrica de las estructuras, se calcularon las desviaciones de distintos parámetros, derivados de los modelos experimentales, con respecto a valores idealizados sobre una base empírica general. Como se muestra en la Tabla 4.9, tanto para las distancias y ángulos de enlace, como para los ángulos impropios, pudo comprobarse que las restricciones experimentales se ajustaron a los valores empíricos.
Figura 4.12. Relación entre restricciones de distancia NOE y RMSD en la estructura de As-p18. Se muestra el número de restricciones NOE no ambiguas empleadas en el cálculo final in vacuo y los valores de RMSD correspondientes por residuo para las 20 estructuras del ensemble. Entre los dos gráficos se representan los elementos de estructura secundaria a lo
RMSD con respecto a geometría ideal
Longitud de enlace (Å) 0.01 ± 0.00
Ángulo de enlace (°) 0.57 ± 0.02
Ángulo impropio (°) 1.67 ± 0.06
La calidad geométrica también puede evaluarse acorde a la distribución de los ángulos de torsión de la cadena principal y lateral de cada residuo en la proteína (Morris et al., 1992). Para el caso de As-p18, esta información se recabó empleando el programa PROCHECK-NMR (Laskowski et al., 1996) y se muestra en el Apéndice E. Las estadísticas de Ramachandran para la totalidad de los residuos (excluyendo a glicinas y prolinas) se muestran en la Tabla 4.10.
Más del 98 % de los residuos se encontraron en las zonas favorables o permitidas corroborando así la alta calidad de las estructuras, poseedoras de una correcta geometría covalente. Analizando exhaustivamente los gráficos de Ramachandran para cada residuo (Apéndice E), pudo comprobarse que aquellos que integraban segmentos de estructura secundaria, se situaban dentro o muy próximos a las zonas favorables. Por otro lado, algunos residuos ubicados en el extremo C-terminal o en loops (como 49Ala, 54Asp, 65Lys y 85Ser), mostraron una mayor variabilidad en los ángulos φ y , probablemente debido a la escasez de restricciones que definieran esas regiones.
Finalmente, se analizaron los valores de 1 para evaluar la calidad geométrica de los ángulos de torsión de cadenas laterales. Los resultados generados por PORCHECK- NMR (Apéndice E) mostraron valores de 1 bien definidos para la mayoría de los residuos, en los 20 modelos de As-p18. Por último, no se encontraron residuos con
Tabla 4.9. Resumen de las desviaciones del ensemble de As-p18 respecto a valores ideales empíricos.
Grupos de residuos N° de residuos %
Residuos en zonas más favorables 2122 82.2
Residuos en zonas permitidas 420 16.3
Residuos en zonas generosamente permitidas 20 0.8
Residuos en zonas prohibidas 18 0.7
Tabla 4.10. Resumen de las estadísticas de Ramachandran para el ensemble de As-p18 determinadas por PROCHECK-NMR.
valores de 1 que cayeran por fuera de las regiones favorables.
Figura 4.13. Representación de Ramachandran de la estructura de As-p18 (ensemble de 20 modelos). Código de colores: rojo, zona más favorable; amarillo, zona permitida; amarillo claro, zona generosamente permitida; blanco, zona prohibida. Con triángulos se representan los residuos de glicina, y con cuadrados el resto de residuos (blancos, en zonas favorables; rojos, en zonas desfavorables). Diagrama generado por PROCHECK-NMR.