Modelización de proteínas - Modelo de interacción molecular de metabolitos presentes en la espe

La cristalografía por rayos X o espectroscopia de resonancia magnética nuclear (RMN) han sido los métodos ideales para la determinación estructural de una proteína dada. No obstante, esto abarca las siguientes desventajas:

- Ciertas proteínas no son fácilmente cristalizables. Por un lado, no se obtienen

grandes cantidades de proteína en la purificación, y por otro, aspectos técnicos.

- La RMN presenta mejores tiempos de respuesta que la cristalografía, sin

embargo, no puede ser aplicada a proteínas mayores de 100 residuos.

Debido a la secuencialidad de ciertos residuos en la estructura secundaria y que la información necesaria para el adecuado plegado de una proteína parece estar contenida en su estructura primaria, uno de los grandes retos que presenta la bioinformática es la predicción de estructuras terciarias (Aguirre Valderrama, 2009).

3.5.1. Métodos de modelización de proteínas

3.5.1.1. Homología de proteínas

La caracterización funcional de una secuencia de proteínas es uno de los problemas más frecuentes en biología. Esto es usualmente facilitado por medio del uso de estructuras tridimensionales precisas. En ausencia de una estructura determinada experimentalmente, el modelamiento comparativo o por homología puede muchas veces proveer de un modelo 3D útil para una proteína (objetivo) que es relacionada con al menos una proteína de estructura conocida (molde).

La estructura tridimensional de las proteínas de la misma familia es más conservada que su secuencia primaria. Así, si la similaridad entre dos proteínas son detectadas al nivel secuencial, la similaridad estructural puede ser usualmente asumida. Sin embargo, las proteínas que comparten un baja similaridad secuencial a menudo podrían tener una estructura similar. Actualmente, la probabilidad de encontrar proteínas relacionadas de estructura conocida para una secuencia elegida aleatoriamente de un genoma varía aproximadamente de 20 a 65%, dependiendo del genoma. Aproximadamente la mitad de todas las secuencias tienen al menos un dominio que se relaciona detectablemente con al menos una proteína de estructura conocida. Dado que el número de proteínas de estructura conocida es de

aproximadamente de 1’200.000, el modelado comparativo puede ser aplicado a dominios de aproximadamente 600.000 proteínas (Aguirre Valderrama, 2009).

3.5.1.2. Pasos en el modelamiento de proteínas.

El desarrollo del modelo de homología es un proceso que se componen en diferentes pasos, los cuales se pueden dividir en: (1) identificación de la plantilla, (2) alineación con secuencias simples o múltiples, (3) construcción del modelo para el objetivo basado en la estructura 3D de la plantilla, (4) refinamiento del modelo, análisis de alineaciones, eliminaciones y adiciones de brechas y (5) validación del modelo.

- Identificación de la plantilla: En este paso inicial el servidor o programa compara la secuencia de la estructura desconocida con la estructura conocida almacenada en las bases de datos. El servidor o base de datos más conocido es BLAST (herramienta de búsqueda de alineación local básica), BLAST realiza una búsqueda contra la base de datos para alineamientos locales óptimos, el resultado de dicha búsqueda es una lista de estructuras proteicas conocidas que coinciden con la secuencia objetivo. BLAST no puede encontrar un molde cuando la identidad de la secuencia está por debajo del 30% (Vyas et al, 2012). En los últimos años, los métodos de perfil han surgido como el enfoque principal en la detección de homología distante. Estos métodos comienzan con la búsqueda en pares de bases de datos, utilizando las alineaciones significativas para construir una matriz de puntaje de posición específica (PSSM). Esta matriz reemplaza la secuencia de consulta en la siguiente ronda de búsqueda en la base de datos. Este procedimiento puede repetirse hasta que no se encuentren nuevas alineaciones significativas. El método de perfil de búsqueda puede mejorarse aún más utilizando información evolutiva para las proteínas de consulta y de destino, donde se compara un perfil de la proteína de consulta con los perfiles de las proteínas diana (Zhexin, 2016). Un perfil es un conjunto de vectores, donde cada vector contiene la frecuencia de cada

probabilidad de un aminoácido en este vector. (Ohlson et al, 2004) han demostrado que los métodos del perfil tienen al menos un 30% mejor capacidad de reconocimiento de proteínas que los métodos estándar (Zhexin, 2016).

- Alineamiento de la secuencia diana con la plantilla: En este paso se establecen equivalencias estructurales o secuenciales entre la secuencia objetivo y los moldes. Este alineamiento es relativamente fácil de obtener cuando la identidad de la secuencia entre el objetivo y el molde es mayor al 40%. Identidades por encima del 70% indican que los modelos obtenidos por homología serán de alta precisión, con desviaciones rms de la estructura nativa del orden de 1Å o 2Å. Si por el contrario, el porcentaje de identidad es menor al 40% el modelo obtenido tendrá huecos (gaps) y necesitará de intervención manual para minimizar el número de residuos no alineados, las estructuras obtenidas tienen generalmente desviaciones rms mayores a 4 Å (Aguirre Valderrama, 2009).

- Construcción del modelo: Después del alineamiento entre la secuencia objetivo y la secuencia molde, el siguiente paso en el modelamiento es la construcción del modelo. Una variedad de métodos puede ser utilizada para llevar a cabo dicha tarea. Generalmente el ensamblaje de cuerpo rígido, la similitud de segmentos, la restricción espacial y la evolución artificial son métodos usados para la construcción de modelos. La construcción del modelo por medio del ensamblaje de cuerpo rígido se basa en la disección natural de la estructura de proteína en las regiones centrales conservadas, los bucles variables que los conectan y las cadenas laterales que componen la estructura principal. La precisión del modelo se basa en la selección de la plantilla y la precisión de alineación. La similitud entre segmentos es una técnica que construye el modelo mediante el uso de un subconjunto de posiciones atómicas a partir de las estructuras de las plantillas como posiciones de guía, y por medio de la identificación y el montaje corto. El modelado por satisfacción de restricciones espaciales se basa en la generación de muchas restricciones en la estructura de la secuencia objetivo, usando su alineación a estructuras de proteínas relacionadas como guía.

- Refinamiento del modelo: Este proceso es de vital importancia en el proceso de homología, ya que requiere de un muestreo eficiente para el espacio conformacional y un medio para identificar con precisión las estructuras cercanas a la nativa. El proceso de refinamiento del modelo generalmente comenzará con un proceso de minimización de energía, usando alguno de los campos de fuerza mencionados anteriormente. Además, para un mayor refinamiento se pueden aplicar técnicas como dinámica molecular, Monte Carlo y muestreo basado en algoritmos genéticos. La precisión de alineación por modelado depende en gran medida del grado de similitud de secuencia. La desalineación de los modelos a veces resulta en errores que pueden ser difíciles de eliminar en las últimas etapas de refinamiento (Vyas et al, 2012).

In document Modelo de interacción molecular de metabolitos presentes en la especie Cannabis satival con la enzima ciclooxigebasa-1 (COX1) y la enzima ciclooxigensa-2 (COX2) de homo sapines (página 55-59)