• No se han encontrado resultados

Alineamiento múltiple de estructuras de proteínas

N/A
N/A
Protected

Academic year: 2020

Share "Alineamiento múltiple de estructuras de proteínas"

Copied!
8
0
0

Texto completo

(1)

Universidad de las Ciencias Informáticas

Título: Alineamiento múltiple de estructuras de proteínas.

Autora: Nara Lidia Pérez Solá

e-mail:

[email protected]

CIUDAD DE LA HABANA, CUBA

(2)

Resumen

La comparación tridimensional o en el espacio de varias estructuras de proteínas, con el objetivo de encontrar residuos espacialmente equivalentes, constituye, en la actualidad, una importante tarea a desarrollar en el campo de las investigaciones bioinformáticas. Mediante la comparación, se pueden identificar las regiones conservadas entre proteínas diferentes, generar hipótesis sobre sus relaciones evolutivas, predecir nuevas funcionalidades a partir de la comparación con otras proteínas mejor estudiadas, así como, estudiar las enfermedades que son provocadas por mutaciones de las proteínas. Muchos trabajos han sido desarrollados en los últimos años con este objetivo. Estos se diferencian entre sí por el método o algoritmo implementado, además del nivel de la estructura y el número de proteínas que intervienen en el alineamiento. En el presente trabajo se describen los diferentes tipos de métodos de comparación de proteínas, sus ventajas, desventajas, principales características y su importancia para el estudio de las proteínas.

Palabras Claves:

¾ Alineamiento

¾ Estructuras de Proteínas

¾ Residuos

Abstract

The three-dimensional, or the space of some protein structures with the purpose of finding space equivalent remainders, is

nowadays an important task to be developed in the field of Bioinformatics investigations. By means of the comparison it is

possible to identify the spaces between different proteins, to generate hypothesis over its evolution as well as to foretell new

functions as the result of the comparison with other proteins studied before. Lots of research projects related to this matter have

been carried out all these years. These works are different according to, in the first place, the method or algorithm used, the level

of the structure and the number of protein that has to do with the alignment. In this work different methods to compare proteins,

advantages, disadvantages and the main characteristics are well described as well as its importance to further studies related to

proteins.

Keywords:

¾ Alignment

¾ Protein Structures

(3)

Introducción

Las proteínas representan las biomoléculas más abundantes dentro de los organismos vivos, pues constituyen más del 50% del peso seco de las células. Estas desempeñan varias funciones, tales como: catalizadoras de reacciones metabólicas (enzimas), en el transporte de Dióxido de Carbono y Oxígeno (Hemoglobina), en la protección inmunológica, en la coagulación sanguínea (Fibrinógeno), entre otras. Prácticamente no existe proceso biológico en el cual no participe por lo menos una proteína. Se les considera como el grupo de compuestos que mayor cantidad de funciones desempeñan en los seres vivos. Y es precisamente, debido a este importante rol, que científicos y biólogos han invertido grandes esfuerzos y recursos en su estudio, para el análisis de enfermedades y la elaboración de nuevos fármacos.

Las proteínas están constituidas por cadenas lineales de aminoácidos unidos mediante enlaces peptídicos, pueden estar formadas por una o varias cadenas peptídicas y su estructura viene definida por cuatro niveles estructurales: estructura primaria, secundaria, terciaria y cuaternaria.

La estructura primaria viene determinada por la secuencia de aminoácidos en la cadena proteica, es decir, el número de aminoácidos presentes y el orden en que están enlazados. La conformación espacial de una proteína se analiza en términos de estructura secundaria (plegamiento que la cadena polipeptídica adopta) y estructura terciaria (disposición tridimensional de todos los átomos que componen la proteína). La asociación de varias cadenas polipeptídicas, origina un nivel superior de organización, la llamada estructura cuaternaria.

La estructura terciaria de una proteína, es la responsable directa de sus propiedades biológicas y la cuaternaria, es el nivel más complejo, el cual lo pueden tener, proteínas complejas, como: las enzimas y los anticuerpos.

Estructura primaria

(4)

Estructura Terciaria Estructura Cuaternaria

Fig. 1: Estructuras de una proteína.

A la hora de analizar la estructura de las proteínas, no se debe analizar solamente en sentido de la secuencia lineal de los aminoácidos. Una misma secuencia lineal de aminoácidos puede adoptar múltiples conformaciones en el espacio. Además un simple cambio en la secuencia o en el entorno en donde se pliegue la proteína, puede significar un cambio en la disposición tridimensional de estas, y por lo tanto en su función.

Un alineamiento de secuencias es una comparación entre la cadena lineal de aminoácidos (estructura primaria) de dos o más proteínas y un alineamiento de estructura, es otro tipo comparación de proteínas basado en el alineamiento de su estructura tridimensional. Este proceso se aplica generalmente a la estructura terciaria de las proteínas.

Es importante entender la estrecha relación que existe entre la estructura de las proteínas y su función, ya que, mutaciones en las proteínas, (modificaciones en los residuos originales) podrían ocasionar la pérdida o el mal funcionamiento de la misma, alterando alguna vía metabólica.

En ocasiones sucede que una estructura completa de proteína no es la responsable de algunas de sus funciones sino que solamente una porción de ella es la que interactúa con su entorno atribuyéndole determinada función. A esta parte de la

proteína que le atribuye cierta y determinada función se le denomina dominio.

(5)

La comparación de estructuras tridimensionales de proteínas es una de las principales herramientas utilizadas para el estudio de estas macromoléculas. Los métodos de comparación de estructuras de proteínas también juegan un rol importante en la validación de otros métodos bioinformáticos, tales como, los métodos de alineamiento de secuencias y los métodos de predicción del tipo de plegamientos. Y, un alineamiento múltiple de estructuras de proteínas es una comparación entre varias estructuras de proteínas.

Desarrollo

Base de Datos estructurales de Proteínas: The Protein Data Bank (PDB)

En los últimos años, muchísimos métodos para realizar alineamientos múltiples de estructuras de proteínas han sido desarrollados, siendo usados, en su gran mayoría, para construir bases de datos para la clasificación de estructuras de proteínas.

Debido a la importancia que representa el estudio de las estructuras de las proteínas, por la estrecha relación con su función, se han desarrollado varias técnicas y tecnologías con el objetivo de determinar la estructura tridimensional de las proteínas, entre las que podemos mencionar a la cristalografía de rayos X. Como resultado se ha creado una base de datos de estructura de proteínas.

La base de datos de la estructura de las proteínas también llamado PDB por sus siglas en inglés (protein data bank), contiene los archivos con la posición de cada átomo en un eje de coordenadas tridimensional, que conforman una proteína. Este archivo de coordenadas, no solo considera el esqueleto de la proteína sino todas aquellas moléculas con las que se haya resuelto en conjunto con la estructura de la proteína.

Comparación de proteínas: Alineamiento Múltiple de estructuras de proteínas.

En los últimos años, como resultado del avance tecnológico, el número de secuencias y de estructuras de proteínas en sus respectivas bases de datos se ha multiplicado, haciendo viables y necesarias el desarrollo de herramientas bioinformáticas que permitan descubrir relaciones evolutivas y estructurales entre las proteínas. La comparación de proteínas es un proceso a partir del cual, se pueden inferir estructuras y funcionalidades a partir de la similitud entre las secuencias o las estructuras de proteínas.

Un alineamiento de estructura, es otro tipo comparación de proteínas basado en el alineamiento de su estructura tridimensional. Este tipo de alineamiento, trata de establecer equivalencias entre la conformación espacial de dos o más proteínas en busca de residuos espacialmente equivalentes.

(6)

Un alineamiento múltiple de estructuras de proteínas es una comparación entre varias estructuras de proteínas con la finalidad de encontrar residuos espacialmente equivalentes. Este tipo de alineamiento no solo se realiza a partir de la información de la estructura completa de las proteínas sino que también es usado para comparar dominios específicos. Por lo cual el alineamiento múltiple de estructuras es una importante herramienta para la clasificación automática de dominios de proteínas.

Métodos para la realización de alineamientos de estructuras de proteínas.

En la actualidad se desarrollan muchos métodos para realizar alineamientos múltiples de estructuras de proteínas. La mayoría de ellos, utilizan el cálculo del RMSD (Root Mean Square Deviation), que no es más que el cálculo de una distancia que expresa la diferencia estructural de dos topologías. De este modo, cuanto menor sea el valor de RMSD de comparación de dos o más estructuras, mayor es la similitud de las mismas. Pero este método puede fallar cuando la correspondencia estructural entre los residuos de las proteínas comparadas no es evidente. Este efecto es obviado por algunos métodos, ya que se van seleccionando trozos de proteínas para realizar la comparación estructural. A medida que los fragmentos seleccionados disminuyen de tamaño, la superposición es mejor.

En los últimos años se han desarrollado varias metodologías para obtener comparaciones estructurales de proteínas no relacionadas, sin embargo estas metodologías implican un gran número de cálculos y realizar un análisis global del PDB resulta imposible. Otra importante limitación son los procedimientos matemáticos que se utilizan y las implicaciones geométricas que suponen los algoritmos utilizados.

Uno de los métodos más populares es el DALI, el cual fue usado para construir la base de datos FSSP (Families of Structurally Similar Proteins), en la cual todas las estructuras de proteínas conocidas son alineadas con las demás para determinar las proteínas con estructuras semejantes y así su clasificación y donde cada proteína cristalizada tiene un fichero FSSP que contiene todos sus homólogos estructurales.

El server de Dali permite consultar el fichero FSSP de una proteína, correr coordenadas tridimensionales contra la base de datos, correr entre ellos dos conjuntos de coordenadas 3D, etc.

(7)

El CE (Combinatorial Extension) es otro método, muy semejante al DALI, y al igual que este, también ha sido usado para

construir una base de datos para la clasificación de estructuras de proteínas. Este proporciona una reducción significativa en el espacio de la búsqueda. CE no resuelve, las llamadas “similitudes no topológicas” donde el orden de los fragmentos polipéptidos en las estructuras alineadas no sigue su orden en la secuencia.

Varias propiedades pueden ser utilizadas también con el algoritmo CE: superposición de estructuras, distancia entre los residuos, propiedades ambientales, propiedades de la conformación

Otros de los métodos de alineamiento menos utilizados son: MAMMOTH MAMMOTH (Matching Molecular Models Obtained From Theory) y el LGA (Zemla, 2003).

El MALECON, es un método progresivo combinado para el alineamiento múltiple de estructuras de proteínas desarrollado en el Centro de Ingeniería Genética y Biotecnología de Cuba (CIGB). Éste busca en una librería de alineamientos de pares, tres proteínas alineadas en las cuales un número específicos de aminoácidos esta consecuentemente alineado. Estos alineamientos son progresivamente expandidos para incluir proteínas adicionales y más residuos espacialmente equivalentes sujetos a determinado criterio. Esta acción incluye superponer las proteínas alineadas por sus residuos equivalentes y buscan los átomos de Cα

adicionales que se encuentran cerca en el espacio. Este método, aunque puede ser muy costoso en recursos y tiempo, es capaz de encontrar semejanzas entre estructuras de proteínas, campo en el que, otros métodos no han mostrado resultados, obteniendo así una mayor eficiencia al comparar estructuras de proteínas sin una similitud evidente.

Conclusiones

Muchos son los esfuerzos, que se dedican a diario al estudio de la estructura de las proteínas, y los métodos de comparación tridimensional arrojan, a los especialistas de ese campo, valiosos conocimientos que han permitido el desarrollo de innumerables fármacos así como la predicción de homologías entre las macromoléculas. De mas está resaltar la vital importancia del proceso de alineamientos múltiple de estructuras de proteínas puesto que es una forma de mostrar DNA, RNA, o estructuras primarias para resaltar las zonas de similitud, que podrían indicar relaciones funcionales o evolutivas entre los genes o proteínas consultados.

En otros casos, se puede detectar si la estructura de la proteína está modificada, ya que de ser así puede generar pérdida de funciones, tales como: distrofia muscular y diversas encelopatías, debido a que las proteínas que participan en esos procesos fundamentales, pierden su conformación original o estructura nativa. Cabe mencionar que más del 50% de los tipos de cáncer humano encontrados hasta la fecha, se deben primordialmente a mutaciones en una proteína llamada: supresor de tumor p53.

(8)

Referencias Bibliográficas

Mas Benavente, José Manuel. Comparación computacional de estructuras de proteínas. Aplicación al estudio de un

inhibidor de carboxipeptidasa como agente antitumoral. Universidad Autónoma de Barcelona. 2001. [Disponible en: 

http://www.tesisenxarxa.net/TESIS_UAB/AVAILABLE/TDX-1108101-161657/ ]

Florencio Pazos Cabaleiro. Predicción de Características Estructurales a Partir de Secuencia. [Disponible en: 

http://www.cnb.uam.es/~pazos/cam97/]

GenomaSur. GenomaSur. [Disponible en: http://www.genomasur.com/lectu.htm]

Gavilanes, José G. bbmi, Universidad Complutense. ¿Qué es una proteína? 2002. [Disponoble en:

http://www.bbm1.ucm.es/divul/proteina.html#Amino%E1cido]

Mañas, Juan Manuel González. Universidad del Pais Vasco. ESTRUCTURA DE LAS PROTEÍNAS. [Disponible

en: http://www.ehu.es/biomoleculas/PROT/PROT4.htm]

Dr. Jorge S. Raisman y Dra. Ana Maria Gonzalez. Proteínas: de la estructura primaria a la cuaternaria. 2005.

[Disponible en: http://fai.unne.edu.ar/biologia/macromoleculas/structup.htm]

Amit P. Singh y Douglas L. Brutlag. Hierarchical Protein Structure Superposition using both Secondary Structure

and Atomic Representations.[Disponible en:

http://64.233.179.104/scholar?hl=es&lr=&q=cache:sOWWg9B4iUQJ:www.cise.ufl.edu/class/cap5510fa04/reading/00

086.pdf+SSAP+(Sequential+Structure+Alignment+Program) ]

Ilya N. Shindyalov y Philip E. Bourne. 1998 [Disponible en:

http://72.14.205.104/search?q=cache:KNaz8LnZztMJ:cl.sdsc.edu/ce/ce.pdf+%22Protein+structure+alignment+by+incr

Referencias

Documento similar

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)

D) El equipamiento constitucional para la recepción de las Comisiones Reguladoras: a) La estructura de la administración nacional, b) La su- prema autoridad administrativa

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en