Rey Méndez M.
Grupo de Sistemática Molecular (Unidad Asociada al CSIC) Departamento de Bioquímica y Biología Molecular
CIBUS-Facultad de Biología
Universidad de Santiago de Compostela. Galicia.
E-mail: [email protected]
Introducción
La molécula de ADN guarda la información que necesitamos para resolver muchos de los problemas que se nos plantean en la pesca y la acuicultura. Esta información tiene tres niveles de organización: a nivel de especies, de poblaciones y de individuos. Aunque las metodologías a utilizar son muy similares para buscar soluciones a los problemas que inten- tamos resolver, es necesario buscar la información en diferentes zonas del ADN con el fi n de dar respuestas correctas a las preguntas planteadas. Así, los tres niveles de organización antes indicados pueden resolverse teniendo como diana secuencias del ADN conservadas (para diferenciar especies, por ejemplo), o muy poco conservadas (para diferenciar individuos de la misma especie).
Gran parte de las secuencias analizadas en nuestro laboratorio, se corresponden con las contenidas en el ADN mitocondrial, aunque se utilizan también microsatélites y genes nu- cleares. El genoma mitocondrial es una herramienta de uso habitual debido a su elevada tasa de mutación, su transmisión generalmente por vía maternal, el orden de genes conservado dentro de taxa cercanos fi logenéticamente y la existencia de cebadores útiles para su uso en la amplifi cación del ADN de un amplio espectro de especies. El rango de especies estudiadas se centra mayoritariamente en el ámbito marino debido a la repercusión social, industrial y eco- lógica de dichas especies en nuestra comunidad (Galicia), con una gran tradición pesquera.
Sin embargo, la globalización del sector pesquero implica abarcar la distribución completa de los taxa en estudio, repartidos frecuentemente por todos los océanos, lo que nos permite,
además de resolver los problemas de identifi cación, mediante la búsqueda de secuencias diagnóstico, la utilización de datos acumulados para realizar otro tipo de estudios de gran interés evolutivo y ecológico.
Metodología
La metodología a utilizar es muy variada y, en nuestro caso, además de realizar análisis que conllevan el uso de infraestructuras pesadas y de difícil disponibilidad para muchos la- boratorios, como la secuenciación, llevamos a cabo la puesta a punto de metodologías más asequibles, que permitan, además de su utilización en laboratorios no especializados, la po- sibilidad de realizar algunas de las determinaciones (identifi cación de especies, por ejemplo) en condiciones de campo o cuando es necesaria una identifi cación rápida e in situ como es el caso de inspecciones alimentarias.
Muestras: la conservación de las muestras susceptibles de análisis de ADN no es ex- cesivamente compleja, un pequeño fragmento (<0,5 g) de tejido y su congelación hasta el análisis, o bien su preservación en etanol o tampones adecuados, a temperatura ambiente, es sufi ciente para que no se observe una degradación limitante del ADN. Un caso extremo de muestras, especialmente degradadas, son las procedentes de conservas, analizadas rutinaria- mente en nuestro laboratorio, constituidas por muestras de tejidos esterilizados en autoclave que, sin embargo, son susceptibles de ser analizadas. Alternativamente, es posible el análisis no invasivo, manteniéndose viables los ejemplares analizados, mediante el uso de fl uidos corporales, fragmentos de piel o aletas, pelo, y otros restos como excrementos.
Aislamiento de ADN: El protocolo, inicialmente utilizado, se basa en la extracción de ADN con solventes orgánicos (Sambrook et al., 1989). Al homogeneizado se le añade un volumen de una mezcla de fenol, iso-cloroformo y alcohol. Mediante centrifugación, son se- paradas una fase acuosa, conteniendo los ácidos nucleicos y una fase orgánica con el resto de componentes celulares. Los ácidos nucleicos, contenidos en la fase acuosa, son precipitados con etanol y resuspendidos en agua o TE (Tris-EDTA) y mantenidos a 4ºC o –20ºC hasta su uso. Una modifi cación llevada a cabo en nuestro laboratorio, para el análisis de ADN altamente degradado, se basa en la recuperación de los ácidos nucleicos de la fase acuosa mediante ultrafi ltración a través de membrana (Microcon-100, -50 ó -30, Amicon, Millipore) (Quinteiro et al., 1998). Este protocolo permite, además de una mayor recuperación de frag- mentos largos de ADN (>500pb), una concentración del ADN, la eliminación de pequeños fragmento (<100pb) los cuales frecuentemente interfi eren en la PCR, así como la posibilidad de eliminación de otros inhibidores.
En la actualidad, la efi cacia y comodidad de diversos kits comerciales ha sustituido, en su uso rutinario, a los protocolos artesanales. Los kits comúnmente utilizados están diseñados
para aplicaciones concretas tales como la extracción a partir de diversos tejidos animales (Dneasy Tissue kit, Qiagen), fl uidos (QIAamp DNA kit, Qiagen), muestras de tipo forense (E.Z.N.A. Forensic DNA kit, Omega Biotech), tejidos de moluscos (E.Z.N.A. Mollusc DNA kit, Omega Biotech), o especialmente diseñados para el análisis de muestras de alimentos (Nucleospin Food, Macherey-Nagel). La cantidad del ADN extraído puede ser estimada por la lectura de la densidad óptica a 260 nm. Su pureza viene confi rmada por una relación DO260/ DO280 >1,8, mientras que su integridad puede observarse por electroforesis en geles de aga- rosa (1%) en TAE o TBE, con tinción de bromuro de etidio y observación en transiluminador ultravioleta.
PCR (reacción en cadena de la polimerasa): La PCR (Saiki et al., 1988) es la reac- ción a la cual es sometido, generalmente, el ADN aislado. Esta reacción, de amplifi cación exponencial del número de moléculas conteniendo las secuencias específi cas, permite evitar, en la mayoría de los casos, las laboriosas metodologías de clonación. Existe un gran número de polimerasas termoestables disponibles comercialmente y la selección de una enzima de- terminada se realiza en función de la especifi cidad requerida, tamaño a amplifi car y cantidad de producto de PCR necesario. Los componentes de la PCR, en general son suministrados conjuntamente con la enzima, incluyéndose además del tampón, una solución de Cl2Mg y los 4 dNTPs. Se añaden a la reacción el juego de cebadores “forward” y “reverse” y el ADN patrón. Las variables que afectan de forma crítica a la especifi cidad y concentración del pro- ducto de PCR son la concentración de Cl2Mg, el cual generalmente se ajusta entre 1,5 y 3,5 mM y la cantidad de ADN patrón. Para cada amplifi cación es necesario titular ambas concen- traciones, seleccionándose aquella en la que el producto de PCR presenta mayor especifi ci- dad y rendimiento. Otro factor crítico para el éxito de una PCR es el correcto funcionamiento de los cebadores (“primers”) ya que, independientemente de las condiciones iónicas de la reacción, su buen funcionamiento depende de la presencia en el ADN molde de una secuen- cia homóloga, la selección adecuada de temperatura de fusión (“annealing temperature”) y de su correcto diseño. La temperatura de fusión debe situarse entre los 55ºC y 60ºC, siendo necesario para ello ajustar la frecuencia de CG y AT en su secuencia. El par de cebadores no debe presentar posibilidades de unión tanto intramoleculares como entre ambas moléculas, originando en el caso contrario artefactos como los dímeros. Actualmente disponemos de numerosas herramientas informáticas que permiten un apropiado diseño de los cebadores, por ejemplo el software Primer Express (Applied Biosystems), aunque su correcto diseño debe ser siempre verifi cado empíricamente. El perfi l térmico de la PCR es defi nido por el usuario, teniendo en cuenta básicamente la Taq polimerasa utilizada, la temperatura de fusión de los cebadores, la longitud del producto de PCR, y la concentración de secuencias patrón.
En general, un perfi l térmico de una PCR consta de: i) un paso inicial de desnaturalización a 94ºC, de 1-3 minutos en el cual las hebras del ADN patrón se separan y, en el caso concreto de la enzima Amplitaq Gold, se lleva a cabo su activación durante 10 min; ii) la repetición durante 30-40 ciclos de los siguientes pasos: a) desnaturalización a 94ºC durante 15 segundos a 1 minuto del ADN patrón y los productos de PCR que se van generando, b) unión de los
cebadores a la temperatura de fusión, entre 50ºC y 60ºC durante 15 segundos a 1 minuto y, c) extensión de los cebadores a 72ºC durante 15 segundos a 3 minutos; iii) de forma opcional, puede realizarse una extensión fi nal, para completar los productos de PCR que hayan queda- do inacabados, a 72ºC durante 5 a 10 minutos. Generalmente, la comprobación de la efi cacia de la PCR se lleva a cabo mediante electroforesis de una alícuota de la reacción en geles de agarosa del 1,5 al 3%. Sin embargo, para algunas aplicaciones, la detección de los productos de PCR puede ser llevada a cabo mediante PCR en tiempo real.
PCR en tiempo real: se basa en la detección de la fl uorescencia generada en el interior del tubo donde se lleva a cabo la reacción, estando directamente correlacionada con la apari- ción del producto de PCR. Disponemos para el uso de esta técnica de un sistema GeneAmp 5700 Sequence Detection System (Applied Biosystem) y de las químicas SYBRGreen y TaqMan. La técnica mediante SYBRGreen consiste en la detección de un producto de PCR por la fuorescencia emitida tras la unión a ese producto, de doble cadena, de la molécula SYBRGreen. Esta técnica es sencilla y barata no requiriendo ninguna modifi cación respecto a la clásica reacción de PCR, a excepción de la incorporación de la molécula SYBRGreen.
La técnica basada en sondas TaqMan es más depurada, requiriendo de una mayor inversión y diseño. Esta técnica se basa en la síntesis de una sonda de 15-30 pb, situada entre los ceba- dores que contiene en uno de sus extremos un fl uorocromo “reporter” mientras que en el otro se sitúa un “quencher” que aplaca la emisión de fl urescencia del fl uorocromo al estar unidos ambos a la sonda. Durante la PCR los cebadores “forward” y “reverse” se sitúan fl anqueando el producto de PCR, con la sonda unida en la parte central a la misma hebra que el cebador
“forward”. Cuando comienza la elongación a partir del cebador “forward” y aprovechando la actividad 5’-nucleasa de la enzima AmpliTaq Polimerasa, la sonda es degradada liberán- dose el fl uorocromo y el “quencher”, produciéndose así la emisión de fl urescencia, la cual se correlaciona también con la generación del producto de PCR. Los nuevos equipos para la realización de esta técnica permiten, además de disponer de una mayor sensibilidad, la posi- bilidad de trabajar con diversos fl uorocromos en la misma PCR, lo que posibilita la detección simultánea de varios productos de PCR en el mismo tubo (PCR multiplex). La aplicación básica de esta técnica, además de la detección cualitativa de un producto de PCR, es la PCR cuantitativa.
PCR cuantitativa: frente al análisis cualitativo, un segundo grupo de análisis incluye la cuantifi cación del tejido utilizado en la elaboración de un determinado alimento procesado.
Aunque no existe en la actualidad una normativa sobre los niveles de tolerancia en el error, entre los valores de peso o volumen del tejido utilizado como materia prima y el indicado por el etiquetado, es probable su futura regulación. Independientemente de la normativa, es de interés conocer el grado de exactitud en los valores indicados en las etiquetas. Los productos susceptibles de estos análisis son aquellos que contienen porcentajes de tejidos homoge- neizados de especies apreciadas, siendo representativos los alimentos infantiles y los patés.
Estos productos constituyen uno de los análisis de mayor difi cultad, debido al elevado grado
de homogeneización con otros tejidos de diversa naturaleza (vegetales, especies relacionadas de pescado, carne, harinas, etc.) y al elevado grado de degradación observado en el ADN extraído debido a los procesos de esterilización al que son sometidos estos productos.
Para la especie a cuantifi car se diseña un sistema de detección compuesto por un par de cebadores y una sonda central TaqMan. El diseño se basa en el conocimiento previo de secuencias específi cas de la especie a cuantifi car y se lleva a cabo mediante la ayuda de he- rramientas informáticas como el software Primer Express (Applied Biosystem). Por ello, esta metodología se sustenta en el los trabajos de caracterización genética previos y centrados en estudios fi logenéticos, poblacionales o de identifi cación de especies.
Figura 1.- Diseño de un sistema de cuantifi cación basado en una secuencia mitocondrial de la sardina, Sardina pilchardus. En color azul se señalan las secuencias de los cebadores “for- ward” y “reverse”, mientras que en color verde se señala la localización de la sonda TaqMan.
La realización de la cuantifi cación, basada en la lectura de fl uorescencia en las etapas iniciales de la amplifi cación exponencial de la PCR, se realiza en un GenAmp 5700 Sequen- ce Detection System (Applied Biosystems) y usando los componentes suministrados por TaqMan Universal PCR Master Mix (Applied Biosystems), además de los primers y sondas sintetizados.
Figura 2.- Perfi l de amplifi caciones obtenidas basadas en un sistema diseñado para la cuanti- fi cación de la merluza europea, Merluccius merluccius. En las abscisas se sitúan el número de ciclos mientras que en la escala logarítmica de las ordenadas se indica la lectura de fl uores- cencia. La lectura de la señal se realiza en la línea situada a una señal fl uorescente Rn=0,01.
La cuantifi cación del ADN de una especie en una muestra problema, y por lo tanto la cantidad de tejido contenido en la muestra, requiere de la previa elaboración de una curva es- tándar de muestras seriadas de ADN obtenidas a partir de cantidades conocidas de tejido. Los sistemas de cuantifi cación deben ser lo sufi cientemente específi cos para que la amplifi cación no se vea interferida por la presencia de ADN de especies afi nes o no relacionadas.
En nuestro laboratorio, los productos de PCR suelen ser sometidos, a continuación, a alguna de estas tres técnicas: PCR-RFLP (Restriction Fragment Lenght Polymorphism), PCR- SSCP (Single Strand Conformation Polymorphism) o, más frecuentemente, a secuenciación.
PCR-RFLP: esta técnica permite la discriminación de productos de PCR basándose en los polimorfi smos de la longitud de los fragmentos originados tras la incubación con enzimas de restricción. En general, requiere de un previo conocimiento de la secuencia del producto de PCR para la selección de la enzima que posea una diana de restricción en el interior de su secuencia, y que dicha diana presente algún interés para el estudio a realizar. En nuestro caso, esta técnica es usada para describir marcadores específi cos, es decir seleccionar enzimas que produzcan patrones de restricción característicos de una determinada especie. Constituye una alternativa sencilla y rápida a la secuenciación, describiendo polimorfi smos diagnósticos de especies, para su aplicación rutinaria en tareas de identifi cación de especies, aunque presenta también desventajas respecto a ella. Su detección se lleva a cabo en geles de agarosa (3,5%) o PAGE (APBiotech).
PCR-SSCP: la generación de productos de PCR de cadena sencilla, por ejemplo me- diante PCR asimétrica (con un primer en concentración mayoritaria), permite identifi car po- limorfi smos subyacentes en la secuencia debido a la generación de distintas conformacio- nes o estructuras secundarias detectables por electroforesis en geles prefabricados de PAGE (APBiotech). Esta metodología permite también disponer de una manera rápida y sencilla de marcadores específi cos. Sin embargo, en ella son críticas la resolución electroforética y la manipulación en el laboratorio. El desarrollo de esta técnica para la aplicación a la iden- tifi cación de especies, originó un estudio paralelo relacionado con las diversas alternativas en la generación de cadena los productos de PCR de cadena sencilla (Rehbein et al., 1998).
Secuenciación: en los últimos años los avances, en general en biología molecular y en concreto en genómica, han estado motivados por el desarrollo experimentado en las metodo- logías de secuenciación del ADN y en los avances en la tecnología que las soporta. El hecho fundamental lo constituye la transición desde las secuenciaciones de tipo manual, basadas ge- neralmente en la utilización de isótopos radioactivos (P32, S35) y la detección de las bandas en autorradiografías del gel, hasta las secuenciaciones automáticas, en las cuales la detección de las bandas está basada en la emisión de fl uorescencia. A lo largo de esta transición son muchas las metodologías intermedias. En general, las secuencias obtenidas provienen o de insertos de plásmidos, previa clonación, o como suele ser en nuestro caso, a partir de productos de PCR.
En la secuenciación automática, o más apropiadamente fl uorescente, los productos de la elongación del cebador de secuenciación son separados en gel de acrilamida/bis-acrilami- da (secuenciador de gel) o mediante polímeros contenidos dentro de capilares (secuenciador capilar). La lectura de las secuencias se produce tras la recogida de la emisión de fl uorescen- cia de los cuatro fl uorocromos usados, por una cámara y su posterior procesado por el orde- nador. Las calles visualizadas en la imagen reconstruida del gel son analizadas por separado mediante algoritmos que reducen la posibilidad de error, ajustándose a las características particulares de cada electroforesis. Tras este proceso se obtienen el electroferograma de cada muestra y la estimación de la secuencia correspondiente, la cual es revisada posteriormente de forma manual.
Análisis de secuencias: las secuencias obtenidas constituyen los juegos de datos re- queridos para el estudio de las diversas cuestiones, siendo, en general, procesadas de forma similar independientemente de la cuestión planteada, siguiendo las diversas metodologías disponibles (Hillis et al., 1996). Una de las primeras pruebas a que se suele someter la se- cuencia, es la verifi cación de su naturaleza. Para ello se procede a realizar un análisis com- parativo con secuencias depositadas en el GenBank, o con secuencias disponibles obtenidas previamente en el laboratorio. El primer paso en este proceso comparativo es el alineamiento de la secuencias, esto es, obtener la maximización de la homología. Cuando se dispone de varias secuencias alineadas, se obtiene un juego de datos constituido por fi las, las secuencias, y por columnas, posiciones nucleotídicas homólogas. Los juegos de secuencias alineadas son sometidos a distintos análisis, encaminados a conocer la relación y el grado de parentesco entre ellas y, en consecuencia, entre los individuos o especies que las contienen, expresa- das mediante la generación de un fi lograma (dendograma) o árbol fi logenético. Para ello se dispone de diversos métodos, básicamente agrupados en las categorías de distancias (DIS), parsimonia (MP) y máxima verosimilitud (ML). Los métodos de distancias y máxima vero- similitud asumen un determinado modelo de evolución molecular, con distintos parámetros, en un intento de crear un modelo de sustitución nucleotídica lo más ajustado posible a la realidad. Los métodos de parsimonia buscan la soluciones más simplifi cadas, a la hora de explicar las relaciones fi logenéticas, y que sean congruentes con los datos obtenidos. Estos métodos son desarrollados por una amplia variedad de software (PHYLIP, PAUP, MEGA,...), que permiten caracterizar los juegos de datos, estimar su señal fi logenética, seleccionar el modelo de evolución más ajustado a los juegos de datos, reconstruir las relaciones entre las secuencias mediante la elaboración de un árbol fi logenético, mediante algoritmos como por ejemplo neighbor-joining, y estimar la consistencia de las hipótesis. De forma similar existen metodologías específi cas para la evaluación de la estructura poblacional, basadas en los aná- lisis de AMOVA (Análisis de Varianza Molecular), estimando la proporción de variabilidad genética específi ca de cada grupo o población, y de los parámetros estimadores de fl ujo géni- co, análogos de Fst (Hillis et al., 1996).