PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE CIENCIAS DEPARTAMENTO DE MICROBIOLOGIA
IDENTIFICACIÓN MOLECULAR DE UNA CEPA DE Candida sp.
Catalina Borrero Velasco
TRABAJO DE GRADO Presentado como requisito parcial
Para optar a los titulos
MICROBIOLOGA INDUSTRIAL MICROBIOLOGA AGRICOLA VETERINARIA
Wilson Teran Perez Ph.D DIRECTOR
Gerardo Moreno M.Sc CODIRECTOR
NOTA DE ADVERTENCIA
AGRADECIMIENTOS
A Melva Linares, directora del cepario de micología, por la facilitación de las cepas control para
el estudio.
A José Salvador por su colaboración con los primers universales (ITS1-ITS4) para la realización
del trabajo.
A Gina Paola Solano por su acogimiento y enseñanzas en el laboratorio.
A Carolina Rosero por su compañía incondicional y apoyo en los estudios bioinformáticos.
A Pilar Márquez por su asesoría y apoyo en la realización de este trabajo.
A Gerardo Moreno por su guía y consejos constantes durante toda la carrera.
A Wilson Terán por ser un guía para el desarrollo de este trabajo, brindando su confianza, apoyo
y conocimientos constantes.
TABLA DE CONTENIDO
Pg.
Resumen 1
1. Introducción 1
2. Planteamiento del problema y justificación 2
3. Marco teórico 3
3.1 Genero Candida sp. 3
3.2 Caracterización molecular 3
3.2.1 Polimorfismos de Longitud de Fragmentos de Restricción (RFLP) 4
3.2.2 Análisis bioinformático 4
3.2.2.1 Bases de datos bioinformáticas 4
3.2.2.2 Alineamientos de secuencias 4
3.2.3.3 Análisis Filogenético 4
3.2.3.4 Predicción y análisis de estructuras secundarias del rRNA 7
4. Objetivos 8
5. Materiales y Métodos 8
5.1 Cepas de levadura Candida sp. 8
5.2 Cultivo y conservación de las cepas de levadura Candida sp. 9
5.3 Extracción de DNA genómico 9
5.4 Polimorfismos de longitud de Fragmentos de Restricción (RFLP) 9
5.4.1 Reacción en cadena de la polimerasa (PCR) 9
5.4.2 Corte con enzimas de restricción 9
5.5 Clonación, secuenciación, análisis bioinformático 9
5.5.1 Ligación y transformación por choque térmico 9
5.5.2 Selección de colonias 10
5.5.3 Extracción del plásmido recombinante 10
5.5.4 Secuenciación y análisis bioinformático 10
5.6 Análisis filogenético 10
5.7 Análisis de estructuras secundarias del rRNA 11
6. Resultados 11
6.1 Técnica de Polimorfismos de longitud de Fragmentos de Restricción (RFLP) 11
6.1.1 Reacción en cadena de la polimerasa (PCR) 11
6.1.2 Polimorfismos de longitud de Fragmentos de Restricción (RFLP) 12
6.2 Clonación y secuenciación 15
6.3 Análisis bioinformático 15
6.5 Análisis de estructuras secundarias 19
7. Discusión 20
8. Conclusiones 22
9. Recomendaciones 22
10. Bibliografía 23
RESUMEN
En los últimos años se han realizado estudios con una cepa Candida sp. cuyo interés reside en su
posible aplicación en la industria agrícola y alimentaria para la retardación de la maduración de frutos, por lo cual es importante descartar que el microorganismo no pertenezca a una especie patógena. Para su identificación se han llevado a cabo técnicas convencionales microbiológicas identificándola como
Candida guilliermondii, aun así estos métodos presentan inconvenientes debido a que varían
dependiendo de las condiciones de cultivo. Debido a esto, el objetivo de este trabajo fue obtener la identificación a nivel de especie de la levadura de interés con el uso de la técnica RFLP, la secuenciación de la región ITS15.8S-ITS2 del rDNA, seguida de un análisis filogenético de su secuencia primaria y secundaria, utilizando seis cepas adicionales como controles internos del proceso, las cuales
pertenecen a las especies C. tropicalis, C. albicans, C. glabrata, C. parapsilopsis, C. krusei, C.
guilliermondii.
Tras el análisis RFLP se diferenció e identificó correctamente las especies del género Candida utilizadas
en este estudio, obteniendo los patrones de bandas esperados. Adicionalmente, el patrón de bandas de
la cepa Candida sp. de estudio permitió ubicarla en la especie Candida guilliermondii. Por otro lado, los
análisis de la secuencia primaria y secundaria ubicaron la cepa Candida sp. de estudio dentro del clado
de especies estrechamente relacionadas de Candida guilliermondii, Candida fermentati (Telémorfo:
Pichia caribbica) y Candida carpophila, por lo cual se concluye su posible pertenencia a alguna de estas
tres especies, descartando su posible pertenencia a la especie patógena C. albicans.
1. INTRODUCCIÓN
Existen más de 150 especies agrupadas en el género Candida, de las cuales algunas han sido de
utilidad biotecnológica en procesos de producción de alimentos, controladores biológicos de fitopatógenos, producción de xilitol, etanol, acido cítrico, enzimas, entre otras aplicaciones (Obera, 2004;
Rizzi et al., 1988; McLaughlin et al., 1990; Felipe et al., 1995; Preziosi-Belloy et al., 2000; Canilha et al.,
2003; Bautista-baños 2006; Kurtzman & Fell, 1998; Hui & Khachatourians, 1994; Jimenez, 2010), A pesar de las ventajas que presentan, algunas especies son causantes de micosis en el hombre y otras son patógenos oportunistas asociados a enfermedades. Por estas razones se hace necesaria la
identificación hasta nivel de especie (Obera, 2004; Kurtzman & Fell, 1998; Cirak et al, 2003; Mirhendi et
al, 2001; Mirhendi & Makimura, 2003).
La identificación se realiza por medio de diferentes técnicas. Los métodos convencionales microbiológicos abarcan criterios morfológicos y fisiológicos como características macroscópicas, microscópicas, pruebas enzimáticas y bioquímicas. Aun así, estos métodos presentan inconvenientes al presentar baja sensibilidad y especificidad debido a que dichos procedimiento varían dependiendo de
las condiciones de cultivo (Rousselle et al, 1994; Elie et al, 1998; Sheppard et al, 1998; Linares & Solis,
2001; Cirak et al, 2003; Gutzmer et al, 2004; Arjuna et al, 2005; Balleste et al, 2005; Alcoba-Flórez et al,
2007;Pinoni et al, 2007).
Métodos alternos de genetica han solucionado las dificultades presentadas en el uso de los métodos convencionales para la identificación y ubicación taxonómica de levaduras. Estas técnicas al fundamentarse en el análisis de fragmentos de moléculas de ácidos nucleícos han permitido la
identificación certera de especies Candida. Una de las principales metodologías utilizadas es la técnica
de Polimorfismos de Longitud de Fragmentos de Restricción (RFLP), dirigida a la identificación de especies al determinar patrones de bandas polimórficos únicos de un organismo (Obera, 2004; Mirhendi
permitido el análisis de secuencias frente bases de datos públicas, construcción de arboles filogenéticos y estudios de estructuras secundarias del rRNA, logrando un acercamiento más certero en la ubicación
taxonómica de especies (Nilsson et al, 2003; Nilsson et al, 2008; Keller et al¸2009).
Para estos estudios se han utilizado las regiones del rDNA 18S, 26S y 5.8S junto con las zonas adyacentes ITS1 e ITS2 (Internal transcribed spacer). Los genes 18S, 26S y 5.8S son regiones muy conservadas con baja variabilidad intraespecifica, mientras que las zonas ITS son hipervariables especie-específica que permiten una alta discriminación e identificación de especies. Estudios realizados
por Williams et al (1995) y Cirak et al (2003) se ha logrado la obtención de patrones RFLP únicos de
especie para la distinción de C. tropicalis, C. albicans, C. glabrata, C. parapsilopsis, C. krusei, C.
guilliermondii, C. stellatoidea y C. pseudotropicalis tras el corte con enzimas de restricción HaeIII, BfaI, DdeI del la región amplificada con los cebadores universales ITS1 – ITS4. Adicionalmente, estudios
bioinformáticos de las secuencias de las regiones ITS realizados por Nelsson et al (2003), Koetschan et
al. (2010), Selig et al. (2008) y Schultz et al. (2006) han facilitado la verificación de la identificación de especies.
Teniendo en cuenta estos hechos, el objetivo principal del presente trabajo es realizar la identificación
molecular a nivel de especie de una cepa Candida sp. de interés aplicativo en el área de alimentos y
agrícola por la técnica RFLP y posteriores análisis bioinformáticos, filogenéticos y de estructura secundaria de las regiones ITS1 e ITS2 (rDNA).
2. PLANTEAMIENTO DEL PROBLEMA Y JUSTIFICACION
Desde el año 2000, en la Pontificia Universidad Javeriana de Bogotá, se han realizado estudios con una
cepa Candida sp. aislada a partir de frutos de tomates heteroinjertados, cuyo interés reside en su posible
aplicación en la industria agrícola y alimentaria para la retardación de la maduración de frutos, por lo cual es importante descartar que el microorganismo no pertenezca a una especie patógena (Ramirez & Ortegon, 2001; Buitrago & Escobar, 2009). Para su identificación se han llevado a cabo técnicas convencionales morfológicas y bioquímicas, obteniendo características macroscópicas (Agar YGC) de colonias blancas, pequeñas, redondas y lisas. Su microscopia mostro células ovaladas en estado de gemación. La prueba de tubo germinal resulto negativa y en la prueba de asimilación de azucares (API
20 AUX) arrojo un perfil numérico 6776377, identificándose como Candida guilliermondii presentando un
taxón significativo de 99.7% (Buitrago & Escobar, 2009). Estos métodos presentan inconvenientes para obtener una caracterización certera debido a que dichos procedimiento varían dependiendo de las condiciones de cultivo, por lo cual es necesaria la verificación de la identificación por otras técnicas
(Williams et al, 1995; Andrade, 2007; Mirhendi et al, 2001)
Actualmente, la identificación de especies Candida sp. se ha logrado por medio de la técnica molecular
de Polimorfismos de Longitud de Fragmentos de Restricción (RFLP) junto con el análisis filogenético de las secuencias ITS del DNA ribosomal, ofreciendo resultados más sensibles, específicos y confiables
(Alcoba-Flórez et al, 2007; Mirhendi et al, 2001; Nilsson et al, 2003; Nilsson et al, 2008).
3. MARCO TEÓRICO
3.1 Genero Candida sp.
El género Candida fue propuesto en el año 1923 por Berkhout y pertenece al grupo de ascomicetos.
Son hongos unicelulares, globosos, elipsoidales, cilíndricos o elongados. Su replicación es por gemación en el cual forma un pequeño brote en la célula madre que crece hasta separarse de ella. Pueden presentar pseudohifas, y no forman artroconidios. Sus colonias son de color crema a amarillento con textura diferentes dependiendo de la especie. Prosperan típicamente en hábitat con azucares y varias pueden vivir de forma simbionte con animales, mientras que otras son patógenas (Kurtzman & Fell, 1998; Koneman, 2001).
3.2 Caracterización molecular
Se basa en el uso de marcadores moleculares genéticos cuyo polimorfismo permite la identificación a nivel de género, especie y hasta sub especie.
3.2.1 Marcador rDNA para la identificación molecular de levaduras
El DNA ribosomal (rDNA) es la región mas conservada del genoma con capacidad de divergencia filogenética. Está organizado como una unidad que se repite una detrás de la otra en tándem. Cada unidad incluye tres genes de rRNA, el gen 18S rRNA (subunidad pequeña SSU), 5.8S rRNA y 28S rRNA (subunidad grande LSU), las cuales son regiones muy conservadas con baja variabilidad intraespecifica. Estos genes están separados por dos secuencias espaciadoras internas que se transcriben junto a los genes de rRNA, denominadas ITS1 e ITS2 (internal transcribed spacer). Son regiones hipervariables, con variabilidad intragénero especie-específica, que permite una alta discriminación e identificación de
especies utilizada para diferenciación de especies Candida, la construcción de análisis filogenéticos y
trazar relaciones entre organismos (Alcoba-Flórez et al, 2007; Mirhendi & Makimura, 2003; Obera, 2004;
Chen et al, 2000; Zaroso et al, 1999; Mirhendi et al, 2006; Andrade, 2007; Mousavi et al, 2007).
Estas regiones intergenicas pueden ser amplificadas por separado utilizando los cebadores universales ITS1-ITS2 para la amplificación específica de la secuencia ITS1, y los cebadores IST3-ITS4 para la amplificación de la secuencia ITS2. De igual forma, se puede amplificar las dos regiones (ITS1 e ITS2) conjuntamente con la secuencia del gen 5.8S rRNA utilizando la pareja de cebadores ITS1-ITS4 (Figura
[image:9.612.130.485.527.607.2]1) (White et al, 1990; Ciardo et al, 2010).
Figura 1. Representación esquemática de las regiones ITS. (Fuente: Ciardo et al, 2010)
problemas para determinar cuál de las regiones ITS (ITS1 o ITS2) es el mejor marcador molecular para la diferenciación e identificación de especies. Para el grupo Fungi algunos autores reportan que la región ITS2 es la más adecuada, aun así los resultados varían dependiendo de del grupo taxonómico,
principalmente a nivel de phylum (Ciardo et al, 2010; Keller et al¸2009; Nilsson et al, 2003; Nilsson et al,
2008).
3.2.2 Polimorfismos de Longitud de Fragmentos de Restricción (RFLP)
La técnica RFLP se basa en un principio que consiste en la diferenciación de organismos por el análisis de patrones de corte que se generan en un sitio específico de una secuencia de DNA, cuando es cortada por enzimas de restricción. Los fragmentos polimórficos de diferente tamaño aparecen debido a que los organismos de diferentes especies e incluso cepas difieren en la distancia de los sitios de clivaje de las endonucleasas, formando diferentes patrones de bandas que permiten diferenciarlos (Obera, 2004). Este
método se ha empleado satisfactoriamente para la diferenciación de especies del genero Candida
realizando la digestión de la región rDNA 5,8S y los espaciadores internos ITS1 e ITS2 con diferentes
enzimas de restricción (Kurtzman & Fell, 1998; Williams et al, 1995; Andrade, 2007; Cirak et al, 2003).
3.2.3 Análiss bioinformático
La bioinformática es una disciplina que combina el uso de la informática y de secuencias de DNA o proteínas para realizar aproximaciones biológicas. La revolución del internet facilito el acceso a las fuentes de cálculo computacional para el análisis de datos o secuencias biológicas cada vez más abundantes y de libre acceso en bases de datos, permitiendo que la información biológica y un amplio rango de herramientas bioinformáticas se encuentren a disposición para el mundo científico.
3.2.3.1 Bases de datos bioinformáticas
Las bases de datos bioinformáticas son divididas en dos tipos, primarias y secundarias. Las bases primarias contienen datos biológicos originales como secuencias de DNA o proteínas e información sobre su estructura a partir de cristalografía. Las bases secundarias contienen información adicional que describen su contexto biológico. Es importante tener en cuenta que diferentes bases de datos contienen diferentes anotaciones de calidad variable (Alphey, 1997).
Algunas bases de datos primarias comprenden genomas, secuencias de proteínas, estructuras de proteínas y secuencias de DNA, como EMBL (European Molecular Biology Laboratory), GenBank de NCBI (National Center for Biotechnology Information) y la DDBJ (DNA Databank of Japan) (Alphey, 1997). A través de estas bases se puede comparar una secuencia desconocida encontrando similitudes con otras secuencias conocidas de las bases de datos biológicas. Esto es realizado principalmente
mediante el uso de la herrameinta BLAST (Basic Alignment Search Tool) (Altschul et al, 1997), el cual
utiliza una comparación y búsqueda de homología mediante alineamiento (Alphey, 1997).
3.2.3.2 Alineamientos de secuencias
El alineamiento permite comparar dos o más secuencias (DNA o proteína) para encontrar similitudes que puedan representar relaciones funcionales o evolutivas, los cuales pueden ser locales o globales entre dos (apareado) o más secuencias (múltiple). Para esto se han desarrollado algoritmos o programas disponibles en la web pero debe tenerse en cuenta que la elección del algoritmo y los parámetros ejercen un impacto en los resultados. Algunos programas conocidos son ClustalW, MUSCLE, T-Coffee, DIALIGN-TX, MAFFT, entre otros (Lesk, 2002; Xiong, 2006; Alphey, 1997).
3.2.3.3 Análisis Filogenético
mismo origen y posteriormente ha divergido a través del tiempo en forma bifurcada e independientemente (Lesk, 2002; Xiong, 2006).
Arboles filogenéticos (Dendogramas):
Los arboles filogenéticos pueden presentar un “nodo raíz” cuando se comparte un ancestro común
para todos, o pueden ser sin raíz. Están compuestos por líneas llamadas “ramas”, las cuales en cada
punta representan un organismo o secuencia denominados “taxa” o unidades taxonómicas
operacionales. Los puntos de conexión son llamados “nodos” y el camino seguido desde el ancestro hasta el descendiente es denominado “linaje”.
Los arboles pueden ser diseñados en diferentes maneras, como cladograma o filograma. En un filograma la longitud de las ramas representa el grado de divergencia evolutiva, es decir, son a escala. Por otro lado, un cladograma solo muestra las relaciones evolutivas y la longitud de sus ramas no son proporcionales al número de cambios evolutivos.
La construcción de un árbol filogenético consta de cinco pasos principales:
1. Selección de secuencias
Las secuencias seleccionadas deben ser preferiblemente de fuentes confiables para garantizar la veracidad del análisis.
2. Alineamiento múltiple
Procedimiento importante debido que establece posiciones en la evolución. Solo un alineamiento correcto produce una correcta inferencia del dendograma.
3. Selección del modelo evolutivo o de sustitución
Existen varios modelos que difieren en como son tratadas las sustituciones de cada nucleótido o aminoácido. En secuencias de nucleótidos las tasas de sustitución difieren dependiendo del sitio, y en secuencias de proteínas existen aminoácidos que cambian raramente debido al código genético degenerado y las funciones específicas que pueden representar.
Para secuencias de DNA existen dos modelos principales. El modelo Jukes-Cantor asume que todos los nucleótidos son sustituidos (mutaciones) aleatoriamente bajo una misma tasa yprobabilidad. Por otro lado, el modelo Kimura de dos parámetros (K2P) asume que las sustituciones ocurren aleatoriamente pero incluye un parámetro que diferencia las tasas de transiciones y transversiones de nucleótidos debido que es esperado que las transiciones sean más frecuentes que las transversiones, lo cual provee un estimado de las distancias evolutivas que se acerca más a la realidad (Lesk, 2002; Xiong, 2006)..
4. Construcción del árbol filogenético
Existen dos principales categorías para su construcción. La primera abarca los métodos basados en caracteres discretos, los cuales asumen que los caracteres correspondientes en una posición en un alineamiento múltiple presentan un ancestro común, y que cada uno evoluciona independientemente. La segunda categoría abarca los métodos basados en la distancia, correspondiente al grado de disimilitud entre secuencias.
Calculan arboles basados en una matriz de distancia, empezando con las secuencias mas similares. Entre estos algoritmos se encuentran el UPGMA (Unweighted Pair Group Method using Arithmetic averages) y el NJ (Neighbor Joining). El algoritmo NJ es similar al anterior, pero construye arboles usando matrices de reducción gradual de distancias, corrigiendo las tasas evolutivas desiguales entre secuencias, siendo un método más robusto que el UPGMA que asume una tasa de evolución constante para todos los taxa (Lesk, 2002; Xiong, 2006).
Los algoritmos de tipo optimizado, a diferencia de los tipo cluster, crea y compara varias topologías de arboles filogenéticos y selecciona el mejor árbol que se ajusta a la matriz evolutiva. Basado en el criterio de optimización hay dos tipos de algoritmos, el Fitch-Margoliash y el ME (Minimum Evolution). El algoritmo Fitch-Margoliash (FM) selecciona el mejor árbol en base a la mínima desviación entre distancias calculadas entre todas las ramas del dendograma y el conjunto de datos originales. El algoritmo ME realiza un procedimiento similar, pero usa un criterio de optimización diferente buscando la mejor topología por la mínima distancia total de ramas (Lesk, 2002; Xiong, 2006).
Métodos basados en caracteres o Métodos discretos: Son basados directamente en los caracteres de la secuencia en vez de las distancias por alineamiento. Estos toman en cuenta eventos mutacionales acumulados en las secuencias, previniendo la perdida de información cuando los
caracteres son convertidos en distancias. Los métodos más comunes son “Máxima Parsimonia” (MP)
y “Máxima Verosimilitud” (Máximum Likelihood – ML).
El método de máxima parsimonia (MP) escoge el árbol que contiene el menor número de cambios evolutivos o la mínima longitud total de distancias de ramas. Es basado en el principio que afirma que la explicación más simple es probablemente la correcta debido que requiere el menor número de supuestos, minimizando el ruido. El árbol es construido en base a sitios informativos del alineamiento, buscando todas las topologías posibles y reconstruyendo secuencias ancestrales que requieran el mínimo numero de cambios para evolucionar. La parsimonia de este método trata todas las mutaciones como equivalentes lo que puede sobre simplificar mutaciones (transversiones, transversiones, cambios de aminoácidos). Por esto también se ha desarrollado el método de Parsimonia Ponderada (Weighted parsimony) el cual toma en cuenta diferentes mutaciones que
ayudan a seleccionar topologías más precisas. Este método es sensible a la “atracción de ramas
largas” (long-branch attraction-LBA), un error artefactual producido cuando grupos que han evolucionado rápidamente son erróneamente colocados juntos en un árbol, sin tomar en cuenta su verdadera posición (Lesk, 2002; Xiong, 2006).
El método de Máxima Verosimilitud (maximum likelihood– ML) usa modelos probabilísticos para
escoger el mejor árbol que contenga alta probabilidad de reproducir la información observada en las secuencias. Es un método considerado matemáticamente más riguroso que el método de máxima parsimonia. El método ML usa toda la información de la secuencia en vez de solo sitios informativos, emplea modelos de sustitución que calculan la probabilidad total de secuencias ancestrales y su evolución a través de los nodos internos hasta las secuencias actuales proporcionadas.
Adicionalmente, no es sensible al efecto de “atracción de ramas largas” (Lesk, 2002; Xiong, 2006).
5. Evaluación del árbol filogenético
Para evaluar la confiabilidad de la filogenia inferida se utilizan pruebas estadísticas, principalmente
“Bootstrapping” y “Jackknifing”, que indican la consistencia o inestabilidad de un árbol al realizar de
Jackknifing es una técnica de repetición que elimina la mitad de la información al azar, a partir del cual se construyen nuevos árboles. Bootstrapping es una técnica que perturba las secuencias originales en forma paramétrica o no paramétrica. El método no paramétrico genera duplicaciones de algunos sitios al azar a expensas de otros, mientras que el método paramétrico usa alteraciones al azar de acuerdo a la distribución de la secuencia y el modelo de sustitución. Es considerado un procedimiento más robusto que el Jackknifing (Xiong, 2006).
Para evaluar si un árbol es significativamente mejor que otro se utilizan pruebas estadísticas que permiten saber si hay diferencias significativas entre ellos. Entre estos pruebas se encuentra el test Kishino-Hasegawa (KH test) diseñado específicamente para arboles construidos por el método de máxima parsimonia (MP), en donde la hipótesis nula a descartar es que los arboles no presentan diferencias estadísticamente significativas usando un test t-student en base a la diferencia del largo de las ramas. El test Shimodaira-Hasegawa (SH test) es frecuentemente usado para arboles construidos bajo el método de máxima verosimilitud probando que tan bien se ajustan dos árboles
basado en el logaritmo del puntaje de probabilidad en donde el valor de probabilidad (P-value)
determina si la diferencia es o no significativa (Xiong, 2006).
- Programas filogenéticos
Para la construcción de arboles filogenéticos existen numerosos programas, de los cuales es importante conocer su base teórica, capacidades y limitaciones. Algunos de los más usados son PAUP (Phylogenetic analysis using parsimony and other methods) desarrollado por David Swofford, PHYLIP (Phylogenetic inference package) por Joe Felsenstein y MEGA (Molecular Evolutionary genetics Analysis) desarrollado por Koichiro Tamura, Daniel Peterson, Nicholas Peterson, Glen Stecher, Masatoshi Nei y Sudhir Kumar (Xiong, 2006).
3.2.3.4 Predicción y análisis de estructuras secundarias del rRNA
Recientemente se ha encontrado que el estudio de la estructura secundaria del rRNA junto con el análisis de secuencias es útil para lograr análisis sistemáticos de mayor nivel. La estructura secundaria es altamente conservada en todos los eucariotas, permitiendo utilizarla en los análisis filogenéticos, lo cual ha demostrado resultados más robustos en el alineamiento y construcción de arboles filogenéticos
que los métodos que solo incluyen análisis de secuencias (Keller et al¸ 2009; Koetschan et al, 2010).
Para la predicción de modelos estructurales del RNA pueden utilizarse técnicas experimentales como cristalografía de rayos X o resonancia magnética nuclear (RMN). Aun así estos métodos implican mucho tiempo y altos costos. Por estas razones se han desarrollado algoritmos y programas computacionales que permiten una predicción teórica cercana a la realidad (Xiong, 2006).
Actualmente existen dos métodos para la predicción de estructuras de RNA:
Método ab initio: Realiza predicciones estructurales basadas en una sola secuencia de RNA, por lo cual sus algoritmos han sido diseñados para buscar la estructura de RNA más estable con la mínima energía libre. Generalmente cuando un apareamiento de bases en formado, la energía de la molécula se reduce debido a las interacciones atractivas. La mínima energía libre es calculada basado en los apareamientos de bases A-U y G-C, aunque algunos menos estables como G-U pueden ser formados. También se debe tener en cuenta que el apareamiento es influenciado por fuerzas de pares de bases adyacentes,
denominado como el fenómeno de “cooperatividad” durante la formación de hélices. Si un par de bases
patrones posibles y calculando la energía total para determinar el modelo energéticamente más favorable (Xiong, 2006). El puntaje puede ser obtenido por medio de matrices de puntos (dot matrix) o por el método de programación dinámica. Algunos de los programas que usan el método ab initio son Mfold (http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form), un programa que combina la programación dinámica y cálculos termodinámicos, produciendo también matrices de puntos. Este programa es más confiable cuando se usan secuencias cortas. Por otro lado también está RNAfold (http://rna.tbi.univie.ac.at/cgi-bin/RNAfold.cg) que evalúa únicamente la energía en una matriz de puntos y calculando la estabilidad termodinámica de estructuras alternas por la vecindad de diagonales optimas (Xiong, 2006).
Método comparativo: Usa secuencias de RNA evolutivamente relacionadas para inferir una estructura
consenso evolutivamente conservada al asumir que las secuencias homologas se pliegan en la misma estructura secundaria, lo cual representa una ventaja debido que al predecir estructuras de una sola
secuencia puede producir errores. Para ello ha sido necesario aplicar el concepto de “covariación” o
cambios de bases compensatorias (Compensatory base per changes – CBC) debido que si una
estructura es conservada evolutivamente, los cambios mutacionales en una posición que es responsable de un apareamiento debe ser compensada con una modificación en la posición correspondiente de la cadena complementaria y así mantener el apareamiento y la estabilidad de la estructura. Por esto, es necesario usar secuencias homologas suficientemente similares que permita un alineamiento confiable, pero con suficiente divergencia que permita detectar las covariaciones. Estos algoritmos pueden ser clasificados en dos categorías, los que usan un prealineamiento como datos de entrada y los que no requieren de dicho prealineamiento (Xiong, 2006).
Los algoritmos que usan prealineamientos, pueden ser obtenidos en programas estándar como T-coffe y Clustal W. RNAalifold (http://rna.tbi.univie.ac.at/cgi-bin/RNAalifold.cgi) es un programa que usa un prealineamiento para analizar sitios de covariación. Una matriz de puntaje es creada al combinar la energía libre y la información de covariación. La programación dinámica es usada para seleccionar la estructura que presenta la menor energía libre.
Los algoritmos que no requieren de un prealineamiento realizan el alineamiento de las secuencias e infiere una estructura consenso. El alineamiento es producido utilizando el método de programación dinámica con un patrón de puntajes que incorpora la similitud entre las secuencias como la energía. Foldalign (http://foldalign.ku.dk/) es un programa que usa la combinación de Clustal W y el método de programación dinámica con un patrón de puntaje que incluye la información de covariación para construir el alineamiento. Una estructura consenso es derivada a partir de las dos secuencias analizadas. Otro programa similar es Dynalign (http://rna.urmc.rochester.edu/dynalign.html), el cual calcula estructuras secundarias usando un método similar al programa Mfold (Xiong, 2006).
Análisis de la estructura secundaria de la región ITS2 rRNA:
Actualmente, Koetschan et al. (2010), Selig et al. (2008) y Schultz et al. (2006) han desarrollado el
servidor web ITS2 Database (http://its2.bioapps.biozentrum.uni-wuerzburg.de) para el análisis de
secuencias de la región ITS2 del rRNA. Este servidor contiene tanto la base de datos de estructuras secundarias de ITS2 como herramientas bioinformáticas que permiten realizar búsquedas de secuencias, estructuras, motivos, predicción y modelamientos de nuevas secuencias ITS2. Adicionalmente, estos autores han desarrollado dos programas independientes [4SALE (http://4sale.bioapps.biozentrum.uni-wuerzburg.de/) y ProDistS (http://profdist.bioapps.biozentrum.uni-wuerzburg.de/cgi-bin/index.php)] para realizar todo el procedimiento, incluyendo el alineamiento de secuencias teniendo en cuenta su estructura secundaria y construyendo el árbol filogenético (Koetschan
4. OBJETIVOS
OBJETIVO GENERAL
Identificar por técnicas moleculares la levadura Candida sp. de interés.
OBJETIVOS ESPECIFICOS
1. Identificar molecularmente a nivel de especie la levadura Candida sp. objeto de estudio
mediante RFLP y secuenciación del fragmento ITS1-5.8S-ITS2 rDNA.
2. Analizar filogenéticamente la secuencia ITS1-5.8S-ITS2 del rDNA a partir de sus estructuras primaria y secundaria.
5. MATRIALES Y MÉTODOS
5.1 CEPAS DE LEVADURA Candida sp.
La levadura Candida sp. de estudio fue proporcionada por el docente Gerardo Moreno del
Departamento de microbiología de la Pontificia Universidad Javeriana de Bogotá.
Adicionalmente se realizó el estudio con seis cepas adicionales Candida sp. como controles internos
del proceso, las cuales pertenecen a las especies C. tropicalis, C. albicans, C. glabrata, C. parapsilopsis,
C. krusei, C. guilliermondii. Estas cepas fueron proporcionadas por el cepario de micología del
departamento de microbiología de Pontificia Universidad Javeriana de Bogotá.
5.2 CULTIVO Y CONSERVACIÓN DE LAS CEPAS DE LEVADURA Candida sp.
Las cepas de levaduras fueron cultivadas periódicamente a 37°C por 48h en agar YPG (1% p/v extracto de levadura, 2% p/v peptona, 2% p/v glucosa, 15g/l agar) en tubos inclinados y conservadas a 4°C.
5.3 EXTRACCIÓN DNA
Para la extracción de DNA se inocularon 2ml de medio liquido YPG con cada especie de levadura, incubando por una noche a temperatura ambiente. Posteriormente, se realizo la extracción siguiendo el
procedimiento descrito por Tomita et al (2002).
La calidad de la extracción fue evaluada en gel de agarosa (0.8% p/v) y cuantificada por espectrofotometría (NanoDrop® Thermo scientific).
5.4 POLIMORFISMOS DE LONGITUD DE FRAGMENTOS DE RESTRICCIÓN (RFLP)
Se realizo la técnica de Polimorfismos de longitud de Fragmentos de Restricción (RFLP) reportada
Williams et al (1995) la cual consto de una amplificación de la región ITS1-5.8S-ITS2 encontrada entre
los genes 18S rDNA y 28S rDNA, seguida de cortes con enzimas de restricción.
5.4.1 REACCIÓN EN CADENA DE LA POLIMERASA (PCR)
La región del rDNA de interés se amplifico por PCR según el protocolo descrito por Williams et al (1995),
el cual está diseñado para amplificar las regiones intergénicas ITS1 e ITS2 del DNA ribosomal con los
primers ITS1 (5’-TCC GTA GGT GAA CCT GCG G-3’) y ITS4(5’-TCC TCC GCT TAT TGA TAT GC-3’)
(White et al, 1990). La mezcla de reacción se preparo modificando únicamente la concentración final de
los oligonucleótidos y utilizando un volumen18ul con concentraciones de 0.2mM de cada deoxinucleotido
Buffer de Promega®), 2.5 U de Taq polimerasa (Taq DNA Polymerase Recombinant de Invitrogen®) y 0.5ng de ADN. El control negativo se realizo con agua destilada estéril en sustitución de DNA.
El programa de PCR se realizó con un ciclo de desnaturalización inicial a 95°C por 3min, seguido por 30 ciclos de una desnaturalización a 95°C por 1min, una hibridación a 55°C por 1min y una extensión a 72°C por 2min, finalizando con un ciclo de extensión final a 72° por 8 min. El tamaño, pureza y concentración de los productos fue confirmado por una electroforesis en gel de agarosa (1,2% p/v).
5.4.2 CORTE CON ENZIMAS DE RESTRICCIÓN
Los productos de PCR (aprox 500-800pb) fueron digeridos separadamente con cada una de las enzimas
de restricción HaeIII, BfaI, y DdeI incubando por una noche a 37°C, como es descrito por Williams et al
(1995). Los fragmentos finales se analizaron por electroforesis en gel de agarosa (3% p/v) en el cual se observaron los patrones de bandas obtenidos. Todos los análisis RFLP se realizaron por duplicado.
5.5 CLONACIÓN, SECUENCIACIÓN, ANÁLISIS BIOINFORMÁTICO
5.5.1 LIGACIÓN Y TRANSFORMACIÓN POR CHOQUE TERMICO
El fragmento ITS1-ITS4 amplificado previamente por PCR fue ligado al plásmido vector pCR®2.1 utilizando el kit TA Cloning de Invitrogen® y posteriormente se realizó la transformación por choque
térmico de células quimiocompetentes E. coli DH5α, reactivando las células en cultivo en medio liquido
LB por 1h a 37°C. Estos procedimientos fueron realizados de acuerdo al protocolo sugerido por el fabricante.
5.5.2 SELECCIÓN DE COLONIAS
Las células trasformadas fueron cultivadas por 16h a 37°C en agar LB con Kanamicina (Kan) (50ug/ml) y Xgal (100ug/ml) para su selección por resistencia al antibiótico y por la técnica de alfa
complementación de LacZ. Las colonias blancas obtenidas con el plásmido recombinante fueron
confirmadas por PCR a partir de colonia bajo las mismas condiciones descritas en el numeral 5.4.1., observando el resultado en un gel de agarosa (1,2% p/v).
5.5.3 EXTRACCIÓN DEL PLASMIDO RECOMBINANTE
Para la extracción del plásmido recombinante se realizo un cultivo en medio líquido LB Kan de las colonias seleccionadas. Se incubaron a 37°C por una noche y se procedió a la extracción del plásmido utilizando el kit comercial Quantum Prep Plasmid Miniprep® de BioRad® y Ultra Clean 6 Minutes MiniPlasmid Prep Kit® de MoBio®. El producto fue cuantificado espectrofotométricamente (NanoDrop 1000® de Thermo Scientific®) y se confirmó la presencia del inserto por PCR y corte con la enzima de
restricción EcoRI. Para esto se realizo una mezcla de 1ug del plásmido con 10U (0.5ul) de la enzima.
Posteriormente se dejo incubar 2h a 37°C y se observo el resultado en un gel de agarosa (1,2% p/v).
5.5.4 SECUENCIACIÓN Y ANÁLISIS BIOINFORMÁTICO
Los insertos clonados se secuenciaron con los primers flanqueantes al sitio de inserción a través de los servicios de Macrogen Inc Korea. Posteriormente se verifico los patrones de bandas obtenidos con la
técnica de Polimorfismos de Longitud de Fragmentos de Restricción (RFLP) simulando in silico la
digestión de la secuencia con la herramienta NEBcutter v2.0 (New England BioLabs inc. - http://tools.neb.com/NEBcutter2/), verificando los sitios de restricción y la longitud de los fragmentos formados.
desarrollado por Nilsson et al (2009) (Fungal ITS Pipeline GNU-GPL software
http://www.emerencia.org/fungalitspipeline.html).
El proceso abarcó herramientas de análisis bioinformático como BLAST, HMMER, Clustal W y MAFFT utilizadas de forma automática por el software. Cada secuencia fue ejecutada en BLASTN frente a la base de datos de secuencias biológicas
(http://www.biomedcentral.com/content/supplementary/1751-0473-4-1-s2.zip) (Nilsson et al (2009), obteniendo las mejores 15 coincidencias. Seguidamente se
localizó y extrajo la región ITS2 de las secuencias problema, utilizando HMMER y modelos HMMs
(Hidden Markov Models) de la subunidad nuclear pequeña (nSSU), la región 5.8s y la subunidad nuclear
grande (nLSU) construidos por Eddy (1998). La secuencia de la región ITS2 fue usada para un nuevo
análisis en BLAST frente a la misma base de datos, obteniendo las mejores 15 coincidencias (Nilsson et
al, 2009).
5.6 ANÁLISIS FILOGENÉTICO
La construcción del árbol filogenético se realizó con las secuencias de cepas ATCC de las coincidencias encontradas en el análisis bioinformático anteriormente mencionado, excluyendo aquellas secuencias aun no identificadas hasta nivel de especie. Adicionalmente, se seleccionaron secuencias de las otras cepas control escogiendo las pertenecientes a la colección ATCC con la secuencia de la región ITS1-5.8s-ITS2 reportada (ANEXO 2).
La construcción del árbol filogenético se realizo usando por separado las regiones ITS1 e ITS2, las
cuales fueron extraídas utilizando el programa Fungal ITS Extractor desarrollado por Nilsson et al (2010)
(http://www.emerencia.org/FungalITSextractor.html). Posteriormente se procedió a realizar un alineamiento múltiple bajo el algoritmo MUSCLE (http://www.ebi.ac.uk/Tools/msa/muscle/) y utilizando el programa MEGA 4 (http://www.megasoftware.net/) para la construcción de los arboles filogenéticos bajo el método NJ (neighbor-joining). Se utilizo el modelo de sustitución Kimura 2 parámetros (K2P y un valor de replicas de 1000 bootstrap. Los arboles fueron observados y editados en el mismo programa (MEGA
4) (Kato et al, 2001).
5.7 ANÁLISIS DE ESTRUCTURAS SECUNDARIAS DEL rRNA
Para la ejecución de este proceso se utilizaron las herramientas bioinformáticas disponibles en el
servidor web ITS2 Database desarrollado por Koetschan et al. (2010)
Selig et al. (2008) y Schultz et al. (2006) accedida a través
http://its2.bioapps.biozentrum.uni-wuerzburg.de (Koetschan et al, 2010). Inicialmente se realizo la extracción de la secuencia ITS2 de las
secuencias problema utilizando HMMs (Hidden Markov Models) seguida por una predicción de la estructura secundaria bajo del método comparativo de secuencias y estructuras homologas, evaluando el grado de transferencia de hélices y la homología de la molécula frente las reportadas y anotadas en la base de datos ITS2.
Adicionalmente se corrió un análisis de cambios de bases compensatorias (Compensatory base per
changes – CBC) para la diferenciación de especies. Esto fue realizado con el programa 4SALE
(http://4sale.bioapps.biozentrum.uni-wuerzburg.de/) (Koetschan et al, 2010; Selig et al, 2008; Schultz et
6. RESULTADOS
6.1 TÉCNICA DE POLIMORFISMOS DE LEONGITUD DE FRAGMENTOS DE RESTRICCION (RFLP)
6.1.1 REACCIÓN EN CADENA DE LA POLIMERASA (PCR)
Tras la extracción de DNA de cada cepa se obtuvo la amplificación de la región ITS1-5.8S-ITS2 del
rDNA. El fragmento amplificado obtenido presento un tamaño de alrededor de 500-600pb para C.
albicans, C. krusei, C. tropicalis, C. parapsilosis, y aproximadamente de 880pb para C. glabrata y 600pb
para C. guilliermondii como era esperado y es reportado por Williams et al (1995) y Andrade (2007)
(Figura 2) (Tabla 1).
Tabla 1. Tamaños de fragmentos ITS1-ITS4 esperados de cada especie Candida sp.
(Fuente: Williams et al, 1995; Andrade, 2007)
Especie Tamaño Fragmento ITS1-ITS4 (pb)
C. albicans 536
C. tropicalis 528
C. parapsilopsis 520
C. krusei 511
C. glabrata 880
[image:18.612.96.536.389.513.2]C. guilliermondii 600
Figura 2. Fragmento ITS1-5.8S-ITS2 rDNA amplificado. Carril 1 y 2. C. parapsilopsis, 3 y 4.
Candida spen estudio, 5 y 6. C. tropicalis, 7,8 y 9. C. krusei, 10 y 11. C. guilliermondii, 12 y 13.
C. glabrata, 14 y 15. C. albicans, 16. Control negativo. Marcador de peso molecular
Hypperladder I (Bioline®)
6.1.2 POLIMORFISMOS DE LEONGITUD DE FRAGMENTOS DE RESTRICCIÓN (RFLP)
Los patrones de bandas obtenidos para las cepas de referencia fueron consistentes con los esperados,
Tabla 2. Patrones de bandas RFLP esperados para las especies Candida sp. tras la digestión
teórica con las enzimas de restricción BfaI, DdeI y HaeIII (Fuente: Andrade, 2007).
Candida sp. Fragmentos resultantes con los cortes teóricos de las enzimas (pb)
BfaI DdeI HaeIII
Candida parapsilopsis 520 520 406-106-14
Candida krusei 196-185-117 511 382-89-38
Candida glabrata 769-112 785-52-44 659-222
Candida albicans 536 419-117 444-92
Candida tropicalis 367-86-75 413-115 444-80
Candida guilliermondii 286-165-119-37 395-212 390-117-78-17-5
Candida parapsilopsis
En la digestión con las enzimas BfaI y DdeI no se obtuvo ningún corte como era esperado, obteniendo
bandas iguales de aproximadamente 500-550pb. La enzima HaeIII genero dos fragmentos de DNA de
aproximadamente 400pb y 100pb. Teóricamente esta enzima realiza tres cortes, obteniendo un tercer fragmento de 14pb que no puede ser observado por el límite de la técnica de electroforesis en gel de agarosa (Figura 3A).
El patrón de bandas RFLP infiere que la cepa si es perteneciente a la especie Candida parapsilopsis.
Candida glabrata
La digestión con la enzima BfaI genero la formación de dos fragmentos, uno de aproximadamente
700-800pb y otro cercano a 110pb. Con la enzima DdeI se observo bandas de 700-800pb. No se alcanzo a
evidenciar una banda esperada de 50pb y44pb por límite de la técnica. La enzima HaeIII genero dos
fragmentos de DNA de aproximadamente de 650-700pb y 200-230pb (Figura 3B).
El patrón de bandas RFLP infiere que la cepa si es perteneciente a la especie Candida glabrata.
A) B)
Figura 3. Patrones RFLP del fragmento ITS1-5.8S-ITS2 rDNA digerido con las enzimas BfaI,
DdeI y HaeIII. A) Candida parapsilosis. B) Candida glabrata. Marcador de peso molecular
[image:19.612.170.453.490.664.2] Candida tropicalis
La digestión con la enzima BfaI genero la formación de dos fragmentos, uno de aproximadamente
360-400pb y otro entre 80-1000pb. Teóricamente se esperarían tres bandas de 367pb, 86pb y 75pb pero estas dos últimas son observadas en el gel como una única banda al presentar tamaños similares. Con
la enzima DdeI se observaron bandas de aproximadamente 400pb y 100pb como era esperado.
Igualmente, la digestión con HaeIII genero los fragmentos esperados de DNA de aproximadamente de
450pb y de 80pb (Figura 4A).
El patrón de bandas RFLP infiere que la cepa si es perteneciente a la especie Candida tropicalis.
Candida krusei
En la digestión con la enzima BfaI se obtuvo dos bandas correspondientes a aproximadamente 200pb
-250pb y 100pb-150pb. Con la endonucleasa DdeI no se obtuvo ningún corte. La enzima HaeIII genero
dos fragmentos de DNA de aproximadamente 400pb y 100pb. Teóricamente esta enzima realiza tres cortes, obteniendo un tercer fragmento de 38pb que no puede ser observado por el límite de la técnica de electroforesis en gel de agarosa (Figura 4B).
El patrón de bandas RFLP infiere que la cepa si es perteneciente a la especie Candida krusei.
[image:20.612.182.456.332.501.2]A) B)
Figura 4. Patrones RFLP del fragmento ITS1-5.8S-ITS2 rDNA digerido con las enzimas BfaI, DdeI y
HaeIII. A) Candida tropicalis. B) Candida krusei. Marcador de peso molecular 100pb (Promega®).
Candida albicans
La enzima BfaI no realizó ningún corte obteniendo el mismo fragmento de DNA amplificado de
aproximadamente de 550pb. Con la enzima DdeI se observó bandas de aproximadamente 400pb y
100pb-150pb, y con HaeIII se generaron dos fragmentos de DNA de aproximadamente de 450pb y
100pb (Figura 5A).
El patrón de bandas RFLP infiere que la cepa si es perteneciente a la especie Candida albicans.
Candida guilliermondii
La digestión con la enzima BfaI generó la formación de tres fragmentos aproximadamente de 300pb,
para HaeIII se obtuvieron los fragmentos de DNA de aproximadamente de 400pb, 120pb y de 80pb, no
se observo la banda de 17pb por el límite de la técnica (Figura 5B).
El patrón de bandas RFLP infiere que la cepa si es perteneciente a la especie Candida guilliermondii.
[image:21.612.195.450.132.294.2]A) B)
Figura 5. Patrones RFLP del fragmento ITS1-5.8S-ITS2 rDNA digerido con las enzimas BfaI,
DdeI y HaeIII. A) Candida albicans. B) Candida guilliermondii. Marcador de peso molecular
100pb (Promega®).
Candida sp. de estudio
En la digestión del fragmento ITS1-5.8S-ITS2 amplificado de la levadura de estudio se obtuvo un patrón
de bandas igual a la cepa de referencia de C. guilliermondii. La endonucleasa BfaI generó tres bandas
de aproximadamente 300pb, 200pb y 100pb. Con DdeI se obtuvo dos bandas de 400pb y 200pb, y con
la enzima HaeIII dos bandas de 400pb y 100pb aproximadamente.
El patrón de bandas obtenido identifica la levadura de interés como C. guilliermondii, como era esperado.
Al mismo tiempo se comparo con el patrón RFLP de C. albicans permitiendo rectificar que la levadura no
pertenece a esta especie, y por lo tanto no es patógena (Figura 6).
Figura 6. Patrón RFLP del fragmento ITS1-5.8S-ITS2 rDNA para las especies C. albicans, C.
guilliermondii y Candida sp. estudio obtenidos con las enzimas BfaI, DdeI y HaeIII. Marcador
[image:21.612.197.419.491.657.2]6.2 CLONACIÓN Y SECUENCIACIÓN
Tras la ligacion de producto de PCR de la region ITS1-5.8S-ITS2 de cada una de las cepas, la transformacion y selección de colonias, se obtuvo celulas con el plasmido recombinante unicamente en
dos cepas, correspondientes a Candida sp. de estudio y C. krusei.
Al comprobar presencia del inserto realizando tanto una PCR con los primers específicos del inserto y
digestión con la enzima de restricción EcoRI se obtuvo productos de PCR amplificados del tamaño
esperado y el plásmido vector linearizado (3.9kb) con el respectivo fragmento correspondiente al inserto (aproximadamente entre 500 y 600pb).
Posteriormente, se obtuvo la secuenciación del fragmento clonado (ITS1-5.8S-ITS2) de las cepa
Candida sp. de estudio y la cepa control C. krusei (ANEXO 3), con las cuales se realizaron los
posteriores análisis.
6.3 ANALISIS BIOINFORMÁTICO
La simulación de la digestión de las secuencias con la herramienta NEBcutter v2.0 arrojo los mismos
resultados obtenidos in vivo (ANEXO 2), confirmando los patrones RFLP.
El análisis bioinformático el programa Fungal ITS Pipeline permitió obtener las mejores 15 coincidencias
tras comparar las secuencias problema de Candida sp. y C. krusei frente a la base de datos con la
herramienta BLASTN incluida (ANEXO 3).
El análisis de la región completa ITS1-5.8S-ITS2 de la levadura de estudio Candida sp. reveló catorce
coincidencias correspondientes a Pichia caribbica y una a Candida carpophila, todos con e-value de 0.0
y cobertura de la secuencia problema entre el 100 y 99%. Tras la extracción y análisis de la secuencia
ITS2 se obtuvo un análisis de mayor precisión con 15 coincidencias (e-value -106 y cobertura de la
secuencia problema del 100%) correspondientes a Pichia caribbica, identificando la levadura de estudio
Candida sp. como Candida fermentati (Telemorfo: Pichia caribbica) (ANEXO 3).
Por otro lado, en el análisis de la secuencia de C. krusei se obtuvo once coincidencias correspondientes
a la especie Issatchenkia orientalis (anamorfo: Candida krusei), uno correspondiente a Issatchenkia
terricola y tres coincidencias que fueron excluidas del estudio por ser cepas no identificadas a nivel de
especie. Todas las coincidencias presentaron un e-value de 0.0 y cobertura de la secuencia problema
entre el 100 y 99%. Tras el análisis de la región ITS2 se obtuvo cuatro coincidencias correspondientes a
Issatchenkia orientalis, dos Issatchenkia terrícola y una coincidencia correspondiente a Pichia sporocuriosa, todas con e-value 1e-87 y cobertura de la secuencia problema del 100% (ANEXO 3).
Los resultados sugieren una igual probabilidad de que la cepa C. krusei de control pertenezca a la
especie Issatchenkia orientalis, Issatchenkia terrícola o Pichia sporocuriosa debidó que las coincidencias
presentan igual E- value, puntaje (match score) y cobertura de la secuencia (query coverage).
6.4 ANALISIS FILOGENÉTICO
El análisis filogenético de las regiones ITS1 e ITS2 arrojaron resultados con topología similares y valores
bootstrap altos (70-100) para la resolución de los clados correspondientes a las especies Candida
parapsilosis, Candida tropicalis, Candida albicans, Candida glabrata y dos grupos, el Clado PC-CG-CC
que contiene las especies Pichia caribbica (Anamorfo: Candida fermentati), Candida guilliermondii y
Candida carpophila, y el Clado IO-IT-PS que contiene las especies Issatchenkia orientalis, Issatchenkia terrícola y Pichia sporocuriosa, indicando una construcción filogenética solida (Figura 7). Aun así, la
un numero de secuencias representativas de esta especie. Adicionalmente, la cepa Candida sp. de
estudio y la cepa control C. krusei fueron agrupadas en los clados PC-CG-CC y IO-IT-PS como era
esperado.
La topología de ambos arboles filogenéticos son consistentes con otros estudios filogenéticos de secuencias de del gen topoisomerasa II y 18S rDNA, indicando una construcción optima de los arboles
bajo las secuencias ITS1 e ITS2 y su utilidad como marcadores filogenéticos (Kato et al, 2001; Barns et
al, 1991). Aun así, no fue posible analizar las posiciones de los taxa dentro de los clados para lograr una mayor aproximación a la identificación de la especie debido que los bajos valores bootstrap obtenidos (Figuras 8 y 9).
En un intento de aproximar la identificación de la cepa control Candida krusei y la cepa de estudio
Candida sp. se analizaron los valores observados en la matriz de distancia genetica pareada de K2P. La
matriz K2P correspondiente a la región ITS2 presentó valores iguales de número de sustituciones de bases por sitio (0.00) entre las especies estrechamente relacionadas de ambos los clados PC-CG-CC y IO-IT-PC lo cual no permitió establecer diferencias entre las especies. Por otro lado, la matriz K2P de la
región ITS1 permitió excluir las especies Candida guilliermondii y Pichia sporocuriosa, reduciendo la
identificación de la cepa Candida sp. de estudio a las especies Pichia caribbica y Candida carpophila, y
la identificación de la cepa control C. krusei a las especies Issatchenkia orientalis y Issatchenkia terricola
(Tablas 8 y 9 - ANEXO 4).
Según estos resultados, la región ITS1 representaría un marcador molecular de mayor utilidad que la región ITS2. Aun así, esto no es respaldado al evaluar los valores totales (overall) K2P de cada región debido que la región ITS1 (0.43) obtuvo un valor total menor de número de sustituciones de bases por sitio, que la región ITS2 (0.49). Se debe tener en cuenta que el valor total K2P pudo ser afectado por las secuencias pertenecientes a las otras especies, diferentes a las estrechamente relacionadas (Clados PC-CG-CC y IO-IT-PS), debido que presentaban un mayor número de sustituciones de bases por sitio en la matriz de distancia genetica pareada de K2P (ANEXO 4).
a)
[image:23.612.75.534.465.659.2]b)
Figura 8. Árbol filogenético de secuencias de la región ITS1 por el método NJ – K2P - 1000
Bootstrap. Las secuencias de Candida sp. de estudio y de C. krusei se encuentran resaltadas con
un cuadrado y un triangulo, respectivamente.
FJ810509 Candida albicans
FJ545229 Candida albicans FJ810508 Candida albicans
FJ159642 Candida albicans
FJ159643 Candida albicans GU319987 Candida albicans
AY139781 Candida albicans
AY939786 Candida albicans
AF336831 Candida albicans AY217023 Candida albicans
GU319991 Candida albicans
Clado Candida albicans
AY282527 Candida tropicalis AF335928 Candida tropicalis
EU589208 Candida tropicalis
Clado Candida tropicalis
AY939798 Candida parapsilosis
AY217021 Candida parapsilosis AJ585347 Candida parapsilosis
Clado Candida parapsilosis
AY939793 Candida glabrata
AF167993 Candida glabrata AF336836 Candida glabrata
Clado Candida glabrata
AF336839 Candida guilliermondii
AY93979 Candida guilliermondii Clado Candida guilliermondii
AY553852 Candida carpophila EU568999 Pichia caribbica
PUJ Candida sp.
EU569005 Pichia caribbica EU569007 Pichia caribbica
EU569009 Pichia caribbica
EU569011 Pichia caribbica
AF022718 Candida fermentati EU569029 Pichia caribbica
EU569027 Pichia caribbica
EU569025 Pichia caribbica
EU569023 Pichia caribbica EU569021 Pichia caribbica
EU569019 Pichia caribbica
EU569017 Pichia caribbica EU569015 Pichia caribbica
EU569013 Pichia caribbica
Clado Pichia caribbica - Candida carpophila
EU315763 Pichia sporocuriosa
EU315751 Issatchenkia orientalis EU315767 Issatchenkia terricola
AF455401 Issatchenkia orientalis
L47113 Issatchenkia orientalis EU330187 Issatchenkia orientalis
PUJ C.krusei
AY939808 Issatchenkia orientalis
AB369918 Issatchenkia orientalis EF136369 Issatchenkia orientalis
AY235807 Issatchenkia orientalis
AF246989 Issatchenkia orientalis EF198013 Issatchenkia orientalis
EF198000 Issatchenkia orientalis
Clado Issatchenkia orientalis - Issatchenkia terricola
Figura 9. Árbol filogenético de secuencias de la región ITS2 por el método NJ – K2P - 1000
Bootstrap. Las secuencias de Candida sp. de estudio y de C. krusei se encuentran resaltadas con
un cuadrado y un triangulo, respectivamente.
EU569005 Pichia caribbica AY93979 Candida guilliermondii EU569007 Pichia caribbica EU569009 Pichia caribbica EU569011 Pichia caribbica EU569013 Pichia caribbica EU569015 Pichia caribbica EU569017 Pichia caribbica EU569019 Pichia caribbica EU569021 Pichia caribbica EU569023 Pichia caribbica EU569025 Pichia caribbica EU569027 Pichia caribbica AF218967 Candida guilliermondii AF022718 Candida fermentati
PUJ Candida sp. AY553852 Candida carpophila EU568999 Pichia caribbica EU569029 Pichia caribbica
Clado Pichia caribbica - Candida guilliermondii - Candida carpophila
AY939798 Candida parapsilosis
AJ585347 Candida parapsilosis Clado Candida parapsilosis AY282528 Candida tropicalis
EU589208 Candida tropicalis Clado Candida tropicalis AY217024 Candida albicans
AF335963 Candida albicans AY939786 Candida albicans AY139782 Candida albicans GU319991 Candida albicans GU319987 Candida albicans FJ159643 Candida albicans FJ159642 Candida albicans FJ810509 Candida albicans FJ545229 Candida albicans FJ810508 Candida albicans
Clado Candida albicans
AF218966 Candida glabrata AF167993 Candida glabrata AY939793 Candida glabrata
Clado Candida glabrata
PUJCkrusei509bp 162 bp AY939808 Issatchenkia orientalis AB369918 Issatchenkia orientalis EF136369 Issatchenkia orientalis EF198013 Issatchenkia orientalis EF198000 Issatchenkia orientalis L47113 Issatchenkia orientalis EU315751 Issatchenkia orientalis EU315767 Issatchenkia terricola AF455401 Issatchenkia orientalis AF246989 Issatchenkia orientalis EU315763 Pichia sporocuriosa AY235807 Issatchenkia orientalis EU330187 Issatchenkia orientalis
Clado Issatchenkia orientalis - Issatchenkia terricola - Pichia sporocuriosa
6.5 ANALISIS DE ESTRUCTURAS SECUNDARIAS
Al realizar el análisis de estructuras secundarias bajo el método comparativo de secuencias y estructuras homologas se obtuvo una estructura de cuatro proyecciones o brazos (doble hélices auto
complementarias) para la secuencia ITS2 de la cepa Candida sp. de estudio y la cepa control C. krusei,
con la más larga proyección correspondiente a la tercera, como era esperado según lo reportado
(Figuras 13 y 14) (Keller et al¸ 2009).
El análisis de la cepa Candida sp. de estudio arrojó coincidencias con un e-value de 9.3e-71 de las
cuales una perteneciente a la especie Pichia caribbica presento un 100% de transferencia de las 2
primeras hélices, y 92% y 0% para la tercera y cuarta hélice respectivamente (100/100/92/0). Las diez
coincidencias restantes correspondieron a cuatro coincidencias Pichia caribbica, dos de Candida
guilliermondii, dos de Candida carpophila y una de Candida albicans (Figura 10 y ANEXO 5), todas con
un e-value de 8.3e-72, porcentajes 100/100/100/50 y un valor CBC (compensatory base per changes) de 0.0, indicando que las secuencias eran idénticas. Por esta razón no se realizo el análisis filogenético.
A pesar de obtener un bajo porcentaje de transferencia de la cuarta hélice (0% y 50%), se obtiene un
resultado consistente al análisis filogenético de secuencias al identificar la cepa Candida sp. de estudio
dentro del clado de especies estrechamente relacionadas de Pichia caribbica, Candida guilliermondii y
Candida carpophila. Aun así, el análisis estructural tampoco permitió diferenciar entre estas tres
especies.
Por otro lado, para la cepa control C. krusei se obtuvo solo una coincidencia correspondiente a
Issatchenkia orientalis con e-value de 5.6e-50 con porcentajes de transferencia de hélices de 84%, 71%,
91% y 62% respectivamente para las hélices 1, 2, 3 y 4 (Tabla 5 – Figura 11). Aunque dos de sus
hélices no presentan un porcentaje de similitud en su estructura mayor al 75%, los valores 71% y 62% no se encuentran lejanos. Este resultado solo permite dar una aproximación hacia la identificación de esta
cepa control como perteneciente a la especie C. krusei (Telémorfo: Issatchenkia orientalis), pero no
permite confirmar la identificación debido a la falta de transferencia de dos de las hélices. Además, se debe tener en cuenta que no hay un numero representativo de estructura secundarias de la región ITS2
en la base de datos, encontrando solo una secuencia y estructura para I. orientalis e I. terricola y ninguna
para la especie Pichia sporocuriosa, lo cual afectó el análisis. Debido a la falta de coincidencias y
confiabilidad en los resultados obtenidos para la secuencia ITS2 de la cepa control C. krusei, no fue
Figura 10. Estructura secundaria de la secuencia ITS2 de la cepa Candida sp.de estudio.
Figura 11. Estructura secundaria de la secuencia ITS2 de la cepa C. krusei. Las regiones marcadas en
rojo representan las zonas homologas con la estructura secundaria de la secuencia Issatchenkia
orientalis reportada en la base de datos ITS2.
7. DISCUSION
Los resultados por la técnica RFLP permitieron diferenciar e identificar correctamente las especies del
género Candida utilizadas en este estudio, obteniendo los patrones de bandas esperados.
Adicionalmente, el patrón de bandas de la cepa Candida sp. de estudio permitió ubicarla en la especie
Candida guilliermondii, obteniendo una identificación consistente con los resultados obtenidos por
métodos convencionales y descartando su pertenencia a la especie patógena C. albicans.
Aun así, esta metodología presenta una baja especificidad para la diferenciación de especies
estrechamente relacionadas como las presentes en el clado Candida guilliermondii. El análisis de
cariotipado electroforético, análisis de secuencias de dominios D1/D2 (26S rDNA) y recientes comparaciones de las regiones ITS1-5.8s-ITS2 rDNA permitieron distinguir nuevas especies reubicadas
como Candida fermentati (originalmente descrita como Torula fermentati), Candida carpophila (Candida
guilliermondii var. Carpophila) y Candida fermentati (Telémorfo: Pichia caribbica) (Vaughan et al, 2005;
Suh & Blackwell, 2004). Asimismo, se han encontrado especies evolutivamente cercanas a la especie C.
krusei como Issatchenkia terrícola y Pichia sporocuriosa, entre las cuales aun no se han esclarecido
bien sus límites (Kurtzman et al, 1980; Kurtzman et al, 2008). Esta alta similitud de secuencias explica la
alta probabilidad de obtener un perfil electroforético RFLP similar que no permite distinguir entre especies estrechamente relacionadas.
el clado IO-IT-PS) al obtener un bajo valor bootstrap. Por otro lado, el análisis de estructuras secundarias del ITS2 rDNA fue afectado debido a el posible encuentro de secuencias mal anotadas, lo cual queda
reflejado en la única coincidencia perteneciente a la especie Candida albicans la cual es descartada del
estudio debido al patrón RFLP obtenido por la cepa Candida sp. de estudio (Bridge et al, 2003).
Al evaluar las diferencias de los resultados del agrupamiento de los árboles filogenéticos y el número de sustituciones de bases por sitio de las regiones ITS1 e ITS2, se obtiene que estas regiones no presentan igual conservación evolutiva. Al comparar el valor total (overall) de numero de sustituciones de bases por sitio (K2P) se obtiene una mayor divergencia nucleotídica para la región ITS2 como es reportado por otros autores, quienes la mencionan como la más adecuada para la diferenciación de especies del grupo
Fungi (Nilsson et al, 2006; Nilsson et al, 2008). Aun así, estudios revelan que esta divergencia y la
diversidad de estas secuencias difieren dependiendo del grupo taxonómico (Nilsson et al, 2008). Para
este estudio la región ITS2 no permitió reducir la identificación dentro de los clados PC-CG-CC y
IO-IT-PS, mientras que la región ITS1 permitió excluir las especies Candida guilliermondii y Pichia
sporocuriosa, reduciendo la identificación de la cepa Candida sp. de estudio a las especies Pichia caribbica y Candida carpophila, y la identificación de la cepa control C. krusei a las especies Issatchenkia orientalis y Issatchenkia terrícola. Aun así, el análisis pudo verse sesgado por la falta de un
número representativo de secuencias de cepas de referencia (ATCC u otras) pertenecientes a dichas especies.
Aun así, se determina que las regiones ITS rDNA no fueron suficientes para su identificación certera. Es necesario un análisis multigénico que incluya otros marcadores moleculares como el gen de la actina 1 (ACT1), el factor de elongación de la traducción 1 (EF1), ITS del rRNA, gen de la riboflavina sintetasa (RIBO) y el gen de la DNA topoisomerasa II (TOPOII) para lograr una identificación definitiva de la cepa
de estudio, tal como lo sugieren varios autores (Kato et al, 2001; Lan & Xu, 2006; Vaughan et al, 2005).
Igualmente, para la identificación de la cepa control C. krusei es necesario un análisis polifásico que
incluya el estudio de la morfología del asco y la ultraestructura de ascosporas que permiten una mejor
resolución de la identificación estas especies (Kurtzman et al, 1980; Kurtzman et al, 2008).
8. CONCLUSIONES
La técnica RFLP, el análisis bioinformático, filogenético y de estructuras secundarias rRNA permitieron
identificar la cepa Candida sp. de estudio dentro del clado de especies estrechamente relacionadas de
Candida guilliermondii, Candida fermentati (Telémorfo: Pichia caribbica) y Candida carpophila,
descartando su posible pertenencia a la especie patógena C. albicans.
9. RECOMENDACIONES
El uso de las regiones ITS rDNA no fueron suficientes para una identificación definitiva entre especies estrechamente relacionadas, por lo cual se concluye que es necesario la realización de estudios adicionales de métodos convencionales y diferentes marcadores moleculares para llegar a una identificación certera.