2. Genómica funcional de plantas
2.3. El Proyecto de Genómica Funcional de Cítricos (CFGP)
El Proyecto de Genómica Funcional de Cítricos (CFGP; http://bioinfo.ibmcp. upv.es) surge fruto de la necesidad de dotar a la Citricultura actual de nuevas herramientas biotecnológicas que, por un lado, permitan profundizar en la comprensión de los mecanismos moleculares subyacentes a la biología de los cítricos, en particular de los relacionados con rasgos agronómicos de interés, y que, por otro lado, constituyan un sólido punto de apoyo en el desarrollo de futuros programas de mejora para la obtención de nuevas variedades. El CFGP se inicia en el año 2001 como una colaboración trilateral entre el Instituto de Biología Molecular y Celular de Plantas (IBMCP), el Instituto Valenciano de Investigaciones Agrarias (IVIA) y el Instituto de Agroquímica y Tecnología Alimentaria (IATA). La presente Tesis Doctoral se integra en el CFGP desde los orígenes del mismo.
En la actualidad existen diversas iniciativas de genómica funcional en cítricos, destacando los esfuerzos de secuenciación del genoma de cítricos (Roose et al, 2007; Chen y Gmitter, 2008; Terol y Talón, 2008); la secuenciación masiva de ESTs de cítricos (Machado et al, 2006; 2007); el desarrollo de la base de datos HarvEST (http://harvest.ucr.edu/), que recoge ESTs de diversas especies de interés agronómico, entre ellas cítricos (Close et al, 2007) y el de la micromatriz de
Introducción
14
oligonucleótidos cortos de Affymetrix (GeneChipP
®
P
Citrus Genome Array), que representa 33,879 transcritos de cítricos (Close et al, 2006). Sin embargo, cuando se
inició el CFGP la base de datos GenBank del NCBI contaba con apenas 2,000 secuencias de cítricos: 1,300 ESTs de frutos en desarrollo de Citrus unshiu,
300 secuencias de flavedo y albedo de frutos de pomelo y 200 secuencias de Citrus
sinensis. Esto implica que el CFGP fue la primera aproximación genómica a gran
escala iniciada en cítricos. El objetivo general del CFGP fue el desarrollo de herramientas genómicas para el estudio de procesos biológicos relevantes para la citricultura, desde la biología del desarrollo (desarrollo vegetativo, floración, cuajado, desarrollo y maduración del fruto, calidad del fruto, senescencia y abscisión), a la respuesta al estrés de origen tanto biótico (infección por virus y hongos) como abiótico (salinidad, sequía y deficiencia férrica), y a los procesos de post-cosecha (respuesta al frío y al ataque por hongos). Este objetivo general se concretó, inicialmente, con la construcción de 25 genotecas de cDNA que cubren un amplio rango de tejidos, estadios de desarrollo y condiciones de estrés biótico y abiótico, así como de una genoteca genómica de Citrus clementina. A partir de los clones generados se aislaron un total de 22,635 ESTs, que representaban 11,836 posibles transcritos únicos o unigenes de cítricos. Como un primer paso en la caracterización del transcriptoma de cítricos, 12,672 clones de cDNA, que representaban 6,875 posibles unigenes, se utilizaron para generar una micromatriz de cDNA de cítricos (Forment et al, 2005). Este trabajo fue pionero en genómica funcional de cítricos puesto que abordó, por primera vez, la secuenciación masiva de ESTs y la generación de una micromatriz de cDNA en cítricos. Posteriormente, se hicieron públicas otras colecciones de ESTs de cítricos (Fujii et al, 2006; Machado et al, 2006, 2007) y se puso al servicio de la comunidad científica la micromatriz de oligonucleótidos cortos de cítricos (Close et al, 2006). La micromatriz de cDNA generada por el CFGP (Forment et al, 2005) permitió el análisis de la expresión génica durante el desarrollo y la maduración del fruto en cítricos (Cercós et al, 2006) así como en relación a la respuesta a la infección del virus de la tristeza de los cítricos (Gandía et al, 2007). Recientemente, se ha generado una genoteca de cDNA normalizada de longitud completa y 9 genotecas de cDNA estándar a partir de tejidos y tratamientos de variedades y patrones seleccionados en relación a la calidad del fruto, la resistencia a la abscisión y la tolerancia a la salinidad. A partir de estas últimas genotecas se han aislado y anotado funcionalmente 52,626 ESTs de cítricos, que representan 15,664 unigenes. El análisis funcional de los unigenes de cítricos se ha centrado en rutas metabólicas tanto del metabolismo primario como secundario, con especial detalle en la biosíntesis de lignina en cítricos y en distintos aspectos de genómica comparada entre cítricos y Arabidopsis como la identificación
Introducción
15
de posibles ortólogos y la caracterización de familias génicas (Terol et al, 2007). En la actualidad el CFGP dispone de un total de 52 genotecas de cDNA (30 genotecas estándar, 6 genotecas de sustracción y 16 genotecas de longitud completa) generadas a partir de un amplio rango de condiciones (tejidos, estadios de desarrollo, condiciones de estrés biótico y abiótico) con el objeto de que la colección de ESTs derivada de estas genotecas maximice la representación del transcriptoma de los cítricos. En estos momentos, la colección de ESTs del CFGP consta de 85,965 ESTs agrupadas en 27,551 unigenes (11,844 contigs, o conjuntos de secuencias formados por dos o más ESTs y 15,707 singletons o secuencias únicas) que se gestionan en la base de datos EST2uni (Forment et al, 2008) (http://bioinf.comav.upv.es/est2uni), herramienta bioinformática desarrollada en el CFGP, que permite el pre-procesado, el ensamblaje y la anotación de las ESTs. Los contigs formados por un elevado número de ESTs, aunque aumentan la redundancia de una colección de ESTs, son de gran utilidad para la identificación de posibles marcadores moleculares, en particular SSRs y SNPs. El análisis de la colección de ESTs de cítricos del CFGP, mediante EST2uni, ha permitido identificar 1,533 posibles SSRs y 6,139 posibles SNPs en cítricos (http://bioinf.comav.upv.es/est2uni). La identificación de este conjunto de posibles marcadores moleculares en cítricos constituye una herramienta fundamental a partir de la cual se pueden desarrollar posteriores estudios que aborden los problemas concretos de la taxonomía, las relaciones filogenéticas y la variabilidad genética del género Citrus, cuestiones críticas en la caracterización del germoplasma, en el control de la erosión genética, en el registro de nuevas variedades y en el establecimiento de nuevos programas de mejora genética.
3. APROXIMACIÓN GENÓMICO-FUNCIONAL A DIVERSOS ASPECTOS DEL