7.1. Genes humanos MBNL
En la descripción inicial del gen muscleblind de Drosophila, se indicó la existencia de genes homólogos en C.elegans y en vertebrados (Begemann et al., 1997). Como hemos comentado, en humanos se han descrito tres genes muscleblind-like (genéricamente MBNL). La característica estructural definitoria de las proteínas Muscleblind tanto en Drosophila como en humanos es la presencia de, al menos, un dedo de zinc del tipo Cys3His. Este motivo proteico, también nombrado como CCCH, consiste en tres residuos de cisteína y uno de histidina con un espaciado entre los residuos característico y se identificó originariamente en la familia de proteínas TIS11/NUP475/TTP (Gomperts et al., 1990). Los miembros de esta familia juegan un papel relevante en distintos aspectos del metabolismo del RNA, como es la transcripción, la estabilidad de los mensajeros y el procesado para MBNL1 tal y como hemos tratado anteriormente.
Introducción
El gen MBNL1 se localiza en el cromosoma 3q25, el gen MBNL2 en 13q31 y el gen MBNL3 en Xp25. Los tres loci se extienden varias kilobases sobrepasando las 100 kb en el caso de MBNL1 y MBNL2. El análisis de los ESTs y cDNAs disponibles en las bases públicas muestra que los tres genes humanos están sujetos a un complejo patrón de procesado alternativo que afecta principalmente a los exones del extremo 3’ de cada uno de los loci. Actualmente, existen nueve mensajeros completos secuencidados para MBNL1, tres para MBNL2 y cuatro para MBNL3 que representan diferentes isoformas proteicas. Las funciones descritas para cada uno de los genes humanos se han comentado en el Apartado 5.2 de Introducción.
7.2. Corte y empalme alternativo en muscleblind
El análisis de la unidad de transcripción muscleblind en Drosophila revela una organización genómica compleja (Figura 7.1) (Artero et al., 1998; Begemann et al., 1997). Se han descrito 10 exones distribuidos a lo largo de 110 kb de DNA genómico. El tamaño de los exones oscila entre 42 y 2181 pb. Destaca la presencia de uno de los intrones más grandes descritos en el genoma de Drosophila que abarca 75 kb (García- Casado, 2002). El transcrito muscleblind primario sigue un patrón de maduración complejo, dando lugar al menos a cuatro mRNAs por procesado alternativo. Estos cuatro mRNAs, denominados mblA, mblB, mblC y mblD comparten la secuencia 5´- UTR y los primeros dos exones (incluyendo el ATG y el extremo N-terminal de las proteínas codificadas) pero se diferencian en sus porciones 3´ dando lugar a cuatro ORFs de diferentes longitudes que codifican para proteínas con distintos extremos C- terminales. Los transcritos mblA, mblB y mblC contienen tres ORFs de 203, 316 y 243 aminoácidos respectivamente, y comparten los primeros 179 residuos N-terminales (Figura 7.1). El transcrito representado por mblD también contiene una ORF que comparte los primeros 63 aminoácidos con las otras isoformas de Muscleblind, pero debido al uso del exón 3, el cual contiene codones de parada, sólo codifica para un pequeño péptido de 84 aminoácidos. Las isoformas MblA, MblB y MblC contienen dos copias del dedo de zinc tipo Cys3His. Un motivo muy semejante se encuentra en las proteínas Tristetrapolin de ratón (TTP, también conocidas como TIS11 y NUP475) y pharynx and intestine in excess protein 1 (PIE-1) en C. elegans. La isoforma corta, MblD, sólo contiene un dedo de zinc completo por lo que su función podría ser reguladora, actuando como una forma dominante negativa que es capaz de interaccionar con las dianas normales de Muscleblind pero de una forma improductiva.
Introducción
El patrón de expresión de muscleblind en embrión se detecta en el ectodermo y mesodermo pero se desconoce la expresión específica de cada variante proteica. La expresión en el ectodermo está restringida en el SNC a un grupo repetido de células y órgano de Bolwig que contiene los fotorreceptores larvarios. La expresión mesodérmica se detecta en la musculatura somática, visceral, faríngea así como en la musculatura que sirve de sostén para el corazón (alary muscles).
Un perfil de expresión mediante PCR semicuantitativa para cada una de las cuatro isoformas retrotranscritas (RT-PCR), indica que la expresión de las isoformas de muscleblind está regulada a lo largo del desarrollo. Los transcritos mblC son los más ampliamente expresados desde embriones tempranos hasta moscas adultas (Vicente et al., 2007).
Introducción
ISOFORMA Secuencia consenso de los dedos de zinc
Figura 7.1. Estructura del gen muscleblind de Drosophila y las isoformas proteicas generadas por corte y empalme alternativo. En el panel superior se muestra la estructura de cada una de las
variantes de procesado (mblA-D). La línea horizontal indica la extensión del DNA genómico. Las cajas denotan exones y las líneas que las unen intrones. En negro, región codificante. Figura dibujada a escala excepto los intrones (barritas verticales). Figura tomada de Begemann et al., 1997 y modificada por García-Casado, 2002. En el panel inferior se muestran las cuatro isoformas proteicas. Las regiones comunes se indican con la misma trama y los dedos de zinc con cuatro líneas verticales (indicadoras de los residuos CCCH conservados). MblB contiene tres regiones de baja complejidad ricas en glutamina (N), alanina (A) y fenilalanina (F).
Introducción
7.3. Comparación entre los genes muscleblind de Drosophila
y humanos
Las proteínas Muscleblind constituyen una nueva familia de proteínas CCCH. En protóstomos, existe un solo gen muscleblind y éste se caracteriza por poseer dos dedos de zinc del tipo CX7CX6CX3H. En deuteróstomos existen tres genes muscleblind y se caracterizan por tener cuatro dedos de zinc siendo el primero y tercero idénticos al de protóstomos y el segundo y cuarto del tipo CX7CX4CX3H (Pascual et al., 2006).
El mayor porcentaje de identidad nucleotídica se da entre los cDNAs de los genes MBNL1 y MBNL3 con un 57% siendo el menor entre MBNL2 y MBNL3 con un 41% (mejor alineamiento global entre las secuencia de nucleótidos de las regiones codificantes). Respecto a los cDNAs de muscleblind en Drosophila, la mayor identidad nucleotídica se da entre la región codificante de la isoforma mblC y el gen humano MBNL2 con un 50%. La mayor identidad de secuencia entre las proteínas Muscleblind humanas se da entre la proteína MBNL1 y MBNL2 con un 77% siendo la menor entre la proteína MBNL1 y MBNL3 con un 68%. Respecto a Drosophila, todas las proteínas humanas tienen porcentajes de identidad similares; el mayor de ellos es entre MBNL1 y la isoforma MblB con un 33% de identidad y un 42% de similaridad (Figura 7.2)
A) Mbla Mblb Mblc Mbld MBNL1 35 48 41 18 MBNL2 47 48 50 25 MBNL3 41 48 48 22 B) Mbla Mblb Mblc Mbld MBNL1 25/32 33/42 28/36 11/15 MBNL2 24/31 31/41 28/35 11/16 MBNL3 26/34 28/41 28/37 13/17 C)
Figura 7.2. Comparaciones de secuencia entre muscleblind y MBNL1-3. (A) Se indica el porcentaje
de identidad nucleotídica entre las regiones codificantes de los cDNAs de muscleblindA-D y de MBNL1 (AJ308400), MBNL2 (AF061261) y MBNL3 (AK002178). (B) Se indica el porcentaje de identidad/ similaridad entre las proteínas MBNL1-3 y las isoformas de Muscleblind. MBNL1-3 tienen, respecto a las distintas isoformas de muscleblind, porcentajes de identidad similares tanto a nivel de nucleótidos como de aminoácidos. La isoforma de mbl que presenta una identidad tanto nucleotídica como aminoacídica más alta con los tres genes humanos es mblB. (C) Las proteínas MBNL1-3 poseen cuatro dedos de zinc (barras negras) mientras que Mbl de Drosophila contiene sólo dos. Se indica el porcentaje de identidad de secuencia entre los cDNA y las respectivas proteínas de MBNL1-3. Figura tomada de Pascual M. 2005.
Introducción