• No se han encontrado resultados

Una forma de predecir la función de un gen es determinar la presencia y organización de dominios proteicos conservados (Sessions et al., 2002). Se entiende por dominio proteico una porción de una proteína con estructura terciaria definida y, en general, asociado a alguna función. El creciente número de secuencias de proteínas depositadas en las bases de datos ha revelado la existencia de motivos de secuencia comunes algunos de los cuales han sido asociados con funciones determinadas. Se han identificado 680 dominios en la base de SMART (Simple Modular Architecture Research Tool; http://www.smart.embl-heidelberg.de/). Esto permite la clasificación de las proteínas en base a la presencia de motivos (Sedgwick y Smerdon, 1999).

II.1 Proteínas con dominios transmembrana

Los dominios transmembrana están compuestos por entre 15 y 30 residuos mayoritariamente hidrofóbicos y se encuentran en proteínas que se unen a alguna membrana celular. Aproximadamente 4.589 genes de

Arabidopsis thaliana (18%) contienen dos o más dominios transmembrana

(Ward, 2001; ARAMEMNON: http://botanik.uni_koeln.de/, Schwacke et al.,

2003). Las proteínas integrales de membrana pueden tener importantes funciones en transporte de solutos a través de la membrana, percepción y transducción de señales y actividades biosintéticas y metabólicas localizadas en membrana. Una proteína puede tener múltiples dominios transmembrana (ej. 20 en TM20 de maíz) (Stiefel et al., 1999). TM20 de maíz es una proteína transmembrana cuya posible función es el transporte polar de hormonas (Stiefel et al., 1999; Jahrmann et al., 2005). Esta proteína se identificó en un mutante tipo dek (defective kernel) de maíz denominado lachrima, cuyo embrión presenta numerosas alteraciones en los estadíos tempranos de la embriogénesis. Al comparar la secuencia proteica de TM20 con las bases de datos de otras especies vegetales se encontró una proteína de organización muy similar en arroz (Oriza sativa L.). En Arabidopsis thaliana, no existe ningún gen que codifique una proteína con 20 dominios transmembrana pero si uno

que codifica una proteína con cierta similitud pero con sólo cuatro dominios transmembrana (Jahrmann, 2002).

II.2 Repeticiones Anquirina

En 1987 Breeden y Nasmyth describieron la presencia de unas secuencias de 33 aminoácidos repetidas en tándem en dos proteínas reguladoras de ciclo celular de Schizosaccharomyces pombe y Saccharomyces

cerevisiae (CDC10 y SW16). Repeticiones semejantes también estaban

presentes en otras proteínas reguladoras como Notch de Drosophila

melanogaster y LIN-12 de Caenorhabditis elegans. Posteriormente, se

descubrieron 24 copias de esta repetición en una proteína humana denominada anquirina, relacionada con el citoesqueleto, que fue la que dio el nombre a la repetición anquirina (ANK) (Sedgwick y Smerdon, 1999).

Actualmente se han identificado repeticiones ANK en numerosas proteínas involucradas en muy diversas funciones y pertenecientes a procariotas, eucariotas e incluso virus (Bork, 1993; Rubstov y Lopina, 2000; Lux

et al., 1990; Massung et al., 1992). Entre las variadas funciones de las

proteínas con repeticiones ANK se puede mencionar la regulación del ciclo celular, enzimas mitocondriales, interacciones de citoesqueleto, traducción de señal o toxinas (Sedgwick y Smerdon, 1999). Por ejemplo, contienen motivos ANK subunidades de factores de transcripción o reguladores de sistemas transcripcionales (cdc10, SW16, SW14, GAPBβ, NF-κB/p105, IκBα, bcl-3 o CAMTAs), proteínas intrínsecas de membrana que regulan la diferenciación de tejidos (Lin-12, Glp-1, Notch), un determinante sexual de nematodos (Fem-1), proteínas reguladoras de fosfolipasas (Phlb e iPLA2), toxinas de arácnidos, intercambiadores iónicos Cl/HCO3, Na/Ca, la ATPasa Na/K, el receptor IP3, rianodina, canales de Na voltaje-dependientes o proteínas de adhesión celular (familia L1 CAM) (Bennett y Baines, 2001; Givskov et al., 1988; Larsson et al., 1998; Kiyatkin et al., 1993; Michaely et al., 2002, Chang y Low, 2003).

El hecho que este motivo este conservado en organismos tan distantes evolutivamente como mamíferos y levaduras indica que cumplen un papel importante para la función de las proteínas (Breeden y Nasmyth, 1987). Al

mismo tiempo están presentes en proteínas de muy diferente función lo cual implica que no deben de cumplir una tarea muy específica sino más bien de carácter general (Bork, 1993; Sedgwick y Smerdon, 1999; Klimyuk et al., 1999), mientras que la presencia de otros dominios de señal, interacción proteína- proteína y catalíticos en las mismas proteínas serían los responsables de la

función específica (Mosavi et al., 2002). Existe un número creciente de

ejemplos en los que las repeticiones ANK funcionan como lugares de unión proteína-proteína, por lo que se considera que esa es su función principal (Sedgwick y Smerdon, 1999). Esta función ha sido demostrada experimentalmente en unión de proteínas heterólogas y mediando

homodimerización (Bork, 1993; Lin et al., 1999). Por ejemplo, LaMarco y

colaboradores (1991) mostraron que las repeticiones ANK están involucradas

en uniones de subunidades de las proteínas β de unión GABA (GABPβ), la

proteína I-κBα está casi enteramente compuesta de repeticiones anquirina y es capaz de unir la subunidad de 65 kDa de NF-κB (Haskill et al., 1991), la α- latrotoxina de la araña viuda negra se asocia a receptores extracelulares a través de las 19 repeticiones ANK (Sudhof, 2001), y las proteínas Su(H) y Deltex se unen mediante repeticiones ANK a Notch (Le Gall y Giniger, 2004).

Estudios en proteínas animales demuestran que la estructura primaria

de las repeticiones ANK tiene en promedio 33 aminoácidos (Figura 10) (Bork,

1993). Solo cinco de los 33 residuos tienen un grado alto de conservación y en 13 más se conserva el tipo de aminoácido. Aquellos aminoácidos que permanecen invariables corresponden a posiciones hidrofóbicas los cuales son necesarios para mantener la estructura secundaria (Rohde y Bork, 1993; Bork, 1993; Mosavi et al., 2002).

- t – o t L H h A h - - t t – t h h t – L L t – t – t - - - Figura 10.- Secuencia consenso de la repetición ANK según la determinación realizada por Bork (1993), basado en proteínas animales. -, representa un aminoácido cualquiera; t representa un aminoácido polar o que tiende a formar

giros; o representa serina o treonina; h representa un aminoácido hidrofóbico y

las letras mayúsculas corresponden a aminoácidos conservados de acuerdo al código de una letra.

Esta repetición ANK básica de 33 aminoácidos se haya repetida en tándem normalmente de 4 a 6 veces, aunque se han encontrado proteínas de entre dos y 29 repeticiones (Kohl et al., 2003). Cada repetición puede estar separada de la siguiente entre cero y 20 aminoácidos (Bork, 1993).

La determinación de la estructura tridimensional de algunas proteínas con motivos ANK ha revelado que dichas repeticiones se pliegan en una serie de hélices α conectadas por giros de 90 grados (Figura 11). La estructura esta estabilizada por hojas β plegadas antiparalelas formadas entre las repeticiones y por uniones hidrofóbicas en la repetición y entre las repeticiones vecinas. Las hojas β plegadas se proyectan desde los pares de hélices casi en ángulo recto. La capacidad de las repeticiones ANK para unir dianas de proteínas implica contacto entre las puntas de los β-hairpins, los que están expuestos hacia el solvente, y la superficie de las hélices encaradas hacia el interior del surco. Los residuos localizados en los extremos de los giros, las zonas más expuestas, corresponden a su vez con la zona terminal de la repetición ANK, que es la de secuencia menos conservada. Se cree que esta zona es la que determina la especificidad de unión de las proteínas al dominio (Bennett y Baines, 2001; Mosavi et al., 2002). Por lo tanto, el plegamiento de las repeticiones ANK juega un importante papel para los variados tipos de funciones que realizan (Mosavi et al., 2002). Estudios previos han demostrado que una sola repetición ANK no puede adoptar una estructura de plegamiento, si no comparte una interfase con otra repetición, por lo tanto, la unidad mínima para un correcto funcionamiento es de dos repeticiones (Zhang y Peng, 2000).

Figura 11.- Estructura tridimensional de un conjunto de repeticiones ANK. Estructura tridimensional del conjunto de repeticiones ANK de la proteína miotrofina de Rattus norvegicus (Yang et al., 1998). Los

II.3 Proteínas de Plantas con Repeticiones Anquirina

Hasta el momento se han caracterizado muy pocas proteínas de plantas que contengan motivos ANK y de la mayoría de ellas no se conoce la función a nivel molecular. Entre ellas se pueden citar:

• ANK1 de tabaco (Ankyrin repeat protein 1) y su homóloga AKR2 de

Arabidopsis (Yan et al., 2002; Kuhlmann et al., 2003), involucradas en la defensa frente a patógenos.

• CAMTAs (Calmodulin-binding transcription activators) en Arabidopsis y

Brassica napus, probablemente implicadas en cascadas de regulación de

la transcripción (Bouché et al., 2002).

• Familia AKT de Arabidopsis (Sentenac et al., 1992; Ketchum y Slayman,

1996; Pilot et al., 2003) y SKT1, un homólogo en patata (Zimmermann et al., 1998), que codifican canales de potasio dependientes de voltaje de la familia Shaker.

• APKs (ankyrin protein kinases), son quinasas descritas en Medicago

(Chinchilla et al., 2003).

• ART2 de Arabidopsis, interviene en la defensa frente a patógenos (Peck et al., 2001).

• CAO, (chlorophyll a/b binding protein harvesting-organelle specific protein) descritas en Arabidopsis(Klimyuk et al., 1999; Jonas-Straube et al., 2001).

• AKR (Ankyrin Repeat gene) de Arabidopsis, interviene en los procesos de diferenciación celular asociada a luz (Zhang et al., 1992).

• NPR1 (non-expresser of PR genes) de Arabidopsis, interviene en el control

de la respuesta frente a patógenos SAR (Systemic Acquired Resistance)

(Cao et al., 1997, 1998).

• ACBP2 (cytosolic acyl-CoA-binding) de Arabidopsis, es una proteína de

unión a acil-CoA (Chye et al., 2000).

• EMB506 de Arabidopsis, es necesaria para el correcto desarrollo

embrionario (Albert et al., 1999).

• ACD6, una proteína con repeticiones ANK y dominio transmembrana, es un

posible regulador y efector de la señal del ácido salicílico en la respuesta de defensa de Arabidopsis(Lu et al., 2003).

Los repeticiones ANK son objetos muy atractivos desde el punto de vista experimental ya sea para evaluar nuestra comprensión sobre la relación secuencia-estructura-estabilidad-función en proteínas, como para el desarrollo de herramientas moleculares para aplicaciones biotecnológicas como, por ejemplo, el reconocimiento molecular específico (Devi et al., 2004).

El objetivo general de esta tesis ha sido la identificación y estudio de

genes relacionados con el desarrollo temprano del embrión de Arabidopsis

thaliana. Este trabajo es continuación de trabajos previos del grupo de

investigación relacionados con el estudio de la embriogénesis en maíz.

En detalle, los objetivos planteados para esta tesis doctoral se han centrado en dos puntos principales:

A. Identificación de genes implicados en el desarrollo de la semilla de Arabidopsis thaliana

A.1.- Caracterización del transcriptoma de semilla inmadura. Obtención de una genoteca de cDNAs a partir de RNA extraído de semillas inmaduras en etapas muy iniciales del desarrollo. Secuenciación de ESTs y evaluación de las características de los genes identificados. A.2.- Identificación de genes que se transcriben específicamente durante el

desarrollo inicial de la semilla. Utilización de un sistema de selección in

silico basado en la presencia de ESTs y en las bases de datos de

hibridaciónes de micromatrices. Evaluar los resultados a nivel experimental y analizar las características de los genes seleccionados. B. Genes que codifican proteínas con repeticiones anquirina y dominios

transmembrana en Arabidopsis thaliana (genes AtAnkTm).

B.1.- Identificación y clasificación de las proteínas codificadas en el genoma que contengan repeticiones anquirina. Determinación de la secuencia consenso de la repetición anquirina en Arabidopsis.

B.2.- Caracterización de los genes AtAnkTm incluyendo su clasificación y análisis filogenético, determinación de su distribución cromosómica, presencia en otras especies, determinación de los patrones de expresión y análisis de líneas mutantes.

B.3.- Caracterización de genes AtAnkTm específicos de etapas tempranas del desarrollo embrionario.

Capítulo I. Identificación de genes que se expresan