Pasos en los experimentos de microarrays - Desarrollo de técnicas de computación evolutiva : mu

Independientemente de la tecnología específica usada, un experimento de microarray

consiste en tres pasos básicos: preparación de las muestras y etiquetado, hibridación de las muestras y lavado y, escaneo de las imágenes de microarray y procesamiento. En esta sección, los microarrays ADNc serán usados como base para la discusión general de estos pasos. En general, los experimentos basados en otras plataformas, como el GeneChip de Affymetrix, siguen principios similares a menos que se especifique lo contrario. El esquema general de un

microarray de ADNc esta ilustrado por la figura 3.4.

Figura 3.4. Esquema general de un microarray de ADNc. Fuente: Duggan et al. (1999).

3.2.1. Preparación de muestras y etiquetado

La preparación de muestras involucra la extracción y purificación de ARNm de tejidos de interés. Debido a un número de desafíos, este procedimiento puede ser muy variable (Amaratunga y Cabrera, 2003; Stekel, 2003). Primero, el ARNm diana típicamente forma parte de una pequeña fracción (menos del 3%) de todo el ARNm en la célula. Segundo, puede ser muy difícil aislar ARNm específico para el estudio a partir de un conjunto heterogéneo de células (por ejemplo, los tejidos enfermos contienen una mezcla de tejidos normales, células inflamadas, tejido necrótico y, en muestras de cáncer, áreas de diferentes grados). Finalmente, el ARNm capturado se degrada muy rápidamente. Para hacer frente a esta rápida degradación, el ARNm es usualmente trascripto a ADNc (para microarrays ADNc), que es mas estable, inmediatamente después de la extracción (Amaratunga y Cabrera, 2003).

Para permitir la detección de cuales ADNc están ligados al microarray, las muestras van a través de un proceso de etiquetado dependiente de la plataforma. Para la plataforma Affymetix, se contruye ARN complementario etiquetado con biotina para hibridizar con el GeneChip. Los protocolos son cuidadosamente definidos por Affymetrix para asegurar que cada laboratorio Affymetrix siga los mismos pasos. Así, los resultados experimentales de diferentes laboratorios Affymetrix son comparables entre si (Stekel, 2003).

La detección de ADN con microarrays de ADNc ha sido realizada anteriormente con ADN etiquetado radiactivamente, pero ahora es mas común el uso de colorantes que son fluorescentes cuando son expuestos a una longitud de onda especifica de luz. En los experimentos mas comunes, dos muestras son hibridizadas en el arreglo, cada una etiquetada con colorantes Cy3 o Cy5, que son excitados por láseres verdes y rojos, respectivamente (Amaratunga y Cabrera, 2003). Esto resulta en un microarray ADNc de dos canales y permite medir simultáneamente ambas muestras. También es posible que sean usadas más de dos muestras etiquetadas, produciendo un microarray de ADNc multicanal.

3.2.2. Hibridación

La hibridación es el paso en el cual las sondas de ADN en los microarrays y el ADN diana etiquetado (o ARN) forma cadenas heterogéneas de acuerdo a la regla de apareo de bases de Watson-Crick (Stekel, 2003). El principio esencial aquí es que una molécula de ADN de una sola hebra se ligara a otra molécula de ADN de una sola hebra con una secuencia de macheo precisa con mucho mas afinidad que a una secuencia con un macheo impreciso (Amaratunga y Cabrera, 2003). En realidad, sin embargo, la hibridación es un proceso complejo y un segmento de ADN podría también ligarse a una secuencia similar pero no idéntica a su diana complementaria, dando lugar al fenómeno llamado hibridación cruzada. Esto es influenciado por muchas condiciones, incluida la temperatura, humedad, concentración salina, volumen de la solución diana y operador de hibridación (Stekel, 2003).

La hibridación también puede ser realizada manualmente o por un robot. La hibridación robótica provee un mucho mejor control sobre la temperatura de la diana y de la filmina. El uso consistente de una sola estación de hibridación también reduce la variabilidad que emerge de múltiples hibridaciones y varios operadores (Sketel, 2003). Después de la hibridación, el

microarray es removido de la cámara o estación y luego es lavado para eliminar cualquier exceso de muestras de etiquetado, para que solo el ADN complementario de las sondas permanezca ligado al arreglo. Finalmente, el microarray es secado usando una centrifugadora o por aplicación de aire limpio comprimido.

3.2.3. Escaneo de Imagen

Después de completar la hibridación, la superficie del arreglo hibridizado es escaneada para producir una imagen de microarray. Como se mencionó previamente, las muestras son etiquetadas con biotín o colorantes fluorescentes que emiten luz detectable cuando son estimuladas por láser. La luz emitida es capturada por un tubo foto multiplicador (photo- multiplier tube o PMT) en un escáner, y la intensidad es grabada. Muchos escáneres contienen uno o mas lásers que son enfocados en el arreglo (para los microarrays de dos canales, el escáner usa dos lásers) (Stekel, 2003).

Aunque el escáner se emplea para detectar la luz emitida por las hebras de ADN diana que están ligadas a su sonda complementaria, también puede capturar la luz de otras fuentes. Estas otras fuentes incluyen muestras de ADN etiquetado que se ha hibridizado accidentalmente a la filmina de vidrio, muestras etiquetadas residuales (sin lavar) que se han adherido al vidrio, varios químicos usados en el procesamiento de la filmina, e incluso la filmina misma. Esta luz capturada incidentalmente es llamada background (Amaratunga y Cabrera, 2003).

El escaneo de la salida de un chip Affymetrix es usualmente una imagen monocromática (ver figura 3.5). Con un microarray de dos canales, la salida es un par de imágenes monocromáticas. Cada imagen es de uno de los lásers en el escáner. Las dos imágenes monocromáticas son luego combinadas para crear las imágenes a color falsas de los microarrays

(ver figura 3.6). Las imágenes monocromáticas y las de dos colores son usualmente almacenas en formato TIFF (tagged image file format).

Figura 3.6. Imagen a color falsa resultante para un microarray de ADNc. Los puntos verdes corresponden a los puntos mas expresados en el canal uno. Los puntos rojos corresponden a aquellos mas expresados en el canal dos. Los puntos amarillos tienen un nivel de expresión similar en ambos canales. Los puntos negros tienen un nivel de expresión bajo en ambos canales. Fuente: http://genome-www.stanford.edu/cellcycle/.

3.3. Procesamiento de imagen

La imagen de microarray generada por el escáner conforma el dato crudo de un experimento de microarray. Antes del análisis de los datos, la imagen debe ser convertida del formato TIFF a información numérica que cuantifique la expresión de genes. La manera en la que esto se lleva a cabo tiene mucho impacto en la calidad de los datos resultantes y en el éxito de los análisis posteriores. Para la síntesis in situ de microarrays, tanto Affymetrix como Agilen han integrado adaptaciones de algoritmos de procesamiento de imágenes en sus paquetes de software, permitiendo a los usuarios finales generar directamente los datos de microarray cuantificados. Para los microarrays de ADNc, las imágenes consisten en puntos (spots) ordenados en un patrón de grilla regular. El procesamiento de estas imágenes consiste de cuatro pasos básicos:

 Identificación del punto. El proceso de identificación de los puntos involucra localizar la posición de los puntos de señal individuales en una imagen y estimar su tamaño.

 Segmentación de la imagen. Este proceso involucra la descomposición de la imagen en dos conjuntos de regiones no solapadas. Específicamente, este paso involucra la diferenciación de aquellos píxeles que forman el punto y que deben incluirse en el calculo de la señal de los otros píxeles que forman parte del background o son ruido y que deben eliminarse.

 Cuantificación del punto. Después de que los píxeles pertenecientes a la señal y al

punto. Aquí, los valores de intensidad de cada píxel son combinados en un único valor representando el nivel de expresión de un gen depositado en un dado lugar.

 Evaluación de la calidad del punto. Este proceso involucra calcular alguna medida de control de calidad para evaluar la calidad tanto del arreglo entero como de los puntos individuales del arreglo. Estas mediciones pueden ayudar a los inspectores humanos en la determinación de la confiabilidad de los datos y en la identificación de aquellos puntos con valores de una calidad cuestionable.

Los datos numéricos obtenidos a partir de la imagen usualmente se pueden representar por una matriz de dos dimensiones X, donde cada fila i en la matriz de datos corresponde a un gen, cada columna j corresponde a una condición experimental, y cada celda xij es un valor real

representando el nivel de expresión del gen i bajo la condición j.

3.4. Limpieza, Preprocesamiento y Normalización de Datos de

In document Desarrollo de técnicas de computación evolutiva : multiobjetivo y aprendizaje automático para la inferencia, modelado y simulación de redes regulatorias (página 54-58)