• No se han encontrado resultados

3.1 Características principales

3.4.2 Reportes gráficos: heatmaps

Se genera un archivo PDF que contiene un conjunto de heatmaps, que son representaciones gráficas de las vías biológicas y proveen una interpretación rápida y visual de los resultados, lo cual es uno de los principales objetivos de COMPADRE y una necesidad al analizar conjuntos de datos biológicos.

En cada uno de ellos se despliegan las 150 primeras vías biológicas en caso de que se hayan detectado más. Los heatmaps generados muestras son la representación gráfica de los datos obtenidos de un análisis de COMPADRE. En ellos se incluye información relevante para la interpretación de los mismos.

52

El encabezado del gráfico muestra el rango de p – value y q – value que se usó para filtrar los resultados. Cabe mencionar que solo se muestran resultados que cumplan con la condición:

p – value <= pThreshold AND q – value <= qThreshold

Donde pThreshold y qThreshold son parámetros de entrada, mismos que se describieron previamente en la Tabla 3.1.

En el mismo encabezado se identifica si los datos pertenecen a un conjunto de genes en particular; cuando no se menciona uno se trata de un heatmap general con los datos de todos los conjuntos de genes. Por ejemplo: KEGG: (p < 0.1 & q < 0.1) 49 GeneSets, significa que en el gráfico se encuentran 49 vías biológicas detectadas cuyo p – value es menor a 0.1 y a la vez su q – value es menor a 0.1, y que las vías biológicas descritas solamente pertenecen al conjunto de genes de KEGG.

En la parte superior, en una barra horizontal se muestran las clases del conjunto de datos diferenciándolas por colores. En la Figura 3.10 se muestra un ejemplo de la parte superior del heatmap. La barra horizontal en colores negro, rojo y verde representa las tres diferentes clases del conjunto de datos. Los valores de expresión de las muestras de cada vía biológica se encuentran agrupados por la clase en la que se encuentran, estos son los puntos que se encuentran bajo la barra horizontal.

Figura 3.10 Clases dentro de un heatmap. La barra horizontal superior representa en negro, rojo y verde las tres

diferentes clases del conjunto de datos de entrada.

Del lado izquierdo del heatmap se encuentra una barra vertical que indica en diferentes colores indica como se detectó la vía biológica. Tomando como ejemplo la Figura 3.11, se puede observar en la línea vertical de la derecha dos colores: negro y rojo, y arriba de

53

ellos las leyendas cpa:34 en negro, que significa las 34 vías que se encuentran en el renglón donde la barra está pintada de negro son vías detectadas con PLAGE (posiblemente falsos positivos), el número indica el número total de vías que se encuentran en la misma escenario; mientras que la leyenda cpa.cpr:15 muestra todas aquellas vías (15 en este caso) que se detectaron con COMPADRE después de remover genes diferencialmente expresados.

Los posibles valores para las leyendas de la barra vertical son:

Unr. Vía sub – representada.

Ovr. Vía sobre – representada.

Cpa. Vía detectada con PLAGE.

Cpr. Vía detectada con COMPADRE después de remover genes

diferencialmente expresados.

Figura 3.11 Parte de heatmap de compadre. La barra vertical izquierda indica como se detectaron las vías. Cpa:34

indica que 34 vías biológicas fueron detectadas siguiendo el algoritmo de PLAGE (posibles falsos positivos), mientras que las que cpa.cpr:15 indica que 15 vías biológicas fueron detectadas con COMPADRE después de remover genes diferencialmente expresados.

54

Cuando el análisis no generó detecciones, el archivo PDF contiene solamente el listado de los valores de los parámetros de entrada. Cuando sí se detectan vías biológicas diferencialmente expresadas, se generan los siguientes heatmaps.

Heatmap general. Es un heatmap que contiene todas las vías biológicas

detectadas mostrándolas antes de haber removido genes diferencialmente expresados. Ver Figura 3.12.

Heatmap por conjunto de genes. Este heatmap es un subconjunto del heatmap

general, contiene las vías biológicas detectadas pero separadas por conjunto de genes, es decir KEGG, Biocarta, etc. Se genera un heatmap por cada conjunto de genes, por lo tanto si para el análisis se seleccionaron tres conjuntos de genes entonces se generarán tres gráficos de estos. Cuando el análisis se ejecuta con un solo conjunto de genes este heatmap será igual al general (Figura 3.13).

Heatmap general sin DEG. Este heatmap es similar al heatmap general, ya que

representa las vías biológicas diferencialmente expresadas pero con la variante que se muestran después de que se les removieron genes diferencialmente expresados.

Heatmap por conjunto de genes sin DEG. Es un heatmap por cada conjunto de

genes que el usuario especificó en los parámetros de entrada, pero con la variante que se muestran después de que se les removieron genes diferencialmente expresados (Figura 3.15).

55

Figura 3.12 Salida COMPADRE: Heatmap general. Representa todas las vías biológicas detectadas por COMPADRE. Cuando se detectaron más de 150 vías solamente se muestran las primeras 150.

56

Figura 3.13 Salida Compadre: Heatmap general por conjunto de genes. Representa las vías biológicas detectadas

pero filtradas por conjuntos de genes. En este ejemplo se muestran solamente las vías que pertenecen a la colección KEGG.

57

Figura 3.14 Salida COMPADRE: Heatmap general sin DEG. Representa las vías biológicas detectadas por

58

Figura 3.15 Salida COMPADRE: Heatmap por conjunto de genes sin DEG. Representa las vías biológicas

detectadas por COMPADRE como diferencialmente expresadas después de la remoción de genes diferencialmente expresados y filtradas por conjuntos de genes. En este caso se muestran las vías pertenecientes a la colección KEGG.

59

Documento similar