• No se han encontrado resultados

6.2 Minería de Datos e Inferencia de RRGs basadas en RAs

6.3.4 Redes Booleanas

Los modelos de redes booleanas, introducidos originalmente en Kauffman (1990) y en Kauffman (1993), pueden proporcionar información útil en la dinámica de la red a nivel grueso. En una red booleana, una entidad puede alcanzar dos niveles alternativos: activo (1) o inactivo (0). Por ejemplo, un gen puede ser descrito como expresado o no expresado en cualquier momento. El nivel de cada entidad se actualiza de acuerdo a los niveles de varias entidades, a través de una función booleana específica. El vector de ceros y unos que describe los niveles de todas las entidades se llama estado del sistema, o estado global. Se supone que cambia sincrónicamente, de tal manera que en cada instante de tiempo, el nivel de cada entidad se determina de acuerdo a los niveles de sus reguladores en el instante de tiempo anterior acorde a la función de regulación. La figura 6.8 es un ejemplo de una red booleana. En muchos casos, no se han establecido las relaciones regulatorias entre los componentes de una red y, por lo tanto, deben ser derivados a partir de datos experimentales. Para cualquier entidad bajo un modelo de red booleana, tanto sus reguladores como la función regulatoria (siendo esta consistente con un conjunto de perfiles de expresión de genes) se pueden encontrar de manera eficiente, a condición de que el número de los reguladores de cada entidad no sobrepase un límite establecido (Lahdesmaki et al., 2003).

1 2 1 2 V1 V2 V3 V4 V1,0 V1,1 V1,2 V2,2 V2, 1 V2,0 V3,2 V3, 1 V3,0 V4,0 V4, 1 V4,2 (a) (b)

Figura 6.8. Una red booleana. Por claridad, cada fF ha sido puesta dentro de un nodo. Normalmente las funciones están implícitas en los arcos la red. f1 = g1g2g3, f2 = g1g2g3, f3 = g1g3.

La redes booleanas no modelan correctamente la dinámica de un factor de transcripción que inhibe su propia expresión debido al limitado nivel de detalle del modelo (Kauffman et al., 2003). Otro problema es el alto costo computacional asociado a analizar la dinámica de las redes de gran tamaño, ya que el número de estados globales es exponencial en el número de entidades. Sin embargo, cuando el número de entidades es pequeño y sólo está disponible conocimiento cualitativo, las redes booleanas pueden proporcionar información importante, como la existencia y naturaleza de los estados estacionarios o la robustez de la red. Por otra parte, para el modelado de sistemas de regulación génica a gran escala, las redes booleanas pueden representar la única alternativa práctica (Smolen et al., 2000).

Los datos de microarrays exhiben incertidumbre en varios niveles, como se dijo antes. En primer lugar, existe incertidumbre biológica en forma de ruido intrínseco y extrínseco. En segundo lugar, hay ruido experimental debido al proceso complejo de medición, que va desde las condiciones de hibridación a las técnicas de procesamiento de imágenes de microarrays. En tercer lugar, es posible que estén interactuando variables latentes, tales como proteínas, diversas condiciones ambientales, u otros genes que no se miden, proporcionando otras fuentes de variabilidad en las mediciones. Para hacer frente a la incertidumbre, en Shmulevich et al. (2002) se introdujeron las Redes Booleanas Probabilísticas (RBP) mediante la asociación de varios predictores con cada gen blanco. Si el gen objetivo gi tiene l(i) funciones de predicción

asociadas, f1(i), f2(i), ..., f(i)(i), luego en cada punto en el tiempo t se selecciona una de estas

funciones para formar la regla de transición para gi en el tiempo t+1. Claramente, si l(i) = 1 para

todo i = 1,2, ..., N, la RBP se reduce simplemente a una red booleana estándar. El bloque de construcción básico de una RBP se muestra en la figura 6.9. El diagrama de cableado para toda la RBP consiste en n de tales bloques de construcción. Conceptualmente, el predictor probabilístico de cada gen blanco puede ser pensado como un interruptor al azar, en donde en cada punto de tiempo de la red, la función fk(i) se elige con probabilidad ck(i) para predecir el gen

g. Una manera de asignar estas probabilidades es emplear el Coeficiente de Determinación

g1 g2 g3

(CoD) (Shmulevich et al., 2002), normalizado de tal manera que

l ik( )1ck( )i 1. Es decir, ( ) ( ) ( ) ( ) 1 / l i i i i k k j k

c

, donde θk(i es el CoD para el gen blanco gi relativo a los genes utilizados

como entradas al predictor fk(i).

En el contexto de las RBP, en Hashimoto et al. (2004) desarrollaron un método para hacer crecer una red a partir de un número más pequeño de genes de interés, o genes semilla. El algoritmo propuesto es flexible y permite varias opciones de diseño respecto a la forma de proceder, como la métrica de fuerza de conexión entre los genes, el protocolo de búsqueda, y las condiciones de detención. Como ejemplo, el CoD (Shmulevich et al., 2002) se puede asignar como función para la medición de la fuerza. La identificación de los genes semilla de interés es un paso crítico en este algoritmo, por lo que generalmente se seleccionan con la ayuda de conocimientos biológicos previos.

Figura 6.9. Un bloque de construcción básico de una RBP.

Aunque bueno en abstraer la incertidumbre en el sistema biológico, el modelo de RBP falla al describir el determinismo específico del contexto de los sistemas regulatorios. Este contexto puede ser definido como una determinada condición en la que un número limitado de genes están estrechamente regulados entre sí para un mecanismo celular específico o una tarea específica. Esta tarea específica puede ser una etapa de desarrollo diferente, o función específica del tejido, lo que resulta en un tipo de célula específica. El cambio de este contexto resultará en el cambio del conjunto de genes que están interactuando intensamente, y probablemente también cambie su conectividad y relaciones. Diferentes contextos biológicos también pueden correlacionar con diferentes enfermedades o pueden ser una de las razones por la cual un cierto

g1 g2 g3 gn gi 1 i f f2i fl i( )i

...

...

1 i c 2i c i( ) l i c

grupo de pacientes responden a una terapia, mientras que otros no. En Li et al. (2004) desarrollaron un modelo de red booleana sensible al contexto (cBN) para describir el comportamiento de los sistemas celulares. Una cBN puede ser considerada como una RBP restringida, donde la restricción es la manera de asignar la probabilidad para el modelo. La inferencia de reglas se basa en la suposición de que las reglas inferidas y las observaciones son consistentes dentro de un contexto dado. La figura 6.10 muestra un ejemplo de cBN que contiene dos contextos y quince genes.

Figura 6.10. Un ejemplo de una cBN con dos contextos.

6.3.4.1 RRGs diferidas en el tiempo con Redes Booleanas

Con el fin de hacer frente al retardo en la regulación génica, Silvescu y Honavar (2001) propusieron un algoritmo que utiliza los datos de series de tiempo para encontrar redes booleanas temporales (Temporal Boolean Networks o TBoN). Las TBoN se desarrollaron para modelar retrasos regulatorios, que pueden ocurrir debido a la falta de genes intermedios y retrasos espaciales o bioquímicos entre la transcripción y la regulación, como se dijo antes. Un ejemplo de una red booleana temporal se presenta en la figura 6.11.

Figura 6.11. Una red booleana temporal. Las funciones regulatorias son como en la figura 6.8, pero los retardos se muestran entre corchetes entre los genes y las funciones. El retardo por defecto si no hay ninguna anotación presente se asume en 0. [2] g1 g2 g3 f1 f2 f3 g1 g0 g3 g4 g2 g7 g9 g8 g6 g5

Una TBoN es muy similar a una red booleana normal, excepto que las funciones fF

pueden referir a niveles de expresión génica ya ocurridos. En lugar de depender sólo de t para inferir t+1, los parámetros de fi se pueden anotar con un número entero representado un retraso

temporal. Por ejemplo: g3 = f3 (g1, g2, g3) = g10g3-2 significa que g3 se expresa en t+1 si g1 se

expresó en t o si g3 se expresó en el tiempo t-2. Las TBoN también pueden ser reformuladas y

deducirse como árboles de decisión.