Nueva soluci´ on: la BN fusionada - Evaluaci´ on off-line

7.1 Evaluaci´ on off-line

7.1.4 Nueva soluci´ on: la BN fusionada

Considerar parte de una BN determinada exclusivamente a aquellos conceptos que resulten ganadores del estudio de GI para un determinado % supone una simplificación que, a menudo, no resulta recomendable. Esto resulta especialmente inconveniente en cuanto concierne a la aplicación de estos modelos a la gestión de diálogo.

Dicha simplificaci´on puede resultar particularmente interesante o razonable cuando bien se necesite limitar el coste computacional de las BNs resultantes (restringiendo de esta forma su topolog´ıa) o bien con objeto de asegurar la adecuada entrenabilidad de las mismas (e.g. cuando en caso de insuficiencia de datos de entrenamiento se opta por refinar las CPTs manualmente).

Sin embargo, resolver el proceso de Inferencia Inversa individualmente para cada uno de los objetivos de diálogo, considerando exclusivamente el contexto “local” a cada objetivo y por consiguiente aprovechando sólo de manera parcial el conjunto de evidencias disponible, puede conducir al gestor de diálogo a tomar decisiones equivocadas.

En particular, y desde el punto de vista del análisis de conceptos (necesario para determinar la acción de diálogo correspondiente a cada concepto), podr´ıa ocurrir que a un mismo concepto le correspondiesen varios resultados diferentes dependiendo de la BN a partir de la cual se ejecute cada proceso de Inferencia Inversa.

Sirva de ejemplo el conjunto de BNs, BN1 y BN2, presentado en la parte izquierda de la Figura 7.2. Como puede observarse el concepto C2 forma parte de ambas BNs correspondientes a los objetivosG1yG2 respectivamente. Asumiendo que ambos objetivos han sido positivamente inferidos mediante el proceso de ID, cabe la posibilidad de obtener dos resultados (i.e. tantos como objetivos inferidos cuyas correspondientes BNs incluyan al concepto en cuesti´on) diferentes para el concepto C2 producto a su vez de sendos procesos de II. De este modo C2 puede resultar“necesario”para G1 pero sin embargo

“innecesario”para G2.

La posibilidad de obtener resultados opuestos conducir´ıa el an´alisis a diferentes clasi- ficaciones de un mismo concepto1_.

Figura 7.2:Detalle de la fusi´on de BNs.

Por el contrario una mejor solución es posible mediante la fusión de todas las BNs disponibles en una única BN global (verBNGLOBALen la parte derecha de la Figura 7.2).

Las decisiones de diálogo deben de ser consistentes con todo el contexto de diálogo. Dicho contexto de diálogo afecta al total de las evidencias disponibles y debe ser común a todos los objetivos definidos en el diálogo.

1_{El resultado adecuado para cada concepto podr´ıa resolverse empleando informaci´}_{on adicional. Una} posibilidad consistir´ıa en determinar el a posteriori más probable (i.e. el valor más cercano a 0 ó 1 respectivamente) y asumir la clasificación correspondiente a dicho resultado.

7.1 Evaluaci´on off-line 135

Como consecuencia inmediata de disponer de una única BN, sólo es necesario un único proceso de II (y su correspondiente análisis) a partir de la nueva BN. As´ı mismo, sólo resulta posible un único resultado o clasificación a partir del análisis para cada concepto. Empleando la BN única, todos los objetivos se resuelven conjuntamente en un escenario común de modo que un determinado concepto no puede ser tratado o considerado de forma distinta para cada objetivo en particular.

Por lo tanto, la principal diferencia entre ambas soluciones estriba en que la nueva estrategia basada en la BN fusionada ofrece como resultado del proceso de II una única clasificación para cada concepto coherente con todo el contexto de diálogo. Este resultado permite delimitar claramente la acción más apropiada a realizar por parte del gestor como continuación del diálogo.

Por el contrario, la estrategia inicial basada en múltiples BNs dependientes de objetivo arroja múltiples resultados para el análisis de cada concepto (cada uno local a un objetivo en concreto) por lo que no garantiza la idoneidad de una determinada acción de diálogo, especialmente en caso de que dichos resultados sean dispares.

7.1.4.1 El algoritmo de fusi´on

El algoritmo de fusión trata de “acoplar” dos BNs diferentes a través de los elementos que éstas tienen en común y las relaciones que dichos elementos mantienen con el resto de nodos constituyentes de las respectivas BNs. Considerando como punto de partida el conjunto de N BNs desarrolladas espec´ıficamente para cada uno de los objetivos, a continuación enumeramos los pasos que conforman el algoritmo de fusión.

1. Inicialmente consideramos un conjuntoFBN compuesto por N BNs, una BN por cada

objetivoGiconstituida por el propio objetivo y losM conceptos m´as representativos,

i.e. S(Gi), incluidos en la misma para el % de GI considerado.

2. Nos referiremos como BN(x) a la BN que afecta a los objetivos incluidos en x

donde x = G1, G2, . . .. Para cada par de BNs distintas en FBN, BN(x) y BN(y), comprobamos si la fusi´on entre ambas es posible, i.e. si S(x)∩S(y) 6= ∅, en cuyo caso:

(a) Fusionamos ambas BNs en una nueva BN mayor, nos referiremos a dicha BN como BN(z) donde z ={x, y}, tal y como hemos mencionado anteriormente. (b) Eliminamos BN(x) y BN(y) de FBN sustituy´endolas por la nueva BN (i.e.

a˜nadimos BN(z) a FBN).

3. Repetimos el paso 2 mientras resten posibles fusiones que llevar a cabo entre cualquier par de BNs.

Para cualquier % de GI distinto del 100 % la aplicación del algoritmo de fusión a las N BNs iniciales no garantiza obtener como resultado una única BN (en cualquier caso sólo garantiza que el número de BNs resultantes nunca excederá el inicial). Efectivamente, en la medida en que los conjuntos de conceptos correspondientes a sendos objetivos resulten disjuntos, dicho algoritmo alojará a cada objetivo en una BN distinta a menos que exista un tercer objetivo con elementos en común tanto con el primero como con el segundo.

136 Cap´ıtulo 7. Evaluaci´on del Sistema de Di´alogo

De cualquier forma, el algoritmo permite evitar los problemas mencionados en el apartado anterior incluso en el caso de obtener varias BNs, toda vez que garantiza que cada elemento definido en el dominio de aplicación sólo puede formar parte de una única BN y, por tanto, un único resultado o análisis resulta posible.

Figura 7.3:Dependencias “concepto → objetivo” Vs. “objetivo → concepto”.

7.1.4.2 Optimizaci´on del coste del modelo de BN

El algoritmo de fusión siempre produce BNs más complejas (y costosas, como tendremos oportunidad de comprobar más adelante). En ese sentido debemos asegurar tanto la adecuada entrenabilidad como la tratabilidad desde el punto de vista de coste computacional de las BNs obtenidas mediante dicho procedimiento. Con ese propósito, es necesario llevar a cabo un estudio acerca del sentido óptimo de las relaciones de dependencia consideradas entre objetivos y conceptos.

Las asunciones de independencia condicional en una BN resultan de vital importancia de cara a reducir o limitar la complejidad del proceso de inferencia [Huang and Darwiche, 1996] Por otra parte, el coste de una BN, definido como el n´umero de par´ametros o entradas de las correspondientes CPTs, puede variar significativamente dependiendo del sentido de las relaciones de dependencia existentes.

Consideremos el siguiente ejemplo, si calculamos el coste resultante para el modelo de BN presentado en la Figura 7.3 para ambas posibles alternativas (ver ecuaciones 7.2 y

7.3 donde cada sumando es una potencia de dos por asumir que estamos tratando con variables binarias), podemos concluir que las dependencias del tipo “objetivo→concepto” son mejores (menos costosas).

Costeconcepto→objetivo = 24

|{z} P(G1|C1,C2,C3) + 23 |{z} P(G2|C2,C4) + 21 |{z} P(C1) + 21 |{z} P(C2) + 21 |{z} P(C3) + 21 |{z} P(C4) = 32 (7.2)

Costeobjetivo→concepto = 21

|{z} P(G1) + 21 |{z} P(G2) + 22 |{z} P(C1|G1) + 23 |{z} P(C2|G1,G2) + 22 |{z} P(C3|G1) + 22 |{z} P(C4|G2) = 24 (7.3)

En caso de que el proceso de fusión produzca varias BNs, esta optimización puede aplicarse individualmente a cada BN. Naturalmente, el sentido óptimo de las dependencias no tiene por qué ser el mismo para todas las BNs resultantes.

Por último, y para tratar de demostrar que, efectivamente, la estrategia basada en la BN fusión conlleva un mayor coste que la basada en múltiples BNs, vamos a considerar ambas estrategias para un número de objetivosN y un número de conceptos M.

7.1 Evaluaci´on off-line 137

Figura 7.4: Modelos gen´ericos para la estrategia basada en m´ultiples BNs (dependencias objetivo → concepto).

Si realizamos un c´alculo similar al presentado en el ejemplo anterior, podemos gene- ralizar para la estrategia basada en m´ultiples BNs (ver Figura 7.4) los siguientes costes:

Costeconcepto→objetivo =

  2 M+1 | {z } P(Gi|C1,...,Cj,...,CM) + 2·M | {z } P(Cj)  ·N = 2 M+1_· N + 2·M ·N (7.4)

Costeobjetivo→concepto=

  2 |{z} P(Gi) + 4·M | {z } P(Cj|Gi)  ·N = 2·N + 4·M·N (7.5)

A la vista de los resultados obtenidos, puede comprobarse que Costeconcepto→objetivo =

Costeobjetivo→concepto si y s´olo si M = 1. Para cualquier otro valor M > 1 enton-

ces Costeconcepto→objetivo > Costeobjetivo→concepto (como puede deducirse f´acilmente te-

niendo en cuenta que Costeconcepto→objetivo crece exponencialmente con M mientras que

Costeobjetivo→concepto s´olo lo hace linealmente).

Figura 7.5: Modelo gen´erico para la estrategia basada en la BN fusi´on (dependencias objetivo → concepto).

Del mismo modo, podemos realizar un estudio semejante para la estrategia basada en la BN fusi´on (ver Figura7.5):

Costeconcepto→objetivo = 2M+1·N

| {z } P(Gi|C1,...,Cj,...,CM) + 2·M | {z } P(Cj) (7.6)

Costeobjetivo→concepto = 2·N

| {z } P(Gi) + 2N+1·M | {z } P(Cj|G1,...,Gi,...,GN) (7.7)

138 Cap´ıtulo 7. Evaluaci´on del Sistema de Di´alogo

Como podemos observar para los resultados presentados en 7.6 y 7.7, se produce un cierta simetr´ıa para ambos costes en N y M. En particular, podemos concluir que:

 



Costeconcepto→objetivo =Costeobjetivo→concepto si N =M,

Costeconcepto→objetivo < Costeobjetivo→concepto si N > M,

Costeconcepto→objetivo > Costeobjetivo→concepto si N < M.

(7.8)

En nuestro caso, t´ıpicamente vamos a trabajar con N < M, es decir, el número de conceptos definidos excederá al de objetivos de diálogo. Si bajo esas condiciones compa- ramos el coste óptimo para la estrategia basada en múltiples BNs (ver 7.5) con el coste ´

optimo para la estrategia basada en la BN fusión (ver 7.7), rápidamente puede advertirse el mayor coste de esta última (i.e. coste BN fusión ∝ 2N+1, mientras que coste de las N BNs∝4·N).

El análisis de costes realizado, a pesar de no haber tenido en cuenta la reducción del coste debida a la selección de conceptos a partir del estudio de GI presentado en el apartado7.1.3.1(dicha reducción afectará al coste de ambas estrategias al simplificarse los modelos de BN considerados en uno y otro caso), justifica razonablemente las diferencias de coste observadas entre ambas estrategias y recogidas en la Tabla7.2.

In document Análisis, diseño y aplicación de modelos de diálogo flexibles, contextuales y dinámicos basados en redes bayesianas (página 152-156)