• No se han encontrado resultados

7.1 Evaluaci´ on off-line

7.1.4 Nueva soluci´ on: la BN fusionada

Considerar parte de una BN determinada exclusivamente a aquellos conceptos que resulten ganadores del estudio de GI para un determinado % supone una simplificaci´on que, a menudo, no resulta recomendable. Esto resulta especialmente inconveniente en cuanto concierne a la aplicaci´on de estos modelos a la gesti´on de di´alogo.

Dicha simplificaci´on puede resultar particularmente interesante o razonable cuando bien se necesite limitar el coste computacional de las BNs resultantes (restringiendo de esta forma su topolog´ıa) o bien con objeto de asegurar la adecuada entrenabilidad de las mismas (e.g. cuando en caso de insuficiencia de datos de entrenamiento se opta por refinar las CPTs manualmente).

Sin embargo, resolver el proceso de Inferencia Inversa individualmente para cada uno de los objetivos de di´alogo, considerando exclusivamente el contexto “local” a cada ob- jetivo y por consiguiente aprovechando s´olo de manera parcial el conjunto de evidencias disponible, puede conducir al gestor de di´alogo a tomar decisiones equivocadas.

En particular, y desde el punto de vista del an´alisis de conceptos (necesario para determinar la acci´on de di´alogo correspondiente a cada concepto), podr´ıa ocurrir que a un mismo concepto le correspondiesen varios resultados diferentes dependiendo de la BN a partir de la cual se ejecute cada proceso de Inferencia Inversa.

Sirva de ejemplo el conjunto de BNs, BN1 y BN2, presentado en la parte izquierda de la Figura 7.2. Como puede observarse el concepto C2 forma parte de ambas BNs correspondientes a los objetivosG1yG2 respectivamente. Asumiendo que ambos objetivos han sido positivamente inferidos mediante el proceso de ID, cabe la posibilidad de obtener dos resultados (i.e. tantos como objetivos inferidos cuyas correspondientes BNs incluyan al concepto en cuesti´on) diferentes para el concepto C2 producto a su vez de sendos procesos de II. De este modo C2 puede resultar“necesario”para G1 pero sin embargo

“innecesario”para G2.

La posibilidad de obtener resultados opuestos conducir´ıa el an´alisis a diferentes clasi- ficaciones de un mismo concepto1.

Figura 7.2:Detalle de la fusi´on de BNs.

Por el contrario una mejor soluci´on es posible mediante la fusi´on de todas las BNs disponibles en una ´unica BN global (verBNGLOBALen la parte derecha de la Figura 7.2).

Las decisiones de di´alogo deben de ser consistentes con todo el contexto de di´alogo. Dicho contexto de di´alogo afecta al total de las evidencias disponibles y debe ser com´un a todos los objetivos definidos en el di´alogo.

1El resultado adecuado para cada concepto podr´ıa resolverse empleando informaci´on adicional. Una posibilidad consistir´ıa en determinar el a posteriori m´as probable (i.e. el valor m´as cercano a 0 ´o 1 respectivamente) y asumir la clasificaci´on correspondiente a dicho resultado.

7.1 Evaluaci´on off-line 135

Como consecuencia inmediata de disponer de una ´unica BN, s´olo es necesario un ´unico proceso de II (y su correspondiente an´alisis) a partir de la nueva BN. As´ı mismo, s´olo resulta posible un ´unico resultado o clasificaci´on a partir del an´alisis para cada concepto. Empleando la BN ´unica, todos los objetivos se resuelven conjuntamente en un escenario com´un de modo que un determinado concepto no puede ser tratado o considerado de forma distinta para cada objetivo en particular.

Por lo tanto, la principal diferencia entre ambas soluciones estriba en que la nueva estrategia basada en la BN fusionada ofrece como resultado del proceso de II una ´unica clasificaci´on para cada concepto coherente con todo el contexto de di´alogo. Este resultado permite delimitar claramente la acci´on m´as apropiada a realizar por parte del gestor como continuaci´on del di´alogo.

Por el contrario, la estrategia inicial basada en m´ultiples BNs dependientes de objetivo arroja m´ultiples resultados para el an´alisis de cada concepto (cada uno local a un objetivo en concreto) por lo que no garantiza la idoneidad de una determinada acci´on de di´alogo, especialmente en caso de que dichos resultados sean dispares.

7.1.4.1 El algoritmo de fusi´on

El algoritmo de fusi´on trata de “acoplar” dos BNs diferentes a trav´es de los elementos que ´estas tienen en com´un y las relaciones que dichos elementos mantienen con el resto de nodos constituyentes de las respectivas BNs. Considerando como punto de partida el conjunto de N BNs desarrolladas espec´ıficamente para cada uno de los objetivos, a continuaci´on enumeramos los pasos que conforman el algoritmo de fusi´on.

1. Inicialmente consideramos un conjuntoFBN compuesto por N BNs, una BN por cada

objetivoGiconstituida por el propio objetivo y losM conceptos m´as representativos,

i.e. S(Gi), incluidos en la misma para el % de GI considerado.

2. Nos referiremos como BN(x) a la BN que afecta a los objetivos incluidos en x

donde x = G1, G2, . . .. Para cada par de BNs distintas en FBN, BN(x) y BN(y), comprobamos si la fusi´on entre ambas es posible, i.e. si S(x)∩S(y) 6= ∅, en cuyo caso:

(a) Fusionamos ambas BNs en una nueva BN mayor, nos referiremos a dicha BN como BN(z) donde z ={x, y}, tal y como hemos mencionado anteriormente. (b) Eliminamos BN(x) y BN(y) de FBN sustituy´endolas por la nueva BN (i.e.

a˜nadimos BN(z) a FBN).

3. Repetimos el paso 2 mientras resten posibles fusiones que llevar a cabo entre cual- quier par de BNs.

Para cualquier % de GI distinto del 100 % la aplicaci´on del algoritmo de fusi´on a las N BNs iniciales no garantiza obtener como resultado una ´unica BN (en cualquier caso s´olo garantiza que el n´umero de BNs resultantes nunca exceder´a el inicial). Efectivamente, en la medida en que los conjuntos de conceptos correspondientes a sendos objetivos resulten disjuntos, dicho algoritmo alojar´a a cada objetivo en una BN distinta a menos que exista un tercer objetivo con elementos en com´un tanto con el primero como con el segundo.

136 Cap´ıtulo 7. Evaluaci´on del Sistema de Di´alogo

De cualquier forma, el algoritmo permite evitar los problemas mencionados en el apar- tado anterior incluso en el caso de obtener varias BNs, toda vez que garantiza que cada elemento definido en el dominio de aplicaci´on s´olo puede formar parte de una ´unica BN y, por tanto, un ´unico resultado o an´alisis resulta posible.

Figura 7.3:Dependencias “concepto → objetivo” Vs. “objetivo → concepto”.

7.1.4.2 Optimizaci´on del coste del modelo de BN

El algoritmo de fusi´on siempre produce BNs m´as complejas (y costosas, como tendremos oportunidad de comprobar m´as adelante). En ese sentido debemos asegurar tanto la ade- cuada entrenabilidad como la tratabilidad desde el punto de vista de coste computacional de las BNs obtenidas mediante dicho procedimiento. Con ese prop´osito, es necesario llevar a cabo un estudio acerca del sentido ´optimo de las relaciones de dependencia consideradas entre objetivos y conceptos.

Las asunciones de independencia condicional en una BN resultan de vital importancia de cara a reducir o limitar la complejidad del proceso de inferencia [Huang and Darwiche, 1996] Por otra parte, el coste de una BN, definido como el n´umero de par´ametros o entradas de las correspondientes CPTs, puede variar significativamente dependiendo del sentido de las relaciones de dependencia existentes.

Consideremos el siguiente ejemplo, si calculamos el coste resultante para el modelo de BN presentado en la Figura 7.3 para ambas posibles alternativas (ver ecuaciones 7.2 y

7.3 donde cada sumando es una potencia de dos por asumir que estamos tratando con variables binarias), podemos concluir que las dependencias del tipo “objetivo→concepto” son mejores (menos costosas).

Costeconcepto→objetivo = 24

|{z} P(G1|C1,C2,C3) + 23 |{z} P(G2|C2,C4) + 21 |{z} P(C1) + 21 |{z} P(C2) + 21 |{z} P(C3) + 21 |{z} P(C4) = 32 (7.2)

Costeobjetivo→concepto = 21

|{z} P(G1) + 21 |{z} P(G2) + 22 |{z} P(C1|G1) + 23 |{z} P(C2|G1,G2) + 22 |{z} P(C3|G1) + 22 |{z} P(C4|G2) = 24 (7.3)

En caso de que el proceso de fusi´on produzca varias BNs, esta optimizaci´on puede aplicarse individualmente a cada BN. Naturalmente, el sentido ´optimo de las dependencias no tiene por qu´e ser el mismo para todas las BNs resultantes.

Por ´ultimo, y para tratar de demostrar que, efectivamente, la estrategia basada en la BN fusi´on conlleva un mayor coste que la basada en m´ultiples BNs, vamos a considerar ambas estrategias para un n´umero de objetivosN y un n´umero de conceptos M.

7.1 Evaluaci´on off-line 137

Figura 7.4: Modelos gen´ericos para la estrategia basada en m´ultiples BNs (dependencias objetivo → concepto).

Si realizamos un c´alculo similar al presentado en el ejemplo anterior, podemos gene- ralizar para la estrategia basada en m´ultiples BNs (ver Figura 7.4) los siguientes costes:

Costeconcepto→objetivo =

  2 M+1 | {z } P(Gi|C1,...,Cj,...,CM) + 2·M | {z } P(Cj)  ·N = 2 M+1· N + 2·M ·N (7.4)

Costeobjetivo→concepto=

  2 |{z} P(Gi) + 4·M | {z } P(Cj|Gi)  ·N = 2·N + 4·M·N (7.5)

A la vista de los resultados obtenidos, puede comprobarse que Costeconcepto→objetivo =

Costeobjetivo→concepto si y s´olo si M = 1. Para cualquier otro valor M > 1 enton-

ces Costeconcepto→objetivo > Costeobjetivo→concepto (como puede deducirse f´acilmente te-

niendo en cuenta que Costeconcepto→objetivo crece exponencialmente con M mientras que

Costeobjetivo→concepto s´olo lo hace linealmente).

Figura 7.5: Modelo gen´erico para la estrategia basada en la BN fusi´on (dependencias ob- jetivo → concepto).

Del mismo modo, podemos realizar un estudio semejante para la estrategia basada en la BN fusi´on (ver Figura7.5):

Costeconcepto→objetivo = 2M+1·N

| {z } P(Gi|C1,...,Cj,...,CM) + 2·M | {z } P(Cj) (7.6)

Costeobjetivo→concepto = 2·N

| {z } P(Gi) + 2N+1·M | {z } P(Cj|G1,...,Gi,...,GN) (7.7)

138 Cap´ıtulo 7. Evaluaci´on del Sistema de Di´alogo

Como podemos observar para los resultados presentados en 7.6 y 7.7, se produce un cierta simetr´ıa para ambos costes en N y M. En particular, podemos concluir que:

 

Costeconcepto→objetivo =Costeobjetivo→concepto si N =M,

Costeconcepto→objetivo < Costeobjetivo→concepto si N > M,

Costeconcepto→objetivo > Costeobjetivo→concepto si N < M.

(7.8)

En nuestro caso, t´ıpicamente vamos a trabajar con N < M, es decir, el n´umero de conceptos definidos exceder´a al de objetivos de di´alogo. Si bajo esas condiciones compa- ramos el coste ´optimo para la estrategia basada en m´ultiples BNs (ver 7.5) con el coste ´

optimo para la estrategia basada en la BN fusi´on (ver 7.7), r´apidamente puede advertirse el mayor coste de esta ´ultima (i.e. coste BN fusi´on ∝ 2N+1, mientras que coste de las N BNs∝4·N).

El an´alisis de costes realizado, a pesar de no haber tenido en cuenta la reducci´on del coste debida a la selecci´on de conceptos a partir del estudio de GI presentado en el apartado7.1.3.1(dicha reducci´on afectar´a al coste de ambas estrategias al simplificarse los modelos de BN considerados en uno y otro caso), justifica razonablemente las diferencias de coste observadas entre ambas estrategias y recogidas en la Tabla7.2.