7. Sistema de aprendizaje GEBL 91
9.5. An´alisis del conocimiento generado por GEBL
la que ya se coment´o su utilidad (seleccionaba la meta de desplazar a una persona que estuviera en la misma ciudad en que hubiera un avi´on).
(control-rule regla-zeno-travel-l200-03-e2
(if (and (current-goal (fuel-level <plane1> <fl1>)) (true-in-state (next <fl0> <fl1>))
(true-in-state (fuel-level <plane1> <fl0>)) (true-in-state (at <plane1> <city1>))
(type-of-object <plane1> aircraft) (type-of-object <city1> city) (type-of-object <fl0> flevel) (type-of-object <fl1> flevel))) (then select operators refuel))
Figura 9.7: Regla para seleccionar el operadorrefuelaprendida enGEBLen el dominio Zenotravel.
9.5.2. Dominio Driverlog
En el dominio Driverlog las reglas generadas por GEBL, tras el refinamiento, son:
13 reglas de selecci´on de bindings del operadorunload-truck 3 reglas de selecci´on de bindings del operadorboard-truck 3 reglas de selecci´on de bindings del operadordisembark-truck 5 reglas de selecci´on de bindings del operadordrive-truck 4 reglas de selecci´on de bindings del operadorwalk
1 regla de selecci´on de bindings del operadorload-truck
29 reglas para seleccionar operador: las mismas de cada operador que las de bindings correspondientes
13 reglas de selecci´on de metas: 2 para seleccionar metas de tipo(at <truck><s>), 2 de tipo(in <package><truck>)y 9 de tipo(at <package><s>).
Al hacer b´usqueda hacia atr´as, el conocimiento m´as importante en este dominio es aplicar el operadorunload-truckcuando la meta es llevar un paquete a un sitio. Las 13 reglas aprendidas se listan en el ap´endice B.2. En ellas se observa que
GEBLaprende las variables correctas para diferentes situaciones. Suponiendo que la meta actual sea llevar un paquete as0, la primera regla describe un estado en el
9.5. AN ´ALISIS DEL CONOCIMIENTO GENERADO PORGEBL 147 que el paquete est´a dentro de un cami´on que se encuentra ens0. La segunda regla, el paquete est´a en otro sitio donde hay un cami´on conducido por un conductor y hay unlinkentre ambos sitios. La tercera, es igual a la anterior, pero el paquete est´a dentro del cami´on. En la cuarta, el cami´on no tiene conductor y el conductor se encuentra en el mismo sitio que el cami´on. En las siguientes reglas el conductor se encuentra en un sitio diferente al del cami´on existiendo caminos entre ambos.
En la quinta, el paquete y el conductor est´an en un mismo sitio y el cami´on en s0. En la sexta, el conductor est´a en s0 y el cami´on y el paquete en el mismo sitio. En la s´eptima, el conductor y el cami´on est´an en el mismo sitio, el paquete en un tercer sitio y hay links entre los dos sitios. Esta regla a˜nade la precondici´on innecesaria de que el mismo conductor est´a ens0. La octava es igual que la anterior, pero el conductor y el cami´on est´an en el mismo sitio. En la novena, el cami´on y el paquete est´an juntos y el conductor est´a en un tercer sitio. Necesita andar por dos caminos hasta llegar al cami´on. Las siguientes reglas son parecidas a alguna de las anteriores, pero a˜nadiendo metas pendientes. Las reglas cubren casi todos los casos referentes a la localizaci´on inicial del cami´on, el conductor y el paquete interviniendo hasta tres sitios diferentes, pero algunas de estas reglas se podr´ıan generalizar o especializar a trav´es de alg´un mecanismo de inducci´on creando un conjunto m´as reducido de reglas, como hace HAMLET.
Las reglas de selecci´on de metas se muestran en el ap´endice B.2. Las cuatro primeras seleccionan entre dos metas de llevar paquetes a distintos sitios que se encuentran en otro sitio. Eligen empezar por el paquete en el que hay un camino entre el origen y el destino. Difieren en la situaci´on original del conductor, el ca- mi´on y los paquetes. Si hay un cami´on en la misma ciudad que uno de los paquetes a desplazar seleccionan empezar por esa meta. Las dos siguientes reglas eligen em- pezar por metas para desplazar paquetes antes que conductores que siempre es una buena estrategia en este dominio. En la regla 12, hay un paquete, un cami´on y un conductor en el mismo sitio y dos metas una de llevar el cami´on a un segundo sitio y otra de llevar el paquete al mismo sitio. La regla elige la meta del cami´on, lo cual no parece lo m´as conveniente; es preferible transportar el paquete a la vez que el cami´on. La siguiente regla describe una situaci´on igual, pero las metas entre las que puede elegir son la de que el paquete est´e dentro del cami´on o la de desplazar el cami´on. En este caso selecciona la opci´on adecuada, empezar por la meta del paquete. PRODIGY dispara todas las reglas cuyas precondiciones se cumplen en cada punto de decisi´on. Aunque alguna de las reglas sea incorrecta, si hay otras que son correctas, el comportamiento final de PRODIGYser´a correcto.
9.5.3. Dominio Logistics
En este dominio ocurre algo similar al dominio anterior. Se generan var´ıas reglas para seleccionar los bindings de cada uno de los operadores del dominio:
48 para el operadorunload-truck, 39 para el operadorload-truck, 23 para
el operadorload-airplane, 14 para el operadorunload-airplane, 5 para el operadordrive-truck y 4 para el operadorfly-airplane. Tambi´en se generan 133 reglas para seleccionar operadores y 140 de selecci´on de metas.
Las reglas para seleccionar los bindings del operadorunload-truckpara conseguir la meta de que un paquete est´e en un sitio, representan diferentes situa- ciones, desde que el paquete est´e dentro de un cami´on en la localidad destino hasta que el paquete se encuentre en un sitio de diferente ciudad y es necesario llevarlo en avi´on. Muchas de las reglas se podr´ıan agrupar en una sola m´as general. Tambi´en hay reglas iguales donde var´ıan las metas pendientes que podr´ıan generalizarse.
Las reglas de selecci´on de metas eligen la meta m´as adecuada cuando la se- lecci´on es entre dos metas pendientes (108 reglas). Por ejemplo, si tiene que elegir entre dos metas de llevar paquetes a un sitio selecciona primero la meta en la que el paquete est´a en la ciudad destino, bien dentro de un cami´on, de un avi´on o en un sitio de la misma ciudad. Sin embargo, cuando intervienen 3 metas (32 reglas) la opci´on elegida por la regla no es siempre la m´as correcta. Por ejemplo, la regla de la figura 9.8 representa una situaci´on en que hay tres metas pendientes: que un ob- jeto, inicialmente dentro de una cami´on en una ciudadc1, est´e dentro de un avi´on que inicialmente est´a en otra ciudadc0; que ese mismo avi´on est´e en el aeropuerto de la ciudadc1; y que un segundo objetoobj0, inicialmente dentro de un cami´on que est´a en el aeropuerto donde est´a el avi´on, est´e en el otro aeropuerto de la ciu- dadc1. La regla elige empezar por la meta de desplazar el avi´on a la otra ciudad y ser´ıa m´as eficiente que antes cargaraobj0ya que est´a en la misma ciudad que el avi´on; es decir, que comenzara por la meta(at obj0 a1). El meta-predicado some-candidate-goalsse cumple si, al menos, una de las metas de su ar- gumento es una meta pendiente; no es necesario que lo sean todas. Por tanto, si la
´unica meta pendiente es queobj0est´e dentro del avi´on, la regla si es correcta.
9.5.4. Dominio Miconic
En este dominio, GEBL genera 13 reglas que resuelven todos los problemas menos uno. HAMLETaprende s´olo 5 reglas que son capaces de resolver todos los problemas. Por tanto, para este dominio el aprendizaje realizado por HAMLET es suficiente para resolver los problemas y no es necesario recurrir a la transferencia de conocimiento. De las 5 reglas que aprende HAMLET 2 son de sub-goaly las otras 3 GEBLaprende la misma regla u otra muy similar como se muestra en las figuras 9.9, 9.10 y 9.11 (la primera regla es la aprendida porGEBL). Entre las reglas que seleccionan el operador down, la regla de HAMLET es m´as general que la de GEBL ya que tiene un meta-predicado true-in-state menos que indica la situaci´on del ascensor. En las otras reglas, son m´as espec´ıficas las que aprende HAMLETya que a˜nade otra precondici´on de que exista una meta pendiente m´as en cada caso. De hecho, las reglas aprendidas por HAMLETpara seleccionar las instanciaciones de variables de los operadoresupydown utilizan la palabra
9.6. CONCLUSIONES Y TRABAJOS FUTUROS 149