3. Principales Planeadores
5.4. An´alisis Adicional
5.4.2. Sat´elite
El dominio Sat´elite, fue el primer dominio de planeamiento inspirado por aplica- ciones espaciales, y es parte de un proyecto de modelamiento de varias aplicaciones relacionadas a ese tema[SFJ00]. En particular involucra el planeamiento y agenda- miento de un conjunto de tareas de observaci´on entre m´ultiples sat´elites, cada uno con una especificaci´on del equipo con el que cuenta.
Descripci´on
Los objetos del dominio son: sat´elite; direcci´on, que representa la direcci´on a la que est´a apuntando el sat´elite; instrumento, que representa un equipo que puede realizar la captura de im´agenes para cumplir las tareas de observaci´on y; modo, que permite clasificar distintos tipos de captura de im´agenes (temperatura, espectro luminoso, etc.)
Los ´atomos que describen el dominio son:
CAP´ITULO 5. RESULTADOS 51
on − board?i − instrument?s − satellite: indica que el sat´elite s cuenta con el instrumento i a bordo,
supports?i − instrument?m − mode: el instrumento i puede capturar im´agenes en modo m,
pointing?s−satellite?d−direction: el sat´elite s est´a apuntando en la direcci´on d,
power − avail?s − satellite: indica que el sat´elite s tiene energ´ıa disponible, power − on?i − instrument: el instrumento i est´a prendido,
calibrated?i − instrument: el calibraje de un instrumento es prerequisito para que ´este pueda capturar im´agenes,
have − image?d − direction?m − mode: se tiene una imagen capturada de la direcci´on d en el modo m y,
calibration − target?i − instrument?d − direction: el instrumento debe cali- brarse apuntando a la direcci´on d.
El dominio consta de cinco acciones, especificadas a continuaci´on:
turn − to(?s − satellite?dnew − direction?dprevdirection) ´esta acci´on, hace que el sat´elite cambie de direcci´on de dprev a dnew, la precondici´on es por tanto que el sat´elite estaba apuntando a dprev, y los efectos, son que el no est´a apun- tando m´as para dprev, y ahora est´a apuntando para dnew. Formalmente:
• Precondiciones: pointing?x?dprev. • Efectos negativos: pointing?x?dprev. • Efectos positivos: pointing?x?dnew.
switch − on(?i − instrument?s − satellite) enciende el instrumento i dentro del sat´elite s, para esto se requiere que el poder del sat´elite est´e disponible, y que el instrumento i est´e a bordo. Los efectos negativos son que la energ´ıa del sat´elite ya no est´a disponible3, que el instrumento no est´a calibrado4y que ahora
3Este modelamiento es reflejo del problema de STRIPS proposicional para representar algunos pro-
blemas reales, ya que todos los sat´elites podr´an tener a lo m´aximo un instrumento encendido a la vez, una versi´on extendida de STRIPS para tratar variables num´ericas permitir´ıa mantener un conteo de cu´antos instrumentos se puede mantener encendidos al mismo tiempo en cada sat´elite.
4Este es un ejemplo de dominio en que el conjunto de efectos negativos no es subconjunto del
CAP´ITULO 5. RESULTADOS 52
el instrumento i est´a encendido. En STRIPS:
• Precondiciones: power − avail?s y on − board?i?s. • Efectos negativos: power − avail?s y calibrated?i. • Efectos positivos: power − on?i.
Contraria a ´esta acci´on, existe la acci´on switch − of f con los mismos par´ame- tros, y con efecto opuesto, con la precondici´on de que el instrumento est´e encen- dido.
calibrate?s − satellite?i − instrument?d − direction, esta acci´on permite ca- librar el instrumento de captura hacia la direcci´on d. Las precondiciones son que el instrumento i est´e dentro del sat´elite, que est´e encendido y que el instrumento i pueda calibrarse en la direcci´on en la que est´a apuntando el sat´elite. Formal- mente:
• Precondiciones: onboard?i?s, calibration − target?i?d, pointing?s?d y
power − on?i. • Sin efectos negativos.
• Efectos positivos: calibrated?i.
take − image(?s − satellite?d − direction?i − instrument?m − mode) cap- tura una imagen en la direcci´on d en el modo m. Los requisitos son de que el instrumento est´e en el sat´elite, soporte el modo m, y est´e encendido y calibrado, as´ı como que el sat´elite est´e apuntando a la direcci´on d. El ´unico efecto de esta acci´on es que ahora se tiene una imagen capturada. Formalmente:
• Precondiciones: calibrated?i, on − board?i?s, supports?i?m, power − on?i, pointing?s?d y poweron?i.
• Sin efectos negativos.
• Efectos positivos: have − image?d?m.
Este es un dominio complejo, pues intervienen una gran cantidad de objetos inclu- sive para los problemas m´as peque˜nos. As´ı mismo, la toma de cada imagen requiere una serie de acciones, lo que genera una cantidad grande de posibilidades desde las primeras iteraciones de la b´usqueda. De este modo, los planes ´optimos para este tipo de problemas son grandes, y de ah´ı el inter´es por su estudio.
CAP´ITULO 5. RESULTADOS 53
Resultados
En las Figuras 5.6, 5.7 y 5.8 se pueden apreciar los resultados obtenidos para las variables Longitud del plan alcanzado, T iempo total de procesamiento y N ´umero de estados generados para el dominio Sat´elite.
Figura 5.6: Resultados obtenidos en la medici´on de la Longitud del Plan alcanzado para el dominio Sat´elite.
Figura 5.7: Resultados obtenidos en la medici´on del tiempo de procesamiento para el dominio Sat´elite.
CAP´ITULO 5. RESULTADOS 54
Figura 5.8: Resultados obtenidos en la medici´on del N´umero de estados generados para el dominio Sat´elite.
El an´alisis resultante se muestra en las Tablas 5.4, 5.5 y 5.6.
MPBH FF BLACKBOX HSP STAN
Mediana 14 11 13 11
Media 45,5 11 11,6 11
Des. Est´andar 29,5 1,63 1,8 1,63
Tabla 5.4: Media, Mediana y Desviaci´on est´andar obtenidos en la medici´on de la Lon-
gitud del Plan para el dominio de Sat´elite.
MPBH FF BLACKBOX HSP STAN
Mediana 6,02 0 0,22 0
Media 63851 0 0,17 0
Des. Est´andar 63844,99 0 0,07 0
Tabla 5.5: Media, Mediana y Desviaci´on est´andar obtenidos en la medici´on del Tiempo
de Procesamiento para el dominio de Sat´elite.
Como se puede apreciar en los resultados obtenidos, MPBH solucion´o dos de los tres problemas ejecutados para el dominio sat´elite y mostr´o un desempe˜no promedio menor que los otros planeadores en t´erminos de las tres variables medidas. El com- portamiento de MPBH en este dominio indica una debilidad del planeador en tratar problemas en los cuales el n´umero de objetos es grande.
CAP´ITULO 5. RESULTADOS 55
MPBH FF BLACKBOX HSP STAN
Mediana 5085 19 1522 11
Media 64066,5 19,33 1395 11
Des. Est´andar 58981,5 3,68 578,74 1,63
Tabla 5.6: Media, Mediana y Desviaci´on est´andar obtenidos en la medici´on del N´umero
de estados generados para el dominio de Sat´elite.
STAN posee una limitaci´on que impide que pueda ser aplicado a problemas de este dominio. Debido a esto no se presentan los resultados de dicho planeador en esta Subsecci´on.
5.4.3.
Elevador
Dominio conocido tambi´en como Miconics. La idea es transportar un conjunto de pasajeros con un elevador desde sus pisos de origen a los de destino. La versi´on STRIPS de este dominio ser´a detallada a continuaci´on.
Descripci´on
El dominio de elevador contempla dos tipos b´asicos: pasajero y piso, los ´atomos que definen el dominio son:
origin?person − passenger?f loor − f loor: el pasajero se encuentra en el piso f loor,
destin?person − passenger?f loor − f loor: el pasajero person desea llegar al piso f loor,
above?f loor1 − f loor?f loor2 − f loor: el piso f loor1 est´a ubicado debajo del piso f loor2,
boarded?person − passenger: el pasajero est´a dentro del elevador,
served?person − passenger: el pasajero ya se encuentra en su piso de destino, lif t − at?f loor − f loor: el elevador se encuentra en el piso f loor.
Las acciones del dominio modelan el abordaje y salida de pasajeros del elevador, as´ı como el desplazamiento del elevador entre pisos adyacentes.
CAP´ITULO 5. RESULTADOS 56
board(?f − f loor?p − passenger): el pasajero p aborda el ascensor en el piso f , para ´esto es necesario que tanto la persona como el elevador est´en en el piso actualmente. El efecto de la acci´on, es que el pasajero se encuentra dentro del elevador. En STRIPS:
• Precondiciones: lif t − at?f y origin?p?f . • Sin efectos negativos.
• Efectos Positivos: boarded?p
depart(?f − f loor?p − passenger): el pasajero p sale del ascensor en el piso f , siempre y cuando el piso f sea su destino. Las precondiciones de esta ac- ci´on son que el elevador est´e en el piso actualmente, que la persona est´e en el elevador y que su destino sea el piso actual. El efecto de la acci´on, es que el pa- sajero no se encuentra m´as dentro del elevador y que el pasajero ya fue servido. Formalmente:
• Precondiciones: lif t − at?f , boarded?p y destin?p?f . • Efectos negativos: boarded?p.
• Efectos Positivos: served?p
up[down](?f 1 − f loor?f 2 − f loor): el elevador se mueve hacia arriba[abajo] del piso f 1 al piso f 2. Se requiere que el piso f 1[f 2] est´e debajo del piso f 2[f 1] y que el elevador est´e en el piso f 1, los efectos son que el piso no est´a m´as en el piso f 1, y ahora est´a en el piso f 2. En STRIPS(para el operador up):
• Precondiciones: lif t − at?f 1 y above?f 1?f 2. • Efectos negativos: lif t − at?f 1.
• Efectos Positivos: lif t − at?f 2
La especificaci´on del estado inicial en un problema de este dominio, consiste en la descripci´on del orden de los pisos, as´ı como de la posici´on inicial y destino de cada uno de los pasajeros. El estado meta es siempre tener a todos los pasajeros servidos, es decir en su piso de destino.
Resultados
Los resultados obtenidos para las variables Longitud del plan alcanzado, T iempo total de procesamiento y N ´umero de estados generados se pueden apreciar en las Figuras 5.9, 5.10 y 5.11 respectivamente.
CAP´ITULO 5. RESULTADOS 57
Figura 5.9: Resultados obtenidos en la medici´on de la Longitud del Plan alcanzado para el dominio Elevador.
Figura 5.10: Resultados obtenidos en la medici´on del tiempo de procesamiento para el dominio Elevador.
El an´alisis resultante se muestra en las Tablas 5.7, 5.8 y 5.9.
MPBH mostr´o un comportamiento estable en los problemas evaludos para este do- minio. A pesar de eso, los planes generados fueron de menor calidad en promedio que los de los otros planeadores y gener´o un mayor n´umero de estados en la resoluci´on de
CAP´ITULO 5. RESULTADOS 58
Figura 5.11: Resultados obtenidos en la medici´on del N´umero de estados generados para el dominio Elevador.
MPBH FF BLACKBOX HSP STAN
Mediana 8 7 7 6
Media 11,5 8,85 8,85 7,85
Des. Est´andar 7,31 3,95 3,95 3,51
Tabla 5.7: Media, Mediana y Desviaci´on est´andar obtenidos en la medici´on de la Lon-
gitud del Plan para el dominio de Elevator.
MPBH FF BLACKBOX HSP STAN
Mediana 0,01 0 0,02 0,063
Media 8,75 0 25,75 0,09
Des. Est´andar 14,82 0 69,65 0,11
Tabla 5.8: Media, Mediana y Desviaci´on est´andar obtenidos en la medici´on del Tiempo
de Procesamiento para el dominio de Elevator.
problemas.
HSP posee una limitaci´on que impide que pueda ser aplicado a resolver problemas de este dominio. Debido a esto no se presentan los resultados de dicho planeador en esta Subsecci´on.
CAP´ITULO 5. RESULTADOS 59
MPBH FF BLACKBOX HSP STAN
Mediana 117 10 291
Media 4152,7 13 823,5
Des. Est´andar 6606,30 7,09 804,95
Tabla 5.9: Media, Mediana y Desviaci´on est´andar obtenidos en la medici´on del N´umero
de estados generados para el dominio de Elevator.
5.4.4.
Log´ıstica
Este dominio tambi´en es de alto inter´es por su aplicabilidad, y es un dominio en el cu´al se puede comparar la efectividad de planeadores independientes del dominio con la de los planeadores dise˜nados para dominios espec´ıficos, ya que existen muchos sistemas que resuelven este problema utilizando otras t´ecnicas como programaci´on lineal por ejemplo.
El problema consiste en el transporte de cargas dentro de ciudades a trav´es de ca- miones, y entre ciudades a trav´es de aviones. Las ubicaciones dentro de ciudades est´an directamente conectadas entre s´ı, y del mismo modo lo est´an las ciudades. En cada ciu- dad existe exactamente un cami´on y en cada ciudad una de las ubicaciones funciona como aeropuerto.
Descripci´on
El dominio de log´ıstica contiene una jerarqu´ıa de tipos de objetos a diferencia de los otros dominios presentados. Los tipos b´asicos son ciudad, lugar y objeto f´ısico. Aeropuerto y ubicaci´on derivan de lugar, paquete y veh´ıculo derivan de objeto f´ısico y tanto cami´on como avi´on derivan de veh´ıculo. Los ´atomos del dominio son:
in − city?loc − place?c − city: especifica que el lugar loc queda dentro de la ciudad c,
at?obj − physobj?loc − place: indice que el objeto obj, que por la jerarqu´ıa de tipos puede ser tanto un veh´ıculo como un paquete, est´a en el lugar loc,
in?p − package?v − vehicle: el paquete p est´a dentro del veh´ıculo v, y puede ser transportado por el mismo.
Las acciones del dominio representan el traslado de veh´ıculos entre lugares(ciudades en el caso de aviones, y ubicaciones en el caso de camiones), as´ı como la carga y
CAP´ITULO 5. RESULTADOS 60
descarga de paquetes en los veh´ıculos. Las acciones de carga y descarga para ambos casos son equivalentes, y solamente desarrollaremos la especificaci´on de las acciones referentes a camiones.
load − truck(?p − package?t − truck?l − place): Cargar el paquete p que se encuentra en la ubicaci´on l en el cami´on c. Sus precondiciones son que tanto el paquete cuanto el cami´on est´en en la ubicaci´on l. Los efectos son que el paquete no est´a m´as en la ubicaci´on l5y que ahora el paquete est´a dentro del cami´on.
• Precondiciones: at?t?l y at?p?l. • Efectos negativos: at?p?l. • Efectos positivos: in?p?t.
unload − truck(?p − package?t − truck?l − place): Descargar el paquete p de dentro del cami´on en la ubicaci´on l, para eso se requiere que el cami´on est´e en l y que el paquete est´e dentro del cami´on. Sus efectos osn que el paquete no est´a m´as dentro del cami´on, y ahora est´a en la ubicaci´on l. En STRIPS:
• Precondiciones: at?t?l y in?p?t. • Efectos negativos: in?p?t. • Efectos positivos: at?p?l.
drive − truck(?t − truck?lf rom − place?lto − place?c − city): Esta acci´on describe la posibilidad de desplazamiento de un cami´on entre dos ubicaciones en una misma ciudad. Los requisitos para llevar a cabo esta acci´on son que el cami´on est´e en la localidad de origen (lf rom) y que tanto la localidad de origen como la de destino est´en en la misma ciudad. La aplicaci´on de la acci´on implica que el cami´on no est´a m´as en la localidad de origen, y que ahora est´a en la localidad destino. Formalmente:
• Precondiciones: at?t?lf rom, in − city?lf rom?c y in − city?lto?c. • Efectos negativos: at?t?lf rom.
• Efectos positivos: at?t?lto.
5En realidad el paquete a´un est´a en l, pero modelar la acci´on contemplando esa propiedad, impli-
car´ıa que los efectos de la acci´on de desplazamiento del cami´on, no ser´ıan est´aticos, depender´ıan del contenido del cami´on, lo cu´al no se puede hacer en STRIPS proposicional.
CAP´ITULO 5. RESULTADOS 61
f ly −airplane(?a−airplane?lf rom−airport?lto−airport): Desplazamiento de un avi´on de un aeropuerto a otro. La precondici´on es que el avi´on est´e en el aeropuerto de origen y los efectos son que no es m´as v´alido que el avi´on est´a en el aeropuerto de origen y que ahora est´a en el aeropuerto de destino.
• Precondiciones: at?a?lf rom. • Efectos negativos: at?a?lf rom. • Efectos positivos: at?a?lto.
Este dominio es interesante puesto que muestra el poder del uso de tipos en la creaci´on de dominios STRIPS. Todos los dominios con tipos pueden ser modelados sin usar tipos, incrementando un ´atomo para cada tipo y especificando en el estado inicial la asociaci´on de tipos a los objetos. As´ı, en este dominio la acci´on drive − truck por ejemplo en lugar de tener tres precondiciones pasar´ıa a tener siete, cuatro adicionales, donde cada una de ellas verifica la existencia del ´atomo de especificaci´on de tipos para cada objeto pasado como par´ametro.
El incremento del n´umero de precondiciones causa un incremento en la compleji- dad de los algoritmos de planeamiento.
Resultados
Para el dominio Log´ıstica, los resultados obtenidos para las variables Longitud del plan alcanzado, T iempo total de procesamiento y N ´umero de estados generados se pueden apreciar en las Figuras 5.12, 5.13 y 5.14 respectivamente.
El an´alisis resultante se muestra en las Tablas 5.10, 5.11 y 5.12.
MPBH FF BLACKBOX HSP STAN
Mediana 28 19 25 9
Media 27,55 19,40 24,3 8,6
Des. Est´andar 10 5,71 8,23 1,95
Tabla 5.10: Media, Mediana y Desviaci´on est´andar obtenidos en la medici´on de la
Longitud del Plan para el dominio de Elevator.
En el dominio de log´ıstica, tambi´en con una gran cantidad de objetos, MPBH tuvo un desempe˜no menor en tiempo de procesamiento y n´umero de estados generados, con respecto a los otros planeadores. Respecto al tama˜no de soluci´on, todos los planeadores
CAP´ITULO 5. RESULTADOS 62
Figura 5.12: Resultados obtenidos en la medici´on de la Longitud del Plan alcanzado para el dominio Log´ıstica.
Figura 5.13: Resultados obtenidos en la medici´on del tiempo de procesamiento para el dominio Log´ıstica.
mostraron un desempe˜no adecuado, s´olo STAN consigui´o obtener los mejores planes para este dominio.
Es tambi´en necesario recalcar que en este dominio Blackbox no pudo solucionar ninguno de los problemas evaluados.
CAP´ITULO 5. RESULTADOS 63
Figura 5.14: Resultados obtenidos en la medici´on del N´umero de estados generados para el dominio Log´ıstica.
MPBH FF BLACKBOX HSP STAN
Mediana 9,57 0 0,01 0,005
Media 17,50 0 0 0,01
Des. Est´andar 7,31 0 0 0,020
Tabla 5.11: Media, Mediana y Desviaci´on est´andar obtenidos en la medici´on del Tiem-
po de Procesamiento para el dominio de Elevator.
MPBH FF BLACKBOX HSP STAN
Mediana 9838 26 27
Media 8376,44 28,1 26,1
Des. Est´andar 4368,43 9,55 8,49
Tabla 5.12: Media, Mediana y Desviaci´on est´andar obtenidos en la medici´on del N´ume-
ro de estados generados para el dominio de Elevator.
5.5.
Consideraciones Finales
El an´alisis de χ2 realizado para la medici´on de la competitividad de MPBH para el dominio de los bloques arroj´o como resultado que no hay asociaci´on entre las varia- bles planeador y n´umero de problemas resueltos por lo tanto el n´umero de problemas resueltos, no depende del planeador empleado para su resoluci´on. Sin embargo en el an´alisis realizado para un conjunto de dominios da como resultado que la hip´otesis El
CAP´ITULO 5. RESULTADOS 64
planeador MPBH es competitivo en t´erminos de n´umero de problemas resueltos frente a los planeadores STAN, HSP, FF y Blackbox de eficacia comprobada. se cumple con
una valor de entre 90 % y 95 % de confianza, entonces se puede decir que s´ı existe una relacion entre las variables P laneador y P roblemasResueltos; por lo tanto se puede afirmar con 90 % - 95 % de confianza que el el planeador MPBH es mejor que otros
planeadores en un conjunto diverso de dominios en t´erminos de n´umero de problemas
resueltos.
En el an´alisis adicional realizado para el mundo de los bloques se tuvo que MPBH tom´o m´as tiempo que los otros planeadores en la mayor´ıa de problemas ejecutados sin embargo el n´umero de estados generados por MPBH fue menor que el n´umero de esta- dos generados por Blackbox y equivalente a los generados por HSP y FF. En t´erminos de calidad de soluci´on, MPBH gener´o planes del mismo tama˜no que los generados por los otros planeadores, siendo HSP el que gener´o los planes de mayor tama˜no en promedio.
En el caso del dominio Sat´elite MPBH solucion´o dos de los tres problemas ejecuta- dos para este dominio y mostr´o un desempe˜no promedio menor para las tres variables medidas, lo cual indica una debilidad del planeador MPBH al tratar problemas en los cuales el n´umero de objetos es grande.
Para el dominio Elevador, MPBH mostr´o un comportamiento estable en la resolu- ci´on de los problemas. A pesar de eso, los planes generados fueron de menor calidad en promedio que los de los otros planeadores y gener´o un mayor n´umero de estados en la resoluci´on de problemas
Finalmente, en el dominio de log´ıstica, en el cual tambi´en existe una gran cantidad