Taxonomía de algoritmos Grid - Algoritmos de planificación

Resultados solo MP

Capítulo 5. Algoritmos de planificación

7. Taxonomía de algoritmos Grid

En [72] se propone una taxonomía jerárquica de algoritmos de planificación de propósito general en sistemas de cómputo paralelo y distribuido (Figura 30). Debido a que los sistemas Grid son una clase especial de estos sistemas, los algoritmos de planificación Grid se encuentran dentro de un subconjunto de esta taxonomía. A continuación se describe desde la raíz cómo puede ser identificada y se analizan las alternativas que fueron tomadas en consideración para implementar la solución propuesta para esta tesis en la generación de espacios virtuales desde un metaplanificador.

Locales vs Globales: En el nivel más alto, se encuentra la distinción entre planificación

global y local. La planificación local determina como el proceso que reside en un procesador es asignado y ejecutado, mientras que una política de planificación global usa la información del sistema para asignar el proceso a múltiples procesadores y optimizar el sistema en forma general con el objetivo de mejorar el rendimiento, por lo que los sistemas Grid se encuentran en esta segunda categoría.

Estático vs Dinámico: El siguiente nivel en la jerarquía (bajo planificación global) es la

elección entre planificación dinámica y estática. La elección indica el tiempo en que se realizan las decisiones de planificación. En el caso de planificación estática, se asume que la información de los recursos así como la de las tareas se encuentra disponible en el momento que se planifica la aplicación. Por el contrario, en el caso de planificación dinámica, la idea básica es realizar la asignación de tareas en el momento de ejecución de la aplicación. Esto es útil cuando es imposible determinar en ejecución, las ramas que puede tomar el código, el número de iteraciones o el modo en que arriban los trabajos en tiempo real.

Optimo vs Sub-óptimo: Cuando toda la información del estado de los recursos y tareas

sea conocida, se puede realizar una asignación óptima basada en una función objetivo, como un árbol de expansión mínima o maximización en la utilización de los recursos. Pero debido a la naturaleza NP-Completa de los algoritmos de planificación y la dificultad de hacer suposiciones razonables en los entornos Grid que son condición necesaria para probar la optimalidad de los algoritmos, las líneas de investigación actuales intentan encontrar soluciones sub-optimas, que pueden ser divididas en las siguientes categorías:

Aproximada vs. Heurística: Los algoritmos de aproximación usan modelos

computacionales formales, pero en vez de hacer búsquedas sobre la solución completa

para una solución óptima, se satisfacen con una solución suficientemente “buena”. En

este caso, donde se dispone de una métrica para evaluar la solución, esta técnica se usa para minimizar el tiempo tomado para encontrar una planificación aceptable.

La otra rama de la categoría sub-optima es llamada heurística, esta rama representa la clase de algoritmos que hace suposiciones más realistas sobre un conocimiento de los procesos y conocimiento de carga del sistema. También representa la solución a los problemas de planificación que no pueden dar una solución óptima, sino que sólo requiere el costo más razonable y sólo algunos recursos para realizar las tareas. La evaluación de esta clase de soluciones generalmente se basa en experiencias del mundo real o simulaciones. Los algoritmos con heurísticas se adaptan más a los entornos Grid donde los recursos y aplicaciones son diversos y dinámicos.

Distribuidos vs Centralizados: En los escenarios de planificación dinámicas, la

responsabilidad de tomar decisiones de planificación globales son responsabilidad de uno o más planificadores centralizados o compartida por múltiples planificadores distribuidos. En un Grid, pueden haber varias aplicaciones enviadas a planificar o re-planificar simultáneamente. La estrategia centralizada tiene la ventaja de su fácil implementación, pero sufre de problemas de escalabilidad, tolerancia a fallos o la posibilidad de ser el cuello de botella.

Cooperativo vs No-cooperativo: Si se usa un algoritmo de planificación distribuido, el

próximo paso es conocer si los nodos que se encuentran involucrados en la planificación de las tareas se encuentran cooperando o son independientes. Si el caso es no- cooperativo, los planificadores actúan como entidades autónomas y toman decisiones según sus propios valores; independientemente de los efectos que estas decisiones pueden tener en el resto del sistema. Algunos ejemplos se dan en planificadores a nivel de aplicación donde los planificadores se encuentran altamente acoplados con aplicaciones especiales tratando de optimizar su funcionamiento.

En el caso cooperativo, es tarea del planificador Grid la responsabilidad de llevar adelante la tarea de planificación, pero junto con el resto de los planificadores trabajan para lograr un objetivo global. Cada planificador Grid tiene la política local de consensuar las decisiones en vez de sólo tener en cuenta el rendimiento local.

En el caso de los entornos Grid la selección por defecto sigue el camino de algoritmos Globales, ya que estos toman la información del sistema para asignar procesos a múltiples procesadores en distintos equipos de computo. En la segunda opción esto depende del algoritmo elegido, en el caso de esta tesis y tomando como referencia el marco de trabajo para la toma de decisiones (capítulo 4), la categorización de los algoritmos que se utilizan es del tipo dinámico, ya que la información se obtiene al arribo de la tarea. La responsabilidad en la toma de decisión para la planificación es compartida entre el metaplanificador y el planificador local, siendo estas características de algoritmos distribuidos y cooperativos.

7.1. Función objetivo

Los dos actores principales en los entornos Grid (los consumidores de los recursos que envían las aplicaciones y los proveedores de recursos que los comparten), generalmente tienen diferentes intenciones cuando se encuentran dentro del entorno Grid. Estas expectativas se presentan en las funciones objetivos. La mayoría de las funciones objetivo en la computación Grid son heredadas de los sistemas de cómputo paralelo y distribuido. Los usuarios Grid se concentran en el rendimiento de las aplicaciones (por ejemplo el costo total de correr una aplicación), mientras que los proveedores de servicio prestan más atención al rendimiento de los recursos que comparten (por ejemplo, el uso en un determinado lapso de tiempo). Así las funciones objetivo pueden ser divididas en centradas en la aplicación o centradas en el recurso.

Orientada a Aplicaciones: Los algoritmos que adoptan la función objetivo orientada a las

aplicaciones intentan optimizar el rendimiento para cada aplicación. La mayoría de las aplicaciones Grid tiene como objetivo minimizar el tiempo, por ejemplo el makespan, que

es el tiempo que lleva desde la ejecución de la primera tarea hasta la ejecución de la última. El makespan es una medida común para medir algoritmos de planificación. A

medida que se introducen modelos económicos, el costo económico que una aplicación necesita pagar por los recursos utilizados también es de interés para los usuarios Grid.

Orientada a Recursos: La función objetivo de algoritmos de planificación orientados a

recursos intenta optimizar la performance de los recursos. Sus objetivos están relacionados con la utilización de los recursos, por ejemplo el throughput que es la

habilidad de los recursos de procesarcierto número de tareas en un periodo de tiempo; o la utilización, que es el porcentaje de tiempo que un recurso está siendo utilizado. Para un recurso multiprocesador, la diferencia en el uso de los procesadores también describe el balance de carga del sistema y disminuye la cantidad de tareas procesadas.

La función objetivo de los algoritmos distribuidos que se desarrollan en esta tesis toma como base el uso de los recursos de cómputo y comunicación disponibles en la red Grid (capítulo 3), por lo que según la calificación se centran en el recurso. Si bien los algoritmos que se describirán en las secciones siguientes, intentan optimizar el uso de los recursos de cómputo y red, la función de optimización puede cambiar de manera sencilla a una ecuación económica siendo esta la función objetivo.

7.2. Planificación adaptativa

Se establece una solución adaptativa al problema de planificación cuando los algoritmos y parámetros para tomar una decisión de planificación cambian significativamente de acuerdo al estado, previo, actual o futuro de los recursos. En la computación Grid la necesidad de contar con planificadores adaptativos proviene de la heterogeneidad de los recursos candidatos, el dinamismo del rendimiento de los recursos y la diversidad de aplicaciones.

Adaptadas a los recursos: Debido a la heterogeneidad de recursos y diversidad de

aplicaciones, descubrir recursos disponibles y seleccionar la aplicación apropiada al subconjunto de los recursos es muy importante para obtener un buen rendimiento o reducir el costo. Por ejemplo, la selección de la ubicación del almacenamiento es afectada por las demoras en la red, o agrupar las aplicaciones dependiendo los anchos de banda de la red o las características de cómputo de los equipos involucrados.

Adaptación al rendimiento: La adaptación al rendimiento de los recursos puede

observarse cuando se cambian las políticas de planificación, o también cuando se intenta lograr un balance de carga dependiendo de algún modelo de rendimiento o encontrar un número de recursos adecuado a ser usado.

Adaptación a la aplicación: Para lograr más rendimiento, los planificadores a nivel de

aplicación se encuentran integrados a los sistemas y no es fácilmente extensible otros sistemas similares o al entorno. Por tal motivo, este tipo de planificadores es propio de un tipo de aplicación.

Según el modelo de planificación distribuida basado en políticas presentado en el capítulo 4, la interacción entre los planificadores se adapta según los cambios de patrón con la llegada de tareas y capacidad de cómputo de los equipos disponibles. Por lo tanto, según la clasificación que aquí se describe se realiza una planificación adaptativa basada en la adaptación de los recursos.

7.3. Dependencia de las tareas

Cuando se toma en consideración la relación entre las tareas se presentan dos alternativas. La primera, es que las tareas puedan ejecutarse de forma independiente unas de otras y la segunda que posean un orden de dependencia entre ellas. La dependencia tiene un impacto crucial en el diseño de algoritmos de planificación.

Cuando las tareas que componen un trabajo tienen orden de precedencia, se aplica un modelo común llamado grafo directo acíclico (DAG), en el que un nodo representa una tarea y la arista dirigida denota un orden de precedencia entre dos vértices. En algunos casos los pesos pueden ser agregados como costo computacional o costos de comunicación respectivamente. Como la infraestructura Grid madura cada vez más y se hace más compleja, se prevén cada vez más herramientas de soporte de flujo que hacen uso de estos conceptos.

Las aplicaciones que se tienen en consideración para el desarrollo de esta tesis, son las que cumplen con el modelo master-worker, por lo que la relación entre las tareas que

ejecutan el cómputo es nula. Su asignación es dinámica ya que se relaciona con la carga que tienen en el momento de arribo los recursos seleccionados.

7.4. Métodos no tradicionales

El entorno Grid es el tipo de sistema que se compone de gran número de proveedores de recursos autónomos, ejecutándose en forma concurrente, cambiando dinámicamente e interactuando entre ellos. En la naturaleza y en la sociedad, existen diversos sistemas con las mismas características. Por lo que nuevas metodologías como los sistemas económicos pueden ser incorporados. Algunos de estos conceptos se describen a continuación.

Figura 34.Taxonomía de métodos no tradicionales

El uso de métodos económicos en planificación Grid requiere la interacción de procesos entre proveedores y consumidores de recursos, de manera análoga a la que funcionan los comportamientos de Mercado, Buyya [73] presenta algunos modelos económicos que pueden ser aplicados en entornos Grid como modelos de mercados de productos, modelos de contrato o modelos de compras.

Algunas de las características comunes de las heurísticas de la naturaleza son relacionadas con el no determinismo y la presencia de estructuras paralelas así como

también la adaptabilidad. Las heurísticas clásicas son los algoritmos Genéticos (GA),

Simulated Annealing (SA) y Tabu Search (TS), y otras que son combinaciones de los tres

tipos de algoritmo.

En los algoritmos analizados para la implementación de esta tesis se encuentran algunos no tradicionales como pueden ser los que utilizan heurísticas de la naturaleza. Estas heurísticas fueron seleccionadas debido a que en la mayoría de los casos tienden a encontrar soluciones cuasi optimas en un lapso de tiempo razonablemente corto, siendo estos requerimientos fundamentales para determinar la factibilidad del funcionamiento a un algoritmo de planificación.

In document Planificación dinámica sobre entornos GRID (página 88-94)