Estudio previo a la optimizaci´ on

3. Motivaci´ on

5.2. Estudio previo a la optimizaci´ on

El propósito de esta sección es analizar la estructura del modelo de simulación para detectar los puntos del sistema que son susceptibles de ser paralelizados. Se trata de un análisis prelimi- nar, ya que el definitivo tendrá lugar sobre el sistema en su versión secuencial una vez que esté implementado. Dicha tarea tendrá mucho peso en el global del proyecto porque cuanto más exhaustivo sea dicho estudio, mejores decisiones podremos tomar acerca de la paralelización y mayores beneficios obtendremos a nivel de prestaciones.

De hecho, uno de los fundamentos del área HPC es conocer y analizar con detalle el algoritmo para aplicar las metodolog´ıas adecuadas en los puntos adecuados. En otras palabras, será necesario hacer un profiling de la implementación secuencial para medir los tiempos de ejecu- ción. De esta manera podremos saber qué cálculos tienen mayor coste y, por tanto, qué bloques

5.2. Estudio previo a la optimizaci´on 41

de código deben paralelizarse. Sabremos también si esos bloques ejecutan llamadas de código C++ puro desde la capa core, o se corresponden con paso de información por parte de la capa intermedia, o bien si se trata de llamadas a la propia API de Maya. Con toda esa información se podrán tomar decisiones acertadas sobre la paralelización de los bucles o la reimplementación de algunas partes del código para favorecer la optimización.

Como dec´ıamos, para poder completar este detallado estudio es necesario disponer de la implementación del sistema en versión secuencial. Por ese motivo, de momento nos vamos a limitar a exponer el algoritmo del modelo y a plantear las hipótesis de paralelización desde un punto de vista teórico. En el Algoritmo 1 se muestra el bucle de simulación del modelo MSXPBD, esto es, el conjunto de instrucciones que se ejecutan en cada fotograma.

Algorithm 1 Pseudoc´odigo del bucle de simulaci´on

1: Recoger datos globales de la escena

2: Enviar datos globales al solver

3: for all m´usculosm do

4: Recoger datos locales de m

5: Enviar datos locales de m al solver

6: Actualizar velocidades de los v´ertices de m

7: Actualizar posiciones de los v´ertices de m

8: for all iteraciones i do

9: for all m´usculos m do

10: Leer geometr´ıas de m´usculos vecinos a m

11: for all restricci´on r do

12: Computar r

13: Actualizar la geometr´ıa de m

14: for all m´usculosm do

15: Actualizar velocidad de los v´ertices de m

16: Enviar posiciones resultantes a la aplicaci´on

17: Actualizar v´ertices en la geometr´ıa de m para la visualizaci´on

Como introducción al análisis de la optimización del sistema, se adjunta la tabla 5.5 en la que se estudian los bucles presentes en el Algoritmo 1 para determinar las posibilidades de paralelización. La columna capa se refiere a la(s) capa(s) de abstracción encargada(s) de ejecutar cada bloque de instrucciones, a saber:coresi son cálculos propios del modelo MSXPBD,

aplicación si son operaciones a nivel de API de Maya, o intermedia si son instrucciones de comunicación entre el core y la aplicación.

Es necesario aclarar algunas cuestiones de la tabla5.5. Por un lado, vemos que los bucles 3-7 y 14-17 están indicados como paralelizables. Dichos bucles implican la participación de las tres capas, incluyendo la capa de aplicación. En estos casos, tendremos que asegurarnos previamente de que las llamadas a la API de Maya son compatibles con directivas de paralelización. Si esto

42 Metodolog´ıa y Gesti´on del Proyecto Capa Par. Comentarios

3-7

Aplicaci´on Intermedia

Core

S´ı

La recogida de parámetros particulares de cada músculo es independiente una de otra. También lo es la integración de fuerzas y velocidades. 8-13 Aplicación Intermedia Core No

El estado de la part´ıculas tras el cómputo de una iteración influye directamente en el cómputo de la iteración siguiente. La convergencia de MSXPB es posible gracias a ello.

9-13

Aplicaci´on Intermedia

Core

El cómputo de un músculo depende del estado de la geometr´ıa de los músculos vecinos con los que se conecta. Se

necesita la informaci´on m´as actualizada posible.

11-12 Core S´ı Los m´etodos Jacobi y Coloreado de Grafos permiten calcular las restricciones de manera simult´anea.

14-17

Aplicaci´on Intermedia

Core

S´ı

La actualización de las velocidades de las part´ıculas de un músculo es independiente del resto de músculos. Ocurre lo mismo con la actualización de los vértices en la geometr´ıa. Tabla 5.5: Estudio de la paralelización del algoritmo. Cada columna refleja de izquierda a derecha: ´ındices de l´ınea en el algoritmo; capa(s) que ejecuta(n) las instrucciones; posibilidad de paralelización; y breve justificación de la columna anterior.

no es posible, será necesario dividir esos bucles en varias partes para poder optimizar, al menos, aquellas instrucciones que se ejecutan únicamente desde la capa core. Esta y otras cuestiones serán las que se ampl´ıen más adelante durante el diseño de la paralelización.

Por otro lado, el bucle 11-12 hace mención a los métodos de Jacobi y de Coloreado de Grafos. Tal y como se introdujo en el cap´ıtulo de Estado del Arte, el método Jacobi es una de las técnicas de paralelización aplicables al modelo XPBD, el cual está basado en la acumulación de las correctivas calculadas por cada restricción para aplicarlas de forma promediada sólo una vez al término de cada iteración, justo antes de procesar la siguiente iteración. Por lo que respecta al Coloreado de Grafos, cabe recordar que consiste en la agrupación de las restricciones aplicando un criterio independencia entre s´ı en lo que a compartición de vértices afectados se refiere. Con esta separación se garantiza la convergencia del sistema y la atomicidad a nivel de escritura de los deltas de posición (consultar la subsección 2.2.1).

In document Optimization of muscle simulation with extended position based dynamics applying jacobi and graph coloring methods (página 53-55)