Generaci´ on de celdas - Arquitectura del sistema

4. Implementaci´ on

4.2. Arquitectura del sistema

4.2.1. Generaci´ on de celdas

El método de lattice Boltzmann utiliza un sistema de grilla para representar la información. Esta grilla está compuesta por celdas de tamaño uniforme. Para posterior generación de matrices de transición que se utilizarán en la etapa de colisión del método, es necesario primero identificar a que celda corresponde cada parte del modelo a simular.

Las geometr´ıas objetivos son representadas en un formato estándar (Wavefront OBJ) [33], el cual consta de definición de puntos en el espacio y aristas que los unen, formando pol´ıgonos. La Figura 4.2 es un ejemplo de un modelo tridimensional descripto en el formato. Para simplificación del trabajo, todas las definiciones de objetos son generadas a partir de triángulos, la m´ınima definición posible de superficie. Cada triangulo es almacenado como una terna de puntos representando sus vértices. Los valores máximos y m´ınimos de los vértices en cada dimensión definen el tamaño del objeto.

Figura 4.2: Modelado de una habitaci´on.

La cantidad de vóxeles en la grilla es un parámetro a asignar al sistema. El tamaño de las celdas se calcula como el cociente entre el lado máximo de la figura y la cantidad de celdas por lado.

La inicialización del sistema consta de la lectura de la geometr´ıa y la creación de la grilla. Una vez cargado todo en memoria, se debe realizar la asociación entre las superficies y los vóxeles que lo contienen. La asignación es trivial cuando una superficie está incluida totalmente en un vóxel. Si los vértices de un triangulo se encuentran en distintas celdas, la figura pertenece a varias de éstas. Una superficie que interseque más de una celda no necesariamente pertenece sólo a las cuales yacen sus vértices, sino también su superficie puede atravesar vóxeles intermedios. La Figura 4.3 representa el pseudocódigo del método de distribución de triángulos en celdas, el cual genera el m´ınimo cubo (Bounding Box) que contiene a la superficie. Las celdas que intersequen con el triangulo, también insersecarán al cubo m´ınimo. Encontrar el conjunto de celdas que se superpone con el cubo posee un menor costo computacional que controlar cada celda con la figura. Se calculan entonces, los vóxeles relativos al cubo m´ınimo, y de estos, se buscaran los que correspondan con la superficie.

4.2.2. Generaci´on de matrices

El generador de matrices de transición toma como parámetro de entrada cada vóxel de forma individual y la lista de geometr´ıas asociadas al mismo. No se requiere poseer conocimiento de la posición del vóxel ni de su vecindario para analizar su comportamiento. Se pueden requerir de parámetros adicionales como especificaciones

BBOX.MIN_Z - TAMA~NO_CELDA < Celda.z < BBOX.MAX_Z + - TAMA~NO_CELDA }

PARA C/ Celda EN Celdas SI Figura EN Celda

Celda->agregar(Figura)

Figura 4.3: Pseudocodigo de inclusi´on de tri´angulos en celdas.

de las propiedades del ambiente en el caso de encontrar v´oxeles vac´ıos.

El sistema posee distintos algoritmos para analizar el comportamiento de la luz dentro de una celda. Los distintos métodos son encapsulados en clases que comparten una misma interfaz para poder ser usadas indistintamente. En la Figura 4.4 se puede observar el diagrama de clases que componen la generación de las transforma- ciones. La clase abstracta AbstractTransformationsCreator contiene la interfaz que interactúa con el pipeline. El resto de las clases generadoras de matrices de trans- formación heredan de la anterior, implementando el comportamiento especifico del método a realizar. La clase abstracta es la encargada de iterar sobre cada celda, lla- mando a la función virtual pura setMatrix(Cell, Transformation), cual implementa el metodo en s´ı.

Además de la geometr´ıa, el comportamiento de la luz es afectado por el tipo de material de la cual la estructura se compone. Los coeficientes de dispersión, absor- ción, y anisotrop´ıa son generados por una clase de tipo CoefficentSetter. La clase

StaticCoefficientSetter se inicia con valores est´aticos que ser´an entregados cada vez que se los consulte.

Sólo los materiales blancos y negros tienen una interacción idéntica para todas las frecuencias de luz. Los objetos cobran color al discriminar las luces a absorber o rebotar. Por esta razón se implementa la clase RGBCoefficientSetter, encargada de distinguir el canal de luz a analizar y el color del objeto, para generar los coeficientes adecuados. Para generar una imagen a color, se deben generar las reglas de

transformación para 3 canales; Rojo, Verde y Azul. Para generar las reglas para un color, este se debe pre-establecer en RGBCoefficientSetter. Cuando el generador de matriz le consulte el coeficiente para una celda; ésta, tomará el promedio intensidad del color en el canal correspondiente, y devolverá los coeficientes calculados a partir de la ecuación descrita en la Sección 3.4.

Matrices isotr´opicas y anisotr´opicas

Las matrices isotrópicas son las más sencillas, comportándose de la misma forma en todas las direcciones. La clase IsotropicMatrixCreator utiliza los coeficientes de absorción y dispersión para generar la matriz isotrópica. Se distingue la presencia o ausencia de geometr´ıas para decidir si la celda pertenece a un objeto o es parte del espacio vac´ıo.

El generador de matrices anisotrópicas es similar al anterior, toma como paráme- tros de entrada la difusión y la absorción. También agrega el uso del coeficiente de anisotrop´ıa para generar una matriz donde la dispersión de la luz no sea uniforme a todas las direcciones. As´ı la clase implementa el método descrito en la Sección 2.4.3. La clase TropicMatrixCreator implementa tanto el modelado de sólidos y vac´ıo sobre el vóxel. Determina la existencia o no de superficies dentro del vóxel y despacha la creación de distintas matrices según el caso. Esto permite crear matrices con distinto comportamiento para los sólidos y el aire.

Generaci´on de plano medio

El generador de matrices por plano medio requiere del vóxel con las superficies recortadas. Se optó por atrasar el recorte de superficies en la etapa de división de figuras en celdas ya que no siempre es utilizado. Es entonces el generador por plano medio el encargado de recortar las figuras cuando lo requiera. El algoritmo de line- clipping de Cohen-Sutherland es aplicado para el recorte.

El generador requiere de un vector que resuma la geometr´ıa existente dentro del vóxel. Se obtiene el área total de superficies dentro del vóxel mediante la suma de las superficies. Su origen y dirección están dados por el promedio de los vectores normales de cada triangulo, ponderado por la superficie de cada uno.

run(Cells) : Transformations setMatrix(Cell,Transformation) = 0 AnisotropicMatrixCreator setMatrix(Triangles,Transformation) IsotropicMatrixCreator setMatrix(Cell,Transformation) MeanSurfaceMatrixCreator setMatrix(Cell,Transformation) TropicMatrixCreator setMatrix(Cell,Transformation) AbstractCoefficientSetter loadVoxel(Cell *) = 0 getScattering() : float = 0 getAbsorption() : float = 0 getExtinction() : float = 0 getG() : float = 0 RGBCoefficientSetter loadVoxel(Cell *) getScattering() : float getAbsorption() : float getExtinction() : float getG() : float StaticCoefficientSetter loadVoxel(Cell *) getScattering() : float getAbsorption() : float getExtinction() : float getG() : float = 0

A partir del vector descriptor de la geometr´ıa y con la matriz de aire se genera la matriz de transformación con las fórmulas planteadas en la Sección 3.4.2.

Fuentes de luz

Las fuentes de luz son implementadas de acuerdo lo descrito en la Sección 2.4.1. El valor inicial para la dirección nula se establece en 1 y debe mantenerse constante. Esto se implementa con una regla de transformación para esta velocidad hacia si misma que mantenga constante la intensidad de iluminación inicial de la celda. Esto es, que la matriz tenga el valorθ00 = 1. Además, las reglas desde las otras direcciones

a hacia la anterior, debe evitar la transferencia, es decir, θi0 = 0 para 0< i <19.

La generaci´on de luz se logra estableciendo aθ0j los valores deseados de generaci´on

lum´ınica. En el caso de una fuente de iluminación isotrópica dicho valor es constante. Si en cambio, se requiere una luz direccional, se establecerán valores mayores a las direcciones correspondientes con la dirección de la luz. El resto de las direcciones seguirán representando el medio en el que se encuentre la fuente de luz.

4.2.3. Simulaci´on

Antes de iniciar la simulación, se asignan valores uniformes próximos al cero, de luz para todas las celdas. El proceso, descripto en la Sección 2.4.4, consta de iteraciones sobre el modelo. En cada una se ejecuta una colisión seguida de una de advección, como se ve en el pseudocódigo de la Figura 4.5.

La etapa de colisión realiza la multiplicación de los valores de la celda por la transformación correspondiente, simulando los efectos de absorción y difracción de la luz. Los cambios ocurren en cada celda de forma independiente.

En la etapa de advecci´on, las distintas celdas interact´uan con sus vecinas, trans- firiendo la luz de las distintas velocidades a las celdas vecinas correspondientes.

La cantidad de iteraciones depende de la cantidad de celdas. Se realizan N ∗ N +N iteraciones, para asegurar la correcta propagaci´on de las intensidades. Este modelo no tiene un punto de convergencia, ya que, las fuentes de luz impulsan un aumento constante de el volumen total de intensidad del modelo. La alternativa, es buscar la convergencia a trav´es de los valores generados por el cociente entre la

para c/ CELDA:

para c/ DIRECCI´ON:

VECINO = CALCULAR_VECINO(CELDA, DIRECCIÓN) VECINO[DIRECCIÓN] = CELDA[DIRECCIÓN]

Figura 4.5: Pseudocodigo del motor LBM.

intensidad actual de cada celda, y la intensidad total del modelo. Esta alternativa, no fue implementada por su alto costo computacional.

Aceleraci´on por placa gr´afica

La simulación es la fase con mayor procesamiento computacional. Dada que una de las caracter´ısticas del LBM es la capacidad de paralelismo gracias al bajo grado de dependencia de datos, se decidió analizar la aceleración del sistema mediante la reimplementación del motor LBM en lenguaje CUDA. Esto permite la ejecución sobre GPUs nVidia de forma paralela, con la técnolog´ıa descrita en la Sección 2.5.1. Las placas gráficas no comparten el mismo espacio de memoria que el procesador, por lo que todos los datos a utilizar deben ser copiados. Ciertos datos, como la cantidad de celdas, requeridos por el motor se mantienen constantes durante la ejecución de la simulación. Estos datos se almacenan en una memoria especifica para tal fin. Las matrices de transformación se mantienen constantes pero son almacenadas en la memoria de datos por su gran tamaño.

Se asignan dos espacios de memoria para almacenar los valores de las celdas. Cada iteraci´on utilizar´a de forma intercalada un espacio como fuente y otro como destino.

En una GPU CUDA, el paralelismo se logra separando operaciones en hilos con- currentes. LBM tiene una atomicidad bien definida, dada por cada celda, debido a su caracter´ıstica de autómata celular. Por estas razones, cada hilo encapsulará la evolución de una celda.

Hilos

Memoria

Figura 4.6: Acceso a memoria no alineado al bloque.

Hilos

Memoria

Figura 4.7: Acceso a memoria alineado al bloque.

ejecuta en un multiprocesador de la GPU. Los multiprocesadores contienen una ´

unica unidad de control que ejecuta las mismas instrucciones en paralelo de cada hilo que le corresponda.

Las instrucciones de acceso a memoria requieren que se carguen datos para cada hilo. Si todos los hilos de un mismo multiprocesador acceden a los datos correspondientes a un único bloque, la lectura será más rápida debido a la arquitectura del hardware. A este tipo de acceso, que se puede observar en la Figura 4.7, se le de- nomina alineado al bloque. El acceso a la memoria no alineado, como muestra la Figura 4.6, requiere un mayor tiempo para su realización.

Como los hilos corresponden a una celda, cada uno accederá al dato correspondiente a la misma. Al ser la instrucción concurrente respecto a los hilos, en cada paso todos accederán a una misma velocidad de la celda LBM que les corresponde. Por esto, hacer el acceso más eficiente requiere que los valores correspondientes a una velocidad sean contiguos. Para ello se re-estructuran los datos de forma de agrupar estos valores antes de ser copiados al dispositivo. Es decir, los datos de la funciónfCP U de transición (Sección 2.3.4) se ordenan según (x, y, z, v), pero en GPU

es conveniente reordenarlos a fGP U de la forma (v, x, y, z).

La ejecución se realiza en un único kernel, que es ejecutado en cada iteración. El kernel es ejecutado en la cantidad máxima de hilos posibles por bloque en la cantidad de bloques necesarios para cubrir la cantidad de celdas del modelo. Este trae a su memoria local los valores correspondientes a la celda. Estos valores son transformados a partir de las reglas de transformación. Finalmente, el valor de cada

Figura 4.8: Interfaz gráfica de configuración de la aplicación.

velocidad es almacenado en la celda vecina correspondiente.

Finalizada la ejecuci´on de la simulaci´on, los resultados se encuentran en el dispositivo. Se realiza una copia de los mismos hacia la memoria principal, y son reestruc- turados para recuperar el formato original, con el que trabaja el resto del sistema.

4.2.4. Interfaz Gr´afica

Para una fácil selección de los métodos a usar, se creó una interfaz gráfica para la aplicación usando Windows Forms. Se eligió esta tecnolog´ıa por su integración con Visual Studio y sus herramientas para la edición gráfica de formularios. La Figura 4.8 muestra la ventana de configuración. El formulario permite la selección de distintos métodos para cada etapa, y almacenar los datos intermedios.

4.2.5. Visualizaci´on

El motor LBM resulta en un mapa de intensidades por celda. Estos valores son utilizados para iluminar las figuras a visualizar.

La tecnolog´ıa utilizada para generar la imagen es OpenGL. Es elegida por ser una especificación estándar, y la amplia existencia de documentación sobre la misma, además de ser compatible con el lenguaje C++. A partir del mapa de intensidades se obtienen la intensidad de la luz para cada canal de la forma

R=F iguraR∗specˆ ∗k+CeldaR∗(1−k) G=F iguraG∗specˆ ∗k+CeldaG∗(1−k) B =F iguraB∗specˆ ∗k+CeldaB∗(1−k)

ˆ spec= h ~ F ig, ~Luzi |F ig~ ||Luz~ | (4.1) Donde:

R,G, y B son los colores resultantes de cada canal.

F iguraX es el color propio de la figura en el canal X.

F ig y Luz~ son los vectores normales de la figura y la luz respectivamente.

k es un coeficiente de proporcionalidad.

CeldaX es la intensidad de luz en el canalX correspondiente a la celda donde

se encuentre la figura.

La integración de los valores resultantes del Pipe con OpenGL se realiza alte- rando los colores de las figuras. Todos los valores de color están normalizados de 0 a 1. Se calcula el ángulo specˆ entre la normal de la superficie y la luz para co- nocer la intensidad de la iluminación especular. Cada canal de color de la figura es multiplicado por la luz especular. Los resultados anteriores y el de la celda son sumados para obtener la luz total. El valor total del color no debe ser mayor a 1 para continuar normalizado. Entonces la suma se realiza ponderando por constantes complementarias.

En la Figura 4.9 se muestra la ventana de la herramienta visualizando el resultado en 3 dimensiones con OpenGL.

Figura 4.9: Ventana WindowsForms con una imagen iluminada con el metodo pro- puesto y pintada en pantalla con OpenGL.

Resultados

En este cap´ıtulo se presentarán casos de pruebas con el objetivo de analizar el comportamiento de la simulación para un conjunto de situaciones y parámetros diversos. Algunos de ellos se compararán con otros modelos de iluminación y se renderizarán para proveer de un mayor entendimiento visual.

Finalmente, se realizarán comparaciones de eficiencia mediante la aceleración por placa gráfica en contraste con procesamiento lineal brindado por CPU. Se analizarán rendimientos para un rango de casos de pruebas de distintos tamaños.

Todos los casos de prueba se han realizado sobre un volumen cúbico y dividido uniformemente en celdas cúbicas. Los resultados expuestos sobre iluminación se ex- hiben en 2 dimensiones, utilizando un corte sobre el plano XY (plano horizontal) a menos que se especifique lo contrario. Los valores de iluminación se representan en una escala de grises, lo cual indica mayor valor de iluminación cuanto mayor cla- ridad, en escala logar´ıtmica. Los valores de iluminación son normalizados, es decir, los valores presentados son relativos a la intensidad de la fuente de luz que posee la intensidad máxima.

5.1. Luz en el vac´ıo

El primer experimento fue realizado para analizar el modelo sobre el vac´ıo. Este caso es el base al analizar el comportamiento de la luz en las simulaciones.

El caso consta de un espacio sin obst´aculos, donde los extremos dejan escapar

Figura 5.1: Gr´afico de intensidad de luz respecto a la distancia a la fuente en unidades de celdas del LBM. La misma disminuye con la inversa del cuadrado de la distancia.

la luz. La fuente de luz es ubicada en el centro del espacio. Para la simulación se utilizaron matrices isotrópicas sin absorción. Se esperó as´ı que la propagación de la luz sea uniforme en el espacio. La simulación itera hasta la convergencia de los valores lum´ınicos.

En mecánica ondulatoria, la ley de la inversa del cuadrado establece que para una onda, en este caso electromagnética, que se propaga desde una fuente puntual en todas direcciones por igual, la intensidad de la misma disminuye de acuerdo con el cuadrado de la distancia a la fuente de emisión. La Figura 5.1 muestra la intensidad de luz resultante desde una fuente de luz hacia el exterior en cualquier dirección. Se puede observar que el decaimiento de la luz obedece la ecuación de la ley anterior. La Figura 5.2 grafica una representación visual de la simulación.

5.1.1. Variaci´on de coeficientes

Como siguiente paso se procede a estudiar el comportamiento de la luz bajo distintos parámetros para el generador de matrices anisotrópicas. Aún sobre un espacio sin obstáculos y con una fuente de luz en el centro, se alteran los valores de difusión

Figura 5.2: Iluminaci´on ambiental en el vac´ıo con σa = 0,0 y g = 0 en escala lo-

gar´ıtmica con perdida absoluta en los bordes. Se muestra una fuente de luz en el centro del dominio y se puede observar el decaimiento de la iluminaci´on sobre los extremos.

Dada la relaci´on entre los coeficientes en (2.11), al disminuir σs aumenta σa

generando matrices con mayor absorción y evitando la propagación de luz. Por otro lado, el coeficienteg aporta cambios en la dirección en que la luz se propaga (Sección

In document Iluminación utilizando lattice Boltzmann (página 42-56)