CAPÍTULO 2 ESTADO DEL ARTE DE LA REALIDAD AUMENTADA MOVIL
2.2 Tecnologías para el Desarrollo de Sistemas de Realidad Aumentada Móvil
2.2.3 Dispositivos y tecnologías de posicionamiento
Uno de los principales desafíos de un sistema de realidad aumentada está en lograr un buen registro de la posición del usuario en el entorno de forma continua, proporcionando tanto posición como orientación con alto grado de precisión [72]. Existen diferentes tecnologías para conseguir este posicionamiento, cada una de ellas orientada a entornos y condiciones de uso diferentes debido a sus ventajas y limitaciones. Una de las más utilizadas debido a su disponibilidad gratuita y su funcionamiento es ARToolKit [73], librería gráfica de posicionamiento basada en marcadores. La versión orientada a desarrolladores (ARToolKitPlus [74] [75]) permite el desarrollo de aplicaciones de realidad aumentada basada en marcadores sobre dispositivos móviles. Para entornos donde se requiere que el sistema no sea intrusivo se utilizan tecnologías como GPS, sensores inerciales [76], procesamiento de imágenes, sensores magnéticos o redes inalámbricas (WiFi) [77]. También se han desarrollado soluciones comerciales sobre tecnologías de infrarrojos [78], aunque éstas proporcionan una cobertura limitada y poco apta para entornos abiertos.
En el trabajo desarrollado por el doctorando durante el periodo de investigación de la fase de formación del programa de doctorado se presentaban las principales tecnologías de posicionamiento que se utilizan en aplicaciones de realidad aumentada. Cada una de ellas presenta una serie de puntos fuertes y también debilidades. La descripción de cada una de las tecnologías de forma independiente no permite tener una visión global de las posibilidades que se nos presentan a la hora de elegir entre las alternativas existentes en el mercado. Dentro del trabajo de investigación se realizó una taxonomía de las diferentes tecnologías en base a cinco criterios de selección: precisión, cobertura, grado de intrusión, ámbito de aplicación (interiores/exteriores) y coste. Una de las principales conclusiones extraídas del trabajo de investigación fue, que una sola tecnología, no resulta, hoy en día suficientemente robusta y adecuada como para satisfacer la diversidad de necesidades existentes en las aplicaciones de realidad aumentada, así pues el uso de soluciones híbridas parece ser la línea adecuada. Por otra parte, respecto a los criterios a tener en cuenta a la hora de elegir la tecnología adecuada para una aplicación
de realidad aumentada, en general todos los criterios presentados dentro de la taxonomía juegan un papel muy importante. No es posible priorizar unos frente a otros, de modo general y la decisión depende de las especificaciones del producto final [79].
A continuación se presentan algunas de las principales soluciones existentes para el seguimiento de la posición del usuario en aplicaciones de realidad aumentada. Las soluciones se presentan clasificadas por tecnologías, pero haciendo especial hincapié en la solución y no tanto en la tecnología. Se presenta al menos una solución por tecnología. En general existen varias soluciones que se ajustarán más o menos a cada aplicación dependiendo de las necesidades de usuario y las restricciones impuestas. Cabe destacar las siguientes:
¾ ARToolKitPlus: Librería de posicionamiento basado en visión con marcadores. Es una extensión de la librería ARToolKit, añade nuevas características pero son incompatibles. Igual que ARToolKit, ARToolKitPlus determina la posición y orientación de la cámara a partir del reconocimiento de unos marcadores o patrones presentes en la escena real.
El principal inconveniente de esta tecnología de posicionamiento es que requiere del uso de marcadores siendo necesaria la adaptación del entorno para el cálculo de la posición y orientación. Esta librería es de código abierto. A diferencia de su predecesora, ARToolKitPlus no esta orientada a usuarios noveles de realidad aumentada, ésta requiere larga experiencia en programación C++, no posee ejecutables binarios, y todas las funciones deben ser programadas por el usuario. Se han implementado versiones tanto para dispositivos tipo PDA como para Smartphone.
¾ Visión sin marcadores: El cálculo de la posición mediante tecnologías de procesado de imagen es uno de los más precisos y prometedores, especialmente cuando la detección de la posición y orientación de la cámara de hace en base a las características de la imagen, sin necesidad de incorporar marcadores o elementos adicionales en el entorno.
Uno de los principales inconvenientes de esta tecnología son los importantes requisitos de procesamiento necesarios para llevar a cabo el posicionamiento. Por el contrario, por tratarse de una técnica poco intrusiva resulta especialmente adecuada para aplicaciones de realidad aumentada móvil.
Algunos de los principales grupos de trabajo y proyectos más recientes se centran en esta tecnología para el posicionamiento. Los resultados de esta tecnología se basan en desarrollos y algoritmos de procesado que han sido desarrollados con propósito general y generalmente propietarios de cada grupo de investigación.
¾ Global Positioning System (GPS): Se trata de un sistema de posicionamiento universal, basado en satélites que emiten una señal y unos receptores que calculan su posición en función de la señal recibida. La precisión de este sistema depende mucho de la calidad de la señal recibida y de la calidad del receptor pero no suele ser posible obtener precisiones mayores a los varios metros. Una variante de este sistema es el DGPS o GPS diferencial. Este sistema se apoya en estaciones terrestres cuya posición es conocida y que permite aumentar la precisión del sistema global. En este caso la precisión se puede elevar hasta menos de 1 metro. El principal problema de este sistema diferencial es que no se trata de un sistema universal sino que únicamente funciona en determinadas áreas que poseen cobertura de este
servicio diferencial. No podemos olvidar que en ambos casos GPS o DGPS únicamente funciona en entornos abiertos.
Actualmente es sencillo encontrar un receptor GPS para dispositivo móvil (Portátil, PDA), incluso algunos de ellos lo incorporan de serie. Hoy en día son dispositivos de precio asequible, bajo consumo, compactos y ligeros de peso. Uno de los principales inconvenientes del uso de sistemas GPS para el cálculo de la posición y orientación es la escasa precisión de los resultados, es necesaria en cualquier caso la utilización de algoritmos que permitan mejorar la precisión de dichos resultados. Actualmente la Unión Europea esta en fase de lanzamiento de su propio sistema de posicionamiento por satélite, denominado GALILEO. Este sistema se define como sistema global de navegación por satélite, diseñado para usos civiles y está previsto su funcionamiento para los próximos años. El gran reto de este sistema es lograr una precisión en posicionamiento mayor de la que ofrece GPS, para ello emplearán una mayor potencia de señal y nuevos relojes de mayor precisión.
Si se incorpora una brújula digital a los receptores GPS se facilita el posicionamiento continuo del usuario especialmente en lo que hace referencia al seguimiento de la orientación de forma más precisa.
¾ Existen otras técnicas alternativas para el cálculo de la posición. Se trata de técnicas desarrolladas para otros propósitos pero que pueden ser adoptadas para el cálculo de la posición por sus características. Por ejemplo redes UMTS, concebidas para la comunicación telefónica móvil, o redes Wi-Fi, en este caso concebidas para la transmisión de datos dentro de un espacio acotado y representado físicamente por una serie de puntos de acceso distribuidos para definir el área de acción. Aunque se trata de escalas diferentes, en ambos casos se utiliza la información de la potencia de la señal recibida desde diferentes puntos de acceso para estimar la posición de un dispositivo dentro de un área determinada. Existen varios trabajos que confirman la validez de estas tecnologías para el propósito del cálculo de la posición [80]. Una interesante solución para navegación en interiores de edificios mediante Wi-Fi, es Ekahau [77]. El dispositivo móvil recibe las señales de los puntos de acceso, éste envía la información sobre intensidad de señal y punto de acceso del que se recibe al servidor. En base a esta información el servidor utiliza el algoritmo para determinar la posición del dispositivo móvil. La precisión puede llegar hasta 2 metros. Los resultados obtenidos con esta tecnología son muy sensibles a los cambios del entorno y no proporcionan orientación.
Las tecnologías GPS y Wi-Fi pueden ser utilizadas conjuntamente para el cálculo de la posición de los dispositivos. Siendo la primera más adecuada para entornos abiertos puesto que ya existe la infraestructura, y por el contrario la segunda se adapta mejor a los espacios cerrados por resultar inadecuada la primera de ellas y además existe hoy en día ya esta infraestructura en muchos edificios modernos. ¾ Sensores magnéticos. Una de las tecnologías para el posicionamiento más
utilizadas en las aplicaciones tradicionales son los sensores magnéticos. Utilizan una fuente estática que genera campos magnéticos de baja frecuencia y receptores colocados en el objeto móvil para poder detectar su movimiento. Para medir la posición y la orientación del usuario, el emisor debe estar compuesto de tres bobinas perpendiculares. En el receptor, los tres sensores miden las componentes del flujo magnético recibido debido al campo inducido. Sobre la base de estas medidas, el sistema determina la posición y la orientación del receptor con respecto al emisor. Se trata de un sistema de sensorización muy extendido, dado el bajo coste y peso.
En esta línea, Ascensión Technology Corporation [81] tiene una gama muy amplia de dispositivos de tracking orientados también al seguimiento de múltiples sensores a la vez. El más común es el Flock of Birds. Hay varias empresas que se dedican al desarrollo de este tipo de sensores. En cualquier caso, son soluciones orientadas al desarrollo de aplicaciones sobre PC y no sobre dispositivos móviles.
Figura 2-25 Flock of Birds
¾ Sensores inerciales. Los sistemas inerciales están compuestos por acelerómetros y giróscopos, ambos se utilizan para calcular el movimiento del usuario. El principio de funcionamiento de un sensor inercial se basa en la conservación de la posición y la orientación. La posición del usuario se calcula a partir de los movimientos obtenidos a lo largo del tiempo. Para el cálculo de la posición y orientación estos sistemas se basan en las leyes de Newton. Los sensores inerciales miden aceleraciones o tasas angulares, de modo que sus señales deben ser integradas en el tiempo para obtener la posición y la orientación. Los acelerómetros miden los vectores de aceleración lineal con respecto al marco de referencia inercial. Para restar la componente de aceleración debida a la gravedad, la orientación de los acelerómetros lineales debe estar determinada correctamente. Una integración temporal de las salidas de los giróscopos calcula los cambios de orientación. La integración de las señales y errores de los giróscopos provoca un crecimiento lineal del error de orientación. Técnicas de corrección, pueden incluir medidas de sensores magnéticos o brújulas, sin embargo las señales de las brújulas son especialmente ruidosas y están sujetas a errores inducidos por materiales ferrosos. Las correcciones basadas en sistemas de visión pueden generalizarse a un mayor rango de escenarios. Estos sistemas son ampliamente utilizados para aplicaciones en exteriores en combinación con otros sistemas de detección de posición. Principalmente son utilizados en sistemas enfocados al entretenimiento.
Algunos de los sistemas de posicionamiento inerciales proporcionan únicamente la orientación del usuario con un rango de 360º en los 3 grados de libertad posibles. Estos dispositivos resultan especialmente adecuados para el seguimiento del movimiento de cabeza del usuario. Cuando el sistema esta colocado en una posición fija estos sistemas permiten conocer la posición del usuario en orientación.
Los sistemas inerciales son ampliamente utilizados como elementos de posicionamiento en aplicaciones de realidad aumentada, aprovechando sus principales ventajas, sobre todo que no necesita de emisores. Además, se trata de sistemas no intrusivos puesto que no modifican el entorno de detección.
Sin embargo, presentan un inconveniente importante que es la baja precisión y la aparición de variaciones de la posición (derivas) después de un cierto tiempo de uso
que exige su recalibración. Ruido, errores de calibración y la gravedad terrestre provocan errores en las señales generadas por estos sistemas, el resultado son imprecisiones en los resultados obtenidos para posición y orientación. La posición se obtiene por doble integración de la aceleración lineal, así pues, el error acumulado en la imprecisión de la posición crece con el cuadrado del tiempo de retardo. La orientación se obtiene a partir de una integración simple, con lo que el error será linealmente proporcional con el tiempo.
El sistema de posicionamiento basado en sensores inerciales más extendido es el Inertial Cube de Intersense [76].
Figura 2-26 Inertial Cube de Intersense
¾ Infrarrojos. En estos sistemas los emisores y receptores están compuestos por un conjunto de proyectores de luz y cámaras, respectivamente. Los proyectores de luz emiten una luz infrarroja que es reflejada por los marcadores. La luz reflejada es vista por las cámaras, quienes graban la posición de los marcadores en referencia a la cámara. Basándose en esta información y en los datos de calibración de la cámara, las coordenadas de los marcadores son calculadas y de ellas, puede saberse el movimiento del usuario. Para poder calcular las coordenadas 3D de todos los marcadores, cada marcador debe ser visto al menos por dos cámaras simultáneamente. Si esta condición no se cumple, las coordenadas del marcador no pueden ser calculadas; se dice que el marcador esta oculto. Para solucionar el ocultamiento de los marcadores, la mayoría de los sistemas de captura de movimiento ópticos tienden a usar más cámaras a costa de hacer el hardware más caro. De todas maneras, esta tecnología esta ampliamente aceptada como la tecnología más adecuada para la captura de movimiento de personas. Diferentes compañías han desarrollado sistemas de captura de movimiento ópticos. Uno de los principales problemas que plantean las técnicas ópticas son que el ordenador servidor debe realizar una gran cantidad de cálculos y que no debe existir ninguna interferencia visual entre las cámaras y los emisores de luz.
La compañía Advanced Realtime Tracking GMBH [78] ha desarrollado interesantes soluciones de posicionamiento basado en infrarrojos. Un ejemplo es el sistema smARTrack1, consta de dos cámaras de infrarrojos unidas mediante una barra rígida. El sistema resulta especialmente adecuado para el seguimiento de la posición dentro de un entorno cerrado y de reducidas dimensiones.
Figura 2-27 smARTrack1 de ARTracking