Principales dificultades y posibles mejoras

Capítulo 6: Conclusiones

6.2. Principales dificultades y posibles mejoras

Este proyecto, se ha diseñado para abordar el problema propuesto basándose en unos parámetros iniciales definidos (posición/orientación del sensor constante e iluminación natural). Las posibles mejoras de esta aplicación se basarían en mejorar situaciones que no se correspondan con estas especificaciones.

Uno de los aspectos más importantes a tener en cuenta es que , antes de poner en marcha el sistema, se deberá mantener la cabeza en una posición frontal durante unos segundos. Cuando se observe que los datos se estabilizan, se podrán realizar los diferentes movimientos, pero siempre se tomará como referencia la posición inicial. En caso de no realizar este primer contacto de la cámara con el conductor, los resultados no se corresponderán con la realidad, es decir, no se estarán captando de forma óptima los datos.

Un gran avance, sería que funcionara perfectamente con exceso de iluminación (gran cantidad de reflejos) o en ambientes oscuros en el interior del vehículo (por ejemplo, de noche o en túneles):

 Exceso de iluminación: Este caso ocurre sobre todo cuando los rayos del sol inciden directamente al sensor desde un lateral o desde el fondo del vehículo. Esto afecta en gran medida a las diferentes señales que detecta la cámara y supondría un obstáculo a la hora de analizar el entorno (Véase Figura 57). [101]

Este fenómeno también es debido a que Kinect capta la realidad mediante rayos infrarrojos, los cuales al distorsionarse o mezclarse con los rayos solares dificultan la correcta estimación de la posición de la cara. Este asunto es uno de los más difíciles de solucionar, puesto que es uno de los principales temas a investigar en la visión artificial actual.

 Visibilidad muy baja o nula en el interior del vehículo: El problema reside en que no capta correctamente la señal RGBA, por lo tanto, la correlación entre color y profundidad dificultaría la extracción de los datos. En casos con visibilidad baja, pero donde se aprecian el entorno y las facciones de la cara, el proyecto puede funcionar perfectamente, pero cuando se produce una visibilidad nula (Véase Figura 58), como puede ocurrir de noche en carreteras no iluminadas, este sistema no detecta ninguna cara.

Figura 58. Funcionamiento con visibilidad nula.

Para resolver este fenómeno, se puede pensar en crear por ejemplo un Modo nocturno, en el que se utilicen únicamente los datos de profundidad. Para ello, se podría llevar a cabo la detección facial con otras técnicas de reconocimiento de objetos, primeramente realizando un estudio estadístico (mediante clasificador Bayesiano, funciones discriminantes, etc) y finalmente un agrupamiento de datos (usando Algoritmo de distancias encadenadas, Algoritmo K-medias, Algoritmo ISODATA, etc). [11]

Otra limitación de este sensor es que únicamente capta correctamente el entorno en interiores, puesto que necesita que los rayos infrarrojos choquen contra las paredes o cristales para detectar la profundidad. Por este motivo, una simple ventanilla bajada en el coche produciría una distorsión de la señal. Esto se podría solucionar utilizando algún sistema de visión estéreo o cámara de tiempo de vuelo, a las que les afecta menos este problema y son compatibles con el algoritmo, pero el proyecto se encarecería puesto que estos equipos suponen una mayor inversión.

También, comentar que, en ocasiones puntuales, se puede observar la presencia de falsos positivos (detectar la cara donde no se encuentra) o de falsos negativos, (no percibir la cara cuando está siendo visualizada). Los primeros son los más comunes de encontrar, con buena visibilidad, al superar ciertos ángulos en los que los errores son mayores (Véase Tabla 3). En cuanto a los segundos, se dan con menor asiduidad, pero se suelen producir en condiciones de escasez o exceso de iluminación. En la siguiente imagen (Véase Figura 59), se puede observar un falso positivo. En este ejemplo, la cara aparece en el entorno y no la localiza don de realmente tendría que hacerlo debido a que confunde la oreja con la nariz y, por lo tanto, realiza mediciones erróneas al llegar a un determinado ángulo . Para una mayor comprensión, se facilita una gráfica (Véase Figura 60), donde se aprecia perfectamente lo que ocurre. Los datos de esta representación se pueden encontrar en el Anexo IV.

Tabla 3. Rango de funcionamiento.

Figura 59. Falso positivo en movimiento Yaw.

Movimiento Rango de funcionamiento*

Pitch Entre -25 y 25 grados Roll Entre -20 y 20 grados Yaw Entre -23 y 23 grados

Figura 60. Gráfica falso positivo en movimiento Yaw (Véase Anexo IV).

Otra posible novedad, puede ser monitorizar en el ordenador de a bordo la señal emitida por Kinect, para dar la posibilidad a cualquier usuario de ajustar la orientación del sensor en base a su estatura. La plataforma obtiene resultados fiables independientemente de la altura del conductor puesto que se ha probado a diferentes alturas, aunque solamente se hayan reflejado en este informe los datos extraídos en base a los parámetros iniciales.

La mejora que actualmente barajan los investigadores de la Universidad para este sistema es detectar el tiempo que permanecería el conductor con los ojos cerrados [3]. De esta forma, se podrá averiguar con mayor exactitud si el sujeto se encuentra dormido y durante cuánto tiempo para casos distracciones por somnolencia.

Para ajustar de mayor forma los datos a la vida real, se podrían acotar los ángulos con un máximo de 90º y un mínimo de -90º puesto que ninguna persona sería capaz de rotar más la cabeza. Por este motivo, todas mediciones que estén fuera de estos límites son considerados valores atípicos, es decir, que no son reales. Si se diera este problema, se podría solucionar obviando estos resultados y, en s u lugar, repetir los valores anteriores donde se captaba bien la orientación porque es preferible apreciar un valor más parecido a la realidad que un dato imposible de aparecer (dentro de unos límites). Este tipo de situaciones no ocurren en la aplicación para ROS Hydro, pero de esta forma se evitarían en el caso de que ocurrieran.

Para finalizar, cabe destacar que el ajuste de los offset en los ejes vertical y horizontal, utilizan la herramienta rqt_gui. Esta interfaz, permite modificar los valores de cada desfase con el fin de que la nube de puntos quede perfectamente

-30 -20 -10 0 10 20 30 Orie n ta ción (grad o s) Tiempo (s)

Falso positivo

alineada. Lo ideal, sería que esta función se hiciera de forma automática para no tener que modificar los datos cada vez que se inicia el sistema.

In document Diseño de aplicación basada en Kinect para vehículo inteligente (página 80-84)