2 NAVEGACIÓN BASADA EN VISIÓN Y LOCALIZACIÓN CON INCERTIDUMBRE
2.1 VISIÓN MONOCULAR PASIVA
2.1.1 ANÁLISIS DE LA ESCENA
En esta tesis, se utilizará visión monocular para captu r ar imágenes de la escena de ambiente de exterior realizan d o la calibración de la luz adecuad a en cada caso; dichas imágenes serán segmen ta d a s por color y posterior me n t e se realizará una clasificación probabilista con una corrección de infor mació n context u al para
reconocer cada elemen to en la escena.
La selección del uso de visión monocular con segmen tació n por color y navegación reactiva de esta tesis fue en general similar al trabajo de [Lorigo 97] del MIT pero utilizan d o diferen tes técnicas. En [Lorigo 97], realizaro n pruebas con el robot Pebbles III en distintos ambien tes del estilo de Marte para su futur a exploración autón o m a; median te visión monocular el robot evitaba obstáculos reactivamen t e, esto con base a la fusión de la informació n de tres méto d o s de segmen tación por detección de orillas, por color con el espacio RGB y por color en el espacio HSI a partir de imágenes de baja resolución.
Una parte impor ta n t e de los sistema s de visión es interpre ta r o reconocer cada uno de los objetos o elemen to s que se encuen tr a n en las imágenes totalmen te descon ocidas al inicio. Un sistem a de reconocimien to de imágenes comú n m e n t e se divide en tres fases: preprocesa mien t o, segmen tació n y clasificación [Jahne 00]. El prepr ocesa mie n t o y la segmen t ación forman parte de la visión de bajo nivel, y la clasificación es parte de la visión de alto nivel.
• El prepr oces a mien t o ayuda a filtrar la imagen original captu ra d a con técnicas de procesa mien t o de imágenes don de la entrad a del proceso es una imagen y la salida es otra imagen diferen te donde se cambiaro n algunas de las propied a d es de la primera; por ejemplo, el mejora mien t o de la calidad de la imagen, la compresión, el suavisamien t o de la imagen, y la extracción de características como contor n o s o esquinas.
• La segmen tació n de la imagen se refiere a la partición de una imagen en un conjun t o de regiones disjun ta s que la cubren; cada región debe ser unifor m e y homogénea con respecto a alguna característica, tal como color, textura, dimen sión, forma, etc. La entrad a de la segmen tació n es una imagen y la salida es un modelo o represen t ació n simbólica de las regiones que puede ser en forma de un árbol o de un grafo. El éxito de este proceso depen d e mucho de escoger la característica idónea o más efectiva para el caso en particular a resolver.
un tipo particular o clase previamen te definido como algún objeto o elemento de la escena, esto se realiza basado en las características o atribut o s que caracterizan a cada región (por ejemplo media, varian za).
El entendi mien t o de las imágenes en escenas de ambiente natu ral con vegetación es una tarea difícil debido a la gran variedad y complejida d de las imágenes; no existe una técnica universal para segmen t ar y clasificar ese tipo de imágenes. Las técnicas de segmen t ación de regiones por color y la clasificación probabilista han sido las más utilizad as para analizar las escenas natu rales de ambientes de exterior. De manera general, la meto d ología que se sigue en esta investigación está basada en este tipo de técnicas; sin embargo, el méto d o en particular utilizad o en ambas técnicas es diferen te a lo que se ha desarrollad o en el área y considera el uso de menos características para los cálculos de la segmen tación y clasificación permitién d o n o s implemen ta r un méto d o eficiente en cuanto al tiempo de procesa mien t o. Es impor tan t e realizar en muy poco tiemp o de procesa mien t o el análisis de la imagen debido a que así el robot tiene más tiemp o para ejecutar de manera eficiente las demás tareas como la navegación reactiva o deliberativa.
En todos los trabajo s en ambientes de exterior, la variación de iluminació n, las sombras y reflejos son problemas comu n es que se deben resolver mediante la segmen tación, clasificación e incluso añadir proceso s posteriores para corregir las regiones mal clasificadas. Como se explica en [Ohta 85], en escenas de exterior natu rales es muy útil considerar la informació n de color en el mome n t o de realizar la segmen t ación y la clasificación. Además de los trabajos previos en robótica, también existen trabajos en el área de visión por comp u t a d o r a que no son aplicados a robótica [Hild 93, Tsin 01, Dai 02, Pajares 02], sin embargo en ellos se analizan escenas de exterior no estructu r a d a s o semiestr u ct u r a d a s con vegetación utilizan d o también en su mayoría el espacio de color HSI o el RGB, y clasificación Bayesiana. Se puede destacar que ninguno de estos trabajos muestr a n tiempo s de procesa mien t o debido a que en los trabajos de visión por comp u t a d o r a no aplicados a robótica es más impor tan t e la mayor precisión de los resultad o s. Para tener una efectividad cercana al 100%, la meto d ología de
estos trabajos no siempre sería eficiente para los tiempo s de resp ues t a necesarios en trabajos actuales de robótica móvil.
En esta tesis se escogió el espacio de color I1, I2, I3 ya que al igual que en
[Murrieta 98, Parra 99, Murrieta 02a] dió mejores resultad o s que con los espacios de color RGB o HSI para la segmen t ación por color, y para la clasificación probabilista se escogió el uso de los Campo s Aleatorios de Markov explicado s en la siguiente sección. El espacio de color I1, I2, I3 fue inicialmen te definido por
[Ohta 85]. En los trabajos donde se ha usado en robótica [Murrieta 98, Murrieta 02a] han demos t r a d o que dicho espacio de color tiene características o medidas de color no correlaciona d a s estadís ticame n t e (ortogonales), es decir que son indepen dien te s de modera d o s cambios de intensida d, y son adecuad as en ambientes de exterior donde las condiciones de luz no son controla d a s. El espacio de color I1
, I2
, I3
está dado por el conju n t o de ecuaciones 2.1. Donde R, G y B son los valores del color rojo, verde y azul respectivamen te.
I1=RGB
3 ; I2=R−B; I3=
2 G−R−B
2 (2.1)