94 Dichas características serán de vital importancia para el alineamiento horizontal/vertical y la

transformación homogénea en caso de que la síntesis de imágenes no diese lugar a la misma información. Este alineamiento será tratado posteriormente.

En este capítulo se tratarán los puntos 2 y 3, y en el siguiente los puntos 4, 5 y 6, puesto que el punto 1 (síntesis de las imágenes de ambos panoramas) fue el tema tratado en el capítulo anterior.

En primer lugar se debe tratar tres temas de vital importancia, definición, detección y descripción de un punto característico.

5.1. Definición de punto característico:

Uno de los aspectos más estudiados en aplicaciones relacionadas con la visión artificial es la

correspondencia entre dos imágenes. Este tipo de tareas es utilizado en un gran número de

aplicaciones, como por ejemplo el reconocimiento de objetos (señales de tráficos, matrículas o rostros, entre otros), patrones o seguimiento de objetos, entre otros.

Para establecer esa correspondencia, también llamada matching, se debe llevar a cabo la extracción y posterior descripción de puntos de interés.

Un punto de interés (puntos característico, keypoint o feature point) es aquel punto de una imagen que

tiene una posición bien definida y que puede ser detectado de forma robusta. Esto significa que un

punto de interés puede ser una esquina (en el que se especializa, por ejemplo, el detector de Harris), pero también puede ser un punto aislado de intensidad local máxima o mínima, final de una línea o aquel punto de la curva donde es localmente máximo.

5.2. Detección de puntos característicos:

La detección corresponde a la primera etapa del procesamiento de una imagen en la tarea de

correspondencia, que implica la individualización de puntos cuyas características ayudan en su conjunto a definir el objeto contenido en una imagen. Se pretende que los detectores sean eficientes

respecto de los recursos computacionales que utilizan. Esto influye directamente en la cantidad de cuadros por segundo (pixeles) se pueden procesar y en las potentes plataformas hardware sobre las cuales se deben implementar los procesos en caso de requerir tiempo real.

Esta fase es absolutamente necesaria en este TFG, probablemente la más importante (después de tener ya las imágenes sintéticas de iguales dimensiones y aparentemente igual información), puesto que la

evidencia en la que se basa el alineamiento entre imágenes, y de hecho concluir que la

correspondencia previa entre cada par de imágenes sintéticas es correcta, será mayor cuantos más

keypoints sean capaces de ser extraídos y relacionados.

La extracción de keypoints (o feature points) permite reducir la información con la que se trabaja, es

decir, en vez de comparar cada pixel correspondiente de ambas imágenes, sólo se comparan los puntos más característicos (esquinas pronunciadas, bordes, puntos máximos o mínimos locales de luminosidad, etc…) reduciendo el tiempo de cómputo. Esto es conocido como procesamiento sparce.

En general no existe una regla para saber qué tipos de puntos de interés hay que extraer, pero dependiendo del tipo de imagen conviene localizar unos u otros. Los puntos de interés más comunes

son las regiones de alta/baja luminosidad, bordes, esquinas (realmente la intersección de dos bordes).

Por ejemplo, en una imagen que presente mucha geometría (un edificio con un gran número de bordes y esquinas) convendrá usar el detector de esquinas de Harris, costoso computacionalmente, pero especializado en esta tarea.

95

5.2.1. Características de un buen detector de keypoints:

Un buen detector de keypoints debe tener la mayor parte o todas de las siguientes características:

1. Precisión: El detector debe localizar con exactitud el keypoint, tanto en escala como en

posición.

2. Repetibilidad: Cuantos más puntos de interés sean capaces de ser extraídos en ambas

imágenes, mejor. De hecho, la matriz calidad (localizada en la función Show_checked_alignment.m) es una extensión de este concepto. Es una matriz 3x3, siendo cada elemento una combinación entre distintas técnicas de extracción (HARRIS, SURF, SIFT) y distintos métodos de estimación de alineamiento tras el filtro MSAC (similarity, affine y projective), en cada elemento de la matriz se guardan el número de inliers:

Figura 5.2: Matriz de calidad del proceso

3. Eficiencia computacional: No debe consumir muchos recursos de la computadora.

4. Robustez: Si un par de keypoints son detectados entre dos imágenes, el proceso debe ser

robusto y ante una invarianza de cambios geométricos y/o iluminación, debería detectar también dicho par. Evidentemente esta robustez será menor/mayor en función del detector y también del tiempo computacional límite dotado.

5. Distintividad: El detector debe ser capaz de detectar entre distintos tipos de puntos

característicos, por ejemplo esquinas de puntos de alta luminosidad, etc…

No existe un único método para la detección de esquinas, bordes, etc Los principales están basados en la curvatura, el gradiente, los keypoints con modelo predefinidio, Scale-Space, imágenes binarias, etc

Este campo de la visión artificial es muy amplio (muchos descriptores) y complejo (procesos físico matemáticos no triviales para la elaboración y comprensión de estos métodos).

La mayoría de estos métodos son válidos para la detección de bordes, siendo probablemente un borde

(también llamado contorno) la principal característica a extraer de una imagen (puesto que realmente una esquina es la intersección de dos bordes). Estos métodos no son sensibles a cambios de intensidad

de la imagen, tal y como se demuestra en el paper 24/7 [8], donde comparan imágenes sintéticas (y se extraen características de todas) en distintos momentos del día. En este TFG en concreto estas técnicas no procederán porque todas las localizaciones de la base de datos se encuentran tomadas en horario diurno (con luz solar).

HARRIS SURF

96

In document Reconstrucción de mapas con detección de cambios a partir de Google Street View (página 95-97)