Optimización del ﬂujo óptico usando programación genética multi-árbolOptical ﬂow optimization using multi-tree genetic programming

(1)

Superior de Ensenada, Baja California

MR

Maestr´ıa en Ciencias

en Ciencias de la Computaci ´

on

Optimizaci ´

on del flujo ´

optico usando programaci ´

on gen ´etica

multi- ´arbol

Tesis

para cubrir parcialmente los requisitos necesarios para obtener el grado de Maestro en Ciencias

Presenta:

H ´ector Cepeda Ju ´arez

(2)

H ´ector Cepeda Ju ´arez

y aprobada por el siguiente Comit ´e

Dr. Gustavo Olague Caballero

Codirector del Comit ´e

Dr. Pedro Gilberto L ´opez Mariscal

Codirector del Comit ´e

Dr. Ubaldo Ru´ız L ´opez

Dra. Mar´ıa del Carmen Maya Sanch ´ez

Dra. Carmen Guadalupe Paniagua Ch ´avez

Dr. Jes ´us Favela Vara

Coordinador del Programa de Posgrado en Ciencias de la Computaci ´on

Dra. Rufina Hern ´andez Mart´ınez Directora de Estudios de Posgrado

(3)

Resumen de la tesis que presentaH éctor Cepeda Ju árez como requisito parcial para la obten-ci ón del grado de Maestro en Cienobten-cias en Cienobten-cias de la Computaobten-ci ón

Optimizaci ón del flujo óptico usando programaci ón gen ética multi- árbol

Resumen aprobado por:

Codirector de Tesis

La visi ón por computadora es una rama de la inteligencia artificial, que tiene por objetivo mo-delar matem áticamente los procesos de percepci ón visual en los seres vivos y generar programas que permitan simular estas capacidades visuales en una computadora. La estimaci ón del flujo óptico es uno de los problemas en la visi ón por computadora que lleva estudiandose desde hace varias d écadas, se origina por el cambio en los patrones de la intensidad en la imagen debido al movimiento aparente de los objetos que se encuentran en la escena. ConsiderandoI(x, y, t)como la intensidad de la imagen en un punto(x, y)en un tiempot, el objetivo es estimar un vector(u, v)

para cada punto en la imagen, tal queI(x, y, t)yI(x+u, y+v, t+ 1)sean correspondientes. En este trabajo de tesis se describe una t écnica basada en la programaci ón gen ética, que es capaz de construir operadores de manera autom ática para optimizar el flujo óptico de una secuencia de im ágenes, con la finalidad de mejorar la precisi ón en la estimaci ón y as´ı obtener resultados com-petitivos comparado con m étodos propuestos por expertos. Para medir la precisi ón del flujo óptico obtenido, se emplea el conjunto de secuencias de im ágenes de la base de datos de Middlebury para flujo óptico.

(4)

Abstract of the thesis presented byH ´ector Cepeda Ju ´arez as a partial requirement to obtain the Master of Science degree in Master in Computer Science in Computer science.

Optical flow optimization using multi-tree genetic programming

Abstract approved by:

Thesis Co-Director

Computer vision is a branch of Artificial Intelligence with the aim of generating computer pro-grams that imitate the human visual process. Optical flow is a computer vision problem that origi-nates from the change of pattern intensities on the image due to the apparent motion of objects in the scene. We can defineI(x, y, t)as the intensity function of image at a point(x, y)at timet, the goal is estimate a vector(u, v)for each point in the image such thatI(x, y, t)andI(x+u, y+v, t+1)

are corresponding. This document describes a technique based on genetic programming which is able to construct automatically operators to optimize the optical flow of a sequence of images, in order to improve the precision in the estimation and thus obtaining competitive results compared with methods proposed by experts. In order to measure the precision of the optical flow, we use the set of image sequences from the Middlebury database for optical flow.

(5)

Dedicatoria

(6)

Agradecimientos

A mi familia, en especial a mis padres, que siempre me han impulsado a seguir adelante,

por creer en m´ı y ser parte fundamental en el cumplimiento de mis metas, por estar siempre

ah´ı d ´andome consejos, una llamada de atenci ´on cuando la merecia y unas palabras de aliento

cuando m ´as las he necesitado. Estar ´e eternamente agradecido con ustedes.

Agradezco a mis asesores, el Dr. Gustavo Olague y el Dr. Gilberto L ´opez por su paciencia y

por haberme guiado a la culminaci ´on de esta tesis, as´ı como a los miembros de mi comit ´e por sus

comentarios y aportes para este trabajo.

Gracias a mis compa ˜neros del posgrado y amigos Mariana, Juan, Selene, Jessica y Luis, por

su amistad y por haber hecho m ´as amena mi estad´ıa en estos a ˜nos de estudio.

A mis amigos de hace ya varios a ˜nos que se mantuvieron al pendiente de m´ı durante el tiempo

que pas ´e en la ciudad de Ensenada, en especial a Jonathan, N ´estor, Javier, Gloria y Araceli, que

de una u otra manera me han brindado su apoyo y buena vibra, se los agradezco.

Al Centro de Investigaci ´on Cient´ıfica y de Educaci ´on Superior de Ensenada.

Al Consejo Nacional de Ciencia y Tecnolog´ıa (CONACyT) por brindarme el apoyo econ ´omico

(7)

Tabla de contenido

P ´agina

Resumen en espa ˜nol . . . ii

Resumen en ingl ´es . . . iii

Dedicatoria . . . iv

Agradecimientos . . . v

Lista de figuras . . . vii

Lista de tablas . . . xi

1. Introducci ´on . . . . 1

1.1 Objetivo General . . . 1

1.2 Objetivos Espec´ıficos . . . 2

1.3 Organizaci ´on del documento . . . 2

2. Marco te ´orico . . . . 3

2.1 Introducci ´on . . . 3

2.2 Flujo ´Optico . . . 4

2.2.1 Clasificaci ´on de los m ´etodos . . . 8

2.2.2 M ´etodo de Horn & Schunck . . . 8

2.2.3 M ´etodo de Lucas & Kanade . . . 11

2.2.4 Flujo ´optico usando un esquema multi-resoluci ´on. . . 13

2.2.5 Representaci ´on visual del flujo ´optico . . . 16

2.3 C ´omputo evolutivo y flujo ´optico . . . 18

2.4 Medidas de evaluaci ón en la estimaci ón de flujo óptico. . . 19

3. Programaci ´on Gen ´etica . . . . 21

3.1 C ´omputo Evolutivo . . . 21

3.2 Conceptos b ´asicos de la programacion gen ´etica . . . 21

3.2.1 Funciones y terminales . . . 23

3.2.2 M étodos de inicializaci ón de la poblaci ón . . . 24

3.3 Aptitud y selecci ´on . . . 25

3.3.1 Operadores gen ´eticos . . . 25

4. Desarrollo de la propuesta . . . . 28

4.1 Funci ´on de transformaci ´on de imagen . . . 28

4.1.1 Mapeo hacia adelante . . . 29

4.1.2 Mapeo hacia atr ´as . . . 30

4.2 Descripci ´on del algoritmo propuesto . . . 31

4.2.1 Primera propuesta . . . 32

4.2.2 Segunda propuesta . . . 42

4.3 Implementaci ´on . . . 45

5. Experimentos y resultados . . . . 46

5.1 Experimentos realizados . . . 46

5.1.1 gpPLK . . . 50

5.1.2 gpPLKColor . . . 67

6. Conclusiones . . . . 88

6.1 Conclusiones . . . 88

6.2 Trabajo Futuro . . . 89

(8)

Lista de figuras

Figura P ´agina

1 Flujo ´optico al momento de un aterrizaje (Gibson, 1950) . . . 3

2 Flujo ´optico. Secuencia Yosemite . . . 4

3 Ejemplo de la restricci ´on de conservaci ´on de los Datos. . . 5

4 Discontinuidades en el movimiento dentro de un vecindario de p´ıxeles (Black,1992) 6 5 Problema de apertura (Mallot, 2000) . . . 7

6 Esquema Multi-resoluci ´on. . . 14

7 Representaci ´on del flujo por medio de vectores . . . 17

8 Representaci ´on del flujo por medio de c ´odigo de colores . . . 17

9 Representaci ´on gr ´afica de los errores AAE y EPE . . . 20

10 Diagrama de flujo de un algoritmo evolutivo . . . 22

11 Rama de un ´arbol . . . 23

12 Ejemplo del operador cruce . . . 26

13 Ejemplo del operador mutaci ´on . . . 27

14 Mapeo hacia adelante . . . 30

15 Mapeo hacia atr ´as . . . 31

16 Estructura de un individuo . . . 37

17 Cruce a nivel gen . . . 38

18 Cruce a nivel gen . . . 38

19 Cruce a nivel cromosoma . . . 39

20 Mutaci ´on a nivel cromosoma . . . 39

21 Secuencias evaluadas . . . 47

22 Evoluci ´on promedio de 30 ejecuciones del programa de GP para la secuencia Di-metrodon . . . 51

23 Evoluci ´on de la mejor ejecuci ´on para la secuencia Dimetrodon . . . 51

24 Frecuencia de uso de funciones para la secuencia Dimetrodon . . . 52

25 Flujo estimado para la secuencia Dimetrodon — AAE 11.2592 EPE 0.5514 . . . 52

26 Evoluci ón promedio de 30 ejecuciones del programa de GP para la secuencia Groove2 53 27 Evoluci ón de la mejor ejecuci ón para la secuencia Groove2 . . . 53

28 Frecuencia de uso de funciones para la secuencia Groove2 . . . 54

(9)

Figura P ´agina

30 Evoluci ´on promedio de 30 ejecuciones del programa de GP para la secuencia

Groo-ve3 . . . 55

31 Evoluci ´on de la mejor ejecuci ´on para la secuencia Groove3 . . . 55

32 Frecuencia de uso de funciones para la secuencia Groove2 . . . 56

33 Flujo estimado para la secuencia Groove3 — AAE 13.5088 EPE 1.4215 . . . 56

34 Evoluci ´on promedio de 30 ejecuciones del programa de GP para la secuencia Hy-drangea . . . 57

35 Evoluci ´on de la mejor ejecuci ´on para la secuencia Hydrangea . . . 57

36 Frecuencia de uso de funciones para la secuencia Hydrangea . . . 58

37 Flujo estimado para la secuencia Hydrangea — AAE 6.3062 EPE 0.5769 . . . 58

38 Evoluci ´on promedio de 30 ejecuciones del programa de GP para la secuencia Rub-berWhale . . . 59

39 Evoluci ´on de la mejor ejecuci ´on para la secuencia RubberWhale . . . 59

40 Frecuencia de uso de funciones para la secuencia RubberWhale . . . 60

41 Flujo estimado para la secuencia RubberWhale — AAE 11.1924 EPE 0.3565 . . . . 60

42 Evoluci ón promedio de 30 ejecuciones del programa de GP para la secuencia Urban2 61 43 Evoluci ón de la mejor ejecuci ón para la secuencia Urban2 . . . 61

44 Frecuencia de uso de funciones para la secuencia Urban2 . . . 62

45 Flujo estimado para la secuencia Urban2 — AAE 23.8622 EPE 5.4499 . . . 62

46 Evoluci ón promedio de 30 ejecuciones del programa de GP para la secuencia Urban3 63 47 Evoluci ón de la mejor ejecuci ón para la secuencia Urban3 . . . 63

48 Frecuencia de uso de funciones para la secuencia Urban2 . . . 64

49 Flujo estimado para la secuencia Urban3 — AAE 31.2206 EPE 5.0296 . . . 64

50 Evoluci ón promedio de 30 ejecuciones del programa de GP para la secuencia Venus 65 51 Evoluci ón de la mejor ejecuci ón para la secuencia Venus . . . 65

52 Frecuencia de uso de funciones para la secuencia Venus . . . 66

53 Flujo estimado para la secuencia Venus — AAE 19.0584 EPE 1.4211 . . . 66

54 Evoluci ´on promedio de 15 ejecuciones del programa de GP para la secuencia Di-metrodon . . . 68

55 Frecuencia de uso de funciones y terminales del operador de color en la secuencia Dimetrodon . . . 68

(10)

Figura P ´agina

57 Frecuencia de uso de funciones y terminales de la funci ´on de integraci ´on en la secuencia Dimetrodon . . . 69

58 Flujo estimado para la secuencia Dimetrodon— AAE 3.4191 EPE 0.1686 . . . 70 59 Evoluci ´on promedio de 15 ejecuciones del programa de GP para la secuencia Groove2 70

60 Frecuencia de uso de funciones y terminales del operador de color en la secuencia Groove2 . . . 71

61 Frecuencia de uso de funciones del operador de flujo en la secuencia Groove2 . . . 71 62 Frecuencia de uso de funciones y terminales de la funci ´on de integraci ´on en la

secuencia Groove2 . . . 72 63 Flujo estimado para la secuencia Dimetrodon— AAE 4.4269 EPE 0.30338 . . . 72

64 Evoluci ´on promedio de 15 ejecuciones del programa de GP para la secuencia Groove3 73 65 Frecuencia de uso de funciones y terminales del operador de color en la secuencia

Groove3 . . . 73 66 Frecuencia de uso de funciones del operador de flujo en la secuencia Groove3 . . . 74

67 Frecuencia de uso de funciones y terminales de la funci ´on de integraci ´on en la secuencia Groove3 . . . 74 68 Flujo estimado para la secuencia Groove3— AAE 11.579 EPE 1.2465 . . . 75

69 Evoluci ´on promedio de 15 ejecuciones del programa de GP para la secuencia Hy-drangea . . . 75

70 Frecuencia de uso de funciones y terminales del operador de color en la secuencia Hydrangea . . . 76

71 Frecuencia de uso de funciones del operador de flujo en la secuencia Hydrangea . 76 72 Frecuencia de uso de funciones y terminales de la funci ´on de integraci ´on en la

secuencia Hydrangea . . . 77 73 Flujo estimado para la secuencia Hydrangea— AAE 5.1464 EPE 0.46108 . . . 77

74 Evoluci ´on promedio de 15 ejecuciones del programa de GP para la secuencia Rub-berWhale . . . 78 75 Frecuencia de uso de funciones y terminales del operador de color en la secuencia

RubberWhale . . . 78 76 Frecuencia de uso de funciones del operador de flujo en la secuencia RubberWhale 79

77 Frecuencia de uso de funciones y terminales de la funci ´on de integraci ´on en la secuencia RubberWhale . . . 79

(11)

Figura P ´agina

80 Frecuencia de uso de funciones y terminales del operador de color en la secuencia Urban2 . . . 81

81 Frecuencia de uso de funciones del operador de flujo en la secuencia Urban2 . . . . 81 82 Frecuencia de uso de funciones y terminales de la funci ´on de integraci ´on en la

secuencia Urban2 . . . 82

83 Flujo estimado para la secuencia Urban2— AAE 23.5533 EPE 5.407 . . . 82

84 Evoluci ´on promedio de 15 ejecuciones del programa de GP para la secuencia Urban3 83 85 Frecuencia de uso de funciones y terminales del operador de color en la secuencia

Urban3 . . . 83

86 Frecuencia de uso de funciones del operador de flujo en la secuencia Urban3 . . . . 84 87 Frecuencia de uso de funciones y terminales de la funci ´on de integraci ´on en la

secuencia Urban3 . . . 84 88 Flujo estimado para la secuencia Urban3— AAE 26.1154 EPE 5.0262 . . . 85

89 Evoluci ´on promedio de 15 ejecuciones del programa de GP para la secuencia Venus 85 90 Frecuencia de uso de funciones y terminales del operador de color en la secuencia

Venus . . . 86 91 Frecuencia de uso de funciones del operador de flujo en la secuencia Venus . . . . 86

92 Frecuencia de uso de funciones y terminales de la funci ´on de integraci ´on en la secuencia Venus . . . 87

(12)

Lista de tablas

Tabla P ´agina

1 Funciones y terminales . . . 35

2 Funciones y terminales para la dimensi ´on de color . . . 43

3 Funciones y terminales para la correcci ´on de flujo . . . 43

4 Funciones y terminales para la funci ´on de integraci ´on de operadores . . . 43

5 Tabla comparativa — M étodos de estimaci ón de flujo óptico . . . 46

6 Tabla comparativa — resultados preliminares . . . 48

7 Evaluaci ´on de los mejores individuos obtenidos en todas las secuencias . . . 49

8 Tabla comparativa—resultados finales . . . 49

9 Parametros GP . . . 50

(13)

Cap´ıtulo 1.

Introducci ´

on

La visi ón por computadora es una rama de la inteligencia artificial, que tiene por objetivo mo-delar matem áticamente los procesos de percepci ón visual en los seres vivos y generar programas que permitan simular estas capacidades visuales en una computadora. La estimaci ón del flujo ópti-co es uno de los problemas que pertenece a la visi ón por ópti-computadora que m ás se ha estudiado en los ultimos a ños as´ı; nuevos m étodos se han introducido y algunos otros m ás se han mejorado. Dentro de las aplicaci ónes que tiene y no limitandos é a éstas podemos encontrar seguimiento de objetos, detecci ón de movimiento , segmentaci ón de objetos.

El flujo ´optico se puede definir como el campo de velocidad en 2D que se origina debido al movimiento aparente de los objetos dentro de una secuencia de im ´agenes. ConsiderandoI(x, y, t)

como la intensidad de la imagen en un punto(x, y)en un tiempot, el objetivo es estimar un vector de velocidad(u, v) para cada punto en la imagen, tal que I(x, y, t) y I(x+u, y+v, t+ 1)sean correspondientes.

Dentro de los m étodos que se encuentran en la literatura para realizar la estimaci ón del flujo óptico destaca el propuesto por (Horn, 1981), en el cual introdujo una restricci ón global para el campo de velocidad en la que se asume que el flujo var´ıa de manera suave. Este m étodo ha servido como base para otros m ás que se han venido desarrollando y perfeccionando a lo largo del tiempo y m ás adelante se abordar á con m ás detalle.

A pesar de la diversidad de los m étodos existentes y la precisi ón con la que estos estiman el flujo óptico, hoy en d´ıa siguen presentandose ciertas dificultades al momento de realizar la esti-maci ón, como lo son las discontinuidades de movimiento debido al solapamiento entre objetos, desplazamientos largos, cambios en la iluminaci ón de la escena as´ı como los costos computacio-nales, lo que lo hace un problema que sigue abierto para la propuesta de nuevos m étodos que realicen de manera m ás precisa y r ápida la estimaci ón de los vectores de flujo.

1.1. Objetivo General

(14)

precisi ón en la estimaci ón mejor a la que es obtenida por m étodos propuestos por expertos. Para medir el rendimiento de la estimaci ón se usar á el conjunto de secuencias de la base de datos de Middlebury para flujo óptico.

1.2. Objetivos Espec´ıficos

• Analizar algunos de los m étodos que realicen la estimaci ón del flujo óptico que se encuentren en la literatura.

• Proponer un m étodo para realizar la estimaci ón del flujo óptico bajo la estrategia de programa-ci ón gen ética.

• Realizar la implementaci ´on del m ´etodo en Matlab.

• Evaluar los resultados obtenidos con la implementaci ´on.

1.3. Organizaci ´on del documento

En el Cap´ıtulo 2 se revisa los conceptos de la estimaci ón del flujo óptico, se abordan los m étodos propuestos por Horn-Schunck as´ı como el de Lucas-Kanade. Tambi én se ven los tipos de representaci ón visual para el flujo óptico, as´ı como las m étricas para evaluar la precisi ón en su estimaci ón.

El Cap´ıtulo 3 trata sobre programaci ón gen ética, que es una t écnica de computo evolutivo usada en el desarrollo del presente trabajo de tesis.

El Cap´ıtulo 4 trata del m étodo propuesto para mejorar la precisi ón en la estimaci ón del flujo óptico. Se describen los detalles de la implementaci ón asi como algunas t écnicas de procesa-miento de im ágenes utilizadas.

(15)

Cap´ıtulo 2.

Marco te ´

orico

2.1. Introducci ´on

La estimaci ón del Flujo óptico es uno de los problemas en la visi ón por computadora que lleva estudiandose desde hace varias d écadas. El fen ómeno estudiado se origina por el cambio en los patrones de la intensidad en la imagen debido a el movimiento aparente de los objetos que se encuentran en la escena o bien del movimiento del observador.

Este t érmino fue introducido por primera vez por el psic ólogo James J. Gibson, mientras reali-zaba investigaci ón en psicolog´ıa de la aviaci ón durante la segunda guerra mundial. En su trabajo (Gibson, 1950) habla sobre informaci ón percibida por un observador y como esta es usada para guiar su movimiento dentro de su entorno, as´ı descubri ó que los cambios en lo que el deno-min ó como ”patrones de flujo óptico”, proveen de informaci ón al observador acerca de que tipo de movimiento se esta realizando.

Figura 1.Flujo ´optico al momento de un aterrizaje (Gibson, 1950)

(16)

corta distancia ya que su movimiento es r ´apido, mientras que para las flechas de menor tama ˜no es todo lo contrario es decir, son puntos que se encuentran a mayor distancia con respecto al observador y que aparentemente su movimiento es lento.

2.2. Flujo ´Optico

El flujo óptico es originado por el movimiento aparente de los objetos en una secuencia de im ágenes. Se defineI(x, y, t)como una funci ón de la intensidad de la imagen en un punto(x, y)

en un tiempot. Cuando este punto se mueve a lo largo de la secuencia, existe un vectorv que describe su desplazamiento tanto horizontal como vertical. El objetivo es estimar un vector de velocidad(u, v)para cada punto en la imagen, tal queI(x, y, t)yI(x+u, y+v, t+ 1)sean corres-pondientes.

Entre las aplicaciones que tiene, por mencionar algunas podemos encontrar seguimiento de objetos, detecci ´on de movimiento, segmentaci ´on de objetos en base a movimiento.

Figura 2.Flujo ´optico. Secuencia Yosemite

(17)

los objetos dentro de la escena pero los valores de la intensidad deben permanecer constantes.

I(x+u, y+v, t+ 1) =I(x, y, t) (1)

Figura 3.Ejemplo de la restricci ´on de conservaci ´on de los Datos.

Esto es que la intensidad en la imagen en un punto(x, y) en un tiempo t, es la misma para la imagen en un instantet+ 1, en donde el punto(x, y)ha tenido un desplazamientou en el eje horizontal y un desplazamientoven el vertical. En la pr áctica esta restricci ón puede ser infringida al existir cambios en la iluminaci ón de la escena o simplemente por ruido que pudiera generar el sensor.

Asumiendo que esta restricci ´on se cumple para todos los pixeles en la imagen, se puede formular una funci ´on objetivo a minimizar de la siguiente forma:

ED(u,v) = X

S

(I(x+u, y+v, t+ 1)−I(x, y, t))2 (2)

en dondeED es una suma que considera todos los p´ıxeles de la imagen y es una funci ´on de los

vectores de flujouyvque corresponden a los desplazamientos horizontales y verticales.

Otra suposici ón que se hace con respecto al flujo dice que puntos vecinos en una regi ón de la imagen pertenecen a un mismo objeto ó superficie y por lo tanto se espera que el flujo varie de manera suave.

Up=Un n∈G(p) (3)

(18)

Esta restricci ´on en ocasiones tambi ´en es violada debido a las discontinuidades que pueden presentarse en el movimiento de los objetos, como al existir solapamiento entre ellos y considerar que un conjunto de puntos pertenecen a un mismo objeto cuando en realidad podria pertenecer a otro y tener un movimiento completamente diferente.

Figura 4.Discontinuidades en el movimiento dentro de un vecindario de p´ıxeles (Black,1992)

De manera formal esta restricci ´on puede ser escrita como:

ES(u,v) = X

n∈G(s)

(us−un)2+ X

n∈G(s)

(vs−vn)2 (4)

Considerando ambas restricciones tenemos una funci ´on de minimizacion de energia:

E(u,v) =ED(u,v) +λES(u,v) (5)

De manera desarrollada

E(u,v) =X S

(I(x+u, y+v, t+ 1)−I(x, y, t))2

+λ

X

n∈G(s)

(us−un)2+ X

n∈G(s)

(vs−vn)2

(6)

(19)

utiliza una aproximaci ´on por serie de Taylor.

ED(u,v) = X

S

(I(x+u, y+v, t+ 1)−I(x, y, t))2

dx=u, dy=v, dt= 1

I(x, y, t) +dx ∂

∂xI(x, y, t) +dy ∂

∂yI(x, y, t) +dt ∂

∂tI(x, y, t)−I(x, y, t) = 0

Simplificando:

u ∂

∂xI(x, y, t) +v ∂

∂yI(x, y, t) + ∂

∂tI(x, y, t) = 0

La ecuaci ´on anterior puede reescribirse como:

Ixu+Iyv+It= 0 (7)

o bien

∇I·~v=−It

en donde u, v son los vectores de desplazamiento horizontal y vertical en un punto en la ima-gen.Ix, Iy y It corresponde a las derivadas parciales de la intensidad de la imagen enx, y y t

respectivamente. A esta ecuaci ón se le conoce como la ecuaci ón de restricci ón de flujo óptico.

Evaluando la Ecuaci ón 7 en un solo punto en la imagen, tenemos una ecuaci ón con dos in-cognitas (u, v), por lo que es necesario contar con m ás informaci ón. Esto da origen a lo que se conoce como ”Problema de apertura”, en el cual al observar el movimiento en un punto de un borde a trav és de una apertura, el movimiento que se tiene es ambiguo y solo se puede recuperar el movimiento que es perpendicular a la orientaci ón de dicho borde.

(20)

2.2.1. Clasificaci ´on de los m ´etodos

Los m étodos que existen dentro de la literatura para la estimaci ón del flujo óptico pueden ser clasificados de acuerdo a (Barron, 1994) de la siguiente manera:

• M ´etodos Diferenciales.

En ellos, se calcula el desplazamiento que tienen los p´ıxeles usando derivadas espaciotem-porales de las intensidades de la imagen. Uno de los m étodos m ás representativos de esta clasificaci ón es el propuesto por (Horn, 1981), el cual se abordar á m ás adelante.

• M ´etodos basados en la correlaci ´on.

En este tipo de m étodos se realiza la busqueda de correspondencia utilizando peque ñas ventanas o patrones alrededor de cada p´ıxel que componen la imagen, con la finalidad de maximizar alguna medida de similaridad. Algunos m étodos que caben dentro de esta clasifi-caci ón son los propuestos por Kalivas (1991), Kories (1986), Sutton (1983), Little (1988), por mencionar algunos.

• M ´etodos basados en la Frecuencia.

Utilizan la transformada de Fourier para calcular el flujo óptico a trav és del dominio de la frecuencia. Algunos de los trabajos que destacan en esta clasificaci ón son los de Watson (1985), Adelson (1985), Fleet (1990), Heeger (1988).

2.2.2. M ´etodo de Horn & Schunck

Uno los primeros trabajos en formalizar un m étodo computacional para determinar el flujo óptico entre un par de im ágenes fue el propuesto por (Horn, 1981). En el parten de la formulaci ón cl ásica de la funci ón objetivo del flujo óptico y proponen un m étodo para optimizarla.

E(u,v) =X S

(Ixu+Iyv+It)2+λ X

n∈G(s)

(us−un)2+ (vs−vn)2

Para aproximar las derivadas parciales de la intensidad de la imagen (Ix, Iy, It), se utilizan

(21)

kcorresponde al tiempo.

Ix≈ 1 4

Ii,j+1,k−Ii,j,k+Ii+1,j+1,k−Ii+1,j,k+

Ii,j+1,k+1−Ii,j,k+1+Ii+1,j+1,k+1−Ii+1,j,k+1

Iy ≈ 1 4

Ii+1,j,k−Ii,j,k+Ii+1,j+1,k−Ii,j+1,k+

Ii+1,j,k+1−Ii,j,k+1+Ii+1,j+1,k+1−Ii,j+1,k+1

It≈ 1 4

Ii,j,k+1−Ii,j,k+Ii+1,j,k+1−Ii+1,j,k+

Ii,j+1,k+1−Ii,j+1,k+Ii+1,j+1,k+1−Ii+1,j+1,k

(8)

Acorde al trabajo de Horn-Schunck, una manera de expresar la restricci ´on de suavidad de la Ecuaci ´on (4), es minimizando el cuadrado de la magnitud del gradiente de los vectores de flujo.

∂u ∂x 2 + ∂u ∂y 2 y ∂v ∂x 2 + ∂v ∂y 2 (9) ´

O tambi ´en como la suma de los cuadrados del Laplaciano de las componentes enxyydel flujo, que son definidos como:

∇2_u₌ ∂2u

∂x2 +

∂2u

∂y2 y ∇

2_v₌ ∂2v

∂x2 +

∂2v

∂y2 (10)

Para realizar la aproximaci ´on del Laplaciano deuyv:

(22)

Dondeuyv, son los promedios deuyvdentro de un vecindario y estan definidos como:

ui,j,k = 1 6

ui−1,j,k+ui,j+1,k+ui+1,j,k+ui,j−1,k +

1 12

ui−1,j−1,k+ui−1,j+1,k+ui+1,j+1,k+ui+1,j−1,k

vi,j,k = 1 6

vi−1,j,k+vi,j+1,k+vi+1,j,k+vi,j−1,k +

1 12

vi−1,j−1,k+vi−1,j+1,k+vi+1,j+1,k+vi+1,j−1,k

(11)

Para realizar la estimaci ón del flujo óptico, Horn-Schunck propone un m étodo iterativo por medio del m étodoGauss-Seidel.

un+1 = u n₋_I

x[Ixun+Iyvn+It] (α2₊_I2

x+Iy2)

vn+1= v

n₋_I_x[_I

xun+Iyvn+It] (α2₊_I2

x+Iy2)

(12)

donde el super´ındicendenota en este caso el n ´umero de iteraci ´on,Ix, Iy y Itson las

(23)

Algoritmo 1M ´etodo de Horn-Schunck

Descripci ón: Realiza la estimaci ón del flujo óptico entre dos im ágenes mediante el m étodo de Horn-Schunck.

Entrada:

• Im1, Im2: Dos im ´agenes subsecuentes en escala de grises.

• α: Par ´ametro que indica la influencia de la restricci ´on de suavidad.

• nIter: N ´umero de iteraci ´ones.

Variables:

• u, v: Componentes de flujo ´optico en direcci ´onx, yrespectivamente.

• Ix, Iy, It: Derivadas parciales de la intensidad de la imagen con respecto ax, y, t. • u y v: Promedios deu y v dentro de un vecindario.

• n: Contador de iteraci ´ones.

Salida:(u, v)Componentes del flujo ´optico para la secuencia de entrada.

Inicio

1: u←0

2: v←0

3: n←0

4: Ix, Iy, It←calcular mediante (8)→Im1, Im2

5: whilen < nIterdo

6: u, v←Calculau, vmediante (11)

7: u, v←Calculau, vmediante (12)

8: n←n+ 1

9: end while

10: return[u, v]

2.2.3. M ´etodo de Lucas & Kanade

Otro de los m étodos cl ásicos para realizar la estimaci ón del flujo óptico es el que fue propuesto por (Lucas, 1981). Este parte de que la Ecuaci ón (7) se cumple para todos los pixeles dentro de un vecindario de tama ño n que tiene como centro un pixel p, de tal forma que se resuelve el sistema de ecuaciones resultantes para dicho vecindario y el vector resultante v se asigna a el puntop.

Para un vecindario de tama ˜nonse tendr´ıa un sistema de ecuaciones de la siguiente manera:

Ix1u + Iy1v = −It1

Ix2u + Iy2v = −It2

.. .

(24)

en dondeIxi, Iyi y Iti, corresponden a las derivadas parciales de la intensidad con

respec-to a x, y, t respectivamente evaluadas en el punto i de la imagen. Como podemos observar se tiene un sistema de ecuaciones sobredeterminado, ya que el n úmero de ecuaciones sobrepasa al n úmero de inc ógnitas. Reescribiendo el sistema de ecuaciones de manera matricial de la forma

Av=b:

A=        

Ix1 Iy1

Ix2 Iy2

.. . ...

Ixn Iyn        

, v=



 u

v 

, b=

       

−It1

−It2

.. . −Itn

       

El vectorvse obtiene de la siguiente manera:

Av=b

ATAv=ATb

v= (ATA)−1ATb

Donde:

ATA= 

 Pn

i=1Ixi2

Pn

i=1IxiIyi Pn

i=1IxiIyi

Pn i=1Iyi2



 −1

ATb= 

 Pn

i=1IxiIti Pn

i=1IyiIti





Para dar soluci ´on a la ecuaci ´onv = (ATA)−1_AT_b _{, la matriz}_AT_A _{debe de ser invertible. En la}

(25)

Algoritmo 2M ´etodo de Lucas-Kanade

Descripci ón: Realiza la estimaci ón del flujo óptico entre dos im ágenes mediante el m étodo de Lucas-Kanade.

Entrada:

• Im1, Im2 : Dos im ´agenes subsecuentes en escala de grises.

• w : N ´umero entero que indica el tama ˜no del vecindario.

Variables:

• u, v: Arreglos bidimensionales que contendr án las componentes de flujo óptico en direcci ón

x, yrespectivamente.

• Ix, Iy, It: Derivadas parciales de la intensidad de la imagen con respecto ax, y, t.

• Ixw, Iyw, Itw : Arreglos para las derivadas parciales de la intensidad de la imagen con

res-pecto ax, y, tdentro de un vecindario.

• i, j: Contadores.

• A, b, uv : Arreglos.

Inicio

1: u, v←Im1.size

2: w←round(w/2)

3: i, j ←0

4: Ix, Iy, It←calcular mediante (8)→Im1, Im2

5: for i=w+ 1toIm1.rows−wstep1do

6: for j=w+ 1toIm1.cols−wstep1do

7: Ixw ←Ix(i−w:i+w, j−w:j+w)

8: Iyw←Iy(i−w:i+w, j−w:j+w)

9: Itw←It(i−w:i+w, j−w:j+w)

10: b← −Itw

11: A←[IxwIyw]

12: uv ←pseudoInv(A)∗b

13: u(i, j)←uv[1]

14: v(i, j)←uv[2]

15: end for

16: end for

2.2.4. Flujo ´optico usando un esquema multi-resoluci ´on.

(26)

Para tratar con este problema se han implementado algunas estrategias como lo es la esti-maci ón de flujo óptico sobre un esquema piramidal. En este esquema, se contruye una piramide en donde la base corresponde a las im ágenes de la secuencia en su dimensi ón original. Los ni-veles superiores se conforman de una versi ón dimensionalmente reducida dado cierto factor de re-escalamiento.

La estimaci ón del flujo óptico se comienza en el nivel superior y consiste en un proceso ite-rativo proyectando dicha estimaci ón al siguiente nivel realizando el correspondiente cambio de resoluci ón hasta llegar a la base de la piramide, en donde se obtendr´ıa una estimaci ón del flujo con las dimensiones originales para la secuencia de entrada.

Figura 6.Esquema Multi-resoluci ´on.

Este esquema puede ser aplicado a m étodos para estimar el flujo óptico como el del Horn-Schunck, con la finalidad de obtener una estimaci ón precisa.

Algoritmo 3Obtener n ´umero de niveles

Descripci ón: Devuelve el n úmero de niveles que tendr á la pir ámide considerando las dimen-siones de la secuencia de entrada, asegurandos é que la dimensi ón final sea divisible entre

2n Entrada:

• Im: Marco perteneciente a la secuencia.

Variables:

• nLvl : N ´umero de niveles para la pir ´amide.

• i, j, n: Contadores.

Salida:(u, v)N ´umero de niveles para la pir ´amide.

(27)

1: i, j ←1

2: n←0

3: while1do

4: n←2i

5: ifIm.cols%n== 0then

6: i←i+ 1

7: else

8: break

9: end if

10: end while

11: n←0

12: while1do

13: n←2j

14: ifIm.rows%n== 0then

15: j ←j+ 1

16: else

17: break

18: end if

19: end while

20: ifi < j then

21: nLvl←i

22: else

23: nLvl←j

24: end if

25: returnnLvl

Algoritmo 4Genera pir ´amide

Descripci ´on: Genera esquema piramidal con la secuencia de entrada

Entrada:

• nLvl : N ´umero de niveles para la piramide.

Variables:

• Im1p, Im2p : Dos arreglos, que representan cada marco de la secuencia de entrada en el esquema piramidal.

• i, n: Contadores.

Salida:Im1p, Im2p Inicio

1: n←1

2: whilen < nLvldo

3: Imp1[n]←resize(Im1)∗0.5

4: Imp2[n]←resize(Im2)∗0.5

5: n←n+ 1

6: end while

7: ImgP[1]←Im1p

8: ImgP[2]←Im2p

(28)

Algoritmo 5M ´etodo de Horn-Schunck con esquema piramidal

Descripci ón: Realiza la estimaci ón del Flujo Óptico entre dos im ágenes mediante el m étodo de Horn-Schunck usando un esquema multiresoluci ón.

Entrada:

• a: Par ´ametro que indica la influencia de la restricci ´on de suavidad.

• nIter: N ´umero de iteraciones.

Variables:

• u, v: Componentes de flujo ´optico en direcci ´onx, yrespectivamente.

• uP rev, vP rev: Componentes de flujo óptico en direcci ónx, yrespectivamente obtenidos en el nivel previo en la pir ámide.

• nLvl : N ´umero de niveles para la pir ´amide.

• ImgP : Arreglo que contiene la secuencia en el esquema piramidal.

• i: Contador.

Inicio

1: nLvl ←Algoritmo 3(Im1)

2: ImgP ←Algoritmo 4(Im1, Img2, nLvl)

3: [u, v]←Algoritmo1(ImgP[1, nLvl], ImgP[2, nLvl], nIter, a)

4: i←nLvl−1

5: whilei >0do

6: u←resize(u)∗2

7: v←resize(v)∗2

8: [uP rev, vP rev]←Algoritmo1(ImgP[1, i], ImgP[2, i], nIter, a)

9: [u, v] = [u, v] + [uP rev, vP rev]

10: i←i−1

11: end while 12: return[u, v]

2.2.5. Representaci ´on visual del flujo ´optico

(29)

Figura 7.Representaci ´on del flujo por medio de vectores

Otro tipo de visualizaci ón es por medio de un c ódigo de colores, en donde la tonalidad indica la direcci ón y la saturaci ón la magnitud del vector de flujo en ese punto de la imagen. En la Figura 8 puede observarse este tipo de visualizaci ón para el flujo óptico estimado en la secuencia Dimetrodon.

(30)

2.3. C ´omputo evolutivo y flujo ´optico

En la literatura se han abordado problemas de visi ón por computadora utilizando t écnicas de c ómputo evolutivo para resolverlos. M étodos para la estimaci ón de movimiento se pueden encon-trar en trabajos propuestos por Li (1999), Gong (2002) y Zavala-Romero (2011) por mencionar algunos.

Un ejemplo de c ómputo evolutivo y flujo óptico es el m étodo propuesto por (Tagliasacchi, 2006). Éste m étodo consta principalmente de dos etapas que se describen a continuaci ón:

• En la primera etapa se realiza una segmentaci ón de la im ágen agrupando aquellos p´ıxeles cuyos vecinos compartan valores similares de intesidad, ya que se asume que el flujo varia de manera suave y que p´ıxeles correspondientes a una misma regi ón espacial pose én un desplazamiento similar.

• Despu és mediante un algoritmo gen ético, se buscan seis par ámetros para un modelo de mo-vimiento af´ın para cada uno de los puntos dentro de las regiones obtenidas en la fase de segmentaci ón.

Una vez que los par ´ametros son conocidos, las componentes del flujo para cualquier puntox,y

estan dados por:

vx(xi, yi) =a1+a3

xi Cx

+a5

yi Cy

vy(xi, yi) =a2+a4

xi Cx

+a6

yi Cy

En dondevx(xi, yi) yvy(xi, yi) corresponden a las componentes del flujo en la direcci ´on de x, y

respectivamente. El vectora =(a1, a2, a3, a4, a5, a6) contiene los par ´ametros del modelo de

mo-vimiento af´ın y Cx y Cy son las coordenadas de los centroides de cada una de las regiones

segmentadas.

La funci ´on objetivo consiste en encontrar el vectoraque minimize el promedio de la diferencia entre los niveles de intensidad del marco actual y el marco de referencia siguiendo la trayectoria descrita por el flujo ´optico calculado.

a=min 1

MΣ

M

(31)

En dondeI(x, y, t) es la funci ´on de intensidad de la im ´agen en un puntox, yen el tiempo ty

M es el total de p´ıxeles correspondientes a una regi ´on

´

Este m étodo reporta un error ángular promedio de 12.13° en la estimaci ón del flujo óptico para la secuencia Yosemite, que corresponde al conjunto de prueba de la base de datos de Middlebury.

Los Algoritmos Evolutivos son ´utiles cuando se requiere resolver un problema cuyo espacio

de soluciones sea muy grande, si este se delimita de manera razonable es posible encontrar soluciones que con los m étodos tradicionales normalmente no se encontrarian. En el cap´ıtulo siguiente se tratan conceptos de laProgramaci ón Gen ética (Koza, 1992), sobre la cual se basa la estrategia empleada en este trabajo.

2.4. Medidas de evaluaci ón en la estimaci ón de flujo óptico.

Para el proceso de evaluaci ón de resultados en este trabajo se utilizar á el conjunto de se-cuencia de im ágenes de Middlebury para flujo óptico. Esta base de datos consta de un conjunto de entrenamiento y otro de prueba cada uno de doce secuencias disponibles tanto en escala de grises como a color, en donde para ocho de ellas del conjunto de entrenamiento se encuentra disponible los valores de referencia del flujo óptico (ground-truth).

En esta base de datos se reportan principalmente dos medidas de precisi ´on, originalmente propuestas por (Barron, 1994) que son:

• Error de punto final (End-Point Error), que es una distancia Euclidiana:

EP E= 1

N N X

i=1

q

(ui−ugti )2+ (vi−vigt)2 (13)

• Error angular promedio (Average Angular error), que es el ´angulo formado entre los vectores estimados y los vectores de referencia:

AAE= 1

N N X

i=1

arc cos

uiugt_i +vivgt_i q

u2_i +v_i2+ 1 q

u2_i,gt+v2_i,gt+ 1

(32)

donde N es el total de p´ıxeles en la imagen,u, vson los vectores de desplazamiento para el p´ıxeli del flujo estimado yugt, vgt el de referencia (ground-truth).

(33)

Cap´ıtulo 3.

Programaci ´

on Gen ´etica

3.1. C ´omputo Evolutivo

El C ómputo Evolutivo (EC, del ingl és Evolutionary Computing) es un área de la inteligencia ar-tificial, la cual est á inspirada en la teor´ıa de la evoluci ón presentada por Charles Robert Darwin en ”El origen de las especies” (Darwin, 1859), que explica el proceso de adaptaci ón de las especies por medio de la selecci ón natural, donde se favorecen a aquellos individuos que se adaptan con mayor facilidad a su entorno y por consecuencia ser án los que sobrevivir án.

Esta t écnica bio-inspirada provee de una metodolog´ıa para resolver problemas de optimizaci ón de manera autom ática, siguiendo una estrategia de busqueda guiada utilizando un proceso de prueba y error que se basa en el paradigma de la evoluci ón artificial.

Dentro de la literatura se destacan cuatro subramas en computo evolutivo que son:

• Algoritmos Gen ´eticos, propuesto por (Holland, 1975).

• Estrateg´ıas Evolutivas (Rechenberg, 1973), (Schwefel, 1995).

• Programaci ´on Evolutiva, (Fogel, 1966).

• Programaci ´on Gen ´etica, propuesto por (Koza, 1992).

En el presente trabajo se utiliz ó la metodolog´ıa presentada por Koza (1992), que se conoce como programaci ón gen ética, la cual se aborda con m ás detalle en las siguientes secciones.

3.2. Conceptos b ´asicos de la programacion gen ´etica

(34)

Figura 10.Diagrama de flujo de un algoritmo evolutivo

En cuanto a la estructura de un programa de GP, podemos decir que es muy similar al resto de t écnicas de EC pero se distingue por la forma de representar las soluciones, ya que en un pro-grama de GP los individuos es decir, las posibles soluciones al problema son codificados usando una estructura de árbol. Cada individuo se contruye en base a dos conjuntos finitos, los nodos internos pertenecen a un conjunto denominadoFunciones y para los nodos que se encuentran en los últimos niveles de los árboles tambien conocidos como hojas se toman de otro conjunto llamadoTerminales.

(35)

3.2.1. Funciones y terminales

La definici ´on de estos conjuntos depende directamente del tipo de problema que se este abor-dando usando GP. Algunos de los elementos por los cuales puede estar formado el conjunto de funciones son:

• Operadores Aritm ´eticos: {+,-,*,/,etc.}

• Operadores Booleanos:{AND, OR, NOT}

• Funciones Matem ´aticas:{Sin, Cos, Tan, etc}

• Sentencias Condicionales:{If, Then, Else, Case}

• Sentencias de Ciclos:{While...Do,Repeat...Until, For,etc}

• Sentencias de Control de Transferencia:{Go to, Call, Jump}

Los elementos pertenecientes tanto al conjunto de Funciones como al de terminales, son de-nominadosnodoscuando la representaci ´on de los programas es en forma de ´arboles. El conjunto de terminales esta formado por:

• Variables, las cuales son las entradas al programa.

• Constantes, que como su nombre lo dice son elementos que no cambian su valor a lo largo de la ejecuci ´on del programa.

Figura 11.Rama de un ´arbol

(36)

3.2.2. M étodos de inicializaci ón de la poblaci ón

Basandonos en la Figura 11, el primer paso que se debe llevar acabo en un programa de GP, es la inicializaci ón de la poblaci ón, es decir generar un conjunto de tama ño P, con estructu-ras en forma de árboles los cuales tendr án unam áxima profundidad previamente definida en el programa.

Para inicializar la estructura de los árboles existen algunos m étodos los cuales se explican a continuaci ón.

3.2.2.1. M ´etodo Completo y Crecimiento

En el m étodo Completo(del ingl és full), cada rama que compone el arbol tiene una profundidad m áxima que podemos denotar comoDmax y se componen de la siguiente manera:

• Los nodos que se encuentran a un niveld < Dmax, son elegidos aletoriamente del conjunto de

Funciones F.

• Los nodos del niveld=Dmax, aleatoriamente son elegidos del conjunto de TerminalesT.

Las ramas de los árboles generados mediante el m étodo de Crecimiento(del ingl és grow) a diferencia del m étodo Completo, pueden tener una profundidad diferente siempre y cuando sean ≤Dmax.

• Los nodos que se encuentran a un niveld < Dmax, se eligen aleatoriamente del conjuntoF∪T.

• Similar a el m ´etodo Completo, los nodos que se encuentran a un nivel d < Dmax, son elegidos

(37)

3.2.2.2. M ´etodo Expansi ´on Mitad y Mitad

En el m étodo Expansi ón Mitad y Mitad (del ingl és ”ramped half-and-half”), los árboles son ini-cializados usando tanto el m étodoCompletoyCrecimiento, eligiendo cada m étodo en base a una probabilidad. Cada individuo sigue gener ándose a partir de los conjuntos T y F y una m áxima produndidad Dmax. Ésto se hace con la finalidad de que exista una mayor diversidad entre los

individuos que componen la poblaci ´on.

3.3. Aptitud y selecci ´on

Siguiendo con el diagrama de la Figura 10, el siguiente paso es la evaluaci ón de la aptitud (Fitness en ingl és) de los individuos que componen la poblaci ón en base a unafunci ón objetivo. La aptitud de cada uno de los individuos se espera que mejore conforme avance el proceso de evoluci ón artificial, y es con ésta que se realiza la selecci ón y se determinar á cuales individuos entrar án al proceso de combinaci ón, cu áles sobrevivir án y cu áles no.

3.3.1. Operadores gen ´eticos

Una vez obtenida la poblaci ón inicial as´ı como la aptitud de cada uno de los individuos, se continua el proceso evolutivo aplicando sobre dicha poblaci ón los operadores gen éticos decruza

ymutaci ´on, los cuales se explican a continuaci ´on.

3.3.1.1. Cruza

(38)

En un programa de GP, el operador de cruce m ´as com ´un se realiza de la siguiente forma:

Figura 12.Ejemplo del operador cruce

• De la poblaci ón, se seleccionan dos individuos lo cual puede ser de manera aleatoria o usando alg ún otro m étodo de selecci ón.

• En cada uno de los padres, se selecciona aleatoriamente un nodo el cual ser ´a el punto de cruce. Cada nodo posee la misma probabilidad de ser seleccionado.

• Por ´ultimo, se intercambian los sub ´arboles que se desprenden de los nodos seleccionado con anterioridad

Dando origen as´ı a dos nuevos hijos. Cabe mencionar que la profundidad de los ´arboles puede superar a la de los padres despu ´es de este paso.

3.3.1.2. Mutaci ´on

(39)

introduciendo nueva informaci ´on y asi sirviendo de mecanismo que ayude al proceso evolutivo a poder escapar de posibles ´optimos locales.

La mutaci ón m ás com ún que se realiza a un inviduo es remplazando un sub árbol elegido aleatoriamente por otro que es generado de igual manera.

(40)

Cap´ıtulo 4.

Desarrollo de la propuesta

En este cap´ıtulo, se describe el algoritmo propuesto para el dise ño autom ático de operadores que actuar án sobre la estimaci ón de flujo óptico con la finalidad de obtener una precisi ón mayor a la de los m étodos existentes en la literatura propuestos por expertos. Primeramente se describen algunos conceptos de funciones de transformaci ón espaciales en im ágenes que fueron emplea-das, despu és se abordan otros aspectos del algoritmo como lo es el espacio de b úsqueda que es formado por el conjunto de funciones y terminales propuesto; la forma de evaluaci ón de las soluciones candidatas encontradas por el algoritmo y finalmente se describen detalles correspon-dientes a la implementaci ón.

4.1. Funci ´on de transformaci ´on de imagen

Dentro de las funciones de transformaci ón de im ágenes podemos encontrar las funciones de transformaci ón espaciales, este tipo de transformaciones tienen el prop ósito de modificar las propiedades geom étricas de la imagen e idealmente, los valores de la intensidad entre la imagen sobre la que act úa la transformaci ón y la imagen resultante deben de permanecer iguales.

Una imagen digitalI(x)puede definirse como:

I(x):D ⊆_Rn→ C ⊆_Rm

x7→I(x)

en dondemindica el n úmero de canales o bandas que conforman la imagen (por ejemplo, 3 en el caso de una imagen RGB, 1 para una imagen en escala de grises, etc.) ynindica la dimensi ón de ésta.

Para este trabajo nos centraremos en un tipo de transformaci ´ones que son conocidas como

Funciones de mapeo. Este tipo de funciones requieren como entrada una imagen y dado un vector

de par ´ametrosθ, toma puntos que la componen y los proyecta a otro plano. Para una imagen en 2D se puede definir como :

Tθ(x):R2→R2

(41)

en dondeθes un vector que indica los par ámetros de la transformaci ón yxes el punto a ser mapeado. Podemos mencionar dos tipos de mapeo: mapeo en direcci ón hacia adelante, y mapeo en direcci ón hacia atr ás

4.1.1. Mapeo hacia adelante

El funcionamiento de este tipo de mapeo resulta ser sencillo, para cada punto en la imagen de entrada se toma el valor de su intensidad y éste es ubicado en la posici ón(x,y)que indique la funci ón de mapeo en el plano de salida.

A continuaci ´on se presenta el algoritmo que describe este proceso.

Algoritmo 6Mapeo hacia adelante — forwardMapping()

Descripci ´on: Algoritmo de la funci ´on de mapeo hacia adelante.

Entrada:

• img: Arreglo que representa una imagen.

• T(): Funci ´on que mapea los puntos de un espacio de entrada a otro.

Variables:

• [xy]: Arreglo que contiene las coordenadas de un punto.

Salida:imgT : Arreglo que representa la imagen transformada.

Inicio

1: fori←1toimg.rowsstep1do

2: fori←1toimg.colsstep1do

3: [xy]←T(img(i, j))

4: imgT(xy[1], xy[2])←img(i, j)

5: end for

6: end for

7: returnimgT

(42)

Figura 14.Mapeo hacia adelante

Con la finalidad anular las desventajas que presenta el mapeo hacia adelante, existe otro tipo de estrategia que es elmapeo hacia atr ´aso tambi ´en conocido comomapeo inverso.

4.1.2. Mapeo hacia atr ´as

Este m étodo de mapeo, para cada punto en el plano de salida (x, y) aplica la funci ón de tranformaci ón inversaT−1 para conocer la posici ón correspondiente de este punto en el plano de entrada con coordenada(u, v)

Isrc(ui, vi) =T−1(Idst(xi, yi))

Una vez conocida esta posici ón, se consideran los puntos cercanos a esta y usando un m éto-do de interpolaci ón se apr óxima el valor de intensidad. Finalmente este valor de intensidad es asignado al puntoIdst(xi, yi)en el plano de salida.

(43)

Figura 15.Mapeo hacia atr ´as

Algoritmo 7Mapeo hacia atr ´as — inverseMapping()

Descripci ón: Algoritmo de la funci ón de mapeo hacia atr ás.

Entrada:

• img: Arreglo que representa una imagen.

• T(): Funci ´on que mapea los puntos de un espacio de entrada a otro.

Variables:

• [xy]: Arreglo que contiene las coordenadas de un punto.

Salida:imgT : Arreglo que representa la imagen transformada.

Inicio

1: for eachpinimgT do

2: [xy]←T−1(p)

3: imgT(p)←img(xy[1], xy[2])

4: end for each

5: returnimgT

4.2. Descripci ´on del algoritmo propuesto

(44)

im ágenes en escala de grises. La segunda versi ón integra la informaci ón que proveen diferentes bandas de color correspondientes a las secuencias de im ágenes para la estimaci ón del flujo y de igual manera genera de manera autom ática operadores para la correcci ón del flujo con la finalidad de obtener una estimaci ón de mayor precisi ón.

4.2.1. Primera propuesta

El dise ño de la primera versi ón del algoritmo propuesto consta a grandes rasgos de dos pasos: una estimaci ón previa del flujo óptico y posteriormente la generaci ón autom ática de operadores para la correcci ón del flujo. Para la primera parte se realiza una estimaci ón previa de flujo óptico utilizando la secuencia en escala de grises, para ésto se emplea el m étodo propuesto por Lukas-Kanade en su enfoque piramidal; se eligi ó este m étodo debido a la simplicidad de implementaci ón. Por otro lado, la generaci ón autom ática de los operadores se realiza a trav és del proceso evolu-tivo, los cuales aplicados a la estimaci ón previamente obtenida se busca que brinden un mejor desempe ño en cuanto a la precisi ón en la estimaci ón de los vectores de flujo.

De acuerdo a la Figura 10, el primer paso en un algoritmo evolutivo es la generaci ón de la poblaci ón. En este trabajo se utiliz ó una estrategia conocida comoprogramaci ón cerebral (Dozal, 2014). En esta t écnica los individuos o posibles soluciones son definidos por arreglos con diversos árboles y no con uno solo, a diferencia de los algoritmos de GP. Dichos individuos son formados por conjuntos de operaciones b ásicas definidos en el cap´ıtulo 3 como conjunto defunciones y terminales.

(45)

Algoritmo 8Algoritmo de GP - proceso evolutivo

Descripci ´on: Algoritmo que describe el proceso evolutivo.

Entrada:

• nGen: Numero de generaci ´ones.

• popSize: Tama ˜no de la poblaci ´on

• maxT rees: N úmero m áximo de árboles para cada individuo.

Variables:

• U V : Arreglo que representa el flujo ´optico para la secuencia de entrada.

• maxLevel: N úmero m áximo de niveles que un árbol puede tener.

• n: Contador de iteraciones para el n ´umero de generaciones.

• pChromCross: Probabilidad de cruce a nivel cromosoma.

• pGenCross: Probabilidad de cruce a nivel gen.

• pChromM ut: Probabilidad de mutaci ´on a nivel cromosoma.

• pGenM ut: Probablilidad de mutaci ´on a nivel gen.

• newGen: Arreglo que almacenar ´a a la nueva poblaci ´on.

• parents : Arreglo que contiene los individuos seleccionados a los que se le aplicar ´a algun operador gen ´etico.

• of f Spring: Arreglo que almacena el resultado de aplicar un operador gen ´etico.

Salida:bestInd: Arreglo que representa al individuo con mejor desempe ˜no.

Inicio

1: U V ← calcOpF low(Im1, Im2) /*Realiza la estimaci ´on de flujo ´optico para la secuencia de entrada*/

2: pop ← initP op(popSize, maxT rees, maxLevel, setF unctions, setT erminals)/*Inicializa la po-blaci ´on*/

3: whilen < nGendo

4: evalP opF itness(pop, U V)/*Evaluaci ´on de la aptitud*/

5: newP op.clear()

6: whilenewGen.length < popSizedo

7: parents←roulette(pop)

8: operator ←rouletteOp(pChromCross, pGenCross, pChromeM ut, pGenM ut)

9: of f Spring←applyOpe(operator, parents)/*Aplica operadores gen ´eticos*/

10: newP op.add(of f Spring)

11: of f Spring.clear()

12: end while

13: pop.replace(newP op) /*Reemplaza los individuos de la nueva poblaci ´on en la poblaci ´on original*/

14: bestInd←getBest(pop)/*Obtiene el mejor individuo de la poblaci ´on*/

15: n=n+ 1

(46)

El algoritmo anterior que va de la linea (1) a la (17), inicia con la asignaci ón de la variableU V, que representa una estimaci ón previa del flujo óptico para la secuencia de entrada utilizando el m étodo de Lukas-Kanade en su variante piramidal abordado en el Cap´ıtulo 2. Adem ás,initP opes el m étodo de inicializaci ón de la poblaci ón que en este caso corresponde al m étodomitad y mitad, requiere como par ámetros de entrada el tama ño de la poblaci ón (popSize), el n úmero m áximo de árboles que puede conformar a un individuo(maxTrees) as´ı como el tama ño m áximo de estos (maxLevel) .

A continuaci ón, se eval úa el desempe ño para cada individuo de la poblaci ón inicial (4) y pos-teriormente se seleccionan aquellos que entrar án al proceso de s´ıntesis por medio del m étodo de la ruleta (7), basandos é en los valores de la aptitud obtenidos en el paso anterior: mientras este valor sea mayor entonces tendr á mayor probabilidad de ser seleccionado. Mediante el mismo m étodo de selecci ón por ruleta, se elige uno de los cuatro operadores gen éticos para la etapa de variaci ón (8), estos operadores son: cruce a nivel gen, cruce a nivel cromosoma, mutaci ón a nivel gen y mutaci ón a nivel cromosoma. Una vez elegido el operador, éste es aplicado (9) y despu és el resultado es a ñadido al arreglonewP op. Posteriormente este arreglo reemplaza a la generaci ón anterior (13) y se almacena el mejor individuo de la generaci ón enbestInd, este proceso se repite hasta alcanzar el n úmero de generaciones previamente definido.

Algoritmo 9initPop()

Descripci ón: Algoritmo que describe el proceso de inicializaci ón de la poblaci ón.

Entrada:

• popSize: Tama ˜no de la poblaci ´on

• maxT rees: N úmero m áximo de árboles para cada individuo.

• maxLevel: N úmero m áximo de niveles que un árbol puede tener.

• setF unctions: Arreglo que contiene el conjunto de funciones para generar los ´arboles

• setT erminals: Arreglo que contiene el conjunto de terminales para generar los ´arboles

Variables:

• trees: N ´umero de ´arboles generado aleatoriamente.

Salida:pop: Poblaci ´on generada aleatoriamente

Inicio

1: fori←1topopSizestep1do

2: trees←random(2, maxT rees)/*Genera un n ´umero aleatorio entre 2 ymaxTrees*/

(47)

4: fort←1totreesstep1do

5: newInd.tree(t)←makeT ree(setF unctions, setT erminals, maxLevel)

6: end for

7: pop(i)←newInd

8: end for

9: returnpop

El algoritmo crea una poblaci ón basado en los par ámetros de entrada. Se genera de manera aleatoria para cada individuo un n úmero que representa la cantidad de árboles que lo compondr án, este var´ıa entre dos ymaxT rees.

Despu és cada árbol es generado de manera autom ática utilizando los arreglos setTerminals

ysetFunctions, que representan a los conjuntos de terminales y de funciones que son definidos

previamente. Dichos conjuntos establecen elEspacio de b ´usquedapara el algoritmo evolutivo.

4.2.1.1. Funciones y terminales

En la Tabla 1, se muestran los conjuntos de funciones y terminales. El objetivo de los elementos que componen a estos dos conjuntos es que de manera autom ática construyan operadores que al ser sometidos al proceso de evoluci ón y aplicados a la estimaci ón del flujo óptico se mejore la precisi ón de ésta. A continuaci ón se somete a evaluaci ón el resultado obtenido usando la base de datos de Middlebury para flujo óptico cuyas m étricas de evaluaci ón se han descrito en la Secci ón 2.4.

Tabla 1.Funciones y terminales

F ={+,−,×,÷, M F3, M F5, M F7, log2(), Dx(), Dy(), kT imes, kM inus, kP lus, kDiv}

T ={uv, Dx(uv), Dy(uv), Dxx(uv), Dyy(uv), M F3, M F5, M F7}

En la Tabla 1,uvrepresenta una estimaci ´on del flujo ´optico. M Fses un filtro de medianas ys

indica el tama ˜no de este.Durepresenta la derivada en la direcci ´on deu∈x, y, xx, yy. Las

primiti-vaskT imes, kM inus, kP lus, kDiv, realizan la operaci ´on que su nombre indica por una constante

(48)

4.2.1.2. Evaluaci ´on de aptitud

La aptitud de cada posible soluci ón generada durante el proceso evolutivo se asigna evaluando la ecuaci ón siguiente, dondeM es el tama ño de la imagen,I(x, y, t)la funci ón de intensidad de la imagen en el punto(x, y)al tiempot, las componentes del flujo óptico sonuyv.

f itness=min 1

MΣ

M

i=1|Iref(xi, yi)−I(xi+vi, yi+vi)|

En el algoritmo propuesto se utiliza una estrategia de mapeo hacia atr ás, mapeando los puntos de la imagen acorde al arreglouv que corresponde a la estimaci ón del flujo óptico a la que le han sido aplicados los operadores generados autom áticamente por el algoritmo evolutivo. Se aplica la funci ón de transformaci ón al cuadro correspondiente at1de la secuencia de entrada dando como

resultado un nuevo cuadro en el que cada punto (x, y) del cuadro t1 ha sido desplazado lo que

indica las componentesuyv. Posteriormente se calcula la diferencia entre el cuadro de referencia

t2 de la secuencia de entrada y el cuadro obtenido en el paso anterior. Se considera mejor la

aptitud del individuo evaluado mientras menor sea esta diferencia. A continuaci ón se muestra el algoritmo de la funci ón de evaluaci ón.

Algoritmo 10Proceso de evaluaci ´on de aptitud

Descripci ´on: Algoritmo del proceso de evaluaci ´on de aptitud.

Entrada:

• ind: Arreglo que representa un individuo de la poblaci ´on.

• uv : Arreglo que representa la estimaci ´on previa del flujo.

Variables:

• im1: Arreglo que reprenta el cuadro ent1.

• im2: Arreglo que reprenta el cuadro ent2.

• nU V : Arreglo que almacena la nueva estimaci ´on del flujo.

Salida:

• f itness: Aptitud del individuo evaluado.

Inicio

1: for eachtreeinind.treesdo

2: nU V ←nU V +eval(tree(uv))

3: end for each

4: remappedImg←inverseM apping(im1, nU V)

5: f itness←mean(abs(im2−remappedImg))

(49)

4.2.1.3. Operadores gen ´eticos

Aplicando el Algoritmo 8 despu és de creada la poblaci ón inicial y evaluado el rendimiento de cada individuo, el siguiente paso corresponde a la selecci ón y variaci ón aplicando los correspon-dientes operadores gen éticos como lo sonselecci ón, cruce y mutaci ón.

Figura 16.Estructura de un individuo

En la Figura 16 puede observarse un ejemplo de como est á compuesto cada individuo de la poblaci ón. Cada árbolt que forma parte de la estructura del inviduo est á a su vez conformado por otras estructuras b ásicas conocidas comonodos. Debido a que un individuo consiste de un arreglo de árboles, los operadores gen éticos definidos en el Cap´ıtulo 4 no pueden ser aplicados sin realizar antes algunas moficaciones.

(50)

Figura 17.Cruce a nivel gen

Mientras que para la mutaci ón es necesario solo un individuo, para cada árbol que lo compone se elige de manera aleatoria un nodo a partir del cual se aplicar á el operador.

Figura 18.Cruce a nivel gen

(51)

Figura 19.Cruce a nivel cromosoma

La mutaci ´on a nivel cromosoma consiste en cambiar por completo cada ´arbol que compone al individuo seleccionado dando como resultado uno nuevo, este operador solo requiere como en-trada un solo individuo.

Figura 20.Mutaci ´on a nivel cromosoma

El algoritmo que describe el operador de cruce a nivel Gen, recibe como entrada dos arreglos que representan a dos individuos de la poblaci ón(p1, p2), que fueron elegidos previamente para entrar al proceso de combinaci ón a nivel gen. En la l´ınea (1) de entre los dos cromosomas de entrada se obtiene el tama ño del menor de ellos, esto con la finalidad de que elpunto de cruceno exceda los l´ımites de la estructura de menor tama ño.

(52)

Algoritmo 11Cruce a nivel Gen

Descripci ´on: Algoritmo que describe el proceso cruce a nivel gen.

Entrada:

• p1, p2: Arreglos que representan a los cromosomas.

Variables:

• minLen: Indica el menor tama ˜no de entre los cromosomas de entrada.

• cp1, cp2: Puntos de cruce.

Salida:c1, c2: Arreglos resultantes del proceso de combinaci ´on a nivel gen.

Inicio

1: minLen←min(p1.length, p2.length)

2: c1←p1

3: c2←p2

4: fori←1tominLenstep1do

5: cp1←random(p1[i])

6: cp2←random(p2[i])

7: c1[i]←swap(p1[i], p2[i], cp1, cp2)

8: c2[i]←swap(p2[i], p1[i], cp2, cp1)

9: end for 10: returnc1, c2

Algoritmo 12Cruce de cromosoma

Descripci ´on: Algoritmo que describe el proceso de cruce a nivel cromosoma.

Entrada:

• p1, p2: Arreglos que representan a los cromosomas.

Variables:

• minLen: Indica el menor tama ˜no de entre los cromosmas de entrada.

• cp: Punto de cruce.

Salida:c1, c2: Arreglos resultantes del proceso de combinaci ´on a nivel cromosoma.

Inicio

1: minLen←min(p1.length, p2.length)

2: c1←p1

3: c2←p2

4: ifp1.length==p2.lengththen

5: minLen←minLen−1

6: end if

7: cp←random(1, minLen)

8: fori←1tocpstep1do

9: c1[i]←p1[i]

10: c2[i]←p2[i]

11: end for

(53)

Al igual que el cruce a nivel gen, este algoritmo recibe como par ámetro de entrada dos arreglos los cuales representan a los cromosomas. Se comienza por obtener de entre éstos el tama ño del menor de ellos (l´ınea 1) y en caso de que ambos sean del mismo tama ño esta cantidad se disminuye en uno, ya que de lo contrario cuando se obtenga de manera aleatoria el punto de cruce existe la posibilidad de que éste sea igual a la longitud del cromosoma. As´ı se obtendr´ıa como resultado para este procedimiento un intercambio total de árboles es decir, la salida consistir´ıa en una r éplica de los arreglos de entrada. Una vez obtenido el punto de cruce se procede a realizar el intercambio de árboles que componen al individuo, desde la primera posici ón y teniendo como l´ımite este punto (l´ıneas 8-11). Por último los nuevos cromosomas son retornados.

Algoritmo 13Mutaci ´on a nivel gen

Descripci ´on: Algoritmo que describe el proceso mutaci ´on a nivel gen.

Entrada:

• p: Arreglo que representa un cromosoma al que ser ´a aplicado el operador.

• maxLevel: Tama ˜no m ´aximo que puede tener el cromosoma.

Variables:

• mp: N ´umero aleatorio que indica el nodo a partir del cual el operador ser ´a aplicado.

• mpLvl: Indica el nivel en el cual se encuentra el nodo al que apuntamp • new: Arreglo que almacena la nueva rama.

Salida:c: Arreglo resultante del proceso de mutaci ´on a nivel gen.

Inicio

1: fori←1top.lengthstep1do

2: mp←random(p[i])

3: mpLlv←getN odeLvl(mp)

4: new←makeT ree(setF unctions, setT erminals, maxLevel−mpLvl+ 1)

5: c[i]←joinT rees(p[i], new, mp)

6: end for 7: returnc

(54)

Algoritmo 14Mutaci ´on de cromosoma

Descripci ´on: Algoritmo que describe el proceso mutaci ´on de cromosoma.

Entrada:

• p: Arreglo que representa un cromosoma al que ser ´a aplicado el operador.

• maxLevel: Tama ˜no m ´aximo que puede tener el cromosoma.

Variables:

• new: Arreglo que almacena el nuevo cromosoma.

Salida:c: Arreglo resultante del proceso de mutaci ´on a nivel cromosoma.

Inicio

1: fori←1top.lengthstep1do

2: new←makeT ree(setF uncions, setT erminals, maxLevel)

3: c[i]←new

4: end for

5: returnc

Este algoritmo es b ásico en su funcionamiento, ya que recibe como entrada un arreglo que representa a un individuo y cada uno de los árboles que lo componen son reemplazados por unos nuevos que son generados de manera aleatoria dado el conjunto de funciones y terminales, respetando los l´ımites de tama ño m áximo definidos enmaxLevel.

4.2.2. Segunda propuesta