Control de tráfico urbano

(1)

Presentado a

LA UNIVERSIDAD DE LOS ANDES

FACULTAD DE INGENIER´IA

DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTR ÓNICA

Para obtener el t´ıtulo de

INGENIERO ELECTR ´ONICO

por

Iv´an Felipe Guti´errez Delgado

CONTROL DE TR ´AFICO URBANO

Sustentado el 26 de junio de 2013 frente al jurado:

Composici´on del jurado

Asesor: Nicanor Quijano Silva Ph.D, Profesor asociado, Ohio State University

Coasesor: Pablo Andrés Ñañez Ojeda Ph.D Student, University of Arizona

Jurado: José Fernando Jiménez Vargas Ph.D, Institut National des Sciences Ap-pliquées

(2)

Se implementa un simulador de tr´afico urbano orientado a objetos que integra MATLAB y

VISSIM PTV. Partiendo de la herramienta, se simulan algoritmos adaptativos basados en

Replicator Dynamics, Model Predictive Control, Distributed Model Predictive Control y

Dis-tributed Reinforcement Learning. Tambi´en se simulan algoritmos de tiempo fijo basados en

optimizaci´on y se comparan todos los resultados contra los presentados al simular un plan

de se˜nales implementado en la ciudad de Barranquilla, Colombia. Con la simulaci´on de los

(3)

(4)

Agradecimientos

Con la entrega de este proyecto concluyo a cabalidad mis estudios de pregrado. Recuerdo que

hace cinco a˜nos, cuando culminaba el nivel educativo de media vocacional, nunca aspir´e a terminar en este per´ıodo dos pregrados, cuando lo habitual en otras instituciones es alcanzar

solo un t´ıtulo. Conociendo la proximidad de mi grado, considero necesario destacar todo el apoyo que he recibido a lo largo de mis estudios: la compañ´ıa y el inefable amor de mi mamá Martha Cecilia Delgado; el apoyo de mi padre Eliseo Gutiérrez Cruz, del cual no tengo reparo

ni afrenta alguna, siendo durante toda mi vida un padre ejemplar; mis hermanos César y Diego, aquellos con quienes crec´ı y disfruté los paisajes de mi natal Santander; a mi novia Paula Daniela, quien afronta mis visicitudes y la galbana que me invade junto con el sueño;

a la compa˜n´ıa de tantos y pocos, que en mi acentuada soledad aliviaron todo ese desd´en que punzaba mi alma.

Muchos otros merecen agradecimientos, y me excuso por no escribir expl´ıcitamente sus nom-bres. Sin embargo, m´as que tres frases dicen mis actos, y en beneficiencia de ellos y de todo

aquel que me apoye o se alegre de mi bienestar, obrar´e a favor de ´estos.

La dirección y apoyo de Nicanor Quijano y Pablo Ñañez han sido de vital importancia en este proyecto. Cada uno de sus logros son motivos que inspiran a ser como m´ınimo de su talante. Muchas gracias por permitirme discernir el camino adecuado.

(5)

Tabla de contenido

1 Introducci´on 1

2 Revisi´on de literatura 3

2.1 Estrategias de control de tr´afico urbano [44] [41] [65] . . . 3

2.1.1 Estrategias de control de tr´afico urbano basadas en tiempo fijo . . . 4

2.1.2 Estrategias de control de tr´afico urbano adaptativas . . . 6

2.2 Estrategias de control basadas en modelo . . . 8

2.2.1 Estrategias de control predictivas. Caso de estudio: MPC . . . 8

2.2.2 Control distribuido: Distributed Model Predictive Control (DMPC) . . 9

2.2.3 Algoritmos basados en Control ´optimo . . . 11

2.2.4 Algoritmos basados en teor´ıa de grafos [4] . . . 12

2.2.5 Algoritmos basados en sistemas h´ıbridos . . . 13

2.3 Estrategias de control no basadas en modelo . . . 15

2.3.1 Algoritmos de control basados en Machine Learning . . . 15

2.3.2 Algoritmos basados en l´ogica difusa . . . 16

2.3.3 Algoritmos bioinspirados . . . 17

2.3.4 Algoritmos basados en din´amicas poblacionales y teor´ıa evolutiva . . . . 19

2.4 Modelos de redes de tr´afico urbano . . . 20

2.4.1 Modelos de tr´afico urbano seg´un la topolog´ıa . . . 21

2.4.2 Modelos de tr´afico urbano seg´un el nivel de detalle . . . 22

3 Enunciado del Problema 24 3.1 Introducci´on . . . 24

3.2 Redes de tr´afico urbano . . . 25

3.3 ´Indices de desempe˜no . . . 26

4 Simulador de tr´afico urbano 29 4.1 Descripci´on . . . 29

4.2 Interfaz de usuario . . . 31

4.3 Arquitectura . . . 32

5 Algoritmos de control 34 5.1 Estrategias basadas en tiempo fijo . . . 34

5.1.1 Aproximación de F. V. Webster para el cálculo de tiempos óptimos . . . 35

5.1.2 Planes de se˜nales de IMATIC Ingenier´ıa LTDA . . . 39

5.2 Estrategias adaptativas al tr´afico . . . 39

(6)

5.2.1 Model Predictive Control . . . 39

5.2.2 Distributed Model Predictive Control . . . 40

5.2.3 Replicator Dynamics . . . 40

5.2.4 Distributed Reinforcement Learning . . . 40

6 Experimentos y consideraciones 43 6.1 Red de tr´afico simulada . . . 43

6.2 Caracter´ısticas de los controladores . . . 45

6.3 Descripci´on de los experimentos . . . 46

6.4 Resultados esperados . . . 48

7 An´alisis y resultados 49

8 Conclusiones y trabajo futuro 53

Referencias 55

(7)

´

_{Indice de figuras}

2.1 Diagrama de de tiempo vs espacio de MAXBAND. Tomado de [33] . . . 6

2.2 Esquema general de MPC. Tomada de [7] . . . 10

2.3 Diagrama de Reinforcement Learning . . . 16

4.1 Estructura general del simulador . . . 30

4.2 Simulador de tr´afico urbano . . . 31

5.1 Retardo seg´un Webster. En la figura, se puede observar gr´aficamente el retardo entre los dos casos posibles. [20] . . . 35

5.2 Comparaci´on entre los valores de retardo calculados y los valores observados. [56] . . . 36

6.1 Una sola intersecci´on de la red de Barranquilla . . . 44

6.2 Red de Barranquilla de 8 intersecciones. . . 45

(8)

´

_{Indice de tablas}

2.1 Comparaci´on entre los dos casos . . . 19

7.1 Resultados comparados contra el controlador basado en los planes de se˜nales enviados por IMATIC . . . 52

A.1 Tabulaci´on de ₂₍₁(1−₋λ_λx)2₎ . . . 62 A.2 Tabulaci´on de ₂₍₁x₋2_x₎ . . . 63

(9)

Introducci´

on

Cada vez que alg´un ente gubernamental decide implementar un nuevo sistema de transporte,

puede caer en la desgracia de perder sus inversiones si los contratistas encargados no han

realizado estudios exhaustivos sobre el efecto de sus obras. Esta situaci´on lleva a pensar si

existen las suficientes herramientas para realizar dichos estudios. Una de estas

herramien-tas es la simulaci´on, que hoy en d´ıa permite verificar de forma virtual los resultados a bajo

costo, por lo cual es completamente indicada para realizar estudios referidos al tr´afico urbano.

Con el fin de facilitar el estudio de algoritmos de control de tr´afico urbano, este trabajo de

grado ha sido enfocado al desarrollo de una herramienta computacional que simplifique la

simulaci´on, y a su vez reduzca el tiempo de desarrollo de los diferentes algoritmos, trabajando

bajo una plataforma est´andar, a la vez que se estudian algoritmos de control de tr´afico urbano.

La principal contribuci´on que existe en este campo ha sido un punto de referencia clave para

este trabajo, y corresponde al expuesto en [53]. En este trabajo se describen cada uno de

los componentes de una API (Application Programming Interface) empleada para simular

algoritmos de control de tr´afico urbano, as´ı como las interacciones entre ellos. A modo de

ejemplo, se presenta un algoritmo basado en Model Predictive Control y se presentan

resul-tados al respecto. Cabe resaltar el trabajo de Kuyer en [28], donde se muestra un algoritmo

de control basado en Reinforcement Learning empleando grafos coordinados mediante un

al-goritmo basado en Max-Plus ´algebra, el cual fue un punto de partida para el algoritmo de

control basado en Reinforcement Learning presentado en este documento. En [56] se presenta

un modelo de retardo para cada intersecci´on, y partiendo del mismo se optimizan diversos

par´ametros de la misma, tales como el tiempo de ciclo y los tiempos de verde; tambi´en se

presenta un modelo para par´ametros de la red como los son las colas. Muchas de las

(10)

sideraciones expuestas por Webster fueron tenidas en cuenta para el desarrollo de algoritmos

que s´olo optimizan tiempos de verde e ignoran los tiempos de ciclo.

Los principales aportes de este proyecto de grado se mencionan a continuaci´on: el desarrollo

de una API orientada a objetos para la simulaci´on de algoritmos de control de tr´afico urbano,

empleando MATLAB y VISSIM PTV para tal fin; la optimizaci´on de los tiempos de ciclo

aplicada a algoritmos adaptativos de control de tr´afico y la creaci´on de un algoritmo de

con-trol basado en Reinforcement Learning, capaz de sincronizar acciones ´optimas entre agentes

vecinos empleando un algoritmo iterativo basado en max-plus ´algebra.

El resto del documento se estructura de la siguiente forma: en el segundo cap´ıtulo se expone

la revisi´on de literatura. En el cap´ıtulo n´umero tres se describe el problema general que se

aborda, dando restricciones y consideraciones pertinentes. En el cap´ıtulo cuatro se expone el

simulador de tr´afico urbano a profundidad, siendo ´este el principal objetivo del proyecto de

grado. En el cap´ıtulo cinco se exponen los algoritmos de control que han sido simulados con

la herramienta dise˜nada, implementando un algoritmo de control basado en Reinforcement

Learning, es considerado uno de los principales aportes de este proyecto. En el cap´ıtulo n´umero

seis se exponen los experimentos que se llevar´an a cabo teniendo en cuenta las consideraciones

particulares de la red a simular. En el cap´ıtulo siete se presentan los resultados y an´alisis de las

simulaciones empleando la herramienta, para terminar en el cap´ıtulo ocho con las conclusiones

(11)

Revisi´

on de literatura

A continuación se presenta la revisión de literatura. En su primera sección se describen las

estrategias de control de tr´afico urbano, resaltando diferencias entre algoritmos basados en

tiempo fijo y en control de tráfico adaptativo. En la sección número dos se abordan los

algorit-mos y modelos de tr´afico basados en modelos, resaltando sus diferentes caracter´ısticas. En la

sección número tres se hace referencia a algoritmos de control de tráfico urbano adaptativo no

basados en modelo. Se comienza en la secci´on n´umero tres con algoritmos de control basados

en Machine Learning, l´ogica difusa, bioinspirados y culmina con din´amicas poblacionales. En

la sección número cuatro se presenta una revisión de los modelos de tráfico urbano,

clasifica-dos seg´un la topolog´ıa y el nivel de detalle.

2.1 Estrategias de control de tr´

afico urbano [44] [41] [65]

Las estrategias de control de tr´afico son las aplicaciones de la teor´ıa de control empleadas

en el mejoramiento del tr´ansito vehicular. En el control de tr´afico urbano a nivel global, las

estrategias de control se encuentran divididas en dos grandes variantes: estrategias de tiempo

fijo y estrategias de control adaptativas al tr´afico. En esta secci´on, se abordan las principales

estrategias de control, incluyendo las estrategias que hoy en d´ıa manejan el tr´afico urbano

como también aquellas encontradas en ámbitos académicos.

(12)

2.1.1 Estrategias de control de tr´afico urbano basadas en tiempo fijo

Las estrategias de control basadas en tiempo fijo funcionan en base a c´alculos offline de la red,

es decir, las mediciones y c´alculos que se realicen para determinar los respectivos tiempos de

verde, amarillo y rojo de cada sem´aforo se realizan en base a datos estad´ısticos de mediciones

previas, para despu´es ser programados en los respectivos controladores de sem´aforos [44]. Por

su simplicidad, son empleadas a lo largo de todo el mundo, puesto que implican un bajo

costo de implementaci´on. Estas estrategias de control no requieren de sensores, bas´andose en

un control open-loop que lee las se˜nales de control de la respectiva memoria del controlador,

espacio en el cual se han almacenado los tiempos de las luces de tr´afico una vez han sido

procesadas estad´ısticamente. Cada estrategia se diferencia de otra en su funci´on objetivo, en

sus restricciones y en sus variables de control, tales como capacidad de intersecciones,

capaci-dad de las colas, n´umero de paradas, tiempo total de paradas, entre otras. Por lo general,

estas estrategias de control de tr´afico son dise˜nadas bajo condiciones de red no saturadas [44].

Entre las estrategias de control basadas en tiempo fijo, se distinguen dos variantes: las

estrate-gias de control para intersecciones aisladas y las de control coordinado de intersecciones.[41]

Las estrategias de control para intersecciones aisladas se basan en un modelo de red simple,

aplicable a zonas de muy bajos flujos vehiculares. Dos ejemplos de estrategias de control de

tiempo fijo para intersecciones aisladas corresponden a SIGSET y SIGCAP. Estas estrategias

de control por su simplicidad son muy semejantes, sin embargo, difieren en la funci´on objetivo

que optimizan. Ambas estrategias de control se basan en limitar la capacidad que tiene

de-terminada v´ıa por encima de la demanda de la red. Adicionalmente, poseen l´ımites m´aximos

y m´ınimos para el tiempo de verde. Matem´aticamente las podemos describir de la siguiente

forma [44]:

sj m

X

i=1

αijλi≥dj ∀j (2.1)

Donde

λ0+λ1+. . .+λm= 1

λ0 =L/c

(13)

representa el derecho de paso, tomando valores de cero o uno,λirepresenta la duraci´on relativa

del tiempo de verde respecto del tiempo de ciclo c,λ0 representa el tiempo perdido relativo

al tiempo de ciclo, donde L representa el tiempo total perdido. Para el caso de SIGSET,

se busca minimizar el tiempo total de espera de la intersecci´on, para el caso de SIGCAP se

busca maximizar la capacidad de las intersecciones [41].

En cuanto a las estrategias de control coordinado de intersecciones, sus principales

represen-tantes son MAXBAND, UTCS y TRANSYT. En general, buscan mejorar el desempe˜no de

las v´ıas principales, en base a datos estad´ısticos tomados de las mismas. Presentan un muy

buen desempe˜no ante redes no congestionadas. Estas estrategias de control conllevan bajos

costos de implementaci´on, al no requerir dispositivos de sensado de tr´afico. La estrategia bajo

MAXBAND acuñó el término “ola verde”, buscando la minimización de los tiempos de parada

de una v´ıa principal. La “ola verde” consiste en una secuencia sucesiva de luces de sem´aforo

verdes en la dirección de flujo de los automóviles, logrando que el automóvil en cuestión se

detenga lo menos posible a lo largo de su trayecto [41] [44] [33].

Tal y como lo expone Little en [33], MAXBAND consideranintersecciones en la v´ıa arterial.

Se define como ancho de banda a aquella fracci´on de tiempo de ciclo en la cual un veh´ıculo

situado en una determinada intersecci´on podr´a experimentar la ola verde. Ello implica que los

veh´ıculos sean conducidos en un rango de velocidades fijos, definidos por el ancho de banda de

cada intersecci´on. En la figura 2.1.1 se puede observar un diagrama de tiempo vs. espacio de

MAXBAND.S1, S2, . . . , Sn son intersecciones, o en términos del autor, señales. Se pueden apreciar dos trayectorias principales: la trayectoria más ancha corresponde al flujo saliente,

y la m´as delgada corresponde al flujo entrante. En la imagen se puede apreciar el concepto

de ancho de banda, representados para cada uno de los flujos comob yb. Cada una de las

l´ıneas observadas representa la trayectoria que han de seguir los veh´ıculos, y la pendiente de

estas rectas corresponden a las velocidades que ´estos deben llevar para mantenerse en la ola

verde. Paralelas al ejex, se pueden apreciar l´ıneas fraccionadas referidas a las se˜nales. Cada

una de estas l´ıneas hace referencia al tiempo de luz roja de cada uno de los sem´aforos de la

(14)

Figura 2.1: Diagrama de de tiempo vs espacio de MAXBAND. Tomado de [33]

2.1.2 Estrategias de control de tr´afico urbano adaptativas

Con respecto a las estrategias de control de tr´afico basadas en tiempo fijo, las estrategias de

tr´afico urbano adaptativas se basan en mediciones en tiempo real de la red, actuando ante

variaciones instant´aneas en ella. Este comportamiento permite una mejor respuesta del

sis-tema de control a perturbaciones y cambios, siendo m´as resistente a variaciones en los flujos

debidas a eventos fortuitos, como los son los accidentes, las aver´ıas y las saturaciones. Existen

tambi´en dos variantes en las estrategias de control de tr´afico urbano adaptativas, tal y como

sucede con las estrategias de control basadas en tiempo fijo: estrategias adaptativas para una

intersecci´on aislada, o estrategias adaptativas para intersecciones coordinadas. Sin embargo,

esta clasificación no es del todo excluyente. También se tratarán las estrategias de tráfico

urbano que emplean o no modelo, en las siguientes secciones.

Estrategias adaptativas para intersecciones aisladas

Para intersecciones aisladas, las principales estrategias de control son llamadas “m´etodo de

intervalo de veh´ıculos” y Microprocessor Optimised Vehicle Actuation (MOVA), que es una

mejora a la anterior. Las dos estrategias se basan en la fijaci´on de un tiempo m´ınimo de verde,

(15)

se aumenta o disminuye el tiempo de verde obteniendo valores en el rango que se ha fijado

con anterioridad. La diferencia entre un m´etodo y otro reside en la flexibilidad de la funci´on

objetivo cuando se emplea MOVA, puesto que optimiza diferentes variables dependiendo de

la condici´on de saturaci´on de la red, maximizando la capacidad de las intersecciones bajo

condiciones saturadas, o minimizando los retardos o paradas bajo condiciones no saturadas.

Estrategias adaptativas para intersecciones coordinadas

Entre las estrategias de control adaptativas para intersecciones coordinadas, existen varias

caracterizadas por realizar un control centralizado, denominadas SCATS (Sydney

Coordi-nated Area Traffic System), RHODES, MOTION, TUC y SCOOT (Split, Cycle and Offset

Optimization Technique). Esta ´ultima t´ecnica se encuentra basada en la estrategia de

TRAN-SYT, donde el c´alculo se realiza de forma centralizada basado en un modelo del sistema. Con

base en los datos provenientes del modelo y la red, SCOOT investiga en tiempo real el efecto

producido en la red por cambios incrementales en el tiempo de ciclo, en las desviaciones y

desplazamiento. El optimizador de ciclo se encarga de revisar los niveles de saturaci´on de

cada una de las intersecciones individualmente, mientras que el optimizador de desviaciones

se encarga de generar retrasos o adelantos en las se˜nales de control, buscando la mejor

com-binaci´on para ese momento espec´ıfico de la red. El optimizador de desplazamiento se encarga

de minimizar los tiempos y n´umero de paradas que se realicen.

Adicionalmente a esta estrategia, existen otros algoritmos conocidos, como OPAC, PRODYN,

CRONOS [6] y RHODES, basados en un modelado riguroso de la red, implicando mayores

tiempos de c´omputo en el c´alculo de los tiempos de verde de cada una de las intersecciones.

Pasando al contexto local, en la ciudad de Bogot´a, Colombia el control de las se˜nales de

semaforizaci´on se realiza en base en las recomendaciones de RILSA (Richtlinien f¨ur

Lichtsig-nalanlagen) el cual es un compendio de consideraciones y estrategias para el control de la

(16)

2.2 Estrategias de control basadas en modelo

Un arduo trabajo se ha desarrollado en torno al modelado del tr´afico urbano. Si bien, es

total-mente imposible predecir con exactitud la llegada de un autom´ovil a una intersecci´on, existen

estimaciones que, con porcentajes de error aceptables, permiten predecir el comportamiento

de la red bajo condiciones preestablecidas.

Antes de 1980, era com´un emplear modelos basados en primer principio. Ellos escudri˜nan

la f´ısica buscando los axiomas que rigen el comportamiento del fen´omeno que se ha de

mod-elar, con el fin de conocer a cabalidad su desempe˜no dadas unas condiciones iniciales. Sin

embargo, llegar hasta estos puntos de detalle con fines de control lo hacen dif´ıcil, tedioso y

hasta imposible de implementar. [4]

En la b´usqueda de un modelo m´as manejable y utilizable, se emplean los denominados

mode-los de caja negra. Estos modelos son m´as sencillos, y se basan en aproximaciones, regresiones

de datos obtenidos as´ı como modelos basados en capas de redes neuronales. A pesar de su

simplicidad, su desempe˜no es excelente cuando se emplean para fines de control. Sin embargo,

presentan ciertos vac´ıos de informaci´on, m´as cuando se busca explicar las causas de las

rela-ciones expuestas en sus ecuarela-ciones; adem´as, es necesario definir diferentes variables a priori,

como lo es el orden de la regresión, el número de neuronas o el número de capas de redes

neuronales. En la presente revisi´on de literatura, se consideran los modelos de caja negra

como si fuesen algoritmos no basados en modelo, puesto que no existe un trasfondo te´orico

que sustente estos resultados. Por ende, s´olo las simplificaciones que se realicen a partir de

los modelos denominadosprimer principio ser´an tenidos en cuenta como modelos de redes de

tr´afico urbanas. [4]

2.2.1 Estrategias de control predictivas. Caso de estudio: MPC

MPC, tal y como lo indica su nombre, hace uso de modelos para predecir la respuesta de la

planta. Con esta predicci´on, busca el camino ´optimo para su variable de control. Este tipo

de control es muy empleado para procesos qu´ımicos e industriales. Est´a conformado

(17)

Una vez las señales son predichas, pasarán por el optimizador, el cual encontrará el camino

´

optimo en t´erminos de las variables de control [39] [7]. Es importante resaltar que MPC no

es una estrategia de control sino un conjunto de m´etodos de control que unidos minimizan

determinada funci´on objetivo, y en base a esto plantea las se˜nales de control.

En el modelamiento del tráfico urbano existen múltiples altenativas, expuestas en la sección

n´umero cinco del presente cap´ıtulo. De igual manera, es destacable el trabajo realizado en

[52] donde se emplea el modelo Store-and-Forward desarrollado inicialmente por Gazis &

Potts que permite la aplicación de técnicas de optimización lineares cuadráticas (LQ por

sus siglas en ingl´es) altamente eficientes. En [11] [23] [1] [54] [26] se destacan el empleo del

modelo METANET para el control de tr´afico urbano en autopistas. En [49] [25] emplean

sis-temas dinámicos y lógicos mixtos (MLD por sus siglas en inglés) buscando adaptar el modelo

a los sistemas computacionales actuales, facilitando el procesamiento y reduciendo el costo

computacional. En [11] [8] [35] [14] [27] se plantea el modelo Store-and-Forward distribuido,

buscando aliviar las situaciones de falla que se presenten en la red, planteando una red basada

en relaciones de vecindad.

En los sistemas de control, se parte de un punto de referencia a seguir, que corresponde al

estado final al cual se desea llevar el sistema. El modelo que se emplee realizar´a la predicci´on

del estado futuro, que se comparar´a con el punto de referencia. Esta resta producir´a un

error futuro, que recibir´a el optimizador. Este con las restricciones y las funciones de costo

brindará las señales de control, que irán al modelo de la red, comenzando de nuevo el proceso.

La anterior descripci´on se puede apreciar en la figura 2.2.

2.2.2 Control distribuido: Distributed Model Predictive Control (DMPC)

Algunos m´etodos de control de tr´afico urbano adaptativo son empleados en intersecciones

ais-ladas. ´Estos m´etodos se conocen bajo el t´ıtulo de control descentralizado [11]. El control

de-scentralizado busca controlar intersecciones aisladas, empleando algoritmos adaptativos para

tal fin. En el control descentralizado no presentamos intercambio de informaci´on entre cada

uno de los dispositivos que controlan la red. Todos ellos tienen la autonom´ıa de tomar sus

(18)

Figura 2.2: Esquema general de MPC. Tomada de [7]

El control descentralizado se suele confundir con el control distribuido. Este control

dis-tribuye por toda la red sensores cuyas se˜nales son captadas por dispositivos locales. Este

esquema requiere de un sistema de comunicaciones que permita el flujo de informaci´on entre

los dispositivos a un ente central, que realiza la optimizaci´on de toda la red con base en

las mediciones recibidas y devuelve a cada dispositivo la acci´on de control pertinente. Sin

embargo, las estrategias de control centralizado no son tolerantes a la falla. Cualquier error

en el sistema de comunicaciones anula la eficacia del sistema de control. Por otra parte, el

control distribuido, si bien presenta un menor desempe˜no que el control centralizado, es m´as

tolerante a la falla. En [8] [14] [17] se presenta el modelo S-a-F, donde se interact´ua con el

concepto de vecindades. Cada una de las intersecciones tiene relaci´on directa s´olo con sus

”vecinas”. El concepto de vecindad permite definir las intersecciones que influyen en una en

particular, as´ı como las intersecciones que esta misma afectar´a. Evidentemente, un fallo en la

comunicación de una intersección tendrá efectos directos sólo en aquellas intersecciones con

las cuales presenta vecindad, llegando a tolerar en mayor medida la ausencia de informaci´on.

En [46] se emplea un modelo no lineal distribuido y descentralizado, con el fin de predecir el

estado futuro de las colas de una determinada intersecci´on o secci´on de autopista. Una vez se

realiza esta predicción, se plantea el problema de optimización que otorgará el plan de señales

´

(19)

2.2.3 Algoritmos basados en Control ´optimo

El control ´optimo, se considera como una rama de la matem´atica, donde se estudian los

proce-sos de optimizaci´on bajo sistemas variantes en el tiempo, considerando cuando hubiese lugar

posibles perturbaciones en el sistema. El control ´optimo modela sistemas mediante ecuaciones

diferenciales, buscando encontrar las trayectorias de las variables de control que minimicen la

funci´on de costo. [36]

Partimos definiendo un sistema de control como sigue:

˙

x=f(x, u) (2.2)

Donde

x corresponde a las variables de estado,

u corresponde a las variables de control

Donde tambi´en resulta pertinente definir un control, como una funci´onω : [0, T]→U acotada

y medible. Se define un control, con el fin de establecer el tipo de funci´on, el espacio y las

caracter´ısticas de las mismas. Una trayectoriaγ : [0, T]→Ode un sistema de control definido

en el intervalo [0, T], es una curva absolutamente continua que satisface ˙γ =f(γ(t), ω(t)) para

casi todot[0, T]. Para un sistema de control,consideramos la siguiente funci´onL:OxU → <

donde se buscan todas las trayectorias que cumplan con la ecuaci´on diferencial que se

encuen-tren entre un valor m´ınimoX0 que corresponde at= 0 y un valor m´aximox1 que corresponde

a t=T tal que minimicen la función. Reescribiéndolo en términos de un problema de

opti-mizaci´on, tenemos:

min Z T

0

L(x(t), u(t))dt (2.3)

s.a.

˙

x=f(x, u)

x(0) =x0

(20)

El anterior planteamiento describe un cl´asico problema de control ´optimo, denominado forma

de Lagrange del problema de control ´optimo. Basados en modelamientos bajo control ´optimo,

pueden llegar a ser tratadas situaciones como incidentes en las v´ıas de tr´ansito, tal y como

se plantea en [62], donde se expone un modelamiento basado en algoritmos gen´eticos, donde

la optimizaci´on del flujo de autos es realizada mediante control ´optimo. Realizar

optimiza-ciones bajo esquemas de control ´optimo permite mejorar el desempe˜no de la red urbana,

demostr´andose en [62] mediante simulaciones que el retardo total de una cola puede llegar a

reducirse en un 20%, resultados muy favorables para el caso. En [19] Se realiza un control

descentralizado de tr´afico urbano, donde cada nodo de la red resuelve un problema de control

´

optimo para obtener el plan de se˜nales. En [46] tras emplear un modelo no lineal, se optimiza

el plan de se˜nales para cada intersecci´on.

2.2.4 Algoritmos basados en teor´ıa de grafos [4]

El m´as grande matem´atico de la historia, Leonard Euler, fue el precursor de la teor´ıa de

grafos tan difundida hoy en d´ıa. Mediante un esquema, Euler logr´o representar la

infor-mación más relevante de una red de urbana de Königsberg, Rusia, con el fin de determinar si

era factible atravesar los 7 puentes del pueblo durante el mismo viaje sin recorrerlos dos veces.

En la teor´ıa de grafos, cabe distinguir dos componentes principales: los v´ertices y los

ar-cos. Los v´ertices representan por lo general lugares espec´ıficos, y los arcos, a su vez, cada uno

de los diferentes caminos que, con determinada direcci´on, conducen de un v´ertice a otro. Los

vértices se suelen clasificar según el número de arcos que lleguen y partan del mismo.

Grado de un v´ertice

Se define como el grado de un v´ertice el n´umerom, tal quem:

m= 2n (2.4)

Donden representa el n´umero de pares selectos, es decir, pares conformados por un arco que

(21)

Empleando la teor´ıa de grafos, se han realizado diversos modelos de redes de tr´afico urbano.

En este caso, es posible realizar una analog´ıa directa entre las redes geof´ısicas y las asociadas

al tr´afico vehicular. Las redes geof´ısicas suelen ser entendidas como aquellas redes dentro de

las cuales las aguas naturales fluyen tanto por el suelo como el subsuelo de la tierra. De por

s´ı, cada uno de los r´ıos es un perfecto ejemplo de estructuras naturales basadas en fractales.

En estos casos, no s´olo se considera la corriente principal, tambi´en se tienen en cuenta las

redes fluviales de aguas lluvia que desembocan en los afluentes. Este tipo de redes se asemejan

a las vistas en el área de tráfico urbano, espec´ıficamente hablando en términos de modelos

macroscópicos, donde es común hacer comparaciones entre el tráfico vehicular y sistemas de

conducción de agua. Además, en ambos ámbitos se emplean modelos basados en teor´ıa de

grafos, aplicados a redes sin escala.

Además de esta aproximación basada en una analog´ıa con las redes fluviales, existen múltiples

aplicaciones directas de la teor´ıa de grafos en la literatura. Tettamanti en [52] y Eduardo

Cam-ponogara en [14] [8] [17] emplean modelos basados en teor´ıa de grafos dirigidos, con el fin de

predecir el estado futuro de las colas en la red. Este modelo se basa en la din´amica propuesta

por Papageorgiou [27] donde se especifica la din´amica de llenado y vac´ıo de colas bajo un

es-quema macrosc´opico. En [21] la red es modelada con un grafo dirigido, teniendo en cuenta las

restricciones de las v´ıas como par´ametro de los arcos. A su vez, intenta mejorar el desempe˜no

de la red de tr´afico empleando de forma paralela un algoritmo de selecci´on de ruta basado en

colonias de hormigas. En [58] Se emplea la teor´ıa de grafos en determinadas v´ıas principales.

Con los datos provenientes de c´amaras especialmente programadas para detectar el paso de

autom´oviles, se predice el estado presente de la red. En [19] se emplea un grafo dirigido para

modelar la red, donde cada uno de los nodos trabaja de modo descentralizado, resolviendo un

problema de control ´optimo en cada caso.

2.2.5 Algoritmos basados en sistemas h´ıbridos

En las últimas décadas, con ayuda del avance en la electrónica y la computación, diversos

sistemas f´ısicos continuos han sido migrados a un espacio discreto. un claro ejemplo de ello

es la discretización de señales eléctricas análogas, para después ser procesadas con diversos

(22)

espectro de frecuencia. Realizar estos procesamientos en el espacio digital permite una mayor

flexibilidad al trabajar en alto nivel, facilitando procesos cada vez m´as complejos.

Para estas descripciones en espacio discreto de sistemas din´amicos, fue necesario desarrollar

herramientas matem´aticas que permitieran tanto describir como operar estos sistemas. Por

ejemplo, hoy en d´ıa se cuentan con las redes de Petri, y ´algebras tropicales como las expuestas

en la tesis doctoral de Bart de Schutter [12]. Hoy en d´ıa, una rama que ha tomado gran

importancia en este campo es la fundamentada en sistemas basados en eventos discretos. Los

sistemas basados en eventos discretos, son sistemas que se encuentran en espacios discretos,

en los cuales su estado actual evoluciona dependiendo de la ocurrencia de eventos particulares

[12].

En el tr´afico urbano, podemos encontrar modelos que emplean a la vez tiempo continuo y

tiempo discreto. Estos modelos se conocen con el nombre de sistemas h´ıbridos. Es importante

resaltar que las redes de tr´afico urbanas pueden ser modeladas por medio de estos sistemas.

Para ello, modelan parte de su comportamiento mediante t´ecnicas en tiempo continuo, y la

restante en tiempo discreto. Sin embargo, es necesario definir las interacciones entre los dos

espacios, definiendo la din´amica que los va a regir.

Basados en modelos h´ıbridos, en [2] se presenta un modelo basado en redes de Petri h´ıbridas

para una intersecci´on de tres fases. Tambi´en se muestran resultados comparativos con el

tr´afico urbano de la ciudad de Tur´ın, en Italia. En [18] se da a luz un modelo que representa

las intersecciones y las autopistas como redes de Petri, teniendo en cuenta consideraciones

estoc´asticas para el modelado del comportamiento vehicular. En [15] se emplea una red de

Petri de tres niveles, con el fin de representar la din´amica y la red en si misma, teniendo en

cuenta tanto peatones como veh´ıculos. En [9] se pueden emplear las descripciones de queue

theory,las cuales pueden ser llevadas al contexto de tr´afico urbano y por ´ultimo, empleando

los conceptos de max-plus ´algebra expuestos en [12], se puede llegar a una aproximaci´on en

(23)

2.3 Estrategias de control no basadas en modelo

Las estrategias de control no basadas en modelo desligan su funcionamiento de las rigurosas

ecuaciones dictadas por aquellos basados en el primer principio. En vez de ello, emplean

métodos matemáticos que se acomodan a las peculiaridades de la planta que se está

mode-lando. A continuaci´on, se muestran algoritmos de control de tr´afico urbano no basados en

modelo, entendiendo que algunas t´ecnicas de control ajustan sus par´ametros con el fin de

modelar la red de tr´afico.

2.3.1 Algoritmos de control basados en Machine Learning

Los algoritmos basados en Machine Learning aprovechan los recursos de memoria de los

dis-positivos para actuar, siendo de por s´ı muy adaptativos al entorno bajo el cual se empleen,

puesto que pretenden lograr que la m´aquina “aprenda” mediante la interacci´on del sistema con

se˜nales de entrada y salida de su entorno. Las principales t´ecnicas desarrolladas en Machine

Learning son: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje

semisuper-visado, transducci´on y aprendizaje por refuerzo, entre otras. Existen t´ecnicas aplicadas de

Machine Learning (ML) empleadas en control de tr´afico urbano, aprovechando su flexibilidad

debida al no empleo de modelo por parte de la misma. Entre ellas, se destacan el aprendizaje

por refuerzo (RL).

´

Esta ´ultima, descrita en [5] y [55] en t´erminos de sus componentes, que son:

El aprendiz: Es la m´aquina o agente. Se encarga de leer el estado del entorno, as´ı como

interpretar las recompensas que ´este le brinde y actuar ante ´el.

El entorno: Corresponde al ente con el cual el aprendiz interact´ua. ´Este recibe las acciones

del agente, y se modifica de acuerdo a la acci´on del aprendiz.

La t´ecnica de RL se basa en aprender en base a la experiencia, bajo un esquema de ensayo

y error, a diferencia de las t´ecnicas en general de ML donde el aprendizaje se basa en el

(24)

ob-Figura 2.3: Diagrama de Reinforcement Learning

jetivos, donde el aprendiz interactúa con el entorno, realizando alguna acción sobre él. El

entorno, dado un est´ımulo por la m´aquina, retorna una recompensa a la misma, estableciendo

la retroalimentaci´on necesaria que ser´a interpretado por el agente para producir la siguiente

acción hacia el entorno. La técnica se puede acercar a las redes de tráfico urbanas, donde

el agente corresponde con el algoritmo de control implementado, y el entorno con la red de

tr´afico urbana. En la figura 2.3.1 se puede evidenciar el esquema de reinforcement learning,

basado en [51]. En ML se evidencian trabajos como el de Yang, Chen, Tang y Sun en [66]

planteando un esquema descentralizado basado en un modelo microsc´opico, y los trabajos de

Zhang Hong-lei et al en [31] y Gregoire et al en [42] donde exponen algoritmos basados en

Q-Learning, realizando un an´alisis de desempe˜no contra los algoritmos de tiempo fijo.

2.3.2 Algoritmos basados en l´ogica difusa

En 1965, Lotfi A. Zadeh introdujo un nuevo concepto a las matem´aticas: los denominados

conjuntos difusos. En su publicaci´on, denominada Fuzzy sets, dio forma a una nueva ´area

en las matem´aticas. Seg´un el texto original del propio Lotfi, los conjuntos difusos permiten

saber el grado de afinidad de cada elemento con su respectivo conjunto, midi´endola con un

(25)

de precisi´on a la hora de trabajar con conjuntos grandes.

El principio b´asico de estos conjuntos se fundamenta en un mapeo que se realiza tomando

como dominio el conjunto inicial y como imagen el rango comprendido entre [0,1]. La funci´on

que realiza este mapeo se suele denominar funci´on de pertenencia (en ingl´es, membership

function) y mediante una regla verifica las caracter´ısticas de cada elemento respecto de la

definici´on del conjunto, con el fin de asignar el valor correspondiente entre el rango dado.

Bajo esta base matem´atica, Lotfi desarrolla un teor´ıa de conjuntos, buscando realizar

corre-spondencias directas entre la teor´ıa est´andar de conjuntos con la desarrollada por ´el mismo.

A partir de los conceptos dictados por Lotfi, naci´o la llamada l´ogica difusa, que, a diferencia

de la lógica clásica, se caracteriza por incluir incertidumbre o ”imprecisión” en el algoritmo.

Basado en este trasfondo matem´atico, en [30], se desarrolla un controlador de tr´afico urbano

basado en l´ogica difusa, el cual se divide en dos capas que trabajan en paralelo. La primera,

busca determinar la duraci´on de los tiempos de verde de cada una de las fases, extendi´endolas

de acuerdo al n´umero de veh´ıculos que se encuentren en la v´ıa. La segunda, busca

modi-ficar los desfases entre los planes de se˜nales, cumpliendo con las restricciones propias de la

intersecci´on. En [34] se presenta un modelo complejo de una red de tr´afico urbana basado en

reglas definidas en un contexto de conjuntos difusos, en ´el se puede observar un manejo de

información tanto online como offline. Con la medición del número de veh´ıculos en la cola, se

emplean ”expertos locales offline” encargados de analizar y ajustar los planes de se˜nales con

la ayuda de un algoritmo genético. Quizá una de las primeras aproximaciones en términos de

lógica difusa es [45], donde se analiza el control de una intersección que sólo posee dos fases.

En [29] Se propone un esquema de varias intersecciones controladas por un algoritmo local

que brinda el plan de se˜nales y las fases ´optimas. En [10] se desarrolla un controlador con solo

nueve reglas, destac´andose por la b´usqueda de simplicidad. En [40] [47] y [22] se presentan

tambi´en controladores basados en l´ogica difusa para controles distribuidos y descentralizados.

2.3.3 Algoritmos bioinspirados

La inform´atica y la biolog´ıa sostienen dos relaciones bien definidas: la bioinform´atica y la

bioinspiración. La bioinformática se basa en el empleo de técnicas y recursos propios de la

(26)

referente a moléculas biológicas, que por lo general son orgánicas, como también complejas

en su estructura [59].

La bioinspiración nace del análisis de los sistemas biológicos, donde se busca simular

sis-temas biol´ogicos en busca de esquemas heur´ısticos no determin´ısticos de aprendizaje,

com-portamiento y b´usqueda, entre otros [59].

Estos esquemas modelan de forma aproximada diversos comportamientos y fen´omenos de la

naturaleza. Se caracterizan por ser no determin´ısticos, es decir, por presentar

comportamien-tos aleatorios. Adicionalmente, pueden llegar a presentar una estructura multiagente,

real-izando procesos concurrentes. Adem´as, estos algoritmos llegan a ser adaptativos, adapt´andose

al entorno en el cual se desenvuelven, modificando tanto el modelo como los par´ametros del

mismo [59].

Ejemplo de los algoritmos bioinspirados son las famosas redes neuronales, donde su gran

paradigma se basa en lograr un aprendizaje autom´atico. Relacionados al tr´afico urbano se

destacan los modelos basados en redes neuronales aplicados al control de trafico urbano

pre-sentados en [24] [27] [38]. Existen tambi´en algoritmos evolutivos, los cuales se basan en los

principios Darwinianos de la evoluci´on natural, donde se emplean modelos poblacionales, en

el cual cada uno de los elementos representa componentes y soluciones del problema an´alogo.

Una amplia rama se ha desarrollado alrededor de Swarm Intelligence, donde se estudian

en-jambres como entes colectivos, empleando sus estrategias de comportamiento para el control

y modelamiento de sistemas poblacionales, tal y como se plantea en [61] [43] [48], donde se

hace una analog´ıa entre el problema de asignaci´on de tiempo de verde y el problema de

asig-nación del número de abejas dispuestas a realizar labores de búsqueda de comida, destacando

también el no empleo de modelos de la red de tráfico urbana, haciéndolo factible de

imple-mentarse a gran escala. Tal y como se expone en [48], la estrategia de control bioinspirada en

las colonias de abejas y su esquema de alimentaci´on busca maximizar el flujo, minimizando

los tiempos de viaje. En la tabla 2.1 se presenta un s´ımil entre la colonia de abejas y una red

(27)

Tabla 2.1: Comparaci´on entre los dos casos

Social bee foraging Control de tr´afico

Un conjuntoB de recolectores Un conjunto de M unidades

de n´ectar ubicados en N ´areas de tiempo ubicadas enN fases

Un conjunto de abejaspj es Una porci´on de tiempo disponible

asignado a un sitioj λi es asignado a la fasei

´

Areas floridas y secas espaci- Demandas de tr´afico cambiantes

almente distribuidas en intersecciones espacialmente

distribuidas

Un grupo de recolectoresxi Un grupo de unidades de tiempogi es

cosecha n´ectar en un ´area dada asignado a alguna fase de luzi

Cada ´area es asociada a una Cada fase es asociada con veh´ıculos

calidad variable en una cola y al tiempo total de espera

La cantidad total de n´ectar co- El tr´afico durante determinada fase

lectado por una abeja depende por unidad de tiempo depende de la

del n´umero de abejas en el ´area longitud de la cola y el tiempo total

y la calidad de la miel asignado a cada fase

El porcentaje de colectores en El porcentaje de tiempo asignado a

todas las ´areas debe satisfacer todas las fases debe satisfacer

PN

j pj = 1 Pi∈{3,4}gi =M k

2.3.4 Algoritmos basados en din´amicas poblacionales y teor´ıa evolutiva

El tr´afico urbano puede ser visto desde un punto de vista poblacional, debido a que cada

veh´ıculo tiene un comportamiento individual, que organizados en poblaciones persiguen

de-terminados objetivos. Por ejemplo, cada uno de los individuos busca tomar la v´ıa que lo

lleve a su destino final en el menor tiempo posible, gastando la m´ınima cantidad de gasolina,

o recorriendo la menor distancia. Estas poblaciones se caracterizan por presentar

compor-tamientos id´enticos, buscando cada uno de los objetivos expuestos previamente [50] .

En este orden de ideas, una alternativa que permite recrear estas caracter´ısticas grupales son

(28)

conforman de agentes de caracter´ısticas id´enticas, conservando su autonom´ıa. Si se repasa la

descripción de tráfico urbano realizada en el párrafo anterior, la semejanza con la estructura

de un juego poblacional es evidente. Ahora, las poblaciones requieren de tres caracter´ısticas

definidas: la primera, es que cada poblaci´on cuente con un gran n´umero de agentes capaces

de tomar decisiones independientes; la segunda describe a cada agente como peque˜no,

en-tendi´endolo desde un punto de vista en el cual sus acciones no afectan los objetivos de otro

dentro del mismo grupo poblacional, y la tercera indica que el resultado obtenido por cada

agente responde a la estrategia definida para su poblaci´on y de la distribuci´on de las otras

estrategias asumidas por otros grupos poblacionales, sin entrar en consideraci´on directa con

agentes que escojan otras estrategias [50].

Los juegos poblacionales, a pesar de modelar las redes de tr´afico urbanas, no permiten

con-trolarlas si no se tiene en cuenta la din´amica que existe entre las poblaciones que se hayan

definido. Para este fin, se emplean las din´amicas evolutivas, donde se recrean las interacciones

entre estas poblaciones, siempre de la mano de las funciones de costo y rentabilidad de cada

una de las poblaciones [50].

2.4 Modelos de redes de tr´

afico urbano

Cuando realizamos un modelo, buscamos imitar la respuesta de una red bajo determinados

par´ametros de control. Una vez el modelo se ajuste a la red real podemos emplearlo para

predecir sus futuros estados. Basados en las anteriores predicciones, se pueden buscar caminos

´

optimos que lleguen al punto deseado con el menor coste posible. La funci´on de costo puede

tener diferentes variables de control, que son categorizadas en tres grandes focos: el primero

corresponde a las luces de tráfico urbano, el segundo a la señalización con mensajes variables

y el tercero corresponde a la se˜nalizaci´on de las rampas de entradas a las autopistas, conocido

como “ramp metering”.Si bien las redes son sistemas f´ısicos reales con variables continuas,

el modelo por lo general emplea variables discretas para representarlas, que dependen del

intervalo de tiempo discreto que se haya definido. [44].

Existen múltiples y variados modelos de redes de tráfico urbanas. En esta sección, se

(29)

tráfico urbano se pueden dividir en 2 categor´ıas: según la topolog´ıa y según el nivel de detalle.

2.4.1 Modelos de tr´afico urbano seg´un la topolog´ıa

Las redes de tr´afico urbano tambi´en pueden ser subdivididas en redes y autopistas. Cuando

nos referimos a una red de tr´afico urbano, estamos hablando de m´ultiples v´ıas e

intersec-ciones con capacidades muy semejantes. Cuando alguna de estas v´ıas presenta una capacidad

de tr´afico considerablemente mayor e influyente en la red de tr´afico urbano, comenzamos a

hablar de tr´afico de autopista. Gran cantidad de las estrategias de control se han desarrollado

para este tipo de tr´afico. Sin embargo, existen estudios en los cuales se integran los dos

mod-elos. Este es el caso presentado en [27], donde los dos modelos se presentan independientes

para despu´es intercambiar informaci´on y presentar resultados conjuntos. En [27] se muestran

resultados destacables, mostrando una mejora del 30% sobre el no aplicar ninguna estrategia

de control. A continuaci´on se expone m´as a fondo los modelos basados en autopistas y en redes.

Modelos basados en autopistas

Las autopistas hoy en d´ıa son v´ıas de tr´afico masivo, que alivian las congestiones de las redes

circundantes, presentando una alternativa en lo posible r´apida y de mayor prioridad que el

resto de la red. Con ellas, se busca generar un espacio de movilizaci´on masivo entre

distan-cias considerablemente largas. Por lo general, se emplean modelos de tr´afico macrosc´opicos

para representarlas. En [54] [27] [11] [3] se desarrollan modelos macrosc´opicos para tr´afico en

autopistas.

En los modelos macrosc´opicos se destaca el control por medio de Ramp Metering. Ramp

Metering busca comprometer el desempe˜no de las rampas de entrada aprovechando su

ca-pacidad, evitando saturar la autopista. En estos modelos, el control es realizado por medio

de sem´aforos, principalmente. En [27] [67] [23] [18] [64] se exponen diferentes modelos y

aplicaciones basados en ramp metering.

Modelos basados en redes

Los modelos basados en redes representan v´ıas paralelas y perpendiculares con recursos muy

(30)

como tambi´en por estar compuestas por unidades b´asicas denominadas intersecciones.

Sue-len entrar en la categor´ıa de modelos macrosc´opicos, como se puede observar en [1] [32] [63] [2].

2.4.2 Modelos de tr´afico urbano seg´un el nivel de detalle

Los modelos de redes de tr´afico urbanos se pueden dividir en tres categor´ıas principales:

macroscópico, mesoscópico y microscópico [44]. Los tres difieren en el nivel de abstracción

con el cual se considere la red. Los modelos microsc´opicos consideran la existencia de cada

uno de los actores individuales as´ı como las interacciones y caracter´ısticas de la red en la cual

se desenvuelven [41]. Los modelos macrosc´opicos corresponden a esquemas menos espec´ıficos,

y buscan representar la red mediante un modelo de flujos, haciendo en m´ultiples ocasiones

alusi´on a la hidrodin´amica [57]. Aprovechando los beneficios de ambos esquemas, los modelos

mesoscópicos buscan integrar caracter´ısticas macroscópicas y microscópicas.

• Los modelos macrosc´opicos son empleados con el fin de reducir la carga computacional,

puesto que han sido pensados para controlar redes de tr´afico de gran extensi´on [44].

Entre los principales modelos encontramos TRANSYT-7F, FREFLO, NETVACI,

KRO-NOS, AUTOS, METANET y METACOR [37].

• Los modelos mesoscópicos son una aproximación intermedia entre los modelos macroscópicos

y microsc´opicos. Su principal caracter´ıstica es la adquisici´on de los beneficios de ambos.

Sin embargo, considera un nivel de detalle intermedio entre los modelos macrosc´opicos

y microscópicos . Un modelo mesoscópico puede considerar el análisis por grupos de

veh´ıculos, por ejemplo. Entre sus principales representantes se encuentran DYNAMIT,

INTEGRATION, METROPOLIS y DINASMART [37] [44].

• Los modelos microscópicos corresponden al nivel más detallado de análisis de la red,

llegando a considerar cada veh´ıculo de la red como un ente con caracter´ısticas definidas,

relacionados con la infraestructura de la red o con otros veh´ıculos adyacentes. Con

el-los, se busca modelar los comportamientos humanos en la red, haci´endolos complejos y

(31)

(32)

Enunciado del Problema

3.1 Introducci´

on

El control del tr´afico urbano pretende mejorar las condiciones de movilidad de la ciudad.

Entre los principales problemas presentados se encuentran: la alta emisi´on de gases de efecto

invernadero, las congestiones vehiculares, el aumento del n´umero de paradas por veh´ıculo en

el trayecto, la disminuci´on de la velocidad promedio de viaje, entre otros. Cada uno de estos

problemas se representa por un ´ındice de desempe˜no, y han llegado a tratarse por separado

en la literatura del tr´afico urbano, donde se evidencia una alta correlaci´on entre los diferentes

´ındices de la red. Sin embargo, en m´ultiples ocasiones la mejora de uno de ellos implica el

empeoramiento de otro, por lo cual es importante focalizar los esfuerzos en lo que en verdad

concierne. Muchos abogan por el mejoramiento de las condiciones ambientales, en

contra-posición al desempeño temporal de la red. El personal de tráfico urbano tiene la potestad de

decidir cu´al de estos ´ındices es el que m´as le conviene para su caso espec´ıfico.

Dadas las problem´aticas anteriormente expuestas, los investigadores en el ´area de control de

tr´afico urbano se dieron a la tarea de idear algoritmos que mejoraran alguno de los ´ındices

de desempe˜no de la red. Con la ayuda de herramientas computacionales como MATLAB,

se ha logrado aplicar la teor´ıa de control, empleando la programaci´on din´amica, el control

predictivo, la l´ogica difusa, los algoritmos poblacionales y dem´as.

De igual forma, resulta importante el modelado, simulaci´on y caracterizaci´on de las redes

de tr´afico urbano. En este aspecto, muchos investigadores prefieren desarrollar programas

de simulaci´on b´asicos, cumpliendo sus requerimientos, tal y como se aprecia en [28], donde

el simulador no es est´andar y presenta limitaciones importantes. En el mercado existen

(33)

versos paquetes comerciales de modelado de redes vehiculares, sin embargo, el uso de uno

en particular ha tendido a estandarizarse: ´este se llama VISSIM, de la empresa PTV. Este

simulador, pese a su precio, es considerado una de las mejores opciones al modelar redes de

tráfico urbano, siendo empleado por agentes de control de tráfico para la verificación de sus

respectivos planes de se˜nales.

A pesar de las altas prestaciones de VISSIM, resulta muy dif´ıcil establecer algoritmos de

control adaptativos que funcionen bajo este programa. Por otra parte, estos algoritmos son

descritos en MATLAB con mucha frecuencia y facilidad. Dada las vastas capacidades de los

dos, el problema principal reside en crear una interfaz capaz de comunicar estos dos

progra-mas, complementando sus funciones con el fin de simular el algoritmo de control en la red

modelada. Partiendo de esta herramienta computacional de interconexi´on, se pueden obtener

en t´erminos de ´ındices de desempe˜no las prestaciones de diversos algoritmos de control.

Aprovechando las diversas prestaciones de cada uno de los programas, este proyecto de grado

busca describir un API responsable de la comunicaci´on entre VISSIM y MATLAB, creando

una herramienta de un mayor nivel de abstracci´on, que facilite la simulaci´on de algoritmos

de control de tr´afico urbano. Cabe resaltar que esta herramienta est´a enfocada al control de

tr´afico mediante sem´aforos.

En la siguiente secci´on se define el contexto bajo el cual se desarrollar´a el proyecto, y en la

tercera y última sección se expondrán los ´ındices de desempeño de relevancia que se pueden

observar en redes de tr´afico urbanas.

3.2 Redes de tr´

afico urbano

La malla vial urbana se puede descomponer en dos componentes principales: las autopistas

y las redes. En el marco de este proyecto, s´olo se estudian las redes de tr´afico urbano. Ello

no implica que con la API desarrollada no se pueda revisar algoritmos desarrollados para

autopistas, haciendo alusi´on s´olo a los algoritmos de control que se desarrollaron y analizaron

con ayuda de esta herramienta.

Las redes de tr´afico urbano se componen de intersecciones, que se asumen semaforizadas

(34)

secuencia de luces que se debe ejecutar. Estas secuencias de luces permiten o niegan el avance

de los veh´ıculos. Para cada intersecci´on se suelen definir fases, que corresponden a la divisi´on

del tiempo de verde del ciclo total entre las v´ıas que no pueden cruzar al mismo tiempo por

la intersecci´on, debido a que generar´ıan choques vehiculares.

Como es de esperarse, existe regulaci´on para el control de tr´afico urbano por medio de luces.

Estas consideraciones buscan respetar un marco m´ınimo de seguridad para las ´areas urbanas.

Entre las principales restricciones se encuentran la definici´on de los tiempos de luz amarilla,

definidos como dos segundos cuando se realiza la transici´on de rojo a verde, y de 3 segundos

m´ınimo cuando las luces cambian de verde a rojo. El tiempo amarillo entre verde y rojo se

suele calcular dependiendo de la velocidad promedio de la v´ıa, calculando el tiempo necesario

para que un veh´ıculo pueda observarlo y detenerse antes de cruzar la intersecci´on. Otra

re-stricci´on reside en el m´ınimo tiempo de verde por cada fase, definido en dos segundos. Ello

garantiza que por cada ciclo se le permitir´a el paso a los veh´ıculos de todas las fases. En el

desarrollo de este proyecto se tuvieron en cuenta las restricciones anteriormente expuestas.

Para el control de tr´afico adaptativo, es necesario contar con dispositivos de sensado. Desde

hace muchos a˜nos, se suele emplear los bucles magn´eticos que detectan el paso de un veh´ıculo.

Estos dispositivos suelen introducirse bajo la superficie de la v´ıa, dificultando el cambio y

mantenimiento de las mismas. En la actualidad, empresas como IMATIC Ingenier´ıa LTDA

emplean c´amaras ubicadas en las estructuras de soporte de los sem´aforos, capaces de detectar

colas de dos veh´ıculos por carril. Esta tecnolog´ıa a´un est´a en desarrollo, y promete ser un

excelente dispositivo de sensado. En cuanto a las estrategias de control de tr´afico urbano,

se asumi´o que se contaba con c´amaras como instrumento de sensado, buscando cumplir otro

de los principales objetivos de este proyecto, que es realizar desarrollos sobre tecnolog´ıas

disponibles y en desarrollo.

3.3 ´

Indices de desempe˜

no

Un ´ındice de desempe˜no permite comparar la respuesta de dos o m´as controladores ante un

mismo experimento. Estos resultados permiten discernir sobre la efectividad de un m´etodo de

control sobre otro. Sin embargo, para un estudio m´as detallado sobre la efectividad del control

propuesto, es necesario revisar m´as de 3 ´ındices de desempe˜no, evitando tomar decisiones ”a

(35)

esta situaci´on, es pertinente identificar los ´ındices de desempe˜no que realmente demuestren la

mejora o empeoramiento del tr´ansito vehicular. A continuaci´on, se aborda cada uno de ellos,

destacando su importancia en el problema en cuesti´on.

Distancia total viajada(DTV)

Es la distancia que recorre cada uno de los veh´ıculos desde que ingresa a la red hasta que

sale de la misma. Esta distancia corresponde a la suma de las distancias recorridas por todos

los veh´ıculos que entren a la red. Se considera como un ´ındice de desempe˜no puesto que una

distancia total viajada superior a los dem´as algoritmos representa un buen desempe˜no del

algoritmo de control en el experimento.

Tiempo total de viaje(TTV)

El tiempo total de viaje corresponde al tiempo empleado por todos los veh´ıculos que ingresan

a la red en recorrer la distancia total viajada. Este ´ındice de desempe˜no va muy ligado al

DTV, puesto que permite definir por si mismo si el algoritmo de control est´a mejorando o no

la experiencia de tr´afico vial.

Velocidad promedio(VP)

La velocidad promedio corresponde a la relaci´on f´ısica entre la distancia total viajada y el

tiempo total de viaje. De por si, permite ver el desempe˜no de la red en t´erminos impl´ıcitos

de dos ´ındices de desempeño, siendo por este motivo un buen parámetro de comparación.

Tiempo promedio de parada(TPP)

Corresponde al promedio del tiempo que estuvo detenido cada veh´ıculo mientras se

encon-traba atravesando la red, contrastado contra todos los veh´ıculos que atraviesan la red.

N´umero de paradas (NP)

Corresponde al n´umero total de paradas que los veh´ıculos experimentan cuando ingresan a la

(36)

Tiempo total de retraso(TTR)

(37)

Simulador de tr´

afico urbano

El desarrollo de una API que vincule VISSIM y MATLAB es un desaf´ıo que requiere de meses

si se parte de cero. Con este proyecto de grado se busca dar los lineamientos para reducir el

tiempo de desarrollo de una interfaz de simulaci´on, a la vez que se verifican estrategias de

con-trol con ayuda de esta herramienta. Trabajos previos en el tema han sido realizados por Pablo ˜

Na˜nez, los cuales han sido un punto de partida para el trabajo expuesto en este documento.

En las siguientes secciones se expone a profundidad las diferentes caracter´ısticas del simulador.

4.1 Descripci´

on

El simulador de tr´afico urbano consta de dos componentes principales:

1. El modelo de la red de tr´afico implementado en VISSIM.

2. el algoritmo de control y el entorno de la aplicaci´on en MATLAB.

La comunicaci´on entre los dos programas se realiza por medio de un servidor COM,

gener-ado desde MATLAB. La interfaz y el control de flujo de datos se realiza desde este ´ultimo.

Mediante comandos predefinidos en la documentaci´on de VISSIM, se puede acceder y

contro-lar por completo todos los componentes y caracter´ısticas de VISSIM. Uno de los principales

requerimientos funcionales del simulador fue desarrollar el c´odigo orientado a objetos. En la

figura 4.1 se muestra la estructura general del simulador.

El flujo de informaci´on en el simulador se describe a continuaci´on:

1. Una vez abierta la interfaz de usuario del simulador, se ingresan cada uno de los

par´ametros que se indican de la red, o se cargan de un archivo.

(38)

Interfaz de usuario

Control de ejecuci´on

Algoritmo de control

MATLAB

Interfaz de usuario

Interfaz COM

´Indices de desempe˜no

VISSIM

Figura 4.1: Estructura general del simulador

2. Basados en una informaci´on completa, la interfaz crea el entorno de ejecuci´on, encargado

de comunicar la informaci´on entre MATLAB y VISSIM.

3. El entorno de ejecuci´on crea una instancia COM de VISSIM y carga en ella el modelo de

la red a simular, especificado como un archivo de extensi´on*.inp . Despu´es de esto, se

crean controladores virtuales, los cuales simulan el comportamiento de un controlador

de tr´afico real.

4. El entorno de ejecuci´on busca el archivo controlUserDefined.m donde se especifica el

algoritmo que controlar´a la red de tr´afico modelada en VISSIM, crea una instancia de

´

el y le solicita los tiempos de verde.

5. Basado en la informaci´on entregada en la interfaz del usuario, el entorno de ejecuci´on

calcula el plan de se˜nales, con el fin de ser enviado a cada uno de los controladores

virtuales.

6. El entorno de ejecuci´on mediante la interfaz COM env´ıa la informaci´on de cada uno de

los controladores a VISSIM y da la orden de que la simulaci´on comience.

7. Una vez acaba el delta de simulaci´on, se solicita de nuevo a la instancia de

contro-lUserDefined.m los tiempos de verde para cada controlador, a la vez que se obtienen

los ´ındices de desempe˜no (i.e. colas) de VISSIM, para volver a ejecutar desde el paso

n´umero 5.

8. Una vez la simulaci´on alcanza el tiempo total definido, el entorno de ejecuci´on cierra

(39)

Figura 4.2: Simulador de tr´afico urbano

misma carpeta donde se encontraba el archivo de extensi´on *.inp.

El delta de simulaci´on es el tiempo que VISSIM emplea exclusivamente para la simulaci´on.

Una vez el delta de simulaci´on termina, VISSIM permite al entorno de ejecuci´on continuar

con las siguientes l´ıneas de código, según el flujo de información expuesto previamente. Los

´ındices de desempe˜no son seleccionados en VISSIM antes de ejecutar la simulaci´on, y se ven

reflejados en archivos de extensiones*.stz y*.npe. El simulador permite ejecutar varias

sim-ulaciones al tiempo. El simulador se puede apreciar en la figura 4.2.

4.2 Interfaz de usuario

La interfaz de usuario se puede apreciar en la figura 4.2. En ella, se distinguen cuatro

(40)

nombre lo indica, en ella se seleccionar´a la versi´on de VISSIM que tenga instalada en su

or-denador y con la que desea trabajar. Debe tener en cuenta si instal´o la versi´on de 32 o 64

bits. Con el panelSelect Network se debe ubicar el archivo*.inp que implementa el modelo

de la red en VISSIM. De igual forma, con el panelSelect Control Algorithm se debe ubicar el

archivo ControlUserDefined.m que implementa el algoritmo de control y calcula los tiempos

de verde. Dependiendo del algoritmo de control, m´ultiples ´ındices de desempe˜no pueden llegar

a ser requeridos. Para tal fin, es necesario definir cuáles y cuántos ´ındices de desempeño se

emplearán, con el fin de que esta información sea actualizada y esté disponible por la instancia

decontrolUserDefined.m.

La segunda columna hace alusión a los parámetros de la red de tráfico. En primer lugar, se

debe ingresar el n´umero de controladores con los cuales cuenta la red. Para cada uno de estos

controladores es necesario ingresar ciertos par´ametros, como lo son el n´umero de grupos de

se˜nales, el tiempo de ciclo, el orden de las luces y el segundo en el cual comienza la luz verde

para cada una de las fases. Tambi´en en la segunda columna se define un tiempo total de

simulaci´on, comprendido entre 1 y 3600 segundos. Con ayuda del bot´on DrawSignalPlan es

posible observar el plan de se˜nales actual de cada uno de los controladores.

En la tercera columna se pueden ingresar los tiempos reglamentarios de amarillo para cada

una de las dos transiciones. En el panel Sensor asignment se realiza la asignaci´on de los

contadores de colas de VISSIM a los controladores virtuales que se describieron previamente.

Tambi´en se cuenta con los comandos b´asicos que permiten manejar el simulador, como lo son

Save,Load,Start,Stop yNew One, que crea una nueva simulaci´on.

Por ´ultimo, la cuarta columna es un panel informativo, donde se muestra la informaci´on del

archivo *.inp que modela la red en VISSIM. Adem´as, con el bot´on results se puede ir a la

ubicaci´on de los archivos que contienen los resultados de la simulaci´on.

4.3 Arquitectura

El simulador de tr´afico urbano se encuentra programado orientado a objetos. En total, consta

de seis clases m´as la interfaz de usuario, que fue desarrollada con la herramienta GUIDE de

(41)

Interfaz: La interfaz recopila toda la informaci´on ingresada por el usuario y crea el entorno

de ejecuci´on. Tambi´en restringe determinadas acciones del usuario que en este contexto no

son v´alidas.

Clase COMInterfaceVISSIM: En esta clase se construye la conexi´on entre VISSIM y

MATLAB. También se encuentran métodos que permiten acceder y enviar información a

VISSIM.

Clase ControllerUserDefined: En esta clase el usuario define sus estrategias de control,

ya sean adaptativas o de tiempo fijo. tambi´en se encarga de generar los tiempos de verde para

cada uno de los controladores virtuales que se hayan creado.

Clase HybridController: Cada instancia de esta clase corresponde a un ”controlador

vir-tual”. Cada uno hace las veces de controlador de campo, interpretando los planes de se˜nales

y enviando las ´ordenes exactas que deben seguir sus equivalentes controladores en la red de

VISSIM.

Clase SignalPlan: Esta clase genera los planes de se˜nales a partir de la informaci´on que el

usuario ha ingresado en la interfaz y de los tiempos de verde que ha entregado previamente

la claseControlUserDefined.

Clase UTNSimulation: Se encarga de coordinar la ejecuci´on de la simulaci´on, enviando y

recibiendo informaci´on proveniente del modelo de red generado en VISSIM.

MainSimulation: Es la clase principal del entorno de ejecuci´on, donde se almacenan las

instancias de las clases previamente expuestas, exceptuando a la interfaz. Cada nueva

(42)

Algoritmos de control

Con el fin de probar la funcionalidad de los algoritmos de control de tr´afico urbano, se

de-scriben a continuaci´on algoritmos basados en tiempo fijo y en estrategias adaptativas. En

total, se simular´an dos algoritmos basados en tiempo fijo y cuatro algoritmos basados en

es-trategias adaptativas. A continuaci´on se presentan cada uno de ellos.

5.1 Estrategias basadas en tiempo fijo

Hoy en d´ıa, el control de tr´afico urbano, en su gran mayor´ıa, se realiza basado en estrategias

de tiempo fijo. Por ejemplo, en Colombia, la mayor parte del tr´afico urbano fuera de las

ciu-dades capitales es controlada mediante estas estrategias de control, empleando informaci´on

offlinede la red. Por estas razones, es importante estudiar los algoritmos basados en tiempos

´

optimos, puesto que la infraestructura vial permite implementarlos sin realizar modificaciones.

Sin embargo, no resulta suficiente generar secuencias de luces con el fin de que controlen los

sem´aforos de las intersecciones. Es necesario que esta programaci´on vaya acorde las

deman-das de las v´ıas, y que a su vez sean lo m´as cercanas al ´optimo posible. En el control de

tráfico urbano, debido a su naturaleza estocástica, no se podrá alcanzar el óptimo de la red,

sin embargo, bajo ciertas restricciones, se pueden llegar a aproximaciones totalmente v´alidas

que nos llevan a sub´optimos muy competitivos. En la literatura, se destacan dos algoritmos

que son un punto de partida para muchos otros: la aproximaci´on de F. V. Webster [56] y la

aproximaci´on de B. de Schutter [13]. En este documento se consignan los resultados de

im-plementar la estrategia propuesta por Webster, como también los planes de señales diseñados

por IMATIC e implementados en la ciudad de Barranquilla, Colombia.