Presentado a
LA UNIVERSIDAD DE LOS ANDES
FACULTAD DE INGENIER´IA
DEPARTAMENTO DE INGENIER´IA EL´ECTRICA Y ELECTR ´ONICA
Para obtener el t´ıtulo de
INGENIERO ELECTR ´ONICO
por
Iv´an Felipe Guti´errez Delgado
CONTROL DE TR ´AFICO URBANO
Sustentado el 26 de junio de 2013 frente al jurado:
Composici´on del jurado
Asesor: Nicanor Quijano Silva Ph.D, Profesor asociado, Ohio State University
Coasesor: Pablo Andr´es ˜Na˜nez Ojeda Ph.D Student, University of Arizona
Jurado: Jos´e Fernando Jim´enez Vargas Ph.D, Institut National des Sciences Ap-pliqu´ees
Se implementa un simulador de tr´afico urbano orientado a objetos que integra MATLAB y
VISSIM PTV. Partiendo de la herramienta, se simulan algoritmos adaptativos basados en
Replicator Dynamics, Model Predictive Control, Distributed Model Predictive Control y
Dis-tributed Reinforcement Learning. Tambi´en se simulan algoritmos de tiempo fijo basados en
optimizaci´on y se comparan todos los resultados contra los presentados al simular un plan
de se˜nales implementado en la ciudad de Barranquilla, Colombia. Con la simulaci´on de los
Agradecimientos
Con la entrega de este proyecto concluyo a cabalidad mis estudios de pregrado. Recuerdo que
hace cinco a˜nos, cuando culminaba el nivel educativo de media vocacional, nunca aspir´e a terminar en este per´ıodo dos pregrados, cuando lo habitual en otras instituciones es alcanzar
solo un t´ıtulo. Conociendo la proximidad de mi grado, considero necesario destacar todo el apoyo que he recibido a lo largo de mis estudios: la compa˜n´ıa y el inefable amor de mi mam´a Martha Cecilia Delgado; el apoyo de mi padre Eliseo Guti´errez Cruz, del cual no tengo reparo
ni afrenta alguna, siendo durante toda mi vida un padre ejemplar; mis hermanos C´esar y Diego, aquellos con quienes crec´ı y disfrut´e los paisajes de mi natal Santander; a mi novia Paula Daniela, quien afronta mis visicitudes y la galbana que me invade junto con el sue˜no;
a la compa˜n´ıa de tantos y pocos, que en mi acentuada soledad aliviaron todo ese desd´en que punzaba mi alma.
Muchos otros merecen agradecimientos, y me excuso por no escribir expl´ıcitamente sus nom-bres. Sin embargo, m´as que tres frases dicen mis actos, y en beneficiencia de ellos y de todo
aquel que me apoye o se alegre de mi bienestar, obrar´e a favor de ´estos.
La direcci´on y apoyo de Nicanor Quijano y Pablo ˜Na˜nez han sido de vital importancia en este proyecto. Cada uno de sus logros son motivos que inspiran a ser como m´ınimo de su talante. Muchas gracias por permitirme discernir el camino adecuado.
Tabla de contenido
1 Introducci´on 1
2 Revisi´on de literatura 3
2.1 Estrategias de control de tr´afico urbano [44] [41] [65] . . . 3
2.1.1 Estrategias de control de tr´afico urbano basadas en tiempo fijo . . . 4
2.1.2 Estrategias de control de tr´afico urbano adaptativas . . . 6
2.2 Estrategias de control basadas en modelo . . . 8
2.2.1 Estrategias de control predictivas. Caso de estudio: MPC . . . 8
2.2.2 Control distribuido: Distributed Model Predictive Control (DMPC) . . 9
2.2.3 Algoritmos basados en Control ´optimo . . . 11
2.2.4 Algoritmos basados en teor´ıa de grafos [4] . . . 12
2.2.5 Algoritmos basados en sistemas h´ıbridos . . . 13
2.3 Estrategias de control no basadas en modelo . . . 15
2.3.1 Algoritmos de control basados en Machine Learning . . . 15
2.3.2 Algoritmos basados en l´ogica difusa . . . 16
2.3.3 Algoritmos bioinspirados . . . 17
2.3.4 Algoritmos basados en din´amicas poblacionales y teor´ıa evolutiva . . . . 19
2.4 Modelos de redes de tr´afico urbano . . . 20
2.4.1 Modelos de tr´afico urbano seg´un la topolog´ıa . . . 21
2.4.2 Modelos de tr´afico urbano seg´un el nivel de detalle . . . 22
3 Enunciado del Problema 24 3.1 Introducci´on . . . 24
3.2 Redes de tr´afico urbano . . . 25
3.3 ´Indices de desempe˜no . . . 26
4 Simulador de tr´afico urbano 29 4.1 Descripci´on . . . 29
4.2 Interfaz de usuario . . . 31
4.3 Arquitectura . . . 32
5 Algoritmos de control 34 5.1 Estrategias basadas en tiempo fijo . . . 34
5.1.1 Aproximaci´on de F. V. Webster para el c´alculo de tiempos ´optimos . . . 35
5.1.2 Planes de se˜nales de IMATIC Ingenier´ıa LTDA . . . 39
5.2 Estrategias adaptativas al tr´afico . . . 39
5.2.1 Model Predictive Control . . . 39
5.2.2 Distributed Model Predictive Control . . . 40
5.2.3 Replicator Dynamics . . . 40
5.2.4 Distributed Reinforcement Learning . . . 40
6 Experimentos y consideraciones 43 6.1 Red de tr´afico simulada . . . 43
6.2 Caracter´ısticas de los controladores . . . 45
6.3 Descripci´on de los experimentos . . . 46
6.4 Resultados esperados . . . 48
7 An´alisis y resultados 49
8 Conclusiones y trabajo futuro 53
Referencias 55
´
Indice de figuras
2.1 Diagrama de de tiempo vs espacio de MAXBAND. Tomado de [33] . . . 6
2.2 Esquema general de MPC. Tomada de [7] . . . 10
2.3 Diagrama de Reinforcement Learning . . . 16
4.1 Estructura general del simulador . . . 30
4.2 Simulador de tr´afico urbano . . . 31
5.1 Retardo seg´un Webster. En la figura, se puede observar gr´aficamente el retardo entre los dos casos posibles. [20] . . . 35
5.2 Comparaci´on entre los valores de retardo calculados y los valores observados. [56] . . . 36
6.1 Una sola intersecci´on de la red de Barranquilla . . . 44
6.2 Red de Barranquilla de 8 intersecciones. . . 45
´
Indice de tablas
2.1 Comparaci´on entre los dos casos . . . 19
7.1 Resultados comparados contra el controlador basado en los planes de se˜nales enviados por IMATIC . . . 52
A.1 Tabulaci´on de 2(1(1−−λλx)2) . . . 62 A.2 Tabulaci´on de 2(1x−2x) . . . 63
Introducci´
on
Cada vez que alg´un ente gubernamental decide implementar un nuevo sistema de transporte,
puede caer en la desgracia de perder sus inversiones si los contratistas encargados no han
realizado estudios exhaustivos sobre el efecto de sus obras. Esta situaci´on lleva a pensar si
existen las suficientes herramientas para realizar dichos estudios. Una de estas
herramien-tas es la simulaci´on, que hoy en d´ıa permite verificar de forma virtual los resultados a bajo
costo, por lo cual es completamente indicada para realizar estudios referidos al tr´afico urbano.
Con el fin de facilitar el estudio de algoritmos de control de tr´afico urbano, este trabajo de
grado ha sido enfocado al desarrollo de una herramienta computacional que simplifique la
simulaci´on, y a su vez reduzca el tiempo de desarrollo de los diferentes algoritmos, trabajando
bajo una plataforma est´andar, a la vez que se estudian algoritmos de control de tr´afico urbano.
La principal contribuci´on que existe en este campo ha sido un punto de referencia clave para
este trabajo, y corresponde al expuesto en [53]. En este trabajo se describen cada uno de
los componentes de una API (Application Programming Interface) empleada para simular
algoritmos de control de tr´afico urbano, as´ı como las interacciones entre ellos. A modo de
ejemplo, se presenta un algoritmo basado en Model Predictive Control y se presentan
resul-tados al respecto. Cabe resaltar el trabajo de Kuyer en [28], donde se muestra un algoritmo
de control basado en Reinforcement Learning empleando grafos coordinados mediante un
al-goritmo basado en Max-Plus ´algebra, el cual fue un punto de partida para el algoritmo de
control basado en Reinforcement Learning presentado en este documento. En [56] se presenta
un modelo de retardo para cada intersecci´on, y partiendo del mismo se optimizan diversos
par´ametros de la misma, tales como el tiempo de ciclo y los tiempos de verde; tambi´en se
presenta un modelo para par´ametros de la red como los son las colas. Muchas de las
sideraciones expuestas por Webster fueron tenidas en cuenta para el desarrollo de algoritmos
que s´olo optimizan tiempos de verde e ignoran los tiempos de ciclo.
Los principales aportes de este proyecto de grado se mencionan a continuaci´on: el desarrollo
de una API orientada a objetos para la simulaci´on de algoritmos de control de tr´afico urbano,
empleando MATLAB y VISSIM PTV para tal fin; la optimizaci´on de los tiempos de ciclo
aplicada a algoritmos adaptativos de control de tr´afico y la creaci´on de un algoritmo de
con-trol basado en Reinforcement Learning, capaz de sincronizar acciones ´optimas entre agentes
vecinos empleando un algoritmo iterativo basado en max-plus ´algebra.
El resto del documento se estructura de la siguiente forma: en el segundo cap´ıtulo se expone
la revisi´on de literatura. En el cap´ıtulo n´umero tres se describe el problema general que se
aborda, dando restricciones y consideraciones pertinentes. En el cap´ıtulo cuatro se expone el
simulador de tr´afico urbano a profundidad, siendo ´este el principal objetivo del proyecto de
grado. En el cap´ıtulo cinco se exponen los algoritmos de control que han sido simulados con
la herramienta dise˜nada, implementando un algoritmo de control basado en Reinforcement
Learning, es considerado uno de los principales aportes de este proyecto. En el cap´ıtulo n´umero
seis se exponen los experimentos que se llevar´an a cabo teniendo en cuenta las consideraciones
particulares de la red a simular. En el cap´ıtulo siete se presentan los resultados y an´alisis de las
simulaciones empleando la herramienta, para terminar en el cap´ıtulo ocho con las conclusiones
Revisi´
on de literatura
A continuaci´on se presenta la revisi´on de literatura. En su primera secci´on se describen las
estrategias de control de tr´afico urbano, resaltando diferencias entre algoritmos basados en
tiempo fijo y en control de tr´afico adaptativo. En la secci´on n´umero dos se abordan los
algorit-mos y modelos de tr´afico basados en modelos, resaltando sus diferentes caracter´ısticas. En la
secci´on n´umero tres se hace referencia a algoritmos de control de tr´afico urbano adaptativo no
basados en modelo. Se comienza en la secci´on n´umero tres con algoritmos de control basados
en Machine Learning, l´ogica difusa, bioinspirados y culmina con din´amicas poblacionales. En
la secci´on n´umero cuatro se presenta una revisi´on de los modelos de tr´afico urbano,
clasifica-dos seg´un la topolog´ıa y el nivel de detalle.
2.1
Estrategias de control de tr´
afico urbano [44] [41] [65]
Las estrategias de control de tr´afico son las aplicaciones de la teor´ıa de control empleadas
en el mejoramiento del tr´ansito vehicular. En el control de tr´afico urbano a nivel global, las
estrategias de control se encuentran divididas en dos grandes variantes: estrategias de tiempo
fijo y estrategias de control adaptativas al tr´afico. En esta secci´on, se abordan las principales
estrategias de control, incluyendo las estrategias que hoy en d´ıa manejan el tr´afico urbano
como tambi´en aquellas encontradas en ´ambitos acad´emicos.
2.1.1 Estrategias de control de tr´afico urbano basadas en tiempo fijo
Las estrategias de control basadas en tiempo fijo funcionan en base a c´alculos offline de la red,
es decir, las mediciones y c´alculos que se realicen para determinar los respectivos tiempos de
verde, amarillo y rojo de cada sem´aforo se realizan en base a datos estad´ısticos de mediciones
previas, para despu´es ser programados en los respectivos controladores de sem´aforos [44]. Por
su simplicidad, son empleadas a lo largo de todo el mundo, puesto que implican un bajo
costo de implementaci´on. Estas estrategias de control no requieren de sensores, bas´andose en
un control open-loop que lee las se˜nales de control de la respectiva memoria del controlador,
espacio en el cual se han almacenado los tiempos de las luces de tr´afico una vez han sido
procesadas estad´ısticamente. Cada estrategia se diferencia de otra en su funci´on objetivo, en
sus restricciones y en sus variables de control, tales como capacidad de intersecciones,
capaci-dad de las colas, n´umero de paradas, tiempo total de paradas, entre otras. Por lo general,
estas estrategias de control de tr´afico son dise˜nadas bajo condiciones de red no saturadas [44].
Entre las estrategias de control basadas en tiempo fijo, se distinguen dos variantes: las
estrate-gias de control para intersecciones aisladas y las de control coordinado de intersecciones.[41]
Las estrategias de control para intersecciones aisladas se basan en un modelo de red simple,
aplicable a zonas de muy bajos flujos vehiculares. Dos ejemplos de estrategias de control de
tiempo fijo para intersecciones aisladas corresponden a SIGSET y SIGCAP. Estas estrategias
de control por su simplicidad son muy semejantes, sin embargo, difieren en la funci´on objetivo
que optimizan. Ambas estrategias de control se basan en limitar la capacidad que tiene
de-terminada v´ıa por encima de la demanda de la red. Adicionalmente, poseen l´ımites m´aximos
y m´ınimos para el tiempo de verde. Matem´aticamente las podemos describir de la siguiente
forma [44]:
sj m
X
i=1
αijλi≥dj ∀j (2.1)
Donde
λ0+λ1+. . .+λm= 1
λ0 =L/c
representa el derecho de paso, tomando valores de cero o uno,λirepresenta la duraci´on relativa
del tiempo de verde respecto del tiempo de ciclo c,λ0 representa el tiempo perdido relativo
al tiempo de ciclo, donde L representa el tiempo total perdido. Para el caso de SIGSET,
se busca minimizar el tiempo total de espera de la intersecci´on, para el caso de SIGCAP se
busca maximizar la capacidad de las intersecciones [41].
En cuanto a las estrategias de control coordinado de intersecciones, sus principales
represen-tantes son MAXBAND, UTCS y TRANSYT. En general, buscan mejorar el desempe˜no de
las v´ıas principales, en base a datos estad´ısticos tomados de las mismas. Presentan un muy
buen desempe˜no ante redes no congestionadas. Estas estrategias de control conllevan bajos
costos de implementaci´on, al no requerir dispositivos de sensado de tr´afico. La estrategia bajo
MAXBAND acu˜n´o el t´ermino “ola verde”, buscando la minimizaci´on de los tiempos de parada
de una v´ıa principal. La “ola verde” consiste en una secuencia sucesiva de luces de sem´aforo
verdes en la direcci´on de flujo de los autom´oviles, logrando que el autom´ovil en cuesti´on se
detenga lo menos posible a lo largo de su trayecto [41] [44] [33].
Tal y como lo expone Little en [33], MAXBAND consideranintersecciones en la v´ıa arterial.
Se define como ancho de banda a aquella fracci´on de tiempo de ciclo en la cual un veh´ıculo
situado en una determinada intersecci´on podr´a experimentar la ola verde. Ello implica que los
veh´ıculos sean conducidos en un rango de velocidades fijos, definidos por el ancho de banda de
cada intersecci´on. En la figura 2.1.1 se puede observar un diagrama de tiempo vs. espacio de
MAXBAND.S1, S2, . . . , Sn son intersecciones, o en t´erminos del autor, se˜nales. Se pueden apreciar dos trayectorias principales: la trayectoria m´as ancha corresponde al flujo saliente,
y la m´as delgada corresponde al flujo entrante. En la imagen se puede apreciar el concepto
de ancho de banda, representados para cada uno de los flujos comob yb. Cada una de las
l´ıneas observadas representa la trayectoria que han de seguir los veh´ıculos, y la pendiente de
estas rectas corresponden a las velocidades que ´estos deben llevar para mantenerse en la ola
verde. Paralelas al ejex, se pueden apreciar l´ıneas fraccionadas referidas a las se˜nales. Cada
una de estas l´ıneas hace referencia al tiempo de luz roja de cada uno de los sem´aforos de la
Figura 2.1: Diagrama de de tiempo vs espacio de MAXBAND. Tomado de [33]
2.1.2 Estrategias de control de tr´afico urbano adaptativas
Con respecto a las estrategias de control de tr´afico basadas en tiempo fijo, las estrategias de
tr´afico urbano adaptativas se basan en mediciones en tiempo real de la red, actuando ante
variaciones instant´aneas en ella. Este comportamiento permite una mejor respuesta del
sis-tema de control a perturbaciones y cambios, siendo m´as resistente a variaciones en los flujos
debidas a eventos fortuitos, como los son los accidentes, las aver´ıas y las saturaciones. Existen
tambi´en dos variantes en las estrategias de control de tr´afico urbano adaptativas, tal y como
sucede con las estrategias de control basadas en tiempo fijo: estrategias adaptativas para una
intersecci´on aislada, o estrategias adaptativas para intersecciones coordinadas. Sin embargo,
esta clasificaci´on no es del todo excluyente. Tambi´en se tratar´an las estrategias de tr´afico
urbano que emplean o no modelo, en las siguientes secciones.
Estrategias adaptativas para intersecciones aisladas
Para intersecciones aisladas, las principales estrategias de control son llamadas “m´etodo de
intervalo de veh´ıculos” y Microprocessor Optimised Vehicle Actuation (MOVA), que es una
mejora a la anterior. Las dos estrategias se basan en la fijaci´on de un tiempo m´ınimo de verde,
se aumenta o disminuye el tiempo de verde obteniendo valores en el rango que se ha fijado
con anterioridad. La diferencia entre un m´etodo y otro reside en la flexibilidad de la funci´on
objetivo cuando se emplea MOVA, puesto que optimiza diferentes variables dependiendo de
la condici´on de saturaci´on de la red, maximizando la capacidad de las intersecciones bajo
condiciones saturadas, o minimizando los retardos o paradas bajo condiciones no saturadas.
Estrategias adaptativas para intersecciones coordinadas
Entre las estrategias de control adaptativas para intersecciones coordinadas, existen varias
caracterizadas por realizar un control centralizado, denominadas SCATS (Sydney
Coordi-nated Area Traffic System), RHODES, MOTION, TUC y SCOOT (Split, Cycle and Offset
Optimization Technique). Esta ´ultima t´ecnica se encuentra basada en la estrategia de
TRAN-SYT, donde el c´alculo se realiza de forma centralizada basado en un modelo del sistema. Con
base en los datos provenientes del modelo y la red, SCOOT investiga en tiempo real el efecto
producido en la red por cambios incrementales en el tiempo de ciclo, en las desviaciones y
desplazamiento. El optimizador de ciclo se encarga de revisar los niveles de saturaci´on de
cada una de las intersecciones individualmente, mientras que el optimizador de desviaciones
se encarga de generar retrasos o adelantos en las se˜nales de control, buscando la mejor
com-binaci´on para ese momento espec´ıfico de la red. El optimizador de desplazamiento se encarga
de minimizar los tiempos y n´umero de paradas que se realicen.
Adicionalmente a esta estrategia, existen otros algoritmos conocidos, como OPAC, PRODYN,
CRONOS [6] y RHODES, basados en un modelado riguroso de la red, implicando mayores
tiempos de c´omputo en el c´alculo de los tiempos de verde de cada una de las intersecciones.
Pasando al contexto local, en la ciudad de Bogot´a, Colombia el control de las se˜nales de
semaforizaci´on se realiza en base en las recomendaciones de RILSA (Richtlinien f¨ur
Lichtsig-nalanlagen) el cual es un compendio de consideraciones y estrategias para el control de la
2.2
Estrategias de control basadas en modelo
Un arduo trabajo se ha desarrollado en torno al modelado del tr´afico urbano. Si bien, es
total-mente imposible predecir con exactitud la llegada de un autom´ovil a una intersecci´on, existen
estimaciones que, con porcentajes de error aceptables, permiten predecir el comportamiento
de la red bajo condiciones preestablecidas.
Antes de 1980, era com´un emplear modelos basados en primer principio. Ellos escudri˜nan
la f´ısica buscando los axiomas que rigen el comportamiento del fen´omeno que se ha de
mod-elar, con el fin de conocer a cabalidad su desempe˜no dadas unas condiciones iniciales. Sin
embargo, llegar hasta estos puntos de detalle con fines de control lo hacen dif´ıcil, tedioso y
hasta imposible de implementar. [4]
En la b´usqueda de un modelo m´as manejable y utilizable, se emplean los denominados
mode-los de caja negra. Estos modelos son m´as sencillos, y se basan en aproximaciones, regresiones
de datos obtenidos as´ı como modelos basados en capas de redes neuronales. A pesar de su
simplicidad, su desempe˜no es excelente cuando se emplean para fines de control. Sin embargo,
presentan ciertos vac´ıos de informaci´on, m´as cuando se busca explicar las causas de las
rela-ciones expuestas en sus ecuarela-ciones; adem´as, es necesario definir diferentes variables a priori,
como lo es el orden de la regresi´on, el n´umero de neuronas o el n´umero de capas de redes
neuronales. En la presente revisi´on de literatura, se consideran los modelos de caja negra
como si fuesen algoritmos no basados en modelo, puesto que no existe un trasfondo te´orico
que sustente estos resultados. Por ende, s´olo las simplificaciones que se realicen a partir de
los modelos denominadosprimer principio ser´an tenidos en cuenta como modelos de redes de
tr´afico urbanas. [4]
2.2.1 Estrategias de control predictivas. Caso de estudio: MPC
MPC, tal y como lo indica su nombre, hace uso de modelos para predecir la respuesta de la
planta. Con esta predicci´on, busca el camino ´optimo para su variable de control. Este tipo
de control es muy empleado para procesos qu´ımicos e industriales. Est´a conformado
Una vez las se˜nales son predichas, pasar´an por el optimizador, el cual encontrar´a el camino
´
optimo en t´erminos de las variables de control [39] [7]. Es importante resaltar que MPC no
es una estrategia de control sino un conjunto de m´etodos de control que unidos minimizan
determinada funci´on objetivo, y en base a esto plantea las se˜nales de control.
En el modelamiento del tr´afico urbano existen m´ultiples altenativas, expuestas en la secci´on
n´umero cinco del presente cap´ıtulo. De igual manera, es destacable el trabajo realizado en
[52] donde se emplea el modelo Store-and-Forward desarrollado inicialmente por Gazis &
Potts que permite la aplicaci´on de t´ecnicas de optimizaci´on lineares cuadr´aticas (LQ por
sus siglas en ingl´es) altamente eficientes. En [11] [23] [1] [54] [26] se destacan el empleo del
modelo METANET para el control de tr´afico urbano en autopistas. En [49] [25] emplean
sis-temas din´amicos y l´ogicos mixtos (MLD por sus siglas en ingl´es) buscando adaptar el modelo
a los sistemas computacionales actuales, facilitando el procesamiento y reduciendo el costo
computacional. En [11] [8] [35] [14] [27] se plantea el modelo Store-and-Forward distribuido,
buscando aliviar las situaciones de falla que se presenten en la red, planteando una red basada
en relaciones de vecindad.
En los sistemas de control, se parte de un punto de referencia a seguir, que corresponde al
estado final al cual se desea llevar el sistema. El modelo que se emplee realizar´a la predicci´on
del estado futuro, que se comparar´a con el punto de referencia. Esta resta producir´a un
error futuro, que recibir´a el optimizador. Este con las restricciones y las funciones de costo
brindar´a las se˜nales de control, que ir´an al modelo de la red, comenzando de nuevo el proceso.
La anterior descripci´on se puede apreciar en la figura 2.2.
2.2.2 Control distribuido: Distributed Model Predictive Control (DMPC)
Algunos m´etodos de control de tr´afico urbano adaptativo son empleados en intersecciones
ais-ladas. ´Estos m´etodos se conocen bajo el t´ıtulo de control descentralizado [11]. El control
de-scentralizado busca controlar intersecciones aisladas, empleando algoritmos adaptativos para
tal fin. En el control descentralizado no presentamos intercambio de informaci´on entre cada
uno de los dispositivos que controlan la red. Todos ellos tienen la autonom´ıa de tomar sus
Figura 2.2: Esquema general de MPC. Tomada de [7]
El control descentralizado se suele confundir con el control distribuido. Este control
dis-tribuye por toda la red sensores cuyas se˜nales son captadas por dispositivos locales. Este
esquema requiere de un sistema de comunicaciones que permita el flujo de informaci´on entre
los dispositivos a un ente central, que realiza la optimizaci´on de toda la red con base en
las mediciones recibidas y devuelve a cada dispositivo la acci´on de control pertinente. Sin
embargo, las estrategias de control centralizado no son tolerantes a la falla. Cualquier error
en el sistema de comunicaciones anula la eficacia del sistema de control. Por otra parte, el
control distribuido, si bien presenta un menor desempe˜no que el control centralizado, es m´as
tolerante a la falla. En [8] [14] [17] se presenta el modelo S-a-F, donde se interact´ua con el
concepto de vecindades. Cada una de las intersecciones tiene relaci´on directa s´olo con sus
”vecinas”. El concepto de vecindad permite definir las intersecciones que influyen en una en
particular, as´ı como las intersecciones que esta misma afectar´a. Evidentemente, un fallo en la
comunicaci´on de una intersecci´on tendr´a efectos directos s´olo en aquellas intersecciones con
las cuales presenta vecindad, llegando a tolerar en mayor medida la ausencia de informaci´on.
En [46] se emplea un modelo no lineal distribuido y descentralizado, con el fin de predecir el
estado futuro de las colas de una determinada intersecci´on o secci´on de autopista. Una vez se
realiza esta predicci´on, se plantea el problema de optimizaci´on que otorgar´a el plan de se˜nales
´
2.2.3 Algoritmos basados en Control ´optimo
El control ´optimo, se considera como una rama de la matem´atica, donde se estudian los
proce-sos de optimizaci´on bajo sistemas variantes en el tiempo, considerando cuando hubiese lugar
posibles perturbaciones en el sistema. El control ´optimo modela sistemas mediante ecuaciones
diferenciales, buscando encontrar las trayectorias de las variables de control que minimicen la
funci´on de costo. [36]
Partimos definiendo un sistema de control como sigue:
˙
x=f(x, u) (2.2)
Donde
x corresponde a las variables de estado,
u corresponde a las variables de control
Donde tambi´en resulta pertinente definir un control, como una funci´onω : [0, T]→U acotada
y medible. Se define un control, con el fin de establecer el tipo de funci´on, el espacio y las
caracter´ısticas de las mismas. Una trayectoriaγ : [0, T]→Ode un sistema de control definido
en el intervalo [0, T], es una curva absolutamente continua que satisface ˙γ =f(γ(t), ω(t)) para
casi todot[0, T]. Para un sistema de control,consideramos la siguiente funci´onL:OxU → <
donde se buscan todas las trayectorias que cumplan con la ecuaci´on diferencial que se
encuen-tren entre un valor m´ınimoX0 que corresponde at= 0 y un valor m´aximox1 que corresponde
a t=T tal que minimicen la funci´on. Reescribi´endolo en t´erminos de un problema de
opti-mizaci´on, tenemos:
min Z T
0
L(x(t), u(t))dt (2.3)
s.a.
˙
x=f(x, u)
x(0) =x0
El anterior planteamiento describe un cl´asico problema de control ´optimo, denominado forma
de Lagrange del problema de control ´optimo. Basados en modelamientos bajo control ´optimo,
pueden llegar a ser tratadas situaciones como incidentes en las v´ıas de tr´ansito, tal y como
se plantea en [62], donde se expone un modelamiento basado en algoritmos gen´eticos, donde
la optimizaci´on del flujo de autos es realizada mediante control ´optimo. Realizar
optimiza-ciones bajo esquemas de control ´optimo permite mejorar el desempe˜no de la red urbana,
demostr´andose en [62] mediante simulaciones que el retardo total de una cola puede llegar a
reducirse en un 20%, resultados muy favorables para el caso. En [19] Se realiza un control
descentralizado de tr´afico urbano, donde cada nodo de la red resuelve un problema de control
´
optimo para obtener el plan de se˜nales. En [46] tras emplear un modelo no lineal, se optimiza
el plan de se˜nales para cada intersecci´on.
2.2.4 Algoritmos basados en teor´ıa de grafos [4]
El m´as grande matem´atico de la historia, Leonard Euler, fue el precursor de la teor´ıa de
grafos tan difundida hoy en d´ıa. Mediante un esquema, Euler logr´o representar la
infor-maci´on m´as relevante de una red de urbana de K¨onigsberg, Rusia, con el fin de determinar si
era factible atravesar los 7 puentes del pueblo durante el mismo viaje sin recorrerlos dos veces.
En la teor´ıa de grafos, cabe distinguir dos componentes principales: los v´ertices y los
ar-cos. Los v´ertices representan por lo general lugares espec´ıficos, y los arcos, a su vez, cada uno
de los diferentes caminos que, con determinada direcci´on, conducen de un v´ertice a otro. Los
v´ertices se suelen clasificar seg´un el n´umero de arcos que lleguen y partan del mismo.
Grado de un v´ertice
Se define como el grado de un v´ertice el n´umerom, tal quem:
m= 2n (2.4)
Donden representa el n´umero de pares selectos, es decir, pares conformados por un arco que
Empleando la teor´ıa de grafos, se han realizado diversos modelos de redes de tr´afico urbano.
En este caso, es posible realizar una analog´ıa directa entre las redes geof´ısicas y las asociadas
al tr´afico vehicular. Las redes geof´ısicas suelen ser entendidas como aquellas redes dentro de
las cuales las aguas naturales fluyen tanto por el suelo como el subsuelo de la tierra. De por
s´ı, cada uno de los r´ıos es un perfecto ejemplo de estructuras naturales basadas en fractales.
En estos casos, no s´olo se considera la corriente principal, tambi´en se tienen en cuenta las
redes fluviales de aguas lluvia que desembocan en los afluentes. Este tipo de redes se asemejan
a las vistas en el ´area de tr´afico urbano, espec´ıficamente hablando en t´erminos de modelos
macrosc´opicos, donde es com´un hacer comparaciones entre el tr´afico vehicular y sistemas de
conducci´on de agua. Adem´as, en ambos ´ambitos se emplean modelos basados en teor´ıa de
grafos, aplicados a redes sin escala.
Adem´as de esta aproximaci´on basada en una analog´ıa con las redes fluviales, existen m´ultiples
aplicaciones directas de la teor´ıa de grafos en la literatura. Tettamanti en [52] y Eduardo
Cam-ponogara en [14] [8] [17] emplean modelos basados en teor´ıa de grafos dirigidos, con el fin de
predecir el estado futuro de las colas en la red. Este modelo se basa en la din´amica propuesta
por Papageorgiou [27] donde se especifica la din´amica de llenado y vac´ıo de colas bajo un
es-quema macrosc´opico. En [21] la red es modelada con un grafo dirigido, teniendo en cuenta las
restricciones de las v´ıas como par´ametro de los arcos. A su vez, intenta mejorar el desempe˜no
de la red de tr´afico empleando de forma paralela un algoritmo de selecci´on de ruta basado en
colonias de hormigas. En [58] Se emplea la teor´ıa de grafos en determinadas v´ıas principales.
Con los datos provenientes de c´amaras especialmente programadas para detectar el paso de
autom´oviles, se predice el estado presente de la red. En [19] se emplea un grafo dirigido para
modelar la red, donde cada uno de los nodos trabaja de modo descentralizado, resolviendo un
problema de control ´optimo en cada caso.
2.2.5 Algoritmos basados en sistemas h´ıbridos
En las ´ultimas d´ecadas, con ayuda del avance en la electr´onica y la computaci´on, diversos
sistemas f´ısicos continuos han sido migrados a un espacio discreto. un claro ejemplo de ello
es la discretizaci´on de se˜nales el´ectricas an´alogas, para despu´es ser procesadas con diversos
espectro de frecuencia. Realizar estos procesamientos en el espacio digital permite una mayor
flexibilidad al trabajar en alto nivel, facilitando procesos cada vez m´as complejos.
Para estas descripciones en espacio discreto de sistemas din´amicos, fue necesario desarrollar
herramientas matem´aticas que permitieran tanto describir como operar estos sistemas. Por
ejemplo, hoy en d´ıa se cuentan con las redes de Petri, y ´algebras tropicales como las expuestas
en la tesis doctoral de Bart de Schutter [12]. Hoy en d´ıa, una rama que ha tomado gran
importancia en este campo es la fundamentada en sistemas basados en eventos discretos. Los
sistemas basados en eventos discretos, son sistemas que se encuentran en espacios discretos,
en los cuales su estado actual evoluciona dependiendo de la ocurrencia de eventos particulares
[12].
En el tr´afico urbano, podemos encontrar modelos que emplean a la vez tiempo continuo y
tiempo discreto. Estos modelos se conocen con el nombre de sistemas h´ıbridos. Es importante
resaltar que las redes de tr´afico urbanas pueden ser modeladas por medio de estos sistemas.
Para ello, modelan parte de su comportamiento mediante t´ecnicas en tiempo continuo, y la
restante en tiempo discreto. Sin embargo, es necesario definir las interacciones entre los dos
espacios, definiendo la din´amica que los va a regir.
Basados en modelos h´ıbridos, en [2] se presenta un modelo basado en redes de Petri h´ıbridas
para una intersecci´on de tres fases. Tambi´en se muestran resultados comparativos con el
tr´afico urbano de la ciudad de Tur´ın, en Italia. En [18] se da a luz un modelo que representa
las intersecciones y las autopistas como redes de Petri, teniendo en cuenta consideraciones
estoc´asticas para el modelado del comportamiento vehicular. En [15] se emplea una red de
Petri de tres niveles, con el fin de representar la din´amica y la red en si misma, teniendo en
cuenta tanto peatones como veh´ıculos. En [9] se pueden emplear las descripciones de queue
theory,las cuales pueden ser llevadas al contexto de tr´afico urbano y por ´ultimo, empleando
los conceptos de max-plus ´algebra expuestos en [12], se puede llegar a una aproximaci´on en
2.3
Estrategias de control no basadas en modelo
Las estrategias de control no basadas en modelo desligan su funcionamiento de las rigurosas
ecuaciones dictadas por aquellos basados en el primer principio. En vez de ello, emplean
m´etodos matem´aticos que se acomodan a las peculiaridades de la planta que se est´a
mode-lando. A continuaci´on, se muestran algoritmos de control de tr´afico urbano no basados en
modelo, entendiendo que algunas t´ecnicas de control ajustan sus par´ametros con el fin de
modelar la red de tr´afico.
2.3.1 Algoritmos de control basados en Machine Learning
Los algoritmos basados en Machine Learning aprovechan los recursos de memoria de los
dis-positivos para actuar, siendo de por s´ı muy adaptativos al entorno bajo el cual se empleen,
puesto que pretenden lograr que la m´aquina “aprenda” mediante la interacci´on del sistema con
se˜nales de entrada y salida de su entorno. Las principales t´ecnicas desarrolladas en Machine
Learning son: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje
semisuper-visado, transducci´on y aprendizaje por refuerzo, entre otras. Existen t´ecnicas aplicadas de
Machine Learning (ML) empleadas en control de tr´afico urbano, aprovechando su flexibilidad
debida al no empleo de modelo por parte de la misma. Entre ellas, se destacan el aprendizaje
por refuerzo (RL).
´
Esta ´ultima, descrita en [5] y [55] en t´erminos de sus componentes, que son:
El aprendiz: Es la m´aquina o agente. Se encarga de leer el estado del entorno, as´ı como
interpretar las recompensas que ´este le brinde y actuar ante ´el.
El entorno: Corresponde al ente con el cual el aprendiz interact´ua. ´Este recibe las acciones
del agente, y se modifica de acuerdo a la acci´on del aprendiz.
La t´ecnica de RL se basa en aprender en base a la experiencia, bajo un esquema de ensayo
y error, a diferencia de las t´ecnicas en general de ML donde el aprendizaje se basa en el
ob-Figura 2.3: Diagrama de Reinforcement Learning
jetivos, donde el aprendiz interact´ua con el entorno, realizando alguna acci´on sobre ´el. El
entorno, dado un est´ımulo por la m´aquina, retorna una recompensa a la misma, estableciendo
la retroalimentaci´on necesaria que ser´a interpretado por el agente para producir la siguiente
acci´on hacia el entorno. La t´ecnica se puede acercar a las redes de tr´afico urbanas, donde
el agente corresponde con el algoritmo de control implementado, y el entorno con la red de
tr´afico urbana. En la figura 2.3.1 se puede evidenciar el esquema de reinforcement learning,
basado en [51]. En ML se evidencian trabajos como el de Yang, Chen, Tang y Sun en [66]
planteando un esquema descentralizado basado en un modelo microsc´opico, y los trabajos de
Zhang Hong-lei et al en [31] y Gregoire et al en [42] donde exponen algoritmos basados en
Q-Learning, realizando un an´alisis de desempe˜no contra los algoritmos de tiempo fijo.
2.3.2 Algoritmos basados en l´ogica difusa
En 1965, Lotfi A. Zadeh introdujo un nuevo concepto a las matem´aticas: los denominados
conjuntos difusos. En su publicaci´on, denominada Fuzzy sets, dio forma a una nueva ´area
en las matem´aticas. Seg´un el texto original del propio Lotfi, los conjuntos difusos permiten
saber el grado de afinidad de cada elemento con su respectivo conjunto, midi´endola con un
de precisi´on a la hora de trabajar con conjuntos grandes.
El principio b´asico de estos conjuntos se fundamenta en un mapeo que se realiza tomando
como dominio el conjunto inicial y como imagen el rango comprendido entre [0,1]. La funci´on
que realiza este mapeo se suele denominar funci´on de pertenencia (en ingl´es, membership
function) y mediante una regla verifica las caracter´ısticas de cada elemento respecto de la
definici´on del conjunto, con el fin de asignar el valor correspondiente entre el rango dado.
Bajo esta base matem´atica, Lotfi desarrolla un teor´ıa de conjuntos, buscando realizar
corre-spondencias directas entre la teor´ıa est´andar de conjuntos con la desarrollada por ´el mismo.
A partir de los conceptos dictados por Lotfi, naci´o la llamada l´ogica difusa, que, a diferencia
de la l´ogica cl´asica, se caracteriza por incluir incertidumbre o ”imprecisi´on” en el algoritmo.
Basado en este trasfondo matem´atico, en [30], se desarrolla un controlador de tr´afico urbano
basado en l´ogica difusa, el cual se divide en dos capas que trabajan en paralelo. La primera,
busca determinar la duraci´on de los tiempos de verde de cada una de las fases, extendi´endolas
de acuerdo al n´umero de veh´ıculos que se encuentren en la v´ıa. La segunda, busca
modi-ficar los desfases entre los planes de se˜nales, cumpliendo con las restricciones propias de la
intersecci´on. En [34] se presenta un modelo complejo de una red de tr´afico urbana basado en
reglas definidas en un contexto de conjuntos difusos, en ´el se puede observar un manejo de
informaci´on tanto online como offline. Con la medici´on del n´umero de veh´ıculos en la cola, se
emplean ”expertos locales offline” encargados de analizar y ajustar los planes de se˜nales con
la ayuda de un algoritmo gen´etico. Quiz´a una de las primeras aproximaciones en t´erminos de
l´ogica difusa es [45], donde se analiza el control de una intersecci´on que s´olo posee dos fases.
En [29] Se propone un esquema de varias intersecciones controladas por un algoritmo local
que brinda el plan de se˜nales y las fases ´optimas. En [10] se desarrolla un controlador con solo
nueve reglas, destac´andose por la b´usqueda de simplicidad. En [40] [47] y [22] se presentan
tambi´en controladores basados en l´ogica difusa para controles distribuidos y descentralizados.
2.3.3 Algoritmos bioinspirados
La inform´atica y la biolog´ıa sostienen dos relaciones bien definidas: la bioinform´atica y la
bioinspiraci´on. La bioinform´atica se basa en el empleo de t´ecnicas y recursos propios de la
referente a mol´eculas biol´ogicas, que por lo general son org´anicas, como tambi´en complejas
en su estructura [59].
La bioinspiraci´on nace del an´alisis de los sistemas biol´ogicos, donde se busca simular
sis-temas biol´ogicos en busca de esquemas heur´ısticos no determin´ısticos de aprendizaje,
com-portamiento y b´usqueda, entre otros [59].
Estos esquemas modelan de forma aproximada diversos comportamientos y fen´omenos de la
naturaleza. Se caracterizan por ser no determin´ısticos, es decir, por presentar
comportamien-tos aleatorios. Adicionalmente, pueden llegar a presentar una estructura multiagente,
real-izando procesos concurrentes. Adem´as, estos algoritmos llegan a ser adaptativos, adapt´andose
al entorno en el cual se desenvuelven, modificando tanto el modelo como los par´ametros del
mismo [59].
Ejemplo de los algoritmos bioinspirados son las famosas redes neuronales, donde su gran
paradigma se basa en lograr un aprendizaje autom´atico. Relacionados al tr´afico urbano se
destacan los modelos basados en redes neuronales aplicados al control de trafico urbano
pre-sentados en [24] [27] [38]. Existen tambi´en algoritmos evolutivos, los cuales se basan en los
principios Darwinianos de la evoluci´on natural, donde se emplean modelos poblacionales, en
el cual cada uno de los elementos representa componentes y soluciones del problema an´alogo.
Una amplia rama se ha desarrollado alrededor de Swarm Intelligence, donde se estudian
en-jambres como entes colectivos, empleando sus estrategias de comportamiento para el control
y modelamiento de sistemas poblacionales, tal y como se plantea en [61] [43] [48], donde se
hace una analog´ıa entre el problema de asignaci´on de tiempo de verde y el problema de
asig-naci´on del n´umero de abejas dispuestas a realizar labores de b´usqueda de comida, destacando
tambi´en el no empleo de modelos de la red de tr´afico urbana, haci´endolo factible de
imple-mentarse a gran escala. Tal y como se expone en [48], la estrategia de control bioinspirada en
las colonias de abejas y su esquema de alimentaci´on busca maximizar el flujo, minimizando
los tiempos de viaje. En la tabla 2.1 se presenta un s´ımil entre la colonia de abejas y una red
Tabla 2.1: Comparaci´on entre los dos casos
Social bee foraging Control de tr´afico
Un conjuntoB de recolectores Un conjunto de M unidades
de n´ectar ubicados en N ´areas de tiempo ubicadas enN fases
Un conjunto de abejaspj es Una porci´on de tiempo disponible
asignado a un sitioj λi es asignado a la fasei
´
Areas floridas y secas espaci- Demandas de tr´afico cambiantes
almente distribuidas en intersecciones espacialmente
distribuidas
Un grupo de recolectoresxi Un grupo de unidades de tiempogi es
cosecha n´ectar en un ´area dada asignado a alguna fase de luzi
Cada ´area es asociada a una Cada fase es asociada con veh´ıculos
calidad variable en una cola y al tiempo total de espera
La cantidad total de n´ectar co- El tr´afico durante determinada fase
lectado por una abeja depende por unidad de tiempo depende de la
del n´umero de abejas en el ´area longitud de la cola y el tiempo total
y la calidad de la miel asignado a cada fase
El porcentaje de colectores en El porcentaje de tiempo asignado a
todas las ´areas debe satisfacer todas las fases debe satisfacer
PN
j pj = 1 Pi∈{3,4}gi =M k
2.3.4 Algoritmos basados en din´amicas poblacionales y teor´ıa evolutiva
El tr´afico urbano puede ser visto desde un punto de vista poblacional, debido a que cada
veh´ıculo tiene un comportamiento individual, que organizados en poblaciones persiguen
de-terminados objetivos. Por ejemplo, cada uno de los individuos busca tomar la v´ıa que lo
lleve a su destino final en el menor tiempo posible, gastando la m´ınima cantidad de gasolina,
o recorriendo la menor distancia. Estas poblaciones se caracterizan por presentar
compor-tamientos id´enticos, buscando cada uno de los objetivos expuestos previamente [50] .
En este orden de ideas, una alternativa que permite recrear estas caracter´ısticas grupales son
conforman de agentes de caracter´ısticas id´enticas, conservando su autonom´ıa. Si se repasa la
descripci´on de tr´afico urbano realizada en el p´arrafo anterior, la semejanza con la estructura
de un juego poblacional es evidente. Ahora, las poblaciones requieren de tres caracter´ısticas
definidas: la primera, es que cada poblaci´on cuente con un gran n´umero de agentes capaces
de tomar decisiones independientes; la segunda describe a cada agente como peque˜no,
en-tendi´endolo desde un punto de vista en el cual sus acciones no afectan los objetivos de otro
dentro del mismo grupo poblacional, y la tercera indica que el resultado obtenido por cada
agente responde a la estrategia definida para su poblaci´on y de la distribuci´on de las otras
estrategias asumidas por otros grupos poblacionales, sin entrar en consideraci´on directa con
agentes que escojan otras estrategias [50].
Los juegos poblacionales, a pesar de modelar las redes de tr´afico urbanas, no permiten
con-trolarlas si no se tiene en cuenta la din´amica que existe entre las poblaciones que se hayan
definido. Para este fin, se emplean las din´amicas evolutivas, donde se recrean las interacciones
entre estas poblaciones, siempre de la mano de las funciones de costo y rentabilidad de cada
una de las poblaciones [50].
2.4
Modelos de redes de tr´
afico urbano
Cuando realizamos un modelo, buscamos imitar la respuesta de una red bajo determinados
par´ametros de control. Una vez el modelo se ajuste a la red real podemos emplearlo para
predecir sus futuros estados. Basados en las anteriores predicciones, se pueden buscar caminos
´
optimos que lleguen al punto deseado con el menor coste posible. La funci´on de costo puede
tener diferentes variables de control, que son categorizadas en tres grandes focos: el primero
corresponde a las luces de tr´afico urbano, el segundo a la se˜nalizaci´on con mensajes variables
y el tercero corresponde a la se˜nalizaci´on de las rampas de entradas a las autopistas, conocido
como “ramp metering”.Si bien las redes son sistemas f´ısicos reales con variables continuas,
el modelo por lo general emplea variables discretas para representarlas, que dependen del
intervalo de tiempo discreto que se haya definido. [44].
Existen m´ultiples y variados modelos de redes de tr´afico urbanas. En esta secci´on, se
tr´afico urbano se pueden dividir en 2 categor´ıas: seg´un la topolog´ıa y seg´un el nivel de detalle.
2.4.1 Modelos de tr´afico urbano seg´un la topolog´ıa
Las redes de tr´afico urbano tambi´en pueden ser subdivididas en redes y autopistas. Cuando
nos referimos a una red de tr´afico urbano, estamos hablando de m´ultiples v´ıas e
intersec-ciones con capacidades muy semejantes. Cuando alguna de estas v´ıas presenta una capacidad
de tr´afico considerablemente mayor e influyente en la red de tr´afico urbano, comenzamos a
hablar de tr´afico de autopista. Gran cantidad de las estrategias de control se han desarrollado
para este tipo de tr´afico. Sin embargo, existen estudios en los cuales se integran los dos
mod-elos. Este es el caso presentado en [27], donde los dos modelos se presentan independientes
para despu´es intercambiar informaci´on y presentar resultados conjuntos. En [27] se muestran
resultados destacables, mostrando una mejora del 30% sobre el no aplicar ninguna estrategia
de control. A continuaci´on se expone m´as a fondo los modelos basados en autopistas y en redes.
Modelos basados en autopistas
Las autopistas hoy en d´ıa son v´ıas de tr´afico masivo, que alivian las congestiones de las redes
circundantes, presentando una alternativa en lo posible r´apida y de mayor prioridad que el
resto de la red. Con ellas, se busca generar un espacio de movilizaci´on masivo entre
distan-cias considerablemente largas. Por lo general, se emplean modelos de tr´afico macrosc´opicos
para representarlas. En [54] [27] [11] [3] se desarrollan modelos macrosc´opicos para tr´afico en
autopistas.
En los modelos macrosc´opicos se destaca el control por medio de Ramp Metering. Ramp
Metering busca comprometer el desempe˜no de las rampas de entrada aprovechando su
ca-pacidad, evitando saturar la autopista. En estos modelos, el control es realizado por medio
de sem´aforos, principalmente. En [27] [67] [23] [18] [64] se exponen diferentes modelos y
aplicaciones basados en ramp metering.
Modelos basados en redes
Los modelos basados en redes representan v´ıas paralelas y perpendiculares con recursos muy
como tambi´en por estar compuestas por unidades b´asicas denominadas intersecciones.
Sue-len entrar en la categor´ıa de modelos macrosc´opicos, como se puede observar en [1] [32] [63] [2].
2.4.2 Modelos de tr´afico urbano seg´un el nivel de detalle
Los modelos de redes de tr´afico urbanos se pueden dividir en tres categor´ıas principales:
macrosc´opico, mesosc´opico y microsc´opico [44]. Los tres difieren en el nivel de abstracci´on
con el cual se considere la red. Los modelos microsc´opicos consideran la existencia de cada
uno de los actores individuales as´ı como las interacciones y caracter´ısticas de la red en la cual
se desenvuelven [41]. Los modelos macrosc´opicos corresponden a esquemas menos espec´ıficos,
y buscan representar la red mediante un modelo de flujos, haciendo en m´ultiples ocasiones
alusi´on a la hidrodin´amica [57]. Aprovechando los beneficios de ambos esquemas, los modelos
mesosc´opicos buscan integrar caracter´ısticas macrosc´opicas y microsc´opicas.
• Los modelos macrosc´opicos son empleados con el fin de reducir la carga computacional,
puesto que han sido pensados para controlar redes de tr´afico de gran extensi´on [44].
Entre los principales modelos encontramos TRANSYT-7F, FREFLO, NETVACI,
KRO-NOS, AUTOS, METANET y METACOR [37].
• Los modelos mesosc´opicos son una aproximaci´on intermedia entre los modelos macrosc´opicos
y microsc´opicos. Su principal caracter´ıstica es la adquisici´on de los beneficios de ambos.
Sin embargo, considera un nivel de detalle intermedio entre los modelos macrosc´opicos
y microsc´opicos . Un modelo mesosc´opico puede considerar el an´alisis por grupos de
veh´ıculos, por ejemplo. Entre sus principales representantes se encuentran DYNAMIT,
INTEGRATION, METROPOLIS y DINASMART [37] [44].
• Los modelos microsc´opicos corresponden al nivel m´as detallado de an´alisis de la red,
llegando a considerar cada veh´ıculo de la red como un ente con caracter´ısticas definidas,
relacionados con la infraestructura de la red o con otros veh´ıculos adyacentes. Con
el-los, se busca modelar los comportamientos humanos en la red, haci´endolos complejos y
Enunciado del Problema
3.1
Introducci´
on
El control del tr´afico urbano pretende mejorar las condiciones de movilidad de la ciudad.
Entre los principales problemas presentados se encuentran: la alta emisi´on de gases de efecto
invernadero, las congestiones vehiculares, el aumento del n´umero de paradas por veh´ıculo en
el trayecto, la disminuci´on de la velocidad promedio de viaje, entre otros. Cada uno de estos
problemas se representa por un ´ındice de desempe˜no, y han llegado a tratarse por separado
en la literatura del tr´afico urbano, donde se evidencia una alta correlaci´on entre los diferentes
´ındices de la red. Sin embargo, en m´ultiples ocasiones la mejora de uno de ellos implica el
empeoramiento de otro, por lo cual es importante focalizar los esfuerzos en lo que en verdad
concierne. Muchos abogan por el mejoramiento de las condiciones ambientales, en
contra-posici´on al desempe˜no temporal de la red. El personal de tr´afico urbano tiene la potestad de
decidir cu´al de estos ´ındices es el que m´as le conviene para su caso espec´ıfico.
Dadas las problem´aticas anteriormente expuestas, los investigadores en el ´area de control de
tr´afico urbano se dieron a la tarea de idear algoritmos que mejoraran alguno de los ´ındices
de desempe˜no de la red. Con la ayuda de herramientas computacionales como MATLAB,
se ha logrado aplicar la teor´ıa de control, empleando la programaci´on din´amica, el control
predictivo, la l´ogica difusa, los algoritmos poblacionales y dem´as.
De igual forma, resulta importante el modelado, simulaci´on y caracterizaci´on de las redes
de tr´afico urbano. En este aspecto, muchos investigadores prefieren desarrollar programas
de simulaci´on b´asicos, cumpliendo sus requerimientos, tal y como se aprecia en [28], donde
el simulador no es est´andar y presenta limitaciones importantes. En el mercado existen
versos paquetes comerciales de modelado de redes vehiculares, sin embargo, el uso de uno
en particular ha tendido a estandarizarse: ´este se llama VISSIM, de la empresa PTV. Este
simulador, pese a su precio, es considerado una de las mejores opciones al modelar redes de
tr´afico urbano, siendo empleado por agentes de control de tr´afico para la verificaci´on de sus
respectivos planes de se˜nales.
A pesar de las altas prestaciones de VISSIM, resulta muy dif´ıcil establecer algoritmos de
control adaptativos que funcionen bajo este programa. Por otra parte, estos algoritmos son
descritos en MATLAB con mucha frecuencia y facilidad. Dada las vastas capacidades de los
dos, el problema principal reside en crear una interfaz capaz de comunicar estos dos
progra-mas, complementando sus funciones con el fin de simular el algoritmo de control en la red
modelada. Partiendo de esta herramienta computacional de interconexi´on, se pueden obtener
en t´erminos de ´ındices de desempe˜no las prestaciones de diversos algoritmos de control.
Aprovechando las diversas prestaciones de cada uno de los programas, este proyecto de grado
busca describir un API responsable de la comunicaci´on entre VISSIM y MATLAB, creando
una herramienta de un mayor nivel de abstracci´on, que facilite la simulaci´on de algoritmos
de control de tr´afico urbano. Cabe resaltar que esta herramienta est´a enfocada al control de
tr´afico mediante sem´aforos.
En la siguiente secci´on se define el contexto bajo el cual se desarrollar´a el proyecto, y en la
tercera y ´ultima secci´on se expondr´an los ´ındices de desempe˜no de relevancia que se pueden
observar en redes de tr´afico urbanas.
3.2
Redes de tr´
afico urbano
La malla vial urbana se puede descomponer en dos componentes principales: las autopistas
y las redes. En el marco de este proyecto, s´olo se estudian las redes de tr´afico urbano. Ello
no implica que con la API desarrollada no se pueda revisar algoritmos desarrollados para
autopistas, haciendo alusi´on s´olo a los algoritmos de control que se desarrollaron y analizaron
con ayuda de esta herramienta.
Las redes de tr´afico urbano se componen de intersecciones, que se asumen semaforizadas
secuencia de luces que se debe ejecutar. Estas secuencias de luces permiten o niegan el avance
de los veh´ıculos. Para cada intersecci´on se suelen definir fases, que corresponden a la divisi´on
del tiempo de verde del ciclo total entre las v´ıas que no pueden cruzar al mismo tiempo por
la intersecci´on, debido a que generar´ıan choques vehiculares.
Como es de esperarse, existe regulaci´on para el control de tr´afico urbano por medio de luces.
Estas consideraciones buscan respetar un marco m´ınimo de seguridad para las ´areas urbanas.
Entre las principales restricciones se encuentran la definici´on de los tiempos de luz amarilla,
definidos como dos segundos cuando se realiza la transici´on de rojo a verde, y de 3 segundos
m´ınimo cuando las luces cambian de verde a rojo. El tiempo amarillo entre verde y rojo se
suele calcular dependiendo de la velocidad promedio de la v´ıa, calculando el tiempo necesario
para que un veh´ıculo pueda observarlo y detenerse antes de cruzar la intersecci´on. Otra
re-stricci´on reside en el m´ınimo tiempo de verde por cada fase, definido en dos segundos. Ello
garantiza que por cada ciclo se le permitir´a el paso a los veh´ıculos de todas las fases. En el
desarrollo de este proyecto se tuvieron en cuenta las restricciones anteriormente expuestas.
Para el control de tr´afico adaptativo, es necesario contar con dispositivos de sensado. Desde
hace muchos a˜nos, se suele emplear los bucles magn´eticos que detectan el paso de un veh´ıculo.
Estos dispositivos suelen introducirse bajo la superficie de la v´ıa, dificultando el cambio y
mantenimiento de las mismas. En la actualidad, empresas como IMATIC Ingenier´ıa LTDA
emplean c´amaras ubicadas en las estructuras de soporte de los sem´aforos, capaces de detectar
colas de dos veh´ıculos por carril. Esta tecnolog´ıa a´un est´a en desarrollo, y promete ser un
excelente dispositivo de sensado. En cuanto a las estrategias de control de tr´afico urbano,
se asumi´o que se contaba con c´amaras como instrumento de sensado, buscando cumplir otro
de los principales objetivos de este proyecto, que es realizar desarrollos sobre tecnolog´ıas
disponibles y en desarrollo.
3.3
´
Indices de desempe˜
no
Un ´ındice de desempe˜no permite comparar la respuesta de dos o m´as controladores ante un
mismo experimento. Estos resultados permiten discernir sobre la efectividad de un m´etodo de
control sobre otro. Sin embargo, para un estudio m´as detallado sobre la efectividad del control
propuesto, es necesario revisar m´as de 3 ´ındices de desempe˜no, evitando tomar decisiones ”a
esta situaci´on, es pertinente identificar los ´ındices de desempe˜no que realmente demuestren la
mejora o empeoramiento del tr´ansito vehicular. A continuaci´on, se aborda cada uno de ellos,
destacando su importancia en el problema en cuesti´on.
Distancia total viajada(DTV)
Es la distancia que recorre cada uno de los veh´ıculos desde que ingresa a la red hasta que
sale de la misma. Esta distancia corresponde a la suma de las distancias recorridas por todos
los veh´ıculos que entren a la red. Se considera como un ´ındice de desempe˜no puesto que una
distancia total viajada superior a los dem´as algoritmos representa un buen desempe˜no del
algoritmo de control en el experimento.
Tiempo total de viaje(TTV)
El tiempo total de viaje corresponde al tiempo empleado por todos los veh´ıculos que ingresan
a la red en recorrer la distancia total viajada. Este ´ındice de desempe˜no va muy ligado al
DTV, puesto que permite definir por si mismo si el algoritmo de control est´a mejorando o no
la experiencia de tr´afico vial.
Velocidad promedio(VP)
La velocidad promedio corresponde a la relaci´on f´ısica entre la distancia total viajada y el
tiempo total de viaje. De por si, permite ver el desempe˜no de la red en t´erminos impl´ıcitos
de dos ´ındices de desempe˜no, siendo por este motivo un buen par´ametro de comparaci´on.
Tiempo promedio de parada(TPP)
Corresponde al promedio del tiempo que estuvo detenido cada veh´ıculo mientras se
encon-traba atravesando la red, contrastado contra todos los veh´ıculos que atraviesan la red.
N´umero de paradas (NP)
Corresponde al n´umero total de paradas que los veh´ıculos experimentan cuando ingresan a la
Tiempo total de retraso(TTR)
Simulador de tr´
afico urbano
El desarrollo de una API que vincule VISSIM y MATLAB es un desaf´ıo que requiere de meses
si se parte de cero. Con este proyecto de grado se busca dar los lineamientos para reducir el
tiempo de desarrollo de una interfaz de simulaci´on, a la vez que se verifican estrategias de
con-trol con ayuda de esta herramienta. Trabajos previos en el tema han sido realizados por Pablo ˜
Na˜nez, los cuales han sido un punto de partida para el trabajo expuesto en este documento.
En las siguientes secciones se expone a profundidad las diferentes caracter´ısticas del simulador.
4.1
Descripci´
on
El simulador de tr´afico urbano consta de dos componentes principales:
1. El modelo de la red de tr´afico implementado en VISSIM.
2. el algoritmo de control y el entorno de la aplicaci´on en MATLAB.
La comunicaci´on entre los dos programas se realiza por medio de un servidor COM,
gener-ado desde MATLAB. La interfaz y el control de flujo de datos se realiza desde este ´ultimo.
Mediante comandos predefinidos en la documentaci´on de VISSIM, se puede acceder y
contro-lar por completo todos los componentes y caracter´ısticas de VISSIM. Uno de los principales
requerimientos funcionales del simulador fue desarrollar el c´odigo orientado a objetos. En la
figura 4.1 se muestra la estructura general del simulador.
El flujo de informaci´on en el simulador se describe a continuaci´on:
1. Una vez abierta la interfaz de usuario del simulador, se ingresan cada uno de los
par´ametros que se indican de la red, o se cargan de un archivo.
Interfaz de usuario
Control de ejecuci´on
Algoritmo de control
MATLAB
Interfaz de usuario
Interfaz COM
´Indices de desempe˜no
VISSIM
Figura 4.1: Estructura general del simulador
2. Basados en una informaci´on completa, la interfaz crea el entorno de ejecuci´on, encargado
de comunicar la informaci´on entre MATLAB y VISSIM.
3. El entorno de ejecuci´on crea una instancia COM de VISSIM y carga en ella el modelo de
la red a simular, especificado como un archivo de extensi´on*.inp . Despu´es de esto, se
crean controladores virtuales, los cuales simulan el comportamiento de un controlador
de tr´afico real.
4. El entorno de ejecuci´on busca el archivo controlUserDefined.m donde se especifica el
algoritmo que controlar´a la red de tr´afico modelada en VISSIM, crea una instancia de
´
el y le solicita los tiempos de verde.
5. Basado en la informaci´on entregada en la interfaz del usuario, el entorno de ejecuci´on
calcula el plan de se˜nales, con el fin de ser enviado a cada uno de los controladores
virtuales.
6. El entorno de ejecuci´on mediante la interfaz COM env´ıa la informaci´on de cada uno de
los controladores a VISSIM y da la orden de que la simulaci´on comience.
7. Una vez acaba el delta de simulaci´on, se solicita de nuevo a la instancia de
contro-lUserDefined.m los tiempos de verde para cada controlador, a la vez que se obtienen
los ´ındices de desempe˜no (i.e. colas) de VISSIM, para volver a ejecutar desde el paso
n´umero 5.
8. Una vez la simulaci´on alcanza el tiempo total definido, el entorno de ejecuci´on cierra
Figura 4.2: Simulador de tr´afico urbano
misma carpeta donde se encontraba el archivo de extensi´on *.inp.
El delta de simulaci´on es el tiempo que VISSIM emplea exclusivamente para la simulaci´on.
Una vez el delta de simulaci´on termina, VISSIM permite al entorno de ejecuci´on continuar
con las siguientes l´ıneas de c´odigo, seg´un el flujo de informaci´on expuesto previamente. Los
´ındices de desempe˜no son seleccionados en VISSIM antes de ejecutar la simulaci´on, y se ven
reflejados en archivos de extensiones*.stz y*.npe. El simulador permite ejecutar varias
sim-ulaciones al tiempo. El simulador se puede apreciar en la figura 4.2.
4.2
Interfaz de usuario
La interfaz de usuario se puede apreciar en la figura 4.2. En ella, se distinguen cuatro
nombre lo indica, en ella se seleccionar´a la versi´on de VISSIM que tenga instalada en su
or-denador y con la que desea trabajar. Debe tener en cuenta si instal´o la versi´on de 32 o 64
bits. Con el panelSelect Network se debe ubicar el archivo*.inp que implementa el modelo
de la red en VISSIM. De igual forma, con el panelSelect Control Algorithm se debe ubicar el
archivo ControlUserDefined.m que implementa el algoritmo de control y calcula los tiempos
de verde. Dependiendo del algoritmo de control, m´ultiples ´ındices de desempe˜no pueden llegar
a ser requeridos. Para tal fin, es necesario definir cu´ales y cu´antos ´ındices de desempe˜no se
emplear´an, con el fin de que esta informaci´on sea actualizada y est´e disponible por la instancia
decontrolUserDefined.m.
La segunda columna hace alusi´on a los par´ametros de la red de tr´afico. En primer lugar, se
debe ingresar el n´umero de controladores con los cuales cuenta la red. Para cada uno de estos
controladores es necesario ingresar ciertos par´ametros, como lo son el n´umero de grupos de
se˜nales, el tiempo de ciclo, el orden de las luces y el segundo en el cual comienza la luz verde
para cada una de las fases. Tambi´en en la segunda columna se define un tiempo total de
simulaci´on, comprendido entre 1 y 3600 segundos. Con ayuda del bot´on DrawSignalPlan es
posible observar el plan de se˜nales actual de cada uno de los controladores.
En la tercera columna se pueden ingresar los tiempos reglamentarios de amarillo para cada
una de las dos transiciones. En el panel Sensor asignment se realiza la asignaci´on de los
contadores de colas de VISSIM a los controladores virtuales que se describieron previamente.
Tambi´en se cuenta con los comandos b´asicos que permiten manejar el simulador, como lo son
Save,Load,Start,Stop yNew One, que crea una nueva simulaci´on.
Por ´ultimo, la cuarta columna es un panel informativo, donde se muestra la informaci´on del
archivo *.inp que modela la red en VISSIM. Adem´as, con el bot´on results se puede ir a la
ubicaci´on de los archivos que contienen los resultados de la simulaci´on.
4.3
Arquitectura
El simulador de tr´afico urbano se encuentra programado orientado a objetos. En total, consta
de seis clases m´as la interfaz de usuario, que fue desarrollada con la herramienta GUIDE de
Interfaz: La interfaz recopila toda la informaci´on ingresada por el usuario y crea el entorno
de ejecuci´on. Tambi´en restringe determinadas acciones del usuario que en este contexto no
son v´alidas.
Clase COMInterfaceVISSIM: En esta clase se construye la conexi´on entre VISSIM y
MATLAB. Tambi´en se encuentran m´etodos que permiten acceder y enviar informaci´on a
VISSIM.
Clase ControllerUserDefined: En esta clase el usuario define sus estrategias de control,
ya sean adaptativas o de tiempo fijo. tambi´en se encarga de generar los tiempos de verde para
cada uno de los controladores virtuales que se hayan creado.
Clase HybridController: Cada instancia de esta clase corresponde a un ”controlador
vir-tual”. Cada uno hace las veces de controlador de campo, interpretando los planes de se˜nales
y enviando las ´ordenes exactas que deben seguir sus equivalentes controladores en la red de
VISSIM.
Clase SignalPlan: Esta clase genera los planes de se˜nales a partir de la informaci´on que el
usuario ha ingresado en la interfaz y de los tiempos de verde que ha entregado previamente
la claseControlUserDefined.
Clase UTNSimulation: Se encarga de coordinar la ejecuci´on de la simulaci´on, enviando y
recibiendo informaci´on proveniente del modelo de red generado en VISSIM.
MainSimulation: Es la clase principal del entorno de ejecuci´on, donde se almacenan las
instancias de las clases previamente expuestas, exceptuando a la interfaz. Cada nueva
Algoritmos de control
Con el fin de probar la funcionalidad de los algoritmos de control de tr´afico urbano, se
de-scriben a continuaci´on algoritmos basados en tiempo fijo y en estrategias adaptativas. En
total, se simular´an dos algoritmos basados en tiempo fijo y cuatro algoritmos basados en
es-trategias adaptativas. A continuaci´on se presentan cada uno de ellos.
5.1
Estrategias basadas en tiempo fijo
Hoy en d´ıa, el control de tr´afico urbano, en su gran mayor´ıa, se realiza basado en estrategias
de tiempo fijo. Por ejemplo, en Colombia, la mayor parte del tr´afico urbano fuera de las
ciu-dades capitales es controlada mediante estas estrategias de control, empleando informaci´on
offlinede la red. Por estas razones, es importante estudiar los algoritmos basados en tiempos
´
optimos, puesto que la infraestructura vial permite implementarlos sin realizar modificaciones.
Sin embargo, no resulta suficiente generar secuencias de luces con el fin de que controlen los
sem´aforos de las intersecciones. Es necesario que esta programaci´on vaya acorde las
deman-das de las v´ıas, y que a su vez sean lo m´as cercanas al ´optimo posible. En el control de
tr´afico urbano, debido a su naturaleza estoc´astica, no se podr´a alcanzar el ´optimo de la red,
sin embargo, bajo ciertas restricciones, se pueden llegar a aproximaciones totalmente v´alidas
que nos llevan a sub´optimos muy competitivos. En la literatura, se destacan dos algoritmos
que son un punto de partida para muchos otros: la aproximaci´on de F. V. Webster [56] y la
aproximaci´on de B. de Schutter [13]. En este documento se consignan los resultados de
im-plementar la estrategia propuesta por Webster, como tambi´en los planes de se˜nales dise˜nados
por IMATIC e implementados en la ciudad de Barranquilla, Colombia.