Din´
amicas Poblacionales Distribuidas
Aplicadas al Control de Tr´
afico Urbano
Jorge Luis Mayorga Taborda
Asesor:Nicanor Quijano Silva
Departamento de Ingenier´ıa El´
ectrica y Electr´
onica
Proyecto de Fin de Carrera
Presentado a
La Universidad de los Andes
Facultad de Ingenier´ıa
Departamento de Ingenier´ıa El´
ectrica y Electr´
onica
Para obtener el t´ıtulo de
INGENIERO ELECTR ´
ONICO
por
Jorge Luis Mayorga Taborda
Din´
amicas Poblacionales Distribuidas Aplicadas al Control de Tr´
afico
Urbano
Sustentado el 09 de Diciembre del 2014 frente al jurado:
Composici´
on del jurado
- Asesor: Nicanor Quijano Silva phD, Profesor Titular, Universidad de Los Andes
CAP´ITULO 0.
Abstract
Se analizan las din´amicas poblacionales aplicadas al control distribuido en semaforizaci´on urbana y su desempe˜no como controladores distribuidos donde los agentes no poseen informaci´on completa. Se utilizan los tiempos de ciclo como recursos a administrar por medio de tres niveles de control.Se aplican los resultados a una simulaci´on de una red de tr´afico urbana utilizando el software PTV VISSIM para un sistema dos,tres y nueve nodos. Se prueban diversas din´amicas poblacionales (globales y locales) y se analiza el resultado en funci´on de diferentes funciones de Fitness.
Tabla de Contenidos
1 Introducci´on 2
1.1 Descripci´on de la problem´atica y justificaci´on del trabajo . . . 2
1.2 Alcance y Productos Finales . . . 4
1.3 Objetivos . . . 5
1.3.1 Objetivo General . . . 5
1.3.2 Objetivos Espec´ıficos . . . 5
2 Marco Te´orico 6 2.1 Tiempo de Ciclo para Sem´aforos . . . 6
2.2 Teor´ıa de Juegos . . . 7
2.2.1 Juegos Potenciales . . . 8
2.2.2 Juegos Estables . . . 8
2.3 Juegos Evolutivos y Din´amicas Poblacionales . . . 9
2.3.1 Protocolos de Revisi´on . . . 10
2.3.2 Mean Dynamics . . . 10
2.3.3 Din´amicas Evolutivas Deterministas . . . 10
2.4 Replicator Dynamics . . . 11
2.5 Software de Microsimulaci´on PTV VISSIM . . . 11
2.6 Interfaz COM de PTV VISSIM 5.4 . . . 12
3 Estado del Arte 13 3.1 Sistemas de Transporte Inteligente . . . 13
3.2 Sensado y Percepci´on . . . 13
3.2.1 Loops Inductivos . . . 13
3.2.2 c´amaras de Video . . . 14
3.2.3 Magnet´ometros . . . 15
3.3 Sistemas de Comunicaciones Inal´ambricas . . . 15
3.4 Sistemas de Control . . . 16
3.4.1 Semaforizaci´on . . . 16
3.4.2 Control de Tiempo de Sem´aforos basados en L´ogica Difusa . . . 17
3.4.3 Control de Tiempo en Sem´aforos basados en Redes Neuronales . . . 17
3.4.4 Control de Tiempo en Sem´aforos basados en Teor´ıa de Juegos . . . 18
TABLA DE CONTENIDOS CAP´ITULO 0.
5 Resultados 21
5.1 Modelo de Tr´afico Urbano . . . 21
5.2 An´alisis de la Funci´on de Fitness . . . 25
5.3 Interfaz Gr´afica GUI PTV VISSIM-Matlab . . . 26
5.4 Simulaciones y Escenarios . . . 28
5.4.1 Red de 2 Nodos . . . 28
5.4.2 Red de 3 Nodos en PTV VISSIM . . . 30
5.4.3 Red de 9 Nodos en PTV VISSIM . . . 32
5.5 Comparaci´on de Desempe˜no . . . 32
6 Discusi´on 36
7 Conclusiones 38
Ap´endices 46
Lista de Figuras
1.1 Diagrama de bloques del sistema de control de trafico urbano . . . 4
2.1 Ejemplo se˜nal de control para sem´aforo trif´asico . . . 6
2.2 Esquema de control de tiempo para las fases de los sem´aforos . . . 7
2.3 Estados de las poblaciones en un juego inestable a lo largo del tiempo . . . 9
2.4 Estados de las poblaciones en un juego estable a lo largo del tiempo . . . 9
5.1 Comparaci´on entre modelos cuadr´aticos y logar´ıtmicos . . . 22
5.2 Simulaci´on Modelo unidimensional con efecto de saturaci´on sin acci´on regulatoria (Sem´aforo) . . . 23
5.3 Simulaci´on Modelo unidimensional con efecto de saturaci´on con acci´on regulatoria (Sem´aforo) . . . 23
5.4 Diagrama de bloques y funciones de la GUI propuesta . . . 27
5.5 Interfaz gr´afica de usuario para la GUI Matlab-PTV VISSIM . . . 28
5.6 Diagrama de Red de 2 nodos para el escenario de igual valor nodal y pesos equili-brados en ambas v´ıas . . . 29
5.7 Diagramas de tiempos de semaforizaci´on, tiempos en verde para v´ıas 1 y tiempos de ciclo para escensario 1 . . . 29
5.8 Diagrama de Red de 2 nodos para el escenario de igual valor nodal y colas de veh´ıculos distintas . . . 30
5.9 Diagramas de tiempos de semaforizaci´on, tiempos en verde para v´ıas 1 y tiempos de ciclo para escenario 2 . . . 30
5.10 Diagrama de Red de 2 nodos para el escenario de distinto valor nodal y pesos distintos en ambas v´ıas . . . 30
5.11 Diagramas de tiempos de semaforizaci´on, tiempos en verde para v´ıas 1 y tiempos de ciclo para escenario 3 . . . 30
5.12 Veh´ıculos por v´ıa para el escenario 4 . . . 31
5.13 Diagramas de tiempos para el escenario 4 . . . 31
5.14 Red de 3 Nodos implementada en PTV VISSIM . . . 31
5.15 Red de 9 nodos implementada en PTV VISSIM . . . 33
A.1 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador de tiempo fijo en condiciones de saturaci´on . . . 46
LISTA DE FIGURAS CAP´ITULO 0.
A.2 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador proporcional enTv
en condiciones de saturaci´on . . . 46
A.3 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador de tiempo fijo en Tv no saturada . . . 47
A.4 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador proportional enTv no saturada . . . 47
A.5 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador de tiempo fijo en Tv no saturada . . . 47
A.6 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador proporcional enTv no saturada . . . 47
A.7 Simulaci´on en PTV VISSIM para red de 3 nodos con controladorTcbajo el Replicator Dynamics . . . 48
A.8 Red de 9 nodos bajo control de tiempo fijo . . . 48
A.9 Red de 9 nodos bajo control deTv proporcional . . . 48
A.10 Red de 9 nodos bajo control deTc yTv proporcional . . . 49
A.11 Red de 9 nodos bajo control deTc bajo Replicator Dynamics yTv fijo . . . 49
Lista de Tablas
5.1 Comparaci´on del desempe˜no de los controladores para una red de 3 y 9 nodos en
diferentes configuraciones de tiempo fijo. . . 34
5.2 Comparaci´on del desempe˜no de los controladores para una red de 3 nodos. . . 34
5.3 Comparaci´on del desempe˜no de los controladores para una red de 9 nodos . . . 34
1
Introducci´
on
1.1
Descripci´
on de la problem´
atica y justificaci´
on del
tra-bajo
Todo el planeta experimenta una creciente crisis de transporte masivo a medida que los centros urbanos incrementan tanto en tama˜no como en densidad. En el 2010, al sur Beijing, la capital de China, se presenci´o el mayor atascamiento de tr´afico de la historia: Un embotellamiento de m´as de 100 Km de largo y 10 d´ıas de duraci´on. La crisis comenz´o por las obras de construcci´on sobre una de las v´ıas m´as importantes del norte de la capital del pa´ıs asi´atico. Con un 40% de incremento anual en el volumen del parque automotor [1] [2], China enfrenta la crisis de tr´afico urbano que afecta a las grandes y medianas urbes a lo largo de todo el globo, desde Mosc´u hasta Buenos Aires, pasando por Tokyo, Los ´Angeles, Bogot´a y Barcelona.
En Colombia el parque automotor privado se increment´o en alrededor de 400.000 veh´ıculos en los ´ultimos dos a˜nos, dando un total al 2013 de 9.156.898 veh´ıculos [3]. No obstante el recurso vial no ha crecido a la misma tasa. Por este motivo se presenta como necesidad el uso ´optimo de los recursos viales, para mejorar el desempe˜no de una malla vial urbana, utilizando herramientas desde la semaforizaci´on hasta el control de los veh´ıculos, pasando por el cobro y penalizaci´on de la malla vial.
Por otro lado, el perfil de uso del recurso vial en la mayor´ıa de las ciudades responde a pi-cos de demanda en pocas horas y pipi-cos de muy baja demanda de veh´ıculos en la mayor parte del d´ıa. Ante este perfil las estrategias de cobro por congesti´on, cambios en el plan de ordenamiento territorial y una migraci´on masiva al transporte p´ublico, han sido foco de atenci´on en los ´ultimos a˜nos; no obstante, estas soluciones tambi´en son criticadas. Una soluci´on a corto plazo y comple-mentaria a cualquier otra estrategia de gesti´on del parque automotor y de pol´ıticas p´ublicas, el control eficiente del recurso vial, tanto espacial como temporal, es fundamental para mejorar el desempe˜no de las redes de tr´afico actuales .
En este sentido se ha abierto un ´area de investigaci´on denominada Sistemas de Transporte Inteligente (ITS por sus siglas en ingles) que desde el siglo pasado ha hecho de los sistemas a´ereos y urbanos su foco principal de investigaci´on y desarrollo.Estos sistemas de control de tr´afico actualmente se aproximan al problema de transporte urbano bajo dos perspectivas principales, la gesti´on del recurso temporal para los veh´ıculos (estrategias como la semaforizaci´on y cooperaci´on) y el control del recurso espacial (veh´ıculos guiados). Los sistemas basados en el control del recurso espacial se caracterizan por la automatizaci´on individual de los veh´ıculos y su conexi´on en sistemas
1.1. DESCRIPCI ´ON DE LA PROBLEM ´ATICA Y JUSTIFICACI ´ON DEL TRABAJO CAP´ITULO 1.
de comunicaciones complejas. Estos sistemas, equipados con una gran cantidad de sensores y un poder de procesamiento exigente, presentan grandes avances a nivel individual y de poblaciones peque˜nas, pero no se han realizado las implementaciones adecuadas en sistemas masivos debido al gran costo del equipamiento de los veh´ıculos con las tecnol´ogicas requeridas.
As´ı mismo, el control de recurso temporal de las v´ıas ha sido de los sistemas de control au-tom´atico m´as antiguo de los ITS: El sem´aforo. El sem´aforo (Traffic Ligth en ingl´es), es un sistema de control similar a compuertas que permiten o restringen el flujo de veh´ıculos por un periodo limitado de tiempo. Tradicionalmente estos sistemas son mallas de control abiertas; es decir, no existe una retroalimentaci´on del estado del tr´afico actual; los sem´aforos no tienen manera de cambiar los tiempos de gesti´on seg´un var´ıa el estado de la red. No obstante, los ITS han agregado sensores como los loops inductivos, c´amaras de video y dispositivos GPS para modificar los tiempos de sem´aforo y mejorar el desempe˜no de la red.
Las redes de tr´afico urbanas son sistemas de gran escala, complejos y variantes en el tiempo. Este comportamiento no lineal requiere de gran poder de procesamiento y una red de comunicaciones muy costosa para poder acceder a la informaci´on de toda la red y obtener los tiempos ´optimos de la red. Ante estas dificultades los algoritmos distribuidos surgen como una soluci´on viable. Estos algoritmos se basan en protocolos de decisi´on utilizando solo la informaci´on local que puede ser consultada por cada agente. En este sentido, las redes de comunicaciones pueden ser menos costosas y el poder de procesamiento puede ser mucho menor. Sin embargo, la forma como se toma la decisi´on del tiempo asignado a cada fase del sem´aforo var´ıa seg´un autor a autor, y existen muchas combinaciones de las mismas: desde redes neuronales sintonizadas por un m´odulo difuso, algoritmos gen´eticos estoc´asticos, control predictivo basado en optimizaci´on por part´ıculas, Social Bee Foragin y, particularmente, Teor´ıa de Juegos.
Una aproximaci´on al problema del control de sem´aforos es el uso de teor´ıa de juegos para la asignaci´on din´amica de los tiempos de fase. Modelando como agentes los segundos de tiempo en verde/rojo y como estrategias los sem´aforos, se puede asignar un juego de agentes infinitos a estrategias finitas con una funci´on de pago en funci´on de las colas, velocidad media, tiempo de retardos, etc. Esta aproximaci´on permite una f´acil implementaci´on de control distribuido dado que se basa en protocolos de negociaci´on y no depende del modelo de la red de tr´afico.
Las redes de malla vial en las ciudades son complejas y cambian r´apidamente, su control basado en un modelo global no resulta viable, tampoco realizar un modelo detallado de una ciudad para sintonizar los tiempos de fase. Bajo esta perspectiva los software de micro simulaci´on han tomado fuerza los ´ultimos a˜nos; estos paquetes de simulaci´on utilizan la configuraci´on f´ısica de la red para realizar la simulaci´on espacio temporal del flujo de veh´ıculos. Estos modelos son muy c´omodos para la simulaciones de grandes sistemas flexibles, ya que para actualizar el modelo matem´atico de fondo, bajo los software de micro simulaci´on, solo requieren modificar la red cambiando una nueva v´ıa, agregando un puente, o instalando un sensor m´as.
En este orden de ideas, el paquete PTV VISSIM de micro simulaci´on es uno de los m´as re-conocidos a nivel mundial, especialmente por ser un paquete multimodal y estar programado bajo una capa de objetos comunes para plataformas Windows: COM. Dado que PTV VISSIM est´a basada en el protocolo COM ActiveX es posible la comunicaci´on con otros programas de
1.2. ALCANCE Y PRODUCTOS FINALES CAP´ITULO 1.
software, inclusive Python. Python es un lenguaje de programaci´on libre que es incluido por defecto como script principal para correr algoritmos en las simulaciones de PTV VISSIM. Si bien Python es uno de los lenguajes de programaci´on m´as extendidos en el mundo acad´emico, no obstante Python presenta dificultades en la curva de aprendizaje que Matlab soluciona con creces, la disponibilidad de soporte especializado, toolbox avanzados y facilidades para la construcci´on de interfaces gr´aficas, comunicaciones entre software y una extensa red de colaboradores, lo hacen un lenguaje de programaci´on de inter´es especialmente para la comunicaci´on Matlab y PTV VISSIM para el dise˜no de estrategias de control.
Ya existe en el mercado la versi´on PTV VISSIM 6 y est´a pr´oxima a salir a la venta el pa-quete PTV VISSIM 7, los m´odulos de comunicaci´on COM de estas dos versiones no est´an totalmente habilitados y presenta fallos frecuentes, por este motivo se sigue manejando la versi´on PTV VISSIM 5.4 en cuanto protocolos de comunicaci´on COM. Por estos motivos, se plante´o como objetivo realizar una interfaz gr´afica basada en COM entre PTV VISSIM 5.4 y Matlab con la intenci´on que se puedan realizar pruebas de algoritmos de control de tr´afico basado en sem´aforos utilizando PTV VISSIM que permitan a usuarios no expertos en programaci´on COM acceder a este modelo de control.
Figure 1.1: Sistema general para el control de la malla vial urbana mediante el m´etodo de se-maforizaci´on
1.2
Alcance y Productos Finales
El objetivo del proyecto fue la implementaci´on de un control basado en juegos evolutivos para la asignaci´on de tiempos de semaforizaci´on as´ı como el desarrollo de un entorno para la simulaci´on de tr´afico en la plataforma Matlab con el software de micro simulaci´on PTV VISSIM. Dicha plataforma de simulaci´on basada en una interfaz gr´afica es utilizada para evaluar el desempe˜no de una red de trafico de 3 y 9 nodos comparando el desempe˜no de estrategias de control de tiempo fijo, tiempos proporcionales, Replicator Dynamics y el Local Replicator Dynamics. Tambi´en se evaluaron distin-tas funciones de Fitness y se compar´o el desempe˜no de las mismas aplicadas a las dos topolog´ıas de tres y nueve nodos.
1.3. OBJETIVOS CAP´ITULO 1.
1.3
Objetivos
1.3.1
Objetivo General
1. Aplicar din´amicas de poblaciones al control distribuido de una red de semaforizaci´on urbana utilizando el software de micro simulaci´on PTV VISSIM.
1.3.2
Objetivos Espec´ıficos
1. Dise˜nar un control distribuido para una red de tr´afico urbana basada en sem´aforos utilizando teor´ıa de juegos y din´amicas poblacionales.
2. Simular un sistema de control distribuido basado en din´amicas poblacionales bajo el software de micro simulaci´on PTV VISSIM.
3. Comparar el desempe˜no entre el controlador basado en din´amicas poblacionales distribuidas y los sistemas de control m´as populares en la literatura.
2
Marco Te´
orico
2.1
Tiempo de Ciclo para Sem´
aforos
Las estrategias de control para los sem´aforos en sistemas de tr´afico urbano m´as comunes son los sistemas de tiempo fijo. En estos algoritmos se calculan de manera “off-line” los tiempos adecuados para las intersecciones y las fases de los ciclos. Estos ciclos corresponden a una se˜nal discreta de 3 estados posibles, correspondientes a cada color del sem´aforo (Rojo,Verde, ´Ambar).
ρ(t) :R→[V erde,Ambar,Rojo] (2.1)
Figure 2.1: Ejemplo se˜nal de control para sem´aforo trif´asico
En t´erminos de funciones elementales se puede describir una se˜nal de control para sem´aforos como:
ρ(t) =
k=tf
X
k=t0
A(k)[u(t−k)−u(t−(k+Tk))] (2.2) Si el sistema posee m´ultiples sem´aforos la se˜nal de control deja de ser un vector de dimensi´on 3 para ser una matriz denx3 elementos incrementando la complejidad del problema. Originalmente los sem´aforos eran controlados electro-mec´anicamente por sistemas de reloj basados en pi˜nones de diferentes tama˜nos, los tiempos no pod´ıan ser cambiados con facilidad, por lo cual los tiempos eran recalculados muy pocas veces en la vida ´util del sem´aforo. Por estos motivos, la mayor´ıa de las naciones han adoptado normas basadas en procesos emp´ıricos utilizando registros hist´oricos del tr´afico para calcular los tiempos adecuados para cada una de las fases. T´ıpicamente se define el tiempo en ´Ambar como el 16% del tiempo asignado a la mayor de las fases restantes con lo cual, si se define un tiempo de ciclo fijo, el problema se reduce de una matriz de nx3 a un problema unidimensional.
2.2. TEOR´IA DE JUEGOS CAP´ITULO 2.
2.2
Teor´ıa de Juegos
La Teor´ıa de Juegos es una rama de las matem´aticas que estudia de manera formal y abstracta el comportamiento de dos o m´as jugadores siguiendo interacciones basadas en reglas, ganancias y p´erdidas. Estas interacciones son llamadas juegos. Los jugadores toman decisiones racionales bas´andose en funciones de pagos. Estas funciones de pago son la recompensa que obtiene cada jugador en proporci´on a las estrategias jugadas por el conjunto de jugadores, incluido el jugador mismo.
En todos los modelos te´oricos de los juegos existe la entidad jugador. Un jugador puede ser interpretado como un individuo o un grupo de ellos. Los jugadores pueden tomar decisiones teniendo en cuenta los estados de los dem´as jugadores, o solamente teniendo en cuenta el estado propio y la maximizaci´on de los pagos que puede recibir. La diferencia entre estos dos tipos de jugadores deriva en dos categor´ıas de juegos: Cooperativos y No Cooperativos. Un juego estrat´egico puede definirse como un modelo de interacci´on entre decisiones y acciones en los cuales los agentes que toman las decisiones escogen un plan de acciones para maximizar una funci´on de beneficio. El modelo consiste en un conjunto finito de N jugadores y por cada jugador i existe un conjunto de accionesAi.
El alto nivel de abstracci´on de estos modelos permite aplicarlos a una gran variedad de situaciones. Un jugador puede ser un ser humano, una sociedad, un animal o un computador. Si bien las aplicaciones m´as comunes se pueden encontrar en la econom´ıa, tambi´en hay aplicaciones en las din´amicas de poblaciones, espec´ıficamente al control de sistemas din´amicos.
En los juegos no cooperativos de informaci´on completa, los jugadores toman sus decisiones analizando las respuestas de su competencia, encontrando puntos donde la estrategia maximice la ganancia que pueden llegar a recibir. Si todos los jugadores realizan este tipo de razonamiento se
2.2. TEOR´IA DE JUEGOS CAP´ITULO 2.
llega a los denominados puntos de equilibrio. Estos puntos son de vital importancia, puesto que las din´amicas poblacionales presentan un comportamiento evolutivo convergente a los puntos de equilibrio del juego asociado.
2.2.1
Juegos Potenciales
Sea un juego definido por una funci´on de pago (Fitness)F. Dado que los estados de las poblaciones para este juego sonX ={x∈Rn
+ :
P
k∈Sxk = 1} y que el simplex de la poblaci´on pertenece a los reales enX entonces se puede definir [4] :
Definici´on 2.2.1 Sea F : Rn+ un juego potencial.F es un juego potencial si existe una funci´on
continuamente diferenciablef :Rn+→Rtal que:
∇f(x) =F(x),∀x∈Rn+
La anterior definici´on tiene como consecuencia que si F ∈ C con C las funciones continuas, entonces el juego es potencial si solo si satisface la exterioridad sim´etrica lo cual es:
∂Fi
∂xj
(x) =∂Fj
∂xi
(x),∀i,j ∈Sp
ConSp el conjunto donde viven los ´ındicesi,j.
2.2.2
Juegos Estables
Definici´on 2.2.2 Un juego poblacional ,seg´un [5],F :X →Rn es un juego estable si
(y−x)T(F(y)−F(x))≤0,∀y,x∈X (2.3)
Si un juego no es estable, entonces el equilibrio al cual convergen las din´amicas se alejar´a del equilibrio de Nash a un estado trivial.
Definici´on 2.2.3 Se le llama a un estado de la poblaci´onx~sun estado trivial o esquina si se cumple
:
~
xs={x∈X| X
k∈S
xk =mp∧ ∃k|xk=mp}
Una analog´ıa de la definici´on 2.2.3 con los sistemas lineales es el comportamiento din´amico de un sistema cuya matriz de relaci´on entre el estado y la derivada de estado posee valores propios positivos.
2.3. JUEGOS EVOLUTIVOS Y DIN ´AMICAS POBLACIONALES CAP´ITULO 2.
Figure 2.3:Estados de las poblaciones en un juego inestable a lo largo del tiempo
Figure 2.4:Estados de las poblaciones en un juego estable a lo largo del tiempo
2.3
Juegos Evolutivos y Din´
amicas Poblacionales
Sea una poblaci´on de agentes Np donde el n´umero de agentes individuales N es muy grande (ej. 10000) de tal forma que la fracci´on Ni;∀i ∈ [1,N] tenga sentido, por ejemplo, variables como la cantidad de ´atomos, gramos en una masa, voltios en una fuente el´ectrica, entre otros.
Estos agentes pueden estar definidos bajo un juego, es decir, que cada agente va a decidir cu´al estrategia utiliza definiendo los estados de una poblaci´on como la cantidad de agentes que han tomado una decisi´on en particular. En otras palabras, el estado de la poblaci´on es un referente de c´omo se han organizado los agentes en la poblaci´on bas´andose en un juego. La forma c´omo los agentes deciden cambiar de estrategia est´a asociada a los protocolos de revisi´on y, sobre todo, de la informaci´on que los agentes posean para medir o censar los diversos estados. Esto implica que en un sistema ideal, todos los agentes pueden conocer el pago que est´an recibiendo los dem´as agentes, tal como en el equilibrio de Nash. Sin embargo, esta suposici´on es bastante fuerte y se eliminar´a m´as adelante en los juegos distribuidos, donde los agentes solo poseen informaci´on de sus vecinos. En este sentido se definen los estados de una poblaci´on:
x= [x1x2x3...xn]T
Como los N estados o estrategias que los agentes pueden tomar en una poblaci´on.
Por otro lado, haciendo una relaci´on con los juegos matriciales, el vector de estados x corre-sponde al vector de estrategias mixtas que toman los jugadores en un juego.Se define la funci´on
F :Rn→
Rncomo la Fitness que determina el valor de pago que reciben los estados de la poblaci´on.
En t´erminos de juegos tradicionales, si la matriz de pago A es cuadrada entoncesF(x) =Ax.Una vez que se definen los estados de la poblaci´on es importante resaltar la parte din´amica del sistema, es decir, c´omo evolucionan las proporciones de la poblaci´on a lo largo del tiempo. Debido a que las funciones de Fitness representan el pago de los estados, es natural pensar en una din´amica en las cuales los estados deseen ir a donde se est´a pagando m´as, es decir, que la poblaci´on encuentre puntos de equilibrio que maximicen los pagos en cada estado. Para pensar en estas din´amicas solo basta con definir el par´ametrox˙(t)donde la funci´onf(x,t)puede ser lineal o, en la mayor´ıa de los casos, ser no lineal. Este par´ametro representa c´omo cambia el valor de x en el tiempo, es decir que si valor
2.3. JUEGOS EVOLUTIVOS Y DIN ´AMICAS POBLACIONALES CAP´ITULO 2.
del estadox(t)tender´a a crecer y, por el contrario, six˙(t)<0el valor del estado comienza a decrecer. A diferencia de cualquier sistema din´amico, el propuesto para las poblaciones debe cumplir con la conservaci´on de agentes, es decir que la proporci´on de agentes siempre deben sumar el valor neto del recurso por el que se disputan los agentes:P
i∈Sxi=N .A este conjunto de estados que cumplen con la condici´on anterior se le denomina Simplex, y corresponde a las limitaciones f´ısicas que debe respetar el sistema; es decir, es el valor m´aximo de voltaje que puede entregar una fuente, el tiempo m´aximo que se le asigna a un sem´aforo, la cantidad de potencia m´axima que puede generar una celda fotovoltaica, entre otros.
2.3.1
Protocolos de Revisi´
on
Un protocolo de revisi´on es una funci´onρij :Rn×Xn →Rn+×n que determina el flujo de agentes
de un estado de la poblaci´on (estrategia) i-esima al estado j-esimo. La consideraci´on de positividad de los protocolos de revisi´on suelen estar enmarcadas en las proporciones de los agentes de una poblaci´on, entonces el m´aximo flujo que puede ir del nodo i al nodo j es la poblaci´on total que exista en el nodo i, y por le contrario, el m´ınimo es 0.
Esta restricci´on no limita el flujo de los agentes en los estados, puesto que si para la combi-naci´onij el flujo es negativo, los protocolosρij = 0yρji>0simulando el evento de flujo negativo desde i a j.
2.3.2
Mean Dynamics
Una vez definido el concepto de protocolo de revisi´on, los agentes evaluar´an su condici´on actual compar´andola con los dem´as estados de la poblaci´on, decidiendo si se quedan en un estado u otro. Bajo este escenario los agentes migrar´an de una poblaci´on local a otra seg´un el estado y la recompensa que reciban por estar en cada una de ellas. Este comportamiento puede ser descrito por la siguiente ecuaci´on:
˙
xi(t) =
d
dtxi(t)in− d
dtxi(t)out
˙
xi(t) = X
j∈S
xjρji(F(x),x)− X
j∈S
xiρij(F(x),x) (2.4)
2.3.3
Din´
amicas Evolutivas Deterministas
Seg´un [5] si se define un conjunto de poblaciones P = [1,2,..,p] cada una con una masa mp y un conjunto de estrategiasSp dondeX ={x∈
Rn+ :x= (x1,x2,...,xn),Pi∈Spx p
i =mp}. Y adem´as se definen los conjuntos:
F ={F:X→Rn|F∈Lc} T ={{xt}t≥0⊆X|x(·)∈C}
Donde Lc es el conjunto de funciones Lipschitz continuas yC es el conjunto de funciones con-tinuas. Con base en las anteriores aclaraciones se puede definir entonces:
2.4. REPLICATOR DYNAMICS CAP´ITULO 2.
Definici´on 2.3.1 Una din´amica evolutiva determinista es un conjunto evaluado de la relaci´on
D:F →T la cual asigna a cada juego poblacional un conjunto de trayectoriasD(F)⊂T tal que satisfaga que para cada ξ∈X existe un{xt}t≥0∈D(F)conx0=ξ.
La definici´on 2.3.1 plantea que para cada condici´on inicial de estados de una poblaci´onξexiste una ´unica evoluci´on de trayectorias xt para tiempos mayores a 0 (o cualquier punto donde se den las condiciones iniciales) guiadas por el mapeoD(F).
Definici´on 2.3.2 Se dice que una din´amica poblacional representada porVF tiene correlaci´on
pos-itiva cuando se cumple queVP
F(x)6= 0o lo que es igual a queV P
F(x)0F(x)>0
2.4
Replicator Dynamics
Las din´amicas conocidas bajo el nombre de Replicator Dynamics son miembros de la familia Imi-tative Dynamics y son descritas, en principio, por el siguiente protocolo de revisi´on:
ρpij(F(x),x) = xj
mp[Fi−Fj]+ (2.5)
Donde
[g(x)]+= max (0,g(x))
Siendo as´ı, utilizando la ecuaci´on de las din´amicas medias (Mean Dynamics) en la ecuaci´on 2.4 se obtiene:
˙
xi(t) =xi(Fi(x)− X
j∈S
xjFj(x))
Ahora, utilizando la notaci´on matricial de estados se definex= [x1,x2,...,xn]eIx=diag{x}de forma que:
˙
x(t) =Ix(F(x)−1xTF(x)) (2.6)
2.5
Software de Microsimulaci´
on PTV VISSIM
La herramienta de simulaci´on para sistemas de tr´afico PTV VISSIM es reconocida a nivel mundial como uno de los mejores paquetes de software para modelo basados en comportamientos individuales de los agentes (veh´ıculos, peatones, bicicletas, etc.), permitiendo una representaci´on del modo inclusive de variables como el color del veh´ıculo, caracter´ısticas de respuesta por parte de los conductores, entre otras. A su vez, PTV VISSIM permite implementar modelos multi-modales, donde adem´as de modelar el comportamiento de veh´ıculos en una red, incluye transporte p´ublico, bicicletas, peatones, rickshaw, entre otras.
PTV VISSIM organiza los modelos mediante elementos como Maps, Links,Traffic Light,Traffic Signal,Counter,Nodes,Vehicle Inputs. Los mapas son descripciones geom´etricas de las ubicaciones de los elementos y sus configuraciones. Estos archivos son almacenados en los archivos .inp y .ini (Versi´on 5.4) necesarios para ejecutar el modelo de micro simulaci´on.
2.6. INTERFAZ COM DE PTV VISSIM 5.4 CAP´ITULO 2.
Adem´as de permitir el an´alisis del comportamiento de una red mediante indicadores, al ser un software de micro simulaci´on, permite observar mediante una interfaz gr´afica el comportamiento de los veh´ıculos en tiempo real,y adem´as observar los escenarios en vistas 3D.
Otro factor diferenciador del paquete PTV VISSIM, es el m´odulo de comunicaci´on COM (Component Object Model), que permite controlar los par´ametros de la simulaci´on desde una plataforma externa o cualquier lenguaje que permita acceso por COM. En este sentido se han desarrollado trabajos abordando la programaci´on de PTV VISSIM desde Python, Java y unos pocos casos C# y Matlab.
2.6
Interfaz COM de PTV VISSIM 5.4
Desarrollada en 1993 por Microsoft para los sistemas Windows, es un est´andar binario para la comunicaci´on entre programas con la plataforma Windows. Por este motivo, la programaci´on basada en COM ha sido muy popular para los sistemas de Microsoft como los frameworks OLE, ActiveX y DirectX.
En t´erminos generales, COM es un lenguaje neutral que permite la implementaci´on de obje-tos y clases independiente del lenguaje de programaci´on tanto por interpretaci´on como por compilaci´on, lo cual permite que herramientas interpretadas como Python y Java interact´uen con rutinas escritas en C previamente compiladas. Actualmente Microsoft ha migrado sus nuevas plataformas a la nube y el entorno web actualizando el modelo por COM a Microsoft.Net. No obstante, las aplicaciones de escritorio que tengan un m´odulo de COM pueden comunicarse con el lenguaje de sistema operativo y permitir la interacci´on entre aplicaciones.
Para acceder por COM a los objetos de una aplicaci´on se requiere que esta posea un m´ o-dulo de programaci´on COM, es decir, que previamente en la aplicaci´on se interpretaron los objetos y clases del lenguaje nativo al lenguaje COM. Esta limitante se suele encontrar en las aplicaciones comerciales para evitar problemas se seguridad, de compatibilidad, de estabilidad y propiedad intelectual, no obstante el paquete PTV VISSIM 5.4 contiene un m´odulo COM que permite el acceso completo a todas las herramientas del sistema.
3
Estado del Arte
3.1
Sistemas de Transporte Inteligente
Se denominan de transporte inteligente a los sistemas inform´aticos y de telecomunicaciones que son utilizados para mejorar el desempe˜no de los sistemas de transporte. Si bien, es ampliamente conocido el aporte de los sistemas inform´aticos a los medios de transporte terrestres, el campo de acci´on de los ITS( Intelligent Transportations Systems) abarcan desde trenes de altas velocidad, pasando por veh´ıculos autom´ovil, hasta los medios a´ereos, ferris, y buques de carga. [6].Actualmente los ITS responden con grandes avances en el uso de telecomunicaciones de corto alcance y bajo consumo de potencia, (especialmente dise˜nadas para la comunicaci´on veh´ıculo a veh´ıculo), uso de reconocimiento facial para detectar estados del conductor, reconocimiento de placas por an´alisis de video, uso de la informaci´on din´amica de las v´ıas para control de rutas y semaforizaci´on [7].
3.2
Sensado y Percepci´
on
Dado que los sistemas ITS requieren acceder a informaci´on para la toma de decisiones se requiere de acceder a datos acerca del comportamiento de los autos en una v´ıa, las condiciones clim´aticas de veh´ıculos a´ereo, las demandas de pasajeros y carga, entre otros. Para acceder a esta informaci´on se suelen dise˜nar redes de sensores de diferentes tipos dentro de los cuales se encuentran los mag-net´ometros, c´amaras de video, loops inductivos, entre otros. No solo basta disponer de los sensores, tambi´en la distribuci´on, los sistemas inform´aticos y electr´onicos para procesarla, la miner´ıa de datos que se pueda realizar a la gran cantidad de datos que suelen arrojar estos sensores, los algoritmos para procesarla (como la visi´on artificial) y por ´ultimo la integraci´on de m´ultiples sensores para estimar medidas.
3.2.1
Loops Inductivos
Aprovechando la composici´on de los materiales de la mayor´ıa de los veh´ıculos, un tipo de sensor muy utilizado para detectar la presencia de veh´ıculos sobre el asfalto, cemento o concreto, son las espiras inductivas. Estos sensores est´an compuestos de un lazo inductivo el cual debe estar protegido bajo el pavimento de la corrosi´on y agentes que deterioren el desempe˜no del sensor, no obstante, es una de las soluciones m´as econ´omicas a la hora de implementar un sensor de veh´ıculos. Si bien resultan de f´acil instalaci´on y de bajo costo, estos sensores han sido de amplio estudio por parte de la academia y se mantienen como el m´etodo de sensando de veh´ıculos m´as com´un en Francia y Estados Unidos
3.2. SENSADO Y PERCEPCI ´ON CAP´ITULO 3.
[8]. Aun vi´endose limitados por el espacio de trabajo (alrededor de 4.5m x 1.5m) se han realizado diversas modificaciones al dise˜no b´asico del sensor, desde el uso de m´ultiples espiras acopladas [9], pasando por capas de l´ogica difusa para procesar las firmas de f´abrica que poseen los autom´oviles [8], hasta un resonador que identifica diferentes tipos de veh´ıculos (bicicletas, motocicletas, autom´oviles y buses) [10].
3.2.2
c´
amaras de Video
Otro sensor que en los ´ultimos a˜nos ha tomado gran importancia son las c´amaras de video. Las c´amaras son utilizadas en las autopistas, carreteras y t´uneles dado que son econ´omicas y f´aciles de instalar. La mayor´ıa de las c´amaras habilitadas para sensar el trafico est´an comunicadas con un centro de control donde se visualizan los estados de tr´afico para los diversos nodos de la ciudad o zona urbana. No obstante, gracias a los avances en visi´on artificial y al poder de c´omputo en aumento, se han venido desarrollando algoritmos y t´ecnicas para identificar veh´ıculos, placas, comportamientos, e inclusive si el conductor est´a tomando conductas peligrosas [11] [12] [13] [14] [15].
En [16] se implementa un sistema para reconocer caracteres en las placas de los veh´ıculos utilizando patrones de color con fotos tomadas a alta velocidad, por lo cual resulta factible su uso para detecci´on de veh´ıculos en movimiento. De la misma forma es frecuente el apoyo por parte de plataformas basadas en machine learning para identificar velocidades de los veh´ıculos, tipos de veh´ıculos, integrar datos de redes sociales, comportamientos de conducci´on e identificar eventos como accidentes o congestiones no solo para equipos fijos sino para c´amaras instaladas en los veh´ıculos [17] [18] [19] [20].
Una t´ecnica usada por varios autores en [21] [22] [23] [24] es la detecci´on y prevenci´on de accidentes utilizando herramientas como la fotograf´ıa est´ereo. Esta t´ecnica explota el mecanismo por el cual el ser humano percibe el espacio en im´agenes en dos dimensiones, esto gracias a la combinaci´on de dos im´agenes separadas del punto de foco. Las aplicaciones de esta t´ecnica van desde la detecci´on de peatones en la v´ıa hasta m´etodos para contar autos en una v´ıa r´apida sin utilizar carga computacional muy alta. Si bien estos algoritmos son simulados y en algunos casos son probados in situ, el costo computacional de incluir visi´on artificial acarrea tiempos e infraestructura mayores. Un com´un denominador en los trabajos de visi´on artificial es el uso de plataformas basadas en Matlab o paquetes especializados. Esto limita en cuanto a costos, tiempos y espacios, a los sistemas de visi´on artificial, sobre todo para las aplicaciones a bordo de los veh´ıculos.
A diferencia de los Loops inductivos, las c´amaras de video est´an condicionadas por la luz ambiente, especialmente por las diferencias clim´aticas de las estaciones y si es de d´ıa o de noche. Por este motivo se han estudiado ampliamente m´etodos para calibrar las c´amaras. En [25] se discuten los problemas asociados a la iluminaci´on urbana nocturna que puede llegar a confundir los algoritmos tradicionales basados en video al crear “autos virtuales” debido a los faros de luz en la v´ıa, autos adyacentes, entre otros elementos de tr´afico. Tambi´en existen dificultades para interpretar veh´ıculos como camiones que obstruyen la visi´on de la c´amara porque no pueden captar los veh´ıculos ubicados detr´as del cami´on.
3.3. SISTEMAS DE COMUNICACIONES INAL ´AMBRICAS CAP´ITULO 3.
Para solucionar este tipo de problemas se han realizado estudios desde diferentes m´etodos de calibraci´on autom´atica para las c´amaras de video fijas, como algoritmos de procesamiento de im´ a-genes incluyendo ´angulos ´optimos de inclinaci´on de las c´amaras (aproximadamente 30◦ seg´un [26]) , hasta soluciones basadas en c´amaras a bordo del veh´ıculo para identificar veh´ıculos cercanos y se˜nales de tr´afico [27] [28] [29] [30] [26].
3.2.3
Magnet´
ometros
Para detectar veh´ıculos est´aticos se han desarrollados sensores magn´eticos y recientemente [31] se han implementado t´ecnicas para captar veh´ıculos en movimiento. Estos sensores a diferencia de los bucles inductivos, no requieren intervenci´on estructural sobre el pavimento y pueden instalarse encima del mismo, no se ven afectados por las condiciones lum´ınicas (d´ıa, noche, estaciones, entre otros). Los sistemas basados en bucles inductivos no permiten obtener ning´un tipo de clasificaci´on de veh´ıculos, son menos exactos que los basados en sensores magn´eticos, limitados a una cobertura de acci´on, poseen grandes costes de instalaci´on y necesitan de grandes c´alculos “offline” para operar.
El funcionamiento de este tipo de sensores se reduce a la perturbaci´on que se genera por la carrocer´ıa de los veh´ıculos con el campo magn´etico de la tierra. Utilizando modelos f´ısicos y matem´aticos (dipolos magn´eticos y elementos finitos) se logran aproximaciones interesantes acerca de la composici´on del veh´ıculo, el tama˜no, velocidad y forma del mismo. Debido al contenido met´alico del chasis de los veh´ıculos (hierro, n´ıquel y acero) se produce una permeabilidad magn´etica diferente a la del aire. Esta perturbaci´on es registrada por el magnet´ometro como una diferencia respecto al valor presente del dipolo magn´etico propio de la tierra [31] [32] [33] .
3.3
Sistemas de Comunicaciones Inal´
ambricas
Obtener informaci´on y procesarla para mejorar el desempe˜no del tr´afico urbano es una de las principales tareas de los sistemas ITS, no obstante esta tarea no podr´ıa llevarse a cabo sin un sistema de comunicaci´on que permita completar la cadena entre los sensores, los controladores y los actuadores. El panorama actual en temas de comunicaciones es bastante distinto al panorama en 1986 cuando se acu˜no el t´ermino de sistemas de transporte inteligente. Actualmente en la literatura se registran tecnolog´ıas de bajo consumo, m´ultiples protocolos, acceso a internet y comunicaci´on entre veh´ıculos que incrementan el potencial de los sistemas de transporte inteligente.
La creciente demanda de los usuarios por acceder a conectividad internet a bordo de sus autom´oviles debido al uso de tel´efonos celulares inteligentes, implica una expansi´on de las redes inal´ambricas para soportar la demanda. Esta inversi´on en infraestructura permitir´a a los usuarios acceder a internet e implementar de manera masiva la coordinaci´on de veh´ıculos dentro de un esquema MAS (multi agent system) aprovechando los bajos costos de sensores a bordo de los veh´ıculos [34] [35].
Tradicionalmente se han utilizado para plataformas inal´ambricas las tecnolog´ıas Bluetooh, WIFI y ZigBee siendo la tecnolog´ıa Wi.Fi de mayor velocidad ( 300 Mbps), seguida del Bluetooth
3.4. SISTEMAS DE CONTROL CAP´ITULO 3.
con menor velocidad (8Mpbs) pero de un consumo de energ´ıa significativamente menor. Por ´ultimo la tecnolog´ıa ZigBee se caracteriza por una velocidad muy limitada (alrededor de 250 kps) pero una distancia de alcance de hasta 1km y una expansi´on hasta 65000 nodos, superando en creces las limitaciones de 8 nodos para el Bluetooth y 50 para el Wifi [36]. Bajo este panorama diversos autores han desarrollado aplicaciones en redes de sensores inal´ambricas, especialmente en el ´area de tr´afico, redes de sensores que puede comunicar puestos de control o veh´ıculos entre s´ı.
Los dispositivos Bluetooth son los m´as comunes en los autom´oviles. Sin embargo, esta tec-nolog´ıa no permite una comunicaci´on eficiente con otros veh´ıculos si la distancia es superior a 10 metros. Por otro lado como se mencion´o anteriormente, la conectividad de una red basada en Bluetooth no permite la escalabilidad a m´ultiples dispositivos conectados entre s´ı. Aun as´ı, se han desarrollado aplicaciones que utilizan Bluetooth en sistemas ITS aprovechando el bajo costo de los m´odulos por lo cual son utilizados para las bases repetidoras de sensores en la v´ıa y para comunicar estados de tr´afico al veh´ıculo [37] [38] [39] [40].
3.4
Sistemas de Control
3.4.1
Semaforizaci´
on
Los sem´aforos son dispositivos de se˜nalizaci´on utilizados para el control y gesti´on de tr´afico tanto peatonal como vehicular. Son instalados en intersecciones viales con la intenci´on de repartir el recurso vial de manera an´aloga a un multiplexor permitiendo el uso de un espacio de v´ıa por periodos de tiempo limitados. El primer modelo se implement´o en 1869 en Londres sin embargo, no fue sino hasta 1912 cuando se instal´o el primer sem´aforo el´ectrico en Utah, Estados Unidos. M´as de 110 a˜nos de desarrollos tecnol´ogicos no han representado en cambios significativos en la herramienta de control de tr´afico m´as utilizada en el mundo.
Si bien se han desarrollado diversos tipos de sem´aforos para peatones, trenes, cronometra-dos, entre otros, la estructura de control de tiempo de fases con 3 colores b´asicos (Rojo, Verde,Ambar) no ha sido modificada. En Colombia, el color Verde representa la v´ıa libre para seguir de frente o girar a la derecha (a menos que otra se˜nalizaci´on lo proh´ıba expl´ıcitamente), los peatones podr´an cruzar la v´ıa y cuando la luz verde presente intermitencia se advierte a los conductores el fin de esta fase. La fase correspondiente a Amarillo/Ambar advierte el cambio de fase y los conductores deber´an reducir su velocidad. Por ´ultimo, la fase rojo advierte que los autos no deben pasar la l´ınea de tr´ansito y ning´un peat´on debe cruzar la v´ıa. Las fases reglamentarias en Colombia por el Ministerio de Transporte deben ser Rojo-Verde-Amarillo-Rojo. La sintonizaci´on de los tiempos de las fases se convierte en un aspecto clave para el control del tr´afico. El Ministerio de Transporte recomienda utilizar una divisi´on de los tiempos proporcionales al flujo m´aximo promedio que se registren en las v´ıas. No obstante se fija tambi´en que el tiempo en verde para los peatones debe ser como m´ınimo el tiempo bajo el cual un peat´on pueda cruzar la calle con ritmo medio. Estas sintonizaciones de tiempo se denominan control por malla abierta de tiempos fijos. Dado que no se requieren sensores, el costo de implementaci´on es significativamente menor, as´ı como su desempe˜no frente a algoritmos adaptativos.
3.4. SISTEMAS DE CONTROL CAP´ITULO 3.
3.4.2
Control de Tiempo de Sem´
aforos basados en L´
ogica Difusa
En los ´ultimos a˜nos el uso de l´ogica difusa (Fuzzy Logic) para controlar el tr´afico urbano ha sido foco de investigaci´on desde el control de los tiempos de los sem´aforos utilizando sintonizaci´on directa por conjunto de reglas difusas, hasta implementaciones en FPGAs utilizando m´ultiples sensores, pasando por combinaciones de t´ecnicas basadas en redes neuronales y algoritmos gen´eticos. Los controladores basados en l´ogica difusa explotan el conocimiento de un experto para sintonizar reglas difusas de controlador y poder responder al sistema con base a la experiencia heredada de un experto, por lo cual no suelen requerir de procesos de optimizaci´on online [41] [42].
De esta forma, en [43] se cuestiona el desempe˜no de los algoritmos adaptativos ´optimos que requieren realizar c´alculos con bastantes recursos computacionales que coh´ıben la implementaci´on de este tipo de sistemas por el requerimiento de poder computacional, restricciones del problema de optimizaci´on y los rangos de factibilidad de problema. En general, en la literatura se registra el uso de los controles basados en l´ogica difusa como un complemento de t´ecnicas variadas.
Estas t´ecnicas suelen apoyarse de redes neuronales, aprendizaje reforzado, estimaciones bayesianas, procesos estoc´asticos, optimizaci´on bioinspirada (Hormigas y Abejas) y teor´ıa de juegos, pero se registran pocas investigaciones donde la sinton´ıa de los tiempos sea principalmente producto de un controlador difuso. Adem´as, las reglas y conjuntos bajo los cuales el controlador difuso act´ua son escogidas de forma arbitraria en la mayor´ıa de los art´ıculos en la literatura, y esto se debe a la naturaleza subjetiva del control basado en experto. As´ı como se menciona en [44], el controlador difuso actualmente aprovecha recursos de otras herramientas como redes neuronales para entrenar bajo prueba y error los par´ametros de los conjuntos difusos y as´ı asegurar un mejor desempe˜no [45] [46] [47] [48].
3.4.3
Control de Tiempo en Sem´
aforos basados en Redes Neuronales
Las aproximaciones que utilizan redes neuronales en el control de tiempos para semaforizaci´on aprovechan la naturaleza adaptativa y los conceptos de aprendizaje que pueden proveer las redes neuronales artificiales (ANN). Autores como [49] desarrollan metodolog´ıas de control para optimizar el recurso (tiempo en verde y rojo) en sistemas distribuidos o donde la informaci´on sea incierta en algunos nodos. Las redes neuronales se destacan por la redundancia de la informaci´on que los hace un control robusto sobre todo a perturbaciones y variaciones de los ejemplos con los cuales se entrenan (supervisado o no supervisado, y son una estrategia ideal para el control distribuido en el control de sem´aforos. Si bien las ANN son provistas con diversas ventajas, el costo computacional de recurrir a algoritmos de optimizaci´on de funciones de costo no lineales de varias variables se convierte en la principal debilidad de esta familia de estrategias de control [50] [51] [52] [53].Por otro lado, para mejorar el desempe˜no y precisi´on de las redes neuronales, se requiere dise˜nar adecuadamente el nivel de capas ocultas, proceso que no est´a estandarizado en la literatura y como menciona [54] no existe un m´etodo para encontrar el n´umero ´optimo de capas ocultas. Una soluci´on a este problema se plantea en [54] donde utilizan un algoritmo iterativo de Kolmogorov.
El potencial de las redes neuronales es explotando en [55] donde se propone utilizar redes de neuronas entrenadas para tareas espec´ıficas, en este caso la sintonizaci´on de tiempos por cruce de manera individual, y no una red de m´ultiples capas complejas para sintonizar la red completa. Si bien esta aproximaci´on reduce el tiempo de c´omputo de manera significativa y mejora la respuesta
3.4. SISTEMAS DE CONTROL CAP´ITULO 3.
individual de cada intersecci´on semaforizada no se aseguran tiempos optimos de la red en conjunto, motivo por el cual los autores introducen elementos coordinadores jerarquizados para mejorar el desempe˜no de la red en conjunto.
3.4.4
Control de Tiempo en Sem´
aforos basados en Teor´ıa de Juegos
Comparando con la vasta investigaci´on que llevan las redes neuronales, el aprendizaje reforzado, los algoritmos heur´ısticos y la l´ogica difusa, la teor´ıa de juegos se ha rezagado, especialmente en tr´afico. La teor´ıa de juegos utiliza herramientas matem´aticas para modelar las interacciones y decisiones de agentes individuales. Aun cuando en la d´ecada de 1990 se realizaron aproximaciones al control basado en teor´ıa de juegos para administrar recursos (especialmente para tr´afico a´ereo) [56] [57], solo hasta el 2006 que se propusieron modelos para el control del tr´afico urbano utilizando semaforizaci´on. Desde entonces el principal punto de investigaci´on ha sido c´omo coordinar agentes para distribuir un recurso finito, que para el caso del estudio espec´ıfico de tr´afico es el tiempo en verde de un sem´aforo. Dos hitos hist´oricos se presentan en [58] [59]. En [58] se plantea el problema de tr´afico y la distribuci´on del recurso de los tiempos del sem´aforo (fases) con el marco matem´atico y el an´alisis bajo los equilibrios de Nash e introduce variables aleatorias a los modelos. Por otro lado, en [59] se presenta el uso de din´amicas asociadas a juegos evolutivos para el control de rutas de veh´ıculos en juegos no cooperativos.
En [60] se presenta un algoritmo basado en din´amicas poblaciones (juegos evolutivos) apoy-ados en una red neuronal para permitirles a los jugadores aprender y mejorar la sinton´ıa de los controladores. Aun as´ı, es con [61] que se plantea la necesidad de un sistema en red para el control de tr´afico debido al gran tama˜no y complejidad de la red y la importancia del uso de algoritmos de consenso para solucionar el problema de la congesti´on. Espec´ıficamente se recomiendan controles basados en agentes y teor´ıa de juegos puesto que utilizar modelos no resulta viable ante la complejidad de la red y la variabilidad de la misma. As´ı mismo en [62] se plantea el problema del tr´afico en una intersecci´on semaforizada utilizando esta vez el modelo matem´atico de juegos cooperativos. Bajo esta perspectiva definen adecuadamente los equilibrios de Nash y de Pareto para el juego de dos intersecciones, lo cual si bien es loable deja fuera una expansi´on a sistemas complejos como una red vial real. Aun as´ı, logran realizar simulaciones y se encuentra que los algoritmos de tiempo fijo pueden ser sintonizados para un correcto funcionamiento cuando el flujo no presenta un estado de congesti´on pero cuando se congestiona, el algoritmo basado en juegos cooperativos que anteriormente no presentaba ninguna ventaja sobre los Fixed Time Algorithm, esta vez mantiene la velocidad media de los autos, mientras que los algoritmos de tiempo fijo colapsaron enviando a 0 la velocidad media de las intersecciones. Los resultados de [61] y [62] son prometedores en cuanto al uso de teor´ıa de juegos en el control de las fases de la semaforizaci´on urbana.
4
Metodolog´ıa
El trabajo se desarroll´o en 9 etapas las cuales contemplan desde el planteamiento del problema hasta el an´alisis de los resultados. En total se utilizaron 15 semanas aprovechando una carga de 12 horas semanales.
• Planteamiento y Propuesta :Se realiz´o la primera aproximaci´on al problema, desde el planteamiento matem´atico, hasta las consideraciones para la GUI y se inspeccion´o cu´al ambi-ente de programaci´on ser´ıa adecuado para realizarla. En esta etapa se definieron los alcances, se realizaron unas primeras pruebas con el software PTV VISSIM.
• Estado del Arte:Se efectu´o una revisi´on bibliogr´afica para conocer el estado actual de los sistemas ITS, el alcance de los sensores, los problemas en los canales de comunicaciones e identificar tendencias. Sobre esta base se realiz´o una indagaci´on en especial sobre estrategias de control por semaforizaci´on y por ´ultimo a las aproximaciones por medio de teor´ıa de juegos.
• Marco Te´orico:Se realiz´o una formalizaci´on de las din´amicas poblacionales desde la perspec-tiva de los protocolos de revisi´on as´ı como un an´alisis de las caracter´ısticas de estas din´amicas para diferentes consideraciones, equilibrios y su comportamiento en grafos distribuidos.
• Modelo de Tr´afico: Se hizo una aproximaci´on a tres modelos de tr´afico y se desarrollaron simulaciones para validar su comportamiento, desde la perspectiva de un cruce sencillo hasta el modelo basado en estados con saturaci´on.
• Din´amicas Poblacionales: Se indag´o acerca de las din´amicas de los juegos evolutivos. Adem´as de implementar algunas din´amicas por medio de protocolos de revisi´on y el m´etodo de las “Mean Dynamics”, se analiz´o el comportamiento de las poblaciones ante juegos distribuidos donde no se posee informaci´on de todos los estados de los agentes.
• Interfaz PTV VISSIM-MATLAB:Se desarroll´o una interfaz gr´afica utilizando la comu-nicaci´on COM que permite el software PTV VISSIM para controlarla desde Matlab. Esta interfaz gr´afica (GUI) se desarroll´o mediante los paquetes gr´aficos GUIDE de Matlab/Java con enf´asis en el dise˜no de interfaces humano-m´aquina.
• Dise˜no de los Controladores:En esta etapa se implementaron en Matlab los controladores basados en Tiempo Fijo, Proporcionales, Basados en Juegos y Basados en Juegos distribuidos.
• Simulaciones:Para las simulaciones se utiliz´o el modelo de Matlab para 4 nodos utilizando redes con saturaci´on y el software PTV VISSIM bajo la interfaz gr´afica para comparar el de-sempe˜no de los controladores de tiempo fijo, asignaci´on proporcional de tiempo de ciclo, como tiempos en verde y controles de alto nivel como los controles basados en las”M eanDynamics”.
CAP´ITULO 4.
• An´alisis de Resultados:Se analizaron los resultados de las simulaciones y se discuten las tablas generadas por la aplicaci´on gr´afica GUI PTV VISSIM-Matlab.
5
Resultados
5.1
Modelo de Tr´
afico Urbano
En la literatura se registran diversos tipos de modelos de tr´afico vehicular, todos inspirados en ecuaciones diferenciales utilizando principios de fluidos y gases tales como la conservaci´on de la materia y energ´ıa. Los modelos Macrosc´opicos hacen una analog´ıa espec´ıfica entre un fluido y una l´ınea de autos en movimiento eliminando as´ı los factores individuales de cada veh´ıculo en las simulaciones. Los modelos microsc´opicos pretenden describir estos comportamientos individuales de cada veh´ıculo, por ello integran ecuaciones que describen posici´on, velocidad de cada auto en una l´ınea. As´ı, las primeras aproximaciones a modelos de flujo vehicular utilizan una regresi´on basada en datos experimentales que arrojaron curvas del estilo:
V =V0(1− k kmax
) (5.1)
DondeV0 corresponde a la velocidad por defecto de los autos, ykmax es la densidad m´axima que soporta la v´ıa antes de saturarse por completo. As´ı mismo, utilizando la relaci´on entre velocidad y flujoq=kV se obtiene:
q(t) =V0k(t)(1− k(t)
kmax
) (5.2)
Sik(t) =LmaxL(t) . Donde L es la longitud de la cola de autos y la densidad se presenta normalizada.
q(t) =V0 L(t) Lmax
(1− L(t)
Lmax
) (5.3)
A su vez, incluyendo el modelo basado en din´amicas de fluidos donde se contempla el cambio de la velocidad se obtiene:
dv dt =−
c2 k
∂k
∂x (5.4)
∂q ∂x =−
∂k
∂t (5.5)
q(t) =c L(t) Lmax
ln(Lmax
L(t) ) (5.6)
Este ´ultimo modelo es denominado el modelo logar´ıtmico de flujo vehicular, puesto que su comportamiento es descrito por una funci´on logar´ıtmica de la inversa de las longitudes de hileras de
5.1. MODELO DE TR ´AFICO URBANO CAP´ITULO 5.
veh´ıculos en una v´ıa (Figura 5.1). Por otro lado, el modelo inicial es llamado el modelo cuadr´atico que difiere del modelo logar´ıtmicoco sobre todo en los valores pico de tr´afico que es capaz de asimilar una v´ıa.
Figure 5.1:Comparaci´on entre modelos cuadr´aticos y logar´ıtmicos para la asimilaci´on de veh´ıculos en una v´ıa
Si se contempla la ecuaci´on de conservaci´on de masa en un flujo ideal se obtiene la ecuaci´on diferencial:
dm dt =
X
i∈I
Qi (5.7)
Ecuaci´on que describe el comportamiento de las colas en una v´ıa de la siguiente forma:
d
dtH(t) =Qin(t)−ρ(t)[Qout(t)−q(t)] (5.8) d
dtq(t) = d dt[c
H(t)
Hmax
ln (Hmax
H(t))]
d dtq(t) =
c Hmax
d
dt[H(t) ln ( Hmax
H(t))]
d dtq(t) =
c Hmax
q(t)[ln (Hmax
H(t))−1] (5.9)
d
dtH(t) =Qin(t)−ρ(t)[Qout(t)−q(t)] (5.10)
El anterior conjunto de ecuaciones diferenciales es desarrollado por m´etodos num´ericos para obtener el modelo din´amico de una v´ıa contemplando saturaci´on. Para ello es necesario plantear condiciones para la longitud de las colas de veh´ıculosH(t)y para el flujo de veh´ıculos a trav´es de la v´ıaq(t), al igual que los par´ametros de la v´ıa tal comoHmaxque representa el m´aximo volumen de autos que puede almacenar la v´ıa, asimismo c el par´ametro que modela la tasa con la cual
5.1. MODELO DE TR ´AFICO URBANO CAP´ITULO 5.
Figure 5.2:Simulaci´on Modelo unidimen-sional con efecto de saturaci´on sin acci´on regulatoria (Sem´aforo)
Figure 5.3:Simulaci´on Modelo unidimen-sional con efecto de saturaci´on con acci´on regulatoria (Sem´aforo)
los veh´ıculos evacuan las v´ıa. El factorρ(t) es una funci´on ρ: R→ {0,1} donde 0 representa un
sem´aforo o se˜nal de control en rojo, y 1 representa el estado del sem´aforo en verde.
En las figuras 5.2 y5.3 se presentan 3 gr´aficas en el tiempo que corresponden a la evoluci´on din´amica de las colas de veh´ıculos en una v´ıa libre (no sem´aforos), con una tasa de entrada de veh´ıculos y una tasa de salida tal que la resta es constante negativa, esto esQin(t)−Qout(t)<0,∀t lo cual implica que la v´ıa eventualmente se regular´a a 0. Por otro lado, en las gr´aficas se observa el fen´omeno de la saturaci´on que si bien el flujo deQin(t)−Qout(t) = 0(es decir que el equilibrio no es 0), la acci´on del sem´aforo s´ı introduce flujos completamente en 0 y saturando enHmax= 100 hasta que la se˜nal de control permita que el flujo sea diferente de 0.
Definici´on 5.1.1 Se llama v´ıa a un espacio finito que permite el desplazamiento de personas o veh´ıculos tal que cumpla con las din´amicas propuestas en las ecuaciones 5.9 y 5.10
Partiendo de la definici´on anterior se puede postular el siguiente teorema:
Teorema 5.1.1 Para toda v´ıa tal queQin(t)−Qout(t)<0,∀t yρ(t) = 1,∀t se puede afirmar que
lim
t→∞H(t) = 0 y tlim→∞q(t)6= 0
Demostraci´on5.1.1 Dado el modelo de las ecuaciones :
dH
dt = [Qin(t)−[Qout(t)−q(t)]ρ(t)] dq
dt = c Hmax
q(t)[ln [Hmax
H(t)]−1]
5.1. MODELO DE TR ´AFICO URBANO CAP´ITULO 5.
dH
dt =δ(t) +q(t) dH = [δ(t) +q(t)]dt
H(t) =
Z t
−∞
[δ(τ) +q(τ)]dτ+H0
H(t) =
Z t
−∞
[δ(τ)]dτ+
Z t
−∞
[q(τ)]dτ H0
lim
t→∞H(t) = limt→∞ Z t
−∞
[δ(τ)]dτ +
Z t
−∞
[q(τ)]dτ +H0
lim
t→∞H(t) = limt→∞ Z t
−∞
[δ(τ)]dτ + lim
t→∞Q(t) +H0
Si δ(t) < 0 entonces R∞
−∞δ(t)dt < 0 y como q(t) ∈ [0,∞) partiendo del modelo especificado
logaritmico, el valor de Q(t) tiende a 0 en cuanto H tienda a 0.Por lo tanto
lim
t→∞H(t) = limt→∞Q(t) + limt→∞B(t) +H0
y como Q(t) +B(t)<0 YH0>0 el valor deH(t)∈[0,Hmax] el m´ınimo valor al que tendera
H(t)para un decreciente Q(t) +B(t)es 0.
Ahora bien, para el modelo extensivo de sistemas de gran escala como una red de tr´afico de m´as de 2 nodos es necesario realizar un planteamiento el espacio de estados. En ese sentido se define el vector de estadosx(k) como el vector deRn
+ que representa las colas de cada v´ıa asociada a cada
nodo. En este modelo se tienen nodos de perturbaci´on que corresponden a los nodos en los cuales ingresan veh´ıculos y los nodos sumidero que son aquellos en los cuales los veh´ıculos siempre salen de la red vial. Para modelar estos comportamientos se declara la siguiente regla de evoluci´on para las colas de veh´ıculos en el sistema:
xi(k+ 1) =xi(k) +ρj−1(k)Qiin(k)(1−ci(k))−ρi+1(k)Qouti (k)(1−ci+1(k)) (5.11)
El modelo de cada estado expandido para valores futuros de tiempo se puede generalizar con la ecuaci´on 5.12 donde ρi−1 yρi+ 1son los valores de los sem´aforos antes y despu´es de la v´ıa, es
decir los sem´aforos que controlan los flujos de ingreso y salida de los veh´ıculos por una v´ıa.
xi(t+n) =xi(t) n Y
k=1
1 +ρi−1(k)Q
i
in(k)−ρi+1(k)Qiout(k)
xi max + n X j=1
ρi−1(j)Qiin(j)−ρi+1(j)Qiout(j) n−1
Y
l=j+1
1 +ρi−1(l)Q
i
in(l)−ρi+1(l)Qiout(k)
xi max
5.2. AN ´ALISIS DE LA FUNCI ´ON DE FITNESS CAP´ITULO 5.
5.2
An´
alisis de la Funci´
on de Fitness
Partiendo de la definici´on 2.2.2 en la cual se enuncia el requerimiento para denominar a un juego estable, proponiendo una funci´on de Fitness de la forma:
F(x) =Mx+C
Se procede a comprobar el principio de estabilidad y se obtiene:
(y−x)T(F(y)−F(x))≤0 (y−x)T([My+C]−[Mx+C])≤0
(y−x)TM([y−x])≤0 (z)TM(z)≤0
Lo cual se cumple siempre y cuandoM sea una matriz semi definida negativa. Definici´on 5.2.1 Una matrizM es negativa semi definida si:
xTMx≤0;∀x6= 0 (5.13)
O lo que es igual, que todos los valores propios de la matriz M sean negativos.
Ahora bien, sea un juego definido por F que cumple con las definiciones 2.2.2 y 2.2.1 existe entonces una funci´onf ={f(x)∈R|F=∇f(x)}entonces el equilibrio de Nash del juego potencial equivale al m´ınimo de la funci´on potencial.Siguiendo este orden de ideas se propone una funci´on potencial de la forma :
f(x) = 1 2x 2 1+ 1 2x 2 2+...+
1 2x
2
n+x1c1+x2c2+...+xncn
f(x) =
n X
i=1
1
2xi(xi+ 2Ci)
∇f(x) =Mx+C
F(x) =Mx+C
Donde el equilibrio de Nash del juego definido por F, corresponde al m´ınimo de la funci´on f.Aprovechando esta relaci´on se puede proponer una matrizM tal que el juego evolucione hacia un valor definido C.La matriz adecuada para lograr el objetivo esM =−I. Esto es:
Fi(x) = (1−
xi
ci
)
Si se aprovecha que los estados se definen como una proporci´on de la poblaci´on de la forma que xi ∈ [0,1] al mismo tiempo que ci ∈ [0,1] entonces se encuentra un equilibrio en el cual los
5.3. INTERFAZ GR ´AFICA GUI PTV VISSIM-MATLAB CAP´ITULO 5.
agentes de benefician al m´aximo de forma individual y colectiva (equilibrio de Nash) pero con pesos ponderados dentro de la poblaci´on.
La funci´on potencial f(x) es una funci´on de costo cuadr´atica con un ´unico m´aximo global ubicado en ~x = ~c.El vector de costos c corresponde al peso de la funci´on se aprovecha que la funci´on de fitness resultante representa un juego estable con un equilibrio proporcional a los pesos del vector de costoscde modo que el juego bajo una din´amica poblacional encuentre el equilibrio que asigna el recursoxacorde a los pesos asignados.
En el caso del tr´afico urbano se plantea una funci´on vector de costos de la forma :
ci=
Hi P
i∈IHi
DondeHi es el valor de la cola de veh´ıculos en el nodo i-esimo. El valor de un nodo es dado por :
Hi=
Li P
i∈IL i Li
El equilibrio b´asico asociado al juego propuesto por esta selecci´on de pesos equivale a una asignaci´on de tiempos de ciclo que es proporcional a los veh´ıculos en el nodo.
5.3
Interfaz Gr´
afica GUI PTV VISSIM-Matlab
El paquete de simulaci´on PTV VISSIM incluye un m´odulo de programaci´on COM que permite la interacci´on de lenguajes de programaci´on externos con el n´ucleo de VISSIM de forma legal y estable. Este m´odulo ha sido explotado en diferentes aproximaciones desde locales como [63] [64] [65] [66] donde se aprovecha el potencial de la comunicaci´on por COM con Matlab, obteniendo inclusive una interfaz gr´afica basada en botones donde se realiza una configuraci´on inicial del escenario de simulaci´on. Por otro lado, se han realizado aproximaciones a la programaci´on COM de PTV VISSIM con otros lenguajes como en [67] [67] donde exploran la posibilidad de compilar en librer´ıas din´amicas .dll funciones mas complejas de C++/Java para la ejecuci´on en tiempo real con VISSIM. Si bien esta es de las opciones que m´as r´apido permiten correr al c´odigo de control conjunto a VISSIM, no permite una f´acil modificaci´on de los c´odigos de control o interactuar en tiempo real Usuario-VISSIM. En este sentido se desarroll´o una aplicaci´on para la interacci´on entre Matlab-PTV VISSIM para simular controladores inteligentes de tr´afico urbano.
La API permite el uso c´omodo por parte de usuarios que no est´en familiarizados con la programaci´on COM y facilita el acceso de Matlab gracias a sus ventajas en cuanto a la curva de aprendizaje,versatilidad, soporte de la comunidad y poder de c´omputo asociado a los toolboxs. El sistema se basa en una GUI usa el entorno GUIDE de Matlab as´ı como funciones auxiliares de Java, se llevaron a cabo simulaciones de tr´afico urbano de redes en PTV VISSIM 5.4, sin utilizar librer´ıas externas o el modulo script de Python de VISSIM 5.4.
Se dise˜n´o una aplicaci´on GUI (Graphic User Interface) que permite realizar simulaciones bajo el ambiente Matlab y el motor de simulaci´on del paquete PTV VISSIM. La aplicaci´on est´a