Dinámicas poblacionales distribuidas aplicadas al control de tráfico urbano

(1)

Din´

amicas Poblacionales Distribuidas

Aplicadas al Control de Tr´

afico Urbano

Jorge Luis Mayorga Taborda

Asesor:Nicanor Quijano Silva

Departamento de Ingenier´ıa El´

ectrica y Electr´

onica

(2)

Proyecto de Fin de Carrera

Presentado a

La Universidad de los Andes

Facultad de Ingenier´ıa

Departamento de Ingenier´ıa El´

ectrica y Electr´

onica

Para obtener el t´ıtulo de

INGENIERO ELECTR ´

ONICO

por

Jorge Luis Mayorga Taborda

Din´

amicas Poblacionales Distribuidas Aplicadas al Control de Tr´

afico

Urbano

Sustentado el 09 de Diciembre del 2014 frente al jurado:

Composici´

on del jurado

- Asesor: Nicanor Quijano Silva phD, Profesor Titular, Universidad de Los Andes

(3)

CAP´ITULO 0.

Abstract

Se analizan las dinámicas poblacionales aplicadas al control distribuido en semaforización urbana y su desempeño como controladores distribuidos donde los agentes no poseen información completa. Se utilizan los tiempos de ciclo como recursos a administrar por medio de tres niveles de control.Se aplican los resultados a una simulación de una red de tráfico urbana utilizando el software PTV VISSIM para un sistema dos,tres y nueve nodos. Se prueban diversas dinámicas poblacionales (globales y locales) y se analiza el resultado en función de diferentes funciones de Fitness.

(4)

Tabla de Contenidos

1 Introducci´on 2

1.1 Descripción de la problemática y justificación del trabajo . . . 2

1.2 Alcance y Productos Finales . . . 4

1.3 Objetivos . . . 5

1.3.1 Objetivo General . . . 5

1.3.2 Objetivos Espec´ıficos . . . 5

2 Marco Te´orico 6 2.1 Tiempo de Ciclo para Sem´aforos . . . 6

2.2 Teor´ıa de Juegos . . . 7

2.2.1 Juegos Potenciales . . . 8

2.2.2 Juegos Estables . . . 8

2.3 Juegos Evolutivos y Din´amicas Poblacionales . . . 9

2.3.1 Protocolos de Revisi´on . . . 10

2.3.2 Mean Dynamics . . . 10

2.3.3 Din´amicas Evolutivas Deterministas . . . 10

2.4 Replicator Dynamics . . . 11

2.5 Software de Microsimulaci´on PTV VISSIM . . . 11

2.6 Interfaz COM de PTV VISSIM 5.4 . . . 12

3 Estado del Arte 13 3.1 Sistemas de Transporte Inteligente . . . 13

3.2 Sensado y Percepci´on . . . 13

3.2.1 Loops Inductivos . . . 13

3.2.2 c´amaras de Video . . . 14

3.2.3 Magnet´ometros . . . 15

3.3 Sistemas de Comunicaciones Inal´ambricas . . . 15

3.4 Sistemas de Control . . . 16

3.4.1 Semaforizaci´on . . . 16

3.4.2 Control de Tiempo de Sem´aforos basados en L´ogica Difusa . . . 17

3.4.3 Control de Tiempo en Sem´aforos basados en Redes Neuronales . . . 17

3.4.4 Control de Tiempo en Sem´aforos basados en Teor´ıa de Juegos . . . 18

(5)

TABLA DE CONTENIDOS CAP´ITULO 0.

5 Resultados 21

5.1 Modelo de Tr´afico Urbano . . . 21

5.2 An´alisis de la Funci´on de Fitness . . . 25

5.3 Interfaz Gr´afica GUI PTV VISSIM-Matlab . . . 26

5.4 Simulaciones y Escenarios . . . 28

5.4.1 Red de 2 Nodos . . . 28

5.4.2 Red de 3 Nodos en PTV VISSIM . . . 30

5.4.3 Red de 9 Nodos en PTV VISSIM . . . 32

5.5 Comparaci´on de Desempe˜no . . . 32

6 Discusi´on 36

7 Conclusiones 38

Ap´endices 46

(6)

Lista de Figuras

1.1 Diagrama de bloques del sistema de control de trafico urbano . . . 4

2.1 Ejemplo señal de control para semáforo trifásico . . . 6

2.2 Esquema de control de tiempo para las fases de los sem´aforos . . . 7

2.3 Estados de las poblaciones en un juego inestable a lo largo del tiempo . . . 9

2.4 Estados de las poblaciones en un juego estable a lo largo del tiempo . . . 9

5.1 Comparaci´on entre modelos cuadr´aticos y logar´ıtmicos . . . 22

5.2 Simulación Modelo unidimensional con efecto de saturación sin acción regulatoria (Semáforo) . . . 23

5.3 Simulación Modelo unidimensional con efecto de saturación con acción regulatoria (Semáforo) . . . 23

5.4 Diagrama de bloques y funciones de la GUI propuesta . . . 27

5.5 Interfaz gr´afica de usuario para la GUI Matlab-PTV VISSIM . . . 28

5.6 Diagrama de Red de 2 nodos para el escenario de igual valor nodal y pesos equili-brados en ambas v´ıas . . . 29

5.7 Diagramas de tiempos de semaforizaci´on, tiempos en verde para v´ıas 1 y tiempos de ciclo para escensario 1 . . . 29

5.8 Diagrama de Red de 2 nodos para el escenario de igual valor nodal y colas de veh´ıculos distintas . . . 30

5.9 Diagramas de tiempos de semaforizaci´on, tiempos en verde para v´ıas 1 y tiempos de ciclo para escenario 2 . . . 30

5.10 Diagrama de Red de 2 nodos para el escenario de distinto valor nodal y pesos distintos en ambas v´ıas . . . 30

5.11 Diagramas de tiempos de semaforizaci´on, tiempos en verde para v´ıas 1 y tiempos de ciclo para escenario 3 . . . 30

5.12 Veh´ıculos por v´ıa para el escenario 4 . . . 31

5.13 Diagramas de tiempos para el escenario 4 . . . 31

5.14 Red de 3 Nodos implementada en PTV VISSIM . . . 31

5.15 Red de 9 nodos implementada en PTV VISSIM . . . 33

A.1 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador de tiempo fijo en condiciones de saturaci´on . . . 46

(7)

LISTA DE FIGURAS CAP´ITULO 0.

A.2 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador proporcional enTv

en condiciones de saturaci´on . . . 46

A.3 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador de tiempo fijo en Tv no saturada . . . 47

A.4 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador proportional enTv no saturada . . . 47

A.5 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador de tiempo fijo en Tv no saturada . . . 47

A.6 Simulaci´on en PTV VISSIM para red de 3 nodos con controlador proporcional enTv no saturada . . . 47

A.7 Simulaci´on en PTV VISSIM para red de 3 nodos con controladorTcbajo el Replicator Dynamics . . . 48

A.8 Red de 9 nodos bajo control de tiempo fijo . . . 48

A.9 Red de 9 nodos bajo control deTv proporcional . . . 48

A.10 Red de 9 nodos bajo control deTc yTv proporcional . . . 49

A.11 Red de 9 nodos bajo control deTc bajo Replicator Dynamics yTv fijo . . . 49

(8)

Lista de Tablas

5.1 Comparaci´on del desempe˜no de los controladores para una red de 3 y 9 nodos en

diferentes configuraciones de tiempo fijo. . . 34

5.2 Comparaci´on del desempe˜no de los controladores para una red de 3 nodos. . . 34

5.3 Comparaci´on del desempe˜no de los controladores para una red de 9 nodos . . . 34

(9)

1 Introducci´

on

1.1 Descripci´

on de la problem´

atica y justificaci´

on del

tra-bajo

Todo el planeta experimenta una creciente crisis de transporte masivo a medida que los centros urbanos incrementan tanto en tamaño como en densidad. En el 2010, al sur Beijing, la capital de China, se presenció el mayor atascamiento de tráfico de la historia: Un embotellamiento de más de 100 Km de largo y 10 d´ıas de duración. La crisis comenzó por las obras de construcción sobre una de las v´ıas más importantes del norte de la capital del pa´ıs asiático. Con un 40% de incremento anual en el volumen del parque automotor [1] [2], China enfrenta la crisis de tráfico urbano que afecta a las grandes y medianas urbes a lo largo de todo el globo, desde Moscú hasta Buenos Aires, pasando por Tokyo, Los Ángeles, Bogotá y Barcelona.

En Colombia el parque automotor privado se incrementó en alrededor de 400.000 veh´ıculos en los últimos dos años, dando un total al 2013 de 9.156.898 veh´ıculos [3]. No obstante el recurso vial no ha crecido a la misma tasa. Por este motivo se presenta como necesidad el uso óptimo de los recursos viales, para mejorar el desempeño de una malla vial urbana, utilizando herramientas desde la semaforización hasta el control de los veh´ıculos, pasando por el cobro y penalización de la malla vial.

Por otro lado, el perfil de uso del recurso vial en la mayor´ıa de las ciudades responde a pi-cos de demanda en pocas horas y pipi-cos de muy baja demanda de veh´ıculos en la mayor parte del d´ıa. Ante este perfil las estrategias de cobro por congestión, cambios en el plan de ordenamiento territorial y una migración masiva al transporte público, han sido foco de atención en los últimos años; no obstante, estas soluciones también son criticadas. Una solución a corto plazo y comple-mentaria a cualquier otra estrategia de gestión del parque automotor y de pol´ıticas públicas, el control eficiente del recurso vial, tanto espacial como temporal, es fundamental para mejorar el desempeño de las redes de tráfico actuales .

En este sentido se ha abierto un área de investigación denominada Sistemas de Transporte Inteligente (ITS por sus siglas en ingles) que desde el siglo pasado ha hecho de los sistemas aéreos y urbanos su foco principal de investigación y desarrollo.Estos sistemas de control de tráfico actualmente se aproximan al problema de transporte urbano bajo dos perspectivas principales, la gestión del recurso temporal para los veh´ıculos (estrategias como la semaforización y cooperación) y el control del recurso espacial (veh´ıculos guiados). Los sistemas basados en el control del recurso espacial se caracterizan por la automatización individual de los veh´ıculos y su conexión en sistemas

(10)

1.1. DESCRIPCI ÓN DE LA PROBLEM ÁTICA Y JUSTIFICACI ÓN DEL TRABAJO CAPÍTULO 1.

de comunicaciones complejas. Estos sistemas, equipados con una gran cantidad de sensores y un poder de procesamiento exigente, presentan grandes avances a nivel individual y de poblaciones peque˜nas, pero no se han realizado las implementaciones adecuadas en sistemas masivos debido al gran costo del equipamiento de los veh´ıculos con las tecnol´ogicas requeridas.

As´ı mismo, el control de recurso temporal de las v´ıas ha sido de los sistemas de control au-tomático más antiguo de los ITS: El semáforo. El semáforo (Traffic Ligth en inglés), es un sistema de control similar a compuertas que permiten o restringen el flujo de veh´ıculos por un periodo limitado de tiempo. Tradicionalmente estos sistemas son mallas de control abiertas; es decir, no existe una retroalimentación del estado del tráfico actual; los semáforos no tienen manera de cambiar los tiempos de gestión según var´ıa el estado de la red. No obstante, los ITS han agregado sensores como los loops inductivos, cámaras de video y dispositivos GPS para modificar los tiempos de semáforo y mejorar el desempeño de la red.

Las redes de tráfico urbanas son sistemas de gran escala, complejos y variantes en el tiempo. Este comportamiento no lineal requiere de gran poder de procesamiento y una red de comunicaciones muy costosa para poder acceder a la información de toda la red y obtener los tiempos óptimos de la red. Ante estas dificultades los algoritmos distribuidos surgen como una solución viable. Estos algoritmos se basan en protocolos de decisión utilizando solo la información local que puede ser consultada por cada agente. En este sentido, las redes de comunicaciones pueden ser menos costosas y el poder de procesamiento puede ser mucho menor. Sin embargo, la forma como se toma la decisión del tiempo asignado a cada fase del semáforo var´ıa según autor a autor, y existen muchas combinaciones de las mismas: desde redes neuronales sintonizadas por un módulo difuso, algoritmos genéticos estocásticos, control predictivo basado en optimización por part´ıculas, Social Bee Foragin y, particularmente, Teor´ıa de Juegos.

Una aproximación al problema del control de semáforos es el uso de teor´ıa de juegos para la asignación dinámica de los tiempos de fase. Modelando como agentes los segundos de tiempo en verde/rojo y como estrategias los semáforos, se puede asignar un juego de agentes infinitos a estrategias finitas con una función de pago en función de las colas, velocidad media, tiempo de retardos, etc. Esta aproximación permite una fácil implementación de control distribuido dado que se basa en protocolos de negociación y no depende del modelo de la red de tráfico.

Las redes de malla vial en las ciudades son complejas y cambian rápidamente, su control basado en un modelo global no resulta viable, tampoco realizar un modelo detallado de una ciudad para sintonizar los tiempos de fase. Bajo esta perspectiva los software de micro simulación han tomado fuerza los últimos años; estos paquetes de simulación utilizan la configuración f´ısica de la red para realizar la simulación espacio temporal del flujo de veh´ıculos. Estos modelos son muy cómodos para la simulaciones de grandes sistemas flexibles, ya que para actualizar el modelo matemático de fondo, bajo los software de micro simulación, solo requieren modificar la red cambiando una nueva v´ıa, agregando un puente, o instalando un sensor más.

En este orden de ideas, el paquete PTV VISSIM de micro simulación es uno de los más re-conocidos a nivel mundial, especialmente por ser un paquete multimodal y estar programado bajo una capa de objetos comunes para plataformas Windows: COM. Dado que PTV VISSIM está basada en el protocolo COM ActiveX es posible la comunicación con otros programas de

(11)

1.2. ALCANCE Y PRODUCTOS FINALES CAP´ITULO 1.

software, inclusive Python. Python es un lenguaje de programación libre que es incluido por defecto como script principal para correr algoritmos en las simulaciones de PTV VISSIM. Si bien Python es uno de los lenguajes de programación más extendidos en el mundo académico, no obstante Python presenta dificultades en la curva de aprendizaje que Matlab soluciona con creces, la disponibilidad de soporte especializado, toolbox avanzados y facilidades para la construcción de interfaces gráficas, comunicaciones entre software y una extensa red de colaboradores, lo hacen un lenguaje de programación de interés especialmente para la comunicación Matlab y PTV VISSIM para el diseño de estrategias de control.

Ya existe en el mercado la versión PTV VISSIM 6 y está próxima a salir a la venta el pa-quete PTV VISSIM 7, los módulos de comunicación COM de estas dos versiones no están totalmente habilitados y presenta fallos frecuentes, por este motivo se sigue manejando la versión PTV VISSIM 5.4 en cuanto protocolos de comunicación COM. Por estos motivos, se planteó como objetivo realizar una interfaz gráfica basada en COM entre PTV VISSIM 5.4 y Matlab con la intención que se puedan realizar pruebas de algoritmos de control de tráfico basado en semáforos utilizando PTV VISSIM que permitan a usuarios no expertos en programación COM acceder a este modelo de control.

Figure 1.1: Sistema general para el control de la malla vial urbana mediante el m´etodo de se-maforizaci´on

1.2 Alcance y Productos Finales

El objetivo del proyecto fue la implementación de un control basado en juegos evolutivos para la asignación de tiempos de semaforización as´ı como el desarrollo de un entorno para la simulación de tráfico en la plataforma Matlab con el software de micro simulación PTV VISSIM. Dicha plataforma de simulación basada en una interfaz gráfica es utilizada para evaluar el desempeño de una red de trafico de 3 y 9 nodos comparando el desempeño de estrategias de control de tiempo fijo, tiempos proporcionales, Replicator Dynamics y el Local Replicator Dynamics. También se evaluaron distin-tas funciones de Fitness y se comparó el desempeño de las mismas aplicadas a las dos topolog´ıas de tres y nueve nodos.

(12)

1.3. OBJETIVOS CAP´ITULO 1.

1.3 Objetivos

1.3.1 Objetivo General

1. Aplicar dinámicas de poblaciones al control distribuido de una red de semaforización urbana utilizando el software de micro simulación PTV VISSIM.

1.3.2 Objetivos Espec´ıficos

1. Diseñar un control distribuido para una red de tráfico urbana basada en semáforos utilizando teor´ıa de juegos y dinámicas poblacionales.

2. Simular un sistema de control distribuido basado en din´amicas poblacionales bajo el software de micro simulaci´on PTV VISSIM.

3. Comparar el desempeño entre el controlador basado en dinámicas poblacionales distribuidas y los sistemas de control más populares en la literatura.

(13)

2 Marco Te´

orico

2.1 Tiempo de Ciclo para Sem´

aforos

Las estrategias de control para los semáforos en sistemas de tráfico urbano más comunes son los sistemas de tiempo fijo. En estos algoritmos se calculan de manera “off-line” los tiempos adecuados para las intersecciones y las fases de los ciclos. Estos ciclos corresponden a una señal discreta de 3 estados posibles, correspondientes a cada color del semáforo (Rojo,Verde, Ámbar).

ρ(t) :R→[V erde,Ambar,Rojo] (2.1)

Figure 2.1: Ejemplo señal de control para semáforo trifásico

En términos de funciones elementales se puede describir una señal de control para semáforos como:

ρ(t) =

k=tf

X

k=t0

A(k)[u(t−k)−u(t−(k+Tk))] (2.2) Si el sistema posee múltiples semáforos la señal de control deja de ser un vector de dimensión 3 para ser una matriz denx3 elementos incrementando la complejidad del problema. Originalmente los semáforos eran controlados electro-mecánicamente por sistemas de reloj basados en piñones de diferentes tamaños, los tiempos no pod´ıan ser cambiados con facilidad, por lo cual los tiempos eran recalculados muy pocas veces en la vida útil del semáforo. Por estos motivos, la mayor´ıa de las naciones han adoptado normas basadas en procesos emp´ıricos utilizando registros históricos del tráfico para calcular los tiempos adecuados para cada una de las fases. T´ıpicamente se define el tiempo en Ámbar como el 16% del tiempo asignado a la mayor de las fases restantes con lo cual, si se define un tiempo de ciclo fijo, el problema se reduce de una matriz de nx3 a un problema unidimensional.

(14)

2.2. TEOR´IA DE JUEGOS CAP´ITULO 2.

2.2 Teor´ıa de Juegos

La Teor´ıa de Juegos es una rama de las matemáticas que estudia de manera formal y abstracta el comportamiento de dos o más jugadores siguiendo interacciones basadas en reglas, ganancias y pérdidas. Estas interacciones son llamadas juegos. Los jugadores toman decisiones racionales basándose en funciones de pagos. Estas funciones de pago son la recompensa que obtiene cada jugador en proporción a las estrategias jugadas por el conjunto de jugadores, incluido el jugador mismo.

En todos los modelos teóricos de los juegos existe la entidad jugador. Un jugador puede ser interpretado como un individuo o un grupo de ellos. Los jugadores pueden tomar decisiones teniendo en cuenta los estados de los demás jugadores, o solamente teniendo en cuenta el estado propio y la maximización de los pagos que puede recibir. La diferencia entre estos dos tipos de jugadores deriva en dos categor´ıas de juegos: Cooperativos y No Cooperativos. Un juego estratégico puede definirse como un modelo de interacción entre decisiones y acciones en los cuales los agentes que toman las decisiones escogen un plan de acciones para maximizar una función de beneficio. El modelo consiste en un conjunto finito de N jugadores y por cada jugador i existe un conjunto de accionesAi.

El alto nivel de abstracción de estos modelos permite aplicarlos a una gran variedad de situaciones. Un jugador puede ser un ser humano, una sociedad, un animal o un computador. Si bien las aplicaciones más comunes se pueden encontrar en la econom´ıa, también hay aplicaciones en las dinámicas de poblaciones, espec´ıficamente al control de sistemas dinámicos.

En los juegos no cooperativos de informaci´on completa, los jugadores toman sus decisiones analizando las respuestas de su competencia, encontrando puntos donde la estrategia maximice la ganancia que pueden llegar a recibir. Si todos los jugadores realizan este tipo de razonamiento se

(15)

2.2. TEOR´IA DE JUEGOS CAP´ITULO 2.

llega a los denominados puntos de equilibrio. Estos puntos son de vital importancia, puesto que las din´amicas poblacionales presentan un comportamiento evolutivo convergente a los puntos de equilibrio del juego asociado.

2.2.1 Juegos Potenciales

Sea un juego definido por una funci´on de pago (Fitness)F. Dado que los estados de las poblaciones para este juego sonX ={x∈_Rn

+ :

P

k∈Sxk = 1} y que el simplex de la poblaci´on pertenece a los reales enX entonces se puede definir [4] :

Definici´on 2.2.1 Sea F : Rn+ un juego potencial.F es un juego potencial si existe una funci´on

continuamente diferenciablef :Rn+→Rtal que:

∇f(x) =F(x),∀x∈Rn+

La anterior definici´on tiene como consecuencia que si F ∈ C con C las funciones continuas, entonces el juego es potencial si solo si satisface la exterioridad sim´etrica lo cual es:

∂Fi

∂xj

(x) =∂Fj

∂xi

(x),∀i,j ∈Sp

ConSp _{el conjunto donde viven los ´ındices}_i,j_.

2.2.2 Juegos Estables

Definici´on 2.2.2 Un juego poblacional ,seg´un [5],F :X →_Rn _{es un juego estable si}

(y−x)T(F(y)−F(x))≤0,∀y,x∈X (2.3)

Si un juego no es estable, entonces el equilibrio al cual convergen las din´amicas se alejar´a del equilibrio de Nash a un estado trivial.

Definici´on 2.2.3 Se le llama a un estado de la poblaci´onx~sun estado trivial o esquina si se cumple

:

~

xs={x∈X| X

k∈S

xk =mp∧ ∃k|xk=mp}

Una analog´ıa de la definición 2.2.3 con los sistemas lineales es el comportamiento dinámico de un sistema cuya matriz de relación entre el estado y la derivada de estado posee valores propios positivos.

(16)

2.3. JUEGOS EVOLUTIVOS Y DIN ´AMICAS POBLACIONALES CAP´ITULO 2.

Figure 2.3:Estados de las poblaciones en un juego inestable a lo largo del tiempo

Figure 2.4:Estados de las poblaciones en un juego estable a lo largo del tiempo

2.3 Juegos Evolutivos y Din´

amicas Poblacionales

Sea una población de agentes Np donde el número de agentes individuales N es muy grande (ej. 10000) de tal forma que la fracción _Ni;∀i ∈ [1,N] tenga sentido, por ejemplo, variables como la cantidad de átomos, gramos en una masa, voltios en una fuente eléctrica, entre otros.

Estos agentes pueden estar definidos bajo un juego, es decir, que cada agente va a decidir cuál estrategia utiliza definiendo los estados de una población como la cantidad de agentes que han tomado una decisión en particular. En otras palabras, el estado de la población es un referente de cómo se han organizado los agentes en la población basándose en un juego. La forma cómo los agentes deciden cambiar de estrategia está asociada a los protocolos de revisión y, sobre todo, de la información que los agentes posean para medir o censar los diversos estados. Esto implica que en un sistema ideal, todos los agentes pueden conocer el pago que están recibiendo los demás agentes, tal como en el equilibrio de Nash. Sin embargo, esta suposición es bastante fuerte y se eliminará más adelante en los juegos distribuidos, donde los agentes solo poseen información de sus vecinos. En este sentido se definen los estados de una población:

x= [x1x2x3...xn]T

Como los N estados o estrategias que los agentes pueden tomar en una poblaci´on.

Por otro lado, haciendo una relaci´on con los juegos matriciales, el vector de estados x corre-sponde al vector de estrategias mixtas que toman los jugadores en un juego.Se define la funci´on

F :_Rn_→

Rncomo la Fitness que determina el valor de pago que reciben los estados de la poblaci´on.

En términos de juegos tradicionales, si la matriz de pago A es cuadrada entoncesF(x) =Ax.Una vez que se definen los estados de la población es importante resaltar la parte dinámica del sistema, es decir, cómo evolucionan las proporciones de la población a lo largo del tiempo. Debido a que las funciones de Fitness representan el pago de los estados, es natural pensar en una dinámica en las cuales los estados deseen ir a donde se está pagando más, es decir, que la población encuentre puntos de equilibrio que maximicen los pagos en cada estado. Para pensar en estas dinámicas solo basta con definir el parámetrox˙(t)donde la funciónf(x,t)puede ser lineal o, en la mayor´ıa de los casos, ser no lineal. Este parámetro representa cómo cambia el valor de x en el tiempo, es decir que si valor

(17)

2.3. JUEGOS EVOLUTIVOS Y DIN ´AMICAS POBLACIONALES CAP´ITULO 2.

del estadox(t)tenderá a crecer y, por el contrario, six˙(t)<0el valor del estado comienza a decrecer. A diferencia de cualquier sistema dinámico, el propuesto para las poblaciones debe cumplir con la conservación de agentes, es decir que la proporción de agentes siempre deben sumar el valor neto del recurso por el que se disputan los agentes:P

i∈Sxi=N .A este conjunto de estados que cumplen con la condición anterior se le denomina Simplex, y corresponde a las limitaciones f´ısicas que debe respetar el sistema; es decir, es el valor máximo de voltaje que puede entregar una fuente, el tiempo máximo que se le asigna a un semáforo, la cantidad de potencia máxima que puede generar una celda fotovoltaica, entre otros.

2.3.1 Protocolos de Revisi´

on

Un protocolo de revisi´on es una funci´onρij :Rn×Xn →Rn+×n que determina el flujo de agentes

de un estado de la población (estrategia) i-esima al estado j-esimo. La consideración de positividad de los protocolos de revisión suelen estar enmarcadas en las proporciones de los agentes de una población, entonces el máximo flujo que puede ir del nodo i al nodo j es la población total que exista en el nodo i, y por le contrario, el m´ınimo es 0.

Esta restricci´on no limita el flujo de los agentes en los estados, puesto que si para la combi-naci´onij el flujo es negativo, los protocolosρij = 0yρji>0simulando el evento de flujo negativo desde i a j.

2.3.2 Mean Dynamics

Una vez definido el concepto de protocolo de revisión, los agentes evaluarán su condición actual comparándola con los demás estados de la población, decidiendo si se quedan en un estado u otro. Bajo este escenario los agentes migrarán de una población local a otra según el estado y la recompensa que reciban por estar en cada una de ellas. Este comportamiento puede ser descrito por la siguiente ecuación:

˙

xi(t) =

d

dtxi(t)in− d

dtxi(t)out

˙

xi(t) = X

j∈S

xjρji(F(x),x)− X

j∈S

xiρij(F(x),x) (2.4)

2.3.3 Din´

amicas Evolutivas Deterministas

Seg´un [5] si se define un conjunto de poblaciones P = [1,2,..,p] cada una con una masa mp _{y un} conjunto de estrategiasSp _donde_X ₌_{_x_∈

Rn+ :x= (x1,x2,...,xn),Pi∈Spx p

i =mp}. Y adem´as se definen los conjuntos:

F ={F:X→Rn|F∈Lc} T ={{xt}t≥0⊆X|x(·)∈C}

Donde Lc es el conjunto de funciones Lipschitz continuas yC es el conjunto de funciones con-tinuas. Con base en las anteriores aclaraciones se puede definir entonces:

(18)

2.4. REPLICATOR DYNAMICS CAP´ITULO 2.

Definición 2.3.1 Una dinámica evolutiva determinista es un conjunto evaluado de la relación

D:F →T la cual asigna a cada juego poblacional un conjunto de trayectoriasD(F)⊂T tal que satisfaga que para cada ξ∈X existe un{xt}t≥0∈D(F)conx0=ξ.

La definición 2.3.1 plantea que para cada condición inicial de estados de una poblaciónξexiste una única evolución de trayectorias xt para tiempos mayores a 0 (o cualquier punto donde se den las condiciones iniciales) guiadas por el mapeoD(F).

Definición 2.3.2 Se dice que una dinámica poblacional representada porVF tiene correlación

pos-itiva cuando se cumple queVP

F(x)6= 0o lo que es igual a queV P

F(x)0F(x)>0

2.4 Replicator Dynamics

Las din´amicas conocidas bajo el nombre de Replicator Dynamics son miembros de la familia Imi-tative Dynamics y son descritas, en principio, por el siguiente protocolo de revisi´on:

ρp_ij(F(x),x) = xj

mp[Fi−Fj]+ (2.5)

Donde

[g(x)]+= max (0,g(x))

Siendo as´ı, utilizando la ecuación de las dinámicas medias (Mean Dynamics) en la ecuación 2.4 se obtiene:

˙

xi(t) =xi(Fi(x)− X

j∈S

xjFj(x))

Ahora, utilizando la notaci´on matricial de estados se definex= [x1,x2,...,xn]eIx=diag{x}de forma que:

˙

x(t) =Ix(F(x)−1xTF(x)) (2.6)

2.5 Software de Microsimulaci´

on PTV VISSIM

La herramienta de simulación para sistemas de tráfico PTV VISSIM es reconocida a nivel mundial como uno de los mejores paquetes de software para modelo basados en comportamientos individuales de los agentes (veh´ıculos, peatones, bicicletas, etc.), permitiendo una representación del modo inclusive de variables como el color del veh´ıculo, caracter´ısticas de respuesta por parte de los conductores, entre otras. A su vez, PTV VISSIM permite implementar modelos multi-modales, donde además de modelar el comportamiento de veh´ıculos en una red, incluye transporte público, bicicletas, peatones, rickshaw, entre otras.

PTV VISSIM organiza los modelos mediante elementos como Maps, Links,Traffic Light,Traffic Signal,Counter,Nodes,Vehicle Inputs. Los mapas son descripciones geométricas de las ubicaciones de los elementos y sus configuraciones. Estos archivos son almacenados en los archivos .inp y .ini (Versión 5.4) necesarios para ejecutar el modelo de micro simulación.

(19)

2.6. INTERFAZ COM DE PTV VISSIM 5.4 CAP´ITULO 2.

Además de permitir el análisis del comportamiento de una red mediante indicadores, al ser un software de micro simulación, permite observar mediante una interfaz gráfica el comportamiento de los veh´ıculos en tiempo real,y además observar los escenarios en vistas 3D.

Otro factor diferenciador del paquete PTV VISSIM, es el módulo de comunicación COM (Component Object Model), que permite controlar los parámetros de la simulación desde una plataforma externa o cualquier lenguaje que permita acceso por COM. En este sentido se han desarrollado trabajos abordando la programación de PTV VISSIM desde Python, Java y unos pocos casos C# y Matlab.

2.6 Interfaz COM de PTV VISSIM 5.4

Desarrollada en 1993 por Microsoft para los sistemas Windows, es un estándar binario para la comunicación entre programas con la plataforma Windows. Por este motivo, la programación basada en COM ha sido muy popular para los sistemas de Microsoft como los frameworks OLE, ActiveX y DirectX.

En términos generales, COM es un lenguaje neutral que permite la implementación de obje-tos y clases independiente del lenguaje de programación tanto por interpretación como por compilación, lo cual permite que herramientas interpretadas como Python y Java interactúen con rutinas escritas en C previamente compiladas. Actualmente Microsoft ha migrado sus nuevas plataformas a la nube y el entorno web actualizando el modelo por COM a Microsoft.Net. No obstante, las aplicaciones de escritorio que tengan un módulo de COM pueden comunicarse con el lenguaje de sistema operativo y permitir la interacción entre aplicaciones.

Para acceder por COM a los objetos de una aplicación se requiere que esta posea un m´ o-dulo de programación COM, es decir, que previamente en la aplicación se interpretaron los objetos y clases del lenguaje nativo al lenguaje COM. Esta limitante se suele encontrar en las aplicaciones comerciales para evitar problemas se seguridad, de compatibilidad, de estabilidad y propiedad intelectual, no obstante el paquete PTV VISSIM 5.4 contiene un módulo COM que permite el acceso completo a todas las herramientas del sistema.

(20)

3 Estado del Arte

3.1 Sistemas de Transporte Inteligente

Se denominan de transporte inteligente a los sistemas informáticos y de telecomunicaciones que son utilizados para mejorar el desempeño de los sistemas de transporte. Si bien, es ampliamente conocido el aporte de los sistemas informáticos a los medios de transporte terrestres, el campo de acción de los ITS( Intelligent Transportations Systems) abarcan desde trenes de altas velocidad, pasando por veh´ıculos automóvil, hasta los medios aéreos, ferris, y buques de carga. [6].Actualmente los ITS responden con grandes avances en el uso de telecomunicaciones de corto alcance y bajo consumo de potencia, (especialmente diseñadas para la comunicación veh´ıculo a veh´ıculo), uso de reconocimiento facial para detectar estados del conductor, reconocimiento de placas por análisis de video, uso de la información dinámica de las v´ıas para control de rutas y semaforización [7].

3.2 Sensado y Percepci´

on

Dado que los sistemas ITS requieren acceder a información para la toma de decisiones se requiere de acceder a datos acerca del comportamiento de los autos en una v´ıa, las condiciones climáticas de veh´ıculos aéreo, las demandas de pasajeros y carga, entre otros. Para acceder a esta información se suelen diseñar redes de sensores de diferentes tipos dentro de los cuales se encuentran los mag-netómetros, cámaras de video, loops inductivos, entre otros. No solo basta disponer de los sensores, también la distribución, los sistemas informáticos y electrónicos para procesarla, la miner´ıa de datos que se pueda realizar a la gran cantidad de datos que suelen arrojar estos sensores, los algoritmos para procesarla (como la visión artificial) y por último la integración de múltiples sensores para estimar medidas.

3.2.1 Loops Inductivos

Aprovechando la composición de los materiales de la mayor´ıa de los veh´ıculos, un tipo de sensor muy utilizado para detectar la presencia de veh´ıculos sobre el asfalto, cemento o concreto, son las espiras inductivas. Estos sensores están compuestos de un lazo inductivo el cual debe estar protegido bajo el pavimento de la corrosión y agentes que deterioren el desempeño del sensor, no obstante, es una de las soluciones más económicas a la hora de implementar un sensor de veh´ıculos. Si bien resultan de fácil instalación y de bajo costo, estos sensores han sido de amplio estudio por parte de la academia y se mantienen como el método de sensando de veh´ıculos más común en Francia y Estados Unidos

(21)

3.2. SENSADO Y PERCEPCI ´ON CAP´ITULO 3.

[8]. Aun viéndose limitados por el espacio de trabajo (alrededor de 4.5m x 1.5m) se han realizado diversas modificaciones al diseño básico del sensor, desde el uso de múltiples espiras acopladas [9], pasando por capas de lógica difusa para procesar las firmas de fábrica que poseen los automóviles [8], hasta un resonador que identifica diferentes tipos de veh´ıculos (bicicletas, motocicletas, automóviles y buses) [10].

3.2.2 c´

amaras de Video

Otro sensor que en los últimos años ha tomado gran importancia son las cámaras de video. Las cámaras son utilizadas en las autopistas, carreteras y túneles dado que son económicas y fáciles de instalar. La mayor´ıa de las cámaras habilitadas para sensar el trafico están comunicadas con un centro de control donde se visualizan los estados de tráfico para los diversos nodos de la ciudad o zona urbana. No obstante, gracias a los avances en visión artificial y al poder de cómputo en aumento, se han venido desarrollando algoritmos y técnicas para identificar veh´ıculos, placas, comportamientos, e inclusive si el conductor está tomando conductas peligrosas [11] [12] [13] [14] [15].

En [16] se implementa un sistema para reconocer caracteres en las placas de los veh´ıculos utilizando patrones de color con fotos tomadas a alta velocidad, por lo cual resulta factible su uso para detección de veh´ıculos en movimiento. De la misma forma es frecuente el apoyo por parte de plataformas basadas en machine learning para identificar velocidades de los veh´ıculos, tipos de veh´ıculos, integrar datos de redes sociales, comportamientos de conducción e identificar eventos como accidentes o congestiones no solo para equipos fijos sino para cámaras instaladas en los veh´ıculos [17] [18] [19] [20].

Una técnica usada por varios autores en [21] [22] [23] [24] es la detección y prevención de accidentes utilizando herramientas como la fotograf´ıa estéreo. Esta técnica explota el mecanismo por el cual el ser humano percibe el espacio en imágenes en dos dimensiones, esto gracias a la combinación de dos imágenes separadas del punto de foco. Las aplicaciones de esta técnica van desde la detección de peatones en la v´ıa hasta métodos para contar autos en una v´ıa rápida sin utilizar carga computacional muy alta. Si bien estos algoritmos son simulados y en algunos casos son probados in situ, el costo computacional de incluir visión artificial acarrea tiempos e infraestructura mayores. Un común denominador en los trabajos de visión artificial es el uso de plataformas basadas en Matlab o paquetes especializados. Esto limita en cuanto a costos, tiempos y espacios, a los sistemas de visión artificial, sobre todo para las aplicaciones a bordo de los veh´ıculos.

A diferencia de los Loops inductivos, las cámaras de video están condicionadas por la luz ambiente, especialmente por las diferencias climáticas de las estaciones y si es de d´ıa o de noche. Por este motivo se han estudiado ampliamente métodos para calibrar las cámaras. En [25] se discuten los problemas asociados a la iluminación urbana nocturna que puede llegar a confundir los algoritmos tradicionales basados en video al crear “autos virtuales” debido a los faros de luz en la v´ıa, autos adyacentes, entre otros elementos de tráfico. También existen dificultades para interpretar veh´ıculos como camiones que obstruyen la visión de la cámara porque no pueden captar los veh´ıculos ubicados detrás del camión.

(22)

3.3. SISTEMAS DE COMUNICACIONES INAL ´AMBRICAS CAP´ITULO 3.

Para solucionar este tipo de problemas se han realizado estudios desde diferentes métodos de calibración automática para las cámaras de video fijas, como algoritmos de procesamiento de im´ a-genes incluyendo ángulos óptimos de inclinación de las cámaras (aproximadamente 30◦ según [26]) , hasta soluciones basadas en cámaras a bordo del veh´ıculo para identificar veh´ıculos cercanos y señales de tráfico [27] [28] [29] [30] [26].

3.2.3 Magnet´

ometros

Para detectar veh´ıculos estáticos se han desarrollados sensores magnéticos y recientemente [31] se han implementado técnicas para captar veh´ıculos en movimiento. Estos sensores a diferencia de los bucles inductivos, no requieren intervención estructural sobre el pavimento y pueden instalarse encima del mismo, no se ven afectados por las condiciones lum´ınicas (d´ıa, noche, estaciones, entre otros). Los sistemas basados en bucles inductivos no permiten obtener ningún tipo de clasificación de veh´ıculos, son menos exactos que los basados en sensores magnéticos, limitados a una cobertura de acción, poseen grandes costes de instalación y necesitan de grandes cálculos “offline” para operar.

El funcionamiento de este tipo de sensores se reduce a la perturbación que se genera por la carrocer´ıa de los veh´ıculos con el campo magnético de la tierra. Utilizando modelos f´ısicos y matemáticos (dipolos magnéticos y elementos finitos) se logran aproximaciones interesantes acerca de la composición del veh´ıculo, el tamaño, velocidad y forma del mismo. Debido al contenido metálico del chasis de los veh´ıculos (hierro, n´ıquel y acero) se produce una permeabilidad magnética diferente a la del aire. Esta perturbación es registrada por el magnetómetro como una diferencia respecto al valor presente del dipolo magnético propio de la tierra [31] [32] [33] .

3.3 Sistemas de Comunicaciones Inal´

ambricas

Obtener información y procesarla para mejorar el desempeño del tráfico urbano es una de las principales tareas de los sistemas ITS, no obstante esta tarea no podr´ıa llevarse a cabo sin un sistema de comunicación que permita completar la cadena entre los sensores, los controladores y los actuadores. El panorama actual en temas de comunicaciones es bastante distinto al panorama en 1986 cuando se acuño el término de sistemas de transporte inteligente. Actualmente en la literatura se registran tecnolog´ıas de bajo consumo, múltiples protocolos, acceso a internet y comunicación entre veh´ıculos que incrementan el potencial de los sistemas de transporte inteligente.

La creciente demanda de los usuarios por acceder a conectividad internet a bordo de sus automóviles debido al uso de teléfonos celulares inteligentes, implica una expansión de las redes inalámbricas para soportar la demanda. Esta inversión en infraestructura permitirá a los usuarios acceder a internet e implementar de manera masiva la coordinación de veh´ıculos dentro de un esquema MAS (multi agent system) aprovechando los bajos costos de sensores a bordo de los veh´ıculos [34] [35].

Tradicionalmente se han utilizado para plataformas inal´ambricas las tecnolog´ıas Bluetooh, WIFI y ZigBee siendo la tecnolog´ıa Wi.Fi de mayor velocidad ( 300 Mbps), seguida del Bluetooth

(23)

3.4. SISTEMAS DE CONTROL CAP´ITULO 3.

con menor velocidad (8Mpbs) pero de un consumo de energ´ıa significativamente menor. Por último la tecnolog´ıa ZigBee se caracteriza por una velocidad muy limitada (alrededor de 250 kps) pero una distancia de alcance de hasta 1km y una expansión hasta 65000 nodos, superando en creces las limitaciones de 8 nodos para el Bluetooth y 50 para el Wifi [36]. Bajo este panorama diversos autores han desarrollado aplicaciones en redes de sensores inalámbricas, especialmente en el área de tráfico, redes de sensores que puede comunicar puestos de control o veh´ıculos entre s´ı.

Los dispositivos Bluetooth son los más comunes en los automóviles. Sin embargo, esta tec-nolog´ıa no permite una comunicación eficiente con otros veh´ıculos si la distancia es superior a 10 metros. Por otro lado como se mencionó anteriormente, la conectividad de una red basada en Bluetooth no permite la escalabilidad a múltiples dispositivos conectados entre s´ı. Aun as´ı, se han desarrollado aplicaciones que utilizan Bluetooth en sistemas ITS aprovechando el bajo costo de los módulos por lo cual son utilizados para las bases repetidoras de sensores en la v´ıa y para comunicar estados de tráfico al veh´ıculo [37] [38] [39] [40].

3.4 Sistemas de Control

3.4.1 Semaforizaci´

on

Los semáforos son dispositivos de señalización utilizados para el control y gestión de tráfico tanto peatonal como vehicular. Son instalados en intersecciones viales con la intención de repartir el recurso vial de manera análoga a un multiplexor permitiendo el uso de un espacio de v´ıa por periodos de tiempo limitados. El primer modelo se implementó en 1869 en Londres sin embargo, no fue sino hasta 1912 cuando se instaló el primer semáforo eléctrico en Utah, Estados Unidos. Más de 110 años de desarrollos tecnológicos no han representado en cambios significativos en la herramienta de control de tráfico más utilizada en el mundo.

Si bien se han desarrollado diversos tipos de semáforos para peatones, trenes, cronometra-dos, entre otros, la estructura de control de tiempo de fases con 3 colores básicos (Rojo, Verde,Ambar) no ha sido modificada. En Colombia, el color Verde representa la v´ıa libre para seguir de frente o girar a la derecha (a menos que otra señalización lo proh´ıba expl´ıcitamente), los peatones podrán cruzar la v´ıa y cuando la luz verde presente intermitencia se advierte a los conductores el fin de esta fase. La fase correspondiente a Amarillo/Ambar advierte el cambio de fase y los conductores deberán reducir su velocidad. Por último, la fase rojo advierte que los autos no deben pasar la l´ınea de tránsito y ningún peatón debe cruzar la v´ıa. Las fases reglamentarias en Colombia por el Ministerio de Transporte deben ser Rojo-Verde-Amarillo-Rojo. La sintonización de los tiempos de las fases se convierte en un aspecto clave para el control del tráfico. El Ministerio de Transporte recomienda utilizar una división de los tiempos proporcionales al flujo máximo promedio que se registren en las v´ıas. No obstante se fija también que el tiempo en verde para los peatones debe ser como m´ınimo el tiempo bajo el cual un peatón pueda cruzar la calle con ritmo medio. Estas sintonizaciones de tiempo se denominan control por malla abierta de tiempos fijos. Dado que no se requieren sensores, el costo de implementación es significativamente menor, as´ı como su desempeño frente a algoritmos adaptativos.

(24)

3.4.2 Control de Tiempo de Sem´

aforos basados en L´

ogica Difusa

En los últimos años el uso de lógica difusa (Fuzzy Logic) para controlar el tráfico urbano ha sido foco de investigación desde el control de los tiempos de los semáforos utilizando sintonización directa por conjunto de reglas difusas, hasta implementaciones en FPGAs utilizando múltiples sensores, pasando por combinaciones de técnicas basadas en redes neuronales y algoritmos genéticos. Los controladores basados en lógica difusa explotan el conocimiento de un experto para sintonizar reglas difusas de controlador y poder responder al sistema con base a la experiencia heredada de un experto, por lo cual no suelen requerir de procesos de optimización online [41] [42].

De esta forma, en [43] se cuestiona el desempeño de los algoritmos adaptativos óptimos que requieren realizar cálculos con bastantes recursos computacionales que coh´ıben la implementación de este tipo de sistemas por el requerimiento de poder computacional, restricciones del problema de optimización y los rangos de factibilidad de problema. En general, en la literatura se registra el uso de los controles basados en lógica difusa como un complemento de técnicas variadas.

Estas técnicas suelen apoyarse de redes neuronales, aprendizaje reforzado, estimaciones bayesianas, procesos estocásticos, optimización bioinspirada (Hormigas y Abejas) y teor´ıa de juegos, pero se registran pocas investigaciones donde la sinton´ıa de los tiempos sea principalmente producto de un controlador difuso. Además, las reglas y conjuntos bajo los cuales el controlador difuso actúa son escogidas de forma arbitraria en la mayor´ıa de los art´ıculos en la literatura, y esto se debe a la naturaleza subjetiva del control basado en experto. As´ı como se menciona en [44], el controlador difuso actualmente aprovecha recursos de otras herramientas como redes neuronales para entrenar bajo prueba y error los parámetros de los conjuntos difusos y as´ı asegurar un mejor desempeño [45] [46] [47] [48].

3.4.3 Control de Tiempo en Sem´

aforos basados en Redes Neuronales

Las aproximaciones que utilizan redes neuronales en el control de tiempos para semaforización aprovechan la naturaleza adaptativa y los conceptos de aprendizaje que pueden proveer las redes neuronales artificiales (ANN). Autores como [49] desarrollan metodolog´ıas de control para optimizar el recurso (tiempo en verde y rojo) en sistemas distribuidos o donde la información sea incierta en algunos nodos. Las redes neuronales se destacan por la redundancia de la información que los hace un control robusto sobre todo a perturbaciones y variaciones de los ejemplos con los cuales se entrenan (supervisado o no supervisado, y son una estrategia ideal para el control distribuido en el control de semáforos. Si bien las ANN son provistas con diversas ventajas, el costo computacional de recurrir a algoritmos de optimización de funciones de costo no lineales de varias variables se convierte en la principal debilidad de esta familia de estrategias de control [50] [51] [52] [53].Por otro lado, para mejorar el desempeño y precisión de las redes neuronales, se requiere diseñar adecuadamente el nivel de capas ocultas, proceso que no está estandarizado en la literatura y como menciona [54] no existe un método para encontrar el número óptimo de capas ocultas. Una solución a este problema se plantea en [54] donde utilizan un algoritmo iterativo de Kolmogorov.

El potencial de las redes neuronales es explotando en [55] donde se propone utilizar redes de neuronas entrenadas para tareas espec´ıficas, en este caso la sintonización de tiempos por cruce de manera individual, y no una red de múltiples capas complejas para sintonizar la red completa. Si bien esta aproximación reduce el tiempo de cómputo de manera significativa y mejora la respuesta

(25)

individual de cada intersecci´on semaforizada no se aseguran tiempos optimos de la red en conjunto, motivo por el cual los autores introducen elementos coordinadores jerarquizados para mejorar el desempe˜no de la red en conjunto.

3.4.4 Control de Tiempo en Sem´

aforos basados en Teor´ıa de Juegos

Comparando con la vasta investigación que llevan las redes neuronales, el aprendizaje reforzado, los algoritmos heur´ısticos y la lógica difusa, la teor´ıa de juegos se ha rezagado, especialmente en tráfico. La teor´ıa de juegos utiliza herramientas matemáticas para modelar las interacciones y decisiones de agentes individuales. Aun cuando en la década de 1990 se realizaron aproximaciones al control basado en teor´ıa de juegos para administrar recursos (especialmente para tráfico aéreo) [56] [57], solo hasta el 2006 que se propusieron modelos para el control del tráfico urbano utilizando semaforización. Desde entonces el principal punto de investigación ha sido cómo coordinar agentes para distribuir un recurso finito, que para el caso del estudio espec´ıfico de tráfico es el tiempo en verde de un semáforo. Dos hitos históricos se presentan en [58] [59]. En [58] se plantea el problema de tráfico y la distribución del recurso de los tiempos del semáforo (fases) con el marco matemático y el análisis bajo los equilibrios de Nash e introduce variables aleatorias a los modelos. Por otro lado, en [59] se presenta el uso de dinámicas asociadas a juegos evolutivos para el control de rutas de veh´ıculos en juegos no cooperativos.

En [60] se presenta un algoritmo basado en dinámicas poblaciones (juegos evolutivos) apoy-ados en una red neuronal para permitirles a los jugadores aprender y mejorar la sinton´ıa de los controladores. Aun as´ı, es con [61] que se plantea la necesidad de un sistema en red para el control de tráfico debido al gran tamaño y complejidad de la red y la importancia del uso de algoritmos de consenso para solucionar el problema de la congestión. Espec´ıficamente se recomiendan controles basados en agentes y teor´ıa de juegos puesto que utilizar modelos no resulta viable ante la complejidad de la red y la variabilidad de la misma. As´ı mismo en [62] se plantea el problema del tráfico en una intersección semaforizada utilizando esta vez el modelo matemático de juegos cooperativos. Bajo esta perspectiva definen adecuadamente los equilibrios de Nash y de Pareto para el juego de dos intersecciones, lo cual si bien es loable deja fuera una expansión a sistemas complejos como una red vial real. Aun as´ı, logran realizar simulaciones y se encuentra que los algoritmos de tiempo fijo pueden ser sintonizados para un correcto funcionamiento cuando el flujo no presenta un estado de congestión pero cuando se congestiona, el algoritmo basado en juegos cooperativos que anteriormente no presentaba ninguna ventaja sobre los Fixed Time Algorithm, esta vez mantiene la velocidad media de los autos, mientras que los algoritmos de tiempo fijo colapsaron enviando a 0 la velocidad media de las intersecciones. Los resultados de [61] y [62] son prometedores en cuanto al uso de teor´ıa de juegos en el control de las fases de la semaforización urbana.

(26)

4 Metodolog´ıa

El trabajo se desarroll´o en 9 etapas las cuales contemplan desde el planteamiento del problema hasta el an´alisis de los resultados. En total se utilizaron 15 semanas aprovechando una carga de 12 horas semanales.

• Planteamiento y Propuesta :Se realizó la primera aproximación al problema, desde el planteamiento matemático, hasta las consideraciones para la GUI y se inspeccionó cuál ambi-ente de programación ser´ıa adecuado para realizarla. En esta etapa se definieron los alcances, se realizaron unas primeras pruebas con el software PTV VISSIM.

• Estado del Arte:Se efectuó una revisión bibliográfica para conocer el estado actual de los sistemas ITS, el alcance de los sensores, los problemas en los canales de comunicaciones e identificar tendencias. Sobre esta base se realizó una indagación en especial sobre estrategias de control por semaforización y por último a las aproximaciones por medio de teor´ıa de juegos.

• Marco Teórico:Se realizó una formalización de las dinámicas poblacionales desde la perspec-tiva de los protocolos de revisión as´ı como un análisis de las caracter´ısticas de estas dinámicas para diferentes consideraciones, equilibrios y su comportamiento en grafos distribuidos.

• Modelo de Tráfico: Se hizo una aproximación a tres modelos de tráfico y se desarrollaron simulaciones para validar su comportamiento, desde la perspectiva de un cruce sencillo hasta el modelo basado en estados con saturación.

• Dinámicas Poblacionales: Se indagó acerca de las dinámicas de los juegos evolutivos. Además de implementar algunas dinámicas por medio de protocolos de revisión y el método de las “Mean Dynamics”, se analizó el comportamiento de las poblaciones ante juegos distribuidos donde no se posee información de todos los estados de los agentes.

• Interfaz PTV VISSIM-MATLAB:Se desarrolló una interfaz gráfica utilizando la comu-nicación COM que permite el software PTV VISSIM para controlarla desde Matlab. Esta interfaz gráfica (GUI) se desarrolló mediante los paquetes gráficos GUIDE de Matlab/Java con enfásis en el diseño de interfaces humano-máquina.

• Dise˜no de los Controladores:En esta etapa se implementaron en Matlab los controladores basados en Tiempo Fijo, Proporcionales, Basados en Juegos y Basados en Juegos distribuidos.

• Simulaciones:Para las simulaciones se utilizó el modelo de Matlab para 4 nodos utilizando redes con saturación y el software PTV VISSIM bajo la interfaz gráfica para comparar el de-sempeño de los controladores de tiempo fijo, asignación proporcional de tiempo de ciclo, como tiempos en verde y controles de alto nivel como los controles basados en las”M eanDynamics”.

(27)

CAP´ITULO 4.

• Análisis de Resultados:Se analizaron los resultados de las simulaciones y se discuten las tablas generadas por la aplicación gráfica GUI PTV VISSIM-Matlab.

(28)

5 Resultados

5.1 Modelo de Tr´

afico Urbano

En la literatura se registran diversos tipos de modelos de tráfico vehicular, todos inspirados en ecuaciones diferenciales utilizando principios de fluidos y gases tales como la conservación de la materia y energ´ıa. Los modelos Macroscópicos hacen una analog´ıa espec´ıfica entre un fluido y una l´ınea de autos en movimiento eliminando as´ı los factores individuales de cada veh´ıculo en las simulaciones. Los modelos microscópicos pretenden describir estos comportamientos individuales de cada veh´ıculo, por ello integran ecuaciones que describen posición, velocidad de cada auto en una l´ınea. As´ı, las primeras aproximaciones a modelos de flujo vehicular utilizan una regresión basada en datos experimentales que arrojaron curvas del estilo:

V =V0(1− k kmax

) (5.1)

DondeV0 corresponde a la velocidad por defecto de los autos, ykmax es la densidad m´axima que soporta la v´ıa antes de saturarse por completo. As´ı mismo, utilizando la relaci´on entre velocidad y flujoq=kV se obtiene:

q(t) =V0k(t)(1− k(t)

kmax

) (5.2)

Sik(t) =_LmaxL(t) . Donde L es la longitud de la cola de autos y la densidad se presenta normalizada.

q(t) =V0 L(t) Lmax

(1− L(t)

Lmax

) (5.3)

A su vez, incluyendo el modelo basado en din´amicas de fluidos donde se contempla el cambio de la velocidad se obtiene:

dv dt =−

c2 k

∂k

∂x (5.4)

∂q ∂x =−

∂k

∂t (5.5)

q(t) =c L(t) Lmax

ln(Lmax

L(t) ) (5.6)

Este ´ultimo modelo es denominado el modelo logar´ıtmico de flujo vehicular, puesto que su comportamiento es descrito por una funci´on logar´ıtmica de la inversa de las longitudes de hileras de

(29)

5.1. MODELO DE TR ´AFICO URBANO CAP´ITULO 5.

veh´ıculos en una v´ıa (Figura 5.1). Por otro lado, el modelo inicial es llamado el modelo cuadr´atico que difiere del modelo logar´ıtmicoco sobre todo en los valores pico de tr´afico que es capaz de asimilar una v´ıa.

Figure 5.1:Comparación entre modelos cuadráticos y logar´ıtmicos para la asimilación de veh´ıculos en una v´ıa

Si se contempla la ecuación de conservación de masa en un flujo ideal se obtiene la ecuación diferencial:

dm dt =

X

i∈I

Qi (5.7)

Ecuaci´on que describe el comportamiento de las colas en una v´ıa de la siguiente forma:

d

dtH(t) =Qin(t)−ρ(t)[Qout(t)−q(t)] (5.8) d

dtq(t) = d dt[c

H(t)

Hmax

ln (Hmax

H(t))]

d dtq(t) =

c Hmax

d

dt[H(t) ln ( Hmax

H(t))]

d dtq(t) =

c Hmax

q(t)[ln (Hmax

H(t))−1] (5.9)

d

dtH(t) =Qin(t)−ρ(t)[Qout(t)−q(t)] (5.10)

El anterior conjunto de ecuaciones diferenciales es desarrollado por métodos numéricos para obtener el modelo dinámico de una v´ıa contemplando saturación. Para ello es necesario plantear condiciones para la longitud de las colas de veh´ıculosH(t)y para el flujo de veh´ıculos a través de la v´ıaq(t), al igual que los parámetros de la v´ıa tal comoHmaxque representa el máximo volumen de autos que puede almacenar la v´ıa, asimismo c el parámetro que modela la tasa con la cual

(30)

Figure 5.2:Simulación Modelo unidimen-sional con efecto de saturación sin acción regulatoria (Semáforo)

Figure 5.3:Simulación Modelo unidimen-sional con efecto de saturación con acción regulatoria (Semáforo)

los veh´ıculos evacuan las v´ıa. El factorρ(t) es una funci´on ρ: R→ {0,1} donde 0 representa un

semáforo o señal de control en rojo, y 1 representa el estado del semáforo en verde.

En las figuras 5.2 y5.3 se presentan 3 gráficas en el tiempo que corresponden a la evolución dinámica de las colas de veh´ıculos en una v´ıa libre (no semáforos), con una tasa de entrada de veh´ıculos y una tasa de salida tal que la resta es constante negativa, esto esQin(t)−Qout(t)<0,∀t lo cual implica que la v´ıa eventualmente se regulará a 0. Por otro lado, en las gráficas se observa el fenómeno de la saturación que si bien el flujo deQin(t)−Qout(t) = 0(es decir que el equilibrio no es 0), la acción del semáforo s´ı introduce flujos completamente en 0 y saturando enHmax= 100 hasta que la señal de control permita que el flujo sea diferente de 0.

Definici´on 5.1.1 Se llama v´ıa a un espacio finito que permite el desplazamiento de personas o veh´ıculos tal que cumpla con las din´amicas propuestas en las ecuaciones 5.9 y 5.10

Partiendo de la definici´on anterior se puede postular el siguiente teorema:

Teorema 5.1.1 Para toda v´ıa tal queQin(t)−Qout(t)<0,∀t yρ(t) = 1,∀t se puede afirmar que

lim

t→∞H(t) = 0 y tlim→∞q(t)6= 0

Demostraci´on5.1.1 Dado el modelo de las ecuaciones :

dH

dt = [Qin(t)−[Qout(t)−q(t)]ρ(t)] dq

dt = c Hmax

q(t)[ln [Hmax

H(t)]−1]

(31)

dH

dt =δ(t) +q(t) dH = [δ(t) +q(t)]dt

H(t) =

Z t

−∞

[δ(τ) +q(τ)]dτ+H0

H(t) =

Z t

−∞

[δ(τ)]dτ+

Z t

−∞

[q(τ)]dτ H0

lim

t→∞H(t) = limt→∞ Z t

−∞

[δ(τ)]dτ +

Z t

−∞

[q(τ)]dτ +H0

lim

t→∞H(t) = limt→∞ Z t

−∞

[δ(τ)]dτ + lim

t→∞Q(t) +H0

Si δ(t) < 0 entonces R∞

−∞δ(t)dt < 0 y como q(t) ∈ [0,∞) partiendo del modelo especificado

logaritmico, el valor de Q(t) tiende a 0 en cuanto H tienda a 0.Por lo tanto

lim

t→∞H(t) = limt→∞Q(t) + limt→∞B(t) +H0

y como Q(t) +B(t)<0 YH0>0 el valor deH(t)∈[0,Hmax] el m´ınimo valor al que tendera

H(t)para un decreciente Q(t) +B(t)es 0.

Ahora bien, para el modelo extensivo de sistemas de gran escala como una red de tr´afico de m´as de 2 nodos es necesario realizar un planteamiento el espacio de estados. En ese sentido se define el vector de estadosx(k) como el vector deRn

+ que representa las colas de cada v´ıa asociada a cada

nodo. En este modelo se tienen nodos de perturbaci´on que corresponden a los nodos en los cuales ingresan veh´ıculos y los nodos sumidero que son aquellos en los cuales los veh´ıculos siempre salen de la red vial. Para modelar estos comportamientos se declara la siguiente regla de evoluci´on para las colas de veh´ıculos en el sistema:

xi(k+ 1) =xi(k) +ρj−1(k)Qiin(k)(1−ci(k))−ρi+1(k)Qouti (k)(1−ci+1(k)) (5.11)

El modelo de cada estado expandido para valores futuros de tiempo se puede generalizar con la ecuación 5.12 donde ρi−1 yρi+ 1son los valores de los semáforos antes y después de la v´ıa, es

decir los sem´aforos que controlan los flujos de ingreso y salida de los veh´ıculos por una v´ıa.

xi(t+n) =xi(t) n Y

k=1

1 +ρi−1(k)Q

i

in(k)−ρi+1(k)Qiout(k)

xi max + n X j=1

ρi−1(j)Qiin(j)−ρi+1(j)Qiout(j) n−1

Y

l=j+1

1 +ρi−1(l)Q

i

in(l)−ρi+1(l)Qiout(k)

xi max

(32)

5.2. AN ÁLISIS DE LA FUNCI ÓN DE FITNESS CAPÍTULO 5.

5.2 An´

alisis de la Funci´

on de Fitness

Partiendo de la definici´on 2.2.2 en la cual se enuncia el requerimiento para denominar a un juego estable, proponiendo una funci´on de Fitness de la forma:

F(x) =Mx+C

Se procede a comprobar el principio de estabilidad y se obtiene:

(y−x)T(F(y)−F(x))≤0 (y−x)T([My+C]−[Mx+C])≤0

(y−x)TM([y−x])≤0 (z)TM(z)≤0

Lo cual se cumple siempre y cuandoM sea una matriz semi definida negativa. Definici´on 5.2.1 Una matrizM es negativa semi definida si:

xTMx≤0;∀x6= 0 (5.13)

O lo que es igual, que todos los valores propios de la matriz M sean negativos.

Ahora bien, sea un juego definido por F que cumple con las definiciones 2.2.2 y 2.2.1 existe entonces una funciónf ={f(x)∈_R|F=∇f(x)}entonces el equilibrio de Nash del juego potencial equivale al m´ınimo de la función potencial.Siguiendo este orden de ideas se propone una función potencial de la forma :

f(x) = 1 2x 2 1+ 1 2x 2 2+...+

1 2x

2

n+x1c1+x2c2+...+xncn

f(x) =

n X

i=1

1

2xi(xi+ 2Ci)

∇f(x) =Mx+C

F(x) =Mx+C

Donde el equilibrio de Nash del juego definido por F, corresponde al m´ınimo de la funci´on f.Aprovechando esta relaci´on se puede proponer una matrizM tal que el juego evolucione hacia un valor definido C.La matriz adecuada para lograr el objetivo esM =−I. Esto es:

Fi(x) = (1−

xi

ci

)

Si se aprovecha que los estados se definen como una proporci´on de la poblaci´on de la forma que xi ∈ [0,1] al mismo tiempo que ci ∈ [0,1] entonces se encuentra un equilibrio en el cual los

(33)

5.3. INTERFAZ GR ´AFICA GUI PTV VISSIM-MATLAB CAP´ITULO 5.

agentes de benefician al m´aximo de forma individual y colectiva (equilibrio de Nash) pero con pesos ponderados dentro de la poblaci´on.

La función potencial f(x) es una función de costo cuadrática con un único máximo global ubicado en ~x = ~c.El vector de costos c corresponde al peso de la función se aprovecha que la función de fitness resultante representa un juego estable con un equilibrio proporcional a los pesos del vector de costoscde modo que el juego bajo una dinámica poblacional encuentre el equilibrio que asigna el recursoxacorde a los pesos asignados.

En el caso del tr´afico urbano se plantea una funci´on vector de costos de la forma :

ci=

Hi P

i∈IHi

DondeHi es el valor de la cola de veh´ıculos en el nodo i-esimo. El valor de un nodo es dado por :

Hi=

Li P

i∈IL i Li

El equilibrio básico asociado al juego propuesto por esta selección de pesos equivale a una asignación de tiempos de ciclo que es proporcional a los veh´ıculos en el nodo.

5.3 Interfaz Gr´

afica GUI PTV VISSIM-Matlab

El paquete de simulación PTV VISSIM incluye un módulo de programación COM que permite la interacción de lenguajes de programación externos con el núcleo de VISSIM de forma legal y estable. Este módulo ha sido explotado en diferentes aproximaciones desde locales como [63] [64] [65] [66] donde se aprovecha el potencial de la comunicación por COM con Matlab, obteniendo inclusive una interfaz gráfica basada en botones donde se realiza una configuración inicial del escenario de simulación. Por otro lado, se han realizado aproximaciones a la programación COM de PTV VISSIM con otros lenguajes como en [67] [67] donde exploran la posibilidad de compilar en librer´ıas dinámicas .dll funciones mas complejas de C++/Java para la ejecución en tiempo real con VISSIM. Si bien esta es de las opciones que más rápido permiten correr al código de control conjunto a VISSIM, no permite una fácil modificación de los códigos de control o interactuar en tiempo real Usuario-VISSIM. En este sentido se desarrolló una aplicación para la interacción entre Matlab-PTV VISSIM para simular controladores inteligentes de tráfico urbano.

La API permite el uso cómodo por parte de usuarios que no estén familiarizados con la programación COM y facilita el acceso de Matlab gracias a sus ventajas en cuanto a la curva de aprendizaje,versatilidad, soporte de la comunidad y poder de cómputo asociado a los toolboxs. El sistema se basa en una GUI usa el entorno GUIDE de Matlab as´ı como funciones auxiliares de Java, se llevaron a cabo simulaciones de tráfico urbano de redes en PTV VISSIM 5.4, sin utilizar librer´ıas externas o el modulo script de Python de VISSIM 5.4.

Se diseñó una aplicación GUI (Graphic User Interface) que permite realizar simulaciones bajo el ambiente Matlab y el motor de simulación del paquete PTV VISSIM. La aplicación está