Control de tráfico urbano - implementación de algoritmo de control

Texto completo

(1)PROYECTO FIN DE CARRERA Presentado a LA UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA. Para obtener el tı́tulo de INGENIERO ELÉCTRICO por Iván Felipe Gutiérrez Delgado. CONTROL DE TRÁFICO URBANO: IMPLEMENTACIÓN DE ALGORITMO DE CONTROL. Sustentado el 5 de diciembre de 2012 frente al jurado: Composición del jurado. Asesor: Cosesor: Jurado:. Nicanor Quijano Silva Ph.D, Profesor asociado, Pontificia Universidad Javeriana - Ohio State University Pablo Andrés Ñañez Ojeda Ph.D Student, Universidad de Los Andes - University of Arizona Eduardo Mojica Nava Ph.D, Universidad de Los Andes - École des Mines de Nantes.

(2) Resumen. Distributed Model Predictive Control es empleado para controlar el tráfico urbano de una red enmallada. Se simulan controladores Basados en Model Predictive Control, Distributed Model Preditive Control y Replicator Dynamics bajo diferentes escenarios de tráfico, empleando VISSIM y MATLAB para tal fin. Se implementa un esquema Hardware-in-the-Loop, basándose en la plataforma tecnológica de control de tráfico urbano disponible bajo el proyecto de cooperación Uniandes - IMATIC..

(3) A todos aquellos que hacen parte de mi vida, a mi padre, Eliseo y a mis hermanos, César y Diego..

(4) Agradecimientos Durante los últimos años, muchas personas han creı́do en mı́. Quiero agradecer la oportunidad de estudiar en la Universidad de los Andes, a todos aquellos que hicieron la beca Quiero Estudiar una hermosa realidad. de igual manera, a Carlos Angulo Galvis, ex rector de la Universidad de los Andes por todos los esfuerzos y apoyos a los becarios. Gracias por creer en mı́, y en mis capacidades. Quisiera agradecer el incondicional apoyo y ayuda de Ángela Marı́a Patiño Gómez, coordinadora del Centro de Atención Decanatura de Estudiantes (CADE), de su mano tracé mi trayectoria profesional. Gracias por creer en mı́ y acogerme, gracias por hacerme sentir como tu hijo. Quisiera expresar mi gratitud especialmente a Pablo Ñañez y Nicanor Quijano, mis asesores de tesis. Lo que he aprendido de ustedes dos es invaluable. Muchas gracias por todo lo que me han enseñado, criticado y corregido. Es un honor trabajar con gente tan admirable. No sólo ellos han creı́do en mı́. Mi mamá, Martha Cecilia Delgado y mi papá Eliseo Gutiérrez lo han hecho. Para ellos, fue una complicada decisión el enviarme a Bogotá. Hoy en dı́a, les agradezco por todos los esfuerzos que han hecho para hacer de mı́ una mejor persona. Muchas gracias por su amor, por su comprensión y por ser totalmente incondicionales conmigo. Los amo. Muchas gracias a mis hermanos César Augusto Gutiérrez y Diego Fernando Gutiérrez. Gracias por todas las pequeñas enseñanzas del dı́a a dı́a, gracias por estar allı́ siempre que los he necesitado. He vivido los últimos años lejos de ustedes, sin embargo cada dı́a los extraño más. A mi novia, Paula Daniela Urrea, muchas gracias por hacer de cada dı́a un frenesı́ de 4.

(5) i felicidad. Gracias por sacar a la luz mis fortalezas en los ocasos. Te amo. Y a todos aquellos que aportaron a mi formación, infinitas gracias..

(6) Tabla de contenido 1 Introducción. 1. 2 Revisión de literatura 2.1 Estrategias de control de tráfico urbano [31] [28] . . . . . . . . . . . . 2.1.1 Estrategias de control de tráfico urbano basadas en tiempo fijo . 2.1.2 Estrategias de control de tráfico urbano adaptativas . . . . . . . 2.2 Estrategias de control predictivas. Caso de estudio: MPC . . . . . . . . 2.2.1 Control distribuido: Distributed Model Predictive Control (DMPC) 2.3 Algoritmos de control basados en Machine Learning . . . . . . . . . . . 2.4 Algoritmos bioinspirados . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Modelos de redes de tráfico urbano . . . . . . . . . . . . . . . . . . . . 2.5.1 Modelos de tráfico urbano según la topologı́a . . . . . . . . . . . 2.5.2 Modelos de tráfico urbano según el nivel de detalle . . . . . . .. 6 6 7 9 11 13 14 15 16 18 19. 3 Distributed Model Predictive Control 3.1 Descripción del Modelo para redes distribuidas . . . . . . . . . . . . . . 3.1.1 Formulación compacta . . . . . . . . . . . . . . . . . . . . . . . 3.2 Función de Costo cuadrática . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Planteamiento del algoritmo distribuido . . . . . . . . . . . . . . . . . . 3.4 Planteamiento para cuatro intersecciones . . . . . . . . . . . . . . . . . 3.4.1 Paso número 1: definición de conjuntos . . . . . . . . . . . . . . 3.4.2 Paso número 2: definición de matrices Bmi . . . . . . . . . . . . 3.4.3 Paso número 3: definición del vector inicial de control um (0) . . 3.4.4 Paso número 4: definir el estado xm (0) del sistema . . . . . . . 3.4.5 Paso número 5: construcción de la formulación compacta . . . . 3.4.6 Paso número 6: formulación de Hmij , gmi , gmm para luego obtener gm y Hm . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.7 Paso número 7: definición de la dinámica del sistema . . . . . . 3.4.8 Paso número 8: plantear el problema de optimización en términos de la formulación compacta . . . . . . . . . . . . . . . . . . . . 3.4.9 Paso número 9: solución del problema cuadrático . . . . . . . . 3.4.10 Paso número 10: predicción de todos los xm (k) para k ∈ [0, T ] .. 21 22 23 24 25 27 29 31 32 33 33. ii. 36 38 39 40 40.

(7) iii. TABLA DE CONTENIDO 4 Enunciado del Problema 4.1 Red de tráfico simulada . . . 4.2 Índices de desempeño . . . . 4.3 Descripción de experimentos 4.4 Resultados esperados . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. 41 42 43 45 45. 5 Implementación del algoritmo distribuido 47 5.1 Distributed Model Predictive Control: Caracterı́sticas de la implementación 47 5.2 Algoritmos analizados . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.3 Interfaz entre MATLAB y VISSIM PTV . . . . . . . . . . . . . . . . . 49 6 Análisis y resultados 6.1 Ventajas y desventajas de la formulación distribuida . . . . . . . . . . .. 51 52. 7 Hardware-in-the-Loop 7.1 Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Controlador COVA-8G . . . . . . . . . . . . . . . . . . . . . . . 7.1.2 Tarjeta de adquisición de datos National Instruments NI USB 6509 7.1.3 Circuitos conversores de voltaje . . . . . . . . . . . . . . . . . . 7.1.4 Interfaz Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Computador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.2 Interacción con los programas . . . . . . . . . . . . . . . . . . . 7.3 Interfaz de conexión para el controlador COVA-8G y VISSIM . . . . .. 54 56 56 57 58 59 60 60 60 61. 8 Conclusiones y trabajo futuro. 63. Referencias. 64. A Controladores de tráfico urbano. 70. B Descripción del controlador COVA-8G. 73.

(8) Índice de figuras 2.1 2.2 2.3. Diagrama de de tiempo vs espacio de MAXBAND. Tomado de [21] . . Esquema general de MPC. Tomada de [6] . . . . . . . . . . . . . . . . . Diagrama de Reinforcement Learning . . . . . . . . . . . . . . . . . . .. 9 12 15. 3.1. Red de cuatro intersecciones . . . . . . . . . . . . . . . . . . . . . . . .. 28. 4.1. Red de Barranquilla de 8 intersecciones. . . . . . . . . . . . . . . . . .. 42. 5.1. Implementación de la red de Barranquilla, Colombia en el software VISSIM 5.4 PTV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 48. 7.1 7.2 7.3 7.4 7.5. Red de control de tráfico urbano basada en controladores IMATIC Arquitectura del Hardware-in-the-Loop . . . . . . . . . . . . . . . Tarjeta de adquisición de datos NI USB-6509 [tomada de NI] . . . Esquema de tarjeta divisora . . . . . . . . . . . . . . . . . . . . . Esquema general del Hardware-in-the-Loop . . . . . . . . . . . . .. . . . . .. . . . . .. 55 56 57 58 61. B.1 B.2 B.3 B.4 B.5 B.6 B.7 B.8. Unidad de procesamiento del controlador de tráfico urbano COVA-8G Breakers de encendido y apagado del controlador . . . . . . . . . . . Fuente de alimentación de 24V . . . . . . . . . . . . . . . . . . . . . . Breakermatic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Módulo GPRS - GPS . . . . . . . . . . . . . . . . . . . . . . . . . . . Módulo GPRS en funcionamiento . . . . . . . . . . . . . . . . . . . . Conectores serial del controlador . . . . . . . . . . . . . . . . . . . . . Conectores serial del controlador . . . . . . . . . . . . . . . . . . . . .. . . . . . . . .. 74 74 75 76 77 77 78 79. iv. . . . . ..

(9) Índice de tablas 2.1. Comparación entre los dos casos. . . . . . . . . . . . . . . . . . . . . .. 17. 6.1. Resultados comparados contra el controlador basado en Replicator Dynamics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 53. v.

(10) Capı́tulo 1 Introducción El control de tráfico urbano es un área de estudio compleja, debido a que el tráfico, como tal, es un proceso estocástico y variable en el tiempo, donde juega un papel fundamental la arquitectura de la red en la cual se desenvuelve. En el control del tráfico existe una dificultad inherente al desarrollo urbano: a medida que la ciudad crece, aumenta la complejidad del sistema, adicionando nuevas intersecciones, vı́as y pasos peatonales a la anterior red. El aumentar la complejidad del sistema hace obsoletos los métodos de control de tiempo fijo. Los métodos de control basados en esquemas de tiempo fijo se ajustan a condiciones especı́ficas de tiempo y espacio, sin embargo llegan a ser ineficientes para otros momentos, por los cambios en la red previamente mencionados. Para empeorar la situación, no sólo los algoritmos de tiempo fijo sufren alteraciones por la modificación de la red, los algoritmos de control de tráfico adaptativos pueden dejar de ser óptimos, puesto que el modelo bajo el cual se encuentran programados deja de ajustarse al caso real. Adicionalmente, varios algoritmos de control de tráfico adaptativo implican al mismo tiempo un alto costo computacional como también de comunicaciones, haciéndolos efectivos ante redes reducidas, limitando sus aplicaciones a redes reales de gran magnitud. Por ende, es necesario implementar algoritmos de control que permitan mejorar el desempeño de la red bajo diferentes circunstancias, procurando que sea flexible ante cambios en la arquitectura de la red. El algoritmo deberı́a modelar los cambios de la misma de una forma rápida, sin necesidad de alterar en su totalidad el modelo previo de la red. La rápida corrección del modelo, ahorra costos y tiempo de desarrollo de los algoritmos.. 1.

(11) CAPÍTULO 1. INTRODUCCIÓN. 2. Muchas de las estrategias de control de tráfico urbano se basan en mediciones del estado actual del sistema, con el fin de obtener valores de flujos, número de autos (colas) y tiempos de cada una de sus intersecciones, para luego ser llevadas mediante un sistema de comunicaciones a un centro de control, encargado de realizar las proyecciones de los tiempos de cada una de las luces de los semáforos de la red. Este sistema es conocido como control centralizado. La comunicación y sincronización de todos estos datos representa un retardo significativo para el sistema, que aumenta a medida que la red modelada es más compleja [10]. Este problema, unido a los altos tiempos de cálculo requeridos por el algoritmo, no ha permitido una implementación del sistema en tiempo real, desaprovechando las bondades de algoritmos basados en Model Predictive Control (MPC). En [10], [45], [11] y [33] se expone esta limitación a implementar esquemas basados en MPC como algoritmo de control de redes reales complejas, sin embargo, se dan los lineamientos para una aproximación bajo la cual la implementación de estos modelos llega a ser viable computacionalmente, sin necesidad de recurrir a cambios en la plataforma tecnológica. A pesar de las bondades de un control basado en MPC, hay que reconocer sus principales falencias. Una de las principales desventajas radica en las comunicaciones requeridas por cada uno de los nodos, que otorga su estado actual al centro de control, ası́ como la sincronización que se requiere entre múltiples nodos de la red y el centro anteriormente nombrado. El hecho de que el sistema de comunicaciones entre uno o varios nodos falle puede llegar a generar un colapso del sistema en general. Lo anterior ocasiona respuestas no deseadas que conllevan al caos del sistema. Un sistema que presente este comportamiento, se define como un sistema sin tolerancia a la falla [11]. En contraposición a los errores presentados por un control centralizado, un control distribuido llega a ser más tolerante a la falla [11]. Bajo un esquema distribuido, un error en alguno de los nodos puede llegar a afectar los nodos vecinos, sobre los cuales tiene influencia directa, o vecindad. Si llegase a fallar un nodo, los demás, que no tienen una relación de vecindad no son afectados, por lo cual la red de tráfico mantiene su orden exceptuando tan sólo el nodo en el cual se presentó la falla. Este comportamiento nos brinda una mayor seguridad a la hora de implementar el algoritmo en ambientes poco.

(12) CAPÍTULO 1. INTRODUCCIÓN. 3. tolerantes a la falla, destacándose aquellas ciudades con alto flujo vehicular, entre las cuales se encuentra Bogotá. Adicionalmente, el hecho de distribuir el modelo de la red en pequeños subsistemas permite una menor carga computacional, lo que hace posible realizar cómputos en paralelo. Esto reduce el tiempo que tarda el algoritmo en ejecutarse, lo que permite su implementación en redes reales. Para ello, es necesario contar con redes de controladores distribuidos por la ciudad. IMATIC propone un esquema de Hardware basado en múltiples controladores dispuestos por la red, con lo cual el algoritmo optimizado basado en Distributed Model Predictive Control (DMPC) es factible de ser programado en redes reales. Sin embargo, se sigue manteniendo un problema referente a la comunicación: ahora los nodos requieren intercambiar información con sus vecinos influyentes, por lo cual se debe garantizar una sincronización entre los diferentes nodos del sistema. Este esquema puede lograrse con base en el Hardware desarrollado por IMATIC vı́a GPRS/GPS, donde se cuenta con una red de control centralizado, la cual puede emplearse con el fin de sincronizar la comunicación y servir de enrutador para cada uno de las señales de comunicación entre los nodos vecinos. IMATIC se encuentra implementando en Barranquilla una red basada en sensores, pensando en la aplicación de algoritmos de control tanto centralizados como distribuidos. También se encuentra desarrollando un nuevo controlador de tráfico, con prestaciones que de seguro permitirán implementar algoritmos como los expuestos en este documento, ejecutándose sobre un sistema operativo basado en LINUX. La aplicación del trabajo desarrollado es inminente, contando con un Hardware provisto por IMATIC. Adicionalmente a los algoritmos basados en tiempo fijo y modelos, existen diversas estrategias que permiten controlar el tráfico urbano, que no requieren un modelo. Éste es el caso de las estrategias de control fundamentadas en Machine Learning (ML), Control óptimo (CO), o los algoritmos bioinspirados, en los que se generan principios de acción bajo los cuales el algoritmo actúa dependiendo del estado actual de la red de tráfico. Con el fin de dar un panorama general de los algoritmos de control de tráfico urbano, en [31] y [28] se discuten diferentes estrategias, basadas en esquemas de tiempo fijo y adaptativas. Entre ellas, existen estrategias de control basadas en modelo, entre las cuales cabe destacar Model predictive Control (MPC), el cual ha sido empleado ampliamente para el control de tráfico urbano: en [6] [27] [17] [16] se dan los lineamientos acerca del.

(13) CAPÍTULO 1. INTRODUCCIÓN. 4. MPC. En [45] se plantea un esquema de optimización distribuida para MPC, basado en redes lineales dinámicas, en el cual se muestran las ventajas y desventajas de su implementación, ası́ como los algoritmos bajo los cuales se puede realizar la optimización del problema planteado. En [10] se analiza el problema de optimización propuesto en [45], modelando el sistema como un grafo en el cual cada nodo conlleva restricciones de entrada como también restricciones de estado. En [11] se estudia la aplicación de [10] a una red de tráfico real en Macaé, Brasil, donde se presentan resultados relevantes en términos de desempeño en el tiempo de los algoritmos en simulación, y a la vez se sientan las bases para la implementación del algoritmo distribuido. En [33] se compara la implementación de algoritmos basados en MPC en términos de procesamiento en serie como en paralelo. En cuanto a técnicas de control no basadas en modelo, se destacan los planteamientos de [46], donde se muestra un esquema de control para redes de tráfico urbanas bioinspirado en colonias de abejas; en [44] se presenta un panorama general de la implementación de algoritmos bioinspirados. En cuanto a algoritmos basados en Machine Leaning, se encuentra en [4] una propuesta para control de tráfico urbano basada en sistemas de aprendizaje por refuerzo multiagentes, y también una descripción de algoritmos de control de tráfico en general basados en aprendizaje por refuerzo en [42]. En [23] se plantea desde diferentes puntos de vista la función objetivo de un problema de control óptimo y en [13] se da una descripción del concepto y la necesidad de implementar a nivel industrial de sistemas Hardware-in-the-Loop. Los objetivos de este proyecto de grado son, posterior a una adecuada revisión de literatura, buscar, seleccionar e implementar un algoritmo de control de tráfico urbano, ası́ como comparar su desempeño con algoritmos basados en modelos, tales como MPC centralizado, y Replicator Dynamics. En el presente documento, se profundiza sobre la implementación de Distributed Model Predictive Control. Además, se implementa un esquema Hardware-in-the-Loop bajo el cual se desarrollan pruebas basadas en controladores reales provistos por la empresa IMATIC, empleando el simulador microscópico de redes de tráfico VISSIM, software al cual se tiene acceso gracias a su disponibilidad en la Universidad de los Andes. El resto del documento se estructura de la siguiente forma: en el capitulo dos se expone la revisión de literatura. Seguido a éste, en el capı́tulo tres se presenta el control basado.

(14) CAPÍTULO 1. INTRODUCCIÓN. 5. en Distributed Model Predictive Control (DMPC) empleado para la optimización de tiempos en luces de tráfico urbano. En este capı́tulo se expone matemáticamente el algoritmo, resaltando la función de costo a optimizar a la vez que se expone un ejemplo sencillo para cuatro intersecciones. En el capı́tulo cuatro se enuncia el problema a analizar, acción que se realiza en el capı́tulo cinco, donde se exponen los parámetros y caracterı́sticas de la simulación. Se prosigue en el capı́tulo seis, donde se analizan los resultados obtenidos bajo los diferentes experimentos propuestos. En el capı́tulo siete se presenta el esquema Hardware-in-the-loop implementado y en el capı́tulo ocho se exponen las conclusiones y el trabajo futuro que se puede realizar en el área..

(15) Capı́tulo 2 Revisión de literatura A continuación se presenta la revisión de literatura. En su primera sección se describen las estrategias de control de tráfico urbano, resaltando diferencias entre algoritmos basados en tiempo fijo y en control de tráfico adaptativo. En la sección número dos se abordan los problemas caracterı́sticos de un esquema basado en MPC, resaltando sus diferentes caracterı́sticas. En esta sección también se presenta una alternativa de solución a la problemática presentada: Distributed Model Predictive Control (DMPC). En la sección número tres y cuatro se hace referencia a algoritmos de control de tráfico urbano adaptativo no basados en modelo. Se comienza en la sección número tres con algoritmos de control basados en Machine Learning y culmina en la sección número cuatro con algoritmos bioinspirados. En la sección número cinco se presenta una revisión de los modelos de tráfico urbano, clasificados según la topologı́a y el nivel de detalle.. 2.1. Estrategias de control de tráfico urbano [31] [28]. En el control de tráfico urbano a nivel global, las estrategias de control se encuentran divididas en dos grandes variantes: estrategias de tiempo fijo y estrategias de control adaptativas al tráfico. En esta sección, se abordan las principales estrategias de control, incluyendo las estrategias que hoy en dı́a manejan el tráfico urbano como también. 6.

(16) CAPÍTULO 2. REVISIÓN DE LITERATURA. 7. aquellas encontradas en ámbitos académicos.. 2.1.1. Estrategias de control de tráfico urbano basadas en tiempo fijo. Las estrategias de control basadas en tiempo fijo funcionan en base a cálculos offline de la red, es decir, las mediciones y cálculos que se realicen para determinar los respectivos tiempos de verde, amarillo y rojo de cada semáforo se realizan en base a datos estadı́sticos de mediciones previas, para después ser programados en los respectivos controladores de semáforos [31]. Por su simplicidad, son empleadas a lo largo de todo el mundo, puesto que implican un bajo costo de implementación. Estas estrategias de control no requieren de sensores, basándose en un control open-loop que lee las señales de control de la respectiva memoria del controlador, espacio en el cual se han almacenado los tiempos de las luces de tráfico una vez han sido procesadas estadı́sticamente. Cada estrategia se diferencia de otra en su función objetivo, en sus restricciones y en sus variables de control, tales como capacidad de intersecciones, capacidad de las colas, número de paradas, tiempo total de paradas, entre otras. Por lo general, estas estrategias de control de tráfico son diseñadas bajo condiciones de red no saturadas [31]. Entre las estrategias de control basadas en tiempo fijo, se distinguen dos variantes: las estrategias de control para intersecciones aisladas y las de control coordinado de intersecciones.[28] Las estrategias de control para intersecciones aisladas se basan en un modelo de red simple, aplicable a zonas de muy bajos flujos vehiculares. Dos ejemplos de estrategias de control de tiempo fijo para intersecciones aisladas corresponden a SIGSET y SIGCAP. Estas estrategias de control por su simplicidad son muy semejantes, sin embargo, difieren en la función objetivo que optimizan. Ambas estrategias de control se basan en limitar la capacidad que tiene determinada vı́a por encima de la demanda de la red. Adicionalmente, poseen lı́mites máximos y mı́nimos para el tiempo de verde..

(17) 8. CAPÍTULO 2. REVISIÓN DE LITERATURA Matemáticamente las podemos describir de la siguiente forma [31]:. sj. m X i=1. αij λi ≥ dj. ∀j. (2.1). Donde λ0 + λ1 + . . . + λm = 1 λ0 = L/c. En las anteriores ecuaciones sj representa el flujo de saturación, dj el flujo de demanda, αij representa el derecho de paso, tomando valores de cero o uno, λi representa la duración relativa del tiempo de verde respecto del tiempo de ciclo c, λ0 representa el tiempo perdido relativo al tiempo de ciclo, donde L representa el tiempo total perdido. Para el caso de SIGSET, se busca minimizar el tiempo total de espera de la intersección, para el caso de SIGCAP se busca maximizar la capacidad de las intersecciones [28]. En cuanto a las estrategias de control coordinado de intersecciones, sus principales representantes son MAXBAND, UTCS y TRANSYT. En general, buscan mejorar el desempeño de las vı́as principales, en base a datos estadı́sticos tomados de las mismas. Presentan un muy buen desempeño ante redes no congestionadas. Estas estrategias de control conllevan bajos costos de implementación, al no requerir dispositivos de sensado de tráfico. La estrategia bajo MAXBAND acuñó el término “ola verde”, buscando la minimización de los tiempos de parada de una vı́a principal. La “ola verde” consiste en una secuencia sucesiva de luces de semáforo verdes en la dirección de flujo de los automóviles, logrando que el automóvil en cuestión se detenga lo menos posible a lo largo de su trayecto [28] [31] [21]. Tal y como lo expone Little en [21], MAXBAND considera n intersecciones en la vı́a arterial. Se define como ancho de banda a aquella fracción de tiempo de ciclo en la cual un vehı́culo situado en una determinada intersección podrá experimentar la ola verde. Ello implica que los vehı́culos sean conducidos en un rango de velocidades fijos, definidos por el ancho de banda de cada intersección. En la figura 2.1.1 se puede observar un diagrama de tiempo vs. espacio de MAXBAND. S1 , S2 , . . . , Sn son intersecciones,.

(18) CAPÍTULO 2. REVISIÓN DE LITERATURA. 9. Figura 2.1: Diagrama de de tiempo vs espacio de MAXBAND. Tomado de [21]. o en términos del autor, señales. Se pueden apreciar dos trayectorias principales: la trayectoria más ancha corresponde al flujo saliente, y la más delgada corresponde al flujo entrante. En la imagen se puede apreciar el concepto de ancho de banda, representados para cada uno de los flujos como b y b. Cada una de las lı́neas observadas representa la trayectoria que han de seguir los vehı́culos, y la pendiente de estas rectas corresponden a las velocidades que éstos deben llevar para mantenerse en la ola verde. Paralelas al eje x, se pueden apreciar lı́neas fraccionadas referidas a las señales. Cada una de estas lı́neas hace referencia al tiempo de luz roja de cada uno de los semáforos de la intersección.. 2.1.2. Estrategias de control de tráfico urbano adaptativas. Con respecto a las estrategias de control de tráfico basadas en tiempo fijo, las estrategias de tráfico urbano adaptativas se basan en mediciones en tiempo real de la red, actuando ante variaciones instantáneas en ella. Este comportamiento permite una mejor respuesta del sistema de control a perturbaciones y cambios, siendo más resistente.

(19) CAPÍTULO 2. REVISIÓN DE LITERATURA. 10. a variaciones en los flujos debidas a eventos fortuitos, como los son los accidentes, las averı́as y las saturaciones. Existen también dos variantes en las estrategias de control de tráfico urbano adaptativas, tal y como sucede con las estrategias de control basadas en tiempo fijo: estrategias adaptativas para una intersección aislada, o estrategias adaptativas para intersecciones coordinadas.. Estrategias adaptativas para intersecciones aisladas Para intersecciones aisladas, las principales estrategias de control son llamadas “método de intervalo de vehı́culos” y Microprocessor Optimised Vehicle Actuation (MOVA), que es una mejora a la anterior. Las dos estrategias se basan en la fijación de un tiempo mı́nimo de verde, como de un tiempo máximo. Dependiendo de las observaciones que se tenga de los sensores, se aumenta o disminuye el tiempo de verde obteniendo valores en el rango que se ha fijado con anterioridad. La diferencia entre un método y otro reside en la flexibilidad de la función objetivo cuando se emplea MOVA, puesto que optimiza diferentes variables dependiendo de la condición de saturación de la red, maximizando la capacidad de las intersecciones bajo condiciones saturadas, o minimizando los retardos o paradas bajo condiciones no saturadas.. Estrategias adaptativas para intersecciones coordinadas Entre las estrategias de control adaptativas para intersecciones coordinadas, existen varias caracterizadas por realizar un control centralizado, denominadas SCATS (Sydney Coordinated Area Traffic System), RHODES, MOTION, TUC y SCOOT (Split, Cycle and Offset Optimization Technique). Esta última técnica se encuentra basada en la estrategia de TRANSYT, donde el cálculo se realiza de forma centralizada basado en un modelo del sistema. Con base en los datos provenientes del modelo y la red, SCOOT investiga en tiempo real el efecto producido en la red por cambios incrementales en el tiempo de ciclo, en las desviaciones y desplazamiento. El optimizador de ciclo se encarga de revisar los niveles de saturación de cada una de las intersecciones individualmente, mientras que el optimizador de desviaciones se encarga de generar retrasos o adelantos en las señales de control, buscando la mejor combinación para ese momento especı́fico.

(20) CAPÍTULO 2. REVISIÓN DE LITERATURA. 11. de la red. El optimizador de desplazamiento se encarga de minimizar los tiempos y número de paradas que se realicen. Adicionalmente a esta estrategia, existen otros algoritmos conocidos, como OPAC, PRODYN, CRONOS y RHODES, basados en un modelado riguroso de la red, implicando mayores tiempos de cómputo en el cálculo de los tiempos de verde de cada una de las intersecciones. Pasando al contexto local, en la ciudad de Bogotá, Colombia el control de las señales de semaforización se realiza en base en las recomendaciones de RILSA (Richtlinien für Lichtsignalanlagen) el cual es un compendio de consideraciones y estrategias para el control de la semaforización de una ciudad, tanto a nivel macroscópico como microscópico [3].. 2.2. Estrategias de control predictivas. Caso de estudio: MPC. MPC, tal y como lo indica su nombre, hace uso de modelos para predecir la respuesta de la planta. Con esta predicción, busca el camino óptimo para su variable de control. Este tipo de control es muy empleado para procesos quı́micos e industriales. Está conformado principalmente por un modelo bajo el cual se realiza la predicción, un control y un optimizador. Una vez las señales son predichas, pasarán por el optimizador, el cual encontrará el camino óptimo en términos de las variables de control [27] [6]. Es importante resaltar que MPC no es una estrategia de control sino un conjunto de métodos de control que unidos minimizan determinada función objetivo, y en base a esto plantea las señales de control. En el modelamiento del tráfico urbano existen múltiples altenativas, expuestas en la sección número cinco del presente capı́tulo. De igual manera, es destacable el trabajo realizado en [39] donde se emplea el modelo Store-and-Forward desarrollado inicial-.

(21) CAPÍTULO 2. REVISIÓN DE LITERATURA. 12. Figura 2.2: Esquema general de MPC. Tomada de [6]. mente por Gazis & Potts que permite la aplicación de técnicas de optimización lineares cuadráticas (LQ por sus siglas en inglés) altamente eficientes. En [8] [14] [1] [41] [17] se destacan el empleo del modelo METANET para el control de tráfico urbano en autopistas. En [34] [16] emplean sistemas dinámicos y lógicos mixtos (MLD por sus siglas en inglés) buscando adaptar el modelo a los sistemas computacionales actuales, facilitando el procesamiento y reduciendo el costo computacional. En [8] [7] [22] [10] [18] se plantea el modelo Store-and-Forward distribuido, buscando aliviar las situaciones de falla que se presenten en la red, planteando una red basada en relaciones de vecindad. En los sistemas de control, se parte de un punto de referencia a seguir, que corresponde al estado final al cual se desea llevar el sistema. El modelo que se emplee realizará la predicción del estado futuro, que se comparará con el punto de referencia. Esta resta producirá un error futuro, que recibirá el optimizador. Este con las restricciones y las funciones de costo brindará las señales de control, que irán al modelo de la red, comenzando de nuevo el proceso. La anterior descripción se puede apreciar en la figura 2.2..

(22) CAPÍTULO 2. REVISIÓN DE LITERATURA. 2.2.1. 13. Control distribuido: Distributed Model Predictive Control (DMPC). Algunos métodos de control de tráfico urbano adaptativo son empleados en intersecciones aisladas. Éstos métodos se conocen bajo el tı́tulo de control descentralizado [8]. El control descentralizado busca controlar intersecciones aisladas, empleando algoritmos adaptativos para tal fin. En el control descentralizado no presentamos intercambio de información entre cada uno de los dispositivos que controlan la red. Todos ellos tienen la autonomı́a de tomar sus propias decisiones, siguiendo sus estrategias de control predefinidas. El control descentralizado se suele confundir con el control distribuido. Este control distribuye por toda la red sensores cuyas señales son captadas por dispositivos locales. Este esquema requiere de un sistema de comunicaciones que permita el flujo de información entre los dispositivos a un ente central, que realiza la optimización de toda la red con base en las mediciones recibidas y devuelve a cada dispositivo la acción de control pertinente. Sin embargo, las estrategias de control centralizado no son tolerantes a la falla. Cualquier error en el sistema de comunicaciones anula la eficacia del sistema de control. Por otra parte, el control distribuido, si bien presenta un menor desempeño que el control centralizado, es más tolerante a la falla. En [7] [10] [11] se presenta el modelo S-a-F, donde se interactúa con el concepto de vecindades. Cada una de las intersecciones tiene relación directa sólo con sus ”vecinas”. El concepto de vecindad permite definir las intersecciones que influyen en una en particular, ası́ como las intersecciones que esta misma afectará. Evidentemente, un fallo en la comunicación de una intersección tendrá efectos directos sólo en aquellas intersecciones con las cuales presenta vecindad, llegando a tolerar en mayor medida la ausencia de información..

(23) CAPÍTULO 2. REVISIÓN DE LITERATURA. 2.3. 14. Algoritmos de control basados en Machine Learning. Los algoritmos basados en Machine Learning aprovechan los recursos de memoria de los dispositivos para actuar, siendo de por sı́ muy adaptativos al entorno bajo el cual se empleen, puesto que pretenden lograr que la máquina “aprenda” mediante la interacción del sistema con señales de entrada y salida de su entorno. Las principales técnicas desarrolladas en Machine Learning son: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje semisupervisado, transducción y aprendizaje por refuerzo, entre otras. Existen técnicas aplicadas de Machine Learning (ML) empleadas en control de tráfico urbano, aprovechando su flexibilidad debida al no empleo de modelo por parte de la misma. Entre ellas, se destacan el aprendizaje por refuerzo (RL). Ésta última, descrita en [4] y [42] en términos de sus componentes, que son: El aprendiz: Es la máquina o agente. Se encarga de leer el estado del entorno, ası́ como interpretar las recompensas que éste le brinde y actuar ante él. El entorno: Corresponde al ente con el cual el aprendiz interactúa. Éste recibe las acciones del agente, y se modifica de acuerdo a la acción del aprendiz. La técnica de RL se basa en aprender en base a la experiencia, bajo un esquema de ensayo y error, a diferencia de las técnicas en general de ML donde el aprendizaje se basa en el seguimiento de ejemplos tanto positivos como negativos. La técnica está dirigida por objetivos, donde el aprendiz interactúa con el entorno, realizando alguna acción sobre él. El entorno, dado un estı́mulo por la máquina, retorna una recompensa a la misma, estableciendo la retroalimentación necesaria que será interpretado por el agente para producir la siguiente acción hacia el entorno. La técnica se puede acercar a las redes de tráfico urbanas, donde el agente corresponde con el algoritmo de control implementado, y el entorno con la red de tráfico urbana. En la figura 2.3 se puede evidenciar el esquema de reinforcement learning, basado en [37]. En ML se evidencian trabajos como el de Yang, Chen, Tang y Sun en [49] planteando un esquema descentral-.

(24) CAPÍTULO 2. REVISIÓN DE LITERATURA. 15. Figura 2.3: Diagrama de Reinforcement Learning izado basado en un modelo microscópico, y los trabajos de Zhang Hong-lei et al en [19] y Gregoire et al en [29] donde exponen algoritmos basados en Q-Learning, realizando un análisis de desempeño contra los algoritmos de tiempo fijo.. 2.4. Algoritmos bioinspirados. La informática y la biologı́a sostienen dos relaciones bien definidas: la bioinformática y la bioinspiración. La bioinformática se basa en el empleo de técnicas y recursos propios de la informática en la biologı́a, con el fin de organizar, analizar y estructurar toda la información referente a moléculas biológicas, que por lo general son orgánicas, como también complejas en su estructura [44]. La bioinspiración nace del análisis de los sistemas biológicos, donde se busca simular sistemas biológicos en busca de esquemas heurı́sticos no determinı́sticos de aprendizaje, comportamiento y búsqueda, entre otros [44]..

(25) CAPÍTULO 2. REVISIÓN DE LITERATURA. 16. Estos esquemas modelan de forma aproximada diversos comportamientos y fenómenos de la naturaleza. Se caracterizan por ser no determinı́sticos, es decir, por presentar comportamientos aleatorios. Adicionalmente, pueden llegar a presentar una estructura multiagente, realizando procesos concurrentes. Además, estos algoritmos llegan a ser adaptativos, adaptándose al entorno en el cual se desenvuelven, modificando tanto el modelo como los parámetros del mismo [44]. Ejemplo de los algoritmos bioinspirados son las famosas redes neuronales, donde su gran paradigma se basa en lograr un aprendizaje automático. Relacionados al tráfico urbano se destacan los modelos basados en redes neuronales aplicados al control de trafico urbano presentados en [15] [18] [25]. Existen también algoritmos evolutivos, los cuales se basan en los principios Darwinianos de la evolución natural, donde se emplean modelos poblacionales, en el cual cada uno de los elementos representa componentes y soluciones del problema análogo. Una amplia rama se ha desarrollado alrededor de Swarm Intelligence, donde se estudian enjambres como entes colectivos, empleando sus estrategias de comportamiento para el control y modelamiento de sistemas poblacionales, tal y como se plantea en [46] [30] [32], donde se hace una analogı́a entre el problema de asignación de tiempo de verde y el problema de asignación del número de abejas dispuestas a realizar labores de búsqueda de comida, destacando también el no empleo de modelos de la red de tráfico urbana, haciéndolo factible de implementarse a gran escala. Tal y como se expone en [32], la estrategia de control bioinspirada en las colonias de abejas y su esquema de alimentación busca maximizar el flujo, minimizando los tiempos de viaje. En la tabla 2.1 se presenta un sı́mil entre la colonia de abejas y una red de tráfico urbano, adaptado de [24].. 2.5. Modelos de redes de tráfico urbano. Cuando realizamos un modelo, buscamos imitar la respuesta de una red bajo determinados parámetros de control. Una vez el modelo se ajuste a la red real podemos emplearlo para predecir sus futuros estados. Basados en las anteriores predicciones, se.

(26) 17. CAPÍTULO 2. REVISIÓN DE LITERATURA Tabla 2.1: Comparación entre los dos casos Social bee foraging. Control de tráfico. Un conjunto B de recolectores. Un conjunto de M unidades. de néctar ubicados en N áreas. de tiempo ubicadas en N fases. Un conjunto de abejas pj es. Una porción de tiempo disponible. asignado a un sitio j. λi es asignado a la fase i. Áreas floridas y secas espaci-. Demandas de tráfico cambiantes. almente distribuidas. en intersecciones espacialmente distribuidas. Un grupo de recolectores xi. Un grupo de unidades de tiempo gi es. cosecha néctar en un área dada. asignado a alguna fase de luz i. Cada área es asociada a una. Cada fase es asociada con vehı́culos. calidad variable. en una cola y al tiempo total de espera. La cantidad total de néctar co-. El tráfico durante determinada fase. lectado por una abeja depende. por unidad de tiempo depende de la. del número de abejas en el área. longitud de la cola y el tiempo total. y la calidad de la miel. asignado a cada fase. El porcentaje de colectores en. El porcentaje de tiempo asignado a. todas las áreas debe satisfacer PN j pj = 1. todas las fases debe satisfacer P i∈{3,4} gi = M k. pueden buscar caminos óptimos que lleguen al punto deseado con el menor coste posible. La función de costo puede tener diferentes variables de control, que son categorizadas en tres grandes focos: el primero corresponde a las luces de tráfico urbano, el segundo a la señalización con mensajes variables y el tercero corresponde a la señalización de las rampas de entradas a las autopistas, conocido como “ramp metering”.Si bien las redes son sistemas fı́sicos reales con variables continuas, el modelo por lo general emplea variables discretas para representarlas, que dependen del intervalo de tiempo discreto que se haya definido. [31]..

(27) CAPÍTULO 2. REVISIÓN DE LITERATURA. 18. Existen múltiples y variados modelos de redes de tráfico urbanas. En esta sección, se exponen los principales modelos, dando a conocer sus caracterı́sticas principales. Los modelos de tráfico urbano se pueden dividir en 2 categorı́as: según la topologı́a y según el nivel de detalle.. 2.5.1. Modelos de tráfico urbano según la topologı́a. Las redes de tráfico urbano también pueden ser subdivididas en redes y autopistas. Cuando nos referimos a una red de tráfico urbano, estamos hablando de múltiples vı́as e intersecciones con capacidades muy semejantes. Cuando alguna de estas vı́as presenta una capacidad de tráfico considerablemente mayor e influyente en la red de tráfico urbano, comenzamos a hablar de tráfico de autopista. Gran cantidad de las estrategias de control se han desarrollado para este tipo de tráfico. Sin embargo, existen estudios en los cuales se integran los dos modelos. Este es el caso presentado en [18], donde los dos modelos se presentan independientes para después intercambiar información y presentar resultados conjuntos. En [18] se muestran resultados destacables, mostrando una mejora del 30% sobre el no aplicar ninguna estrategia de control. A continuación se expone más a fondo los modelos basados en autopistas y en redes.. Modelos basados en autopistas Las autopistas hoy en dı́a son vı́as de tráfico masivo, que alivian las congestiones de las redes circundantes, presentando una alternativa en lo posible rápida y de mayor prioridad que el resto de la red. Con ellas, se busca generar un espacio de movilización masivo entre distancias considerablemente largas. Por lo general, se emplean modelos de tráfico macroscópicos para representarlas. En [41] [18] [8] [3] se desarrollan modelos macroscópicos para tráfico en autopistas. En los modelos macroscópicos se destaca el control por medio de Ramp Metering. Ramp Metering busca comprometer el desempeño de las rampas de entrada aprovechando su.

(28) CAPÍTULO 2. REVISIÓN DE LITERATURA. 19. capacidad, evitando saturar la autopista. En estos modelos, el control es realizado por medio de semáforos, principalmente. En [18] [50] [14] [12] [48] se exponen diferentes modelos y aplicaciones basados en ramp metering. Modelos basados en redes Los modelos basados en redes representan vı́as paralelas y perpendiculares con recursos muy similares. Se caracterizan por presentar múltiples vı́as dispuestas en serie y en paralelo, como también por estar compuestas por unidades básicas denominadas intersecciones. Suelen entrar en la categorı́a de modelos macroscópicos, como se puede observar en [1] [20] [47] [2].. 2.5.2. Modelos de tráfico urbano según el nivel de detalle. Los modelos de redes de tráfico urbanos se pueden dividir en tres categorı́as principales: macroscópico, mesoscópico y microscópico [31]. Los tres difieren en el nivel de abstracción con el cual se considere la red. Los modelos microscópicos consideran la existencia de cada uno de los actores individuales ası́ como las interacciones y caracterı́sticas de la red en la cual se desenvuelven [28]. Los modelos macroscópicos corresponden a esquemas menos especı́ficos, y buscan representar la red mediante un modelo de flujos, haciendo en múltiples ocasiones alusión a la hidrodinámica [43]. Aprovechando los beneficios de ambos esquemas, los modelos mesoscópicos buscan integrar caracterı́sticas macroscópicas y microscópicas.. • Los modelos macroscópicos son empleados con el fin de reducir la carga computacional, puesto que han sido pensados para controlar redes de tráfico de gran. extensión [31]. Entre los principales modelos encontramos TRANSYT-7F, FREFLO, NETVACI, KRONOS, AUTOS, METANET y METACOR [24].. • Los modelos mesoscópicos son una aproximación intermedia entre los modelos. macroscópicos y microscópicos. Su principal caracterı́stica es la adquisición de.

(29) CAPÍTULO 2. REVISIÓN DE LITERATURA. 20. los beneficios de ambos. Sin embargo, considera un nivel de detalle intermedio entre los modelos macroscópicos y microscópicos . Un modelo mesoscópico puede considerar el análisis por grupos de vehı́culos, por ejemplo. Entre sus principales representantes se encuentran DYNAMIT, INTEGRATION, METROPOLIS y DINASMART [24] [31].. • Los modelos microscópicos corresponden al nivel más detallado de análisis de la red, llegando a considerar cada vehı́culo de la red como un ente con caracterı́sticas definidas, relacionados con la infraestructura de la red o con otros vehı́culos adyacentes. Con ellos, se busca modelar los comportamientos humanos en la red, haciéndolos complejos y costosos de implementar. Entre los principales modelos se destacan INTRAS, FRESIM, NETSIM, THOREAU, FLEXSYT-II Y AIMSUM [24]..

(30) Capı́tulo 3 Distributed Model Predictive Control DMPC ha sido ampliamente empleado en redes lineales y dinámicas. Por su carácter general, DMPC no sólo ha sido empleado en el control de tráfico urbano adaptativo. Mercangöz y Doyle [26] lo han empleado para el control de procesos, ası́ como Talukdar et al [36] en sistemas de potencia eléctricos. Dunbar [9] and Murray y Keviczky et al [38] presentan un DMPC para redes distribuidas basado en sistemas dinámicos no lineales desacoplados. Li et al [35], por su parte plantea DMPC para sistemas lineales sin restricciones, buscando como objetivo un equilibrio de Nash, o un punto fijo como también es llamado. Manikonda et al [40] ha presentado un modelo dinámico para la longitud de las colas, ası́ como un control distribuido basado en agentes, muy similar al propuesto en este documento. Eduardo Camponogara ha realizado un reconocido trabajo en Distributed Model Predictive Control (DMPC) [7] [10] [11] [45]. Para describir su trabajo, se ha dividido en tres la descripción del controlador. En la primera sección se describe el modelo empleado para predecir el futuro estado del sistema basado en el modelo propuesto. En la segunda sección se aborda el problema de optimización que se plantea para resolver el sistema, ası́ como la función objetivo empleada para tal fin. En la tercera sección se describe cómo el modelo es implementado por medio de simulaciones en la interfaz VISSIM -MATLAB. 21.

(31) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.1. 22. Descripción del Modelo para redes distribuidas. El sistema se modela por medio de grafos dirigidos, donde cada uno de los M nodos representa un subsistema, basándose en el modelo Store-and-Forward presentado por Papageorgiou et al en [5]. Cada uno de los subsistemas cuenta con vector de estado xk que representa el número de vehı́culos en las vı́as definidas entre cada una de las intersecciones (colas) y un vector de control uk en el cual se indican los tiempos de verde. El grafo dirigido puede ser descrito como G = {V, E}, donde V = {1, 2, . . . , M } repre-. senta el conjunto de vértices del grafo, llamados previamente subsistemas. El conjunto E ⊆ V × V representa los arcos que hay entre cada uno de los vértices. El concepto de vecindad se explica de la siguiente forma: si un arco (i, j) ∈ E implica que el vértice i. tiene efectos directos en el estado futuro del subsistema j. Las colas que controla cada intersección corresponden a las colas que llegan a la misma, y son descargadas gracias a los grupos de señales que se definan para cada intersección. Sin embargo, las colas por las cuales los vehı́culos salen de la intersección también son afectadas puesto que se llenan a medida que las colas que llegan a la intersección se vacı́an. Basados en una dinámica en tiempo discreto, se presenta la ecuación de estado para cada uno de los subsistemas como:. xm (k + 1) = Am xm (k) +. X. Bmi ui (k). (3.1). i∈I(m). Donde I(m) = {m} ∪ {i : (i, m) ∈ E} es el conjunto de subsistemas que afectan el subsistema m, incluyéndose también él mismo. Am es una matriz identidad, y Bmi es. la matriz que contiene la tasa de entrada y salida de las colas que se modelan para cada subsistema m. La matriz Bmi se construye a partir de los parámetros de las colas de las vecindades y de las propias, en términos de sus flujos de saturación y tasas de giro. Los valores de la diagonal de B son negativos, indicando un flujo de salida, y los demás son positivos, indicando un flujo de entrada..

(32) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.1.1. 23. Formulación compacta. Como se puede apreciar en la ecuación 3.1, el estado siguiente de cada subsistema depende de su estado previo. Por obvias razones, la ecuación 3.1 es una restricción de estado del problema de optimización que se plantee, independiente del ı́ndice de desempeño. Una forma de simplificar la función de objetivo se presenta en la ecuación 3.2.. xm (k + 1) =. Akm xm (0). +. k X X l=1 i∈I(m). Al−1 m Bmi ui (k − l). (3.2). En la ecuación 3.2 se elimina la dependencia del estado anterior, expresando el estado previo en términos de las matrices pasadas Am y de los tiempos de verde de cada cola. Es pertinente aclarar que en este caso todas las matrices Am son matrices identidad. A partir de esto, resulta conveniente definir los siguientes hı́per vectores e hı́per matrices: x̄m , ūm , Ām , y B̄mi ,   A  m um (0) xm (1) A2     .   m ..  ..  ūm =  Ā = x̄m =   .  m      ...    um (T − 1) xm (T ) ATm . . . . (3.3). Donde T es el horizonte de predicción, que en este caso se establece de acuerdo a los escenarios de simulación en 3, 5, 8 y 10. También es conveniente representar Bmi de forma compacta, tal y como se indica en la ecuación 3.4.

(33) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. . B̄mi. Bmi. 0. .... 0. 0. .  0    0   ... 0   . . . Bmi.   Am Bmi Bmi 0   .. .. .. = . . .  AT −2 B T −4 T −3 mi Am Bmi Am Bmi  m ATm−1 Bmi ATm−2 Bmi ATm−3 Bmi. 24. ... .. .. (3.4). Donde 0 representa una matriz de ceros de la dimensión apropiada. Con los vectores definidos en 3.3, podemos reescribir la dinámica del sistema, tal y como se muestra en 3.5 X. x̄m = Ām xm (0) +. B̄mi ūi. (3.5). i∈I(m). 3.2. Función de Costo cuadrática. La función de costo penaliza los cuadrados de las diferencias entre los controles y los estados. Una restricción de igualdad modela la dinámica del sistema, otra limita la suma de tiempos de cada grupo de señales al tiempo de verde del ciclo. Las restricciones de desigualdad modelan las limitaciones mı́nimas de tiempo de verde, que se ha establecido en 10. En la ecuación 3.6 se aprecia la función de costo.. P = min. M X T X 1 m=1 k=1. 2. M X T −1 X. 0. xm (k) Qm xm (k) +. um (k)0 Rm um (k). m=1 k=0. Sujeto a: xm (k + 1) = Am xm (k) +. P. i∈I(m). Cm um (k) ≥ cm Dm um (k) = dm. Bmi ui (k). (3.6).

(34) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 25. Donde Qm Y Rm son matrices semidefinidas positiva que se escogen dependiendo de la relevancia que se le de a cada esfuerzo de control o cambios en el estado. La función de costo anterior puede simplificarse y compactarse en base a los vectores expuestos en la ecuación 3.3 y en la dinámica compacta mostrada en 3.5. Expresando la función de costo en términos de las expresiones compactas y de las matrices obtenemos la expresión de la ecuación 3.7:. 1 x̄m (k)0 Q̄m x̄m (k) + ūm (k)0 R̄m ūm (k) 2. (3.7). Donde se obtiene la matriz Q̄m = In ⊗Qm en términos del producto de Kronecker, donde. In es una matriz de identidad de dimensión adecuada. Reemplazando la ecuación 3.5 en 3.7 y operando se obtiene la ecuación 3.8 X 1 Pb = xm (0)0 Ā0m Q̄m Ām xm (0) + xm (0)0 Ā0m Q̄m B̄mi ūi + 2. (3.8). i∈I(m). 1 X 2. X. i∈I(m) j∈I(m). 3.3. 1 0 ū0i B̄mi Q̄m B̄mj ūj + ū0m R̄m ūm 2. Planteamiento del algoritmo distribuido. El principal objetivo al plantear el algoritmo distribuido es diseñar funciones de costo para cada uno de los subsistemas, donde la unión de cada función objetivo y de las restricciones locales enuncien el problema de optimización planteado en la ecuación 3.6. en la ecuación 3.9 se presenta la descomposición de la función de costo planteada en 3.8 1 Pbm = 2. X. 0 ūm + ū0i Hmij ūj + gmm. (i,j)∈C(m). 1 X 2 ¯. X i∈I(m). X. k∈I(m) (i,j)∈C(m,k). ū0i HKij ūj. 0 gim ūm +. (3.9).

(35) 26. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL Sujeto a: C̄m ūm ≥ c̄m D̄m ūm ≥ d¯m Donde es pertinente definir los siguientes conjuntos y vectores:.   d0  m d0   m d¯m =  .   ..    d0m.   c0  m c0   m c̄m =  .   ..    c0m. C̄m = In ⊗ Cm. D̄m = In ⊗ Dm. C(m) = {(i, j) ∈ I(m) × I(m) : i = m or j = m}. C(m, k) = {(i, j) ∈ I(k) × I(k) : i = m or j = m} ¯ I(m) = {i : m ∈ I(i), i 6= m}. (3.10). Es importante destacar que las matrices C(m) y C(m, k) son claves en el modelamiento distribuido. La matriz C(m) define la vecindad de 1 sola intersección indicando como se afectan entre sı́ las intersecciones (parejas). C(m, k) indica la vecindad del link que hay entre m y k. Si C(m, k) existe, hay un link entre m y k, siguiendo la dirección: del subsistema m al subsitema k. En la ecuación 3.9 se observa que la formulación del problema de optimización no se encuentra en forma estándar. Para llegar a ella, es necesario definir las matrices presentadas en 3.11 0 Q̄m Ām xm (0) gmi = B̄mi 0 Hmij = B̄mi Q̄m B̄mj. i ∈ I(m). i, j ∈ I(m), i 6= m, o j 6= m. 0 Q̄m B̄mm + R̄m Hmmm = B̄mm. c̄m = [c0m , . . . , c0m ]0 d¯m = [d0m , . . . , d0m ]0. (3.11).

(36) 27. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. Con las anteriores matrices definidas en 3.11 podemos definir las matrices expuestas en 3.12 gm =. +. 1 2. X. 0 (Hmim + Hmmi ) + gmm. (i,m)∈C(m):i6=m. 1 X 2 ¯. X. 0 + Hkmi )ūi (Hkim. (3.12). k∈I(m) (i,m)∈C(m,k):i6=j. +. X. gkm. ¯ k∈I(m). Hm = Hmmm +. X. Hkmm. ¯ k∈I(m). Con las anteriores definiciones, podemos formular el problema de optimización cuadrático de una forma más simple y organizada, tal y como se muestra en 3.13. Note que la función objetivo ahora es mono-objetivo. Ésto fue posible cuando quitamos la dependencia del estado anterior, y calculando todo en términos de los vectores de tiempo.. 1 0 Pbm = ū0m Hm ūm + gm ūm 2. (3.13). s.t. : C̄m ūm ≥ c̄m D̄m ūm ≥ d¯m. 3.4. Planteamiento para cuatro intersecciones. Como primer paso, se describe el procedimiento a seguir para implementar el algoritmo en la red mostrada en la figura 4.1. Ella consta de cuatro intersecciones, conectadas entre sı́ por un carril unidireccional. Cada una de las intersecciones se han numerado de 1 a 4, con el fin de definir 4 subsistemas. Adicionalmente, se numeran las vı́as que existen, definiendo xs como la vı́a que comunica dos intersecciones. Estas vı́as numeradas.

(37) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 28. x2 ←− 1. 2. ←−. ←−. ←−. x3. x1. x4. 4. 3. ←− x5. Figura 3.1: Red de cuatro intersecciones corresponden a las vı́as que tienen semaforización. Aquellas que no tengan numeración ni señalización deben asumirse como vı́as de salida o entradas no controladas al sistema. A continuación se listan uno a uno los pasos que se deben seguir para realizar la implementación de DMPC.. ¯ 1. Definir conjuntos I(m), I(m), C(m), C(m, k) 2. Definir matrices Bmi 3. Definir el vector inicial de control um (0) (tiempos de verde) de cada subsistema. 4. Definir el estado xm (0) del sistema, es decir, las colas de cada intersección. 5. Construir formulación compacta para x̄m , ūm , Ām , B̄mi , Q̄m , R̄m , C̄m , D̄m 6. Basado en la formulación compacta, se formulan Hmij , gmi , gmm para luego obtener gm y Hm 7. Enunciar la dinámica en términos de espacio de estados, empleando las matrices definidas en pasos previos. 8. Plantear el problema de optimización en términos de la formulación compacta obtenida en el numeral 8 y ūm.

(38) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 29. 9. Se resuelve el problema cuadrático dependiendo del método de optimización escogido. 10. Predecir todos los xm (k) para k ∈ [0, T ] Los anteriores pasos resultan una guı́a básica para la formulación de DMPC, sin embargo, ignora demás procesos que han de tenerse en cuenta en la simulación basada en la plataforma VISSIM - MATLAB bajo la cual se trabaja. A continuación, se detalla cada uno de los pasos para un caso base de 4 intersecciones. Para posteriores análisis se realiza el mismo procedimiento, obviando su desarrollo detallado, presentándolo sólo para la red de cuatro intersecciones.. 3.4.1. Paso número 1: definición de conjuntos. I(m) puede entenderse como el conjunto de intersecciones que afectan el subsistema m, incluyendo el subsistema m también en el conjunto. Entonces, se definen cada uno de los conjuntos como se muestra en la ecuación 3.14. I(1) = {1, 2}. I(2) = {2, 3, 4} I(3) = {1, 3}. (3.14). I(4) = {3, 4} ¯ Ahora, es pertinente definir I(m), entendiéndolo como las intersecciones sobre las cuales el subsistema m tiene efecto, sin incluir el subsistema m. Para cada una de los subsistemas, se definen los subconjuntos, tal y como se muestra en la ecuación 3.15.

(39) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. ¯ = {3} I(1) ¯ = {1} I(2). ¯ = {2, 4} I(3) ¯ = {2} I(4). 30. (3.15). Se definen los conjuntos C(m) que corresponden a los pares de términos cuadráticos que dependen de ūm , para este caso especı́fico las vı́as que ingresan al subsistema, ası́ como del subsistema m en sı́ mismo. Los conjuntos se presentan en 3.16. C(1) = { (1, 1), (1, 2), (2, 1) }. C(2) = { (2, 2), (2, 3), (2, 4) , (3, 2), (4, 2) } C(3) = {(3, 1), (3, 3), (1, 3) }. (3.16). C(4) = {(4, 3), (4, 4), (3, 4)}. Se definen los conjuntos C(m, k) que corresponden a los pares de términos cuadráticos que dependen de ūm , para este caso especı́fico las vı́as que salen del subsistema, ası́ como del subsistema m en sı́ mismo. Los conjuntos se presentan en 3.17. C(1, 3) = {(1, 1), (1, 3), (3, 1)} C(2, 1) = {(2, 1), (2, 2), (1, 2)}. C(3, 2) = {(3, 2), (3, 3), (3, 4), (4, 3), (2, 3)} C(3, 4) = {(3, 3), (3, 4), (4, 3)}. C(4, 2) = {(4, 2), (4, 3), (4, 4), (3, 4), (2, 4)}. (3.17).

(40) 31. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.4.2. Paso número 2: definición de matrices Bmi. Las matrices Bmi se encargan de modelar la red. Estas se basan en el modelo Store-AndForward presentado por Papageorgiou en [5]. Al basarnos en un esquema distribuido, se deben definir cada una de las matrices para cada intersección de manera independiente. El número de matrices está dictado por la relación de vecindad: el número de matrices corresponde a la dimensión del vector I(m). Las matrices Bmi donde m = i representan los flujos de salida de una intersección, por lo cual son modelados negativos. Estos flujos de salida dependen del valor del tiempo de discretización τ , el tiempo de ciclo C, y el valor del flujo de saturación Sj de la lı́nea. El flujo de saturación se calcula en base a los flujos de entrada y salida de la intersección en cuestión ası́ como de los flujos de entrada y salida de bahı́as de parqueo. Cuando tenemos matrices Bmi donde m 6= i estamos. modelando el llenado de las colas. Adicionalmente a los términos introducidos en el caso de m = i, se debe adicionar la probabilidad de giro de una vı́a a otra, denotada por ρi,j , comprendida entre cero y uno.. Definición de matrices Bmi para la intersección número 1 Como se mencionó en la descripción, se definen matrices dependiendo de cada caso allı́ enunciado. Para la intersección número uno, se presentan las matrices en 3.18. B11 = τ. . −Sx2 C. . B12 = τ ρx3 ,x2 SCx1. ρx4 ,x2. Sx4 C. . (3.18). Definición de matrices Bmi para la intersección número 2 A continuación se definen las matrices Bmi para la intersección número dos y se presentan en 3.19. B22 = τ. −Sx3 C. 0. 0. −Sx4 C. ! B23 = τ. ρx1 ,x3 0. Sx1 C. ! B24 = τ. !. 0 ρx5 ,x4. Sx5 C. (3.19).

(41) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 32. Definición de matrices Bmi para la intersección número 3 A continuación se definen las matrices Bmi para la intersección número tres y se presentan en 3.20. B33 = τ. . −Sx1 C. . B31 = τ ρx2 ,x1 SCx2. (3.20). Definición de matrices Bmi para la intersección número 4 A continuación se definen las matrices Bmi para la intersección número cuatro y se presentan en 3.21. B44 = τ. 3.4.3. . −Sx5 C. . B43 = τ ρx1 ,x5 SCx1. (3.21). Paso número 3: definición del vector inicial de control um (0). El vector inicial de control se define a criterio del programador. Al no tener certeza del estado de la red, se asume un control con señales constantes, donde cada uno de los tiempos de verde de las vı́as tiene un valor fijo. Para esta situación, se ha definido un tiempo de verde para cada una de las intersecciones. Se debe garantizar que los vectores de control definidos estén dentro del conjunto factible definido por las restricciones del problema de optimización. En este caso, la primera restricción dicta un tiempo de verde mı́nimo de 10 segundos y un tiempo máximo de 90 segundos. La segunda restricción indica que la suma de los tiempos de verde de todas las fases, que debe ser igual a 90. Considerando ésto, los vectores de control inicial se aprecian en 3.22 u1 (0) = 90. u2 (0) =. ! 45 45. u3 (0) = 90. u4 (0) = 90. (3.22).

(42) 33. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.4.4. Paso número 4: definir el estado xm (0) del sistema. Para definir el estado inicial de las colas del sistema, se pueden plantear diferentes escenarios, seleccionados en función de los objetivos buscados. Para este caso, se ha definido un estado inicial de 0 vehı́culos por intersección, obteniendo los estados iniciales mostrados en 3.23. x1 (0) = 0 x2 (0) = 0 x3 (0) = 0 x4 (0) = 0. 3.4.5. (3.23). Paso número 5: construcción de la formulación compacta. Para realizar la formulación compacta, nos remontamos a las ecuaciones mostradas en 3.3 y 3.4. Hay que recordar que las matrices A son matrices identidad y son ignoradas pues no representan modificaciones en el sistema. Según la formulación presentada en los pasos anteriores, en 3.24 se presentan las matrices y vectores para este caso.. .  x1 (1)  .  .  x̄1 =   .  x1 (110). . 110×1. .  u1 (0)  .  .  ū1 =   .  u1 (109).  x2 (1)  .  .  x̄2 =   .  x2 (110). . 110×1. . 110×1.  u2 (0)  .  .  ū2 =   .  u2 (109).  x3 (1)  .  .  x̄3 =   .  x3 (110). . 110×1. . 110×1.  u3 (0)  .  .  ū3 =   .  u3 (109).  x4 (1)  .  .  x̄4 =   .  x4 (110). 110×1. . 110×1.  u4 (0)  .  .  ū4 =   .  u4 (109). 110×1.

(43) 34. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. . B̄11. 0. 0.  B11 B11 0   . .. .. =  .. . .  B  11 B11 B11 B11 B11 B11. . B̄22. B11. B22. 0. 0.  B22 B22 0   . .. .. =  .. . .  B  22 B22 B22 B22 B22 B22. .... 0. .  0    0   ... 0   . . . B11. ... .. .. B̄12. B12 B12 B12. 110×110. .... 0. .  0    0   ... 0   . . . B22 ... ....  B12 0 0  B12 B12 0   . .. .. =  .. . .  B  12 B12 B12. B̄23. 220×220.  B23 0 0  B23 B23 0   . .. .. =  .. . .  B  23 B23 B23 B23 B23 B23. .... 0. .  0    0   ... 0   . . . B12 ... .. .. .... 0. 110×220. .  0    0   ... 0   . . . B23 ... .... 220×110. (3.24). B̄33.  B33 0 0  B33 B33 0   . .. .. =  .. . .  B  33 B33 B33 B33 B33 B33. B̄44.  B44 0 0  B44 B44 0   . .. .. =  .. . .  B  44 B44 B44 B44 B44 B44. .... 0. .  0    0   ... 0   . . . B33. ... .. .. B̄31. B31 B31 B31. 110×110. .... 0. .  0    0   ... 0   . . . B44. ... .. .. 110×110.  B31 0 0  B31 B31 0   . .. .. =  .. . .  B  31 B31 B31. B̄43.  B43 0 0  B43 B43 0   . .. .. =  .. . .  B  43 B43 B43 B43 B43 B43. .... 0. .  0    0   ... 0   . . . B31 ... .. .. 110×110. .... 0. .  0    0   ... 0   . . . B43 ... .. .. 110×110. Para definir las matrices Q̄m y R̄m , se asumen que son matrices identidad multiplicadas por un factor de peso que variará entre cero y uno. En los pasos siguientes, cuando se formule la función objetivo, se podrá observar lo anteriormente mencionado. Es necesario definir las matrices Cm y Dm para cada uno de los casos, que incluirán las.

(44) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 35. restricciones a cada uno de los problemas enunciados. Cm no es necesario usarlo, por ende solo se trabajará con la restricción de igualdad, que modela el tiempo máximo de verde por intersección. Por ello, Dm corresponde a un vector de unos, tal y como se observa en 3.26. (3.25). D1 = [1] D2 = [11] D3 = [1] D4 = [1]. Definiendo el vector dm de la misma forma. (3.26). d1 = [60] d2 = [30 30] d3 = [60] d4 = [60]. En cuanto a las matrices D̄m , se resuelve el producto de Kronecker, tal y como se observa en 3.27.  1  0  D̄1 =  .  ..  0.  1  0  D̄2 =  .  ..  0. 0 ... 1 ... .. . . . . 0 ....  0 ... 0  1 . . . 0   .. . . . 0 .  0 ... 1.  0  0   0  1. 110×110. 110×110.  1  0  ⊗ [1] =  .  ..  0.  1  0  ⊗ [1 1] =  .  ..  0. 0 ... 1 ... .. . . . . 0 ....  0  0   0  1. 110×110. 1 0 0 ... 0 0. .  1 . . . 0 0   .. . . . 0 0 .  0 0 0 ... 1 1 0 .. .. 1 .. .. 110×220. (3.27).

(45) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. . 1  0  D̄3 =  .  .. . 0 ... 1 ... .. . . . .. 0 0 .... . 1  0  D̄4 =  .  .. . 0 ... 1 ... .. . . . .. 0 0 ....  0  0   0  1. 110×110.  0  0   0  1. 110×110.  1  0  ⊗ [1] =  .  ..  0  1  0  ⊗ [1] =  .  ..  0. 0 ... 1 ... .. . . . . 0 ... 0 ... 1 ... .. . . . . 0 .... 36.  0  0   0  1. 110×110.  0  0   0  1. 110×110. Ahora es necesario definir los vectores d̄m = [d0m . . . d0m ]0.   90   90   d̄1 =  .   ..    90. 110×1. 3.4.6.   90   90   d̄2 =  .   ..    90. 220×1.   90   90   d̄3 =  .   ..    90. 110×1.   90   90   d̄3 =  .   ..    90. (3.28). 110×1. Paso número 6: formulación de Hmij , gmi , gmm para luego obtener gm y Hm. Basada en las definiciones previas, se formulan las matrices Hmij.

(46) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 37. 0 0 H121 = B̄12 Q̄1 B̄11 = q B̄12 B̄11 0 0 H112 = B̄11 Q̄1 B̄12 = q B̄11 B̄12 0 0 H223 = B̄22 Q̄2 B̄23 = q B̄22 B̄23 0 0 H224 = B̄22 Q̄2 B̄24 = q B̄22 B̄24 0 0 H232 = B̄23 Q̄2 B̄22 = q B̄23 B̄22 0 0 H242 = B̄24 Q̄2 B̄22 = q B̄24 B̄22. (3.29). 0 0 H331 = B̄33 Q̄3 B̄31 = q B̄33 B̄31 0 0 H313 = B̄31 Q̄3 B̄33 = q B̄31 B̄33 0 0 H443 = B̄44 Q̄4 B̄43 = q B̄44 B̄43 0 0 Q̄4 B̄44 = q B̄43 B̄44 H434 = B̄43. Como se puede apreciar en 3.29, las matrices Q̄m se reemplazan por un factor externo común que representa la penalización en el cambio del vector de estados. Para este caso, q = 0.5. Basada en las definiciones previas, se formulan las matrices gmi , teniendo en cuenta la misma consideración para Q̄m y asumiendo Ām como matrices identidad.. 0 0 x1 (0) Q̄1 Ā1 x1 (0) = q B̄11 g11 = B̄11 0 0 g12 = B̄12 Q̄1 Ā1 x1 (0) = q B̄12 x1 (0) 0 0 x2 (0) Q̄2 Ā2 x2 (0) = q B̄22 g22 = B̄22 0 0 g23 = B̄23 Q̄2 Ā2 x2 (0) = q B̄23 x2 (0) 0 0 g24 = B̄24 Q̄2 Ā2 x2 (0) = q B̄24 x2 (0). g31 = g33 =. 0 B̄31 Q̄3 Ā3 x3 (0) 0 B̄33 Q̄3 Ā3 x3 (0). = =. (3.30). 0 x3 (0) q B̄31 0 q B̄33 x3 (0). 0 0 g43 = B̄43 Q̄4 Ā4 x4 (0) = q B̄43 x4 (0) 0 0 g44 = B̄44 Q̄4 Ā4 x4 (0) = q B̄44 x4 (0). Basada en las definiciones previas, se formulan las matrices gm . No se desarrollan explı́citamente por su gran extensión, sin embargo, se enuncian sus parámetros.. 1 0 1 0 + H112 )ū2 + g11 + (H331 + H313 )ū3 + g31 g1 = (H121 2 2.

(47) 38. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. g2 =. 1 X 1 0 0 (H2i2 + H22i )ūi + g22 + (H112 + H121 )ū1 + g12 2 2. (3.31). i={3,4}. 1 X 1 0 + H331 )ū1 + g33 + g3 = (H313 2 2. X. 0 (Hki3 + Hk3i )ūi + g23 + g43. k={2,4} (i,3)∈C(3,k). 1 X 1 0 0 + H443 )ū4 + g44 + (H2i4 + H24i )ūi + g24 g4 = (H434 2 2 i={3,2}. Basada en las definiciones previas, se formulan las matrices Hm . No se desarrollan explı́citamente por su gran extensión, sin embargo, se enuncian sus parámetros. Es necesario definir primero las matrices Hmmm. 0 0 B̄11 + R̄1 Q̄1 B̄11 + R̄1 = q B̄11 H111 = B̄11 0 0 H222 = B̄22 Q̄2 B̄22 + R̄2 = q B̄22 B̄22 + R̄2 0 0 B̄33 + R̄3 Q̄3 B̄33 + R̄3 = q B̄33 H333 = B̄33. (3.32). 0 0 H444 = B̄44 Q̄4 B̄44 + R̄4 = q B̄44 B̄44 + R̄4. H1 = H111 + H311 H2 = H222 + H222 H3 = H333 + H233 + H433. (3.33). H4 = H444 + H244. 3.4.7. Paso número 7: definición de la dinámica del sistema. Una vez modelado el sistema con Store-and-Forward, se procede a enunciar la dinámica de cada uno de los subsistemas. Basados en la dinámica expuesta en 3.2, se formulan las dinámicas para cada una de las intersecciones, tal y como se muestra en 3.34 x1 (k + 1) = x1 (0) +. k X X l=1 i∈{1,2}. B1i ui (k − l).

(48) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. x2 (k + 1) = x2 (0) +. k X X l=1 i∈{2,3,4}. x3 (k + 1) = x3 (0) +. k X X l=1 i∈{1,3}. x4 (k + 1) = x4 (0) +. k X X l=1 i∈{3,4}. 3.4.8. B2i ui (k − l). 39. (3.34). B3i ui (k − l) B4i ui (k − l). Paso número 8: plantear el problema de optimización en términos de la formulación compacta. En los anteriores pasos, se observa el desarrollo de cada una de las matrices necesarias para formular el problema de optimización. en 3.35 se muestran cada uno de los problemas de optimización. P̂1 = min 12 ū01 H1 ū1 + g10 ū01 s.a. D̄1 ū1 ≥ d¯1 P̂2 = min 12 ū02 H2 ū2 + g20 ū02 s.a. D̄2 ū2 ≥ d¯2 P̂3 = min 12 ū03 H3 ū3 + g30 ū03 s.a. D̄3 ū3 ≥ d¯3 P̂4 = min 12 ū04 H4 ū4 + g40 ū04 s.a. D̄4 ū4 ≥ d¯4. (3.35).

(49) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.4.9. 40. Paso número 9: solución del problema cuadrático. Para solucionar el problema cuadrático, existen diferentes métodos. En [45] se expone el método de direcciones factibles y programación cuadrática. El énfasis en este punto afecta el desempeño temporal del controlador. En [45] se aprecia un considerable beneficio temporal empleando programación cuadrática sobre el método basado en direcciones factibles. En los análisis presentados en secciones posteriores, la optimización se realiza con ayuda de la función quadprog de MATLAB, empleando el método del punto interior para alcanzar el óptimo. En esta formulación con quadprog es fácil adaptar las restricciones de valores mı́nimos y máximos de tiempos de verde, teniendo vectores independientes para modelarlas. Por esta razón se pudo ignorar el planteamiento de C̄m en la formulación del problema de optimización.. 3.4.10. Paso número 10: predicción de todos los xm (k) para k ∈ [0, T ]. Una vez se cuente con la dinámica de cada uno de los subsistemas se procede a realizar la predicción a lo largo de todo el horizonte de predicción basados en las ecuaciones 3.34. T en este caso se ha establecido en 110, con un tiempo de discretización de 1 segundo. Este paso es totalmente mecánico y depende de cada proceso controlado..

(50) Capı́tulo 4 Enunciado del Problema Es totalmente necesario ajustar los casos simulados a los presentes en el dı́a a dı́a de nuestro entorno. Si bien se sabe, el estudio y desarrollo de algoritmos de control busca que todo resultado obtenido sea implementado, empleando sus ventajas en beneficio de todo aquel que tenga contacto con el sistema. Para esto, es de vital importancia conocer la planta que ha de ser controlada, con el fin de ajustar los diferentes parámetros del sistema de control conforme a la información obtenida. Si la planta se comporta de acuerdo a su modelamiento, el control será totalmente decisivo en el comportamiento del sistema, logrando el desempeño que se buscaba cuando se pensó en implementar la estrategia de control. Sin embargo, fuera del papel la situación es diferente. En general, los modelos que emplea el algoritmo de control difieren de la planta real, generando una respuesta fuera de los parámetros establecidos en un principio. En estos casos donde el algoritmo de control supervisa el estado de una planta real, es necesario realizar ajustes en los parámetros que modelan la planta, acercándose cada vez más a la respuesta deseada del sistema. En cuanto al control de tráfico urbano, el modelo Store-and-Forward presentado por Papageorgiou en [5] es empleado para modelar la red de tráfico urbana. Como se dijo en el párrafo anterior, este modelo necesita ajustes si ha de ser llevado a la vida real. Con propósitos académicos, se definen parámetros que probablemente no corresponden con la red simulada, sin embargo permiten dilucidar el desempeño de los algoritmos 41.