• No se han encontrado resultados

Control de tráfico urbano - implementación de algoritmo de control

N/A
N/A
Protected

Academic year: 2020

Share "Control de tráfico urbano - implementación de algoritmo de control"

Copied!
92
0
0

Texto completo

(1)PROYECTO FIN DE CARRERA Presentado a LA UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA. Para obtener el tı́tulo de INGENIERO ELÉCTRICO por Iván Felipe Gutiérrez Delgado. CONTROL DE TRÁFICO URBANO: IMPLEMENTACIÓN DE ALGORITMO DE CONTROL. Sustentado el 5 de diciembre de 2012 frente al jurado: Composición del jurado. Asesor: Cosesor: Jurado:. Nicanor Quijano Silva Ph.D, Profesor asociado, Pontificia Universidad Javeriana - Ohio State University Pablo Andrés Ñañez Ojeda Ph.D Student, Universidad de Los Andes - University of Arizona Eduardo Mojica Nava Ph.D, Universidad de Los Andes - École des Mines de Nantes.

(2) Resumen. Distributed Model Predictive Control es empleado para controlar el tráfico urbano de una red enmallada. Se simulan controladores Basados en Model Predictive Control, Distributed Model Preditive Control y Replicator Dynamics bajo diferentes escenarios de tráfico, empleando VISSIM y MATLAB para tal fin. Se implementa un esquema Hardware-in-the-Loop, basándose en la plataforma tecnológica de control de tráfico urbano disponible bajo el proyecto de cooperación Uniandes - IMATIC..

(3) A todos aquellos que hacen parte de mi vida, a mi padre, Eliseo y a mis hermanos, César y Diego..

(4) Agradecimientos Durante los últimos años, muchas personas han creı́do en mı́. Quiero agradecer la oportunidad de estudiar en la Universidad de los Andes, a todos aquellos que hicieron la beca Quiero Estudiar una hermosa realidad. de igual manera, a Carlos Angulo Galvis, ex rector de la Universidad de los Andes por todos los esfuerzos y apoyos a los becarios. Gracias por creer en mı́, y en mis capacidades. Quisiera agradecer el incondicional apoyo y ayuda de Ángela Marı́a Patiño Gómez, coordinadora del Centro de Atención Decanatura de Estudiantes (CADE), de su mano tracé mi trayectoria profesional. Gracias por creer en mı́ y acogerme, gracias por hacerme sentir como tu hijo. Quisiera expresar mi gratitud especialmente a Pablo Ñañez y Nicanor Quijano, mis asesores de tesis. Lo que he aprendido de ustedes dos es invaluable. Muchas gracias por todo lo que me han enseñado, criticado y corregido. Es un honor trabajar con gente tan admirable. No sólo ellos han creı́do en mı́. Mi mamá, Martha Cecilia Delgado y mi papá Eliseo Gutiérrez lo han hecho. Para ellos, fue una complicada decisión el enviarme a Bogotá. Hoy en dı́a, les agradezco por todos los esfuerzos que han hecho para hacer de mı́ una mejor persona. Muchas gracias por su amor, por su comprensión y por ser totalmente incondicionales conmigo. Los amo. Muchas gracias a mis hermanos César Augusto Gutiérrez y Diego Fernando Gutiérrez. Gracias por todas las pequeñas enseñanzas del dı́a a dı́a, gracias por estar allı́ siempre que los he necesitado. He vivido los últimos años lejos de ustedes, sin embargo cada dı́a los extraño más. A mi novia, Paula Daniela Urrea, muchas gracias por hacer de cada dı́a un frenesı́ de 4.

(5) i felicidad. Gracias por sacar a la luz mis fortalezas en los ocasos. Te amo. Y a todos aquellos que aportaron a mi formación, infinitas gracias..

(6) Tabla de contenido 1 Introducción. 1. 2 Revisión de literatura 2.1 Estrategias de control de tráfico urbano [31] [28] . . . . . . . . . . . . 2.1.1 Estrategias de control de tráfico urbano basadas en tiempo fijo . 2.1.2 Estrategias de control de tráfico urbano adaptativas . . . . . . . 2.2 Estrategias de control predictivas. Caso de estudio: MPC . . . . . . . . 2.2.1 Control distribuido: Distributed Model Predictive Control (DMPC) 2.3 Algoritmos de control basados en Machine Learning . . . . . . . . . . . 2.4 Algoritmos bioinspirados . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Modelos de redes de tráfico urbano . . . . . . . . . . . . . . . . . . . . 2.5.1 Modelos de tráfico urbano según la topologı́a . . . . . . . . . . . 2.5.2 Modelos de tráfico urbano según el nivel de detalle . . . . . . .. 6 6 7 9 11 13 14 15 16 18 19. 3 Distributed Model Predictive Control 3.1 Descripción del Modelo para redes distribuidas . . . . . . . . . . . . . . 3.1.1 Formulación compacta . . . . . . . . . . . . . . . . . . . . . . . 3.2 Función de Costo cuadrática . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Planteamiento del algoritmo distribuido . . . . . . . . . . . . . . . . . . 3.4 Planteamiento para cuatro intersecciones . . . . . . . . . . . . . . . . . 3.4.1 Paso número 1: definición de conjuntos . . . . . . . . . . . . . . 3.4.2 Paso número 2: definición de matrices Bmi . . . . . . . . . . . . 3.4.3 Paso número 3: definición del vector inicial de control um (0) . . 3.4.4 Paso número 4: definir el estado xm (0) del sistema . . . . . . . 3.4.5 Paso número 5: construcción de la formulación compacta . . . . 3.4.6 Paso número 6: formulación de Hmij , gmi , gmm para luego obtener gm y Hm . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.7 Paso número 7: definición de la dinámica del sistema . . . . . . 3.4.8 Paso número 8: plantear el problema de optimización en términos de la formulación compacta . . . . . . . . . . . . . . . . . . . . 3.4.9 Paso número 9: solución del problema cuadrático . . . . . . . . 3.4.10 Paso número 10: predicción de todos los xm (k) para k ∈ [0, T ] .. 21 22 23 24 25 27 29 31 32 33 33. ii. 36 38 39 40 40.

(7) iii. TABLA DE CONTENIDO 4 Enunciado del Problema 4.1 Red de tráfico simulada . . . 4.2 Índices de desempeño . . . . 4.3 Descripción de experimentos 4.4 Resultados esperados . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. 41 42 43 45 45. 5 Implementación del algoritmo distribuido 47 5.1 Distributed Model Predictive Control: Caracterı́sticas de la implementación 47 5.2 Algoritmos analizados . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.3 Interfaz entre MATLAB y VISSIM PTV . . . . . . . . . . . . . . . . . 49 6 Análisis y resultados 6.1 Ventajas y desventajas de la formulación distribuida . . . . . . . . . . .. 51 52. 7 Hardware-in-the-Loop 7.1 Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Controlador COVA-8G . . . . . . . . . . . . . . . . . . . . . . . 7.1.2 Tarjeta de adquisición de datos National Instruments NI USB 6509 7.1.3 Circuitos conversores de voltaje . . . . . . . . . . . . . . . . . . 7.1.4 Interfaz Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Computador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.2 Interacción con los programas . . . . . . . . . . . . . . . . . . . 7.3 Interfaz de conexión para el controlador COVA-8G y VISSIM . . . . .. 54 56 56 57 58 59 60 60 60 61. 8 Conclusiones y trabajo futuro. 63. Referencias. 64. A Controladores de tráfico urbano. 70. B Descripción del controlador COVA-8G. 73.

(8) Índice de figuras 2.1 2.2 2.3. Diagrama de de tiempo vs espacio de MAXBAND. Tomado de [21] . . Esquema general de MPC. Tomada de [6] . . . . . . . . . . . . . . . . . Diagrama de Reinforcement Learning . . . . . . . . . . . . . . . . . . .. 9 12 15. 3.1. Red de cuatro intersecciones . . . . . . . . . . . . . . . . . . . . . . . .. 28. 4.1. Red de Barranquilla de 8 intersecciones. . . . . . . . . . . . . . . . . .. 42. 5.1. Implementación de la red de Barranquilla, Colombia en el software VISSIM 5.4 PTV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 48. 7.1 7.2 7.3 7.4 7.5. Red de control de tráfico urbano basada en controladores IMATIC Arquitectura del Hardware-in-the-Loop . . . . . . . . . . . . . . . Tarjeta de adquisición de datos NI USB-6509 [tomada de NI] . . . Esquema de tarjeta divisora . . . . . . . . . . . . . . . . . . . . . Esquema general del Hardware-in-the-Loop . . . . . . . . . . . . .. . . . . .. . . . . .. 55 56 57 58 61. B.1 B.2 B.3 B.4 B.5 B.6 B.7 B.8. Unidad de procesamiento del controlador de tráfico urbano COVA-8G Breakers de encendido y apagado del controlador . . . . . . . . . . . Fuente de alimentación de 24V . . . . . . . . . . . . . . . . . . . . . . Breakermatic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Módulo GPRS - GPS . . . . . . . . . . . . . . . . . . . . . . . . . . . Módulo GPRS en funcionamiento . . . . . . . . . . . . . . . . . . . . Conectores serial del controlador . . . . . . . . . . . . . . . . . . . . . Conectores serial del controlador . . . . . . . . . . . . . . . . . . . . .. . . . . . . . .. 74 74 75 76 77 77 78 79. iv. . . . . ..

(9) Índice de tablas 2.1. Comparación entre los dos casos. . . . . . . . . . . . . . . . . . . . . .. 17. 6.1. Resultados comparados contra el controlador basado en Replicator Dynamics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 53. v.

(10) Capı́tulo 1 Introducción El control de tráfico urbano es un área de estudio compleja, debido a que el tráfico, como tal, es un proceso estocástico y variable en el tiempo, donde juega un papel fundamental la arquitectura de la red en la cual se desenvuelve. En el control del tráfico existe una dificultad inherente al desarrollo urbano: a medida que la ciudad crece, aumenta la complejidad del sistema, adicionando nuevas intersecciones, vı́as y pasos peatonales a la anterior red. El aumentar la complejidad del sistema hace obsoletos los métodos de control de tiempo fijo. Los métodos de control basados en esquemas de tiempo fijo se ajustan a condiciones especı́ficas de tiempo y espacio, sin embargo llegan a ser ineficientes para otros momentos, por los cambios en la red previamente mencionados. Para empeorar la situación, no sólo los algoritmos de tiempo fijo sufren alteraciones por la modificación de la red, los algoritmos de control de tráfico adaptativos pueden dejar de ser óptimos, puesto que el modelo bajo el cual se encuentran programados deja de ajustarse al caso real. Adicionalmente, varios algoritmos de control de tráfico adaptativo implican al mismo tiempo un alto costo computacional como también de comunicaciones, haciéndolos efectivos ante redes reducidas, limitando sus aplicaciones a redes reales de gran magnitud. Por ende, es necesario implementar algoritmos de control que permitan mejorar el desempeño de la red bajo diferentes circunstancias, procurando que sea flexible ante cambios en la arquitectura de la red. El algoritmo deberı́a modelar los cambios de la misma de una forma rápida, sin necesidad de alterar en su totalidad el modelo previo de la red. La rápida corrección del modelo, ahorra costos y tiempo de desarrollo de los algoritmos.. 1.

(11) CAPÍTULO 1. INTRODUCCIÓN. 2. Muchas de las estrategias de control de tráfico urbano se basan en mediciones del estado actual del sistema, con el fin de obtener valores de flujos, número de autos (colas) y tiempos de cada una de sus intersecciones, para luego ser llevadas mediante un sistema de comunicaciones a un centro de control, encargado de realizar las proyecciones de los tiempos de cada una de las luces de los semáforos de la red. Este sistema es conocido como control centralizado. La comunicación y sincronización de todos estos datos representa un retardo significativo para el sistema, que aumenta a medida que la red modelada es más compleja [10]. Este problema, unido a los altos tiempos de cálculo requeridos por el algoritmo, no ha permitido una implementación del sistema en tiempo real, desaprovechando las bondades de algoritmos basados en Model Predictive Control (MPC). En [10], [45], [11] y [33] se expone esta limitación a implementar esquemas basados en MPC como algoritmo de control de redes reales complejas, sin embargo, se dan los lineamientos para una aproximación bajo la cual la implementación de estos modelos llega a ser viable computacionalmente, sin necesidad de recurrir a cambios en la plataforma tecnológica. A pesar de las bondades de un control basado en MPC, hay que reconocer sus principales falencias. Una de las principales desventajas radica en las comunicaciones requeridas por cada uno de los nodos, que otorga su estado actual al centro de control, ası́ como la sincronización que se requiere entre múltiples nodos de la red y el centro anteriormente nombrado. El hecho de que el sistema de comunicaciones entre uno o varios nodos falle puede llegar a generar un colapso del sistema en general. Lo anterior ocasiona respuestas no deseadas que conllevan al caos del sistema. Un sistema que presente este comportamiento, se define como un sistema sin tolerancia a la falla [11]. En contraposición a los errores presentados por un control centralizado, un control distribuido llega a ser más tolerante a la falla [11]. Bajo un esquema distribuido, un error en alguno de los nodos puede llegar a afectar los nodos vecinos, sobre los cuales tiene influencia directa, o vecindad. Si llegase a fallar un nodo, los demás, que no tienen una relación de vecindad no son afectados, por lo cual la red de tráfico mantiene su orden exceptuando tan sólo el nodo en el cual se presentó la falla. Este comportamiento nos brinda una mayor seguridad a la hora de implementar el algoritmo en ambientes poco.

(12) CAPÍTULO 1. INTRODUCCIÓN. 3. tolerantes a la falla, destacándose aquellas ciudades con alto flujo vehicular, entre las cuales se encuentra Bogotá. Adicionalmente, el hecho de distribuir el modelo de la red en pequeños subsistemas permite una menor carga computacional, lo que hace posible realizar cómputos en paralelo. Esto reduce el tiempo que tarda el algoritmo en ejecutarse, lo que permite su implementación en redes reales. Para ello, es necesario contar con redes de controladores distribuidos por la ciudad. IMATIC propone un esquema de Hardware basado en múltiples controladores dispuestos por la red, con lo cual el algoritmo optimizado basado en Distributed Model Predictive Control (DMPC) es factible de ser programado en redes reales. Sin embargo, se sigue manteniendo un problema referente a la comunicación: ahora los nodos requieren intercambiar información con sus vecinos influyentes, por lo cual se debe garantizar una sincronización entre los diferentes nodos del sistema. Este esquema puede lograrse con base en el Hardware desarrollado por IMATIC vı́a GPRS/GPS, donde se cuenta con una red de control centralizado, la cual puede emplearse con el fin de sincronizar la comunicación y servir de enrutador para cada uno de las señales de comunicación entre los nodos vecinos. IMATIC se encuentra implementando en Barranquilla una red basada en sensores, pensando en la aplicación de algoritmos de control tanto centralizados como distribuidos. También se encuentra desarrollando un nuevo controlador de tráfico, con prestaciones que de seguro permitirán implementar algoritmos como los expuestos en este documento, ejecutándose sobre un sistema operativo basado en LINUX. La aplicación del trabajo desarrollado es inminente, contando con un Hardware provisto por IMATIC. Adicionalmente a los algoritmos basados en tiempo fijo y modelos, existen diversas estrategias que permiten controlar el tráfico urbano, que no requieren un modelo. Éste es el caso de las estrategias de control fundamentadas en Machine Learning (ML), Control óptimo (CO), o los algoritmos bioinspirados, en los que se generan principios de acción bajo los cuales el algoritmo actúa dependiendo del estado actual de la red de tráfico. Con el fin de dar un panorama general de los algoritmos de control de tráfico urbano, en [31] y [28] se discuten diferentes estrategias, basadas en esquemas de tiempo fijo y adaptativas. Entre ellas, existen estrategias de control basadas en modelo, entre las cuales cabe destacar Model predictive Control (MPC), el cual ha sido empleado ampliamente para el control de tráfico urbano: en [6] [27] [17] [16] se dan los lineamientos acerca del.

(13) CAPÍTULO 1. INTRODUCCIÓN. 4. MPC. En [45] se plantea un esquema de optimización distribuida para MPC, basado en redes lineales dinámicas, en el cual se muestran las ventajas y desventajas de su implementación, ası́ como los algoritmos bajo los cuales se puede realizar la optimización del problema planteado. En [10] se analiza el problema de optimización propuesto en [45], modelando el sistema como un grafo en el cual cada nodo conlleva restricciones de entrada como también restricciones de estado. En [11] se estudia la aplicación de [10] a una red de tráfico real en Macaé, Brasil, donde se presentan resultados relevantes en términos de desempeño en el tiempo de los algoritmos en simulación, y a la vez se sientan las bases para la implementación del algoritmo distribuido. En [33] se compara la implementación de algoritmos basados en MPC en términos de procesamiento en serie como en paralelo. En cuanto a técnicas de control no basadas en modelo, se destacan los planteamientos de [46], donde se muestra un esquema de control para redes de tráfico urbanas bioinspirado en colonias de abejas; en [44] se presenta un panorama general de la implementación de algoritmos bioinspirados. En cuanto a algoritmos basados en Machine Leaning, se encuentra en [4] una propuesta para control de tráfico urbano basada en sistemas de aprendizaje por refuerzo multiagentes, y también una descripción de algoritmos de control de tráfico en general basados en aprendizaje por refuerzo en [42]. En [23] se plantea desde diferentes puntos de vista la función objetivo de un problema de control óptimo y en [13] se da una descripción del concepto y la necesidad de implementar a nivel industrial de sistemas Hardware-in-the-Loop. Los objetivos de este proyecto de grado son, posterior a una adecuada revisión de literatura, buscar, seleccionar e implementar un algoritmo de control de tráfico urbano, ası́ como comparar su desempeño con algoritmos basados en modelos, tales como MPC centralizado, y Replicator Dynamics. En el presente documento, se profundiza sobre la implementación de Distributed Model Predictive Control. Además, se implementa un esquema Hardware-in-the-Loop bajo el cual se desarrollan pruebas basadas en controladores reales provistos por la empresa IMATIC, empleando el simulador microscópico de redes de tráfico VISSIM, software al cual se tiene acceso gracias a su disponibilidad en la Universidad de los Andes. El resto del documento se estructura de la siguiente forma: en el capitulo dos se expone la revisión de literatura. Seguido a éste, en el capı́tulo tres se presenta el control basado.

(14) CAPÍTULO 1. INTRODUCCIÓN. 5. en Distributed Model Predictive Control (DMPC) empleado para la optimización de tiempos en luces de tráfico urbano. En este capı́tulo se expone matemáticamente el algoritmo, resaltando la función de costo a optimizar a la vez que se expone un ejemplo sencillo para cuatro intersecciones. En el capı́tulo cuatro se enuncia el problema a analizar, acción que se realiza en el capı́tulo cinco, donde se exponen los parámetros y caracterı́sticas de la simulación. Se prosigue en el capı́tulo seis, donde se analizan los resultados obtenidos bajo los diferentes experimentos propuestos. En el capı́tulo siete se presenta el esquema Hardware-in-the-loop implementado y en el capı́tulo ocho se exponen las conclusiones y el trabajo futuro que se puede realizar en el área..

(15) Capı́tulo 2 Revisión de literatura A continuación se presenta la revisión de literatura. En su primera sección se describen las estrategias de control de tráfico urbano, resaltando diferencias entre algoritmos basados en tiempo fijo y en control de tráfico adaptativo. En la sección número dos se abordan los problemas caracterı́sticos de un esquema basado en MPC, resaltando sus diferentes caracterı́sticas. En esta sección también se presenta una alternativa de solución a la problemática presentada: Distributed Model Predictive Control (DMPC). En la sección número tres y cuatro se hace referencia a algoritmos de control de tráfico urbano adaptativo no basados en modelo. Se comienza en la sección número tres con algoritmos de control basados en Machine Learning y culmina en la sección número cuatro con algoritmos bioinspirados. En la sección número cinco se presenta una revisión de los modelos de tráfico urbano, clasificados según la topologı́a y el nivel de detalle.. 2.1. Estrategias de control de tráfico urbano [31] [28]. En el control de tráfico urbano a nivel global, las estrategias de control se encuentran divididas en dos grandes variantes: estrategias de tiempo fijo y estrategias de control adaptativas al tráfico. En esta sección, se abordan las principales estrategias de control, incluyendo las estrategias que hoy en dı́a manejan el tráfico urbano como también. 6.

(16) CAPÍTULO 2. REVISIÓN DE LITERATURA. 7. aquellas encontradas en ámbitos académicos.. 2.1.1. Estrategias de control de tráfico urbano basadas en tiempo fijo. Las estrategias de control basadas en tiempo fijo funcionan en base a cálculos offline de la red, es decir, las mediciones y cálculos que se realicen para determinar los respectivos tiempos de verde, amarillo y rojo de cada semáforo se realizan en base a datos estadı́sticos de mediciones previas, para después ser programados en los respectivos controladores de semáforos [31]. Por su simplicidad, son empleadas a lo largo de todo el mundo, puesto que implican un bajo costo de implementación. Estas estrategias de control no requieren de sensores, basándose en un control open-loop que lee las señales de control de la respectiva memoria del controlador, espacio en el cual se han almacenado los tiempos de las luces de tráfico una vez han sido procesadas estadı́sticamente. Cada estrategia se diferencia de otra en su función objetivo, en sus restricciones y en sus variables de control, tales como capacidad de intersecciones, capacidad de las colas, número de paradas, tiempo total de paradas, entre otras. Por lo general, estas estrategias de control de tráfico son diseñadas bajo condiciones de red no saturadas [31]. Entre las estrategias de control basadas en tiempo fijo, se distinguen dos variantes: las estrategias de control para intersecciones aisladas y las de control coordinado de intersecciones.[28] Las estrategias de control para intersecciones aisladas se basan en un modelo de red simple, aplicable a zonas de muy bajos flujos vehiculares. Dos ejemplos de estrategias de control de tiempo fijo para intersecciones aisladas corresponden a SIGSET y SIGCAP. Estas estrategias de control por su simplicidad son muy semejantes, sin embargo, difieren en la función objetivo que optimizan. Ambas estrategias de control se basan en limitar la capacidad que tiene determinada vı́a por encima de la demanda de la red. Adicionalmente, poseen lı́mites máximos y mı́nimos para el tiempo de verde..

(17) 8. CAPÍTULO 2. REVISIÓN DE LITERATURA Matemáticamente las podemos describir de la siguiente forma [31]:. sj. m X i=1. αij λi ≥ dj. ∀j. (2.1). Donde λ0 + λ1 + . . . + λm = 1 λ0 = L/c. En las anteriores ecuaciones sj representa el flujo de saturación, dj el flujo de demanda, αij representa el derecho de paso, tomando valores de cero o uno, λi representa la duración relativa del tiempo de verde respecto del tiempo de ciclo c, λ0 representa el tiempo perdido relativo al tiempo de ciclo, donde L representa el tiempo total perdido. Para el caso de SIGSET, se busca minimizar el tiempo total de espera de la intersección, para el caso de SIGCAP se busca maximizar la capacidad de las intersecciones [28]. En cuanto a las estrategias de control coordinado de intersecciones, sus principales representantes son MAXBAND, UTCS y TRANSYT. En general, buscan mejorar el desempeño de las vı́as principales, en base a datos estadı́sticos tomados de las mismas. Presentan un muy buen desempeño ante redes no congestionadas. Estas estrategias de control conllevan bajos costos de implementación, al no requerir dispositivos de sensado de tráfico. La estrategia bajo MAXBAND acuñó el término “ola verde”, buscando la minimización de los tiempos de parada de una vı́a principal. La “ola verde” consiste en una secuencia sucesiva de luces de semáforo verdes en la dirección de flujo de los automóviles, logrando que el automóvil en cuestión se detenga lo menos posible a lo largo de su trayecto [28] [31] [21]. Tal y como lo expone Little en [21], MAXBAND considera n intersecciones en la vı́a arterial. Se define como ancho de banda a aquella fracción de tiempo de ciclo en la cual un vehı́culo situado en una determinada intersección podrá experimentar la ola verde. Ello implica que los vehı́culos sean conducidos en un rango de velocidades fijos, definidos por el ancho de banda de cada intersección. En la figura 2.1.1 se puede observar un diagrama de tiempo vs. espacio de MAXBAND. S1 , S2 , . . . , Sn son intersecciones,.

(18) CAPÍTULO 2. REVISIÓN DE LITERATURA. 9. Figura 2.1: Diagrama de de tiempo vs espacio de MAXBAND. Tomado de [21]. o en términos del autor, señales. Se pueden apreciar dos trayectorias principales: la trayectoria más ancha corresponde al flujo saliente, y la más delgada corresponde al flujo entrante. En la imagen se puede apreciar el concepto de ancho de banda, representados para cada uno de los flujos como b y b. Cada una de las lı́neas observadas representa la trayectoria que han de seguir los vehı́culos, y la pendiente de estas rectas corresponden a las velocidades que éstos deben llevar para mantenerse en la ola verde. Paralelas al eje x, se pueden apreciar lı́neas fraccionadas referidas a las señales. Cada una de estas lı́neas hace referencia al tiempo de luz roja de cada uno de los semáforos de la intersección.. 2.1.2. Estrategias de control de tráfico urbano adaptativas. Con respecto a las estrategias de control de tráfico basadas en tiempo fijo, las estrategias de tráfico urbano adaptativas se basan en mediciones en tiempo real de la red, actuando ante variaciones instantáneas en ella. Este comportamiento permite una mejor respuesta del sistema de control a perturbaciones y cambios, siendo más resistente.

(19) CAPÍTULO 2. REVISIÓN DE LITERATURA. 10. a variaciones en los flujos debidas a eventos fortuitos, como los son los accidentes, las averı́as y las saturaciones. Existen también dos variantes en las estrategias de control de tráfico urbano adaptativas, tal y como sucede con las estrategias de control basadas en tiempo fijo: estrategias adaptativas para una intersección aislada, o estrategias adaptativas para intersecciones coordinadas.. Estrategias adaptativas para intersecciones aisladas Para intersecciones aisladas, las principales estrategias de control son llamadas “método de intervalo de vehı́culos” y Microprocessor Optimised Vehicle Actuation (MOVA), que es una mejora a la anterior. Las dos estrategias se basan en la fijación de un tiempo mı́nimo de verde, como de un tiempo máximo. Dependiendo de las observaciones que se tenga de los sensores, se aumenta o disminuye el tiempo de verde obteniendo valores en el rango que se ha fijado con anterioridad. La diferencia entre un método y otro reside en la flexibilidad de la función objetivo cuando se emplea MOVA, puesto que optimiza diferentes variables dependiendo de la condición de saturación de la red, maximizando la capacidad de las intersecciones bajo condiciones saturadas, o minimizando los retardos o paradas bajo condiciones no saturadas.. Estrategias adaptativas para intersecciones coordinadas Entre las estrategias de control adaptativas para intersecciones coordinadas, existen varias caracterizadas por realizar un control centralizado, denominadas SCATS (Sydney Coordinated Area Traffic System), RHODES, MOTION, TUC y SCOOT (Split, Cycle and Offset Optimization Technique). Esta última técnica se encuentra basada en la estrategia de TRANSYT, donde el cálculo se realiza de forma centralizada basado en un modelo del sistema. Con base en los datos provenientes del modelo y la red, SCOOT investiga en tiempo real el efecto producido en la red por cambios incrementales en el tiempo de ciclo, en las desviaciones y desplazamiento. El optimizador de ciclo se encarga de revisar los niveles de saturación de cada una de las intersecciones individualmente, mientras que el optimizador de desviaciones se encarga de generar retrasos o adelantos en las señales de control, buscando la mejor combinación para ese momento especı́fico.

(20) CAPÍTULO 2. REVISIÓN DE LITERATURA. 11. de la red. El optimizador de desplazamiento se encarga de minimizar los tiempos y número de paradas que se realicen. Adicionalmente a esta estrategia, existen otros algoritmos conocidos, como OPAC, PRODYN, CRONOS y RHODES, basados en un modelado riguroso de la red, implicando mayores tiempos de cómputo en el cálculo de los tiempos de verde de cada una de las intersecciones. Pasando al contexto local, en la ciudad de Bogotá, Colombia el control de las señales de semaforización se realiza en base en las recomendaciones de RILSA (Richtlinien für Lichtsignalanlagen) el cual es un compendio de consideraciones y estrategias para el control de la semaforización de una ciudad, tanto a nivel macroscópico como microscópico [3].. 2.2. Estrategias de control predictivas. Caso de estudio: MPC. MPC, tal y como lo indica su nombre, hace uso de modelos para predecir la respuesta de la planta. Con esta predicción, busca el camino óptimo para su variable de control. Este tipo de control es muy empleado para procesos quı́micos e industriales. Está conformado principalmente por un modelo bajo el cual se realiza la predicción, un control y un optimizador. Una vez las señales son predichas, pasarán por el optimizador, el cual encontrará el camino óptimo en términos de las variables de control [27] [6]. Es importante resaltar que MPC no es una estrategia de control sino un conjunto de métodos de control que unidos minimizan determinada función objetivo, y en base a esto plantea las señales de control. En el modelamiento del tráfico urbano existen múltiples altenativas, expuestas en la sección número cinco del presente capı́tulo. De igual manera, es destacable el trabajo realizado en [39] donde se emplea el modelo Store-and-Forward desarrollado inicial-.

(21) CAPÍTULO 2. REVISIÓN DE LITERATURA. 12. Figura 2.2: Esquema general de MPC. Tomada de [6]. mente por Gazis & Potts que permite la aplicación de técnicas de optimización lineares cuadráticas (LQ por sus siglas en inglés) altamente eficientes. En [8] [14] [1] [41] [17] se destacan el empleo del modelo METANET para el control de tráfico urbano en autopistas. En [34] [16] emplean sistemas dinámicos y lógicos mixtos (MLD por sus siglas en inglés) buscando adaptar el modelo a los sistemas computacionales actuales, facilitando el procesamiento y reduciendo el costo computacional. En [8] [7] [22] [10] [18] se plantea el modelo Store-and-Forward distribuido, buscando aliviar las situaciones de falla que se presenten en la red, planteando una red basada en relaciones de vecindad. En los sistemas de control, se parte de un punto de referencia a seguir, que corresponde al estado final al cual se desea llevar el sistema. El modelo que se emplee realizará la predicción del estado futuro, que se comparará con el punto de referencia. Esta resta producirá un error futuro, que recibirá el optimizador. Este con las restricciones y las funciones de costo brindará las señales de control, que irán al modelo de la red, comenzando de nuevo el proceso. La anterior descripción se puede apreciar en la figura 2.2..

(22) CAPÍTULO 2. REVISIÓN DE LITERATURA. 2.2.1. 13. Control distribuido: Distributed Model Predictive Control (DMPC). Algunos métodos de control de tráfico urbano adaptativo son empleados en intersecciones aisladas. Éstos métodos se conocen bajo el tı́tulo de control descentralizado [8]. El control descentralizado busca controlar intersecciones aisladas, empleando algoritmos adaptativos para tal fin. En el control descentralizado no presentamos intercambio de información entre cada uno de los dispositivos que controlan la red. Todos ellos tienen la autonomı́a de tomar sus propias decisiones, siguiendo sus estrategias de control predefinidas. El control descentralizado se suele confundir con el control distribuido. Este control distribuye por toda la red sensores cuyas señales son captadas por dispositivos locales. Este esquema requiere de un sistema de comunicaciones que permita el flujo de información entre los dispositivos a un ente central, que realiza la optimización de toda la red con base en las mediciones recibidas y devuelve a cada dispositivo la acción de control pertinente. Sin embargo, las estrategias de control centralizado no son tolerantes a la falla. Cualquier error en el sistema de comunicaciones anula la eficacia del sistema de control. Por otra parte, el control distribuido, si bien presenta un menor desempeño que el control centralizado, es más tolerante a la falla. En [7] [10] [11] se presenta el modelo S-a-F, donde se interactúa con el concepto de vecindades. Cada una de las intersecciones tiene relación directa sólo con sus ”vecinas”. El concepto de vecindad permite definir las intersecciones que influyen en una en particular, ası́ como las intersecciones que esta misma afectará. Evidentemente, un fallo en la comunicación de una intersección tendrá efectos directos sólo en aquellas intersecciones con las cuales presenta vecindad, llegando a tolerar en mayor medida la ausencia de información..

(23) CAPÍTULO 2. REVISIÓN DE LITERATURA. 2.3. 14. Algoritmos de control basados en Machine Learning. Los algoritmos basados en Machine Learning aprovechan los recursos de memoria de los dispositivos para actuar, siendo de por sı́ muy adaptativos al entorno bajo el cual se empleen, puesto que pretenden lograr que la máquina “aprenda” mediante la interacción del sistema con señales de entrada y salida de su entorno. Las principales técnicas desarrolladas en Machine Learning son: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje semisupervisado, transducción y aprendizaje por refuerzo, entre otras. Existen técnicas aplicadas de Machine Learning (ML) empleadas en control de tráfico urbano, aprovechando su flexibilidad debida al no empleo de modelo por parte de la misma. Entre ellas, se destacan el aprendizaje por refuerzo (RL). Ésta última, descrita en [4] y [42] en términos de sus componentes, que son: El aprendiz: Es la máquina o agente. Se encarga de leer el estado del entorno, ası́ como interpretar las recompensas que éste le brinde y actuar ante él. El entorno: Corresponde al ente con el cual el aprendiz interactúa. Éste recibe las acciones del agente, y se modifica de acuerdo a la acción del aprendiz. La técnica de RL se basa en aprender en base a la experiencia, bajo un esquema de ensayo y error, a diferencia de las técnicas en general de ML donde el aprendizaje se basa en el seguimiento de ejemplos tanto positivos como negativos. La técnica está dirigida por objetivos, donde el aprendiz interactúa con el entorno, realizando alguna acción sobre él. El entorno, dado un estı́mulo por la máquina, retorna una recompensa a la misma, estableciendo la retroalimentación necesaria que será interpretado por el agente para producir la siguiente acción hacia el entorno. La técnica se puede acercar a las redes de tráfico urbanas, donde el agente corresponde con el algoritmo de control implementado, y el entorno con la red de tráfico urbana. En la figura 2.3 se puede evidenciar el esquema de reinforcement learning, basado en [37]. En ML se evidencian trabajos como el de Yang, Chen, Tang y Sun en [49] planteando un esquema descentral-.

(24) CAPÍTULO 2. REVISIÓN DE LITERATURA. 15. Figura 2.3: Diagrama de Reinforcement Learning izado basado en un modelo microscópico, y los trabajos de Zhang Hong-lei et al en [19] y Gregoire et al en [29] donde exponen algoritmos basados en Q-Learning, realizando un análisis de desempeño contra los algoritmos de tiempo fijo.. 2.4. Algoritmos bioinspirados. La informática y la biologı́a sostienen dos relaciones bien definidas: la bioinformática y la bioinspiración. La bioinformática se basa en el empleo de técnicas y recursos propios de la informática en la biologı́a, con el fin de organizar, analizar y estructurar toda la información referente a moléculas biológicas, que por lo general son orgánicas, como también complejas en su estructura [44]. La bioinspiración nace del análisis de los sistemas biológicos, donde se busca simular sistemas biológicos en busca de esquemas heurı́sticos no determinı́sticos de aprendizaje, comportamiento y búsqueda, entre otros [44]..

(25) CAPÍTULO 2. REVISIÓN DE LITERATURA. 16. Estos esquemas modelan de forma aproximada diversos comportamientos y fenómenos de la naturaleza. Se caracterizan por ser no determinı́sticos, es decir, por presentar comportamientos aleatorios. Adicionalmente, pueden llegar a presentar una estructura multiagente, realizando procesos concurrentes. Además, estos algoritmos llegan a ser adaptativos, adaptándose al entorno en el cual se desenvuelven, modificando tanto el modelo como los parámetros del mismo [44]. Ejemplo de los algoritmos bioinspirados son las famosas redes neuronales, donde su gran paradigma se basa en lograr un aprendizaje automático. Relacionados al tráfico urbano se destacan los modelos basados en redes neuronales aplicados al control de trafico urbano presentados en [15] [18] [25]. Existen también algoritmos evolutivos, los cuales se basan en los principios Darwinianos de la evolución natural, donde se emplean modelos poblacionales, en el cual cada uno de los elementos representa componentes y soluciones del problema análogo. Una amplia rama se ha desarrollado alrededor de Swarm Intelligence, donde se estudian enjambres como entes colectivos, empleando sus estrategias de comportamiento para el control y modelamiento de sistemas poblacionales, tal y como se plantea en [46] [30] [32], donde se hace una analogı́a entre el problema de asignación de tiempo de verde y el problema de asignación del número de abejas dispuestas a realizar labores de búsqueda de comida, destacando también el no empleo de modelos de la red de tráfico urbana, haciéndolo factible de implementarse a gran escala. Tal y como se expone en [32], la estrategia de control bioinspirada en las colonias de abejas y su esquema de alimentación busca maximizar el flujo, minimizando los tiempos de viaje. En la tabla 2.1 se presenta un sı́mil entre la colonia de abejas y una red de tráfico urbano, adaptado de [24].. 2.5. Modelos de redes de tráfico urbano. Cuando realizamos un modelo, buscamos imitar la respuesta de una red bajo determinados parámetros de control. Una vez el modelo se ajuste a la red real podemos emplearlo para predecir sus futuros estados. Basados en las anteriores predicciones, se.

(26) 17. CAPÍTULO 2. REVISIÓN DE LITERATURA Tabla 2.1: Comparación entre los dos casos Social bee foraging. Control de tráfico. Un conjunto B de recolectores. Un conjunto de M unidades. de néctar ubicados en N áreas. de tiempo ubicadas en N fases. Un conjunto de abejas pj es. Una porción de tiempo disponible. asignado a un sitio j. λi es asignado a la fase i. Áreas floridas y secas espaci-. Demandas de tráfico cambiantes. almente distribuidas. en intersecciones espacialmente distribuidas. Un grupo de recolectores xi. Un grupo de unidades de tiempo gi es. cosecha néctar en un área dada. asignado a alguna fase de luz i. Cada área es asociada a una. Cada fase es asociada con vehı́culos. calidad variable. en una cola y al tiempo total de espera. La cantidad total de néctar co-. El tráfico durante determinada fase. lectado por una abeja depende. por unidad de tiempo depende de la. del número de abejas en el área. longitud de la cola y el tiempo total. y la calidad de la miel. asignado a cada fase. El porcentaje de colectores en. El porcentaje de tiempo asignado a. todas las áreas debe satisfacer PN j pj = 1. todas las fases debe satisfacer P i∈{3,4} gi = M k. pueden buscar caminos óptimos que lleguen al punto deseado con el menor coste posible. La función de costo puede tener diferentes variables de control, que son categorizadas en tres grandes focos: el primero corresponde a las luces de tráfico urbano, el segundo a la señalización con mensajes variables y el tercero corresponde a la señalización de las rampas de entradas a las autopistas, conocido como “ramp metering”.Si bien las redes son sistemas fı́sicos reales con variables continuas, el modelo por lo general emplea variables discretas para representarlas, que dependen del intervalo de tiempo discreto que se haya definido. [31]..

(27) CAPÍTULO 2. REVISIÓN DE LITERATURA. 18. Existen múltiples y variados modelos de redes de tráfico urbanas. En esta sección, se exponen los principales modelos, dando a conocer sus caracterı́sticas principales. Los modelos de tráfico urbano se pueden dividir en 2 categorı́as: según la topologı́a y según el nivel de detalle.. 2.5.1. Modelos de tráfico urbano según la topologı́a. Las redes de tráfico urbano también pueden ser subdivididas en redes y autopistas. Cuando nos referimos a una red de tráfico urbano, estamos hablando de múltiples vı́as e intersecciones con capacidades muy semejantes. Cuando alguna de estas vı́as presenta una capacidad de tráfico considerablemente mayor e influyente en la red de tráfico urbano, comenzamos a hablar de tráfico de autopista. Gran cantidad de las estrategias de control se han desarrollado para este tipo de tráfico. Sin embargo, existen estudios en los cuales se integran los dos modelos. Este es el caso presentado en [18], donde los dos modelos se presentan independientes para después intercambiar información y presentar resultados conjuntos. En [18] se muestran resultados destacables, mostrando una mejora del 30% sobre el no aplicar ninguna estrategia de control. A continuación se expone más a fondo los modelos basados en autopistas y en redes.. Modelos basados en autopistas Las autopistas hoy en dı́a son vı́as de tráfico masivo, que alivian las congestiones de las redes circundantes, presentando una alternativa en lo posible rápida y de mayor prioridad que el resto de la red. Con ellas, se busca generar un espacio de movilización masivo entre distancias considerablemente largas. Por lo general, se emplean modelos de tráfico macroscópicos para representarlas. En [41] [18] [8] [3] se desarrollan modelos macroscópicos para tráfico en autopistas. En los modelos macroscópicos se destaca el control por medio de Ramp Metering. Ramp Metering busca comprometer el desempeño de las rampas de entrada aprovechando su.

(28) CAPÍTULO 2. REVISIÓN DE LITERATURA. 19. capacidad, evitando saturar la autopista. En estos modelos, el control es realizado por medio de semáforos, principalmente. En [18] [50] [14] [12] [48] se exponen diferentes modelos y aplicaciones basados en ramp metering. Modelos basados en redes Los modelos basados en redes representan vı́as paralelas y perpendiculares con recursos muy similares. Se caracterizan por presentar múltiples vı́as dispuestas en serie y en paralelo, como también por estar compuestas por unidades básicas denominadas intersecciones. Suelen entrar en la categorı́a de modelos macroscópicos, como se puede observar en [1] [20] [47] [2].. 2.5.2. Modelos de tráfico urbano según el nivel de detalle. Los modelos de redes de tráfico urbanos se pueden dividir en tres categorı́as principales: macroscópico, mesoscópico y microscópico [31]. Los tres difieren en el nivel de abstracción con el cual se considere la red. Los modelos microscópicos consideran la existencia de cada uno de los actores individuales ası́ como las interacciones y caracterı́sticas de la red en la cual se desenvuelven [28]. Los modelos macroscópicos corresponden a esquemas menos especı́ficos, y buscan representar la red mediante un modelo de flujos, haciendo en múltiples ocasiones alusión a la hidrodinámica [43]. Aprovechando los beneficios de ambos esquemas, los modelos mesoscópicos buscan integrar caracterı́sticas macroscópicas y microscópicas.. • Los modelos macroscópicos son empleados con el fin de reducir la carga computacional, puesto que han sido pensados para controlar redes de tráfico de gran. extensión [31]. Entre los principales modelos encontramos TRANSYT-7F, FREFLO, NETVACI, KRONOS, AUTOS, METANET y METACOR [24].. • Los modelos mesoscópicos son una aproximación intermedia entre los modelos. macroscópicos y microscópicos. Su principal caracterı́stica es la adquisición de.

(29) CAPÍTULO 2. REVISIÓN DE LITERATURA. 20. los beneficios de ambos. Sin embargo, considera un nivel de detalle intermedio entre los modelos macroscópicos y microscópicos . Un modelo mesoscópico puede considerar el análisis por grupos de vehı́culos, por ejemplo. Entre sus principales representantes se encuentran DYNAMIT, INTEGRATION, METROPOLIS y DINASMART [24] [31].. • Los modelos microscópicos corresponden al nivel más detallado de análisis de la red, llegando a considerar cada vehı́culo de la red como un ente con caracterı́sticas definidas, relacionados con la infraestructura de la red o con otros vehı́culos adyacentes. Con ellos, se busca modelar los comportamientos humanos en la red, haciéndolos complejos y costosos de implementar. Entre los principales modelos se destacan INTRAS, FRESIM, NETSIM, THOREAU, FLEXSYT-II Y AIMSUM [24]..

(30) Capı́tulo 3 Distributed Model Predictive Control DMPC ha sido ampliamente empleado en redes lineales y dinámicas. Por su carácter general, DMPC no sólo ha sido empleado en el control de tráfico urbano adaptativo. Mercangöz y Doyle [26] lo han empleado para el control de procesos, ası́ como Talukdar et al [36] en sistemas de potencia eléctricos. Dunbar [9] and Murray y Keviczky et al [38] presentan un DMPC para redes distribuidas basado en sistemas dinámicos no lineales desacoplados. Li et al [35], por su parte plantea DMPC para sistemas lineales sin restricciones, buscando como objetivo un equilibrio de Nash, o un punto fijo como también es llamado. Manikonda et al [40] ha presentado un modelo dinámico para la longitud de las colas, ası́ como un control distribuido basado en agentes, muy similar al propuesto en este documento. Eduardo Camponogara ha realizado un reconocido trabajo en Distributed Model Predictive Control (DMPC) [7] [10] [11] [45]. Para describir su trabajo, se ha dividido en tres la descripción del controlador. En la primera sección se describe el modelo empleado para predecir el futuro estado del sistema basado en el modelo propuesto. En la segunda sección se aborda el problema de optimización que se plantea para resolver el sistema, ası́ como la función objetivo empleada para tal fin. En la tercera sección se describe cómo el modelo es implementado por medio de simulaciones en la interfaz VISSIM -MATLAB. 21.

(31) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.1. 22. Descripción del Modelo para redes distribuidas. El sistema se modela por medio de grafos dirigidos, donde cada uno de los M nodos representa un subsistema, basándose en el modelo Store-and-Forward presentado por Papageorgiou et al en [5]. Cada uno de los subsistemas cuenta con vector de estado xk que representa el número de vehı́culos en las vı́as definidas entre cada una de las intersecciones (colas) y un vector de control uk en el cual se indican los tiempos de verde. El grafo dirigido puede ser descrito como G = {V, E}, donde V = {1, 2, . . . , M } repre-. senta el conjunto de vértices del grafo, llamados previamente subsistemas. El conjunto E ⊆ V × V representa los arcos que hay entre cada uno de los vértices. El concepto de vecindad se explica de la siguiente forma: si un arco (i, j) ∈ E implica que el vértice i. tiene efectos directos en el estado futuro del subsistema j. Las colas que controla cada intersección corresponden a las colas que llegan a la misma, y son descargadas gracias a los grupos de señales que se definan para cada intersección. Sin embargo, las colas por las cuales los vehı́culos salen de la intersección también son afectadas puesto que se llenan a medida que las colas que llegan a la intersección se vacı́an. Basados en una dinámica en tiempo discreto, se presenta la ecuación de estado para cada uno de los subsistemas como:. xm (k + 1) = Am xm (k) +. X. Bmi ui (k). (3.1). i∈I(m). Donde I(m) = {m} ∪ {i : (i, m) ∈ E} es el conjunto de subsistemas que afectan el subsistema m, incluyéndose también él mismo. Am es una matriz identidad, y Bmi es. la matriz que contiene la tasa de entrada y salida de las colas que se modelan para cada subsistema m. La matriz Bmi se construye a partir de los parámetros de las colas de las vecindades y de las propias, en términos de sus flujos de saturación y tasas de giro. Los valores de la diagonal de B son negativos, indicando un flujo de salida, y los demás son positivos, indicando un flujo de entrada..

(32) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.1.1. 23. Formulación compacta. Como se puede apreciar en la ecuación 3.1, el estado siguiente de cada subsistema depende de su estado previo. Por obvias razones, la ecuación 3.1 es una restricción de estado del problema de optimización que se plantee, independiente del ı́ndice de desempeño. Una forma de simplificar la función de objetivo se presenta en la ecuación 3.2.. xm (k + 1) =. Akm xm (0). +. k X X l=1 i∈I(m). Al−1 m Bmi ui (k − l). (3.2). En la ecuación 3.2 se elimina la dependencia del estado anterior, expresando el estado previo en términos de las matrices pasadas Am y de los tiempos de verde de cada cola. Es pertinente aclarar que en este caso todas las matrices Am son matrices identidad. A partir de esto, resulta conveniente definir los siguientes hı́per vectores e hı́per matrices: x̄m , ūm , Ām , y B̄mi ,   A  m um (0) xm (1) A2     .   m ..  ..  ūm =  Ā = x̄m =   .  m      ...    um (T − 1) xm (T ) ATm . . . . (3.3). Donde T es el horizonte de predicción, que en este caso se establece de acuerdo a los escenarios de simulación en 3, 5, 8 y 10. También es conveniente representar Bmi de forma compacta, tal y como se indica en la ecuación 3.4.

(33) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. . B̄mi. Bmi. 0. .... 0. 0. .  0    0   ... 0   . . . Bmi.   Am Bmi Bmi 0   .. .. .. = . . .  AT −2 B T −4 T −3 mi Am Bmi Am Bmi  m ATm−1 Bmi ATm−2 Bmi ATm−3 Bmi. 24. ... .. .. (3.4). Donde 0 representa una matriz de ceros de la dimensión apropiada. Con los vectores definidos en 3.3, podemos reescribir la dinámica del sistema, tal y como se muestra en 3.5 X. x̄m = Ām xm (0) +. B̄mi ūi. (3.5). i∈I(m). 3.2. Función de Costo cuadrática. La función de costo penaliza los cuadrados de las diferencias entre los controles y los estados. Una restricción de igualdad modela la dinámica del sistema, otra limita la suma de tiempos de cada grupo de señales al tiempo de verde del ciclo. Las restricciones de desigualdad modelan las limitaciones mı́nimas de tiempo de verde, que se ha establecido en 10. En la ecuación 3.6 se aprecia la función de costo.. P = min. M X T X 1 m=1 k=1. 2. M X T −1 X. 0. xm (k) Qm xm (k) +. um (k)0 Rm um (k). m=1 k=0. Sujeto a: xm (k + 1) = Am xm (k) +. P. i∈I(m). Cm um (k) ≥ cm Dm um (k) = dm. Bmi ui (k). (3.6).

(34) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 25. Donde Qm Y Rm son matrices semidefinidas positiva que se escogen dependiendo de la relevancia que se le de a cada esfuerzo de control o cambios en el estado. La función de costo anterior puede simplificarse y compactarse en base a los vectores expuestos en la ecuación 3.3 y en la dinámica compacta mostrada en 3.5. Expresando la función de costo en términos de las expresiones compactas y de las matrices obtenemos la expresión de la ecuación 3.7:. 1 x̄m (k)0 Q̄m x̄m (k) + ūm (k)0 R̄m ūm (k) 2. (3.7). Donde se obtiene la matriz Q̄m = In ⊗Qm en términos del producto de Kronecker, donde. In es una matriz de identidad de dimensión adecuada. Reemplazando la ecuación 3.5 en 3.7 y operando se obtiene la ecuación 3.8 X 1 Pb = xm (0)0 Ā0m Q̄m Ām xm (0) + xm (0)0 Ā0m Q̄m B̄mi ūi + 2. (3.8). i∈I(m). 1 X 2. X. i∈I(m) j∈I(m). 3.3. 1 0 ū0i B̄mi Q̄m B̄mj ūj + ū0m R̄m ūm 2. Planteamiento del algoritmo distribuido. El principal objetivo al plantear el algoritmo distribuido es diseñar funciones de costo para cada uno de los subsistemas, donde la unión de cada función objetivo y de las restricciones locales enuncien el problema de optimización planteado en la ecuación 3.6. en la ecuación 3.9 se presenta la descomposición de la función de costo planteada en 3.8 1 Pbm = 2. X. 0 ūm + ū0i Hmij ūj + gmm. (i,j)∈C(m). 1 X 2 ¯. X i∈I(m). X. k∈I(m) (i,j)∈C(m,k). ū0i HKij ūj. 0 gim ūm +. (3.9).

(35) 26. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL Sujeto a: C̄m ūm ≥ c̄m D̄m ūm ≥ d¯m Donde es pertinente definir los siguientes conjuntos y vectores:.   d0  m d0   m d¯m =  .   ..    d0m.   c0  m c0   m c̄m =  .   ..    c0m. C̄m = In ⊗ Cm. D̄m = In ⊗ Dm. C(m) = {(i, j) ∈ I(m) × I(m) : i = m or j = m}. C(m, k) = {(i, j) ∈ I(k) × I(k) : i = m or j = m} ¯ I(m) = {i : m ∈ I(i), i 6= m}. (3.10). Es importante destacar que las matrices C(m) y C(m, k) son claves en el modelamiento distribuido. La matriz C(m) define la vecindad de 1 sola intersección indicando como se afectan entre sı́ las intersecciones (parejas). C(m, k) indica la vecindad del link que hay entre m y k. Si C(m, k) existe, hay un link entre m y k, siguiendo la dirección: del subsistema m al subsitema k. En la ecuación 3.9 se observa que la formulación del problema de optimización no se encuentra en forma estándar. Para llegar a ella, es necesario definir las matrices presentadas en 3.11 0 Q̄m Ām xm (0) gmi = B̄mi 0 Hmij = B̄mi Q̄m B̄mj. i ∈ I(m). i, j ∈ I(m), i 6= m, o j 6= m. 0 Q̄m B̄mm + R̄m Hmmm = B̄mm. c̄m = [c0m , . . . , c0m ]0 d¯m = [d0m , . . . , d0m ]0. (3.11).

(36) 27. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. Con las anteriores matrices definidas en 3.11 podemos definir las matrices expuestas en 3.12 gm =. +. 1 2. X. 0 (Hmim + Hmmi ) + gmm. (i,m)∈C(m):i6=m. 1 X 2 ¯. X. 0 + Hkmi )ūi (Hkim. (3.12). k∈I(m) (i,m)∈C(m,k):i6=j. +. X. gkm. ¯ k∈I(m). Hm = Hmmm +. X. Hkmm. ¯ k∈I(m). Con las anteriores definiciones, podemos formular el problema de optimización cuadrático de una forma más simple y organizada, tal y como se muestra en 3.13. Note que la función objetivo ahora es mono-objetivo. Ésto fue posible cuando quitamos la dependencia del estado anterior, y calculando todo en términos de los vectores de tiempo.. 1 0 Pbm = ū0m Hm ūm + gm ūm 2. (3.13). s.t. : C̄m ūm ≥ c̄m D̄m ūm ≥ d¯m. 3.4. Planteamiento para cuatro intersecciones. Como primer paso, se describe el procedimiento a seguir para implementar el algoritmo en la red mostrada en la figura 4.1. Ella consta de cuatro intersecciones, conectadas entre sı́ por un carril unidireccional. Cada una de las intersecciones se han numerado de 1 a 4, con el fin de definir 4 subsistemas. Adicionalmente, se numeran las vı́as que existen, definiendo xs como la vı́a que comunica dos intersecciones. Estas vı́as numeradas.

(37) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 28. x2 ←− 1. 2. ←−. ←−. ←−. x3. x1. x4. 4. 3. ←− x5. Figura 3.1: Red de cuatro intersecciones corresponden a las vı́as que tienen semaforización. Aquellas que no tengan numeración ni señalización deben asumirse como vı́as de salida o entradas no controladas al sistema. A continuación se listan uno a uno los pasos que se deben seguir para realizar la implementación de DMPC.. ¯ 1. Definir conjuntos I(m), I(m), C(m), C(m, k) 2. Definir matrices Bmi 3. Definir el vector inicial de control um (0) (tiempos de verde) de cada subsistema. 4. Definir el estado xm (0) del sistema, es decir, las colas de cada intersección. 5. Construir formulación compacta para x̄m , ūm , Ām , B̄mi , Q̄m , R̄m , C̄m , D̄m 6. Basado en la formulación compacta, se formulan Hmij , gmi , gmm para luego obtener gm y Hm 7. Enunciar la dinámica en términos de espacio de estados, empleando las matrices definidas en pasos previos. 8. Plantear el problema de optimización en términos de la formulación compacta obtenida en el numeral 8 y ūm.

(38) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 29. 9. Se resuelve el problema cuadrático dependiendo del método de optimización escogido. 10. Predecir todos los xm (k) para k ∈ [0, T ] Los anteriores pasos resultan una guı́a básica para la formulación de DMPC, sin embargo, ignora demás procesos que han de tenerse en cuenta en la simulación basada en la plataforma VISSIM - MATLAB bajo la cual se trabaja. A continuación, se detalla cada uno de los pasos para un caso base de 4 intersecciones. Para posteriores análisis se realiza el mismo procedimiento, obviando su desarrollo detallado, presentándolo sólo para la red de cuatro intersecciones.. 3.4.1. Paso número 1: definición de conjuntos. I(m) puede entenderse como el conjunto de intersecciones que afectan el subsistema m, incluyendo el subsistema m también en el conjunto. Entonces, se definen cada uno de los conjuntos como se muestra en la ecuación 3.14. I(1) = {1, 2}. I(2) = {2, 3, 4} I(3) = {1, 3}. (3.14). I(4) = {3, 4} ¯ Ahora, es pertinente definir I(m), entendiéndolo como las intersecciones sobre las cuales el subsistema m tiene efecto, sin incluir el subsistema m. Para cada una de los subsistemas, se definen los subconjuntos, tal y como se muestra en la ecuación 3.15.

(39) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. ¯ = {3} I(1) ¯ = {1} I(2). ¯ = {2, 4} I(3) ¯ = {2} I(4). 30. (3.15). Se definen los conjuntos C(m) que corresponden a los pares de términos cuadráticos que dependen de ūm , para este caso especı́fico las vı́as que ingresan al subsistema, ası́ como del subsistema m en sı́ mismo. Los conjuntos se presentan en 3.16. C(1) = { (1, 1), (1, 2), (2, 1) }. C(2) = { (2, 2), (2, 3), (2, 4) , (3, 2), (4, 2) } C(3) = {(3, 1), (3, 3), (1, 3) }. (3.16). C(4) = {(4, 3), (4, 4), (3, 4)}. Se definen los conjuntos C(m, k) que corresponden a los pares de términos cuadráticos que dependen de ūm , para este caso especı́fico las vı́as que salen del subsistema, ası́ como del subsistema m en sı́ mismo. Los conjuntos se presentan en 3.17. C(1, 3) = {(1, 1), (1, 3), (3, 1)} C(2, 1) = {(2, 1), (2, 2), (1, 2)}. C(3, 2) = {(3, 2), (3, 3), (3, 4), (4, 3), (2, 3)} C(3, 4) = {(3, 3), (3, 4), (4, 3)}. C(4, 2) = {(4, 2), (4, 3), (4, 4), (3, 4), (2, 4)}. (3.17).

(40) 31. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.4.2. Paso número 2: definición de matrices Bmi. Las matrices Bmi se encargan de modelar la red. Estas se basan en el modelo Store-AndForward presentado por Papageorgiou en [5]. Al basarnos en un esquema distribuido, se deben definir cada una de las matrices para cada intersección de manera independiente. El número de matrices está dictado por la relación de vecindad: el número de matrices corresponde a la dimensión del vector I(m). Las matrices Bmi donde m = i representan los flujos de salida de una intersección, por lo cual son modelados negativos. Estos flujos de salida dependen del valor del tiempo de discretización τ , el tiempo de ciclo C, y el valor del flujo de saturación Sj de la lı́nea. El flujo de saturación se calcula en base a los flujos de entrada y salida de la intersección en cuestión ası́ como de los flujos de entrada y salida de bahı́as de parqueo. Cuando tenemos matrices Bmi donde m 6= i estamos. modelando el llenado de las colas. Adicionalmente a los términos introducidos en el caso de m = i, se debe adicionar la probabilidad de giro de una vı́a a otra, denotada por ρi,j , comprendida entre cero y uno.. Definición de matrices Bmi para la intersección número 1 Como se mencionó en la descripción, se definen matrices dependiendo de cada caso allı́ enunciado. Para la intersección número uno, se presentan las matrices en 3.18. B11 = τ. . −Sx2 C. .  B12 = τ ρx3 ,x2 SCx1. ρx4 ,x2. Sx4 C. . (3.18). Definición de matrices Bmi para la intersección número 2 A continuación se definen las matrices Bmi para la intersección número dos y se presentan en 3.19. B22 = τ. −Sx3 C. 0. 0. −Sx4 C. ! B23 = τ. ρx1 ,x3 0. Sx1 C. ! B24 = τ. !. 0 ρx5 ,x4. Sx5 C. (3.19).

(41) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 32. Definición de matrices Bmi para la intersección número 3 A continuación se definen las matrices Bmi para la intersección número tres y se presentan en 3.20. B33 = τ. . −Sx1 C. .   B31 = τ ρx2 ,x1 SCx2. (3.20). Definición de matrices Bmi para la intersección número 4 A continuación se definen las matrices Bmi para la intersección número cuatro y se presentan en 3.21. B44 = τ. 3.4.3. . −Sx5 C. .   B43 = τ ρx1 ,x5 SCx1. (3.21). Paso número 3: definición del vector inicial de control um (0). El vector inicial de control se define a criterio del programador. Al no tener certeza del estado de la red, se asume un control con señales constantes, donde cada uno de los tiempos de verde de las vı́as tiene un valor fijo. Para esta situación, se ha definido un tiempo de verde para cada una de las intersecciones. Se debe garantizar que los vectores de control definidos estén dentro del conjunto factible definido por las restricciones del problema de optimización. En este caso, la primera restricción dicta un tiempo de verde mı́nimo de 10 segundos y un tiempo máximo de 90 segundos. La segunda restricción indica que la suma de los tiempos de verde de todas las fases, que debe ser igual a 90. Considerando ésto, los vectores de control inicial se aprecian en 3.22   u1 (0) = 90. u2 (0) =. ! 45 45.   u3 (0) = 90.   u4 (0) = 90. (3.22).

(42) 33. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.4.4. Paso número 4: definir el estado xm (0) del sistema. Para definir el estado inicial de las colas del sistema, se pueden plantear diferentes escenarios, seleccionados en función de los objetivos buscados. Para este caso, se ha definido un estado inicial de 0 vehı́culos por intersección, obteniendo los estados iniciales mostrados en 3.23. x1 (0) = 0 x2 (0) = 0 x3 (0) = 0 x4 (0) = 0. 3.4.5. (3.23). Paso número 5: construcción de la formulación compacta. Para realizar la formulación compacta, nos remontamos a las ecuaciones mostradas en 3.3 y 3.4. Hay que recordar que las matrices A son matrices identidad y son ignoradas pues no representan modificaciones en el sistema. Según la formulación presentada en los pasos anteriores, en 3.24 se presentan las matrices y vectores para este caso.. .  x1 (1)  .  .  x̄1 =   .  x1 (110). . 110×1. .  u1 (0)  .  .  ū1 =   .  u1 (109).  x2 (1)  .  .  x̄2 =   .  x2 (110). . 110×1. . 110×1.  u2 (0)  .  .  ū2 =   .  u2 (109).  x3 (1)  .  .  x̄3 =   .  x3 (110). . 110×1. . 110×1.  u3 (0)  .  .  ū3 =   .  u3 (109).  x4 (1)  .  .  x̄4 =   .  x4 (110). 110×1. . 110×1.  u4 (0)  .  .  ū4 =   .  u4 (109). 110×1.

(43) 34. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. . B̄11. 0. 0.  B11 B11 0   . .. .. =  .. . .  B  11 B11 B11 B11 B11 B11. . B̄22. B11. B22. 0. 0.  B22 B22 0   . .. .. =  .. . .  B  22 B22 B22 B22 B22 B22. .... 0. .  0    0   ... 0   . . . B11. ... .. .. B̄12. B12 B12 B12. 110×110. .... 0. .  0    0   ... 0   . . . B22 ... ....  B12 0 0  B12 B12 0   . .. .. =  .. . .  B  12 B12 B12. B̄23. 220×220.  B23 0 0  B23 B23 0   . .. .. =  .. . .  B  23 B23 B23 B23 B23 B23. .... 0. .  0    0   ... 0   . . . B12 ... .. .. .... 0. 110×220. .  0    0   ... 0   . . . B23 ... .... 220×110. (3.24). B̄33.  B33 0 0  B33 B33 0   . .. .. =  .. . .  B  33 B33 B33 B33 B33 B33. B̄44.  B44 0 0  B44 B44 0   . .. .. =  .. . .  B  44 B44 B44 B44 B44 B44. .... 0. .  0    0   ... 0   . . . B33. ... .. .. B̄31. B31 B31 B31. 110×110. .... 0. .  0    0   ... 0   . . . B44. ... .. .. 110×110.  B31 0 0  B31 B31 0   . .. .. =  .. . .  B  31 B31 B31. B̄43.  B43 0 0  B43 B43 0   . .. .. =  .. . .  B  43 B43 B43 B43 B43 B43. .... 0. .  0    0   ... 0   . . . B31 ... .. .. 110×110. .... 0. .  0    0   ... 0   . . . B43 ... .. .. 110×110. Para definir las matrices Q̄m y R̄m , se asumen que son matrices identidad multiplicadas por un factor de peso que variará entre cero y uno. En los pasos siguientes, cuando se formule la función objetivo, se podrá observar lo anteriormente mencionado. Es necesario definir las matrices Cm y Dm para cada uno de los casos, que incluirán las.

(44) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 35. restricciones a cada uno de los problemas enunciados. Cm no es necesario usarlo, por ende solo se trabajará con la restricción de igualdad, que modela el tiempo máximo de verde por intersección. Por ello, Dm corresponde a un vector de unos, tal y como se observa en 3.26. (3.25). D1 = [1] D2 = [11] D3 = [1] D4 = [1]. Definiendo el vector dm de la misma forma. (3.26). d1 = [60] d2 = [30 30] d3 = [60] d4 = [60]. En cuanto a las matrices D̄m , se resuelve el producto de Kronecker, tal y como se observa en 3.27.  1  0  D̄1 =  .  ..  0.  1  0  D̄2 =  .  ..  0. 0 ... 1 ... .. . . . . 0 ....  0 ... 0  1 . . . 0   .. . . . 0 .  0 ... 1.  0  0   0  1. 110×110. 110×110.  1  0  ⊗ [1] =  .  ..  0.  1  0  ⊗ [1 1] =  .  ..  0. 0 ... 1 ... .. . . . . 0 ....  0  0   0  1. 110×110. 1 0 0 ... 0 0. .  1 . . . 0 0   .. . . . 0 0 .  0 0 0 ... 1 1 0 .. .. 1 .. .. 110×220. (3.27).

(45) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. . 1  0  D̄3 =  .  .. . 0 ... 1 ... .. . . . .. 0 0 .... . 1  0  D̄4 =  .  .. . 0 ... 1 ... .. . . . .. 0 0 ....  0  0   0  1. 110×110.  0  0   0  1. 110×110.  1  0  ⊗ [1] =  .  ..  0  1  0  ⊗ [1] =  .  ..  0. 0 ... 1 ... .. . . . . 0 ... 0 ... 1 ... .. . . . . 0 .... 36.  0  0   0  1. 110×110.  0  0   0  1. 110×110. Ahora es necesario definir los vectores d̄m = [d0m . . . d0m ]0.   90   90   d̄1 =  .   ..    90. 110×1. 3.4.6.   90   90   d̄2 =  .   ..    90. 220×1.   90   90   d̄3 =  .   ..    90. 110×1.   90   90   d̄3 =  .   ..    90. (3.28). 110×1. Paso número 6: formulación de Hmij , gmi , gmm para luego obtener gm y Hm. Basada en las definiciones previas, se formulan las matrices Hmij.

(46) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 37. 0 0 H121 = B̄12 Q̄1 B̄11 = q B̄12 B̄11 0 0 H112 = B̄11 Q̄1 B̄12 = q B̄11 B̄12 0 0 H223 = B̄22 Q̄2 B̄23 = q B̄22 B̄23 0 0 H224 = B̄22 Q̄2 B̄24 = q B̄22 B̄24 0 0 H232 = B̄23 Q̄2 B̄22 = q B̄23 B̄22 0 0 H242 = B̄24 Q̄2 B̄22 = q B̄24 B̄22. (3.29). 0 0 H331 = B̄33 Q̄3 B̄31 = q B̄33 B̄31 0 0 H313 = B̄31 Q̄3 B̄33 = q B̄31 B̄33 0 0 H443 = B̄44 Q̄4 B̄43 = q B̄44 B̄43 0 0 Q̄4 B̄44 = q B̄43 B̄44 H434 = B̄43. Como se puede apreciar en 3.29, las matrices Q̄m se reemplazan por un factor externo común que representa la penalización en el cambio del vector de estados. Para este caso, q = 0.5. Basada en las definiciones previas, se formulan las matrices gmi , teniendo en cuenta la misma consideración para Q̄m y asumiendo Ām como matrices identidad.. 0 0 x1 (0) Q̄1 Ā1 x1 (0) = q B̄11 g11 = B̄11 0 0 g12 = B̄12 Q̄1 Ā1 x1 (0) = q B̄12 x1 (0) 0 0 x2 (0) Q̄2 Ā2 x2 (0) = q B̄22 g22 = B̄22 0 0 g23 = B̄23 Q̄2 Ā2 x2 (0) = q B̄23 x2 (0) 0 0 g24 = B̄24 Q̄2 Ā2 x2 (0) = q B̄24 x2 (0). g31 = g33 =. 0 B̄31 Q̄3 Ā3 x3 (0) 0 B̄33 Q̄3 Ā3 x3 (0). = =. (3.30). 0 x3 (0) q B̄31 0 q B̄33 x3 (0). 0 0 g43 = B̄43 Q̄4 Ā4 x4 (0) = q B̄43 x4 (0) 0 0 g44 = B̄44 Q̄4 Ā4 x4 (0) = q B̄44 x4 (0). Basada en las definiciones previas, se formulan las matrices gm . No se desarrollan explı́citamente por su gran extensión, sin embargo, se enuncian sus parámetros.. 1 0 1 0 + H112 )ū2 + g11 + (H331 + H313 )ū3 + g31 g1 = (H121 2 2.

(47) 38. CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. g2 =. 1 X 1 0 0 (H2i2 + H22i )ūi + g22 + (H112 + H121 )ū1 + g12 2 2. (3.31). i={3,4}. 1 X 1 0 + H331 )ū1 + g33 + g3 = (H313 2 2. X. 0 (Hki3 + Hk3i )ūi + g23 + g43. k={2,4} (i,3)∈C(3,k). 1 X 1 0 0 + H443 )ū4 + g44 + (H2i4 + H24i )ūi + g24 g4 = (H434 2 2 i={3,2}. Basada en las definiciones previas, se formulan las matrices Hm . No se desarrollan explı́citamente por su gran extensión, sin embargo, se enuncian sus parámetros. Es necesario definir primero las matrices Hmmm. 0 0 B̄11 + R̄1 Q̄1 B̄11 + R̄1 = q B̄11 H111 = B̄11 0 0 H222 = B̄22 Q̄2 B̄22 + R̄2 = q B̄22 B̄22 + R̄2 0 0 B̄33 + R̄3 Q̄3 B̄33 + R̄3 = q B̄33 H333 = B̄33. (3.32). 0 0 H444 = B̄44 Q̄4 B̄44 + R̄4 = q B̄44 B̄44 + R̄4. H1 = H111 + H311 H2 = H222 + H222 H3 = H333 + H233 + H433. (3.33). H4 = H444 + H244. 3.4.7. Paso número 7: definición de la dinámica del sistema. Una vez modelado el sistema con Store-and-Forward, se procede a enunciar la dinámica de cada uno de los subsistemas. Basados en la dinámica expuesta en 3.2, se formulan las dinámicas para cada una de las intersecciones, tal y como se muestra en 3.34 x1 (k + 1) = x1 (0) +. k X X l=1 i∈{1,2}. B1i ui (k − l).

(48) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. x2 (k + 1) = x2 (0) +. k X X l=1 i∈{2,3,4}. x3 (k + 1) = x3 (0) +. k X X l=1 i∈{1,3}. x4 (k + 1) = x4 (0) +. k X X l=1 i∈{3,4}. 3.4.8. B2i ui (k − l). 39. (3.34). B3i ui (k − l) B4i ui (k − l). Paso número 8: plantear el problema de optimización en términos de la formulación compacta. En los anteriores pasos, se observa el desarrollo de cada una de las matrices necesarias para formular el problema de optimización. en 3.35 se muestran cada uno de los problemas de optimización. P̂1 = min 12 ū01 H1 ū1 + g10 ū01 s.a. D̄1 ū1 ≥ d¯1 P̂2 = min 12 ū02 H2 ū2 + g20 ū02 s.a. D̄2 ū2 ≥ d¯2 P̂3 = min 12 ū03 H3 ū3 + g30 ū03 s.a. D̄3 ū3 ≥ d¯3 P̂4 = min 12 ū04 H4 ū4 + g40 ū04 s.a. D̄4 ū4 ≥ d¯4. (3.35).

(49) CAPÍTULO 3. DISTRIBUTED MODEL PREDICTIVE CONTROL. 3.4.9. 40. Paso número 9: solución del problema cuadrático. Para solucionar el problema cuadrático, existen diferentes métodos. En [45] se expone el método de direcciones factibles y programación cuadrática. El énfasis en este punto afecta el desempeño temporal del controlador. En [45] se aprecia un considerable beneficio temporal empleando programación cuadrática sobre el método basado en direcciones factibles. En los análisis presentados en secciones posteriores, la optimización se realiza con ayuda de la función quadprog de MATLAB, empleando el método del punto interior para alcanzar el óptimo. En esta formulación con quadprog es fácil adaptar las restricciones de valores mı́nimos y máximos de tiempos de verde, teniendo vectores independientes para modelarlas. Por esta razón se pudo ignorar el planteamiento de C̄m en la formulación del problema de optimización.. 3.4.10. Paso número 10: predicción de todos los xm (k) para k ∈ [0, T ]. Una vez se cuente con la dinámica de cada uno de los subsistemas se procede a realizar la predicción a lo largo de todo el horizonte de predicción basados en las ecuaciones 3.34. T en este caso se ha establecido en 110, con un tiempo de discretización de 1 segundo. Este paso es totalmente mecánico y depende de cada proceso controlado..

(50) Capı́tulo 4 Enunciado del Problema Es totalmente necesario ajustar los casos simulados a los presentes en el dı́a a dı́a de nuestro entorno. Si bien se sabe, el estudio y desarrollo de algoritmos de control busca que todo resultado obtenido sea implementado, empleando sus ventajas en beneficio de todo aquel que tenga contacto con el sistema. Para esto, es de vital importancia conocer la planta que ha de ser controlada, con el fin de ajustar los diferentes parámetros del sistema de control conforme a la información obtenida. Si la planta se comporta de acuerdo a su modelamiento, el control será totalmente decisivo en el comportamiento del sistema, logrando el desempeño que se buscaba cuando se pensó en implementar la estrategia de control. Sin embargo, fuera del papel la situación es diferente. En general, los modelos que emplea el algoritmo de control difieren de la planta real, generando una respuesta fuera de los parámetros establecidos en un principio. En estos casos donde el algoritmo de control supervisa el estado de una planta real, es necesario realizar ajustes en los parámetros que modelan la planta, acercándose cada vez más a la respuesta deseada del sistema. En cuanto al control de tráfico urbano, el modelo Store-and-Forward presentado por Papageorgiou en [5] es empleado para modelar la red de tráfico urbana. Como se dijo en el párrafo anterior, este modelo necesita ajustes si ha de ser llevado a la vida real. Con propósitos académicos, se definen parámetros que probablemente no corresponden con la red simulada, sin embargo permiten dilucidar el desempeño de los algoritmos 41.

Referencias

Documento similar