Predicción de la demanda de transporte público en intersecciones viales mediante redes neuronales

(1)

UNIVERSIDAD NACIONAL DE INGENIERÍA

FACULTAD DE INGENIERÍA CIVIL

TESIS

PREDICCIÓN DE LA DEMANDA DE TRANSPORTE PÚBLICO EN

INTERSECCIONES VIALES MEDIANTE REDES NEURONALES

PARA OBTENER EL TÍTULO PROFESIONAL DE INGENIERO CIVIL

ELABORADO POR

MARYLIN RUBI UCHASARA HUARACHI

ASESOR

MSc. LEONARDO FLORES GONZALEZ

LIMA- PERÚ

(2)

Dedicatoria:

Esta tesis se lo dedico a mis padres y

hermanos por darme la oportunidad de

tener una vida privilegiada llena de

bendiciones, y a Dios por regalarme a la

persona más importante de mi vida, mi

(3)

Agradecimientos:

Le agradezco profundamente a mi asesor el MSc.

Leonardo Flores y su esposa por los consejos, apoyo

y guía que me ofrecieron. Agradezco a los docentes

y personal del departamento académico de ciencias

básicas por el gran apoyo brindado, el cual me

permitió desarrollarme en muchos aspectos.

Finalmente, a mis amigos y compañeros los cuales

(4)

ÍNDICE

RESUMEN ...3

ABSTRACT ...4

PRÓLOGO ...5

LISTA DE TABLAS ...6

LISTA DE FIGURAS ...7

LISTA DE SÍMBOLOS Y SIGLAS ...11

INTRODUCCIÓN ...12

CAPÍTULO I: GENERALIDADES...14

1.1ANTECEDENTES ...14

1.2PLANTEAMIENTODELPROBLEMA ...14

1.2.1 Problemática ...14

1.2.2 Planteamiento del problema ...15

1.3DEFINICIÓNDEOBJETIVOS ...15

1.3.1 Objetivo Principal ...15

1.3.2 Objetivos Específicos ...15

1.4 HIPÓTESIS ...16

1.5 JUSTIFICACIÓN ...16

1.6METODOLOGÍADETRABAJO ...17

1.7TIPODEINVESTIGACIÓN ...17

1.8CONTENIDO ...17

CAPÍTULO II: FUNDAMENTO TEÓRICO Y ESTADO DEL ARTE ...18

2.1ESTADODELARTE ...18

2.2FUNDAMENTOTEÓRICO ...20

2.2.1 Sistema de Bus Rápido (BRT) ...20

2.2.2 Transporte Público en Lima ...22

2.2.3 Diseño Operacional...23

2.2.4 Redes Neuronales Artificiales ...25

2.2.5 Modelos de Simulación de Tráfico ...28

CAPÍTULO III: METODOLOGÍA DE MEDICIÓN DE DATOS ...31

3.1LEVANTAMIENTODEINFORMACIÓN ...32

(5)

3.1.2 Estudio de Ocupación Visual ...36

3.2PROCESAMIENTODEDATOS ...40

3.2.1 Preprocesamiento de la Información ...41

3.2.2 Procesamiento de la Información ...42

3.2.3 Resultados del Procesamiento ...45

CAPÍTULO IV: PROPUESTA DE MODELO NUMÉRICO ...53

4.1CASODEESTUDIO ...53

4.2DESCRIPCIÓNDEALGORITMOSSOLUCIÓN ...56

4.2.1 Algoritmo para la generación de llegada de buses ...56

4.2.2 Algoritmo para la predicción a corto plazo ...60

4.3SIMULACIÓNDETRÁFICO...62

4.3.1 Generación de llegada de buses ...64

4.3.2 Etapa de ajuste ...64

4.3.3 Resultados de Simulación ...65

4.4PREDICCIÓNDELMODELO...66

4.4.1 División de la base de datos ...66

4.4.2 Entrenamiento ...66

4.4.3 Simulación ...68

4.5CALIBRACIÓNDELMODELO ...70

4.5.1 Matriz de confusión ...71

4.5.2 Cantidad óptima de neuronas ...72

CAPÍTULO V: VALIDACIÓN DE LA HIPÓTESIS ...74

5.1ANÁLISISDERESULTADOS ...74

5.2RESULTADOSDEPREDICCIÓN ...76

CAPITULO VI: CONCLUSIONES Y RECOMENDACIONES ...79

BIBLIOGRAFÍA ...82

(6)

RESUMEN

En la presente tesis, se desarrolla un modelo de simulación para la estimación de demanda. Este algoritmo de solución se basa en la utilización de diferentes redes neuronales generadas para la predicción, de criterios estadísticos y de teoría de funcionamiento operacional de líneas de transporte público. La metodología de predicción incluye variables tipo aleatorias.

Para construir el modelo de simulación, es necesario contar con información necesaria para probar distintas particularidades que representan a una red real de transporte público. Para esto se definen diversas variables que interpretan los datos recolectados mediante estudios de campo en la ciudad de Lima (GTU, 2015), que luego se procesan con la metodología propuesta en el presente trabajo de investigación. Todos los modelos fueron calibrados con mediciones realizadas manualmente en puntos específicos de la ciudad y con recursos limitados. En la actualidad no se ha determinado en Lima si las bases establecidas para la planificación del transporte público son confiables. Con esta investigación se propone una metodología orientada a la mejora de planificación urbana.

(7)

ABSTRACT

In the present thesis, a simulation model is developed for the estimation of demand. This algorithm of the solution is based on the utilization of different neuronal networks generated for the prediction of statistical criteria and of theory of the operational functioning of lines of public transport. The methodology of prediction includes random type variable.

To construct the simulation model, it is necessary to have the necessary information to sample the different particularities to represent a real public transport network. For this are defined diverse variables to interpret the information gathered by means of field studies in the city of Lima (GTU, 2015), that later are processed by the methodology proposed in the present investigation work. All the models were calibrated with manually realized measurements in specific points of the city with limited resources. Actually, it has not decided in Lima if the bases established for the planning of the public transport are reliable. This research proposes one a methodology orientated to the improvement of town planning.

(8)

PRÓLOGO

Existen varios caminos para adentrarse en el conocimiento de una disciplina. Una forma tradicional es a partir de una base de datos histórica, otro es identificar los temas relevantes y presentarlos en términos analíticos, incluyendo la información acumulada. En la presente tesis se trata de sintetizar estos dos caminos, para presentar la PREDICCIÓN DE LA DEMANDA MEDIANTE REDES NEURONALES. El primer elemento destacable de la tesis radica en una bibliografía que abarca desde los orígenes hasta los aportes más recientes, garantizando un conocimiento secuencial y del comportamiento del transporte público en Lima.

Es importante destacar que la demanda de pasajeros en el transporte público desde sus orígenes ha sido concebida como un campo de investigación y de estudio preferentemente académico, dejando sus aplicaciones a quienes cultivan otras disciplinas.

El pronosticar algún fenómeno repercute en la toma de decisiones y en la planificación de recursos para una mayor y eficiencia producción. Conocer qué suceso va a pasar en el futuro permite tomar ciertas medidas preventivas. Para realizar un pronóstico es necesario entender la técnica que se está utilizando hasta saber los posibles costos que generan su realización. Claro está que los datos que se recolectan deberán ser fiables ya que, al momento de la construcción de algún modelo, la predicción deba ser lo más realista posible y además ser confiable.

En este trabajo de tesis, el objetivo principal es realizar la predicción y la comparación de estos resultados para un conjunto de datos, los que corresponden a las demandas proporcionadas por Gerencia de Transporte Urbano (GTU). Son dos los enfoques estudiados para lograr tal objetivo, la metodología y el uso de redes neuronales artificiales. Esta última ha brindado soluciones a problemas en donde los datos presentan alguna perturbación o que se tengan datos faltantes a la hora de resolver dicho problema.

Finalmente, para el análisis de los datos se utilizó MATLAB que es un software de simulación matricial, específicamente el Toolbox de redes neuronales.

(9)

LISTA DE TABLAS

Tabla N° 1 Criterio de Chauvenet para rechazo de valor medido …………. 29

Tabla N° 2 Tipología y capacidad de buses ………. 34

Tabla N° 3 Velocidad promedio según tipología ……….. 34

Tabla N° 4 Características físicas de las intersecciones ……… 37

Tabla N° 5 Parámetros de la distribución de normalidad y Poisson ………. 48

Tabla N° 6 Características físicas según tipología ……….. 50

Tabla N° 7 Resultados de demanda y flota para cada ruta ……… 51

Tabla N° 8 Errores de validación y tiempos de entrenamiento para los distintos números de neuronas en la capa oculta. ………..….. 73

Tabla N° 9 Resultados de la demanda de las intersecciones para simulación y campo ………... 76

Tabla N° 10 Índices de error medio cuadrático medio para cada

intersección……… 78

(10)

LISTA DE FIGURAS

Figura N° 1 Derecha Congestionamiento del transporte (fuente: el comercio) Izquierda Red Vial de Transporte de lima ……… 20

Figura N° 2 Autobús articulado utilizado en los corredores de lima, similar a los que se propondrán en los sistemas BRT. (1) Autobús articulado (2) Validación del billete a bordo (3) Parada ………. 21

Figura N° 3 Representación de los tipos de redes de transporte existentes (a) sistema descentralizado (b) sistema de tronco alimentador (c) corredores estratégicos (d) corredor de la avenida universitaria ………. 22

Figura N° 4 Distribución de la demanda en la red durante el día. Dimensiones de la capacidad Fuente: Tomado y adoptado de Roderick et al. (2004) …. 23

Figura N° 5 Esquema de un modelo de una Neurona Artificial ………. 24

Figura N° 6 Ilustración esquemática de una red neuronal de Retro propagación de tres capas ……….. 25

Figura N° 7 Ilustración esquemática de una red neuronal de SOM ……….…. 27

Figura N° 8 Ilustración esquemática de la detección de valores atípicos ……….…. 28

Figura N°9 Esquema General de Metodología ……… 31

Figura N°10 Mapa de Rutas – JICA 2012 ……… 32

Figura N°11 Esquema de los cambios de ruta que hubo durante el periodo 2012-2015 ……… ……….…. 33

Figura N°12 Valores atípicos observados en la gráfica de carga-paradero, según el estudio de embarque-desembarque ……….. 33

Figura N°13 Formato de encuesta utilizado en el estudio de Embarque-Desembarque ……….…. 35

Figura N°14 Mapa general de ubicación de puntos de ocupación visual ……….. 35

(11)

Figura N°16 Esquema de entradas y salidas a una intersección ………. 37

Figura N°17 Esquema de puntos de ocupación visual y el número de rutas en las vías………... 38

Figura N°18 Formato de encuesta utilizado en el estudio de Ocupación Visual………... 39

Figura N°19 Representación Global de la data procesada……… 39

Figura N°20 Esquema general del preprocesamiento de la información………. 40

Figura N°21 Salidas del paquete de programas del estudio de embarque – desembarque ………. 42

Figura N°22 Representación de las salidas del paquete de programas del estudio de ocupación visual ……… 43

Figura N°23 Correlación entre estudios de Embarque desembarque –

Ocupación visual de una ruta………..……… 44

Figura N°24 Izquierda: Análisis de grupo de dispersión de data, derecha: comportamiento del grupo ganador de la red neuronal para cada estación ………..……… 46

Figura N°25 Ajuste de distribución en la intersección Av. La Marina - Av. Universitaria (CC02-2) ……….……… 47

Figura N°26 Intersecciones de corredor Universitaria, comportamiento general de rutas dentro de una intersección……….……… 49

Figura N°27 Acumulación de rutas de transporte público, en los puntos internos de la intersección, de acuerdo con las subidas, bajadas, y carga. Software: ArcGis……….…….… 49

Figura N°28 Maniobras en cada punto de la intersección……….………… 51

Figura N°29 Vista por satélite de los distritos involucrados para el corredor de estudio……….… 52

Figura N°30 Ubicación y algunas características de las tomas de campo…….…… 53

Figura N°31 Flujograma de la intersección CC02-2……… 54

Figura N°32 Vista del simulador y movimientos dentro de la intersección…….…… 56

(12)

Figura N°34 Diagrama esquemático para la simulación del control de tráfico………...…… 58

Figura N°35 Diagrama esquemático de las variables de entrada a la simulación ………..… 58

Figura N°36 Estructura metodológica propuesta……….……… 59

Figura N°37 Diagrama esquemático de las variables de entrada a la simulación ………..………… 61

Figura N°38 Cola de vehículos en una entrada de múltiples simulaciones del comportamiento de vehículos en una intersección. ……… 62

Figura N°39 Búsqueda de la mejor representación de simulación del comportamiento de tráfico en la intersección ……….…… 63

Figura N°40 Comparación de resultados de simulación vs campo (CS_UNIV-2) ……….………… 64

Figura N°41 Interfaz de entrenamiento y simulación de Neural Network Matlab Toolbox ………..… 65

Figura N°42 Evolución del error durante el entrenamiento ……….………… 65

Figura N°43 Regresión lineal de las respuestas de salida ………..………… 67

Figura N°44 Comparación de la data clasificada vs estimado generado de vehículos que entran y salen de la intersección respectivamente .………..…… 69

Figura N°45 Regresión lineal de la 1er salida y 2da salida de las respuestas

respectivamente……… 69

Figura N°46 Comparación de la data observada de campo vs estimado ………..… 70

Figura N°47 Matriz de Confusión para el predictor con 15 neuronas en la capa oculta ………72

Figura N°48 Matrices de confusión para distintos números de neuronas de la capa oculta ………72

Figura N°49 Tiempos de entrenamiento. Error de validación ………74

(13)

Figura N°51 Resultados de los valores de correlación total, entrenamiento, validación y verificación del modelo predictivo ……… 77

Figura N°52 Salidas del modelo de predicción. Coeficiente de correlación y resultados de predicción de la intersección CC02-2……… 78

(14)

LISTA DE SÍMBOLOS Y SIGLAS

Dmed Demanda media

T Periodo

Dmáx Demanda máxima

TDmáx Periodo de demanda máxima

e Error

W Pesos de la red neuronal

GTU Gerencia de Transporte Público

PROTRANSPORTE Instituto Metropolitano Protransporte de Lima

BRT Bus Rapid Transit

SOM Self-organizing map

JICA Japan International Cooperation Agency

CAF Corporación Andina de Fomento

RNA Redes Neuronales Artificiales

HPC High-performance computing

SIT Sistema Integrado de Transporte

DM Data Mining

TGA Corredor Tacna Garcilazo Arequipa

VBA Visual Basic for Applications

σ Desviación Estándar

(15)

INTRODUCCIÓN

Los sistemas de buses constituyen básicamente el modo de transporte público de la ciudad de Lima, los cuales se realizan en microbús, ómnibus y camioneta rural. Las rutas de transporte público comparten los mismos corredores viales y algunos poseen recorridos extensos. Según la fundación Transitemos, en el 2016 [18] se observaron 31000 vehículos (41% camionetas rurales) de transporte público en circulación, de las cuales se requieren solo 16000 unidades. Esto constituye un exceso de rutas (formales e informales) y sobreposición excesiva de rutas. El costo promedio de operación es más de 4 mil millones de soles anuales.

Por otra parte, la CAF (2011) se refiere sobre el sistema de transporte público de Lima como obsoleto y poco eficiente, con paradas en cada esquina y en algunos casos con varias en la misma cuadra; donde el peatón no posee facilidades para caminar, lo que ocasiona demoras importantes en la movilidad urbana.

Dada la situación actual del transporte público de la ciudad de Lima comentada anteriormente y sustentada por varios documentos de política urbana, se requiere un sistema de gran capacidad debido a los niveles de demanda, en el que se debe emplear montos de inversión moderados.

En esta tesis se procedió a presentar una propuesta conceptual de simulación de aforos vehiculares y predicción de la demanda siendo una medida efectiva y económica para el estudio de la demanda, que permitirá una disminución considerable del congestionamiento, que implica un aumento de la capacidad de la vía.

(16)

La propuesta metodológica consiste en simular cantidades de pasajeros que arriban en intervalos de tiempo utilizando el modelo de Poisson como base, y utilizar los datos históricos disponibles para predecir el flujo futuro durante un de periodo tiempo. En este sentido, en las últimas décadas se ha empezado a hablar de la necesidad de aplicar un pronóstico de los acontecimientos futuros e implementarlo en el diseño vial e infraestructura.

(17)

CAPÍTULO I

GENERALIDADES

1.1 ANTECEDENTES

En la literatura se puede encontrar cuantiosa información acerca del uso generalizado de las redes neuronales en diversos problemas de predicción. Estas técnicas son muy potentes para abordar problemas de transporte. Tal es el caso de la predicción de cola (Chang y Su, 1995), los modelos predictivos basados en redes neuronales recurrentes de tiempo discreto (Pérez Ortiz,2002) y la predicción de demanda de pasajeros en tiempo real para evaluación de estrategias de control en sistemas de transporte público (Valencia Quilodran,2012).

Según Akcelik (1995), el flujo de saturación es una característica básica para calcular la capacidad de una vía que accede a una intersección controlada por un semáforo durante un ciclo de operación, el cual se basa en Mohring (1976), donde fue modelada la aleatoriedad temporal de la demanda en paraderos de los pasajeros que desean subir o bajar, mediante una distribución de Poisson, lo cual da respaldo a nuestra hipótesis. Se aborda la aplicación de colas de Poisson en situaciones propias de la teoría de colas, para procesos de prestación de servicios que se caracterizan por la llegada aleatoria de los clientes al sistema representada a través de una distribución de probabilidad de Poisson.

En este trabajo se tiene por objetivo mostrar el uso del Toolbox de redes neuronales de Matlab, aplicación sobre el cual se soporta este trabajo, con el fin de diseñar y simular propuestas de mejora que se basan en modelos de redes neuronales para predicción de demanda en el corredor de la avenida universitaria.

1.2 PLANTEAMIENTO DEL PROBLEMA

1.2.1 Problemática

(18)

Según una encuesta realizada en el 2008, los limeños consideran que el segundo problema de la ciudad (46% de la población), es el “caos y la mala calidad del transporte público”, detrás de la inseguridad ciudadana (75%) [27]. Estudios financiados por el Banco Mundial indican que se pierden aproximadamente 500 millones de dólares cada año en horas/hombre y en costos operativos debido a las ineficiencias del sistema de transporte urbano [17].

En el año 2015, se desarrollaron estudios de embarque y desembarque para las 399 rutas autorizadas en Lima Metropolitana, donde según Vargas Egos representante de uno de los corredores principales de Lima, sostuvo que cada estudio representa una inversión de 15,000 soles a las empresas [52].

En la práctica, la demanda se puede obtener por métodos basados en encuestas, como la encuesta domiciliaria, entrevista en carretera y la técnica de reconocimiento de matrículas. Estos métodos pueden dar resultados precisos cuando se realizan cuidadosamente. Sin embargo, son a menudo costosos y requieren una gran cantidad de recursos para su implementación [23].

1.2.2 Planteamiento del problema

¿Cómo predecir la demanda de transporte público de pasajeros a partir de simulaciones de aforos vehiculares en intersecciones viales?

1.3 DEFINICIÓN DE OBJETIVOS

1.3.1 Objetivo Principal

Desarrollar un modelo numérico para simulación de aforos vehiculares basado en algoritmos inteligentes, que permita predecir la demanda de transporte público en intersecciones viales.

1.3.2 Objetivos Específicos

• Revisar información actualizada en revistas científicas y tesis acerca de la predicción de la demanda para definir las variables que caracterizan el comportamiento del transporte público en intersecciones viales y los modelos de transporte donde se aplican.

(19)

• Desarrollar herramientas informáticas que permitan analizar de forma adecuada la base de datos creada.

• Predecir y validar la demanda de pasajeros basada en datos de aforos vehiculares mediante redes neuronales.

1.4 HIPÓTESIS

La demanda de transporte público en intersecciones viales puede ser simulada a partir de una red híbrida inteligente entrenada con una base de datos procedente de estudios de embarque-desembarque y ocupación visual.

1.5 JUSTIFICACIÓN

La presente tesis beneficiaría a los usuarios del sistema, a todos los entes locales y nacionales encargados de los estudios de demanda; tales como el Ministerio de Transporte y Comunicaciones, Gobiernos Regionales, Municipalidades y a los ingenieros civiles y de transporte que no aplican o desconocen la metodología propuesta en el presente trabajo.

- IMPORTANCIA

El transporte público permite que las sociedades progresen y es uno de los elementos fundamentales que generan eficiencia en los procesos urbanos. Una ciudad que busca ser productiva requiere de sistemas de transporte público que permitan una eficiente utilización de los escasos recursos disponibles [1]. En el marco generalizado de austeridad en el que se encuentran las administraciones públicas, los estudios de demanda adquieren una importancia todavía mayor [4].

La obtención de información desagregada de la demanda en sistemas reales de transporte público es un problema de vital importancia considerando el costo de la misma [48]. Se han desarrollado una variedad de métodos de estimación usando conteos de tráfico las cuales tienen grandes ventajas económicas en comparación a los métodos de estimación directa tradicionales, siendo estas últimas costosas y se basan en encuestas de tráfico [16].

(20)

1.6 METODOLOGÍA DE TRABAJO

La metodología de investigación seguida en esta tesis para alcanzar los objetivos y demostrar las hipótesis planteadas, es:

- Revisión de artículos de revistas científicas, tesis adecuadas para el desarrollo del fundamento teórico de la tesis.

- Medición en campo para generación de base de datos.

- Procesamiento de datos, mediante algoritmos desarrollados para la presente tesis. - Obtención de la demanda mediante modelo de redes neuronales.

- Validación del modelo.

1.7 TIPO DE INVESTIGACIÓN

En la presente tesis se desarrollan dos tipos de investigación: el método deductivo (construir un modelo y probar sus predicciones frente a observaciones), y el método inductivo (en el que a partir de los datos se intentan inferir el comportamiento de la red).

1.8 CONTENIDO

El presente trabajo está estructurado en cinco capítulos los cuales están organizados en tres partes: Teoría, modelo y aplicaciones.

En el primer capítulo presentamos antecedentes generales, teoría básica de modelos neuronales de predicción, la problemática y definición de objetivos.

En el capítulo 2 se presenta varias generalizaciones de predicción, presenta un análisis sobre una nueva fuente para extraer un modelo de demanda de pasajeros que sea capaz de reflejar de forma más precisa el comportamiento real de un sistema de transporte público.

En el capítulo 3 se muestra la estrategia de toma de datos para los estudios de campo que permite obtener indicadores, los cuales estamos interesados en analizar y procesar utilizando herramientas estadísticas, para aprender de ellos posteriormente.

En el capítulo 4 se presenta una propuesta de predicción de demanda que se utiliza en la aplicación de estrategias para la planificación, se analiza el rendimiento aplicado a un sistema de transporte variando las características de la demanda.

(21)

CAPÍTULO II

FUNDAMENTO TEÓRICO Y ESTADO DEL ARTE

En el presente capítulo se realiza una revisión de literatura. En la primera parte se presenta la revisión de diversos modelos de predicción en transporte existente. Luego, se dan algunos conceptos preliminares y descripción de algunos problemas estudiados en el marco del transporte. Luego, introduciremos algunas definiciones importantes, las cuales usaremos a lo largo del trabajo. También realizaremos un repaso de los principios estadísticos de manejo de información para el desarrollo de esta tesis.

2.1 ESTADO DEL ARTE

En los trabajos que se presentan a continuación hay modelos que proponen una resolución numérica, para la optimización de la demanda, y por otro lado hay modelos simples los cuales se pueden resolver analíticamente. La idea de la sección es presentar algunos de los resultados y analizar varios los modelos presentados por los diversos autores. Se investiga el comportamiento de la demanda por transporte público, de manera de hacer un análisis asociado al diseño optimo operacional del transporte público como presentamos a continuación.

Diseño Operacional de Transporte Público

El transporte público se considera en gran medida como opción viable para el transporte sostenible en las zonas urbanas, ofreciendo ventajas como la mejora de la movilidad, la congestión del tráfico y la reducción de la contaminación atmosférica, y la conservación de la energía. Sin embargo, en los últimos años, se ha visto que la planificación e investigación operacional del transporte viene siendo un problema en extremo complejo, si se intenta resolver de forma global; por lo cual, en literatura especializada se ha optado por subdividir el problema en distintos niveles tales como diseño de rutas, ajuste de frecuencias, elaboración de calendarios, programar autobuses y programar controladores (Ceder y Wilson, 1986) [7].

(22)

basa y analiza un modelo para una estructura de rutas del caso línea aislada, incorporando la restricción de velocidad de operación en buses, número de pasajeros transportados y el tiempo de viaje variable, teniendo un efecto directo en la frecuencia, el tamaño/capacidad de los buses y la operación del sistema en los resultados [24]. Chang y Schonfeld (1991) dan modelos analíticos los cuales permiten determinan las frecuencias, considerando el tiempo de viaje constante, y otras características tales como la demanda a lo largo de un ciclo diario; optimizando los servicios de bus con dependencia temporal y elasticidad en sus características de demanda [46]. Gschwender (2000) desarrolla un modelo analítico de optimización entre la frecuencia y el tamaño de los vehículos en corredores, basándose en un análisis crítico de todos los estudios que tratan el tema, considerando el espaciamiento entre rutas para calcular el tiempo de acceso [21]. Jara-Díaz (1980), Gschwender (2003) y Ortega (2008) realizan estudios de los efectos de omitir el costo de los usuarios en el diseño óptimo del transporte público, dando un análisis del supuesto de demanda uniformemente distribuida en el corredor [25] [44] [35]. Fernández et al (2005) estudia la influencia de la estructura de demanda sobre un corredor en la producción de viajes, ilustrando casos posibles de demanda uniforme, homogénea y rutas alimentadoras, donde define a la demanda uniforme como una configuración de viajes que produce una carga uniforme de pasajeros sobre la ruta, demanda homogénea supone una distribución homogénea de los viajes entre todos los pares origen-destino y rutas alimentadoras es cuando hay un solo destino (el final de la ruta) [14].

Redes Neuronales

(23)

Predicción en transporte público

En la literatura, varios autores diseñan sus estrategias de control o técnicas convencionales de predicción basado en la especificación de funciones de costos, determinación de valores óptimos de la frecuencia o la capacidad de los vehículos [21] [24] [44], siendo herramientas fundamentales para obtener un buen desempeño en cualquier sistema dinámico, por lo que su aplicación a un sistema de transporte público resulta muy adecuada. Se estudiaron distintos modelos, tales como Eberlein et ál (2001). señalan que un modelo estocástico implica algoritmos mucho más complejos que uno determinístico, siendo menos eficiente si hay muchos tipos de aleatoriedad involucrados [12]. Otros modelos se basan en la predicción de cada instante de llegada del pasajero, requiriendo de un cálculo intenso que aumenta en forma proporcional a la cantidad de paraderos y tiempo de simulación [19], por lo que al aplicarlo a un modelo de red de transporte para predecir la demanda resulta no práctica. La demanda es desconocida e incierta, siendo modelada como una perturbación para un esquema predictivo. Existen propuestas de control a través de estrategias de control predictivo híbrido (HPC) que tienen como ventaja valorar no solamente las acciones pasadas sino el comportamiento futuro. Teniendo una propuesta de control predictivo híbrido presentada por Yinghui y Xilin (2010) [51] y Sáez et ál (2012) [43] en la literatura de transporte público, las estrategias de control son habitualmente desarrolladas en forma heurística y no poseen en general la sistematización tradicional. En concreto, el problema de predicción se da a partir de estimaciones procedentes de modelos desagregados.

2.2 FUNDAMENTO TEÓRICO

2.2.1 Sistema de Bus Rápido (BRT)

(24)

en América Latina y ha sido una inspiración clave para otras ciudades del continente [11], incluyendo Bogotá (TransMilenio) donde en varias publicaciones se ha afirmado que esta opción llamada BRT es muy eficiente para mejorar los sistemas de transporte público en países en desarrollo con base en parámetros de capacidad, costo, tiempo de construcción y otras variables [37].

En México, la ciudad de León fue el primero en aplicar el modelo BRT en 2003. La ciudad de México implementa el modelo en 2005, su BRT fue llamado Metrobús donde surgió a partir de un mayor esfuerzo para hacer frente a la mala calidad del aire en la Ciudad de México, pero convertido en una baja emisión de carbono [28].

En Chile se tiene el Transantiago, el cual reformó por completo la malla de recorridos, diseñando un sistema basado en el uso de servicios alimentadores y troncales, en conjunto con el Metro de Santiago, el cual se inspiró en el sistema Transmilenio de Bogotá. Se realizó una enorme inversión en infraestructura (carriles bus y estaciones) y en la flota de vehículos, y además se estableció el uso de una tarjeta inteligente con el fin de establecer un sistema tarifario integrado [19].

En Lima se tiene el Metropolitano, pero la implementación no progresiva de BRT generaría un problema socio económico, sobre todo en los sectores de bajos recursos económicos, ya que estos sectores invierten el 17% de sus ingresos en transporte, el sistema actual a pesar de caótico es una alternativa económica para estos sectores, por lo que un proceso de transición de sistemas de transporte resulta una medida adecuada [17].

(25)

(1)

(2)

(3)

Por otro lado, la capacidad presenta varias dimensiones: la capacidad de diseño, que depende de políticas de operación, y la capacidad operada, que está en función de la frecuencia y el tamaño del vehículo. Ambas no son necesariamente iguales a la capacidad máxima, y tampoco son iguales entre sí (Roderick et ál, 2004) [40]. El BRT está compuesto por buses articulados los cuales pueden transportar desde 150 a 300 pasajeros. Su uso ha permitido trasladar volúmenes de 14 000 pasajeros por hora, sentido y pista, con una capacidad de hasta 18 000.

Actualmente, se cuenta para el corredor Javier Prado del consorcio ECO Express Javier Prado, con buses articulados con capacidad para 160 pasajeros y vehículos con capacidad para 115 pasajeros. Los buses biarticulados cuestan unos de 400 000 dólares cada uno, lo cual es caro, pero mucho menos que los buses del corredor, que nunca bajan del millón de dólares. [7]

Figura N° 2 Autobús articulado utilizado en los corredores de Lima, similar a los que se propondrán en los sistemas BRT. (1) Autobús articulado (2) Validación del billete a

bordo (3) Parada.

2.2.2 Transporte Público en Lima

(26)

Figura N° 3 Representación de los tipos de redes de transporte existentes (a) sistema descentralizado (b) sistema de tronco alimentador (c) corredores estratégicos (d)

corredor de la avenida Universitaria.

También se presentan en la Figura N°3 (b) los sistemas tronco alimentador que acercan a los usuarios a puntos de transferencia en donde abordan vehículos de mayor capacidad que circulan sobre corredores segregados haciendo paradas en estaciones preestablecidas y en la Figura N°3 (c) los corredores estratégicos corresponden son aquellas vías que tienen una mayor vocación de utilización en vías y equipamientos urbanos y de gestión del tránsito para garantizar los mayores beneficios a los usuarios de los buses, donde por último la Figura N°3 (d) es la representación del corredor universitaria.

2.2.3 Diseño Operacional

El diseño operacional se describe como un procedimiento que permite ajustar la oferta de un sistema a la demanda prevista, estableciendo un esquema de producción de servicio [3], donde el objetivo fundamental de la planificación operacional es poner en práctica las decisiones tácticas al menor costo, determinándose la asignación de vehículos, la asignación de conductores y la operación de terminales entre otras variables, que generalmente no afectan el nivel de servicio [4]. Según Fernández y Planzer (2002), argumentan que la capacidad de un sistema de buses se ve limitada por la operación en los paraderos [15]. Por ello cuando la demanda de pasajeros alcanza o

(a

)

(b)

(27)

excede la capacidad, afecta la calidad del servicio, la velocidad y la carga de pasajeros (Ryus et ál, 2003) [41]. Por esta razón es muy importante garantizar que la capacidad sea adecuada en cualquier sistema de transporte público. Según Roderick et ál (2004), la capacidad tiene varias dimensiones: capacidad de diseño (carga y frecuencia de servicio definida), capacidad gestionada (plan de frecuencia y tamaño del vehículo) [40].

Figura N° 4 Distribución de la demanda en la red durante el día. Dimensiones de la capacidad Fuente: Tomado y adoptado de Roderick et al. (2004)

Varios autores recurren a técnicas de modelación sofisticadas para representar detalles de operación de transporte público, adaptando los paquetes comerciales de simulación, obteniendo resultados satisfactorios en términos de modelación.

A continuación, definimos, de forma complementaria, un conjunto de parámetros relaciones con la operación de las rutas (Molinero y Sánchez, 1998) [32]:

- Horario de servicio: se refiere a la hora de inicio del servicio en la mañana y la hora a la que se despacha el último vehículo en la noche. Entre estas dos horas se realiza toda la programación de despachos.

- Intervalo: es la porción de tiempo, comúnmente expresada en minutos, entre dos salidas sucesivas de vehículos de transporte público en una ruta.

- Frecuencia de servicio: también se le denomina frecuencia de despacho y corresponde al número de vehículos que se despacha durante una hora (o cualquier periodo de tiempo considerado).

(28)

- Tiempo de terminal: es el tiempo adicional que un vehículo espera en un terminal. Su propósito es contar con tiempo para dar vuelta al vehículo, para dar un descanso al conductor y permitir los ajustes necesarios en el horario.

- Longitud del recorrido: es la longitud de los desplazamientos hechos por los buses a lo largo del periodo.

Basado en el ítem anterior enunciamos a las definiciones más importantes que servirán de guía para la presente tesis, y mostrar con la mayor claridad como estimar de manera sencilla algunos indicadores para la demanda operacional. Dichos parámetros permitirán determinar la capacidad del sistema actual en términos de pasajeros por día, el cual se centra para la caracterización de flotas.

2.2.4 Redes Neuronales Artificiales

Las redes neuronales artificiales han sido reconocidas como aproximadores universales de funciones, complejas y no lineales, particularmente útil cuando estos sistemas son difíciles de modelar usando métodos estadísticos clásicos [10].

Teniendo aplicaciones casi ilimitadas, siendo básicamente la clasificación de datos, modelización/predicción y control del sistema. Existen varias definiciones de una red neuronal artificial, donde en términos generales se definen como “sistemas de procesamiento que copian esquemáticamente la estructura neuronal del cerebro para tratar de reproducir sus capacidades” (Martin del Brío y Sanz ,1997) [2].

Un modelo de red neuronal está formado por cuatro componentes principales: (1) un nodo como una unidad que se activa al recibir las señales de entrada, (2) las interconexiones entre nodos, (3) una función de activación que transforma el interior de un nodo, la entrada en la salida y (4) una función de aprendizaje opcional.

(29)

La descripción completa de una red neuronal puede encontrarse fácilmente en la literatura [26] [31] [5], donde básicamente el aprendizaje de la red es un proceso mediante el cual la red modifica los pesos de las conexiones para que las salidas de la red se vayan adaptando de manera paulatina al funcionamiento que se considera correcto. Esta modificación de los pesos se realiza en base a un criterio establecido: Aprendizaje supervisado, para cada patrón o ejemplo presentado a la red existe una respuesta deseada. La respuesta de la red se compara con su salida deseada, y en base a esa comparación se ajustan los pesos de la red.

Aprendizaje no supervisado, no se especifica a la red cual es la respuesta correcta. La red descubre las relaciones presentes en los ejemplos mediante reglas de aprendizaje.

El arreglo de las neuronas en capas y los patrones de conexión interior entre capas se denomina arquitectura de red. A continuación, describimos algunas arquitecturas, haciendo énfasis en aquellos que utilizaremos para el desarrollo de la presente tesis.

2.2.4.1 Algoritmo de Retropropagación

El algoritmo de propagación hacia atrás (en inglés Backpropagation) fue propuesto en 1986 por Rumelhart, Hinton y Williams para establecer pesos y por lo tanto para la formación de capas múltiples. Esto abrió el camino para el uso de múltiples capas de las RNA, las cuales se basan en un procedimiento supervisado, es decir, la red construye un modelo basado en ejemplos de datos con los resultados conocidos.

Figura Ilustración esquemática de una red neuronal de Retropropagación de tres capas

Capa Oculta Capa de Salida

(30)

Siendo una de las redes más fáciles de entender. Su procedimiento de aprendizaje y actualización es basado en un concepto relativamente simple. Los pasos que componen el proceso de aprendizaje (el más comúnmente usado) son las siguientes:

Paso 1. Se inicializan los pesos y ganancias de la red, con valores aleatorios o resultados de un entrenamiento previo.

Paso 2. Se inicializa una arquitectura de la red: número de neuronas de la capa de entrada, número de capas ocultas, número de neuronas en cada capa oculta, el número de neuronas de la capa de salida, que depende del número de variables de salida.

Paso 3. Se realiza la exploración de datos, con la muestra así seleccionada se inicia el proceso (cada neurona de la capa de entrada debe tener tantas dendritas como variables tiene el problema). Se clasifica al conjunto de entrenamiento mediante una red

self-organizing map, se considera la mitad de cada grupo para el entrenamiento de la

red, la cuarta de cada grupo para la validación y test.

Paso 4. Se asigna a cada neurona las funciones de activación y también la función de entrenamiento de toda la red.

Paso 5. Se procede a calcular el vector de respuestas Y de la red. La norma de la diferencia del vector de respuestas de la red y el vector de respuestas de campo (respuestas conocidas) dividido entre dos, es el error medio cuadrático.

Paso 6. Se emplea un proceso de optimización matemático (gradiente, gradiente conjugado, etc) para minimizar el error medio cuadrático. El resultado de este proceso son los nuevos pesos y ganancias de la red.

2.2.4.2 Algoritmo de Auto Organización

Los mapas auto organizados o redes de Kohonen (SOM por sus siglas en inglés,

self-organizing map) son conocidas como mapas topológicos que se organizan sobre la base

(31)

Figura Ilustración esquemática de una red neuronal de SOM

La capa de salida es la encargada de procesar la información y formar el mapa. Durante el proceso de aprendizaje, los pesos se van modificando iterativamente, donde la neurona más cercana es la ganadora (por lo general, en términos de la mínima distancia) y posee un aprendizaje competitivo. En términos generales un modelo SOM está compuesto por dos capas de neuronas, la capa de entrada se encarga de recibir y transmitir a la capa de salida la información procedente del exterior. Para determinar el mejor conjunto de acoplamiento, un método consiste en iterar a través de todos los nodos y calcular la distancia euclidiana entre el vector de peso de cada nodo y el vector de entrada.

2.2.5 Modelos de Simulación de Tráfico

Los simuladores de tráfico son una herramienta importante cuando se requiere evaluar proyectos de intervención vial y gestión de tráfico. La variación en el tráfico puede surgir debido a muchos factores, tales como la hora del día, el trabajo zonas y tiempo. Por lo general, el modelado del flujo de tráfico requiere tres tipos de datos: los datos del modelo, modelo de los parámetros observados y las salidas. Las entradas del modelo implican los datos de la demanda para el cual la simulación de tráfico se lleva a cabo (conteos de volumen, capacidad y características físicas de bordes de trayecto). Los datos de salida se observan en el mundo real y son necesarias para comparar los resultados del modelo y evaluar la precisión de los modelos.

En el caso del transporte público, las herramientas usadas para la toma de decisiones importantes de diseño son los microsimuladores de tráfico comercial existente, podemos

Capa de Entrada

Capa de Salida

(32)

mencionar AIUMSUM/2 (TSS, 2004), CORSIM (FHWA, 1996), DRACULA (Liu, 2003), VISSIM (PTV, 2003) y PARAMICS (Quadstone, 2004), MISTRANSIT (Burgos, 2006),

Detección de Valores Atípicos

Anomalías o valores atípicos (en inglés outliers) pueden afectar la precisión de los modelos predictivos. Generalmente definimos los valores atípicos como muestras que están excepcionalmente lejos del promedio de los datos. No hay una definición matemática rígida de lo que constituye un valor atípico. Detectar valores atípicos y tratarlos es un paso crítico en la preparación de datos para el modelamiento predictivo. Existen dos tipos principales de valores atípicos. Chambers (1986) se refiere a los dos tipos como representativos y no representativos. En el presente trabajo, nos adentraremos a los de tipo no representativo. Un outliers no representativo es uno que es una "observación incorrecta" (es decir, debido a un error en la entrada de datos, codificación o medición) o se considera único porque no hay otros valores como él en la población.

Figura N° 8 Ilustración esquemática de la detección de valores atípicos

(33)

Tabla N° 1 Criterio de Chauvenet para rechazo de valor medido.

Número de lecturas

n

Razón de máxima aceptación

Desviación / Desviación Estándar 

/ d_max

3 1,38

4 1,54

5 1,65

6 1,73

7 1,80

10 1,96

15 2,13

25 2,33

50 2,57

100 2,81

300 3,14

500 3,29

1000 3,48

.

Generación de llegada de buses

Para el problema que nos ocupa se trata de modelar el paso de vehículos a través de una intersección, la evolución de la longitud de cola que se produce en función de su flujo vehicular y demanda de pasajeros, teniendo en cuenta que el conductor detendrá su vehículo al llegar a la intersección. En este sistema de cola, hay un proceso de llegada de vehículos, los cuales acceden a una cola y luego a un servidor (intersección), en el que se experimenta un determinado tiempo de servicio y una vez que han sido servidos salen del sistema [38]. La espera se produce porque hay más demanda de servicio que el disponible. Sin embargo, ampliar esta capacidad de servicio no siempre es la solución adecuada [42].

(34)

colas, caracterizadas por la llegada aleatoria e independiente de los clientes, con tiempos de servicio exponenciales que evidencian la falta de memoria respecto al tiempo empleado por algún cliente anterior en el proceso de atención [30].

Definición 1.0 Sea X una variable aleatoria que representa el número de eventos

aleatorios independientes que ocurren a una rapidez constante sobre el tiempo o el

espacio. Se dice entonces que la variable aleatoria X tiene una distribución de Poisson

con función de probabilidad.

𝑝(𝑘, 𝜆) = 𝑓(𝑘) =

𝑒

−𝜆_𝜆𝑘

𝑘!

,

𝑠𝑖 𝑘 = 0,1, … , 𝑛, … ;

𝜆 > 0;

0, 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑚𝑎𝑛𝑒𝑟𝑎

La función f es una función de probabilidad

La función de distribución acumulativa de Poisson F (k), la cual permite determinar la probabilidad de que una variable aleatoria de Poisson X sea menor o igual a un valor específico k, tiene la siguiente forma:

𝑃(𝑋 ≤ 𝑘) = 𝐹(𝑘, 𝜆) = ∑

𝑒

−𝜆

_𝜆

𝑖

𝑖!

∞

𝑖=0

Con lo anterior, encontramos que la probabilidad de que no ocurra algún evento, en el periodo hasta el tiempo t esta dada por

𝑝(0, 𝜆𝑡) =

𝑒

−𝜆

𝜆

0

0!

= 𝑒

−𝜆

Si X es el tiempo para el primer evento de Poisson. La probabilidad de que la duración del tiempo hasta el primer evento exceda x (sea mayor que x) es la misma que la probabilidad de que no ocurra algún evento de Poisson en el periodo hasta el tiempo x. De esta forma la manera acumulativa de la distribución de X, es:

𝐹(𝑥) = 𝑃(0 ≤ 𝑋 ≤ 𝑥) = 1 − 𝑃(𝑋 ≥ 𝑥) = 1 − 𝑒

−𝜆𝑥

𝑡 =

−1

𝜆

ln (𝑃(𝑋 ≥ 𝑘))

.

CAPÍTULO III

(35)

En este capítulo se presenta la metodología para la obtención de la base de datos, presentando variables tales como el flujo de buses, subidas, bajadas, etc., las cuales son relevantes para la realización de la presente tesis. En la segunda parte del respectivo capítulo se describe el procesamiento de datos del caso particular de esta investigación que corresponde al corredor vial Universitaria.

3.1 LEVANTAMIENTO DE INFORMACIÓN

La Figura N°9, muestra una representación general de la metodología tomada por la Gerencia de Transporte Urbano (GTU), el cual consiste básicamente en cuatro etapas: la etapa de diseño, trabajo de campo o en terreno, procesamiento y finalmente resultados.

Figura N°9 Esquema General de la Metodología

(36)

3.1.1 Estudio de Embarque-Desembarque

El estudio de embarque-desembarque tiene por objeto realizar un conteo de número de pasajeros que abordan y abandonan los buses en cada paradero seguido por la ruta durante periodos establecidos.

3.1.2.1 Metodología

- Selección de recorridos

Según la Resolución de Gerencia N°165-2015-MML/GTU, esto iba dirigido a las 399 rutas de transporte público de Lima Metropolitana. En la avenida Universitaria solo realizaron el conteo de pasajeros de buses en 84 rutas (de un total de 89 rutas) que pasan por los puntos de aglomeración establecidos en dicha avenida.

- Dispositivos GPS

Se utilizaron dispositivos GPS como una de las herramientas de encuesta de viaje, los cuales ofrecen el comportamiento del viaje y la ruta física, logrando una actualización de la base de datos, donde al comparar con la base de datos (creada por la agencia de cooperación internacional del Japón - JICA) se ve que algunas rutas presentan pequeños cambios, esto debido a diversos factores.

Figura N°10 Mapa de Rutas – JICA 2012

(37)

Figura N°11 Esquema de los cambios de ruta (EO39, EM46) que hubo durante el periodo 2012-2015

- Selección de Horarios

La selección del horario se realizó en los momentos de mayor congestión u hora pico. Por ello se consideró para el análisis dos turnos (mañana, tarde), donde se da para el turno mañana (06:00 a.m. – 09:00 a.m.) y el turno tarde (6:00 p.m. – 9:00 p.m.), intervalo de tiempo donde el bus realiza su recorrido.

- Análisis y filtros de información de datos

Se realizó una búsqueda de datos anómalos (outliers) relativos para cada paradero teniendo como supuesto fundamental que la cantidad de pasajeros por paradero es homogénea, es decir, no hay grandes diferencias entre la cantidad promedio de pasajeros que suben o bajan en los paraderos día a día, en el horario de alta utilización del servicio (punta mañana o punta tarde). El registro de data se clasificará por mañana-ida (MI), mañana-vuelta (MT), tarde-mañana-ida (TI) y tarde-vuelta (TV).

Figura N°12 Valores atípicos observados en la gráfica de carga-paradero, según el estudio de embarque-desembarque

Como se observa en la figura el filtro elimina datos sujetos a error. Esto permite analizar los valores de subidas, bajadas y carga de pasajeros a nivel de bus.

OUTLIER

OUTLIER X

Y

REGISTRO DE INFORMACIÓN POR PARADEROS-RUTA

MI MV TI TV

RUTA: NM47

N° d

e

B

u

se

s

(38)

- Tipología vehicular

Es el dato técnico que señala la categoría y clase vehicular con la que debe operar una ruta autorizada, conforme a los reglamentos nacionales.

Tabla N° 2 Tipología y capacidad de buses

Tipo de Vehículo

CAMIONETA RURAL (de 10 a 16 asientos) MICROBÚS (de 17 a 33 asientos) ÓMNIBUS (de 34 asientos a más)

- Velocidad de operación

Uno de los aspectos importantes del transporte público es su velocidad promedio. La velocidad media de recorrido de los buses de transporte público de Lima, el cual depende de la tipología de la ruta. Según el informe de la ProTransporte de 2008, la velocidad promedio es según se presenta en la tabla.

Tabla N° 3 Velocidad promedio según tipología

TIPOLOGIA VELOCIDAD PROMEDIO (km/h)

CAMIONETA RURAL 26

MICROBÚS 17

ÓMNIBUS 15

La velocidad de operación más baja es la del ómnibus y la más alta corresponde a la camioneta rural. Debemos tener en cuenta que la velocidad promedio en hora punta se reduciría, la cual se sacará de los archivos GPS.

- Formatos de Encuestas

(39)

Figura N°13 Formato de encuesta utilizado en el estudio de Embarque-Desembarque

3.1.2 Estudio de Ocupación Visual

El aforo de ocupación visual tiene por objeto estimar el volumen de pasajeros por tipo de vehículo que transita por las vialidades de la ciudad, y así plantear un sistema operativo de buses.

3.1.3.2 Metodología Utilizada

En este estudio se comenzó con la localización los puntos de ocupación visual como primer paso, esta elección se basó en la aglomeración de rutas en: avenida Javier prado, corredor TGA, carretera Panamericana, carretera Central, avenida Universitaria, avenida Benavides, avenida Angamos, avenida Ejército, avenida Pachacútec. En la figura se presenta las intensidades de aglomeración de rutas para dichas avenidas

(40)

Como se muestra en la figura se vio un máximo de 74 rutas en los corredores. Así mismo debemos tener en cuenta que una ruta puede pasar por muchos puntos de ocupación visual en dichos casos se tomará un representativo promedio.

(41)

La siguiente tabla presenta datos de los corredores para un mayor entendimiento Tabla N° 4 Características físicas de las intersecciones

- Días de Aforo

Conforme a lo estipulado en los estudios de la Municipalidad Metropolitana, éste se registró en cada punto de ocupación, el cual tuvo una duración de 3-5 días según el nivel de importancia de cada uno de ellos. La duración de los conteos se dio en dos periodos no consecutivos.

- Sentido de Toma de Ocupación

Se registró que los puntos de toma interno en intersecciones de estudio se dan de acuerdo a un solo sentido de flujo (entrada o salida de la intersección), asumiendo que la demanda tiene un equilibrio entre los dos sentidos.

Figura N°16 Esquema de entradas y salidas a una intersección

CC02-2 CS_UNIV-4 CS_UNIV-3 CS_UNIV-2 CS_UNIV-1

AVENIDA PRINCIPAL AV. UNIVERSITARIA

AVENIDA REFERENCIAL Av. LA MARINA

Av. SIMÓN BOLIVAR

Av. JOSE GRANDA

Av. ANTUNEZ DE MAYOLO

Av. VICTOR BELAUNDE

SEMÁFORO SI SI SI SI SI

PUNTOS DE AFORO 4 3 4 4 4

(42)

- Estaciones de Conteo

Se definieron múltiples estaciones de conteo volumétrico donde su ubicación se realizó conforme a la aglomeración de rutas de transporte público en las diversas intersecciones ubicadas en los corredores principales de la ciudad.

Figura N°17 Esquema de puntos de ocupación visual y el número de rutas en las vías

- Periodo

El rango de tiempo que se considera para el análisis se da para la punta mañana (06:00 a.m. – 09:00 a.m.) y punta tarde (6:00 pm – 9:00 p.m.), ambas divididas en periodos de 15 minutos, lo que da un total de 24 periodos a analizar. Esta periodización se hace con fin de recoger la variabilidad en periodo.

- Niveles de ocupación visual

(43)

Figura N°18 Formato de encuesta utilizado en el estudio de Ocupación Visual

3.2 PROCESAMIENTO DE DATOS

En este ítem se ilustra el desarrollo metodológico aplicado y estrategias de programación, considerando información disponible. Se utilizaron cerca de 85000 observaciones de campo para cada una de las intersecciones que componen la avenida Universitaria, los cuales corresponden a las registradas entre el 28 de abril de 2015 y 15 de agosto del 2015.

Figura N°19 Representación Global de la data procesada

La metodología para la predicción de demanda necesita una buena estimación de las variables correspondientes, tales son el análisis del flujo y demanda mediante la utilización de herramientas propias. Para la cual se realiza una serie de tratamientos:

• fase de preprocesamiento, se extiende en el enfoque de programación y organización para enfrentar el problema de procesamiento.

Porcentajes No hay data

Porcentajes

(44)

• fase de procesamiento, con los programas se procede al cálculo y estimación de variables donde se realizarán las curvas de carga, sube y baja de pasajeros por cada ruta, usando datos proporcionados por la GTU.

• fase de resultados, se enfoca en el análisis de datos considerando evaluaciones estadísticas y métodos que permitan evaluar las relaciones entre los resultados, con la finalidad de justificar procedimientos para usar estimaciones correctas para la validación.

3.2.1 Preprocesamiento de la Información

El objetivo de esta etapa es acondicionar la gran base de datos para que esta pueda ser procesada. El siguiente esquema define el proceso interno que se le dio a la data entregada por cada empresa de transporte público, llevado a cabo por la Municipalidad de Lima como parte del Estudio de Embarque – Desembarque.

(45)

Durante el transcurso de este trabajo se realizaron los algoritmos para el fácil procesamiento de la información en lenguaje VBA, los cuales se explicarán a detalle en el siguiente ítem. Se observó la presencia de datos faltantes en algunas rutas donde se procedió al completamiento de acuerdo con las características de la ruta.

3.2.2 Procesamiento de la Información

Se presenta una propuesta de procedimiento. Se basa en una serie de programas que provee las funcionalidades de:

▪ Embarque-Desembarque: compilar data, identificador de paraderos, filtro de datos anómalos, análisis estadístico, salida gráfica

▪ Ocupación Visual: compilar data, identificador de rutas, completa sentido de rutas, análisis estadístico por tipología de ruta, salida gráfica.

El desarrollo de los programas se llevó a cabo bajo funciones y programación orientada a objetos en lenguaje Visual Basic, utilizando el ambiente de desarrollo Microsoft Visual, en el Excel. Adicionalmente se procedió a codificar los corredores e intersecciones respectivos empleando imágenes satelitales y fotos tomadas en campo, teniendo salidas en AutoCAD.

a. Procesamiento de Embarque-Desembarque

El modelo planteado mencionado anteriormente consta de 4 etapas y una salida gráfica. Esto se aplica para la carga, subida y bajada de pasajeros los cuales detallaremos a continuación.

Etapa 1. Al programar se necesitó la compilación total de la data, en general se vio un comportamiento no uniforme en los paraderos diario por ruta.

Etapa 2. Identificar la lista de paraderos que predomina o se repite con mayor frecuencia, el análisis se basa en revisar los cambios que se dan día a día en la lista de paraderos.

Etapa 3. Se utiliza el criterio de Chauvenet como filtro de datos anómalos, el cual elimina datos de acuerdo con el número de mediciones tomada en relación de la media y la desviación estándar de la misma.

Etapa 4. En esta etapa habiendo identificado y eliminado datos anómalos, procedemos al nuevo cálculo de parámetros estadísticos, tales como la media y desviación estándar.

(46)

Figura N°21 Salidas del paquete de programas del estudio de embarque – desembarque

De la figura 21, podemos ver las salidas de CARGA representa a los pasajeros dentro del bus en cada paradero, las salidas de SUBE representa a los pasajeros que subieron al bus en cada paradero, y finalmente las de BAJA representa a los pasajeros que bajaron del bus en cada paradero (en la ruta de transporte publico EM01).

.

CARGA

N°

P

a

s

a

je

ro

s

N°

P

a

s

a

je

ro

s

N°

P

a

s

a

je

ro

s

Paraderos

SUBE

BAJA

IDA VUELTA

VUELTA

VUELTA IDA

IDA

---

RUTA: EM01

(47)

---b. Procesamiento de Ocupación Visual

El modelo planteado mencionado anteriormente consta de 3 etapas y una salida gráfica, esto se aplica a cada ruta que pasa por la intersección a estudiarse.

Etapa 1. Al programar se necesitó la compilación total de la data de acuerdo con la intersección de estudio, el cual servirá de entrada para la siguiente etapa.

Etapa 2. Identificar el sentido que la ruta tiene al pasar por el punto de observación, por ello se realizó una base de datos que contenga los sentidos de cada ruta según el punto de toma el cual se tomó de la base de datos de la GTU.

Etapa 3. En esta etapa, habiendo identificado y filtrado las rutas, procedemos al nuevo cálculo de parámetros estadísticos para cada una de las rutas por sentido, tales como la media y desviación estándar.

Etapa 4. La gráfica de los resultados de dicha metodología se dará en el entorno Matlab y la data de campo en el entorno ArcGis, como se representa en la siguiente gráfica.

Figura N°22 Representación de las salidas del paquete de programas del estudio de ocupación visual Dema n da (nú m

ero de pas

aj eros) De ma n da (n ú m er o de p as aj er os ) Ru ta

s de Tra

(48)

En el Anexo A. se presenta en detalle los resultados gráficos de las intersecciones a trabajar, las cuales se utilizaron para construir el modelo.

c. Proceso de caracterización de ruta

Con la ayuda de algunas programables en VBA, pasaremos a ubicar el intervalo de tiempo al que perteneció la toma de ocupación visual, para poder calibrarlo con los resultados de embarque-desembarque. De esta manera uniformizamos la data de ambos estudios. El factor correctivo fue calculado como la relación entre la carga de embarque – desembarque y la ocupación visual (Ver ANEXO A).

Figura N°23 Correlación entre estudios de Embarque desembarque – Ocupación visual de una ruta

3.2.3 Resultados del Procesamiento

Cuando se procesan los datos facilitados por GTU, se van teniendo pérdidas en las diferentes fases como se presenta. Por esto, se tienen paraderos con información incompleta que no se pueden utilizar en ciertos horarios ya que se pueden distorsionar los análisis realizados. En esta etapa se verá el análisis de datos considerando evaluaciones estadísticas y métodos que permitan evaluar las relaciones entre los resultados, con la finalidad de justificar procedimientos a través de la lógica estadística.

(49)

a. Estudio de Ocupación Visual

Las variables de conteo se definen como el número de sucesos o eventos que han ocurrido en una misma unidad o intervalo de observación definido. Debido a la complejidad y a partir de esta definición propuesta se da una estrategia que en comparación a los modelos tradicionales hace que los requerimientos de información sean mayores. La información es requerida para los propósitos de construcción, para la calibración/validación de esta.

Análisis de Grupos

Se realiza el diagrama de dispersión de los datos para comprobar visualmente la lejanía o cercanía de las variables de acuerdo a ello se ve necesario agrupar elementos (de cada variable), tratando de lograr la máxima homogeneidad en cada grupo y la mayor diferencia entre los grupos. Por ello usamos el algoritmo SOM empleando el lenguaje de programación MATLAB y su Toolbox de redes neuronales (MATLAB R2015a, The MathWorks Inc.). Si bien el entrenamiento y evaluación de cada red tomó pocos segundos, el gran número de redes estimadas requirió de tiempos de cálculo de hasta 4.5 horas (Intel Core i7-3630QM, 2.4 GHz, 8 GB RAM). Donde se construyó una red neuronal con una única neurona que tiene una función paso, como función de transferencia, y dos sensores de entrada. Donde se trabajaron con diferentes dimensiones ([2 4], [4 2], [3 3], [2 5]), con grafos ‘gridtop’ - ‘hextop’, y distancias ‘mandist’ – ‘dist’, haciendo un total de 16 formas de agrupación en diversas dimensiones (Vea ANEXO A).

Coeficiente de Variación y Correlación

(50)

Figura N°24 izquierda: Análisis de grupo de dispersión de data, derecha: comportamiento del grupo ganador de la red neuronal para cada estación

CC02-2

CS_UNIV-1

CS_UNIV-3 CS_UNIV-2

(51)

Distribuciones de probabilidad

Para el ajuste de distribuciones, se tomaron los datos agrupados de cada intersección mediante el software EasyFit. De esta manera se tiene que, debido a la importancia del tamaño de la muestra, los resultados deben ser representativos. Se establece un nivel de confianza el cual nos indica que, es aceptado en un porcentaje determinado. Siendo el nivel de confianza la probabilidad de acertar en la estimación, y los errores de muestreo indican la bondad de la misma.

Figura N°25 Ajuste de distribución en la intersección Av. La Marina - Av. Universitaria (CC02-2)

Función de densidad de probabilidad

HistogramaNormal x 1240 1200 1160 1120 1080 1040 1000 960 920 880 f(x ) 0.44 0.4 0.36 0.32 0.28 0.24 0.2 0.16 0.12 0.08 0.04 0 σ= 121.56 μ= 396.4

HistogramaNormal

x 400 440 480 520

360 320 280 240 f( x ) 0.44 0.4 0.36 0.32 0.28 0.24 0.2 0.16 0.12 0.08 0.04 0 σ= 143.36 μ= 1062.2

HistogramaNormal x 88 80 72 64 56 48 40 32 24 16 f( x) 0.88 0.8 0.72 0.64 0.56 0.48 0.4 0.32 0.24 0.16 0.08 0 σ= 32.11 μ= 34.8

MuestraPoisson

x 5 6 7

4 3 2 f(x ) 0.44 0.4 0.36 0.32 0.28 0.24 0.2 0.16 0.12 0.08 0.04 0 ג=4.4

MuestraPoisson x 27 26 25 24 23 22 21 20 f( x ) 0.22 0.2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 ג=23.6