I UNIVERSIDAD DE LOS ANDES
FACULTAD DE INGENIERIA INGENIERÍA INDUSTRIAL
MODELO COMPORTAMENTAL DE ELECCIÓN DISCRETA SOBRE EL MODO DE TRANSPORTE UTILIZADO EN BOGOTÁ
JUAN MARTIN MENDOZA SANCHEZ
ASESOR
ROBERTO ZARAMA URDANETA
II TABLA DE CONTENIDO
LISTA DE GRAFICAS LISTA DE TABLAS
RESUMEN EJECUTIVO 1
INTRODUCCIÓN 1
1. CAPITULO I: Delimitación del trabajo 5
1.1 Planteamiento del problema 5
1.2 Delimitación del problema 5
1.3 Delimitación del destino 6
1.4 Delimitación del tiempo 7
1.5 Delimitación de la frecuencia 8
2. Objetivo General 9
3. Justificación 9
4. CAPITULO II: Antecedentes y Marco teórico 9 4.1 Urban Travel Demand: A Behavioral Analysis
4.2 Regression models for categorical dependent variables using Stata
4.3 A Behavior Model for Persuasive Design (Fogg, 2004)
5. CAPITULO III: Planteamiento del Modelo 12
5.1 Descripción de la encuesta base 13
5.2Descripción de las variables independientes consideradas 16
5.3 Nivel Socioeconómico 17
5.4Tipo de vivienda de la muestra 18
5.5 Total de personas en el hogar 19
5.6 Medios de transporte en el hogar 20
5.7 Forma de pago del hogar 21
5.8 Ingresos 22
III
5.10 Nivel de estudios 23
5.11 Ocupación principal 24
5.12 Sector productivo 25
5.13 Licencia de conducción 26
5.14 Género 27
5.15 Tiempo de transporte hacia el trabajo 27 5.16 Minutos caminados al salir y al llegar 28 5.17 Descripción de la variable dependiente 29
5.18 Modelo Multilogístico general 32
5.19 Modelo base 34
6 CAPITULO IV: Interpretación de los resultados y conclusiones 37
7 CONCLUSIONES 42
IV
LISTA DE GRÁFICAS
Ilustración 1. Porcentaje de viajes según motivo. Fuente: Secretaría de movilidad 06
Ilustración 2. Viajes del sistema Transmilenio por hora. Fuente: Encuesta movilidad 07
Ilustración 3. Número de viajes por estrato y ocupación. 08
Ilustración 4. Distribución de la muestra por localidades 17
Ilustración 5. Número distribución por estrato socioeconómico de la muestra 18
Ilustración 6. Número distribución por tipo de vivienda de la muestra 19
Ilustración 7. Número de personas en el hogar 20
Ilustración 8. Distribución del porcentaje de vehículos en los hogares la muestra 21
Ilustración 10. Mayor ingreso que puede tener una persona en los hogares de la muestra 22
Ilustración 11. Edad en años de la muestra 23
Ilustración 12. Nivel de estudios en los hogares de la muestra 24
Ilustración 13. Trabajo principal de una persona en los hogares de la muestra 24
Ilustración 14. Sector productivo de los hogares de la muestra 25
Ilustración 15. Sector productivo de los hogares de la muestra 26
Ilustración 16. Porcentaje de género en los hogares de la muestra 27
Ilustración 17. Tiempo que gastan en transporte hacia el trabajo los encuestados 28
Ilustración 18. Número de cuadras caminadas al salir de la casa 29
Ilustración 19 Número de cuadras caminadas al llegar por los hogares de la muestra 29
Ilustración 20. Muestra usada para la construcción del modelo y su distribución 30
Ilustración 21. Porcentaje de los medios utilizados en el estudio de la muestra 31
Ilustración 22. Uso de los medios pronosticado y de la muestra por estrato 38
Ilustración 23. Tiempo en tránsito vs medio usado 40
Ilustración 24. Probabilidad de elección del medio Vs licencia de conducción 41
V LISTA DE TABLAS
1. Información y variables utilizadas para construir el modelo 16
2. Agrupación de medios de transporte 31
3. Variables empleadas como modelo base 35 4. Pruebas de significancia variables continuas seleccionadas 36
1 RESUMEN EJECUTIVO
Uno de los problemas que afronta toda entidad gubernamental al momento de
generar políticas de transporte es saber su impacto sobre la decisión del medio a
utilizar por parte de los ciudadanos. El presente trabajo busca aportar conocimiento
sobre este problema enfocado en la ciudad de Bogotá para viajes hacia el trabajo
en la hora pico. Algunas de las variables del modelo final tendrán en cuenta
conceptos que los planeadores distritales puedan cambiar con nuevas políticas para
saber la reacción de las personas en general sobre el medio de transporte a utilizar.
Para tal fin, se hará uso de herramientas como la teoría de maximización de la
utilidad individual para avalar los supuestos utilizados en el modelo y otras
estadísticas para indagar sobre la relevancia de las variables hipótesis así como
para construir el modelo final.
INTRODUCCIÓN
En la gran mayoría de los países industrializados los sistemas de transporte son
una parte fundamental de la vida cotidiana puesto que sin una buena red de
transporte es imposible comunicar de manera eficiente las diferentes actividades
productivas (ONU, 2012).
Dada esta importancia, es necesario instaurar políticas que permitan su buen
funcionamiento a largo plazo, impulsando así el desarrollo sostenible del país. Por
lo tanto, hay una necesidad creciente de entender el porqué de la elección de un
2
conllevan las decisiones de movilidad tomadas por el gobierno, llevando así un
control de las consecuencias que se desea obtener y las que realmente están
sucediendo.
Es necesario entonces un método de estudio que permita ver la situación actual de
movilidad en la ciudad y al mismo tiempo pueda medir la sensibilidad de esta ante
cambios, antes de ser aplicados. Con un buen uso de las herramientas de
predicción es posible controlar también cambios presentes en diversos ámbitos
como social, económico, ambiental y cultural (Garrido, 1999). Por último, el uso
extremo de algunos medios de transporte para algunas personas puede llevar a
problemas de estrés o depresión que repercute en su diario vivir de manera notable,
cosa que puede ser evitada con buenas campañas de concientización (Sánchez,
2012).
El método aquí presentado es un aporte para un mejor entendimiento de los medios
usados en Bogotá y está dirigido hacia la política de transporte, con lo que se
pretende ayudar a mejorar la movilidad de la ciudad mediante un estudio serio que
permita a los planeadores distritales pronosticar las consecuencias de algunas
decisiones de movilidad implantadas en la ciudad a largo plazo. La metodología
aquí utilizada se centra en un análisis del comportamiento de la gente, que unido a
sus factores socioeconómicos básicos permitirá responder la pregunta fundamental
que todo modelo de transporte debe tener presente: “cómo las decisiones de
3
El análisis de la demanda de transporte de esta tesis se centrará en los viajes al
trabajo en hora pico, dada la relevancia de estos viajes (por su regularidad y
aprovechamiento).La metodología general del estudio aquí propuesto comienza por
el uso de los datos proporcionados por una muestra significativa recogida en la
ciudad. Serán usadas aproximadamente 1500 encuestas de personas de los 16 a
los 83 años que utilizan medios de transporte básicos claramente definidos para
llegar a su trabajo, conociendo el tiempo empleado en los medios, sus factores
socioeconómicos y otros asociados con los sistemas de transporte seleccionados.
Con los datos anteriormente mencionados, se hará un análisis de significancia
estadística para saber cuáles de las variables recolectadas en la muestra son
relevantes para los capitalinos al momento de la elección del medio de transporte a
utilizar. Para tal fin, se hará uso del software STATA que permitirá construir el
modelo adecuado y hacer las pruebas para su validación. Construido el modelo, se
procederá a hacer pruebas de sensibilidad que aporten un mayor entendimiento del
tema.
Las limitaciones principales del trabajo propuesto tienen que ver con el
planteamiento del mismo, ya que se desea entender las decisiones de transporte
en unas horas específicas para un fin bien delimitado y con una frecuencia también
fijada. Esto se plantea de esta manera pues disminuye la variabilidad del estudio, lo
hace mucho más exacto y con frutos más provechosos. Existen otro tipo de
limitaciones referentes al espectro de variables utilizadas para la construcción del
4
los medios y son esenciales al momento de entender determinadas decisiones de
transporte.
En el primer capítulo se explica por qué es importante el uso de un modelo para la
predicción del comportamiento de los ciudadanos con respecto al medio de
transporte usado según unas políticas implantadas por el gobierno. Además, se
plantearán las hipótesis correspondientes, los objetivos generales del modelo y la
justificación de todo el trabajo.
En el segundo capítulo se tratarán temas como los antecedentes del problema
propuesto, los estudios similares realizados por otros autores y el marco teórico en
el cual se basa en su mayoría la metodología estadística aplicada y la derivación
del modelo de utilidad empleado. Con este estudio se busca aclarar la forma como
fue afrontado el problema dándole una base sólida al estudio.
En el tercer capítulo se encontrará una descripción detallada de la metodología
aplicada para el manejo de los datos recolectados, el modo como se hallaron las
variables más importantes en el estudio y la derivación del modelo final. Se hará
además una referencia explícita a las limitaciones del estudio referentes a las
restricciones en los métodos y técnicas utilizadas para la recolección de muestras y
manipulación de datos.
Por último, en el capítulo cuarto se hará un análisis de los datos recolectados junto
con la interpretación de los resultados obtenidos, contrastando estos con los
5
acerca del estudio y el modelo, incluyendo un análisis de sensibilidad a los cambios
y los logros alcanzados con el trabajo de investigación.
1. CAPÍTULO I: Delimitación del trabajo
1.1 Planteamiento del problema
En Bogotá, los automóviles de servicio particular han crecido en un 118.304% desde
el 2004 hasta el año pasado, siendo los más usados los automóviles con un 57%
de participación, mientras que los vehículos de transporte público han crecido de
759 en el 2004 a 1791 en el 2011. Si se contrastan estas cifras con las del
crecimiento de la malla vial en Bogotá desde el 2004 del 6.26% vemos que hay un
serio problema de distribución del modo de transporte de los bogotanos.
Lo expuesto anteriormente muestra la necesidad de crear un modelo de planeación
que permita a la secretaría de transporte de Bogotá implementar y evaluar políticas
de acuerdo con un desarrollo sostenible de la movilidad en la ciudad para los
próximos años y que ayude a alivianar las cargas que actualmente están afectando
a la ciudad en materia de tránsito.
1.2 Delimitación del problema
El presente trabajo trata de dar una aproximación de solución al problema
anteriormente planteado, para lo cual se necesita hacer uso de ciertos límites que
permitan una mayor manejabilidad del tema expuesto. Esta aproximación, un poco
6
detallada y será prudente con el tiempo y recursos destinados para el presente
trabajo.
Cuando una persona toma una decisión de transportarse, realmente toma a su vez
varias que afectarán la manera como lo hace. Los factores interrelaciónales que se
debe tener en cuenta son destino, tiempo, frecuencia y modo Fuente libro. Este trabajo se centra en averiguar cómo la gente toma la decisión del medio de
transporte a utilizar para un destino de viaje definido a una hora fijada con una
frecuencia específica. Las constantes utilizadas para cada una de estas elecciones
se basan en forma racional de las necesidades de la ciudad y se explican en los
siguientes apartados.
1.3 Delimitación del destino
La siguiente gráfica muestra el porcentaje de viajes que los bogotanos hacen según
el motivo:
Ilustración 1. Porcentaje de viajes según motivo. Fuente: Secretaría de movilidad 2008
44%
25% 14%
1%
1% 9%
6% 0%
Porcentaje de viajes según motivo
Regreso a la residencia Trabajo
Estudio Negocios Compras
Asuntos Personales Transbordo Otro
7
De la gráfica se puede concluir que el mayor número de viajes se hacen
principalmente de regreso a la casa y hacia el trabajo. Se obtiene pues que
aproximadamente el 50% de los viajes hechos en un día por una persona que resida
en Bogotá son hechos por motivos laborales. Por lo tanto, para la delimitación del
destino se decidió tomar los viajes hacia el trabajo y de regreso del trabajo, haciendo
posible la inclusión de esta decisión por parte del viajero
1.4 Delimitación del tiempo
En cuanto a la hora del día en la que se hará la toma de datos, conviene explicar
que el mayor caos vehicular de la ciudad se presenta en la hora pico, la cual está
definida en la siguiente gráfica:
8
Como se puede apreciar, el mayor número de viajes que se realizan en la ciudad
comienzan a las 5:00 am y terminan a las 8:30 am por la mañana y de 4:30 pm a
8:00 pm por la tarde. Se tomarán solo estas horas como referentes para el estudio
pues son en las que la mayoría de las personas se dirigen hacia sus trabajos y
regresan de este a sus casas, haciéndolas horas clave para futuros análisis de
congestión en materia de movilidad en la ciudad.
1.5 Delimitación de la frecuencia
La gráfica siguiente muestra la frecuencia de viajes según el estrato y la ocupación:
Ilustración 3.Número de viajes por estrato y ocupación. Fuente: Encuesta de movilidad 2011
Como se puede ver claramente en la ilustración, la mayoría de los empleados hacen
2 viajes al día, razón por la cual esta será la frecuencia diaria utilizada en el estudio.
Nótese que las diferencias entre los estratos no hacen parte de esta clasificación
pues este será un factor socioeconómico que estará presente en el modelo final y
9 2. OBJETIVO GENERAL
Construir un modelo estadístico y comportamental que muestre la decisión del
medio de transporte a utilizar de los habitantes de la ciudad de Bogotá para los
viajes laborales en la hora pico mediante análisis de datos de encuestas a través de
herramientas estadísticas y de teoría de juegos que permitan tomar decisiones a
largo plazo en materia de planeación y desarrollo vial.
3. JUSTIFICACIÓN
El presente estudio pretende crear un modelo estadístico-comportamental mediante
el cual sea posible entender la manera como los habitantes de Bogotá toman su
decisión de qué medio de transporte utilizar para ir a su trabajo en las horas pico.
Es necesario hacer este estudio puesto que si no se sabe los estímulos que hacen
que un ciudadano elija un medio de transporte por encima de otro no es posible
cambiar la forma como se transportan, uno de los puntos clave en la movilidad de
las ciudades. Conociendo el comportamiento de los capitalinos y reflejándolo en un
modelo, es mucho más fácil implementar políticas de movilidad que busquen una
menor congestión vehicular y una mejor planeación urbana.
4. CAPÍTULO II Antecedentes y marco teórico
En esta sección se hace mención a los estudios que tienen relación con el estudio
hecho. Se hace referencia a los antecedentes relacionados con el estudio hecho y
las bases teóricas del mismo. De cada referencia, se sintetiza el tema, el propósito,
10 4.1 Urban Travel Demand: A Behavioral Analysis (Domencich, 1996)
El tema central de este libro escrito por Tom Domencich y Daniel L. McFadden
es crear una teoría de la demanda de viajes con un énfasis en las políticas
adoptadas para cambiar el comportamiento de los usuarios. Hace también un
estudio con la aplicación de su teoría en Pittsburgh, Estados Unidos para los dos
medios más representativos del lugar teniendo en cuenta dos tipos de viajes:
viajes al trabajo y viajes recreacionales.
El principal propósito del estudio es comprender los objetivos de un estudio de
la demanda de viajes, cómo la decisión del modo de transporte cambia cuando
cambian los atributos del mismo y cómo es el comportamiento de los usuarios
en una ciudad en específico. Para tales propósitos, los autores recopilan
información acerca de los estudios previos al suyo y con los resultados de los
mismos construyen la teoría del comportamiento individual de los individuos, de
donde concluyen las restricciones principales sobre la teoría de la maximización
de la utilidad de los mismos.
Hecho esto, hacen un agregado de estos comportamientos, pasando a la teoría
del comportamiento de la población acerca de la demanda de viajes. De aquí
sacan las funciones de probabilidad para dos y más medios de transporte que
después usarán para su aplicación sobre los datos obtenidos de la ciudad
mencionada. Hecho esto, pasan a la aplicación con el modelo propuesto.
Su estudio concluye que es posible cambiar la forma como las personas toman
su decisión de transporte con modelos híbridos que incluyan variables
11
estudiados. Además, hacen unos análisis de sensibilidad del modelo para
demostrar su utilidad práctica para pronosticar los resultados de las políticas
implantadas.
4.2 Regression models for categorical dependent variables using Stata (Long, 2001).
Este libro trata principalmente del uso de Stata para crear e interpretar modelos
que poseen variables discretas, aunque en general sirve de guía para el uso del
software. Su propósito es familiarizar al lector con el ambiente de Stata y usar
algunas de las funciones creadas por los escritores para realizar diferentes tipos
de pruebas y gráficas sobre los modelos de regresión no lineales.
Al principio del libro, hay una breve explicación de los comandos más utilizados
del software, sus usos básicos y la forma como se puede descargar los
complementos creados por otros usuarios para el análisis de datos. Hecho esto,
se enfocan en explicar los tres modelos usados durante todo el libro y de forma
general, los comandos creados para su interpretación.
De este libro fue útil el planteamiento de los modelos multilogísticos, su ejecución
en Stata teniendo en cuenta algunas opciones relevantes del comando y su
forma de interpretar los resultados.
4.3 A Behavior Model for Persuasive Design (Fogg, 2004)
Este artículo trata sobre los factores que se deben tener en cuenta en un estudio
12
es exponer las tres condiciones clave al momento de facilitar un cambio de
comportamiento: Habilidad, motivación y el activador del cambio.
Como metodología para exponer estos factores, se hace una breve introducción
y se menciona estudios hechos sobre el tema, después, de cada una de las
condiciones clave, se hace una breve descripción, se da ejemplos de su
aplicación y se muestra sus subdivisiones, las cuales son propensas a ser
cambiadas por el investigador de diversas formas dependiendo del ámbito
estudiado. Por último, la conclusión del estudio revela que es importante tener
en cuenta estos componentes a la hora de hablar del cambio en el
comportamiento de los individuos.
Este estudio fue útil debido a que el modelo que se creó necesitaba ser
comportamental, y dio algunas pautas sobre las cuales se podía lograr cambios
en la forma de actuar de las personas, ayudando así a un mejor entendimiento
de los resultados del modelo.
5. CAPÍTULO III: Planteamiento del Modelo
En este capítulo se explicará la metodología empleada para el planteamiento del
modelo final. Es de vital importancia establecer las preguntas clave usadas para la
recolección de datos así como la forma como se llegó a la muestra usada para la
construcción del modelo mediante la selección de los datos relevantes. Después de
esto, se explicará de manera sistemática el tipo de modelo planteado, las pruebas
asociadas con el modelo base y cómo se llegó desde este al modelo final. El tipo de
13
se llega a una generalización para toda la población y es posible contestar las
preguntas asociadas al problema planteado (qué, cómo, dónde, cuánto, etc.).
5.1 Descripción de la encuesta base
La encuesta base usada para este estudio fue la encuesta de movilidad del 2011
realizada por la Unión temporal Steer Davies Gleave del Centro Nacional de
Consultoría para la Secretaría de Movilidad de Bogotá. Esta encuesta consta de dos
partes, la encuesta domiciliaria y la encuesta de interceptación. La encuesta
domiciliaria está organizada en cuatro módulos básicos y uno adicional donde se
recoge información sobre la vivienda habitada, las características socioeconómicas
de los habitantes, los vehículos presentes en el hogar y los viajes realizados durante
el día pasado a su aplicación. La encuesta de interceptación fue realizada en tres
medios de transporte, público, masivo y privado, recogiendo información acerca del
lugar de residencia, el destino, el medio usado, la edad y el género entre otras
(Movilidad, 2011).
Como se puede apreciar, para el trabajo que concierne a este estudio es más
completa la encuesta domiciliaria, ya que contiene información detallada acerca de
los integrantes del hogar, sus trabajos, los vehículos que tienen a su disposición,
los tiempos asociados a sus viajes, etc., información que está restringida en la
encuesta de interceptación. Para este estudio se tomará como base esta encuesta,
pues los factores contenidos en ella son de vital importancia para entender el
14
El módulo A contiene información acerca de la vivienda y el hogar. Contenía dentro
de los datos recolectados el municipio en el cual estaba ubicada la vivienda, dato
que fue útil para limitar las encuestas a las efectuadas en Bogotá únicamente
(excluyendo municipios aledaños), lo cual iba acorde con el propósito del estudio.
De las preguntas contenidas en este se eligió como relevantes las asociadas con la
Unidad de Planeamiento Zonal, el estrato socioeconómico, el tipo de vivienda donde
reside el hogar, el número total de personas que habitan el hogar y la forma como
se paga la vivienda.
El módulo B contiene información acerca de los miembros del hogar. Este módulo
fue útil para filtrar las encuestas a solo aquellas con miembros cuya ocupación
principal estuviera relacionada con el trabajo, excluyendo los asuntos de estudio y
otros no relevantes para el modelo. También se excluyó a las personas con alguna
discapacidad física para usar medios de transporte ya que presentaban valores
atípicos. Por último, se limitó el número de viajes a 2 el día anterior, el porqué de
esta exclusión ya fue dicho de manera detallada anteriormente. De este módulo se
extrajo información acerca de la edad, género, nivel educativo, trabajo
desempeñado, actividad económica de la empresa donde trabaja y la licencia de
conducción de la muestra.
El módulo C está orientado a recoger información acerca de los medios de
transporte presentes en el hogar. De este módulo se extrajo información de cuantos
carros, camionetas, motos y bicicletas había en el hogar, lo cual estaba
estrechamente relacionado con los medios de transporte usados como variable
15
El módulo D tenía como propósito recolectar información de los viajes hechos el día
anterior a la aplicación de la encuesta y otros datos relacionados con el encuestador
y su supervisor. De este se filtró viajes con una sola etapa por viaje, ya que hacerlo
con más ampliaba mucho el espectro de combinaciones posibles para un solo viaje.
Por lo tanto, por cada etapa del viaje existía solo un medio de transporte, lo cual es
muy conveniente para ser analizado en el modelo. También se limitó las encuestas
a solo aquellas cuyo objetivo de viaje eran los asuntos de trabajo, lo cual es
coherente con lo dicho en el módulo B. Este módulo es de los más importantes pues
de este es posible seleccionar los medios usados como variable dependiente y
unificarlos de manera consistente. También se usó información acerca de los
minutos caminados al salir y al llegar, la hora de salida y la hora de llegada.
De la información adicional de la encuesta solo fue de importancia la relacionada
con los ingresos del hogar, ya que los demás datos hacían parte de información de
seguridad para las mujeres en los medios de transporte. A continuación se hace un
resumen en forma de tabla de los filtros usados sobre la encuesta y las preguntas
seleccionadas para el estudio. Las celdas en azul indican que esta información fue
usada para filtrar los datos de la encuesta y las verde claro indican que son variables
usadas para construir el modelo.
Módulo Información Asociada Pregunta
A
Municipio Dado por la dirección de residencia
Upz Dado por la dirección de residencia
Estrato Socioeconómico Dado por la dirección de residencia
Tipo de vivienda Identifique el tipo de vivienda donde reside el hogar
Total de personas ¿Cuántas personas de 5 años y más residen en el hogar?
Tipo de pago vivienda La vivienda donde reside este hogar es:
16 Limitaciones físicas ¿Tiene limitaciones físicas que le dificultan usar los medios de transporte?
Frecuencia de viajes ¿Cuántos viajes hizo?
Sexo ¿Cuál es su sexo?
Edad La edad en años cumplidos es:
Nivel educativo ¿Cuál es el máximo nivel educativo aprobado?
Sector Productivo ¿A qué actividad económica se dedica la empresa donde trabaja?
Licencia de conducción ¿Tiene licencia de conducción?
C Número de vehículos ¿De la siguiente lista de vehículos cuales y cuántos tienen en el hogar?
D
Municipio ¿Cuál fue su municipio de llegada?
Motivo ¿Qué fue a hacer?
Hora de salida ¿A qué hora salió por primera vez en el día?
Medio usado ¿Qué medio de transporte usó?
Minutos Caminados al salir ¿Cuánto caminó para salir?
Minutos Caminados al llegar ¿Cuánto caminó para llegar?
Hora llegada ¿A qué hora llegó a su destino?
Adicional Ingresos ¿Cuál es el rango de ingresos de su hogar?
6. TABLA información y variables utilizadas para construir el modelo
Después de las limitaciones hechas a la muestra quedaron 1570 encuestas, cada
una asociada con un factor de expansión específico, los cuales hacen que estas
encuestas representaran a 222.881 personas de la ciudad de Bogotá.
5.2Descripción de las variables independientes consideradas
En total fueron usadas dieciocho variables para la construcción del modelo, de las
cuales se seleccionó las que mayor importancia y significancia ofrecían para la
explicación de la variable dependiente. A continuación serán descritas estas
variables, sus valores y sus distribuciones correspondientes con la muestra usada.
Upz
Las upz son unidades de planeamiento zonal propuestas por la secretaría de
17
creadas con características similares en materia de movilidad. Están numeradas del
1 al 117 y fueron usadas en el estudio porque dan mayor información que las
localidades sobre la ubicación de los individuos de la muestra. A continuación se
presenta la distribución de la muestra por localidades ya que así es gráficamente
más fácil de entender:
Ilustración 4.Distribucion de la muestra por localidades
Como se puede ver, la mayor parte de la muestra está en las localidades de
Usaquén, Kennedy, Engativá y suba, siendo las cantidades restantes distribuidas
de manera aproximadamente uniforme. Esto es consistente con los datos del estrato
de la muestra ya que la mayoría de los individuos se ubican en estrato medio. Esta
variable es tratada como discreta nominal no ordenada, dado que el número de la
upz no corresponde con una numeración ordinal.
5.3 Nivel Socioeconómico
0 10,000 20,000 30,000 40,000 50,000 Frecuencia 0 Usaqué n Chap iner o San
ta Fe San Cris tob al Usm e Tunj
uelito Bos a Ken ned y Font ibón Eng
ativáSub a Bar rios Uni dos Teus aqui llo Los M
ártir es
Antoni o Nar
iño Pue nte Arand a Cand elar ia Raf ael Uribe Uribe Ciu dad Bol ivar Localidad
18
Esta variable clasifica las viviendas de uno a seis estratos. Es usada para calcular
las tarifas de los servicios públicos y hace posible identificar los sectores de la
población que tienen una mayor contribución monetaria al momento de pagar los
servicios así como identificar los que serán beneficiados con esta contribución. A
continuación se muestra la distribución por estrato socioeconómico de la muestra:
Ilustración 5 Número distribución por estrato socioeconómico de la muestra
Como se puede apreciar, el 81% de la muestra pertenece los estratos dos tres y
cuatro, considerados estratos medios. Dado que estos estratos cumplen con la
función de generar la mayor parte de mano de obra, esta distribución es consistente
con la realidad de la ciudad.
5.4Tipo de vivienda de la muestra
El estudio contratado por la secretaría de movilidad tuvo en cuenta cinco tipos de
vivienda a saber: casa, apartamento, cuartos en inquilinato, cuartos en otro tipo de
estructura y otros tipos de vivienda (Carpa, vagón, tienda, etc.). En la siguiente
6.8%
27%
36% 18%
6.8% 5.2%
1 2 3 4 5 6
19
gráfica se puede apreciar que la muestra utilizada para el presente trabajo solo
contiene tres de estos ya que los dos restantes son atípicos en la ciudad.
Ilustración 6. Número distribución por tipo de vivienda de la muestra
Como se puede apreciar, la casa y el apartamento son predominantes, solo tres
personas habitando un cuarto en inquilinato. Esta variable, como se verá más
adelante, no será significativa para explicar la variable dependiente, en parte debido
a que existen pocas categorías en su estructura.
5.5 Total de personas en el hogar
Esta variable es de tipo entera ordenada, ya que explica cuántas personas residen
en la vivienda donde fue hecha la encuesta. Tiene en cuenta solo personas mayores
de 5 años y presenta un valor que puede considerarse atípico que no tiene ninguna
repercusión en el análisis hecho para la construcción del modelo. 0
20,000 40,000 60,000 80,000 100,000 120,000 140,000
Frecuencia
0
Cas a
Apa rtam
ento
Cuar to en
inqu ilinat
o
20
Ilustración 7 Número de personas en el hogar
Como se puede ver, 14 personas viviendo en una casa no es un valor normal de la
variable, pero se presenta en el hogar donde residen las tres personas en inquilinato
y no afecta la estimación posterior del modelo. Tiene una distribución discreta que
asemeja a una normal cuyo valor máximo es tres individuos por hogar
representando a 66.427 personas teniendo en cuenta los pesos dados por el factor
de expansión.
5.6 Medios de transporte en el hogar
Esta variable indica cómo se distribuye el porcentaje de carros, camionetas,
bicicletas y motos existen en los hogares de la muestra. Estos fueron elegidos
dentro de las once opciones dadas en la encuesta base. Para la construcción del
modelo se fusionaron el número de carros y el de camionetas dado que su diferencia
no es de mayor importancia la hora de aplicar el modelo. 0
10,000 20,000 30,000 40,000 50,000 60,000 70,000
Frecuencia
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 To tal personas en el ho gar
21
Como se puede ver, el 55% del número total de vehículos corresponde a carros o
camionetas y el 45% restante motos o bicicletas. Este tipo de gráfico con
porcentajes es usado únicamente para la caracterización de la muestra, para el
estudio fue usado el número de vehículos de cada tipo en el hogar.
5.7 Forma de pago del hogar
En la encuesta base existen cinco tipos de pago de vivienda a saber: Propia pagada,
Propia pagando, Arriendo o subarriendo, En usufructo y Ocupante de hecho. En la
siguiente gráfica se muestra solo cuatro de estas categorías ya que dentro de la
muestra final no se encuentra ninguna persona viviendo como Ocupante de hecho.
Como se aprecia, la mayoría de los individuos residen en una vivienda propia
pagada, lo cual no es sorprendente tratándose de personas trabajando y que
pueden pagar el lugar donde viven. La otra gran mayoría vive en arriendo, lo cual
es consistente también con el anterior comentario.
8.1%
22%
23% 47%
Camionetas Motos
Bicicletas Carros
22 5.8 Ingresos
Esta es la última variable tratada en el estudio base. Está ordenada en rangos con
intervalos irregulares y tiene ocho clasificaciones. A continuación se muestra el
gráfico de columnas para cada uno de los valores, siendo el valor que se muestra
el mayor ingreso que puede tener una persona ubicada en esa categoría
Ilustración 10 mayor ingreso que puede tener una persona en los hogares de la muestra
Como se puede apreciar, la mayoría de los individuos de la muestra usada tiene
ingresos de más de $535.800 y menores a $4`000.000, algo consistente con la
estratificación mostrada anteriormente pues según la Dirección Nacional de
Planeación, los ingresos para el estrato medio oscilan entre 3 y 8 salarios mínimos
vigentes.
5.9 Edad
La variable edad fue tomada como una variable continua dado su alto grado de
variabilidad (de 16 a 83 años). Existen tres adolescentes menores de edad
trabajando, uno de 16 y otro de 17 años, lo cual no es explotación infantil si estos lo 0
20,000 40,000 60,000
Frecuencia
535 .600
1.200 .000
2.000 .000
2.800 .000
4.000 .000
5.500 .000
8.000 .000
Más de 8.00
0.000
23
hacen con permiso legal de los responsables económicos y no ha de ser excluido
del estudio si estos datos no afectan de manera crítica los estimativos del modelo.
Ilustración 11 edad en años de la muestra
Esta gráfica nos muestra que la media oscila entre los 25 y los 35 años. Como se
puede ver, la muestra se distribuye de manera aproximadamente normal y no
presenta ninguna mutilación abrupta de los datos, lo cual es típico en este tipo de
variable. Es importante incluir esta variable dentro del estudio pues como se verá
más adelante tiene una estrecha correlación con la probabilidad de uso de los
medios de transporte analizados.
5.10 Nivel de estudios
Esta variable nominal presenta de manera ordenada el último grado de estudio que
el encuestado ha alcanzado hasta el día de la encuesta. De los doce niveles de
estudio presentes en el estudio base, solo el nivel de preescolar no tiene ningún
individuo en la muestra final. 0
5,000 10,000 15,000 20,000 25,000 30,000 35,000
Frecuencia
10 20 30 40 50 60 70 80
24
Ilustración 12 nivel de estudios en los hogares de la muestra
Para comprobar la significancia de esta variable en el modelo final, fue necesario
unificar las categorías de completo e incompleto pues al disminuir la variabilidad de
la variable en general, era más fácil mostrar la significancia global de la variable y
sus respectivas repercusiones por rango sobre la variable dependiente.
5.11 Ocupación principal
Esta variable nominal sirvió para dos propósitos: por un lado se usó para crear una
restricción y que todos los individuos del estudio final fueran trabajadores, y por el
otro se probó su aporte al modelo. Está dividida en doce categorías, todas
relacionadas con algún trabajo.
Ilustración 13 trabajo principal de una persona en los hogares de la muestra
0 10,000 20,000 30,000 40,000 50,000 60,000 70,000 80,000 Frecuencia prees colar Prim aria Incom plet a Prim aria Com plet a Sec und aria Incom plet a Sec und aria com pleta Técnic o Inc
omplet o
Técnic o Com
pleto
Univer sitar
io Inc ompl eto Uni versit ario Com plet o Pos tgrado Incom plet o Pos tgrado Com plet o Ningun o
Nivel de estudios
0 20,000 40,000 60,000 80,000 100,000 120,000 140,000 Frecuencia 0 Obr ero Emplead o de
nómina Cont
ratist a
Emplead o Dom
éstic o
Trabaj ado
r Ind epe
ndient e
Prof esion
al Inde pen dient e Patrón o em plead or Trabaj o fa
miliar
Trabaj o des
de la cas a Cond uctor de bus /bus eta Cond uctor de taxi Mens ajero Trabajo Principal
25
El gráfico muestra que la mayoría de los encuestados son empleados de nómina,
típico de las personas con los ingresos y estrato mostrados en el estudio. Es
importante también aclarar que a esta variable se le hicieron algunas modificaciones
relevantes mostradas más adelante con el fin de demostrar su significancia cuando
se unían categorías.
5.12 Sector productivo
En el estudio usado como base para el presente trabajo existían dieciocho
categorías sobre esta variable, de las cuales están presentes todas en la muestra
reducida. Esta es una variable nominal no ordenada, sobre la cual también se
hicieron algunos ajustes para verificar su significancia al momento de unificar
algunas de las categorías con características similares.
Ilustración 14 sector productivo de los hogares de la muestra
Se puede apreciar que algunos sectores no son propios de la ciudad ni gozan de
una buena cantidad de personas trabajando, tales como la pesca, agricultura,
0 5,000 10,000 15,000 20,000 25,000 30,000 35,000 40,000 Frecuencia -1 Otro Agr icul tura Pes ca Explo tación
de m inas Indu strias Manu fact urer as Sum inistr
o de servic
ios púb licos Cons trucc ión Com erci
o al por
may or
Hot eles
y res tau
rant es
Trans por
te y alm acena mient o Inter medi ación finan ciera Activ idades Inm obiliar ias Adm inistac
ión púb lica y def ensa Edu cación Ser vici
os S ocial
es
Ser vici
os c omuni
tario s y
soc iales
Servic io dom
éstic o
Organ izac
ione s Ex
trat errit
oria les
26
explotación de minas u organizaciones extraterritoriales dada su poca disponibilidad
de terreno para ser ejecutadas. Por otro lado, se evidencia una gran mayoría de
comercio entre otras actividades del sector de servicios, abundantes en las
metrópolis modernas.
5.13 Licencia de conducción
En el estudio base existen 5 categorías básicas para esta variable, todas las cuales
están incluidas en la muestra reducida. Esta variable es nominal, teniendo una
influencia clara en el medio de transporte a elegir, ya que constituye un costo extra
para utilizar algunos de los medios estudiados.
Ilustración 15 sector productivo de los hogares de la muestra
Como se puede ver, la gran mayoría de personas en la encuesta tienen al menos
una licencia, siendo más frecuente la de automóvil que el resto. Este, sin embargo,
puede verse como un punto muy variable, pues las licencias se vencen cada 4 años
y no es seguro que una persona que la tenga este la renueve el siguiente.
5.2% 8.2%
14%
27% 45%
Otros Vehiculos Solo Moto Automovil y Moto No tiene Solo Automovil
27 5.14 Género
Se puede apreciar una clara diferencia de género en la muestra utilizada
comparándola con la muestra total. Esto se puede deber a que es mayor la cantidad
de mujeres amas de casa en la ciudad por las características culturales del país.
Esta variable es dicotómica nominal y no hay necesidad de hacerle ninguna
transformación al momento de comprobar su significancia.
Ilustración 16 porcentaje de género en los hogares de la muestra
5.15 Tiempo de transporte hacia el trabajo
Esta variable es una de las más importantes pues es muy maleable al momento de
insertar nuevas políticas en la forma de transporte utilizada en la ciudad. Es una
variable continua y está estrechamente relacionada con el medio utilizado de forma
intuitiva. Esta variable fue creada artificialmente teniendo en cuenta la hora de salida
y la hora de llegada de las personas a su destino.
56.4% 43.6%
28
Ilustración 17 Tiempo que gastan en transporte hacia el trabajo los hogares de la muestra
Como podemos notar, algunos de los viajes duran más de tres horas ya que esta
incluye el tiempo que se demoraba una persona caminando hacia el medio o
esperándolo. Fueron eliminados tres valores atípicos ya que al ser revisados
correspondían a taxistas que trabajaban en el mismo medio de transporte en el que
iban hacia el trabajo y por lo tanto se asumió que respondieron el tiempo total que
estuvieron laborando.
5.16 Minutos caminados al salir y al llegar
Estas variables nos indican el tiempo en minutos caminados al llegar al medio de
transporte y al trabajo respectivamente. A primera vista, sus distribuciones son
similares, pero como veremos más adelante, las dos resultaron ser significativas
para el estudio de forma individual. Fueron modeladas como variables continuas y
no se les hizo cambio alguno al momento de probar su significancia. 0
10,000 20,000 30,000 40,000 50,000
Frecuencia
0 .5 1 1.5 2 2.5 3 3.5
29
Ilustración 18 número de cuadras caminadas al salir de la casa por hogares de la muestra
Se puede ver que la mayoría de personas no tienen que caminar al medio de
transporte, ya que al ser privado en muchos casos se encuentra en el mismo lugar
de residencia.
Ilustración 19 Número de cuadras caminadas al llegar por los hogares de la muestra
El mismo comentario anterior aplica para este caso. Al ser un medio privado, no es
necesario caminar hacia el trabajo, pues este es en la mayoría de los casos un
medio puerta a puerta. Las distribuciones tienen mucha similitud entre ellas, pero al
momento de llegar al trabajo es mayor la cantidad de personas que no deben
caminar.
5.17 Descripción de la variable dependiente
0 50,000 100,000
Frecuencia
0 5 10 15 20 25 30 35 40
Cuadras caminadas al salir de la casa
0 50,000 100,000 150,000
Frecuencia
0 5 10 15 20 25
30
En el estudio base la pregunta sobre el medio usado para viajar tiene varias
opciones de respuesta, por lo que fue necesario agrupadas por características
similares, de manera que fuera simplificado. A continuación se presenta una gráfica
con la muestra usada para la construcción del modelo y su distribución asociada al
medio de transporte usado.
Ilustración 20 muestra usada para la construcción del modelo y su distribución asociada al medio de transporte usado
Como se puede ver, hay algunos medios dominantes y otros sin mayor relevancia.
La siguiente tabla muestra cómo fueron agrupados los medios. Es importante
aclarar que en algunos casos los medios no parecen pertenecer a la categoría
seleccionada a simple vista, pero si se analiza el precio de uso se entenderá el
porqué de su inclusión. 0 20,000 40,000 60,000 Frecuencia 0 Bus alim ent ado r Bus eta Cam ion Veh icul
o es colar
Veh ículo
a trac ción anim al bici taxi Aut o inf
orm al Otro Bici clet a Mot o com
o cond uctor
Veh icul
o pr ivado
com o cond
uctor
Trans mileni
o
31
Categoría Propuesta Medio usado
Carro Vehículo privado como conductor
Vehículo privado como pasajero
T. Público
Bus Buseta Microbús
Transporte intermunicipal Bus colectivo informal
taxi
Taxi
Vehículo escolar Bus privado Taxi colectivo
Bicicleta Bicicleta
Moto Moto como conductor
Moto como pasajero
Transmilenio Transmilenio
7. TABLA agrupación de medios de transporte
Después de ser agrupados de esta manera, el siguiente gráfico muestra sus
proporciones finales:
Ilustración 21porcentaje de los medios utilizados en el estudio de la muestra
Como se puede observar, no hay manera de mesclar los medios finales, y a pesar
de su baja proporción dentro de la muestra utilizada, es necesario hacer el estudio
sin agrupar más categorías. Por otro lado, el transporte público y el carro ocupan 8.8%
33.2%
1.5% 17.5%
32.3%
6.7%
taxi Transporte Público Bicicleta
32
los lugares más privilegiados de este diagrama, lo que se corresponde plenamente
con la verdadera situación de la ciudad.
5.18 Modelo Multilogístico general
Un modelo nominal se presenta cuando sus categorías son discretas y no están
ordenadas. En este caso, las salidas del modelo se reducen a seis medios de
transporte que no tienen orden alguno, pero muchas veces aunque las salidas sean
ordenadas, si existe alguna duda, se prefiere usar este tipo de estudios. El modelo
multinomial logístico es el modelo nominal más usado, aunque conlleva grandes
problemas al momento de interpretar los resultados y seleccionar el modelo
adecuado dada su naturaleza no lineal. En esta parte se presenta una breve
introducción al modelo, seguido de tests de significancia acerca de las variables
explicativas evaluadas y finalmente se hace uso de métodos de interpretación.
El modelo multilogístico puede ser pensado como una estimación de varios modelos
logísticos al tiempo para todas las comparaciones posibles entre las variables
dependientes. Por ejemplo, vamos a suponer que el modelo solo tiene tres variables
nominales como salidas que son Transporte público (P), Vehículo Privado (V) y taxi
(T) y que solo existe una variable explicativa que dice el nivel de ingresos de la
muestra. Se puede ver el efecto de la variable ingresos sobre nuestros tres tipos de
transporte usando una regresión multilogística estimando tres logits diferentes:
𝑙𝑛 [Pr(𝑇|𝑥)
Pr(𝑃|𝑥)] = 𝛽0,𝑇|𝑃 + 𝛽1,𝑇|𝑃𝑖𝑛𝑔𝑟𝑒𝑠𝑜𝑠
𝑙𝑛 [Pr(𝑉|𝑥)
33
𝑙𝑛 [Pr(𝑇|𝑥)
Pr(𝑉|𝑥)] = 𝛽0,𝑇|𝑉 + 𝛽1,𝑇|𝑉𝑖𝑛𝑔𝑟𝑒𝑠𝑜𝑠
Donde los β`s indican qué comparación está siendo hecha.
Como se puede ver, hay una redundancia de información al estimar los 3 logits con
los mismos datos, por lo que se prefiere usar la siguiente fórmula para estimar la
tercera comparación y sus respectivos betas:
• 𝑙𝑛 [Pr(𝑇|𝑥)Pr(𝑃|𝑥)]-𝑙𝑛 [Pr(𝑉|𝑥)Pr(𝑃|𝑥)]=𝑙𝑛 [Pr(𝑇|𝑥)Pr(𝑉|𝑥)]
• Donde:
• 𝛽0,𝑇|𝑃− 𝛽0,𝑉|𝑃 = 𝛽0,𝑇|𝑉
• 𝛽1,𝑇|𝑃 − 𝛽1,𝑉|𝑃= 𝛽1,𝑇|𝑉
En general, si hay J categorías en la variable dependiente, se deben estimar solo
j-1 modelos logísticos binarios, encontrando los datos del que falta con la fórmula
especificada.
El problema de estimar logits independientes para cada una de las categorías radica
en que la muestra correspondiente a las categorías que no están siendo utilizadas
no es usada, lo cual lleva a estimaciones de las betas erróneas. Este error es
corregido al utilizar un modelo multilogístico pues este tiene en cuenta las
restricciones pertinentes para generar una muestra del mismo tamaño al estimar
34
A continuación se muestra el modelo general que va a ser usado para la estimación
de las probabilidades:
ln 𝛺𝑚|𝑏(𝒙) = 𝑙𝑛 [Pr(𝑦=𝑚|𝒙)Pr(𝑦=𝑏|𝒙)] = 𝒙𝛽𝑚|𝑏 Para m=1 a J
Donde:
Pr(𝑦 = 𝑚|𝒙) = 𝑒𝑥𝑝(𝒙𝛽𝑚|𝑏)
∑𝐽𝑗=1𝑒𝑥𝑝(𝒙𝛽𝑗|𝑏)
ln 𝛺𝑏|𝑏(𝑥) = ln 1 = 0⇒ 𝛽𝑏|𝑏= 0
La b es la categoría base, que también puede ser llamada el grupo de comparación.
Dado que el ln 𝛺𝑏|𝑏(𝑥) = ln 1 = 0, entonces 𝛽𝑏|𝑏 = 0
Se debe tener en cuenta que el resultado es el mismo sin importar qué categoría se
elija como base, aunque un cambio de categoría puede ser confuso. Por este
motivo, en el siguiente trabajo se sigue la recomendación de usar una sola categoría
como base durante todo el trabajo investigativo.
5.19 Modelo base
Después de la selección de las variables candidatas el estudio, fue necesario decidir
el grupo de comparación y crear un modelo base con variables significativas para
probar su relevancia. Se seleccionó el grupo de Transporte público como base que
como ya se dijo puede ser cualquier otro puesto que no tiene ningún efecto esta
elección en los resultados del modelo. Las variables empleadas como base y a las
35
de carros y camionetas, motos y bicicletas en el hogar, los ingresos, y el tiempo de
transporte.
Para evitar los problemas de co-linealidad perfecta fue necesario fusionar los
estratos 5 y 6 al ser omitidos en el modelo al igual que el rango de ingresos 7 y 8 de
la variable Ingresos puesto que de otra manera la función evaluada no sería
cóncava y como consecuencia no tendría un máximo. Los resultados de las pruebas
de significancia con un 2.5% de valor p son los siguientes:
Variable Independiente
Likelihood Ratio Test Wald Test
chi2 df P>chi2 chi2 dfP>chi2
Estrato 1 37,98 5 0,0% 24.792 5 0,0%
Estrato 2 55,64 5 0,0% 48.893 5 0,0%
Estrato 3 41,85 5 0,0% 36.763 5 0,0%
Estrato 4 28,09 5 0,0% 24.338 5 0,0%
Ingresos 1 ( 0 - 535.601) 8,74 5 12,0% 2.326 5 80,2%
Ingresos 2 ( 535.601 - 1´200.000) 3,07 5 68,9% 2.846 5 72,4%
Ingresos 3 (1`200.001 - 2`000.000) 3,80 5 57,9% 3.826 5 57,5%
Ingresos 4 (2`000.001 - 2`800.000) 3,11 5 68,3% 3.023 5 69,6%
Ingresos 5 (2`800.001 - 4`000.000) 8,60 5 12,6% 8.417 5 13,5%
Carros y camionetas 77,11 5 0,0% 69.788 5 0,0%
Motos 200,10 5 0,0% 132.894 5 0,0%
Bicicletas 33,52 5 0,0% 33.980 5 0,0%
Tiempo de transporte 173,02 5 0,0% 129.640 5 0,0%
Set: Ingresos 34,96 25 8,9% 25.942 2541,1%
Set: Estrato 80,49 20 0,0% 62.522 20 0,0%
8. TABLA variables empleadas como modelo base
Como se muestra en la tabla, se hicieron dos tipos de pruebas para cada variable,
una Likelihood ratio y la otra de Wald. Las categorías de cada variable son probadas
36
son variables nominales. Las variables y los porcentajes en rojo representan las que
aceptan la hipótesis nula, es decir que los coeficientes asociados a la variable
ingresos y todos sus sub grupos son 0 y no deben ser incluidos en el modelo. Por
lo tanto, dichas variables son descartadas. Con las variables que pasan las pruebas,
se crea un nuevo modelo y a este se van adicionando una a una las variables
restantes para probar su aporte. A continuación se muestra las pruebas de
significancia para las demás variables continuas seleccionadas:
Variable Independiente Likelihood Ratio Test Wald Test chi2 dfP>chi2 chi2 dfP>chi2
Número de hogares en la vivienda 5.877,00 5 31,8% 5.258 5 38,5%
Total personas en el hogar 59.553,00 5 0,0% 55.467 5 0,0%
Edad 25.985,00 5 0,0% 24.842 5 0,0%
Minutos caminados salida 920.737,00 5 0,0%
393.718
5 0,0%Minutos caminados llegada 484.834,00 5 0,0%
484.834
5 0,0% 9. TABLA pruebas de significancia para las demás variables continuas seleccionadasLa tabla nos muestra que todas menos la variable que indica el número de hogares
en la vivienda pasan las dos pruebas. Por lo tanto, solo esta variable no será incluida
en el modelo de las mostradas y se añadirá las cuatro restantes al modelo final. De
las variables discretas faltantes hubo dos que especialmente fueron problemáticas
al momento de valorar su significancia dado lo complejo de sus categorías, por lo
tanto se dejarán estos dos casos para ser probados al final de la construcción. Las
37
Variable Independiente Likelihood Ratio Test Wald Test
chi2 df P>chi2 chi2 dfP>chi2
Tipo pago de vivienda: Propia pagando 2.282 5 80,9% 2.295 5 80,7%
Tipo pago de vivienda: Arriendo o subarriendo 4.943 5 42,3% 4.768 5 44,5%
Set: Tipo de pago de vivienda 13.005 10 22,3% 12.841 1023,3%
Secundaria 5.437 5 36,5% 5.516 5 35,6%
Técnico 11.091 5 5,0% 10.909 5 5,3%
Universitario 4.607 5 46,6% 4.578 5 47,0%
Postgrado 2.998 5 70,0% 2.989 5 70,2%
Set: Nivel de estudios 31.030 20 5,5% 30.545 20 6,1%
Automóvil y Moto 195.515 5 0,0% 148.013 5 0,0%
Solo Automóvil 110.291 5 0,0% 91.107 5 0,0%
Solo Moto 110.218 5 0,0% 69.031 5 0,0%
Otros Vehículos 82.683 5 0,0% 72.010 5 0,0%
Set: Licencia de conducción 350.765 20 0,0% 263.92020 0,0%
Upz 12.324 5 3,1% 11.422 5 4,4%
Tipo de Vivienda 1.931 5 85,9% 1.920 5 86,0%
Género 57.741 5 0,0% 53.264 5 0,0%
10. TABLA variables discretas
Como se puede ver, solo pasan las dos pruebas la variable licencia de conducción
y género puesto que el nivel de significancia elegido es de 2.5%. Para las otras dos
variables restantes se hace un estudio aparte unificando categorías, estas variables
son el sector productivo y la ocupación principal. La principal razón para hacer esto
es que ya que son variables nominales, si se incluyen todos los subgrupos
contenidos en ellas es inevitable una correlación perfecta, por lo que es necesario
unificar uno o varios de los rangos y omitirlos al momento de generar el modelo.
6. CAPITULO IV: Interpretación de los resultados y conclusiones
Para la interpretación de los datos, lo primero que se hace es una comparación
38
base. Después, se expondrá los resultados más importantes asociados con la
interpretación del modelo y por último sus respectivas conclusiones.
Para mostrar las diferencias y similitudes de los datos de la encuesta con los datos
generados por el modelo se hizo un gráfico de barras por estrato que muestra la
probabilidad de uso de cada uno de los medios.
Como se puede ver, el modelo creado tiene las mismas tendencias que los datos
sacados del estudio. Sin embargo, hay dos casos en los que sobreestima los
porcentajes, el caso del carro y el caso del transporte público, mientras que en otros
los subestima, como es el caso del Transmilenio y la bicicleta. Esto puede corregirse
incluyendo otras variables explicativas de diferentes clases a las utilizadas en el
presente estudio tales como la seguridad de los medios u otras que sean
características tomadas directamente del sistema de transporte actual.
Por otro lado, la edad y el género mostraron ser variables relevantes en el estudio
dado que los valores que toman tienen una incidencia relevante sobre la variable
dependiente. A continuación se muestra la tabla asociada al cambio del porcentaje
asociado al cambio en el género:
0% 20% 40% 60% 80% 100%
1 2 3 4 5 6
Uso de los medios pronosticado por estrato
Bici Tm Carro Moto
T Público 0% 20% 40% 60% 80% 100%
1 2 3 4 5 6
Uso de los medios de la muestra por estrato
Bici Tm Carro Moto T Público
39
Esta es una tabla que está dividida en tres columnas. La primera muestra el grupo
base que va a ser afectado por el cambio en el porcentaje, la segunda muestra
contra qué grupo se está comparando y la tercera es el factor por el cual se ve
afectado el primer grupo contra el segundo. Por ejemplo, para la comparación entre
el carro y la bicicleta, la tabla nos muestra que la probabilidad de que una mujer elija
el carro sobre la bicicleta es 3.87 veces más grande que la misma elección para los
hombres. Este resultado se puede deber al riesgo asociado a usar este medio en la
ciudad, pues la infraestructura vial está mucho mejor desarrollada para el carro que
para la bicicleta o la moto y las mujeres, se podría argumentar, son más adversas
al riesgo que los hombres.
Los números en rojo nos indican que las mujeres tienden a preferir el carro sobre el
Transmilenio en un 20% más que la probabilidad de elección de los hombres, y el
taxi sobre el Transmilenio un 58% más. Esto nos indica que existe una diferencia
de elección entre los dos sexos asociada a algún atributo del medio. Para la edad
también se muestran diferencias apreciables y que es necesario destacar. En la
siguiente tabla se muestra los resultados asociados al cambio de probabilidades
40
Esta tabla nos muestra que la probabilidad de usar taxi a otros medios es mayor en
todos los casos cuando una persona tiene diez años más. Por el contrario, parecen
preferir cualquier medio menos la bicicleta en vez del Transmilenio. Esto se puede
deber a una disminución de la actividad física a medida que pasan los años, pues
los medios más usados son los que menos actividad requieren (caminar, montar
bicicleta, etc.).
Otro aspecto analizado y que después llevará a una conclusión importante es la
probabilidad de usar un medio de transporte dependiendo del tiempo que se demora
en el viaje. En especial, es importante señalar el comportamiento de tres de los
medios estudiados: taxi, carro y transporte público. La gráfica siguiente hace un
resumen del comportamiento encontrado:
0% 20% 40% 60% 80%
Por
ce
n
taje
d
e
u
so
Tiempo en tránsito (En horas)
Tiempo en tránsito vs medio usado
Carro T. Público Taxi
41
Como se puede apreciar, la probabilidad de uso de los medios mostrados no cambia
de manera abrupta, por el contrario, posee una tendencia constante. Esto es
especialmente cierto en el caso del carro, cuyos límites inferior y superior no
sobrepasan el 29 o el 31 por ciento respectivamente. Para este caso, se podría
afirmar que el tiempo empleado en el viaje no afecta de manera significativa el
porcentaje de uso del medio de transporte, lo que unido a la creciente congestión
en las vías es un aspecto clave a tener en cuenta. Si la congestión en las vías
aumenta, el tiempo de transporte aumenta, sin embargo como parece sugerirlo la
presente gráfica, el modo de transporte no cambia.
En la siguiente gráfica se presenta el porcentaje de cambio de los diversos modos
de transporte dependiendo la licencia de conducción de los encuestados:
Como se puede apreciar, el tener una licencia de conducción afecta de manera
negativa el uso del transporte público y aumenta el uso del carro sin importar el tipo
-0,6 -0,5 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 0,5 0,6
Cambio en probabilidad de
elección del medio dependiendo
de la licencia de conducción
Automovil y Moto Otros Vehiculos Solo Automovil Solo Moto
42
de licencia obtenida. A pesar de ser un dato interesante, prueba ser de poco valor
práctico al momento de adoptar una política sobre este punto, debido principalmente
a que toda acción tomada sobre esta variable tendría un efecto muy limitado sobre
el comportamiento de la gente. Esta, es por lo tanto, una variable que explica el
modelo mas no sirve para su modificación.
7. CONCLUSIONES
La ciudad se está congestionando debido a que la tasa de crecimiento de la
infraestructura vial está muy por debajo de la demanda de carros. Esto fue
claramente explicado cuando se mostró que desde el 2004 al 2011 la cantidad de
carros en las vías se había duplicado mientras que la infraestructura vial solo había
crecido un 6%.
Por otro lado, se señaló que con respecto al efecto de la variable que determina el
tiempo de transporte, sin importar el tiempo que se demore una persona en llegar
al trabajo, la demanda del carro, transporte público y taxi siguen siendo
aproximadamente iguales. En este punto, el carro parece ser el que más cumple
con esta condición. Este resultado y el anterior nos permite inferir de manera lógica
que el aumento del tráfico no hace que la gente deje de utilizar estos medios de
transporte, por lo cual si no son implantadas algunas políticas, es imposible cambiar
la forma como las personas se movilizan.
La encuesta de movilidad incluía un apartado que se preguntaba acerca de la
violencia contra las mujeres dependiendo del medio de transporte usado. Según
43
dice haber sido víctima de algún tipo de agresión en los medios de transporte en el
mes previo a la realización de la encuesta. A continuación se muestra una gráfica
del porcentaje de agresión por medio de transporte:
Como se puede ver, el lugar donde más se presentan este tipo de agresiones es
en el Transmilenio, lo cual unido a que hay 12 mujeres por cada 10 hombres que
prefieren el carro al Transmilenio, mientras que hay aproximadamente 16 mujeres
por cada 10 hombres que prefieren el taxi al Transmilenio, nos permite plantear la
hipótesis de que este puede ser un punto relevante para explicar el por qué los
hombres prefieren este medio más que las mujeres.
Se recomienda tener en cuenta esta diferencia de género al momento de elegir el
medio de transporte, pues este comportamiento puede estar asociado con la alta
tasa de violencia reportada por la encuesta.
3%
65% 27%
5%
Violencia contra la
mujer por medio de
transporte
Taxi
Transmilenio Bus
44 8. REFERENCIAS
Domencich, Tom & McFadden, Daniel. (1996). Urban Travel Demand: A Behavioral
Analysis.Berkeley, California, EEUU.:North-Holland Publishing Co.
Fogg, BJ. (2004). A Behavior Model for Persuasive Design. Recuperado el día 15
de enero de 2013 de la base de datos academia.edu
Garrido, José. (1999). Impactos medioambientales y sociales del transporte.
Universidad de Zaragoza. Recuperado el 15 de enero de 2013 de la página
http://www.unizar.es/geografia/geographicalia/garrido.pdf
Long, Scott & Freese, Jeremy. (2001). Regression models for categorical dependent
variables using Stata. Bloomington, Indiana, EEUU.:Stata Press.
Centro de noticias ONU. (2012). Colombia: PNUD apoya estrategia de desarrollo
bajo en carbono. Recuperado el 15 de enero de 2013, de la página
http://www.un.org/spanish/News/story.asp?NewsID=22744#.UPWdU2-Nsgp
Centro de noticias ONU. (2012). Colombia: PNUD apoya estrategia de desarrollo
bajo en carbono. Recuperado el 15 de enero de 2013, de la página
http://www.un.org/spanish/News/story.asp?NewsID=22744#.UPWdU2-Nsgp
Sánchez, Lina. (2012). Viajes de la casa al trabajo y aglomeraciones, principales
causas, según la U. Manuela Beltrán, El Tiempo. Recuperado el 15 de enero de
2013,de la página