ANÁLISIS DE EFECTIVIDAD AL
IMPLEMENTAR LA TÉCNICA DE ÁRBOLES
DE DECISIÓN DEL ENFOQUE DE
APRENDIZAJE DE MÁQUINA PARA LA
DETERMINACIÓN DE AVALÚOS MASIVOS
PARA LAS UPZ 79 CALANDAIMA, 65
ARBORIZADORA Y 73 GARCÉS NAVAS
Adriana del Pilar Albancando Robles
Universidad Distrital Francisco José de Caldas
Facultad de Ingeniería, Ingeniería Catastral y Geodesia
Bogotá D.C.
ANÁLISIS DE EFECTIVIDAD AL
IMPLEMENTAR LA TÉCNICA DE ÁRBOLES
DE DECISIÓN DEL ENFOQUE DE
APRENDIZAJE DE MÁQUINA PARA LA
DETERMINACIÓN DE AVALÚOS MASIVOS
PARA LAS UPZ 79 CALANDAIMA, 65
ARBORIZADORA Y 73 GARCÉS NAVAS
Adriana del Pilar Albancando Robles
Monografía de grado presentado como requisito parcial para optar el título de:
Ingeniera Catastral y Geodesta
Director:
Ingeniero Edwin Robert Pérez Carvajal
Universidad Distrital Francisco José de Caldas
Facultad de Ingeniería, Ingeniería Catastral y Geodesia
Bogotá D.C.
III Dedicatoria
A mi Padre Celestial, a mi mamá
Adriana Robles Salazar, mi papá Edwin
Albancando Cushcagua, mis hermanas
Diana Margarita, Liz Alejandra, Karol
Daniela y mis hermanos Edwin Hared y
José David, quienes han sido el motor y
apoyo constante en cada logro que he
conseguido, así como a cada familiar y
amigo que ha hecho parte de este
proceso.
Adriana del Pilar Albancando Robles
IV
Agradecimientos
De manera solemne expreso gratitud a todos los que estuvieron involucrados en este
proyecto que ahora llega a su culminación.
A Mi Padre Celestial, a quien debo cada fortaleza, a los miembros de mi familia, mis
padres y hermanos, que fueron participantes activos en este proceso, su ejemplo, apoyo,
dedicación y sacrificio dieron paso a que haya sido posible llevar a cabo este cometido,
reconozco su paciencia y confianza, que me llevaron a perseverar en esta labor cada
momento.
A la Universidad Distrital Francisco José de Caldas por haberme permitido participar de
este proyecto curricular y darme las herramientas mediante sus docentes y programas para
desarrollarme como profesional en Ingeniería Catastral y Geodesia.
De manera especial agradezco a mi director, el Ingeniero Edwin Robert Pérez, quien
estuvo al tanto de cada parte del desarrollo de este trabajo, prestando un dedicado apoyo,
constante atención e instrucción oportuna.
Finalmente agradezco a la Unidad Administrativa Especial de Catastro Distrital (UAECD)
y al Observatorio Técnico Catastral por suministrarme la información correspondiente a
V
Resumen
El presente proyecto tiene como fin desarrollar la aplicación del aprendizaje de máquina,
específicamente el método de árboles de decisión, para verificar su efectividad como parte
fundamental del estudio que constituyen los avalúos masivos y mostrar una comparación
con valores observados y el método tradicionalmente empleado, a saber, la regresión
lineal.
Para cumplir con los objetivos propuestos se emplearon métodos de clasificación para
datos numéricos, el M5P, y para datos nominales, el ID3 y el J48, los cuales se evaluaron
por variaciones de los Test Cross Validation (validación cruzada) y Percentage Split
(División de porcentaje), por medio de los que se verificó el clasificador de árboles de
decisión más acertado al obtener resultados semejantes a los observados.
Con el propósito de verificar la efectividad de la aplicación del aprendizaje de máquina en
procesos como los avalúos, se hizo uso de datos proporcionados por la Unidad
Administrativa Especial de Catastro Distrital (UAECD) y el Observatorio Técnico
Catastral, correspondientes a las Unidades de Planeamiento Zonal (UPZ) 65
Arborizadora, 73 Calandaima y 79 Garcés Navas, adicionalmente, para el tratamiento de
los datos se empleó el software libre Weka con sus aplicaciones y opciones para visualizar,
procesar y observar resultados.
Como resultado del análisis realizado, se obtuvo que el aprendizaje de máquina por medio
del método de árboles de decisión es una herramienta útil y efectiva para aplicar dentro del
proceso de los avalúos, su aplicación a los datos es más específica al compararla con el
VI
aplica a los grupos de datos y hacer un análisis más específico de las clasificaciones
finales.
Palabras clave: Aprendizaje de Máquina, Árboles de decisión, Unidad de Planeamiento
1
Tabla de contenido
Agradecimientos ... IV
Lista de figuras ...5
Lista de tablas ...8
Lista de ecuaciones ... 12
Lista de anexos ... 13
Introducción ... 18
1. Antecedentes ... 20
2. Problema de investigación ... 28
3. Objetivos ... 31
3.1 General ... 31
3.2 Específicos ... 31
4. Justificación ... 32
5. Marco espacial ... 34
5.1. UPZ 65 Arborizadora ... 34
5.2. UPZ 73 Garcés Navas ... 37
5.3. UPZ 79 Calandaima ... 41
2
6.1 Inteligencia artificial ... 44
6.2 Aprendizaje de máquina... 47
6.3 Árboles de decisión ... 50
6.4 Entropía de la información ... 55
6.5 Ganancia de la información ... 59
6.6 Método ID3 ... 64
6.7 Método J48 o C4.5 ... 65
6.8 Método M5P ... 68
6.9 Métodos de validación ... 69
6.10 WEKA... 70
6.10.1 Estadístico Kappa ... 75
6.10.2 Coeficiente de correlación ... 76
6.10.3 Errores ... 77
6.11 Construcción de intervalos ... 79
6.12 Valuación ... 79
6.12.1 Valuación estadística... 81
6.12.2 Avalúos masivos ... 83
6.12.3 Puntos de investigación económica ... 84
6.13 Unidades de Planeamiento Zonal (UPZ)... 84
3
7.1 Definición de zonas de estudio ... 86
7.2 Adquisición de base de datos catastrales de la zona de estudio ... 87
7.3 Selección de métodos basados en árboles de decisión ... 89
7.4 Estructura preliminar del experimento, clasificación de los datos para el procesamiento en el software WEKA ... 91
7.4.1 Atributo sector... 95
7.4.2 Atributo uso ... 96
7.4.3 Atributo pisos ... 97
7.4.4 Atributo edad ... 98
7.4.5 Atributo puntaje ... 99
7.4.6 Atributo estrato ... 100
7.4.7 Atributo actividad ... 101
7.4.8 Atributo tratamiento ... 101
7.4.9 Atributo área de terreno ... 102
7.4.10 Atributo valor metro cuadrado de terreno ... 104
7.4.11 Atributo área construida ... 106
7.4.12 Atributo valor metro cuadrado de construcción ... 108
7.4.13 Generación archivos weka ... 109
8. Análisis de resultados ... 115
4
8.2 Resultados UPZ 73 Garcés Navas, Conjunto de datos NO_PH ... 126
8.3 Resultados UPZ 65 Arborizadora, Conjunto de datos PH ... 137
8.4 Resultados UPZ 65 Arborizadora, Conjunto de datos NO_PH ... 148
8.5 Resultados UPZ 79 Calandaima, Conjunto de datos PH ... 159
8.6 Resultados UPZ 79 Calandaima, Conjunto de datos NO_PH ... 170
9. Conclusiones ... 181
10. Recomendaciones ... 183
11. Anexos ... 185
5
Lista de figuras
Figura 1. 1 Procedimiento para construir una base de conocimiento para implementar el
método de aprendizaje... 20
Figura 1. 2 Ejemplo de capas de una imagen para el conjunto de datos de entrenamiento y el flujo de datos en el subsistema ... 21
Figura 1. 3 Esquema de la definición de las variables ... 23
Figura 1. 4 Ejemplo de árbol de decisión para iniciación ... 24
Figura 1. 5 Comportamiento del error (ECM) ... 26
Figura 5.1. 1 División por sectores UPZ 65 Arborizadora ... 35
Figura 5.2. 1 División por Sectores UPZ 73 Garcés Navas ... 39
Figura 5.3. 1 División por sectores UPZ 79 Calandaima ... 42
Figura 6.2. 1 Esquema de la técnica de Aprendizaje de máquina ... 48
Figura 6.3. 1 Ejemplo de árbol de decisión ... 52
Figura 6.3. 2 Ejemplo de reglas generadas por un Árbol de Decisión ... 53
Figura 6.4. 1 Gráfica de la Función de entropía de una clasificación booleana ... 58
Figura 6.5. 1 Comparación de resultados de Ganancia de información... 64
Figura 6.9. 1 Ejemplo de Validación Cruzada - Cross Validation ... 70
Figura 6.10. 1 Ventana de Inicio. Weka, Versión 3.6.13 ... 71
Figura 6.10. 2 Entorno Explorer del Software WEKA ... 72
Figura 7. 1 Esquema de metodología ... 86
Figura 7.1. 1 Localización de las zonas de estudio ... 87
6
Figura 7.5. 1 Elaboración del experimento, etapa de entrenamiento y validación ... 111
Figura 7.5. 2 Elaboración del experimento, etapa de pronóstico ... 112
Figura 8.1. 1 Garcés Navas – PH, Comparación Valor m2 de Construcción Observado y
método Árbol de Decisión M5P Split 66 ... 123
Figura 8.1. 2 Garcés Navas – PH, Comparación Valor m2 de Construcción Observado y
método Regresión Lineal Cross 20 ... 124
Figura 8.1. 3 Garcés Navas – PH, Comparación Valor m2 de Construcción Observado,
método Árbol de Decisión M5P Split 66 y Regresión Lineal Cross 20... 125
Figura 8.2. 1 Garcés Navas –NO_PH, Comparación Valor m2 de Construcción Observado
y método Árbol de Decisión M5P Split 80 ... 134
Figura 8.2. 2 Garcés Navas - NO_ PH, Comparación Valor m2 de construcción observado y
método regresión lineal Cross 20 ... 135
Figura 8.2. 3 Garcés Navas – NO_PH, Comparación Valor m2 de Construcción Observado,
método Árbol de Decisión M5P Split 80 y Regresión Lineal Cross 20... 136
Figura 8.3. 1 Arborizadora – PH, Comparación Valor m2 de Construcción observado y
método Árbol de Decisión M5P Cross 20... 145
Figura 8.3. 2 Arborizadora – PH, Comparación Valor m2 de Construcción Observado y
método Regresión Lineal Split 66 ... 146
Figura 8.3. 3 Arborizadora – PH, Comparación Valor m2 de Construcción Observado,
método árbol de Decisión M5P Cross 20 y Regresión Lineal Split 66 ... 147
Figura 8.4. 2 Arborizadora - NO_ PH, Comparación Valor m2 de Construcción Observado
7
Figura 8.4. 3 Arborizadora - NO_PH, Comparación Valor m2 de Construcción Observado
y método Regresión Lineal Split 33 ... 157
Figura 8.4. 4 Arborizadora - NO – PH, Comparación Valor m2 de construcción observado,
método Árbol de Decisión M5P Split 80 y Regresión Lineal Split 33 ... 158
Figura 8.5. 1 Calandaima – PH, Comparación Valor m2 de Construcción Observado y
método Árbol de Decisión M5P Cross 20... 167
Figura 8.5. 2 Calandaima – PH, Comparación Valor m2 de Construcción Observado y
método Regresión Lineal Split 66 ... 168
Figura 8.5. 3 Calandaima – PH, Comparación Valor m2 de Construcción Observado,
método Árbol de Decisión M5P Cross 20 y Regresión Lineal Split 66... 169
Figura 8.6. 1 Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado y
método Árbol de Decisión M5P Split 80 ... 178
Figura 8.6. 2 Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado y
método Regresión Lineal Cross 20 ... 179
Figura 8.6. 3 Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado,
método Árbol de Decisión M5P Split 80 y Regresión Lineal Cross 20... 180
8
Lista de tablas
Tabla 5.1. 1Límites UPZ 65 Arborizadora... 34
Tabla 5.1. 2 Extensión UPZ 65 Arborizadora ... 35
Tabla 5.1. 3 Vías malla arterial UPZ 65 Arborizadora ... 36
Tabla 5.1. 4 Usos del Suelo UPZ 65 Arborizadora ... 37
Tabla 5.1. 5 Distribución de la población por estrato en la UPZ 65 Arborizadora ... 37
Tabla 5.2. 1 Límites UPZ 73 Garcés Navas ... 38
Tabla 5.2. 2 Extensión UPZ 73 Garcés Navas ... 38
Tabla 5.2. 3 Vías Malla Arterial UPZ 73 Garcés Navas ... 40
Tabla 5.2. 4 Usos del Suelo UPZ 73 Garcés Navas ... 40
Tabla 5.2. 5 Distribución de la población por estrato en la UPZ 73 Garcés Navas ... 41
Tabla 6.5. 1 Atributos y valores experimento ... 61
Tabla 6.10. 1 Descripción de las opciones presentes en el entorno Explorer del Software WEKA ... 73
Tabla 6.10.2. 1 Gráficas de casos de resultados del coeficiente de correlación ... 77
Tabla 6.10.3. 1 Características de los errores... 78
Tabla 7.2. 1 Atributos de información cartográfica ... 88
Tabla 7.2. 2 Contenido bases de datos catastrales ... 89
Tabla 7.3. 1 Métodos de entrenamiento y validación ... 91
Tabla 7.4. 1 Comparación de cantidad de datos por UPZ luego de la depuración ... 91
9
Tabla 7.4. 3 Atributos seleccionados para procesar ... 94
Tabla 7.4. 4 Cantidad de datos para conjunto de entrenamiento y validación y conjunto de pronóstico ... 94
Tabla 7.4.2. 1 Atributo uso para predios No PH ... 96
Tabla 7.4.2. 2 Atributo uso para predios PH ... 97
Tabla 7.4.3. 1 Atributo pisos ... 97
Tabla 7.4.4.1 Características de la clasificación: atributo edad ... 98
Tabla 7.4.4.2 Clasificación atributo edad... 98
Tabla 7.4.5.1 Características de la clasificación: atributo puntaje ... 99
Tabla 7.4.5. 2 Clasificación atributo puntaje, grupo1 ... 99
Tabla 7.4.5. 3 Clasificación atributo puntaje, grupo 2 ... 100
Tabla 7.4.5. 4 Clasificación atributo puntaje, grupo 3 ... 100
Tabla 7.4.6. 1 Clasificación atributo estrato ... 101
Tabla 7.4.7. 1 Clasificación atributo actividad ... 101
Tabla 7.4.8. 1 Clasificación atributo tratamiento ... 102
Tabla 7.4.9. 1Características de la clasificación: atributo área de terreno ... 103
Tabla 7.4.9. 2 Clasificación atributo área de terreno, grupo 1 ... 103
Tabla 7.4.9. 3 Clasificación atributo área de terreno, grupo 2 ... 104
Tabla 7.4.9. 4 Clasificación atributo área de terreno, grupo 3 ... 104
10
Tabla 7.4.10. 1 Características de la clasificación: atributo valor metro cuadrado de terreno
... 105
Tabla 7.4.10. 2 Clasificación atributo valor metro cuadrado de terreno ... 105
Tabla 7.4.11. 1 Características de la clasificación: atributo área construida ... 106
Tabla 7.4.11. 2 Clasificación atributo área construida, grupo 1 ... 106
Tabla 7.4.11. 3 Clasificación atributo área construida, grupo 2 ... 107
Tabla 7.4.11. 4 Clasificación atributo área construida, grupo 3 ... 107
Tabla 7.4.11. 5 Clasificación atributo área construida, grupo 4 ... 107
Tabla 7.4.12. 1 Características de la clasificación: valor metro cuadrado de construcción 108 Tabla 7.4.12. 2 Clasificación atributo valor metro cuadrado de construcción, grupo 1 .... 108
Tabla 7.4.12. 3 Clasificación atributo valor metro cuadrado de construcción, grupo 2 .... 109
Tabla 7.4.13. 1 Nombres de archivos .arff, UPZ 73 ... 110
Tabla 7.4.13. 2 Nombres de archivos .arff, UPZ 65 ... 110
Tabla 7.4.13. 3 Nombres de archivos .arff, UPZ 79 ... 110
Tabla 7.5. 1 Resultados obtenidos según método de clasificación ... 112
Tabla 8.1. 1 Características experimento: Garcés Navas, PH ID3- J48 - M5P - RL ... 115
Tabla 8.1. 2 Comparación de errores de la selección de resultados finales, experimento: Garcés Navas, PH - J48 – M5P - RL ... 121
Tabla 8.1. 3 Selección de resultados finales, experimento: Garcés Navas, PH - J48 – M5P - RL ... 122
11
Tabla 8.2. 3 Selección de resultados finales, experimento: Garcés Navas, NO_PH - J48 –
M5P - RL ... 133
Tabla 8.3. 1. Características experimento: Arborizadora, PH ID3-J48–M5P-RL ... 137
Tabla 8.3. 2 Comparación de errores de la selección de resultados finales, experimento:
Arborizadora, PH – ID3 - M5P - RL... 143
Tabla 8.3. 3 Selección de resultados finales, experimento: Arborizadora, PH – ID3 – M5P -
RL ... 144
Tabla 8.4. 1. Características experimento: Arborizadora, NO_PH ID3-J48-M5P-RL ... 148
Tabla 8.4. 2. Comparación de errores de la selección de resultados finales, experimento:
Arborizadora, NO_PH - J48 – M5P - RL ... 154
Tabla 8.4. 3 Selección de resultados finales, experimento: Arborizadora, NO_PH J48 - M5P
- RL ... 155
Tabla 8.5. 1. Características experimento: Arborizadora, PH ID3- J48 - M5P - RL ... 159
Tabla 8.5. 2 Comparación de errores de la selección de resultados finales, experimento:
Calandaima, PH – ID3 – M5P - RL ... 165
Tabla 8.5. 3 Selección de resultados finales, experimento: Calandaima, PH ID3 – ID3 -
M5P - RL ... 166
Tabla 8.6. 1 Características experimento: Calandaima, NO_PH ID3- J48 - M5P - RL ... 170
Tabla 8.6. 2. Comparación de errores de la selección de resultados finales, experimento:
Arborizadora, NO_PH - ID3 - M5P - RL ... 176
Tabla 8.6. 3 Selección de resultados finales, experimento: Calandaima, NO_PH – ID3 -
M5P - RL ... 177
12
Lista de ecuaciones
Ecuación (6.4. 1) Entropía (S) ... 56
Ecuación (6.4. 2) Entropía general ... 59
Ecuación (6.5. 1) Ganancia de información ... 60
Ecuación (6.5. 2) Subconjunto de S ... 60
Ecuación (6.10.1. 1) Estadístico Kappa ... 75
Ecuación (6.10.2. 1) Coeficiente de correlación de Pearson... 76
Ecuación (6.10.2.2) Coeficiente de correlación para estadístico muestral ... 77
Ecuación (6.11. 1) Regla de Sturges ... 79
Ecuación (6.11. 2) Rango ... 79
13
Lista de anexos
Anexo 1. Resultados, experimento: Garcés Navas, PH-ID3 ... 185
Anexo 2. Selección de resultados, experimento: Garcés Navas, PH - ID3 ... 186
Anexo 3. Resultados, experimento: Garcés Navas, PH-J48. ... 187
Anexo 4. Selección de resultados, experimento: Garcés Navas, PH - J48 ... 188
Anexo 5. Comparación de selecciones, experimento: Garcés Navas, PH – J48 - ID3 ... 189
Anexo 6. Resultados experimento: Garcés Navas, PH-M5P ... 190
Anexo 7. Selección de resultados, experimento: Garcés Navas, PH - M5P ... 191
Anexo 8. Resultados, experimento: Garcés Navas, PH-RL ... 192
Anexo 9. Selección de resultados, experimento: Garcés Navas, PH - RL ... 193
Anexo 10. Comparación de selecciones, experimento: Garcés Navas, PH - M5P-RL ... 194
Anexo 11. Garcés Navas – PH, Comparación Valor m2 de Construcción Observado y método Árbol de Decisión M5P Percentage Split 66... 195
Anexo 12. Garcés Navas – PH, Comparación Valor m2 de Construcción Observado y método Regresión Lineal Cross 20 ... 196
Anexo 13. Garcés Navas – PH, Comparación Valor m2 de Construcción Observado, método Árbol de Decisión Split 66 y Regresión Lineal Cross 20 ... 197
Anexo 14. Resultados, experimento: Garcés Navas, NO_ PH-ID3 ... 198
Anexo 15. Selección de resultados, experimento: Garcés Navas, NO_PH - ID3 ... 199
Anexo 16. Resultados, experimento: Garcés Navas, NO_PH-J48. ... 200
14
Anexo 18. Comparación de selecciones, experimento: UPZ Garcés Navas, NO _PH – J48 -
ID3 ... 202
Anexo 19. Resultados experimento: Garcés Navas, NO_PH-M5P ... 203
Anexo 20. Selección de resultados, experimento: Garcés Navas, NO_PH - M5P ... 204
Anexo 21. Resultados, experimento: Garcés Navas, NO_PH-RL ... 205
Anexo 22. Selección de resultados, experimento: Garcés Navas, NO_PH – RL ... 206
Anexo 23. Comparación de selecciones, experimento: UPZ Garcés Navas, NO_PH - M5P-RL ... 207
Anexo 24. Garcés Navas – NO_PH, Comparación Valor m2 de Construcción Observado y método Árbol de Decisión M5P Split 80 ... 208
Anexo 25. Garcés Navas – NO_PH, Comparación Valor m2 de Construcción Observado y Método Regresión Lineal Cross 20 ... 209
Anexo 26. Garcés Navas – NO_PH, Comparación Valor m2 de Construcción Observado, método Árbol de Decisión M5P- Split 80 y Regresión Lineal Cross 20 ... 210
Anexo 27. Resultados, experimento: Arborizadora, PH-ID3 ... 211
Anexo 28. Selección de resultados, experimento: Arborizadora, PH - ID3 ... 212
Anexo 29. Resultados, experimento: Arborizadora, PH-J48 ... 213
Anexo 30. Selección de resultados, experimento: Arborizadora, PH - J48 ... 214
Anexo 31. Comparación de selecciones, experimento: Arborizadora, PH – J48 - ID3 .... 215
Anexo 32. Resultados experimento: Arborizadora, PH-M5P ... 216
Anexo 33. Selección de resultados, experimento: Arborizadora, PH - M5P ... 217
Anexo 34. Resultados, experimento: Arborizadora, PH-RL... 218
15
Anexo 36. Comparación de selecciones, experimento: Arborizadora, PH - M5P-RL ... 220
Anexo 37. Arborizadora – PH, Comparación Valor m2 de Construcción Observado y método Árbol de Decisión M5P Cross 20... 221
Anexo 38. Arborizadora – PH, Comparación Valor m2 de Construcción Observado y método Regresión Lineal Split 66 ... 222
Anexo 39. Arborizadora – PH, Comparación Valor m2 de Construcción Observado, método Árbol de Decisión M5P Cross 20 y Regresión Lineal Split 66... 223
Anexo 40. Resultados, experimento: Arborizadora, NO_PH-ID3 ... 224
Anexo 41. Selección de resultados, experimento: Arborizadora, NO_PH - ID3 ... 225
Anexo 42. Resultados, experimento: Arborizadora, NO_PH-J48. ... 226
Anexo 43. Selección de resultados, experimento: Arborizadora, NO_PH - J48 ... 227
Anexo 44. Comparación de selecciones, experimento: UPZ Arborizadora, NO_PH – J48 - ID3 ... 228
Anexo 45. Resultados experimento: Arborizadora, NO_PH - M5P ... 229
Anexo 46. Selección de resultados, experimento: Arborizadora, NO_PH - M5P ... 230
Anexo 47. Resultados, experimento: Arborizadora, NO_PH - RL ... 231
Anexo 48. Selección de resultados, experimento: Arborizadora, NO_PH – RL ... 232
Anexo 49. Comparación de selecciones, experimento: UPZ Arborizadora, NO_PH - M5P-RL ... 233
Anexo 50. Arborizadora – NO_PH, Comparación Valor m2 de Construcción Observado y método Árbol de Decisión M5P - Split 80 ... 234
16
Anexo 52. Arborizadora - NO_PH, Comparación Valor m2 de Construcción Observado,
método Árbol de Decisión M5P - Split 80 y Regresión Lineal - Split 33 ... 236
Anexo 53. Resultados, experimento: Calandaima, PH-ID3 ... 237
Anexo 54. Selección de resultados, experimento: Calandaima, PH - ID3 ... 238
Anexo 55. Resultados, experimento: Calandaima, PH-J48. ... 239
Anexo 56. Selección de resultados, experimento: Calandaima, PH - J48 ... 240
Anexo 57. Comparación de selecciones, experimento: UPZ Calandaima, PH – J48 -
ID3 ... 241
Anexo 58. Resultados experimento: Calandaima, PH-M5P ... 242
Anexo 59. Selección de resultados, experimento: Calandaima, PH - M5P ... 243
Anexo 60. Resultados, experimento: Calandaima, PH - RL ... 244
Anexo 61. Selección de resultados, experimento: Calandaima, PH – RL ... 245
Anexo 62. Comparación de selecciones, experimento: UPZ Calandaima, PH - M5P-RL 246
Anexo 63. Calandaima – PH, Comparación Valor m2 de Construcción Observado y
método Árbol de Decisión - M5P Cross 20 ... 247
Anexo 64. Calandaima – PH, Comparación Valor m2 de Construcción Observado y
método Regresión Lineal – Split 66 ... 248
Anexo 65. Calandaima – PH, Comparación Valor m2 de Construcción Observado, método
Árbol de Decisión M5P– Cross 20 y Regresión Lineal – Split 66 ... 249
Anexo 66. Resultados, experimento: Calandaima, NO_PH - ID3 ... 250
Anexo 67. Selección de resultados, experimento: Calandaima, NO_PH - ID3 ... 251
Anexo 68. Resultados, experimento: Calandaima, NO_PH-J48. ... 252
17
Anexo 70. Comparación de selecciones, experimento: UPZ Calandaima, NO_PH – J48 -
ID3 ... 254
Anexo 71. Resultados experimento: Calandaima, NO_PH-M5P ... 255
Anexo 72. Selección de resultados, experimento: Calandaima, NO_PH - M5P ... 256
Anexo 73. Resultados, experimento: Calandaima, NO_PH-RL ... 257
Anexo 74. Selección de resultados, experimento: Calandaima, NO_PH – RL ... 258
Anexo 75. Comparación de selecciones, experimento: UPZ Calandaima, NO_PH -
M5P-RL ... 259
Anexo 76. Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado y
método Árbol de Decisión – M5P Split 80 ... 260
Anexo 77. Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado y
método Regresión Lineal – Cross 20 ... 261
Anexo 78. Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado,
18
Introducción
La Inteligencia artificial, según Marvin Minsky, considerado el padre de la inteligencia
artificial (Bernardo, 2016), se define como la ciencia de construir máquinas que hagan
cosas que, si las hicieran los humanos requerirían inteligencia (Cazorla,M, Alfonso, M,
Escolano, F, Colomina, O, & Lozano, M, 2003). De esta ciencia, se derivan diferentes
campos, entre los cuales se encuentra el aprendizaje de máquina, este consiste en un
conjunto de métodos por los cuales las máquinas pueden detectar automáticamente patrones
en los datos, y luego usar los patrones descubiertos para realizar predicciones (Murphy,K,
2012), uno de estos métodos es el de árbol de decisión, que es de los más populares entre
los algoritmos de inferencia inductiva, en el que por reglas de si – entonces, realiza la
clasificación de los datos (Mitchell, T, 1997).
Valuar consiste en la aplicación de los diferentes enfoques y herramientas para la
estimación del valor de un bien, al relacionarlo con los bienes inmuebles se hace necesario
buscar la forma y herramientas que permitan llegar, de manera técnica y precisa, al
conocimiento del valor del bien, ya sea que se trate de uno, o de varios predios, según
corresponda el caso.
En las técnicas que se requieren en la valuación, se emplean diferentes variables que
identifican el inmueble, por lo que al requerir avalúos de un gran volumen de predios, es
necesario realizar una clasificación, esta se puede desarrollar mediante diversos métodos,
entre los que se encuentran la comparación o el mercado, la capitalización de rentas o
ingresos, costo de reposición y la técnica de desarrollo potencial o método involutivo.
19
determinar el valor de un bien inmueble; en caso de tratarse de varios predios, en Colombia
se ha popularizado el uso de modelos de regresión lineal, no obstante, dadas las
características de algunas variables inherentes a los predios es necesario hacer procesos
para poder identificarlas e instrumentalizarlas en la regresión, o simplemente no
emplearlas.
En este trabajo se presenta una herramienta más a partir de la implementación del algoritmo
de árboles de decisión, del enfoque del aprendizaje de máquina, a los procesos valuatorios
de los bienes inmuebles, mostrando otra alternativa para emplear un proceso de esta índole
20
1.
Antecedentes
Diferentes técnicas derivadas del aprendizaje de máquina han sido implementadas con el
fin de facilitar procesos, entre estas técnicas se encuentran las redes neuronales, algoritmos
genéticos, arboles de decisión, entre otros. Recientemente se han desarrollado proyectos
aplicados a campos empresariales, de inversión y, aunque no en gran cantidad, al componente “geo” de una comunidad.
A continuación se presentan tres trabajos que se han realizado empleando técnicas de
aprendizaje de máquina para cumplir con sus respectivos objetivos.
Figura 1. 1 Procedimiento para construir una base de conocimiento para implementar el método de aprendizaje
Fuente: (Huang,X & Jensen,J.R, 1997)
En primer lugar, en el año de 1997 se realizó un paper titulado A Machine-Learning
Approach to Automated Knowledge-Base Building for Remote Sensing Image Analysis
21
conocimiento automatizado para el análisis de imágenes de sensor remoto con datos SIG)
por Xueqiao Huang y John R. Jensen.
Al realizar este artículo científico, el objetivo de los autores fue presentar la manera en que
se podía aplicar el enfoque de aprendizaje de máquina, para la clasificación de imágenes
obtenidas mediante sensores remotos.
Figura 1. 2 Ejemplo de capas de una imagen para el conjunto de datos de entrenamiento y el flujo de datos en el subsistema
Fuente: (Huang,X & Jensen,J.R, 1997)
El proceso que se siguió se dividio entre el trabajo realizado por los humanos expertos y el
trabajo realizado por el aprendizaje de máquina o del programa, como se muestra en la
Figura 1.1, en la parte superior del gráfico (a) se puede apreciar que se parte de una base de
un sistema de información geográfica, seguido a eso los humanos expertos realizan los
procedimientos necesarios para las debidas clasificaciones que conformaran el conjunto de
22
el aprendizaje, mediante el software y la máquina se genera el árbol de decisión y las
respectivas reglas, para obtener finalmente una base de conocimiento.
Este proyecto se desarrolló con imágenes obtenidas de sensores remotos con el fin de hacer
un análisis multitemporal de un área de humedales localizada a los alrededores del rio
Savannah localizado en la frontera entre los estados de Carolina del Sur y Georgia en los
Estados Unidos.
Ilustrado en la Figura 1.2, se explica gráficamente como el pixel de una sola imagen tiene
varios componentes, seis para el ejemplo, que serán los valores que conformarán el
conjunto de datos de entrenamiento para la generación del árbol de decisión y las reglas a
aplicar para finalmente tener una clasificación como resultado.
Como conclusiones del trabajo los autores obtuvieron que el uso del aprendizaje de
máquina facilita en gran manera el proceso de clasificación de las imágenes a comparación
del método empleado convencionalmente, al hacer una selección adecuada del conjunto de
datos de entrenamiento se obtienen resultados de calidad y destacan la facilidad de entender
e interpretar los resultados obtenidos mediante los árboles y las reglas para la posterior
aplicación a los datos de validación (Huang,X & Jensen,J.R, 1997).
En segundo lugar, en el año 2008, se publicó para la Revista Colombiana de Estadística, el
artículo titulado Aplicación de árboles de decisión en modelos de riesgo crediticio por
Paola Andrea Cardona Hernández.
Mediante este trabajo, la autora muestra un marco general de la normatividad del sistema
23
estudios, específicamente el método de árboles de decisión para el cálculo de
incumplimiento en crédito presentando sus ventajas y desventajas.
Entendiendo por riesgo de crédito la pérdida potencial para una entidad financiera debido a
la incapacidad del cliente de cumplir con sus obligaciones de pago, se hace necesario, de
parte de las entidades financieras realizar estudios que les permitan conocer si sus clientes
son deudores potenciales, para estos se establece un tiempo de doce meses a futuro y se
estudia la capacidad de pago de los mismos, comúnmente se hace con clientes que
anteriormente han estado en mora, no obstante, mediante otros métodos estadísticos es
posible realizarlo para clientes que no han estado en mora y prever en escenarios futuros su
posible comportamiento respecto sus deudas.
Figura 1. 3 Esquema de la definición de las variables
Fuente: (Cardona, A, 2004)
Como se muestra en la Figura 1.3, se establecen como clientes buenos aquellos que no han
estado en mora en los primeros doce meses y como clientes malos aquellos que antes de los
24
árbol de decisión y posteriormente las reglas que permitirán aplicar el modelo generado de
datos de entrenamiento a datos de los posibles clientes.
Figura 1. 4 Ejemplo de árbol de decisión para iniciación
Fuente: (Cardona, A, 2004)
Como se observa en este ejemplo de la Figura 1.4, al emplear el método de árboles de
decisión, para este caso se obtienen seis nodos terminales, es decir, 6 categorías con sus
respectivas probabilidades que permiten identificar seis perfiles de riesgo para tomar
decisiones respecto a otorgar o no el crédito a las personas en los diferentes escenarios.
Los requerimientos para el uso de modelos están asociados a tres factores:
Simplicidad: A fin de que diferentes empleados de la entidad financiera puedan
entender el modelo y sus resultados.
Potencia: Mostrando en sus resultados la elegibilidad correcta entre clientes
buenos y clientes malos.
25
Teniendo en cuenta que el modelo de árboles de decisión cumple con estos requerimientos,
la autora presenta la forma en que se aplican pruebas estadísticas para evaluar la capacidad
del modelo como la prueba F, Kolmogorov-Smirnov para dos muestras (K-S), la curva
ROC (Recive Operative Curve) y el coeficiente Gini y como estas dan buenos resultados.
Concluyendo, la autora se refiere a los árboles de decisión como una herramienta efectiva
al evaluar el riesgo de que exista incumplimiento en las responsabilidades de los posibles
clientes, es estable en el tiempo y útil para planeación de estrategias comerciales, métodos
de cobranza, entre otras. Se aclara que la importancia de un buen modelo radica en que
según las decisiones que se tomen al aceptar o no un cliente afectará directamente las
utilidades de la entidad financiera, permitiéndole aumentar en capital o llegar a la
insolvencia (Cardona, A, 2004).
Para finalizar, en tercer lugar, en el año 2011 fue presentada en la facultad de minas de
Ingeniería de sistemas en la Universidad Nacional, sede Medellín, Colombia, la tesis
titulada Modelo Basado en Aprendizaje de Máquinas para el Manejo de Riesgo de Falla
Durante la Composición de Servicios Web por Byron Enrique Portilla Rosero como
requisito para optar al título de magister en ingeniería de sistemas.
El objetivo de este trabajo estuvo en proponer un modelo basado en el método de aprendizaje de máquina que permitiera “aprender al sistema” los riesgos que puede
presentar en el servicio web a fin de disminuir el riesgo de falla del mismo.
Para lograr esto el autor estudio las siguientes técnicas: Arboles de decisión
26
Razonamiento basado en Casos(CBR)
Aprendizaje por refuerzo
Aprendizaje bayesiano
De estas revisó las ventajas y desventajas de cuatro características específicas, a saber: Manejo de recursos de memoria, almacenamiento y tiempo de ejecución
Información requerida
Representación
Facilidad de interpretar el resultado por el humano
Figura 1. 5 Comportamiento del error (ECM)
Nota: Comportamiento del ECM del cálculo del riesgo en la métrica de disponibilidad por parte del aprendizaje para el servicio GetItemInformation para el día martes 11am.
Fuente: (Portilla,B.E., 2011)
27
Llegando a la conclusión que las técnicas que describían mejor estas características y se
aplicaban al objetivo de su proyecto, de adquirir información referente a riesgos de falla de
los servicios durante composiciones web, fueron los árboles de decisión y la programación
lógica inductiva, dado que estas dos técnicas se fusionan en el marco de árboles de
decisión lógicos.
Como se muestra en la Figura 1.5, el comportamiento de los servicios es aprendido de
forma satisfactoria por el modelo de aprendizaje, permitiendo hacer una mejor selección de
los servicios y disminución de las fallas.
Al finalizar el proyecto, se obtuvo que el modelo sugerido muestra solides en el
aprendizaje, capacidad para encontrar asociaciones correctas y el incremento de esa
28
2.
Problema de investigación
Conocer el valor de la posesiones es una necesidad que se ha generado desde tiempos
remotos, dado el hecho de que existiera un exceso de determinado bien, se hizo importante
saber el valor que este representaba para alguien que careciera del mismo (Caballero, M,
2002); en un principio se empleó el trueque, haciendo el intercambio entre objetos que se
consideraban de valor equivalente debido a la necesidad que se tenía de los mismos, con el
paso del tiempo, luego de la invención del papel moneda como medio de intercambio, se estableció una forma “imparcial” de valorar las cosas, no obstante el problema de saber a
cuantas unidades monetarias era equivalente un bien, continuaba siendo una necesidad por
satisfacer en los diferentes campos, incluyendo el de los bienes inmuebles.
A fin de dar solución a esta y otras necesidades relacionadas con el área de catastro,
geodesia, geomática, socioeconomía y planeación, en Colombia se creó el pregrado de
Ingeniería Catastral y Geodesia, teniendo como propósito el estudio del recurso tierra con
énfasis en el manejo social (UDFJC, 2016), enseñando también la investigación necesaria
que se requiere para conocer el valor monetario de un bien inmueble, la cual incluye, que
además de conocer de métodos matemáticos se conozca del entorno y se sepa argumentar
cada una de las decisiones que se tomen respecto al valor del bien valuado, ya que el
dinamismo que se presenta en las ciudades a nivel económico, social, arquitectónico,
estructural, de vetustez, entre otros, será un factor importante en el mercado de los
inmuebles.
Ahora bien, el analizar un bien y realizar toda una investigación involucrando diferentes
29
es una tarea que involucra gran trabajo y dedicación, no obstante, este trabajo se multiplica
al hablar de realizar avalúos masivos, por lo que se hace necesario emplear métodos que
faciliten la labor y funcionen como una herramienta más en la toma de decisiones.
El método enseñado y practicado para los avalúos masivos, en la universidad Distrital
Francisco José de Caldas, consiste en la realización de modelos econométricos, en cuyas
ecuaciones normalmente se tiene como variable dependiente el valor de metro cuadrado de
la construcción y como variables independientes, los valores correspondientes a área, edad
de la construcción, estrato, localización, entre otras, según la información con la que se
cuente y la relevancia que tengan las variables dentro del modelo que se realice, luego de
aplicar las diferentes pruebas a un modelo original; este método funciona bien y arroja,
según la calidad de los datos y del modelo establecido, errores pequeños en las
predicciones, lo que hace de este método una buena herramienta para conocer el valor tanto
de un predio como de un gran conjunto de estos.
Aun cuando el método de los regresores lineales en los modelos econométricos permite
obtener una precisión aceptable, se requiere un trabajo significativo en el momento de
trabajar con variables cualitativas, casos en los que se hace necesario crear variables
dicótomas para solucionar en parte el uso necesario de estas que representan las
características de los predios.
Teniendo en cuenta la importancia de la participación de este tipo de variables en el
proceso de valuar una bien inmueble, así como el ánimo de obtener mejores resultados, se
30
Artificial del enfoque de aprendizaje de máquina, mediante los cuales es posible realizar
predicciones referentes a los predios, acertadas y con mínimos errores, permiten trabajar
con las diferentes variables inherentes a los predios incluyendo características como su
localización y el manejo de grandes volúmenes de información para el caso de avalúos
31
3.
Objetivos
3.1 General
Realizar un análisis de la efectividad de implementar los enfoques de aprendizaje de
máquina, específicamente los árboles de decisión, en la determinación de avalúos masivos
para los predios ubicados en la ciudad de Bogotá, en los sectores de la localidad 8 de
Kennedy, Unidad de Planeamiento Zonal 79 Calandaima; localidad 19 de Ciudad Bolívar,
UPZ 65 Arborizadora y localidad 10 de Engativá, UPZ 73 Garcés Navas.
3.2 Específicos
Implementar la técnica de árboles de decisión y sus diferentes variaciones en el proceso de
realizar los avalúos.
Determinar de las técnicas de árboles de decisión usadas las que por sus parámetros
permitan llegar a resultados más acertados.
Establecer una comparación del método seleccionado de la técnica de árboles de decisión
con el método tradicionalmente empleado, regresión lineal, para la realización de avalúos
32
4.
Justificación
Los avalúos masivos son desarrollados por entidades privadas y gubernamentales según
diferentes necesidades como obras viales, proyectos de renovación urbana, estudios de
costos, entre otras y se efectúan mediante técnicas de modelos de regresión, en estos
procesos están involucradas variables numéricas y cualitativas, el uso de estos modelos se
ve afectado especialmente al involucrar variables del segundo tipo, debido a que se deben
buscar maneras de organizar y procesar los datos a fin de que todas las técnicas que se
empleen estén debidamente ejecutadas, al implementar este método se obtienen resultados
que al compararlos con la realidad son buenas representaciones de esta, no obstante, debido
a que se generaliza una regresión para una gran cantidad de datos, no siempre se ajusta de
una manera óptima para todos; al brindar un método que permita resultados aún más
ajustados a la realidad, las ventajas para las entidades que emplearían estos métodos serían
representativas y notorias en reducciones de costos y una visión más acertada referente a
los predios estudiados
Considerando la manera en que la tecnología permite el continuo avance en diferentes
entornos se optó por hacer uso de la inteligencia artificial, que tiene como uno de sus
enfoques el aprendizaje de máquina, que busca que mediante un sistema la máquina
aprenda una tarea y sea capaz de utilizar la información aprendida para generar
clasificaciones que funcionen para el pronóstico de datos ingresados posteriormente al
sistema. Este método ha sido implementado en campos financieros y del tratamiento de
33
Teniendo en cuenta que estos métodos han sido empleados para predicciones en distintos
campos, se plantea como un método para usar en el proceso de realizar avalúos masivos
mediante la clasificación automática que puede llegar a generarse, lo cual, según la calidad
de los resultados, es un método más sumándose al convencional.
Debido a que la necesidad de realizar avalúos es permanente en una sociedad que está en
constante cambio, crecimiento y modernización, el hecho de tener más herramientas que
aporten, faciliten y brinden mejores resultados, son necesarias constantemente y gracias al
continuo avance de la tecnología y la implementación de esta en los procesos valuatorios,
los beneficios a corto plazo del proyecto se verifican en los resultados obtenidos en el
presente proyecto, brindando una herramienta efectiva por su proximidad a los valores
reales, a mediano plazo, permitiendo aplicar esta técnica con valores de proyecciones de
entidades como el DANE y a largo plazo al posibilitar el uso de esta herramienta en
conjunto con muchas otras que hagan el proceso inicial de selección y clasificación de
34
5.
Marco espacial
El proyecto se desarrolló con los datos de predios localizados en la Ciudad de Bogotá en las
localidades 19 de Ciudad Bolívar, 8 de Kennedy y 10 de Engativá en las Unidades de
Planeamiento Zonal, 65 Arborizadora, 73 Garcés Navas y 79 Calandaima,
respectivamente, elegidas por la variabilidad que presentan en las características de los
predios allí localizados, presentando una información de más provecho para el estudio. A
continuación se presenta una descripción general de cada una de estas zonas.
5.1. UPZ 65 Arborizadora
La UPZ 65 Arborizadora cuenta con las siguientes características principales:
Localización: La UPZ Arborizadora está localizada al nororiente de la localidad 19,
Simón Bolívar, en la Ciudad de Bogotá, con un área de 326.97 hectáreas (Alcaldía
Mayor de Bogotá D.C - SDP, 2008), comprendidas entre los límites especificados
en la Tabla 5.1.1.
Tabla 5.1. 1Límites UPZ 65 Arborizadora
Norte Avenida del Ferrocarril del sur (DG 57c Sur)
Límite con la localidad 7, Bosa
Sur Avenida Villavicencio (AC 61 Sur)
Límite con la UPZ 66, San Francisco
Oriente
Río Tunjuelo
Límite con la localidad 6, Tunjuelito Límite con la localidad 8, Kennedy
Occidente
Avenida Villavicencio (AC 61 Sur) Límite con la UPZ 69, Ismael Perdomo
35
Extensión: Su extensión total está dividida como se muestra en la Tabla 5.1.2.,
mostrando que la mayor parte de la unidad se encuentra urbanizada y no cuenta con
áreas protegidas.
Tabla 5.1. 2 Extensión UPZ 65 Arborizadora
Área Total 326,97 hectáreas
Área Urbanizada 275,12 hectáreas
Área sin Urbanizar 51,85 hectáreas
Áreas Protegidas 0 hectáreas
Sectores catastrales y centralidades: La UPZ 65 Arborizadora está conformada
por 10 sectores catastrales, Guadalupe, Rafael Escamilla, Madalena, El Ensueño,
Atlanta, La Coruña, Verona, Arborizadora Baja, El Chircal Sur y Ronda,
distribuidos como se presenta en la Figura 5.1.1.
36
La UPZ Arborizadora hace parte de la Centralidad Delicias – Ensueño, del eje de
integración Sur, que permite buenas condiciones para comercializar diversos bienes y
servicios de la región (Secretaría Distrital de Planeación, 2009) promoviendo el
desarrollo de suelo urbano al hacerlo adecuado para actividades productivas y servicios
complementarios a diferentes escalas (Secretaría general de la Alcaldía Mayor de
Bogotá, 2005).
Sistema de Equipamientos: La UPZ cuenta con equipamientos de escala urbana1, zonal2 y vecinal3, entre los más destacados están los destinados a educación, salud y bienestar y en menor cantidad se encuentran los destinados a culto como las iglesias
y templos, a cultura como salones comunales y a la prestación de otros servicios
como el Centro de Atención Distrital Especializado CADE (Alcaldía Mayor de
Bogotá D.C - SDP, 2008).
Vías de acceso: Los ejes de la malla vial arterial para comunicar, acceder y permitir
la movilidad a través de la UPZ están conformados por las vías presentadas en la
Tabla 5.1.3.
Tabla 5.1. 3 Vías malla arterial UPZ 65 Arborizadora
1 Equipamientos de escala urbana, son los que atienden a un área importante de la ciudad 2
Equipamientos de escala zonal, son los que atienden a un conjunto de barrios 3
Equipamientos de escala vecinal, son los que atienden un solo barrio (Alcaldía Mayor de Bogotá D.C - SDP, 2008)
Vía Sentido de Comunicación
Avenida Ferrocarril del sur Oriente - Occidente Avenida (autopista) Sur Oriente - Occidente Avenida Ciudad de Villavicencio Norte - Sur
37
Usos del suelo: La UPZ 65 Arborizadora está reglamentada por el Decreto 241 de
2005 estableciendo los usos del suelo como se muestra en la Tabla 5.1.4 (Secretaría
general de la Alcaldía Mayor de Bogotá, 2005):
Tabla 5.1. 4 Usos del Suelo UPZ 65 Arborizadora
Uso Barrios
Vivienda La Coruña y Ronda
Vivienda con algunas zonas de comercio Madelena, Isla del Sol, La Coruña y El Chircal Sur Vivienda con locales comerciales Arborizadora Baja y Verona
Grandes almacenes y supermercados Guadalupe
Industria Guadalupe y Rafael Escamilla Zona para usos mixtos (vivienda, comercio,
equipamientos) Atlanta y El Ensueño
Densificación y estratificación: Referente a densificación, la UPZ 65 Arborizadora
tenía una población de 61850 habitantes para el año 2011 según las proyecciones de
población del DANE y una densidad urbana de 202 habitantes por hectárea.
En la UPZ están localizados predios pertenecientes a los estratos socioeconómicos 2
(bajo) y 3 (medio-bajo) (Secretaria Distrital de Planeación, 2011) con una
distribución de la población como se presenta en la Tabla 5.1.5.
Tabla 5.1. 5 Distribución de la población por estrato en la UPZ 65 Arborizadora
5.2. UPZ 73 Garcés Navas
Ubicación: La UPZ 73 Garcés Navas está localizada al occidente de la localidad 10,
Engativá, en la Ciudad de Bogotá, con un área total de 557.43 hectáreas (Alcaldía
Estrato Cantidad de
Habitantes (%) Cantidad de Hogares
Cantidad de Hogares (%)
Estrato 2 (Bajo) 68.7 12234 68.7
38
Mayor de Bogotá D.C - SDP, 2007) comprendidas entre los límites especificados en
la Tabla 5.2.1.
Tabla 5.2. 1 Límites UPZ 73 Garcés Navas
Norte Avenida Medellín (AC 80)
Límite con la UPZ Bolivia
Sur Calle 66ª y el Humedal Jaboque
Límite con la UPZ Álamos
Oriente Avenida Longitudinal de Occidente
Límite con la UPZ Boyacá Real
Occidente Río Bogotá, Límite del Distrito Capital
Extensión: Su extensión total está dividida como se muestra en la Tabla 5.2.2,
mostrando que la mayor parte de la unidad se encuentra urbanizada y no cuenta con
áreas protegidas.
Tabla 5.2. 2 Extensión UPZ 73 Garcés Navas
Área Total 557,43 hectáreas
Área Urbanizada 382,05 hectáreas
Área sin Urbanizar 118,03 hectáreas
Sectores y Centralidades: La UPZ 73 Garcés Navas está conformada por 23
sectores catastrales: El Gaco, Molinos de Viento, Los ángeles, Álamos, Villas de
Alcalá, El Cedro, Gran Granada, Bolivia, Villas de Granada I, Villas de Granada,
San Antonio, La Riviera, Garcés Navas, Garcés Navas Oriental, Garcés Navas Sur,
Villa Amalia, Florida Blanca, Villa Sagrario, Villa del Mar, El Dorado Industrial, El
Madrigal, Engativá el Dorado, Santa Mónica y Álamos Norte, distribuidos como se
39
Figura 5.2. 1 División por Sectores UPZ 73 Garcés Navas
La UPZ Garcés navas se beneficia por contener la centralidad4 Álamos, localizada en la intersección de la Avenida Chile y la Avenida Longitudinal de Occidente (ALO), que
permite actividades comerciales y favorece la integración a la ciudad, por otra parte se
localiza cerca a otras dos, la Centralidad de Quirigua – Bolivia, también con una vocación
comercial, pero enfocada a integrar la ciudad con la región y la Centralidad de Fontibón –
Aeropuerto el Dorado – Engativá en donde se encuentran usos comerciales y equipamientos
como el Aeropuerto el Dorado, que permite la integración del país con el mundo (Alcaldía
Mayor de Bogotá D.C - SDP, 2007).
Sistema de Equipamientos : La UPZ cuenta con equipamientos de escala zonal,
vecinal y algunos a escala urbana, entre los más destacados están los destinados a
4
40
educación, salud y bienestar entre los que se encuentran el Jardín infantil y Colegio
Fe y Alegría y la estación de bomberos y en menor cantidad se encuentran los
destinados a culto como las iglesias y templos, entre los que se encuentra la
Parroquia San Francisco de Borja en el Barrio Villas de Granada y a cultura como
salones comunales (Alcaldía Mayor de Bogotá D.C - SDP, 2007).
Vías de Acceso: Los ejes de la malla vial arterial para comunicar, acceder y
permitir la movilidad a través de la UPZ están conformados por las vías presentadas
en la Tabla 5.2.3.
Tabla 5.2. 3 Vías Malla Arterial UPZ 73 Garcés Navas
Usos del suelo: La UPZ 65 Garcés Navas está reglamentada por el Decreto 073 de
2006 (Secretaría General de la Alcaldía Mayor de Bogotá D.C, 2006) estableciendo
los usos del suelo como se muestra en la Tabla 5.2.4.
Tabla 5.2. 4 Usos del Suelo UPZ 73 Garcés Navas
Uso Barrios
Vivienda
El Gaco, Engativá El Dorado, El Dorado Industrial, Gran Granada, Villas de Alcalá, Urbanización San Basilio, Los Ángeles y Los Álamos
Vivienda con algunas zonas de comercio
Gran Granada, Villas de Granada, Molinos de Viento, Garcés Navas Oriental, El Madrigal, Plazuelas del Virrey, El Pedregal, Los Álamos
Vivienda con locales comerciales Barrios Garcés Navas, La perla, Villa Amalia, Bosques de Mariana, Villas del Dorado
Comercial Zonal de gran actividad El Dorado Industrial Zona para usos mixtos (vivienda,
comercio, equipamientos) Villas de Alcalá y Urbanización Esparta
Vía Sentido de Comunicación
Avenida Longitudinal de Occidente Borde Oriental de la UPZ Avenida Bolivia (Carrera 104) Oriente – Occidente
Avenida Chile (Calle72) Oriente – Occidente Avenida Medellín (Calle 80) Oriente – Occidente Avenida Gonzalo Ariza (Carrera 110) Norte – Sur
41
Densificación y estratificación: Referente a densificación, la UPZ 73 Garcés
Navas tenía una población de 156478 habitantes para el año 2011 según las
proyecciones de población del DANE y una densidad urbana de 282 habitantes por
hectárea.
En la UPZ están localizados predios pertenecientes a los estratos socioeconómicos 1
(bajo-bajo), 2 (bajo) y 3 (medio-bajo) (Secretaria Distrital de Planeación, 2011) con
una distribución de la población como se presenta en la Tabla 5.2.5.
Tabla 5.2. 5 Distribución de la población por estrato en la UPZ 73 Garcés Navas
5.3. UPZ 79 Calandaima
La UPZ 79 Calandaima, se distingue por las características que se presentan a continuación: Localización: La UPZ 79 Calandaima está localizada al centro occidente
(Secretaría distrital de planeación, 2009) de la localidad 8 de Kennedy en la Ciudad
de Bogotá, con un área de 319 hectáreas, comprendidas entre los límites
especificados en la Tabla.5.3.1 (García,W, 2013).
Tabla 5.3. 1 Límites UPZ 79 Calandaima
Norte Avenida las Américas
Limita con la UPZ Tintal Norte
Sur Avenida las Américas (AC 6) y Avenida de los Muiscas (Cl 38 sur)
Limita con la UPZ Patio Bonito
Oriente Avenida Ciudad de Cali y avenida El Tintal
Limita con las UPZ Castilla y Patio Bonito
Occidente Río Bogotá
Limita con el municipio de Mosquera
Estrato Cantidad de
Habitantes (%) Cantidad de Hogares
Cantidad de Hogares (%)
Estrato 2 (Bajo) 16.6 6,515 22
42
Extensión: La UPZ Calandaima tiene una extensión de 319 hectáreas que
representan un 8.3% del total de la localidad de Kennedy (García,W, 2013).
Sectores Catastrales y Centralidades: La UPZ 79 Calandaima contiene los barrios
Tintalá, Osorio II, Galán, Galán Rural y Calandaima distribuidos como se muestra
en la Figura 5.3.1, estos sectores están en una etapa de desarrollo mediante la
construcción en PH, que para el año 2012 tuvo un notable incremento del 81.63%
desde el año 2002 (García,W, 2013).
Vías de acceso: Los ejes de la malla vial arterial para comunicar, acceder y permitir
la movilidad a través de la UPZ están conformados por las vías: Avenida Ciudad de
Cali (AK 86), Avenida Tintal (AK 89), Avenida Longitudinal de Occidente (AK
96), Avenida Castilla (AC 8) y Avenida de las Américas (AC 6) (Secretaría distrital
de planeación, 2009).
43
Usos del Suelo: Debido a que en la actualidad la UPZ Calandaima está en etapa de
desarrollo, no cuenta con un decreto que la reglamente, en parte se rige por el
Acuerdo 06 de 1990 con Tratamiento Especial de Incorporación al Sector Tintal
Central y el Área Suburbana de Expansión mediante el Decreto 012 de 1993
considerando como uso de suelo (Alcaldia Mayor de Bogota D.C., 1993). Áreas de
Actividad: Múltiple (Desarrollos urbanísticos residenciales, comerciales,
industriales e institucionales).
Densificación y estratificación: Esta UPZ cuenta con población perteneciente al
estrato dos y una gran parte sin estratificar (Secretaria Distrital de Planeación,
2011), como se presenta en la tabla 5.3.2.
Tabla 5.3. 2 Distribución de la población por estrato en la UPZ 79 Calandaima
Estrato Cantidad de Habitantes (%) Cantidad de Hogares
Estrato 2 (Bajo) 96.2 19974
44
6.
Marco teórico
Este capítulo contiene la información empleada en las diferentes etapas del desarrollo del
proyecto, teoría relacionada con temas de Ingeniería, matemática y tecnología.
6.1 Inteligencia artificial
Para dar una definición de Inteligencia Artificial (IA), en los documentos, se hace
referencia en primer lugar al significado de inteligencia dado por la RAE, en donde se
describe como la facultad de conocer, de entender o comprender; lo que lleva a pensar
desde una primera instancia en que el termino hará alusión al hecho de poseer las facultades
de la inteligencia de una manera artificial. Al tratar este tema diferentes autores dan su
concepto, unos de los más representativos son los de Marvin Minsky, padre de la
inteligencia artificial (Díaz, I, 2014) y el que aporta la Enciclopedia de la Inteligencia
Artificial, por un lado Minski la define como la ciencia de construir máquinas que hagan
cosas que, si las hicieran los humanos requerirían inteligencia (Cazorla,M, Alfonso, M,
Escolano, F, Colomina, O, & Lozano, M, 2003), y por otro, se afirma que es un campo de
la ciencia y la ingeniería que se ocupa de la comprensión, desde el punto de vista
informático, de lo que denomina comúnmente comportamiento inteligente, también se
ocupa de la creación de artefactos que exhiben este comportamiento (Pino,R, Gómez, A, &
de Abajo, N, 2001),de estas concepciones, se puede concluir, a fin de generalizar, que el
centro de la Inteligencia artificial, como ciencia y tecnología es buscar la manera de emular
las capacidades del ser humano, por lo que se han creado sistemas que se encaminan a
45
Las áreas en las que la IA (Inteligencia Artificial) ha hecho presencia se clasifican, en
general, en las siguientes:
Tratamiento de lenguajes naturales: También conocido por sus siglas en inglés NLP
(Natural Language Processing) (García, A, 2012) consiste en hacer que un sistema sea
inteligente al permitir su interacción con los usuarios en su mismo lenguaje (Pino,R,
Gómez, A, & de Abajo, N, 2001), esta área de la IA engloba todas aquellas aplicaciones
que realizan traducciones entre idiomas, interfaces hombre – máquina que permiten
interrogar una base de datos o dar órdenes a un sistema operativo, haciendo que la
comunicación sea más amigable con el usuario.
Los productos comerciales que realizan tareas relacionadas con el procesamiento de
lenguaje natural se pueden clasificar, de manera general en:
Sistemas de consulta en lenguaje natural de bases de datos: Sistemas que traducen el
tipo de consultas que se pueden hacer a una base de datos, a la serie de instrucciones
adecuadas en el lenguaje informático de consulta de una base de datos.
Sistemas de búsqueda, reconocimiento y categorización de textos: Empleados para
seleccionar y filtrar la enorme masa de información que en la actualidad reciben y
tienen en sus bases de datos las empresas. Sistemas de traducción automáticas
Programas de edición de textos: Programas que permiten la corrección ortográfica,
gramatical y de estilo de los textos que se escriben en ordenador.
“Máquinas de escribir” accionadas por la voz: Sistemas que reconocen los textos
46
cálculo) y van “transcribiendo” en texto “dictado” a su correspondiente
representación escrita.
Productos de consumo: Productos que permiten un uso más “natural” de
determinados aparatos domésticos o profesionales. Como ejemplo están los
sistemas de programación de videos o teléfonos de coche accionados por la voz.
Razonamiento automático – Sistemas de Expertos: Hacen referencia a los sistemas
diseñados para que las máquinas imiten el comportamiento de los humanos, siendo capaces
de realizar conclusiones lógicas según información presente (Cazorla,M, Alfonso, M,
Escolano, F, Colomina, O, & Lozano, M, 2003).
Aprendizaje automático o de máquina: Son los sistemas que se elaboran mediante modelos que permiten a la máquina “aprender” mediante una base de información
suministrada.
Representación del conocimiento: Dado que el sistema tiene la capacidad de “razonar y de aprender”, la representación del conocimiento abarca el hecho de que esa información
que adquiere o infiere autónomamente pueda ser almacenado y recuperado de forma
eficiente, ya que no es útil almacenar datos si luego los sistemas no pueden acceder a estos
para usarlos, sacar conclusiones y obtener nueva información que no poseían de forma
directa.
Visión artificial y robótica: Son todos los sistemas de la IA que hacen posible el
reconocimiento de objetos y del habla, detección de defectos en piezas por medio de visión,
47
Uno de los problemas con los que cuentan esta clase de procedimientos es el captar e
interpretar las imágenes del entorno que envuelve a un sistema inteligente y le está enviando cantidades de “píxeles” o elementos de información que son fundamentales para
aprender y predecir acontecimientos.
Los aspectos más estudiados, en general, son de caracteres tipográficos y manuscritos,
interpretación de imágenes, reconocimiento de objetos, visión del color y análisis visual del
movimiento.
Esta área de la visión artificial y la manipulación de objetos, en otras palabras robots
móviles, sistemas para control de brazos, ensamble de piezas, etc. es conocida como
robótica (Pino,R, Gómez, A, & de Abajo, N, 2001).
6.2 Aprendizaje de máquina
La técnica de Inteligencia Artificial hace referencia a la modelización de conductas para su
posterior implementación en computadoras, mediante sistemas se busca hacer que las
máquinas sean capaces de realizar generalizaciones a partir de ejemplos sacados del
entorno, como lo mencionan Daniel y José Luis, (Sontag, E. D & Tesoro, J. L, 1972) en
cierto modo, lo que se desea es obtener máquinas capaces de resolver problemas que requieran de “ingenio: Procesos de decisión complejos en medios potencialmente infinitos
e incontrolables y sentido común: el poder deducir automáticamente y por cuenta propia
una cantidad amplia de consecuencias inmediatas de lo que se dice y los conocimientos que ya posee” (McCarthy, J, 1958). Para lograr esto se utilizan técnicas basadas en redes y
48
comportamiento del cerebro humano a través de redes neuronales, es así como se establece
que la máquina sea capaz de “aprender” cosas nuevas, adaptarse al medio y generar una
respuesta, condición exigible a cualquier ser dotado de inteligencia (García, A, 2012), como
se muestra en la Figura 6.2.1. Existen cinco pasos generales en el proceso que constituye el
aprendizaje de máquina, distribuidos en dos etapas esenciales.
Figura 6.2. 1 Esquema de la técnica de Aprendizaje de máquina
Etapa 1: Etapa de Aprendizaje (Entrenamiento).
1. El componente humano del proceso aporta la información base5 o conjunto de datos inicial.
2. Los datos son procesados mediante el algoritmo que genera el aprendizaje de la
máquina.
3. Generación de un modelo.