• No se han encontrado resultados

Análisis de Efectividad al Implementar la Técnica de Árboles de Decisión del Enfoque de Aprendizaje de Máquina para la Determinación de Avalúos Masivos para las UPZ 79 Calandaima, 65 Arborizadora y 73 Garcés Navas

N/A
N/A
Protected

Academic year: 2020

Share "Análisis de Efectividad al Implementar la Técnica de Árboles de Decisión del Enfoque de Aprendizaje de Máquina para la Determinación de Avalúos Masivos para las UPZ 79 Calandaima, 65 Arborizadora y 73 Garcés Navas"

Copied!
275
0
0

Texto completo

(1)

ANÁLISIS DE EFECTIVIDAD AL

IMPLEMENTAR LA TÉCNICA DE ÁRBOLES

DE DECISIÓN DEL ENFOQUE DE

APRENDIZAJE DE MÁQUINA PARA LA

DETERMINACIÓN DE AVALÚOS MASIVOS

PARA LAS UPZ 79 CALANDAIMA, 65

ARBORIZADORA Y 73 GARCÉS NAVAS

Adriana del Pilar Albancando Robles

Universidad Distrital Francisco José de Caldas

Facultad de Ingeniería, Ingeniería Catastral y Geodesia

Bogotá D.C.

(2)

ANÁLISIS DE EFECTIVIDAD AL

IMPLEMENTAR LA TÉCNICA DE ÁRBOLES

DE DECISIÓN DEL ENFOQUE DE

APRENDIZAJE DE MÁQUINA PARA LA

DETERMINACIÓN DE AVALÚOS MASIVOS

PARA LAS UPZ 79 CALANDAIMA, 65

ARBORIZADORA Y 73 GARCÉS NAVAS

Adriana del Pilar Albancando Robles

Monografía de grado presentado como requisito parcial para optar el título de:

Ingeniera Catastral y Geodesta

Director:

Ingeniero Edwin Robert Pérez Carvajal

Universidad Distrital Francisco José de Caldas

Facultad de Ingeniería, Ingeniería Catastral y Geodesia

Bogotá D.C.

(3)

III Dedicatoria

A mi Padre Celestial, a mi mamá

Adriana Robles Salazar, mi papá Edwin

Albancando Cushcagua, mis hermanas

Diana Margarita, Liz Alejandra, Karol

Daniela y mis hermanos Edwin Hared y

José David, quienes han sido el motor y

apoyo constante en cada logro que he

conseguido, así como a cada familiar y

amigo que ha hecho parte de este

proceso.

Adriana del Pilar Albancando Robles

(4)

IV

Agradecimientos

De manera solemne expreso gratitud a todos los que estuvieron involucrados en este

proyecto que ahora llega a su culminación.

A Mi Padre Celestial, a quien debo cada fortaleza, a los miembros de mi familia, mis

padres y hermanos, que fueron participantes activos en este proceso, su ejemplo, apoyo,

dedicación y sacrificio dieron paso a que haya sido posible llevar a cabo este cometido,

reconozco su paciencia y confianza, que me llevaron a perseverar en esta labor cada

momento.

A la Universidad Distrital Francisco José de Caldas por haberme permitido participar de

este proyecto curricular y darme las herramientas mediante sus docentes y programas para

desarrollarme como profesional en Ingeniería Catastral y Geodesia.

De manera especial agradezco a mi director, el Ingeniero Edwin Robert Pérez, quien

estuvo al tanto de cada parte del desarrollo de este trabajo, prestando un dedicado apoyo,

constante atención e instrucción oportuna.

Finalmente agradezco a la Unidad Administrativa Especial de Catastro Distrital (UAECD)

y al Observatorio Técnico Catastral por suministrarme la información correspondiente a

(5)

V

Resumen

El presente proyecto tiene como fin desarrollar la aplicación del aprendizaje de máquina,

específicamente el método de árboles de decisión, para verificar su efectividad como parte

fundamental del estudio que constituyen los avalúos masivos y mostrar una comparación

con valores observados y el método tradicionalmente empleado, a saber, la regresión

lineal.

Para cumplir con los objetivos propuestos se emplearon métodos de clasificación para

datos numéricos, el M5P, y para datos nominales, el ID3 y el J48, los cuales se evaluaron

por variaciones de los Test Cross Validation (validación cruzada) y Percentage Split

(División de porcentaje), por medio de los que se verificó el clasificador de árboles de

decisión más acertado al obtener resultados semejantes a los observados.

Con el propósito de verificar la efectividad de la aplicación del aprendizaje de máquina en

procesos como los avalúos, se hizo uso de datos proporcionados por la Unidad

Administrativa Especial de Catastro Distrital (UAECD) y el Observatorio Técnico

Catastral, correspondientes a las Unidades de Planeamiento Zonal (UPZ) 65

Arborizadora, 73 Calandaima y 79 Garcés Navas, adicionalmente, para el tratamiento de

los datos se empleó el software libre Weka con sus aplicaciones y opciones para visualizar,

procesar y observar resultados.

Como resultado del análisis realizado, se obtuvo que el aprendizaje de máquina por medio

del método de árboles de decisión es una herramienta útil y efectiva para aplicar dentro del

proceso de los avalúos, su aplicación a los datos es más específica al compararla con el

(6)

VI

aplica a los grupos de datos y hacer un análisis más específico de las clasificaciones

finales.

Palabras clave: Aprendizaje de Máquina, Árboles de decisión, Unidad de Planeamiento

(7)

1

Tabla de contenido

Agradecimientos ... IV

Lista de figuras ...5

Lista de tablas ...8

Lista de ecuaciones ... 12

Lista de anexos ... 13

Introducción ... 18

1. Antecedentes ... 20

2. Problema de investigación ... 28

3. Objetivos ... 31

3.1 General ... 31

3.2 Específicos ... 31

4. Justificación ... 32

5. Marco espacial ... 34

5.1. UPZ 65 Arborizadora ... 34

5.2. UPZ 73 Garcés Navas ... 37

5.3. UPZ 79 Calandaima ... 41

(8)

2

6.1 Inteligencia artificial ... 44

6.2 Aprendizaje de máquina... 47

6.3 Árboles de decisión ... 50

6.4 Entropía de la información ... 55

6.5 Ganancia de la información ... 59

6.6 Método ID3 ... 64

6.7 Método J48 o C4.5 ... 65

6.8 Método M5P ... 68

6.9 Métodos de validación ... 69

6.10 WEKA... 70

6.10.1 Estadístico Kappa ... 75

6.10.2 Coeficiente de correlación ... 76

6.10.3 Errores ... 77

6.11 Construcción de intervalos ... 79

6.12 Valuación ... 79

6.12.1 Valuación estadística... 81

6.12.2 Avalúos masivos ... 83

6.12.3 Puntos de investigación económica ... 84

6.13 Unidades de Planeamiento Zonal (UPZ)... 84

(9)

3

7.1 Definición de zonas de estudio ... 86

7.2 Adquisición de base de datos catastrales de la zona de estudio ... 87

7.3 Selección de métodos basados en árboles de decisión ... 89

7.4 Estructura preliminar del experimento, clasificación de los datos para el procesamiento en el software WEKA ... 91

7.4.1 Atributo sector... 95

7.4.2 Atributo uso ... 96

7.4.3 Atributo pisos ... 97

7.4.4 Atributo edad ... 98

7.4.5 Atributo puntaje ... 99

7.4.6 Atributo estrato ... 100

7.4.7 Atributo actividad ... 101

7.4.8 Atributo tratamiento ... 101

7.4.9 Atributo área de terreno ... 102

7.4.10 Atributo valor metro cuadrado de terreno ... 104

7.4.11 Atributo área construida ... 106

7.4.12 Atributo valor metro cuadrado de construcción ... 108

7.4.13 Generación archivos weka ... 109

8. Análisis de resultados ... 115

(10)

4

8.2 Resultados UPZ 73 Garcés Navas, Conjunto de datos NO_PH ... 126

8.3 Resultados UPZ 65 Arborizadora, Conjunto de datos PH ... 137

8.4 Resultados UPZ 65 Arborizadora, Conjunto de datos NO_PH ... 148

8.5 Resultados UPZ 79 Calandaima, Conjunto de datos PH ... 159

8.6 Resultados UPZ 79 Calandaima, Conjunto de datos NO_PH ... 170

9. Conclusiones ... 181

10. Recomendaciones ... 183

11. Anexos ... 185

(11)

5

Lista de figuras

Figura 1. 1 Procedimiento para construir una base de conocimiento para implementar el

método de aprendizaje... 20

Figura 1. 2 Ejemplo de capas de una imagen para el conjunto de datos de entrenamiento y el flujo de datos en el subsistema ... 21

Figura 1. 3 Esquema de la definición de las variables ... 23

Figura 1. 4 Ejemplo de árbol de decisión para iniciación ... 24

Figura 1. 5 Comportamiento del error (ECM) ... 26

Figura 5.1. 1 División por sectores UPZ 65 Arborizadora ... 35

Figura 5.2. 1 División por Sectores UPZ 73 Garcés Navas ... 39

Figura 5.3. 1 División por sectores UPZ 79 Calandaima ... 42

Figura 6.2. 1 Esquema de la técnica de Aprendizaje de máquina ... 48

Figura 6.3. 1 Ejemplo de árbol de decisión ... 52

Figura 6.3. 2 Ejemplo de reglas generadas por un Árbol de Decisión ... 53

Figura 6.4. 1 Gráfica de la Función de entropía de una clasificación booleana ... 58

Figura 6.5. 1 Comparación de resultados de Ganancia de información... 64

Figura 6.9. 1 Ejemplo de Validación Cruzada - Cross Validation ... 70

Figura 6.10. 1 Ventana de Inicio. Weka, Versión 3.6.13 ... 71

Figura 6.10. 2 Entorno Explorer del Software WEKA ... 72

Figura 7. 1 Esquema de metodología ... 86

Figura 7.1. 1 Localización de las zonas de estudio ... 87

(12)

6

Figura 7.5. 1 Elaboración del experimento, etapa de entrenamiento y validación ... 111

Figura 7.5. 2 Elaboración del experimento, etapa de pronóstico ... 112

Figura 8.1. 1 Garcés Navas – PH, Comparación Valor m2 de Construcción Observado y

método Árbol de Decisión M5P Split 66 ... 123

Figura 8.1. 2 Garcés Navas – PH, Comparación Valor m2 de Construcción Observado y

método Regresión Lineal Cross 20 ... 124

Figura 8.1. 3 Garcés Navas – PH, Comparación Valor m2 de Construcción Observado,

método Árbol de Decisión M5P Split 66 y Regresión Lineal Cross 20... 125

Figura 8.2. 1 Garcés Navas –NO_PH, Comparación Valor m2 de Construcción Observado

y método Árbol de Decisión M5P Split 80 ... 134

Figura 8.2. 2 Garcés Navas - NO_ PH, Comparación Valor m2 de construcción observado y

método regresión lineal Cross 20 ... 135

Figura 8.2. 3 Garcés Navas – NO_PH, Comparación Valor m2 de Construcción Observado,

método Árbol de Decisión M5P Split 80 y Regresión Lineal Cross 20... 136

Figura 8.3. 1 Arborizadora – PH, Comparación Valor m2 de Construcción observado y

método Árbol de Decisión M5P Cross 20... 145

Figura 8.3. 2 Arborizadora – PH, Comparación Valor m2 de Construcción Observado y

método Regresión Lineal Split 66 ... 146

Figura 8.3. 3 Arborizadora – PH, Comparación Valor m2 de Construcción Observado,

método árbol de Decisión M5P Cross 20 y Regresión Lineal Split 66 ... 147

Figura 8.4. 2 Arborizadora - NO_ PH, Comparación Valor m2 de Construcción Observado

(13)

7

Figura 8.4. 3 Arborizadora - NO_PH, Comparación Valor m2 de Construcción Observado

y método Regresión Lineal Split 33 ... 157

Figura 8.4. 4 Arborizadora - NO – PH, Comparación Valor m2 de construcción observado,

método Árbol de Decisión M5P Split 80 y Regresión Lineal Split 33 ... 158

Figura 8.5. 1 Calandaima – PH, Comparación Valor m2 de Construcción Observado y

método Árbol de Decisión M5P Cross 20... 167

Figura 8.5. 2 Calandaima – PH, Comparación Valor m2 de Construcción Observado y

método Regresión Lineal Split 66 ... 168

Figura 8.5. 3 Calandaima – PH, Comparación Valor m2 de Construcción Observado,

método Árbol de Decisión M5P Cross 20 y Regresión Lineal Split 66... 169

Figura 8.6. 1 Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado y

método Árbol de Decisión M5P Split 80 ... 178

Figura 8.6. 2 Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado y

método Regresión Lineal Cross 20 ... 179

Figura 8.6. 3 Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado,

método Árbol de Decisión M5P Split 80 y Regresión Lineal Cross 20... 180

(14)

8

Lista de tablas

Tabla 5.1. 1Límites UPZ 65 Arborizadora... 34

Tabla 5.1. 2 Extensión UPZ 65 Arborizadora ... 35

Tabla 5.1. 3 Vías malla arterial UPZ 65 Arborizadora ... 36

Tabla 5.1. 4 Usos del Suelo UPZ 65 Arborizadora ... 37

Tabla 5.1. 5 Distribución de la población por estrato en la UPZ 65 Arborizadora ... 37

Tabla 5.2. 1 Límites UPZ 73 Garcés Navas ... 38

Tabla 5.2. 2 Extensión UPZ 73 Garcés Navas ... 38

Tabla 5.2. 3 Vías Malla Arterial UPZ 73 Garcés Navas ... 40

Tabla 5.2. 4 Usos del Suelo UPZ 73 Garcés Navas ... 40

Tabla 5.2. 5 Distribución de la población por estrato en la UPZ 73 Garcés Navas ... 41

Tabla 6.5. 1 Atributos y valores experimento ... 61

Tabla 6.10. 1 Descripción de las opciones presentes en el entorno Explorer del Software WEKA ... 73

Tabla 6.10.2. 1 Gráficas de casos de resultados del coeficiente de correlación ... 77

Tabla 6.10.3. 1 Características de los errores... 78

Tabla 7.2. 1 Atributos de información cartográfica ... 88

Tabla 7.2. 2 Contenido bases de datos catastrales ... 89

Tabla 7.3. 1 Métodos de entrenamiento y validación ... 91

Tabla 7.4. 1 Comparación de cantidad de datos por UPZ luego de la depuración ... 91

(15)

9

Tabla 7.4. 3 Atributos seleccionados para procesar ... 94

Tabla 7.4. 4 Cantidad de datos para conjunto de entrenamiento y validación y conjunto de pronóstico ... 94

Tabla 7.4.2. 1 Atributo uso para predios No PH ... 96

Tabla 7.4.2. 2 Atributo uso para predios PH ... 97

Tabla 7.4.3. 1 Atributo pisos ... 97

Tabla 7.4.4.1 Características de la clasificación: atributo edad ... 98

Tabla 7.4.4.2 Clasificación atributo edad... 98

Tabla 7.4.5.1 Características de la clasificación: atributo puntaje ... 99

Tabla 7.4.5. 2 Clasificación atributo puntaje, grupo1 ... 99

Tabla 7.4.5. 3 Clasificación atributo puntaje, grupo 2 ... 100

Tabla 7.4.5. 4 Clasificación atributo puntaje, grupo 3 ... 100

Tabla 7.4.6. 1 Clasificación atributo estrato ... 101

Tabla 7.4.7. 1 Clasificación atributo actividad ... 101

Tabla 7.4.8. 1 Clasificación atributo tratamiento ... 102

Tabla 7.4.9. 1Características de la clasificación: atributo área de terreno ... 103

Tabla 7.4.9. 2 Clasificación atributo área de terreno, grupo 1 ... 103

Tabla 7.4.9. 3 Clasificación atributo área de terreno, grupo 2 ... 104

Tabla 7.4.9. 4 Clasificación atributo área de terreno, grupo 3 ... 104

(16)

10

Tabla 7.4.10. 1 Características de la clasificación: atributo valor metro cuadrado de terreno

... 105

Tabla 7.4.10. 2 Clasificación atributo valor metro cuadrado de terreno ... 105

Tabla 7.4.11. 1 Características de la clasificación: atributo área construida ... 106

Tabla 7.4.11. 2 Clasificación atributo área construida, grupo 1 ... 106

Tabla 7.4.11. 3 Clasificación atributo área construida, grupo 2 ... 107

Tabla 7.4.11. 4 Clasificación atributo área construida, grupo 3 ... 107

Tabla 7.4.11. 5 Clasificación atributo área construida, grupo 4 ... 107

Tabla 7.4.12. 1 Características de la clasificación: valor metro cuadrado de construcción 108 Tabla 7.4.12. 2 Clasificación atributo valor metro cuadrado de construcción, grupo 1 .... 108

Tabla 7.4.12. 3 Clasificación atributo valor metro cuadrado de construcción, grupo 2 .... 109

Tabla 7.4.13. 1 Nombres de archivos .arff, UPZ 73 ... 110

Tabla 7.4.13. 2 Nombres de archivos .arff, UPZ 65 ... 110

Tabla 7.4.13. 3 Nombres de archivos .arff, UPZ 79 ... 110

Tabla 7.5. 1 Resultados obtenidos según método de clasificación ... 112

Tabla 8.1. 1 Características experimento: Garcés Navas, PH ID3- J48 - M5P - RL ... 115

Tabla 8.1. 2 Comparación de errores de la selección de resultados finales, experimento: Garcés Navas, PH - J48 – M5P - RL ... 121

Tabla 8.1. 3 Selección de resultados finales, experimento: Garcés Navas, PH - J48 – M5P - RL ... 122

(17)

11

Tabla 8.2. 3 Selección de resultados finales, experimento: Garcés Navas, NO_PH - J48 –

M5P - RL ... 133

Tabla 8.3. 1. Características experimento: Arborizadora, PH ID3-J48–M5P-RL ... 137

Tabla 8.3. 2 Comparación de errores de la selección de resultados finales, experimento:

Arborizadora, PH – ID3 - M5P - RL... 143

Tabla 8.3. 3 Selección de resultados finales, experimento: Arborizadora, PH – ID3 – M5P -

RL ... 144

Tabla 8.4. 1. Características experimento: Arborizadora, NO_PH ID3-J48-M5P-RL ... 148

Tabla 8.4. 2. Comparación de errores de la selección de resultados finales, experimento:

Arborizadora, NO_PH - J48 – M5P - RL ... 154

Tabla 8.4. 3 Selección de resultados finales, experimento: Arborizadora, NO_PH J48 - M5P

- RL ... 155

Tabla 8.5. 1. Características experimento: Arborizadora, PH ID3- J48 - M5P - RL ... 159

Tabla 8.5. 2 Comparación de errores de la selección de resultados finales, experimento:

Calandaima, PH – ID3 – M5P - RL ... 165

Tabla 8.5. 3 Selección de resultados finales, experimento: Calandaima, PH ID3 – ID3 -

M5P - RL ... 166

Tabla 8.6. 1 Características experimento: Calandaima, NO_PH ID3- J48 - M5P - RL ... 170

Tabla 8.6. 2. Comparación de errores de la selección de resultados finales, experimento:

Arborizadora, NO_PH - ID3 - M5P - RL ... 176

Tabla 8.6. 3 Selección de resultados finales, experimento: Calandaima, NO_PH – ID3 -

M5P - RL ... 177

(18)

12

Lista de ecuaciones

Ecuación (6.4. 1) Entropía (S) ... 56

Ecuación (6.4. 2) Entropía general ... 59

Ecuación (6.5. 1) Ganancia de información ... 60

Ecuación (6.5. 2) Subconjunto de S ... 60

Ecuación (6.10.1. 1) Estadístico Kappa ... 75

Ecuación (6.10.2. 1) Coeficiente de correlación de Pearson... 76

Ecuación (6.10.2.2) Coeficiente de correlación para estadístico muestral ... 77

Ecuación (6.11. 1) Regla de Sturges ... 79

Ecuación (6.11. 2) Rango ... 79

(19)

13

Lista de anexos

Anexo 1. Resultados, experimento: Garcés Navas, PH-ID3 ... 185

Anexo 2. Selección de resultados, experimento: Garcés Navas, PH - ID3 ... 186

Anexo 3. Resultados, experimento: Garcés Navas, PH-J48. ... 187

Anexo 4. Selección de resultados, experimento: Garcés Navas, PH - J48 ... 188

Anexo 5. Comparación de selecciones, experimento: Garcés Navas, PH – J48 - ID3 ... 189

Anexo 6. Resultados experimento: Garcés Navas, PH-M5P ... 190

Anexo 7. Selección de resultados, experimento: Garcés Navas, PH - M5P ... 191

Anexo 8. Resultados, experimento: Garcés Navas, PH-RL ... 192

Anexo 9. Selección de resultados, experimento: Garcés Navas, PH - RL ... 193

Anexo 10. Comparación de selecciones, experimento: Garcés Navas, PH - M5P-RL ... 194

Anexo 11. Garcés Navas – PH, Comparación Valor m2 de Construcción Observado y método Árbol de Decisión M5P Percentage Split 66... 195

Anexo 12. Garcés Navas – PH, Comparación Valor m2 de Construcción Observado y método Regresión Lineal Cross 20 ... 196

Anexo 13. Garcés Navas – PH, Comparación Valor m2 de Construcción Observado, método Árbol de Decisión Split 66 y Regresión Lineal Cross 20 ... 197

Anexo 14. Resultados, experimento: Garcés Navas, NO_ PH-ID3 ... 198

Anexo 15. Selección de resultados, experimento: Garcés Navas, NO_PH - ID3 ... 199

Anexo 16. Resultados, experimento: Garcés Navas, NO_PH-J48. ... 200

(20)

14

Anexo 18. Comparación de selecciones, experimento: UPZ Garcés Navas, NO _PH – J48 -

ID3 ... 202

Anexo 19. Resultados experimento: Garcés Navas, NO_PH-M5P ... 203

Anexo 20. Selección de resultados, experimento: Garcés Navas, NO_PH - M5P ... 204

Anexo 21. Resultados, experimento: Garcés Navas, NO_PH-RL ... 205

Anexo 22. Selección de resultados, experimento: Garcés Navas, NO_PH – RL ... 206

Anexo 23. Comparación de selecciones, experimento: UPZ Garcés Navas, NO_PH - M5P-RL ... 207

Anexo 24. Garcés Navas – NO_PH, Comparación Valor m2 de Construcción Observado y método Árbol de Decisión M5P Split 80 ... 208

Anexo 25. Garcés Navas – NO_PH, Comparación Valor m2 de Construcción Observado y Método Regresión Lineal Cross 20 ... 209

Anexo 26. Garcés Navas – NO_PH, Comparación Valor m2 de Construcción Observado, método Árbol de Decisión M5P- Split 80 y Regresión Lineal Cross 20 ... 210

Anexo 27. Resultados, experimento: Arborizadora, PH-ID3 ... 211

Anexo 28. Selección de resultados, experimento: Arborizadora, PH - ID3 ... 212

Anexo 29. Resultados, experimento: Arborizadora, PH-J48 ... 213

Anexo 30. Selección de resultados, experimento: Arborizadora, PH - J48 ... 214

Anexo 31. Comparación de selecciones, experimento: Arborizadora, PH – J48 - ID3 .... 215

Anexo 32. Resultados experimento: Arborizadora, PH-M5P ... 216

Anexo 33. Selección de resultados, experimento: Arborizadora, PH - M5P ... 217

Anexo 34. Resultados, experimento: Arborizadora, PH-RL... 218

(21)

15

Anexo 36. Comparación de selecciones, experimento: Arborizadora, PH - M5P-RL ... 220

Anexo 37. Arborizadora – PH, Comparación Valor m2 de Construcción Observado y método Árbol de Decisión M5P Cross 20... 221

Anexo 38. Arborizadora – PH, Comparación Valor m2 de Construcción Observado y método Regresión Lineal Split 66 ... 222

Anexo 39. Arborizadora – PH, Comparación Valor m2 de Construcción Observado, método Árbol de Decisión M5P Cross 20 y Regresión Lineal Split 66... 223

Anexo 40. Resultados, experimento: Arborizadora, NO_PH-ID3 ... 224

Anexo 41. Selección de resultados, experimento: Arborizadora, NO_PH - ID3 ... 225

Anexo 42. Resultados, experimento: Arborizadora, NO_PH-J48. ... 226

Anexo 43. Selección de resultados, experimento: Arborizadora, NO_PH - J48 ... 227

Anexo 44. Comparación de selecciones, experimento: UPZ Arborizadora, NO_PH – J48 - ID3 ... 228

Anexo 45. Resultados experimento: Arborizadora, NO_PH - M5P ... 229

Anexo 46. Selección de resultados, experimento: Arborizadora, NO_PH - M5P ... 230

Anexo 47. Resultados, experimento: Arborizadora, NO_PH - RL ... 231

Anexo 48. Selección de resultados, experimento: Arborizadora, NO_PH – RL ... 232

Anexo 49. Comparación de selecciones, experimento: UPZ Arborizadora, NO_PH - M5P-RL ... 233

Anexo 50. Arborizadora – NO_PH, Comparación Valor m2 de Construcción Observado y método Árbol de Decisión M5P - Split 80 ... 234

(22)

16

Anexo 52. Arborizadora - NO_PH, Comparación Valor m2 de Construcción Observado,

método Árbol de Decisión M5P - Split 80 y Regresión Lineal - Split 33 ... 236

Anexo 53. Resultados, experimento: Calandaima, PH-ID3 ... 237

Anexo 54. Selección de resultados, experimento: Calandaima, PH - ID3 ... 238

Anexo 55. Resultados, experimento: Calandaima, PH-J48. ... 239

Anexo 56. Selección de resultados, experimento: Calandaima, PH - J48 ... 240

Anexo 57. Comparación de selecciones, experimento: UPZ Calandaima, PH – J48 -

ID3 ... 241

Anexo 58. Resultados experimento: Calandaima, PH-M5P ... 242

Anexo 59. Selección de resultados, experimento: Calandaima, PH - M5P ... 243

Anexo 60. Resultados, experimento: Calandaima, PH - RL ... 244

Anexo 61. Selección de resultados, experimento: Calandaima, PH – RL ... 245

Anexo 62. Comparación de selecciones, experimento: UPZ Calandaima, PH - M5P-RL 246

Anexo 63. Calandaima – PH, Comparación Valor m2 de Construcción Observado y

método Árbol de Decisión - M5P Cross 20 ... 247

Anexo 64. Calandaima – PH, Comparación Valor m2 de Construcción Observado y

método Regresión Lineal – Split 66 ... 248

Anexo 65. Calandaima – PH, Comparación Valor m2 de Construcción Observado, método

Árbol de Decisión M5P– Cross 20 y Regresión Lineal – Split 66 ... 249

Anexo 66. Resultados, experimento: Calandaima, NO_PH - ID3 ... 250

Anexo 67. Selección de resultados, experimento: Calandaima, NO_PH - ID3 ... 251

Anexo 68. Resultados, experimento: Calandaima, NO_PH-J48. ... 252

(23)

17

Anexo 70. Comparación de selecciones, experimento: UPZ Calandaima, NO_PH – J48 -

ID3 ... 254

Anexo 71. Resultados experimento: Calandaima, NO_PH-M5P ... 255

Anexo 72. Selección de resultados, experimento: Calandaima, NO_PH - M5P ... 256

Anexo 73. Resultados, experimento: Calandaima, NO_PH-RL ... 257

Anexo 74. Selección de resultados, experimento: Calandaima, NO_PH – RL ... 258

Anexo 75. Comparación de selecciones, experimento: UPZ Calandaima, NO_PH -

M5P-RL ... 259

Anexo 76. Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado y

método Árbol de Decisión – M5P Split 80 ... 260

Anexo 77. Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado y

método Regresión Lineal – Cross 20 ... 261

Anexo 78. Calandaima – NO_PH, Comparación Valor m2 de Construcción Observado,

(24)

18

Introducción

La Inteligencia artificial, según Marvin Minsky, considerado el padre de la inteligencia

artificial (Bernardo, 2016), se define como la ciencia de construir máquinas que hagan

cosas que, si las hicieran los humanos requerirían inteligencia (Cazorla,M, Alfonso, M,

Escolano, F, Colomina, O, & Lozano, M, 2003). De esta ciencia, se derivan diferentes

campos, entre los cuales se encuentra el aprendizaje de máquina, este consiste en un

conjunto de métodos por los cuales las máquinas pueden detectar automáticamente patrones

en los datos, y luego usar los patrones descubiertos para realizar predicciones (Murphy,K,

2012), uno de estos métodos es el de árbol de decisión, que es de los más populares entre

los algoritmos de inferencia inductiva, en el que por reglas de si – entonces, realiza la

clasificación de los datos (Mitchell, T, 1997).

Valuar consiste en la aplicación de los diferentes enfoques y herramientas para la

estimación del valor de un bien, al relacionarlo con los bienes inmuebles se hace necesario

buscar la forma y herramientas que permitan llegar, de manera técnica y precisa, al

conocimiento del valor del bien, ya sea que se trate de uno, o de varios predios, según

corresponda el caso.

En las técnicas que se requieren en la valuación, se emplean diferentes variables que

identifican el inmueble, por lo que al requerir avalúos de un gran volumen de predios, es

necesario realizar una clasificación, esta se puede desarrollar mediante diversos métodos,

entre los que se encuentran la comparación o el mercado, la capitalización de rentas o

ingresos, costo de reposición y la técnica de desarrollo potencial o método involutivo.

(25)

19

determinar el valor de un bien inmueble; en caso de tratarse de varios predios, en Colombia

se ha popularizado el uso de modelos de regresión lineal, no obstante, dadas las

características de algunas variables inherentes a los predios es necesario hacer procesos

para poder identificarlas e instrumentalizarlas en la regresión, o simplemente no

emplearlas.

En este trabajo se presenta una herramienta más a partir de la implementación del algoritmo

de árboles de decisión, del enfoque del aprendizaje de máquina, a los procesos valuatorios

de los bienes inmuebles, mostrando otra alternativa para emplear un proceso de esta índole

(26)

20

1.

Antecedentes

Diferentes técnicas derivadas del aprendizaje de máquina han sido implementadas con el

fin de facilitar procesos, entre estas técnicas se encuentran las redes neuronales, algoritmos

genéticos, arboles de decisión, entre otros. Recientemente se han desarrollado proyectos

aplicados a campos empresariales, de inversión y, aunque no en gran cantidad, al componente “geo” de una comunidad.

A continuación se presentan tres trabajos que se han realizado empleando técnicas de

aprendizaje de máquina para cumplir con sus respectivos objetivos.

Figura 1. 1 Procedimiento para construir una base de conocimiento para implementar el método de aprendizaje

Fuente: (Huang,X & Jensen,J.R, 1997)

En primer lugar, en el año de 1997 se realizó un paper titulado A Machine-Learning

Approach to Automated Knowledge-Base Building for Remote Sensing Image Analysis

(27)

21

conocimiento automatizado para el análisis de imágenes de sensor remoto con datos SIG)

por Xueqiao Huang y John R. Jensen.

Al realizar este artículo científico, el objetivo de los autores fue presentar la manera en que

se podía aplicar el enfoque de aprendizaje de máquina, para la clasificación de imágenes

obtenidas mediante sensores remotos.

Figura 1. 2 Ejemplo de capas de una imagen para el conjunto de datos de entrenamiento y el flujo de datos en el subsistema

Fuente: (Huang,X & Jensen,J.R, 1997)

El proceso que se siguió se dividio entre el trabajo realizado por los humanos expertos y el

trabajo realizado por el aprendizaje de máquina o del programa, como se muestra en la

Figura 1.1, en la parte superior del gráfico (a) se puede apreciar que se parte de una base de

un sistema de información geográfica, seguido a eso los humanos expertos realizan los

procedimientos necesarios para las debidas clasificaciones que conformaran el conjunto de

(28)

22

el aprendizaje, mediante el software y la máquina se genera el árbol de decisión y las

respectivas reglas, para obtener finalmente una base de conocimiento.

Este proyecto se desarrolló con imágenes obtenidas de sensores remotos con el fin de hacer

un análisis multitemporal de un área de humedales localizada a los alrededores del rio

Savannah localizado en la frontera entre los estados de Carolina del Sur y Georgia en los

Estados Unidos.

Ilustrado en la Figura 1.2, se explica gráficamente como el pixel de una sola imagen tiene

varios componentes, seis para el ejemplo, que serán los valores que conformarán el

conjunto de datos de entrenamiento para la generación del árbol de decisión y las reglas a

aplicar para finalmente tener una clasificación como resultado.

Como conclusiones del trabajo los autores obtuvieron que el uso del aprendizaje de

máquina facilita en gran manera el proceso de clasificación de las imágenes a comparación

del método empleado convencionalmente, al hacer una selección adecuada del conjunto de

datos de entrenamiento se obtienen resultados de calidad y destacan la facilidad de entender

e interpretar los resultados obtenidos mediante los árboles y las reglas para la posterior

aplicación a los datos de validación (Huang,X & Jensen,J.R, 1997).

En segundo lugar, en el año 2008, se publicó para la Revista Colombiana de Estadística, el

artículo titulado Aplicación de árboles de decisión en modelos de riesgo crediticio por

Paola Andrea Cardona Hernández.

Mediante este trabajo, la autora muestra un marco general de la normatividad del sistema

(29)

23

estudios, específicamente el método de árboles de decisión para el cálculo de

incumplimiento en crédito presentando sus ventajas y desventajas.

Entendiendo por riesgo de crédito la pérdida potencial para una entidad financiera debido a

la incapacidad del cliente de cumplir con sus obligaciones de pago, se hace necesario, de

parte de las entidades financieras realizar estudios que les permitan conocer si sus clientes

son deudores potenciales, para estos se establece un tiempo de doce meses a futuro y se

estudia la capacidad de pago de los mismos, comúnmente se hace con clientes que

anteriormente han estado en mora, no obstante, mediante otros métodos estadísticos es

posible realizarlo para clientes que no han estado en mora y prever en escenarios futuros su

posible comportamiento respecto sus deudas.

Figura 1. 3 Esquema de la definición de las variables

Fuente: (Cardona, A, 2004)

Como se muestra en la Figura 1.3, se establecen como clientes buenos aquellos que no han

estado en mora en los primeros doce meses y como clientes malos aquellos que antes de los

(30)

24

árbol de decisión y posteriormente las reglas que permitirán aplicar el modelo generado de

datos de entrenamiento a datos de los posibles clientes.

Figura 1. 4 Ejemplo de árbol de decisión para iniciación

Fuente: (Cardona, A, 2004)

Como se observa en este ejemplo de la Figura 1.4, al emplear el método de árboles de

decisión, para este caso se obtienen seis nodos terminales, es decir, 6 categorías con sus

respectivas probabilidades que permiten identificar seis perfiles de riesgo para tomar

decisiones respecto a otorgar o no el crédito a las personas en los diferentes escenarios.

Los requerimientos para el uso de modelos están asociados a tres factores:

 Simplicidad: A fin de que diferentes empleados de la entidad financiera puedan

entender el modelo y sus resultados.

 Potencia: Mostrando en sus resultados la elegibilidad correcta entre clientes

buenos y clientes malos.

(31)

25

Teniendo en cuenta que el modelo de árboles de decisión cumple con estos requerimientos,

la autora presenta la forma en que se aplican pruebas estadísticas para evaluar la capacidad

del modelo como la prueba F, Kolmogorov-Smirnov para dos muestras (K-S), la curva

ROC (Recive Operative Curve) y el coeficiente Gini y como estas dan buenos resultados.

Concluyendo, la autora se refiere a los árboles de decisión como una herramienta efectiva

al evaluar el riesgo de que exista incumplimiento en las responsabilidades de los posibles

clientes, es estable en el tiempo y útil para planeación de estrategias comerciales, métodos

de cobranza, entre otras. Se aclara que la importancia de un buen modelo radica en que

según las decisiones que se tomen al aceptar o no un cliente afectará directamente las

utilidades de la entidad financiera, permitiéndole aumentar en capital o llegar a la

insolvencia (Cardona, A, 2004).

Para finalizar, en tercer lugar, en el año 2011 fue presentada en la facultad de minas de

Ingeniería de sistemas en la Universidad Nacional, sede Medellín, Colombia, la tesis

titulada Modelo Basado en Aprendizaje de Máquinas para el Manejo de Riesgo de Falla

Durante la Composición de Servicios Web por Byron Enrique Portilla Rosero como

requisito para optar al título de magister en ingeniería de sistemas.

El objetivo de este trabajo estuvo en proponer un modelo basado en el método de aprendizaje de máquina que permitiera “aprender al sistema” los riesgos que puede

presentar en el servicio web a fin de disminuir el riesgo de falla del mismo.

Para lograr esto el autor estudio las siguientes técnicas:  Arboles de decisión

(32)

26

 Razonamiento basado en Casos(CBR)

 Aprendizaje por refuerzo

 Aprendizaje bayesiano

De estas revisó las ventajas y desventajas de cuatro características específicas, a saber:  Manejo de recursos de memoria, almacenamiento y tiempo de ejecución

 Información requerida

 Representación

 Facilidad de interpretar el resultado por el humano

Figura 1. 5 Comportamiento del error (ECM)

Nota: Comportamiento del ECM del cálculo del riesgo en la métrica de disponibilidad por parte del aprendizaje para el servicio GetItemInformation para el día martes 11am.

Fuente: (Portilla,B.E., 2011)

(33)

27

Llegando a la conclusión que las técnicas que describían mejor estas características y se

aplicaban al objetivo de su proyecto, de adquirir información referente a riesgos de falla de

los servicios durante composiciones web, fueron los árboles de decisión y la programación

lógica inductiva, dado que estas dos técnicas se fusionan en el marco de árboles de

decisión lógicos.

Como se muestra en la Figura 1.5, el comportamiento de los servicios es aprendido de

forma satisfactoria por el modelo de aprendizaje, permitiendo hacer una mejor selección de

los servicios y disminución de las fallas.

Al finalizar el proyecto, se obtuvo que el modelo sugerido muestra solides en el

aprendizaje, capacidad para encontrar asociaciones correctas y el incremento de esa

(34)

28

2.

Problema de investigación

Conocer el valor de la posesiones es una necesidad que se ha generado desde tiempos

remotos, dado el hecho de que existiera un exceso de determinado bien, se hizo importante

saber el valor que este representaba para alguien que careciera del mismo (Caballero, M,

2002); en un principio se empleó el trueque, haciendo el intercambio entre objetos que se

consideraban de valor equivalente debido a la necesidad que se tenía de los mismos, con el

paso del tiempo, luego de la invención del papel moneda como medio de intercambio, se estableció una forma “imparcial” de valorar las cosas, no obstante el problema de saber a

cuantas unidades monetarias era equivalente un bien, continuaba siendo una necesidad por

satisfacer en los diferentes campos, incluyendo el de los bienes inmuebles.

A fin de dar solución a esta y otras necesidades relacionadas con el área de catastro,

geodesia, geomática, socioeconomía y planeación, en Colombia se creó el pregrado de

Ingeniería Catastral y Geodesia, teniendo como propósito el estudio del recurso tierra con

énfasis en el manejo social (UDFJC, 2016), enseñando también la investigación necesaria

que se requiere para conocer el valor monetario de un bien inmueble, la cual incluye, que

además de conocer de métodos matemáticos se conozca del entorno y se sepa argumentar

cada una de las decisiones que se tomen respecto al valor del bien valuado, ya que el

dinamismo que se presenta en las ciudades a nivel económico, social, arquitectónico,

estructural, de vetustez, entre otros, será un factor importante en el mercado de los

inmuebles.

Ahora bien, el analizar un bien y realizar toda una investigación involucrando diferentes

(35)

29

es una tarea que involucra gran trabajo y dedicación, no obstante, este trabajo se multiplica

al hablar de realizar avalúos masivos, por lo que se hace necesario emplear métodos que

faciliten la labor y funcionen como una herramienta más en la toma de decisiones.

El método enseñado y practicado para los avalúos masivos, en la universidad Distrital

Francisco José de Caldas, consiste en la realización de modelos econométricos, en cuyas

ecuaciones normalmente se tiene como variable dependiente el valor de metro cuadrado de

la construcción y como variables independientes, los valores correspondientes a área, edad

de la construcción, estrato, localización, entre otras, según la información con la que se

cuente y la relevancia que tengan las variables dentro del modelo que se realice, luego de

aplicar las diferentes pruebas a un modelo original; este método funciona bien y arroja,

según la calidad de los datos y del modelo establecido, errores pequeños en las

predicciones, lo que hace de este método una buena herramienta para conocer el valor tanto

de un predio como de un gran conjunto de estos.

Aun cuando el método de los regresores lineales en los modelos econométricos permite

obtener una precisión aceptable, se requiere un trabajo significativo en el momento de

trabajar con variables cualitativas, casos en los que se hace necesario crear variables

dicótomas para solucionar en parte el uso necesario de estas que representan las

características de los predios.

Teniendo en cuenta la importancia de la participación de este tipo de variables en el

proceso de valuar una bien inmueble, así como el ánimo de obtener mejores resultados, se

(36)

30

Artificial del enfoque de aprendizaje de máquina, mediante los cuales es posible realizar

predicciones referentes a los predios, acertadas y con mínimos errores, permiten trabajar

con las diferentes variables inherentes a los predios incluyendo características como su

localización y el manejo de grandes volúmenes de información para el caso de avalúos

(37)

31

3.

Objetivos

3.1 General

Realizar un análisis de la efectividad de implementar los enfoques de aprendizaje de

máquina, específicamente los árboles de decisión, en la determinación de avalúos masivos

para los predios ubicados en la ciudad de Bogotá, en los sectores de la localidad 8 de

Kennedy, Unidad de Planeamiento Zonal 79 Calandaima; localidad 19 de Ciudad Bolívar,

UPZ 65 Arborizadora y localidad 10 de Engativá, UPZ 73 Garcés Navas.

3.2 Específicos

Implementar la técnica de árboles de decisión y sus diferentes variaciones en el proceso de

realizar los avalúos.

Determinar de las técnicas de árboles de decisión usadas las que por sus parámetros

permitan llegar a resultados más acertados.

Establecer una comparación del método seleccionado de la técnica de árboles de decisión

con el método tradicionalmente empleado, regresión lineal, para la realización de avalúos

(38)

32

4.

Justificación

Los avalúos masivos son desarrollados por entidades privadas y gubernamentales según

diferentes necesidades como obras viales, proyectos de renovación urbana, estudios de

costos, entre otras y se efectúan mediante técnicas de modelos de regresión, en estos

procesos están involucradas variables numéricas y cualitativas, el uso de estos modelos se

ve afectado especialmente al involucrar variables del segundo tipo, debido a que se deben

buscar maneras de organizar y procesar los datos a fin de que todas las técnicas que se

empleen estén debidamente ejecutadas, al implementar este método se obtienen resultados

que al compararlos con la realidad son buenas representaciones de esta, no obstante, debido

a que se generaliza una regresión para una gran cantidad de datos, no siempre se ajusta de

una manera óptima para todos; al brindar un método que permita resultados aún más

ajustados a la realidad, las ventajas para las entidades que emplearían estos métodos serían

representativas y notorias en reducciones de costos y una visión más acertada referente a

los predios estudiados

Considerando la manera en que la tecnología permite el continuo avance en diferentes

entornos se optó por hacer uso de la inteligencia artificial, que tiene como uno de sus

enfoques el aprendizaje de máquina, que busca que mediante un sistema la máquina

aprenda una tarea y sea capaz de utilizar la información aprendida para generar

clasificaciones que funcionen para el pronóstico de datos ingresados posteriormente al

sistema. Este método ha sido implementado en campos financieros y del tratamiento de

(39)

33

Teniendo en cuenta que estos métodos han sido empleados para predicciones en distintos

campos, se plantea como un método para usar en el proceso de realizar avalúos masivos

mediante la clasificación automática que puede llegar a generarse, lo cual, según la calidad

de los resultados, es un método más sumándose al convencional.

Debido a que la necesidad de realizar avalúos es permanente en una sociedad que está en

constante cambio, crecimiento y modernización, el hecho de tener más herramientas que

aporten, faciliten y brinden mejores resultados, son necesarias constantemente y gracias al

continuo avance de la tecnología y la implementación de esta en los procesos valuatorios,

los beneficios a corto plazo del proyecto se verifican en los resultados obtenidos en el

presente proyecto, brindando una herramienta efectiva por su proximidad a los valores

reales, a mediano plazo, permitiendo aplicar esta técnica con valores de proyecciones de

entidades como el DANE y a largo plazo al posibilitar el uso de esta herramienta en

conjunto con muchas otras que hagan el proceso inicial de selección y clasificación de

(40)

34

5.

Marco espacial

El proyecto se desarrolló con los datos de predios localizados en la Ciudad de Bogotá en las

localidades 19 de Ciudad Bolívar, 8 de Kennedy y 10 de Engativá en las Unidades de

Planeamiento Zonal, 65 Arborizadora, 73 Garcés Navas y 79 Calandaima,

respectivamente, elegidas por la variabilidad que presentan en las características de los

predios allí localizados, presentando una información de más provecho para el estudio. A

continuación se presenta una descripción general de cada una de estas zonas.

5.1. UPZ 65 Arborizadora

La UPZ 65 Arborizadora cuenta con las siguientes características principales:

Localización: La UPZ Arborizadora está localizada al nororiente de la localidad 19,

Simón Bolívar, en la Ciudad de Bogotá, con un área de 326.97 hectáreas (Alcaldía

Mayor de Bogotá D.C - SDP, 2008), comprendidas entre los límites especificados

en la Tabla 5.1.1.

Tabla 5.1. 1Límites UPZ 65 Arborizadora

Norte Avenida del Ferrocarril del sur (DG 57c Sur)

Límite con la localidad 7, Bosa

Sur Avenida Villavicencio (AC 61 Sur)

Límite con la UPZ 66, San Francisco

Oriente

Río Tunjuelo

Límite con la localidad 6, Tunjuelito Límite con la localidad 8, Kennedy

Occidente

Avenida Villavicencio (AC 61 Sur) Límite con la UPZ 69, Ismael Perdomo

(41)

35

Extensión: Su extensión total está dividida como se muestra en la Tabla 5.1.2.,

mostrando que la mayor parte de la unidad se encuentra urbanizada y no cuenta con

áreas protegidas.

Tabla 5.1. 2 Extensión UPZ 65 Arborizadora

Área Total 326,97 hectáreas

Área Urbanizada 275,12 hectáreas

Área sin Urbanizar 51,85 hectáreas

Áreas Protegidas 0 hectáreas

Sectores catastrales y centralidades: La UPZ 65 Arborizadora está conformada

por 10 sectores catastrales, Guadalupe, Rafael Escamilla, Madalena, El Ensueño,

Atlanta, La Coruña, Verona, Arborizadora Baja, El Chircal Sur y Ronda,

distribuidos como se presenta en la Figura 5.1.1.

(42)

36

La UPZ Arborizadora hace parte de la Centralidad Delicias – Ensueño, del eje de

integración Sur, que permite buenas condiciones para comercializar diversos bienes y

servicios de la región (Secretaría Distrital de Planeación, 2009) promoviendo el

desarrollo de suelo urbano al hacerlo adecuado para actividades productivas y servicios

complementarios a diferentes escalas (Secretaría general de la Alcaldía Mayor de

Bogotá, 2005).

Sistema de Equipamientos: La UPZ cuenta con equipamientos de escala urbana1, zonal2 y vecinal3, entre los más destacados están los destinados a educación, salud y bienestar y en menor cantidad se encuentran los destinados a culto como las iglesias

y templos, a cultura como salones comunales y a la prestación de otros servicios

como el Centro de Atención Distrital Especializado CADE (Alcaldía Mayor de

Bogotá D.C - SDP, 2008).

Vías de acceso: Los ejes de la malla vial arterial para comunicar, acceder y permitir

la movilidad a través de la UPZ están conformados por las vías presentadas en la

Tabla 5.1.3.

Tabla 5.1. 3 Vías malla arterial UPZ 65 Arborizadora

1 Equipamientos de escala urbana, son los que atienden a un área importante de la ciudad 2

Equipamientos de escala zonal, son los que atienden a un conjunto de barrios 3

Equipamientos de escala vecinal, son los que atienden un solo barrio (Alcaldía Mayor de Bogotá D.C - SDP, 2008)

Vía Sentido de Comunicación

Avenida Ferrocarril del sur Oriente - Occidente Avenida (autopista) Sur Oriente - Occidente Avenida Ciudad de Villavicencio Norte - Sur

(43)

37

Usos del suelo: La UPZ 65 Arborizadora está reglamentada por el Decreto 241 de

2005 estableciendo los usos del suelo como se muestra en la Tabla 5.1.4 (Secretaría

general de la Alcaldía Mayor de Bogotá, 2005):

Tabla 5.1. 4 Usos del Suelo UPZ 65 Arborizadora

Uso Barrios

Vivienda La Coruña y Ronda

Vivienda con algunas zonas de comercio Madelena, Isla del Sol, La Coruña y El Chircal Sur Vivienda con locales comerciales Arborizadora Baja y Verona

Grandes almacenes y supermercados Guadalupe

Industria Guadalupe y Rafael Escamilla Zona para usos mixtos (vivienda, comercio,

equipamientos) Atlanta y El Ensueño

Densificación y estratificación: Referente a densificación, la UPZ 65 Arborizadora

tenía una población de 61850 habitantes para el año 2011 según las proyecciones de

población del DANE y una densidad urbana de 202 habitantes por hectárea.

En la UPZ están localizados predios pertenecientes a los estratos socioeconómicos 2

(bajo) y 3 (medio-bajo) (Secretaria Distrital de Planeación, 2011) con una

distribución de la población como se presenta en la Tabla 5.1.5.

Tabla 5.1. 5 Distribución de la población por estrato en la UPZ 65 Arborizadora

5.2. UPZ 73 Garcés Navas

Ubicación: La UPZ 73 Garcés Navas está localizada al occidente de la localidad 10,

Engativá, en la Ciudad de Bogotá, con un área total de 557.43 hectáreas (Alcaldía

Estrato Cantidad de

Habitantes (%) Cantidad de Hogares

Cantidad de Hogares (%)

Estrato 2 (Bajo) 68.7 12234 68.7

(44)

38

Mayor de Bogotá D.C - SDP, 2007) comprendidas entre los límites especificados en

la Tabla 5.2.1.

Tabla 5.2. 1 Límites UPZ 73 Garcés Navas

Norte Avenida Medellín (AC 80)

Límite con la UPZ Bolivia

Sur Calle 66ª y el Humedal Jaboque

Límite con la UPZ Álamos

Oriente Avenida Longitudinal de Occidente

Límite con la UPZ Boyacá Real

Occidente Río Bogotá, Límite del Distrito Capital

Extensión: Su extensión total está dividida como se muestra en la Tabla 5.2.2,

mostrando que la mayor parte de la unidad se encuentra urbanizada y no cuenta con

áreas protegidas.

Tabla 5.2. 2 Extensión UPZ 73 Garcés Navas

Área Total 557,43 hectáreas

Área Urbanizada 382,05 hectáreas

Área sin Urbanizar 118,03 hectáreas

Sectores y Centralidades: La UPZ 73 Garcés Navas está conformada por 23

sectores catastrales: El Gaco, Molinos de Viento, Los ángeles, Álamos, Villas de

Alcalá, El Cedro, Gran Granada, Bolivia, Villas de Granada I, Villas de Granada,

San Antonio, La Riviera, Garcés Navas, Garcés Navas Oriental, Garcés Navas Sur,

Villa Amalia, Florida Blanca, Villa Sagrario, Villa del Mar, El Dorado Industrial, El

Madrigal, Engativá el Dorado, Santa Mónica y Álamos Norte, distribuidos como se

(45)

39

Figura 5.2. 1 División por Sectores UPZ 73 Garcés Navas

La UPZ Garcés navas se beneficia por contener la centralidad4 Álamos, localizada en la intersección de la Avenida Chile y la Avenida Longitudinal de Occidente (ALO), que

permite actividades comerciales y favorece la integración a la ciudad, por otra parte se

localiza cerca a otras dos, la Centralidad de Quirigua – Bolivia, también con una vocación

comercial, pero enfocada a integrar la ciudad con la región y la Centralidad de Fontibón –

Aeropuerto el Dorado – Engativá en donde se encuentran usos comerciales y equipamientos

como el Aeropuerto el Dorado, que permite la integración del país con el mundo (Alcaldía

Mayor de Bogotá D.C - SDP, 2007).

Sistema de Equipamientos : La UPZ cuenta con equipamientos de escala zonal,

vecinal y algunos a escala urbana, entre los más destacados están los destinados a

4

(46)

40

educación, salud y bienestar entre los que se encuentran el Jardín infantil y Colegio

Fe y Alegría y la estación de bomberos y en menor cantidad se encuentran los

destinados a culto como las iglesias y templos, entre los que se encuentra la

Parroquia San Francisco de Borja en el Barrio Villas de Granada y a cultura como

salones comunales (Alcaldía Mayor de Bogotá D.C - SDP, 2007).

Vías de Acceso: Los ejes de la malla vial arterial para comunicar, acceder y

permitir la movilidad a través de la UPZ están conformados por las vías presentadas

en la Tabla 5.2.3.

Tabla 5.2. 3 Vías Malla Arterial UPZ 73 Garcés Navas

Usos del suelo: La UPZ 65 Garcés Navas está reglamentada por el Decreto 073 de

2006 (Secretaría General de la Alcaldía Mayor de Bogotá D.C, 2006) estableciendo

los usos del suelo como se muestra en la Tabla 5.2.4.

Tabla 5.2. 4 Usos del Suelo UPZ 73 Garcés Navas

Uso Barrios

Vivienda

El Gaco, Engativá El Dorado, El Dorado Industrial, Gran Granada, Villas de Alcalá, Urbanización San Basilio, Los Ángeles y Los Álamos

Vivienda con algunas zonas de comercio

Gran Granada, Villas de Granada, Molinos de Viento, Garcés Navas Oriental, El Madrigal, Plazuelas del Virrey, El Pedregal, Los Álamos

Vivienda con locales comerciales Barrios Garcés Navas, La perla, Villa Amalia, Bosques de Mariana, Villas del Dorado

Comercial Zonal de gran actividad El Dorado Industrial Zona para usos mixtos (vivienda,

comercio, equipamientos) Villas de Alcalá y Urbanización Esparta

Vía Sentido de Comunicación

Avenida Longitudinal de Occidente Borde Oriental de la UPZ Avenida Bolivia (Carrera 104) Oriente – Occidente

Avenida Chile (Calle72) Oriente – Occidente Avenida Medellín (Calle 80) Oriente – Occidente Avenida Gonzalo Ariza (Carrera 110) Norte – Sur

(47)

41

Densificación y estratificación: Referente a densificación, la UPZ 73 Garcés

Navas tenía una población de 156478 habitantes para el año 2011 según las

proyecciones de población del DANE y una densidad urbana de 282 habitantes por

hectárea.

En la UPZ están localizados predios pertenecientes a los estratos socioeconómicos 1

(bajo-bajo), 2 (bajo) y 3 (medio-bajo) (Secretaria Distrital de Planeación, 2011) con

una distribución de la población como se presenta en la Tabla 5.2.5.

Tabla 5.2. 5 Distribución de la población por estrato en la UPZ 73 Garcés Navas

5.3. UPZ 79 Calandaima

La UPZ 79 Calandaima, se distingue por las características que se presentan a continuación:  Localización: La UPZ 79 Calandaima está localizada al centro occidente

(Secretaría distrital de planeación, 2009) de la localidad 8 de Kennedy en la Ciudad

de Bogotá, con un área de 319 hectáreas, comprendidas entre los límites

especificados en la Tabla.5.3.1 (García,W, 2013).

Tabla 5.3. 1 Límites UPZ 79 Calandaima

Norte Avenida las Américas

Limita con la UPZ Tintal Norte

Sur Avenida las Américas (AC 6) y Avenida de los Muiscas (Cl 38 sur)

Limita con la UPZ Patio Bonito

Oriente Avenida Ciudad de Cali y avenida El Tintal

Limita con las UPZ Castilla y Patio Bonito

Occidente Río Bogotá

Limita con el municipio de Mosquera

Estrato Cantidad de

Habitantes (%) Cantidad de Hogares

Cantidad de Hogares (%)

Estrato 2 (Bajo) 16.6 6,515 22

(48)

42

Extensión: La UPZ Calandaima tiene una extensión de 319 hectáreas que

representan un 8.3% del total de la localidad de Kennedy (García,W, 2013).

Sectores Catastrales y Centralidades: La UPZ 79 Calandaima contiene los barrios

Tintalá, Osorio II, Galán, Galán Rural y Calandaima distribuidos como se muestra

en la Figura 5.3.1, estos sectores están en una etapa de desarrollo mediante la

construcción en PH, que para el año 2012 tuvo un notable incremento del 81.63%

desde el año 2002 (García,W, 2013).

Vías de acceso: Los ejes de la malla vial arterial para comunicar, acceder y permitir

la movilidad a través de la UPZ están conformados por las vías: Avenida Ciudad de

Cali (AK 86), Avenida Tintal (AK 89), Avenida Longitudinal de Occidente (AK

96), Avenida Castilla (AC 8) y Avenida de las Américas (AC 6) (Secretaría distrital

de planeación, 2009).

(49)

43

Usos del Suelo: Debido a que en la actualidad la UPZ Calandaima está en etapa de

desarrollo, no cuenta con un decreto que la reglamente, en parte se rige por el

Acuerdo 06 de 1990 con Tratamiento Especial de Incorporación al Sector Tintal

Central y el Área Suburbana de Expansión mediante el Decreto 012 de 1993

considerando como uso de suelo (Alcaldia Mayor de Bogota D.C., 1993). Áreas de

Actividad: Múltiple (Desarrollos urbanísticos residenciales, comerciales,

industriales e institucionales).

Densificación y estratificación: Esta UPZ cuenta con población perteneciente al

estrato dos y una gran parte sin estratificar (Secretaria Distrital de Planeación,

2011), como se presenta en la tabla 5.3.2.

Tabla 5.3. 2 Distribución de la población por estrato en la UPZ 79 Calandaima

Estrato Cantidad de Habitantes (%) Cantidad de Hogares

Estrato 2 (Bajo) 96.2 19974

(50)

44

6.

Marco teórico

Este capítulo contiene la información empleada en las diferentes etapas del desarrollo del

proyecto, teoría relacionada con temas de Ingeniería, matemática y tecnología.

6.1 Inteligencia artificial

Para dar una definición de Inteligencia Artificial (IA), en los documentos, se hace

referencia en primer lugar al significado de inteligencia dado por la RAE, en donde se

describe como la facultad de conocer, de entender o comprender; lo que lleva a pensar

desde una primera instancia en que el termino hará alusión al hecho de poseer las facultades

de la inteligencia de una manera artificial. Al tratar este tema diferentes autores dan su

concepto, unos de los más representativos son los de Marvin Minsky, padre de la

inteligencia artificial (Díaz, I, 2014) y el que aporta la Enciclopedia de la Inteligencia

Artificial, por un lado Minski la define como la ciencia de construir máquinas que hagan

cosas que, si las hicieran los humanos requerirían inteligencia (Cazorla,M, Alfonso, M,

Escolano, F, Colomina, O, & Lozano, M, 2003), y por otro, se afirma que es un campo de

la ciencia y la ingeniería que se ocupa de la comprensión, desde el punto de vista

informático, de lo que denomina comúnmente comportamiento inteligente, también se

ocupa de la creación de artefactos que exhiben este comportamiento (Pino,R, Gómez, A, &

de Abajo, N, 2001),de estas concepciones, se puede concluir, a fin de generalizar, que el

centro de la Inteligencia artificial, como ciencia y tecnología es buscar la manera de emular

las capacidades del ser humano, por lo que se han creado sistemas que se encaminan a

(51)

45

Las áreas en las que la IA (Inteligencia Artificial) ha hecho presencia se clasifican, en

general, en las siguientes:

Tratamiento de lenguajes naturales: También conocido por sus siglas en inglés NLP

(Natural Language Processing) (García, A, 2012) consiste en hacer que un sistema sea

inteligente al permitir su interacción con los usuarios en su mismo lenguaje (Pino,R,

Gómez, A, & de Abajo, N, 2001), esta área de la IA engloba todas aquellas aplicaciones

que realizan traducciones entre idiomas, interfaces hombre – máquina que permiten

interrogar una base de datos o dar órdenes a un sistema operativo, haciendo que la

comunicación sea más amigable con el usuario.

Los productos comerciales que realizan tareas relacionadas con el procesamiento de

lenguaje natural se pueden clasificar, de manera general en:

 Sistemas de consulta en lenguaje natural de bases de datos: Sistemas que traducen el

tipo de consultas que se pueden hacer a una base de datos, a la serie de instrucciones

adecuadas en el lenguaje informático de consulta de una base de datos.

 Sistemas de búsqueda, reconocimiento y categorización de textos: Empleados para

seleccionar y filtrar la enorme masa de información que en la actualidad reciben y

tienen en sus bases de datos las empresas.  Sistemas de traducción automáticas

 Programas de edición de textos: Programas que permiten la corrección ortográfica,

gramatical y de estilo de los textos que se escriben en ordenador.

 “Máquinas de escribir” accionadas por la voz: Sistemas que reconocen los textos

(52)

46

cálculo) y van “transcribiendo” en texto “dictado” a su correspondiente

representación escrita.

 Productos de consumo: Productos que permiten un uso más “natural” de

determinados aparatos domésticos o profesionales. Como ejemplo están los

sistemas de programación de videos o teléfonos de coche accionados por la voz.

Razonamiento automático – Sistemas de Expertos: Hacen referencia a los sistemas

diseñados para que las máquinas imiten el comportamiento de los humanos, siendo capaces

de realizar conclusiones lógicas según información presente (Cazorla,M, Alfonso, M,

Escolano, F, Colomina, O, & Lozano, M, 2003).

Aprendizaje automático o de máquina: Son los sistemas que se elaboran mediante modelos que permiten a la máquina “aprender” mediante una base de información

suministrada.

Representación del conocimiento: Dado que el sistema tiene la capacidad de “razonar y de aprender”, la representación del conocimiento abarca el hecho de que esa información

que adquiere o infiere autónomamente pueda ser almacenado y recuperado de forma

eficiente, ya que no es útil almacenar datos si luego los sistemas no pueden acceder a estos

para usarlos, sacar conclusiones y obtener nueva información que no poseían de forma

directa.

Visión artificial y robótica: Son todos los sistemas de la IA que hacen posible el

reconocimiento de objetos y del habla, detección de defectos en piezas por medio de visión,

(53)

47

Uno de los problemas con los que cuentan esta clase de procedimientos es el captar e

interpretar las imágenes del entorno que envuelve a un sistema inteligente y le está enviando cantidades de “píxeles” o elementos de información que son fundamentales para

aprender y predecir acontecimientos.

Los aspectos más estudiados, en general, son de caracteres tipográficos y manuscritos,

interpretación de imágenes, reconocimiento de objetos, visión del color y análisis visual del

movimiento.

Esta área de la visión artificial y la manipulación de objetos, en otras palabras robots

móviles, sistemas para control de brazos, ensamble de piezas, etc. es conocida como

robótica (Pino,R, Gómez, A, & de Abajo, N, 2001).

6.2 Aprendizaje de máquina

La técnica de Inteligencia Artificial hace referencia a la modelización de conductas para su

posterior implementación en computadoras, mediante sistemas se busca hacer que las

máquinas sean capaces de realizar generalizaciones a partir de ejemplos sacados del

entorno, como lo mencionan Daniel y José Luis, (Sontag, E. D & Tesoro, J. L, 1972) en

cierto modo, lo que se desea es obtener máquinas capaces de resolver problemas que requieran de “ingenio: Procesos de decisión complejos en medios potencialmente infinitos

e incontrolables y sentido común: el poder deducir automáticamente y por cuenta propia

una cantidad amplia de consecuencias inmediatas de lo que se dice y los conocimientos que ya posee” (McCarthy, J, 1958). Para lograr esto se utilizan técnicas basadas en redes y

(54)

48

comportamiento del cerebro humano a través de redes neuronales, es así como se establece

que la máquina sea capaz de “aprender” cosas nuevas, adaptarse al medio y generar una

respuesta, condición exigible a cualquier ser dotado de inteligencia (García, A, 2012), como

se muestra en la Figura 6.2.1. Existen cinco pasos generales en el proceso que constituye el

aprendizaje de máquina, distribuidos en dos etapas esenciales.

Figura 6.2. 1 Esquema de la técnica de Aprendizaje de máquina

Etapa 1: Etapa de Aprendizaje (Entrenamiento).

1. El componente humano del proceso aporta la información base5 o conjunto de datos inicial.

2. Los datos son procesados mediante el algoritmo que genera el aprendizaje de la

máquina.

3. Generación de un modelo.

Figure

Figura  1.  1  Procedimiento  para  construir  una  base  de  conocimiento  para  implementar  el  método  de  aprendizaje
Figura 1. 2 Ejemplo de capas de una imagen para el conjunto de datos de entrenamiento y el flujo de  datos en el subsistema
Figura 1. 4 Ejemplo de árbol de decisión para  iniciación  Fuente: (Cardona, A, 2004)
Figura 1. 5 Comportamiento del error (ECM)
+7

Referencias

Documento similar

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi

diabetes, chronic respiratory disease and cancer) targeted in the Global Action Plan on NCDs as well as other noncommunicable conditions of particular concern in the European

Luis Miguel Utrera Navarrete ha presentado la relación de Bienes y Actividades siguientes para la legislatura de 2015-2019, según constan inscritos en el

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

(13) La preservación, el análisis y el almacenamiento de pruebas relativas al genocidio, los crímenes contra la humanidad, los crímenes de guerra y las infracciones penales

Artículo 8. Las solicitudes de reconocimiento presentadas, en las que se aleguen créditos obtenidos en títulos universitarios oficiales de Graduado, para la convalidación de