Desarrollo de un sistema de visión computacional para la identificación de fallas superficiales en pavimento flexible en la ciudad de Trujillo

Texto completo

(1)Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. UNIVERSIDAD NACIONAL DE TRUJILLO. IC AS. FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. ESCUELA PROFESIONAL DE INFORMÁTICA. Desarrollo de un sistema de visión computacional para la identificación de fallas superficiales en pavimento flexible en la ciudad de Trujillo.. TESIS. IO. PARA OPTAR EL TÍTULO PROFESIONAL DE INGENIERO. BI. BL. AUTORES:. ASESOR:. INFORMÁTICO. Chávez Castro, Nataly Solange Reyes Velásquez, Joseph Flamel Mg. Peralta Luján, José Luis TRUJILLO - PERÚ 2019. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(2) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. IC AS. Dedico esta tesis a :. A mi querida madre María, por inculcarme desde pequeña la importancia de los valores y el estudio, por ser un ejemplo de arduo trabajo, por su apoyo constante, su. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. amor incondicional y palabras de confortación ante momentos de flaqueo.. A mi querido padre Andrés, por estar siempre dispuesto a apoyarme ante cualquier obstáculo presentado, por sus sabios consejos y palabras de ánimo. Chávez Castro, Nataly Solange. A mis padres, por todo su apoyo durante el desarrollo del proyecto tesis, por animarme siempre y demostrarme, que con esfuerzo y dedicación todo es posible.. A mi compañera de tesis, Nataly, por toda la paciencia, durante todo este tiempo.. BI. BL. IO. Reyes Velásquez, Joseph Flamel. I. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(3) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. IC AS. Agradecimientos. A Dios, por todas sus bendiciones y por permitirme disfrutar estos logros en compañía de las personas más importantes en mi vida.. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. A mis padres, por darme la oportunidad de formarme profesionalmente, por su apoyo constante y aliento cuando más lo necesité.. A mi estimado docente, Ing. Juan Orlando Salazar Campos, por sus conocimientos impartidos, asesoramiento desinteresado en todo el proceso de la carrera, su gran amabilidad y consejos para nuestro crecimiento profesional.. A mi compañero de tesis, Joseph Flamel Reyes Velásquez, por su amistad, por todo su esfuerzo y empeño puesto en esta investigación, por la confianza y oportunidad de compartir este logro.. A mi Asesor, Ing. José Luis Peralta Lujan por todo el apoyo brindado en el proceso de la investigación y a todos mis docentes del Departamento de Informática, por todos. IO. los conocimientos brindados de manera incondicional y sus críticas constructivas. Finalmente, a mis amigos, que siempre estuvieron presente a lo largo de este ca-. BL. mino.. BI. Chávez Castro, Nataly Solange. II. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(4) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. IC AS. Agradecimientos. A mi maestro, Ing. Juan Orlando Salazar Campos, por su disponibilidad ante cual-. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. quier consulta, por su dedicación y gran amabilidad. Mi eterna gratitud por sus consejos y aportes en la elaboración del presente proyecto de tesis.. A mi Asesor, el Ing. José Luis Peralta Lujan por todo el apoyo brindado y a todos mis profesores del Departamento de Informática, de los cuales recibí una gran cantidad de conocimientos.. IO. A mis familiares, que siempre me alentaron en todo momento.. BI. BL. Reyes Velásquez, Joseph Flamel. III. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(5) BI. BL. IO. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. IC AS. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(6) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Resumen. IC AS. El presente trabajo investigación planteó como objetivo principal, implementar un sistema de visión computacional para identificar fallas superficiales en el pavimento. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. flexible haciendo uso del procesamiento digital de imágenes y fundamentos de inteligencia artificial.. Se diseñó 4 modelos diferentes de redes convolucionales, con un conjunto de datos de 7200 imágenes, siendo 1440 para el conjunto de entrenamiento, 360 para el conjunto de validación y 77 para el test. Se eligió el modelo que presentó los mejores indicadores para el sistema de visión computacional siendo los resultados los siguientes: 98.03 % de eficacia, 95.06 % de sensibilidad y 95.63 % de especificidad. Finalmente, con los resultados obtenidos se pudo demostrar la hipótesis planteada, que un sistema de visión computacional permite identificar las fallas superficiales en el pavimento flexible.. Palabras claves: Visión artificial, red neuronal convolucional, procesamiento digital. BI. BL. IO. de imágenes, visión computacional.. V. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(7) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Abstract. IC AS. The present research work aimed as main objective, to implement a computer vision system to identify surface faults in the flexible pavement using digital image processing and artificial intelligence fundamentals.. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. Four different models of convolutional networks were designed, with a data set of 7200 images, 1440 being for the training set, 360 for the validation set and 77 for the test. The model that presented the best indicators for the computer vision system was chosen, the results being as follows: 98.03 % efficiency, 95.06 % sensitivity and 95.63 % specificity.. Finally, with the results obtained, the hypothesis proposed could be demonstrated, that a computer vision system allows the identification of surface faults in the flexible pavement.. Keywords: Artificial vision, convolutional neural network, digital image processing,. VI. BI. BL. IO. computational vision.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(8) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. IC AS. Índice de figuras. 6. 2.2. Corte transversal de un pavimento flexible . . . . . . . . . . . . . . . . . . . . . .. 8. 2.3. Corte transversal de un pavimento rígido . . . . . . . . . . . . . . . . . . . . . . .. 9. 2.4. Corte transversal de un pavimento articulado . . . . . . . . . . . . . . . . . . . . .. 9. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. 2.1. Diseño de contrastación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2.5. Piel de cocodrilo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.6. Deformación por deficiencia estructural . . . . . . . . . . . . . . . . . . . . . . . 11 2.7. Ahuellamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.8. Reparaciones o parchados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.9. Fisuras longitudinales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.10. Peladura o desprendimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.11. Baches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.12. Fisuras transversales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14. IO. 2.13. Esquema general de visión por computadora. . . . . . . . . . . . . . . . . . . . . . . 16. BL. 2.14. Esquema de un modelo neuronal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21. BI. 2.15. Red neuronal monocapa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.16. Red neuronal multicapa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.17. Representación de una red convolucional . . . . . . . . . . . . . . . . . . . . . . . . 24 2.18. Esquema etapa convolucional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.19. Representación del Zero-padding. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.20. Representación de la función de activación ReLU . . . . . . . . . . . . . . . . . . . . 29 VII Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(9) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.21. Esquema técnica Dropout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.22. Esquema Max pooling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.23. Modelo de red neuronal convolucional profunda . . . . . . . . . . . . . . . . . . . . . 32. IC AS. 2.24. Esquema tasa de aprendizaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.1. Pavimento bueno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. 3.2. Falla piel de cocodrilo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.3. Falla de peladura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.4. Falla de bache . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.5. Fallas de fisuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.6. Diagrama general del diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.7. Brazo Metálico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.8. Nivel de burbuja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.9. Arquitectura del sistema de visión computacional: Hardware . . . . . . . . . . . . . . . 42 3.10. Función binarizar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.11. Esquema de la binarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.12. Diseño general de la red neuronal convolucional . . . . . . . . . . . . . . . . . . . . . 45 3.13. Adquisición de imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48. IO. 3.14. Función binarizar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49. BL. 3.15. Parámetros de la red convolucional . . . . . . . . . . . . . . . . . . . . . . . . . . . 50. BI. 3.16. Función de la red convolucional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.17. Función de la red convolucional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.18. Función de la red convolucional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.1. Desempeño del entrenamiento 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.2. Matriz de confusión diseño 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57. VIII Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(10) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 4.3. Porcentaje de eficacia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.4. Desempeño del entrenamiento 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.5. Matriz de confusión diseño 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60. IC AS. 4.6. Desempeño del entrenamiento 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.7. Matriz de confusión diseño 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. 4.8. Desempeño del entrenamiento 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 4.9. Matriz de confusión diseño 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 A.1. Hoja de observación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 A.2. Hoja de observación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 A.3. Hoja de observación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 C.1. Pantalla de inicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 C.2. Imagen seleccionada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 C.3. Pre-procesamiento de la imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 C.4. Resultados de la identificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 C.5. Resultados de la identificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 C.6. Resultados de la identificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86. IO. C.7. Resultados de la identificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86. BI. BL. C.8. Resultados de la identificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87. IX Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(11) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. IC AS. Índice de tablas. 7. 2.2. Métodos, Instrumentos y Procedimientos de análisis de datos . . . . . . . . . . . .. 7. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. 2.1. Indicadores, Técnicas y procedimiento de recolección de datos . . . . . . . . . . .. 2.3. Niveles de visión y procesos del PDI . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.1. Requerimientos funcionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.2. Requerimientos no funcionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.3. Entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.1. Porcentaje de indicadores Modelo 1 . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.2. Porcentaje de indicadores modelo 2 . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.3. Porcentaje de indicadores modelo 3 . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.4. Porcentaje de indicadores modelo 4 . . . . . . . . . . . . . . . . . . . . . . . . . 67 4.5. Discusión de resultados eficacia-fórmula(4,1) . . . . . . . . . . . . . . . . . . . . 68. IO. 4.6. Discusión de resultados sensibilidad-fórmula(4,2) . . . . . . . . . . . . . . . . . . 69. BI. BL. 4.7. Discusión de resultados especificidad-fórmula(4,3) . . . . . . . . . . . . . . . . . 69. X Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(12) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. Dedicatoria. IC AS. Índice general. I. Agradecimientos. II. Agradecimientos. III. Resumen Abstract. Índice de Figuras Índice de Tablas 1. Introducción. IO. 1.1. Justificación de la investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . .. BL. 1.2. Formulación del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. V. VI. IX. X. 1 3 3 3. 1.4. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. 1.4.1. Generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. 1.4.2. Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. 1.5. Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. BI. 1.3. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. Materiales y métodos. 5 XI. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(13) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1. Población y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Población. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 2.1.2. Muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 2.2. Técnicas e instrumentos de recolección de datos . . . . . . . . . . . . . . . . . . .. 6. 2.2.1. Técnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.2.2. Instrumento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. IC AS. 2.1.1.. 5. 2.3. Análisis e Interpretación de Resultados . . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.3.1. Diseño de Contrastación . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.4.. Indicadores, Técnicas y procedimiento de recolección de datos . . . . . . . . . . .. 7. 2.5.. Métodos, Instrumentos y Procedimientos de análisis de datos . . . . . . . . . . . .. 7. 2.6. Marco teórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. 2.6.1. Pavimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. Clasificación de los Pavimentos . . . . . . . . . . . . . . . . . .. 8. 2.6.1.2.. Clasificación de fallas del pavimento flexible . . . . . . . . . . .. 9. 2.6.1.3.. Fallas estructurales . . . . . . . . . . . . . . . . . . . . . . . . 10. 2.6.1.4.. Fallas superficiales . . . . . . . . . . . . . . . . . . . . . . . . . 13. 2.6.1.5.. Evaluación de pavimentos . . . . . . . . . . . . . . . . . . . . . 14. 2.6.1.6.. Evaluación estructural . . . . . . . . . . . . . . . . . . . . . . . 14. IO. 2.6.1.1.. BL. 2.6.1.7.. Evaluación superficial . . . . . . . . . . . . . . . . . . . . . . . 15. BI. 2.6.2. Procesamiento digital de imágenes . . . . . . . . . . . . . . . . . . . . . . 15 2.6.2.1.. Imagen digital . . . . . . . . . . . . . . . . . . . . . . . . . . . 15. 2.6.2.2.. El procesamiento digital de imágenes (PDI) . . . . . . . . . . . 15. 2.6.2.3.. Visión computacional . . . . . . . . . . . . . . . . . . . . . . . 16. 2.6.2.4.. Técnicas del procesamiento digital de imágenes . . . . . . . . . 16. 2.6.2.5.. Técnica de pre-procesamiento . . . . . . . . . . . . . . . . . . . 18. XII Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(14) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.6.2.5.1.. Binarización . . . . . . . . . . . . . . . . . . . . . . . 18. 2.6.3. Redes neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Ventajas de las redes neuronales . . . . . . . . . . . . . . . . . . 19. 2.6.3.2.. Modelo neuronal . . . . . . . . . . . . . . . . . . . . . . . . . . 20. 2.6.3.3.. Arquitecturas neuronales . . . . . . . . . . . . . . . . . . . . . 21. 2.6.3.4.. Según el tipo de conexión . . . . . . . . . . . . . . . . . . . . . 22. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. IC AS. 2.6.3.1.. 2.6.3.5.. Clasificación de las redes neuronales artificiales . . . . . . . . . 23. 2.6.4. Redes neuronales convolucionales . . . . . . . . . . . . . . . . . . . . . . 24 2.6.4.1.. Capa convolucional . . . . . . . . . . . . . . . . . . . . . . . . 25. 2.6.4.2.. Etapa convolucional . . . . . . . . . . . . . . . . . . . . . . . . 25. 2.6.4.3.. Función de activación ReLU . . . . . . . . . . . . . . . . . . . 28. 2.6.4.4.. Técnica dropout . . . . . . . . . . . . . . . . . . . . . . . . . . 29. 2.6.4.5.. Pooling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30. 2.6.4.6.. Capa totalmente conectada . . . . . . . . . . . . . . . . . . . . 31. 2.6.5. Entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Tasa de aprendizaje . . . . . . . . . . . . . . . . . . . . . . . . 34. 2.6.5.2.. Optimizador ADAM (derv. Estimación del momento adaptativo). 2.6.5.3.. Función softmax . . . . . . . . . . . . . . . . . . . . . . . . . . 36. IO. 2.6.5.1.. 37. BL. 3. Metodología para el sistema de detección de fallas en la superficie asfáltica. 35. BI. 3.1. Análisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.1.1. Requerimientos funcionales . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.1.2. Requerimientos no funcionales . . . . . . . . . . . . . . . . . . . . . . . . 38 3.1.3. Conjunto de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.1.3.1.. Pavimento bueno . . . . . . . . . . . . . . . . . . . . . . . . . 38. 3.1.3.2.. Falla piel de cocodrilo . . . . . . . . . . . . . . . . . . . . . . . 38 XIII. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(15) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 3.1.3.3.. Falla de peladura . . . . . . . . . . . . . . . . . . . . . . . . . . 39. 3.1.3.4.. Falla de bache . . . . . . . . . . . . . . . . . . . . . . . . . . . 39. 3.1.3.5.. Falla de fisura . . . . . . . . . . . . . . . . . . . . . . . . . . . 39. IC AS. 3.2. Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.2.1. Diagrama general del diseño . . . . . . . . . . . . . . . . . . . . . . . . . 40. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. 3.2.2. Arquitectura del sistema de visión computacional . . . . . . . . . . . . . . 41 3.2.3. Adquisición de Imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.2.4. Pre-procesamiento de Imágenes . . . . . . . . . . . . . . . . . . . . . . . 42 3.2.4.1.. Módulo de binarización . . . . . . . . . . . . . . . . . . . . . . 43. 3.2.4.2.. Aplicación de la binarización . . . . . . . . . . . . . . . . . . . 44. 3.2.5. Toma de decisión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.2.5.1.. Diseño general de la red neuronal convolucional . . . . . . . . . 45. 3.2.5.2.. Diseño 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45. 3.2.5.3.. Diseño 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45. 3.2.5.4.. Diseño 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46. 3.2.5.5.. Diseño 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46. 3.2.6. Entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46. IO. 3.3. Implementación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48. BL. 3.3.1. Módulo de adquisición de imágenes . . . . . . . . . . . . . . . . . . . . . 48 3.3.2. Módulo de pre-procesamiento . . . . . . . . . . . . . . . . . . . . . . . . 48. BI. 3.3.3. Módulo de parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.3.4. Módulo generador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.3.5. Módulo de red convolucional . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.3.5.1.. Módulo de clasificación . . . . . . . . . . . . . . . . . . . . . . 52. 4. Resultados de la tesis. 54 XIV. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(16) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 4.1. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.1.1. Diseño 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Desempeño Diseño 1 . . . . . . . . . . . . . . . . . . . . . . . 56. 4.1.1.2.. Matriz de confusión . . . . . . . . . . . . . . . . . . . . . . . . 57. 4.1.1.3.. Porcentaje de indicadores . . . . . . . . . . . . . . . . . . . . . 58. 4.1.1.4.. Gráfico de porcentaje de Indicadores . . . . . . . . . . . . . . . 58. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. IC AS. 4.1.1.1.. 4.1.2. Diseño 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.1.3. Desempeño Diseño 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.1.3.1.. Matriz de confusión . . . . . . . . . . . . . . . . . . . . . . . . 60. 4.1.3.2.. Porcentaje de indicadores . . . . . . . . . . . . . . . . . . . . . 61. 4.1.3.3.. Gráfico porcentaje de indicadores . . . . . . . . . . . . . . . . . 61. 4.1.4. Diseño 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.1.5. Desempeño diseño 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.1.5.1.. Matriz de confusión . . . . . . . . . . . . . . . . . . . . . . . . 63. 4.1.5.2.. Porcentaje de indicadores . . . . . . . . . . . . . . . . . . . . . 64. 4.1.5.3.. Gráfico porcentaje de indicadores . . . . . . . . . . . . . . . . . 64. 4.1.6. Diseño 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65. IO. 4.1.7. Desempeño diseño 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65. BI. BL. 4.1.7.1.. Matriz de confusión . . . . . . . . . . . . . . . . . . . . . . . . 66. 4.1.7.2.. Porcentaje de indicadores . . . . . . . . . . . . . . . . . . . . . 67. 4.1.7.3.. Gráfico porcentaje de indicadores . . . . . . . . . . . . . . . . . 67. 4.2. Discusión de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.2.1. Eficacia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.2.2. Sensibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.2.3. Especificidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69. XV Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(17) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 5. Consideraciones finales. 71. 5.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71. IC AS. 5.2. Trabajos futuros y recomendaciones . . . . . . . . . . . . . . . . . . . . . . . . . 72 Referencias bibliográfícas. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. A. Anexo I: Guías de observación. 73 76 79. C. Anexo III: Interfaces del Sistema de visión computacional. 83. BI. BL. IO. B. Anexo II: Validación de instrumentos por expertos. XVI Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(18) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. IC AS. Capítulo 1. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. Introducción. Según Porras et al. (2012) la carretera es un recurso de gran importancia para el bienestar social ya que el pavimento en mal estado se traduce en un aumento en tiempo de traslado y una disminución en la comodidad y seguridad para el conductor y el pasajero. Un indicador importante del mal estado del pavimento es la aparición de fallas en la superficie. Es por esta razón que, Zevallos Gamarra (2018) manifiesta que para identificar qué técnicas de mantenimiento y reparación son las adecuadas para mejorar la serviciabilidad del pavimento, es necesario evaluar la vía y conocer el estado real en que se encuentra con el fin de ahorrar tiempo y dinero.. En la actualidad, el Manual de carreteras conservación vial (2013) presenta un guía para la identificación de fallas en el pavimento flexible, donde se indica que es realizada mediante forma-. IO. tos de inspección que organizan los datos e información de forma ordenada y coherente; toman. BL. fotografías que guardan relación directa con lo colocado en los documentos; una regla o mira para. BI. medir y poder identificar la escala en cada fotografía que permitan corroborar la información. Sin embargo, este proceso de evaluación presenta los factores que descalifican el método como, que es un trabajo tedioso y lento; es subjetivo, teniendo la probabilidad alta de error; presenta peligro para los inspectores; y tiene un costo elevado por Kilómetro. Actualmente, en el mundo existen sistemas automáticos para la evaluación vial que utilizan diversos equipos para asegurar la confiabilidad y eficiencia, estos equipos miden la localización 1 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(19) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. (ej. GPS), rugosidad (ej. perfiles de precisión láser y manual), propiedades mecánicas del pavimento (ej. deflectómetro de impacto, penetrómetro dinámico de cono, viga Benkelman), deterioro superficial (ej. cámaras fotográficas de línea y de láser), y otras características importantes de la. IC AS. infraestructura vial (Bennett et al., 2006).. Mientras que, la tecnología existente en nuestro país para la identificación de fallas en el pavi-. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. mento flexible es mínimo o casi nula. Hoy en día, la evaluación se rige en el Manual de Carreteras de Conservación Vial del MTC (Ministerio de Transporte y Carreteras) basado en el AASHTO (Association of State Highway and Transportation Officials) u en otros casos usando la técnica de PCI (Pavement Condition Index) que es un procedimiento que consiste en la determinación de la condición del pavimento a través de inspecciones visuales. En otros casos haciendo uso de tecnologías muy costosas como el uso de rugosímetro tipo láser, deflectómetro y otros. Se propone un sistema de visión computacional para identificar los diferentes tipos de fallas. BI. BL. IO. superficiales en el pavimento flexible.. 2 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(20) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1.. Justificación de la investigación. La presente investigación se justifica por la necesidad de identificar diferentes tipos de fallas. IC AS. en la superficie del pavimento flexible para poder orientar en la selección de las técnicas para su reparación con el fin de tratar prever accidentes.. Asimismo, se diseñó un nuevo método automático para la identificación de fallas en pavimento. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. flexible con el propósito de reemplazar los métodos tradicionales de inspección vial. Finalmente, este estudio servirá como base para el mantenimiento vial, así como generar antecedentes que permitan continuar con este rubro de la visión computacional y redes neuronales convolucionales.. 1.2.. Formulación del problema. ¿Cómo identificar las fallas superficiales en pavimento flexible en la ciudad de Trujillo?. 1.3.. Hipótesis. Un sistema de visión computacional permite identificar las fallas superficiales en el pavimento flexible.. Objetivos. 1.4.1.. Generales. BL. IO. 1.4.. BI. Desarrollar un sistema de visión computacional que permita la identificación de fallas superficiales en el pavimento flexible.. 3 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(21) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4.2.. Específicos. a) Comprender el proceso de recolección de datos para la identificación de fallas superficiales. IC AS. en el pavimento flexible.. b) Diseñar un sistema de visión computacional basado en los procesos del procesamiento digital. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. de imágenes para identificar las fallas superficiales en el pavimento flexible.. c) Implementar un sistema de visión computacional para identificar fallas superficiales en el pavimento flexible.. d) Analizar los resultados obtenidos por el sistema de visión computacional en la identificación de fallas superficiales en pavimento flexible.. 1.5.. Estructura de la tesis. El trabajo está dividido en cinco capítulos. El primer capítulo presenta los aspectos generales de la investigación realizada tales como justificación, formulación del problema, hipótesis y objetivos. El capítulo dos describe los materiales y las técnicas de recolección de datos, se presenta el referencial teórico, como conceptos de inteligencia artificial, visión artificial, aprendizaje automático. IO. basado en redes neuronales convolucionales.. BL. En el tercer capítulo es el desarrollo de la tesis, se realiza el análisis, diseño, implementación y. BI. las pruebas. Se presentan los resultados obtenidos en la investigación y la discusión de ellos. En el capítulo cuatro se presentan las consideraciones finales obtenidas en esta tesis. Conclusiones y los trabajos futuros relacionados al tema investigado. Finalmente, las referencias bibliográficas usadas para la investigación en esta tesis y los anexos.. 4 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(22) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. IC AS. Capítulo 2. 2.1.. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. Materiales y métodos Población y muestra. 2.1.1.. Población. La población para esta investigación es infinita, compuesta por imágenes de pavimento flexible en la ciudad de Trujillo, con dimensiones de 1200x1200 píxeles.. 2.1.2.. Muestra. El tamaño de la muestra para una población infinita se obtiene a través de la siguiente fórmula: n=. (2.1). IO. Dónde:. Z2 × p × q e2. BL. n: tamaño muestral.. BI. z: valor correspondiente a la distribución de gauss, zα= 0.05 = 1.96. p: prevalencia esperada del parámetro a evaluar, en caso de desconocerse (p =0.5), que hace mayor el tamaño muestral. q: 1 – p (si p = 50 %, q = 50 %). e: error que se prevé cometer si es del 5 %, e = 0.05.. 5 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(23) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Por lo tanto, el tamaño de la muestra es de: n = 384.16 = 385 imágenes.. Técnicas e instrumentos de recolección de datos. 2.2.1.. Técnica. IC AS. 2.2.. 2.2.2.. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. Observación.. Instrumento. Guías de observación.. 2.3.. Análisis e Interpretación de Resultados. 2.3.1.. Diseño de Contrastación. Diseño de contrastación post test. Diseño con un solo grupo.. Figura 2.1: Diseño de contrastación Fuente: Elaboración propia.. IO. Dónde:. BL. GE: Grupo experimental.. BI. O1: Imágenes del pavimento flexible. X: Sistema de visión computacional.. 6 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(24) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.4.. Indicadores, Técnicas y procedimiento de recolección de datos Tabla 2.1: Indicadores, Técnicas y procedimiento de recolección de datos. Técnicas. Porcentaje de eficacia. Porcentaje de sensibilidad. Porcentaje de especificidad.. Observación. Procedimiento de recolección de datos Guía de observación. Observación. Guía de observación. Observación. Guía de observación. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. IC AS. Indicadores. Fuente: Elaboración propia.. 2.5.. Métodos, Instrumentos y Procedimientos de análisis de datos Tabla 2.2: Métodos, Instrumentos y Procedimientos de análisis de datos. Variable Variable Dependiente. Indicadores Porcentaje eficacia. Variable Independiente. Porcentaje sensibilidad. Especificidad=VN/(VN+FP) Dónde: VP: Verdaderos Negativos FN: Falsos Positivos.. Fuente: Elaboración propia.. Marco teórico. BI. 2.6.. BL. IO. Porcentaje especificidad. Método de Procesamiento de análisis de datos Eficacia= (VP+VN)/T Dónde: VP: Verdadero Positivo VN: Verdadero Negativo T: Resultado correcto de la evaluación de una muestra. Sensibilidad=VP/(VP+FN) Dónde: VP: Verdaderos Positivos FN: Falsos Negativos.. 2.6.1.. Pavimento. Según Monteja Fonseca (2002) un pavimento está constituido por un conjunto de capas superpuestas, relativamente horizontales, que se diseñan y construyen técnicamente con materiales apropiados y adecuadamente compactados. 7 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(25) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.6.1.1.. Clasificación de los Pavimentos. 1. Pavimentos flexibles Se denomina Pavimento flexible por ser una estructura que se deflecta o flexiona depen-. IC AS. diendo de las cargas que transitan sobre él. Medina and De la Cruz (2015) en la Figura 2.2, nos muestra el pavimento flexible está conformado por una carpeta asfáltica en la superficie. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. de rodamiento, debajo de la carpeta, se encuentran la base granular y la capa de sub-base, destinadas a distribuir y transmitir las cargas originadas por el tránsito. Al final está la subrasante sirviendo de soporte a las capas antes mencionada.. Figura 2.2: Corte transversal de un pavimento flexible Fuente: Medina and De la Cruz (2015). Según Medina and De la Cruz (2015) el pavimento flexible resulta más económico en su construcción inicial, tiene un período de vida de entre 10 y 15 años, pero tiene la desventaja de requerir mantenimiento periódico para cumplir con su vida útil. 2. Pavimentos rígidos. IO. Para Medina and De la Cruz (2015) el pavimento rígido o pavimento hidráulico, se pue-. BL. de observar en la Figura 2.3 que se compone de losas de concreto hidráulico que algunas. BI. veces presentan acero de refuerzo. Esta losa va sobre la base (o sub-base) y ésta sobre la sub-rasante. El pavimento rígido según Medina and De la Cruz (2015) tiene un costo inicial más elevado que el pavimento flexible y su período de vida varía entre 20 y 40 años. El mantenimiento que requiere es mínimo y se orienta generalmente al tratamiento de juntas de las losas. 8 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(26) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. IC AS. Figura 2.3: Corte transversal de un pavimento rígido Fuente: Medina and De la Cruz (2015). 3. Pavimentos articulados. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. Medina and De la Cruz (2015) en la Figura 2.4 se observa que, el pavimento articulado se encuentra conformada por bloques de concreto prefabricados(adoquines), iguales entre sí y de un espesor uniforme; y que se colocan sobre una capa delgada de arena, la cual se encuentra sobre una capa granular o la sub-rasante.. Según Medina and De la Cruz (2015) tienen alta durabilidad y su vida útil puede superar los 40 años. Además, el mantenimiento es mínimo debido a su mayor durabilidad y facilidad de reparación comparado con los otros pavimentos.. Figura 2.4: Corte transversal de un pavimento articulado Fuente: Medina and De la Cruz (2015). Clasificación de fallas del pavimento flexible. IO. 2.6.1.2.. BL. Según el Manual de carreteras conservación vial (2013), las fallas de los pavimentos flexibles. BI. pueden clasificarse en dos grandes categorías: fallas estructurales y fallas superficiales. Las fallas de la primera categoría se asocian generalmente con obras de rehabilitación de costo alto. Las fallas de la segunda categoría se relacionan generalmente con obras de mantenimiento periódico.. 9 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(27) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.6.1.3.. Fallas estructurales. El Manual de carreteras conservación vial (2013) indica que los deterioros estructurales caracterizan un estado estructural del pavimento, concerniente al conjunto o de las diferentes capas de. IC AS. este o bien solamente a la capa de superficie. Las fallas no aparecen de inmediato, sino al cabo de la repetición de cargas definida por la curva de fatiga de cada material.. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. a) Piel de Cocodrilo:. Según el Manual de carreteras conservación vial (2013) está constituida por fisuras que forman polígonos irregulares de ángulos agudos, como se observa en la Figura 2.5. El tamaño de la malla disminuye luego bajo el efecto de las condiciones climáticas y del tráfico. Además, las fisuras se abren y se observan perdidas de material en sus bordes.. BI. BL. IO. Figura 2.5: Piel de cocodrilo Fuente: Manual de carreteras conservación vial (2013). 10 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(28) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. b) Deformación por deficiencia estructural: Según el Manual de carreteras conservación vial (2013) son discontinuas y únicas al inicio, evolucionan rápidamente hacia una fisuración continua y muchas veces ramificada. IC AS. antes de multiplicarse debido al tráfico, hasta convertirse en muy cerradas, como se muestra. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. en la Figura 2.6. Figura 2.6: Deformación por deficiencia estructural Fuente: Manual de carreteras conservación vial (2013). c) Ahuellamiento:. El Manual de carreteras conservación vial (2013) lo define como surcos o huellas que se producen en la superficie de rodadura de una carretera, debiéndose a la consolidación o movimiento lateral de los materiales por efectos del tránsito. En la Figura 2.7 vemos que su gravedad es anotada por la profundidad medida sobre una regla rígida de 1.50 m de longitud. BI. BL. IO. colocada transversalmente en la calzada.. Figura 2.7: Ahuellamiento Fuente: Manual de carreteras conservación vial (2013). 11 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(29) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. d) Reparaciones o parchados: Para el Manual de carreteras conservación vial (2013), las reparaciones están destinadas a mitigar los defectos del pavimento, de manera provisional o definitiva: su número, su ex-. IC AS. tensión y su frecuencia son elementos del diagnóstico. Una reparación reciente enmascara un problema, reparaciones frecuentes lo subrayan. En la Figura 2.8 se muestra un parche. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. recién hecho.. Figura 2.8: Reparaciones o parchados Fuente: Manual de carreteras conservación vial (2013). e) Fisuras longitudinales:. Para el Manual de carreteras conservación vial (2013), las fisuras longitudinales son consecuencia del fenómeno de fatiga de las capas asfálticas sometidas a una repetición de cargas superior a la permisible. En la Figura 2.9 se muestra que, la falla comienza en la parte. BI. BL. IO. inferior de las capas asfálticas y finalmente la fisuración se propaga a la superficie.. Figura 2.9: Fisuras longitudinales Fuente: Manual de carreteras conservación vial (2013). 12 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(30) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.6.1.4.. Fallas superficiales. El Manual de carreteras conservación vial (2013) indica que los deterioros superficiales se originan en general por un defecto de construcción, por un defecto en la calidad de un producto o. IC AS. por una condición local particular que el tráfico acentúa. Además, pueden resultar de la evolución. a) Peladura:. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. de deterioros o fallas estructurales.. El Manual de carreteras conservación vial (2013) denomina peladura a la desintegración superficial de la carpeta asfáltica se puede ver una imagen de ejemplo en la Figura 2.10, debido a la pérdida del ligante bituminoso o del agregado, como se observa en la Figura. Figura 2.10: Peladura o desprendimientos Fuente: Manual de carreteras conservación vial (2013). b) Baches:. IO. Según el Manual de carreteras conservación vial (2013) son consecuencia del desgaste o de la destrucción de la capa de rodadura, así como se muestra en la Figura 2.11. Debido a la. BI. BL. falta de mantenimiento ellos aumentan y se produce en cadena.. Figura 2.11: Baches Fuente: Manual de carreteras conservación vial (2013). 13 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(31) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. c) Fisuras transversales: El Manual de carreteras conservación vial (2013) define las fisuras transversales como fracturas del pavimento, transversales (o casi) al eje de la vía, como se muestra en la Figura. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. IC AS. 2.12.. Figura 2.12: Fisuras transversales Fuente: Manual de carreteras conservación vial (2013). 2.6.1.5.. Evaluación de pavimentos. Según Canturías and Watanabe (2017) la evaluación de pavimentos consiste en un estudio, en el cual se presenta el estado en el que se encuentra la estructura y la superficie del pavimento, para poder adoptar las medidas adecuadas de conservación y mantenimiento, con las cuales se pretende prolongar la vida útil del pavimento, siendo de suma importancia elegir y realizar una evaluación que sea objetiva y acorde al medio en que se encuentre. Evaluación estructural. IO. 2.6.1.6.. BL. Canturías and Watanabe (2017) dividen en dos grupos los métodos de evaluación estructural, los ensayos destructivos y los ensayos no destructivos. Entre los ensayos destructivos más cono-. BI. cidos están las calicatas que nos permiten obtener una visualización de las capas de la estructura expuestas, a través de las paredes de esta y realizar ensayos de densidad “in situ”, permitiendo obtener el estado actual del perfil a través de las propiedades reales de los materiales que lo componen. Mientras que, en los ensayos no destructivos, pueden llevarse a cabo mediante medidas de deflexiones que son una herramienta importante en el análisis no destructivo de los pavimentos.. 14 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(32) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.6.1.7.. Evaluación superficial. Se realiza en una vía con el objeto de determinar los deterioros que afectan al pavimento y al usuario, y conocer el estado en el que se encuentra el mismo. Existen diversos métodos para la. IC AS. evaluación superficial de los pavimentos, que son sencillos de aplicar y no requieren de equipos sofisticados (Canturías and Watanabe, 2017).. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. La inspección visual que se realiza es una de las herramientas más importantes en la aplicación de estos métodos, y forma parte esencial de esta investigación.. Canturías and Watanabe (2017) mencionan que, por lo general la evaluación se realiza en dos etapas, una inicial y otra detallada. La evaluación inicial tiene como fin hacer una inspección general del proyecto, se recorre la vía ya sea a pie o por vehículo para determinar la serviciabilidad que está brindando el pavimento. Mientras que, la evaluación detallada consiste en inspeccionar la vía caminando sobre ella y realizando la recopilación de datos, en donde es necesario describir todo tipo de falla encontrados en función a su clase, severidad y cantidad o densidad.. 2.6.2.. Procesamiento digital de imágenes. 2.6.2.1.. Imagen digital. Según García Santillán (2008) una imagen puede ser definida como una función bidimensional, f(x,y), donde x e y son coordenadas espaciales (plano) y la amplitud f es llamada intensidad o nivel. IO. de gris en ese punto. Cuando x, y e f son todos finitos, cantidades discretas, llamamos a la imagen. BL. digital. Una imagen digital está compuesta por un número finito de elementos, cada uno de los. BI. cuales, con un valor y una posición particular, llamados píxeles. 2.6.2.2.. El procesamiento digital de imágenes (PDI). El procesar las imágenes del mundo real de manera digital por medio de un computador es un tema muy amplio para García Santillán (2008), ya que incluyen estudios de física, matemáticas, ingeniería eléctrica, computación. Asimismo, estudia los fundamentos conceptuales de la. 15 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(33) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. adquisición y despliegue de imágenes y con detalle los fundamentos teóricos y algorítmicos del procesamiento como tal. Además, tiene como objetivo mejorar el aspecto de las imágenes y hacer más evidentes en ellas ciertos detalles que se desean hacer notar. Visión computacional. IC AS. 2.6.2.3.. Para García Santillán (2008), la visión computacional o visión artificial puede ser definida como. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. los procesos de obtención, caracterización e interpretación de información de imágenes tomadas de un mundo tridimensional.. Según la Asociación de Imágenes Automatizadas AIA (2018), la visión artificial abarca todas las aplicaciones industriales y no industriales en las que una combinación de hardware y software brinda un guiado operativo a los dispositivos en la ejecución de sus funciones de acuerdo con la captación y procesamiento de imágenes.. Sucar L. Gomez G. (2018) mediante un esquema general en la Figura 2.13, describe la visión computacional como el estudio de reconocer y localizar objetos en el ambiente mediante el. Figura 2.13: Esquema general de visión por computadora. Fuente: Adaptada de Sucar L. Gomez G. (2018). BI. BL. IO. procesamiento de imágenes, para entenderlos y construir maquinas con capacidades similares.. 2.6.2.4.. Técnicas del procesamiento digital de imágenes. García Santillán (2008) considera tres niveles de procesamiento: visión de bajo, medio y alto nivel, tal como se muestra en la tabla 2.3. 16 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(34) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Tabla 2.3: Niveles de visión y procesos del PDI. Nivel de Visión. 1. Captura/adquisición 2. Pre-procesamiento 3. Segmentación 4. Descripción 5. Reconocimiento 6. Interpretación. Bajo Bajo Medio Medio Medio Alto. Fuente: García Santillán (2008).. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. 1) La captura o adquisición:. IC AS. Procesos del PDI. El primer paso en el proceso es adquirir la imagen digital. Una vez que la imagen digitalizada es obtenida, el siguiente paso consiste en el pre-procesamiento de dicha imagen. 2) El pre-procesamiento:. El objetivo del pre-procesamiento es mejorar la imagen de forma que el objetivo final tenga mayores posibilidades de éxito, incluye técnicas tales como la reducción del ruido, realce del contraste, realce de ciertos detalles, etc. 3) La segmentación:. En la segmentación, su objetivo es dividir la imagen en partes que la constituyen o los objetos que la forman. Una buena segmentación facilitará mucho la solución de un problema; caso contrario la segmentación errónea conducirá al fallo.. IO. 4) La descripción:. BL. La salida del proceso de segmentación es una imagen de datos que, o bien contienen la. BI. frontera de la región o los puntos de ella misma, para ello es necesario convertir estos datos a una forma que sea apropiada para el ordenador, que es lo que definimos como descripción.. 5) El reconocimiento: El reconocimiento se dedica a extraer rasgos que producen alguna información cuantitativa de interés o rasgos que son básicos para diferenciar una clase de objetos de otra.. 17 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(35) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 6) La interpretación: La interpretación lleva a asignar significado al conjunto de objetos reconocidos. 2.6.2.5.. Técnica de pre-procesamiento Binarización. IC AS. 2.6.2.5.1.. Según Sucar L. Gomez G. (2018) la binarización es una operación puntual, la cual consiste en. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. transformar una imagen de entrada a una imagen de salida; de forma que, cada píxel de la imagen de salida solo depende del correspondiente píxel de la imagen de entrada. Para obtener una imagen binaria se hace una transformación, en la cual cada píxel puede tomar uno de dos valores: 0 ó 1, para otro caso 0 ó 255, etc. La decisión de que cada píxel tome un valor depende de la elección de un umbral T.. 1) Binarización por umbral:. La técnica de binarización por umbral, consiste en transformar una imagen, donde cada píxel de la imagen de salida depende del correspondiente píxel de la imagen de entrada. Para obtener la imagen binaria se hace una transformación, estos píxeles toma uno de dos valores 0 ó 255. La decisión de cada píxel depende de la elección del umbral, en este trabajo se consideró un umbral de 110.. IO. 2) Binarazación Global:. El método global del valor umbral se elige un valor umbral para toda la imagen. Este. BL. método es el más fácil de calcular, pero también muy sensible a las pequeñas variaciones. BI. que puedan existir en la luminosidad de la imagen. El método global, por lo tanto, sólo se utiliza para segmentar imágenes con mucho con-. traste. Estas imágenes pueden provenir de documentos mecanografiados o de fotografías realizadas a contraluz.. 18 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(36) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.6.3.. Redes neuronales. Para Getal (2018), las redes neuronales son un conjunto de cálculos simples, usualmente adaptativos, interconectados masivamente en paralelo y con una organización jerárquica que le permite. IC AS. interactuar con algún sistema del mismo modo que lo hace el sistema nervioso biológico.. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. Según Serrano and Martín (2009), las redes neuronales son elementos que están interconectados entre si mediante una serie de conexiones que se conocen como pesos sinápticos. Estos pesos varían con el tiempo mediante un proceso que se conoce como aprendizaje.. Serrano and Martín (2009) definen, el aprendizaje de una red neuronal como el proceso por el cual modifica las conexiones entre neuronas, pesos sinápticos, para realizar una tarea deseada. 2.6.3.1.. Ventajas de las redes neuronales. Todas las siguientes ventajas según Serrano and Martín (2009) hacen el uso de las redes neuronales espacialmente atractivo en un gran número de aplicaciones. 1) Sistemas distribuidos no lineales. Una neurona es un elemento no lineal por lo que una interconexión de ellas (red neuronal) también será un dispositivo no lineal. Esta propiedad permitirá la simulación de sistemas no. IO. lineales y caóticos.. BL. 2) Sistemas tolerantes a fallos. BI. Una red neuronal al ser un sistema distribuido permite el fallo de algunos elementos. individuales sin alterar significativamente la respuesta total del sistema. Este hecho las hace especialmente atractivas frente a las computadoras actuales que, por lo general son sistemas secuenciales de tal forma que un fallo en uno de sus componentes conlleva que el sistema total no funcione.. 19 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(37) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 3) Adaptabilidad Una red neuronal tiene la capacidad de modificar los parámetros de los que depende su. 4) Establecen relaciones no lineales entre datos. IC AS. funcionamiento de acuerdo con los cambios que se produzcan en su entorno de trabajo.. Las redes neuronales son capaces de relacionar dos conjuntos de datos, teniendo como. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. principal ventaja que los datos no tienen porque cumplir las condiciones de linealidad en comparación con los métodos estadísticos clásicos que realizan la misma misión. 2.6.3.2.. Modelo neuronal. En todo modelo artificial de neurona según Serrano and Martín (2009) se tiene cuatro elementos básicos, como se muestra en la Figura 2.14:. 1) Un conjunto de conexiones, pesos o sinapsis que determinan el comportamiento de la neurona. Estas conexiones pueden ser excitadoras.. 2) Un sumador, que se encarga de sumar todas las entradas multiplicadas por las respectivas sinapsis.. 3) Una función de activación no lineal(p), para limitar la amplitud de la salida de la neurona.. BL. Dónde:. IO. 4) Un umbral exterior, que determina el umbral por encima del cual la neurona se activa.. BI. x(1).......x(k): Son las neuronas de entrada. w(n1).....w(nk): Son los pesos de las conexiones. +: Representa la entrada de la sumatoria de pesos de las conexiones por las neuronas de entrada.. 20 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(38) TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. IC AS. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Figura 2.14: Esquema de un modelo neuronal Fuente: Adaptada de Serrano and Martín (2009). Un: Representa la salida de la sumatoria de la sumatoria de pesos de las conexiones por las neuronas de entrada. 2.6.3.3.. Arquitecturas neuronales. Serrano and Martín (2009) las divide según número de capas: 1) Redes neuronales monocapa. Le corresponde a la red neuronal más sencilla ya que se tiene una capa de neuronas que proyectan las entradas a una capa de neuronas de salida donde se realizan diferentes cálculos. La capa de entrada. por no realizar ningún calculo. no se cuenta de ahí el nombre de redes. BI. BL. IO. neuronales con una sola capa. Se muestra un ejemplo en la Figura 2.15. Figura 2.15: Red neuronal monocapa Fuente: Adaptada de Serrano and Martín (2009). 21 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(39) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Dónde: x(1).......x(n): neuronas de entrada.. IC AS. y1, y2 e y3: salidas de la red monocapa 2) Redes neuronales multicapa. Es una generalización de la anterior existiendo un conjunto de capas intermedias entre la. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. entrada y la salida. Este tipo de red puede estar total o parcialmente conectada. Se muestra un ejemplo en la Figura 2.16. BL. Además:. IO. Figura 2.16: Red neuronal multicapa Fuente: Adaptada de Serrano and Martín (2009). BI. x(1).......x(n): Son las neuronas de la capa de entrada. y1 e y2 :Son las salidas de la red multicapa P: función de activación 2.6.3.4.. Según el tipo de conexión. Serrano and Martín (2009) las divide en: 22 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(40) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1) Redes neuronales no recurrente En esta red la propagación de las señales se produce en un sentido solamente no existiendo la posibilidad de realimentaciones.. IC AS. 2) Redes neuronales recurrentes. Esta red viene caracterizada por la existencia de lazos de realimentación. Estos lazos. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. pueden ser entre neuronas de diferentes capas, neuronas de la misma capa o, más sencillamente, entre una misma neurona. Esta estructura recurrente la hace especialmente entre una misma neurona. 2.6.3.5.. Clasificación de las redes neuronales artificiales. 1) Red Neural Dinámico. 2) Red de Hopfield. 3) Perceptrón.. 4) Redes Neuro-Fuzzy.. 5) Red Neuronal Convolucional.. 6) Redes Neuronales Estocásticos.. IO. 7) Red Neuronal Probabilística.. BL. 8) Redes Neuronales Modulares.. BI. 9) Máquina de Turing Neuronal. 10) Red Neuronal de Impulsos. 11) Mapas Autoorganizados de Kohnen. 12) Red Neuronal Asociativa.. 23 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(41) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 13) Redes Patrón Productoras de Composición.. 2.6.4.. Redes neuronales convolucionales. IC AS. Según Torres (2018), están formadas por neuronas que tienen parámetros en forma de sesgos y pesos que se pueden aprender, pero un rasgo diferencial de las CNN es que hacen la suposición explícita de que las entradas son imágenes, cosas que nos permite codificar ciertas propiedades. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. en la arquitectura para reconocer elementos concretos en las imágenes. Visualmente, una idea intuitiva de lo que aprenden las capas se presenta a menudo con este ejemplo extraído del artículo de referencia de Andrew Ng, como se muestra en la Figura 2.17. Figura 2.17: Representación de una red convolucional Fuente: Torres (2018). IO. Donde:. BL. B1.......B4: Bordes de la imagen.. BI. C1, C2 y C3 : Combinaciones de bordes de la imagen. M1 Y M2: Modelos de objetos de la imagen. S: Salida.. La idea que se quiere dar con este ejemplo visual según Torres (2018) es que en una red neuronal convolucional cada capa va aprendiendo diferentes niveles de abstracción. Además, menciona que 24 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(42) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. una red neuronal convolucional (CNN), es un caso concreto de redes neuronales. 2.6.4.1.. Capa convolucional. parte del trabajo pesado computacional (Li et al., 2019). Etapa convolucional. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. 2.6.4.2.. IC AS. La capa convolucional es el componente básico de una red convolucional que realiza la mayor. Consisten en un conjunto de filtros cuyos valores se aprenden, es decir, se empiezan con datos aleatorios y conforme avance el entrenamiento irán variando. Cada filtro es pequeño espacialmente (a lo ancho y alto), pero se extiende a través de la profundidad total del volumen de entrada (Li et al., 2019).. Un ejemplo según Li et al. (2019), un filtro típico en una primera capa de una red convolucional puede tener un tamaño de 5x5x3 (es decir, 5 píxeles de ancho y alto, y 3 de profundidad de los canales de color). Durante el avance, deslizamos (se realiza la convolución) cada filtro a través del ancho y la altura del volumen de entrada y calculamos los productos de punto entre las entradas. BI. BL. IO. del filtro y la entrada en cualquier posición, como se observa en la Figura 2.18. Figura 2.18: Esquema etapa convolucional. Fuente: Adaptada de Li et al. (2019). 25 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(43) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. A medida que deslizamos el filtro sobre el ancho y la altura del volumen de entrada, produciremos un mapa de activación bidimensional que proporciona las respuestas de ese filtro en cada posición espacial. Intuitivamente la red aprenderá filtros que se activarán cuando vean algún tipo. IC AS. de característica visual, como un borde de cierta orientación o una mancha de algún color (Li et al., 2019).. TE CA Y M DE AT C EM IEN ÁT CI IC AS AS FÍ S. La convolución aprovecha tres ideas importantes según Montes (2018), que pueden ayudar a mejorar un sistema de aprendizaje automático: interacciones dispersas, uso compartido de parámetros y representaciones equivalentes.. Las capas de redes neuronales tradicionales usan la multiplicación de matrices mediante una matriz de parámetros con un parámetro separado que describe la interacción entre cada unidad de entrada y cada unidad de salida. Esto significa que cada unidad de salida interactúa con cada unida de entrada. Sin embargo, las redes convolucionales suelen tener interacciones dispersas (o conectividades dispersas), en las cuales el kernel es más pequeño que la entrada (Li et al., 2019). Un ejemplo planteado por Li et al. (2019), al procesar una imagen, la imagen de entrada puede tener miles o millones de píxeles, pero podemos detectar características pequeñas y significativas, como bordes con núcleos que ocupan solo decenas o cientos de píxeles, necesitando almacenar. IO. menos parámetros, lo que reduce los requisitos de memoria del modelo, mejora su eficiencia esta-. BL. dística y también conlleva a que el cálculo de la salida requiera menos operaciones. Según Li et al. (2019) es necesario considerar tres aspectos importantes: la extensión espacial,. BI. el paso (stride) y la cantidad de zero-padding. La extensión espacial, es siempre igual a la profundidad del volumen de entrada. El stride, representa el ’paso’ en la de convolución indicando cuánto se debe desplazar un kernel sobre una imagen en cada paso y se detendrá en cada longitud de salto y realizará las operaciones necesarias en ese paso. 26 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.