Manejo del riesgo en costos y duraciones en proyectos de construcción

Texto completo

(1)UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERÍA CIVIL MAESTRÍA EN INGENIERÍA CIVIL. Tesis. MANEJO DEL RIESGO EN COSTOS Y DURACIONES EN PROYECTOS DE CONSTRUCCIÓN. Presentado por: Ing. Claudia Susana González Castro Código. 200127135. Presentado a: Diego Echeverry Campos. Ph. D. Bogotá, Diciembre de 2002.

(2) CONTENIDO. INTRODUCCIÓN ................................................................................................ 3. 1. OBJETIVOS.................................................................................................... 6 1.1 GENERAL................................................................................................. 6 1.2 ESPECÍFICOS.......................................................................................... 6 2 ANTECEDENTES........................................................................................... 7. 3 MARCO TEÓRICO .......................................................................................... 9 3.1 RIESGO..................................................................................................... 9 3.2 GERENCIA DEL RIESGO........................................................................ 11 3.3 MINERIA DE DATOS ............................................................................... 16 3.3.1 Descubrimiento de Conocimiento ..................................................... 17 3.4 LAS REDES NEURONALES ARTIFICIALES.......................................... 21 3.4.1 Descripción De Las RNA .................................................................. 21 3.4.2 Funcionamiento De Las Redes Neuronales Artificiales .................... 23 3.4.3 Estructura de las RNA....................................................................... 25 3.4.4 Tipos de Aprendizaje ........................................................................ 25 3.4.5 Configuración de las RNA................................................................. 26 3.4.6 Fases de operación........................................................................... 27 3.4.7 Componentes de las redes neuronales............................................. 28 3.4.8 Funcionamiento De Una Neurona Biológica ..................................... 30 3.4.9 Características De Una Red Neuronal Artificial ................................ 33 3.5 INFERENCIA ESTADÍSTICA................................................................... 35. 1.

(3) 4 PROCEDIMIENTO PARA LA REALIZACIÓN DE ESTA TESIS.................. 38. 5. MODELACIÓN DE REDES NEURONALES ARTIFICIALES UTILIZANDO LA INTERFASE GRÁFICA DE MATLAB......................................................... 42. 6. ESTUDIO DE CASOS................................................................................... 56 6.1 CASO 1.................................................................................................... 57 6.1.1 Definición del CASO 1 ...................................................................... 57 6.1.2 Procedimiento para la aplicación de RNA para el CASO 1............... 63 6.1.3 Resultados De La Modelación .......................................................... 66 6.2 CASO 2.................................................................................................... 70 6.2.1 Definición del CASO 2 ...................................................................... 70 6.2.2 Resultados de la Modelación ........................................................... 77 6.3 ANÁLISIS DE RESULTADOS DE LOS CASOS 1 Y 2 .......................................... 81 7. CONCLUSIONES ......................................................................................... 83. BIBLIOGRAFÍA ................................................................................................ 87. ANEXOS ........................................................................................................... 91 ANEXO A - BASE DE DATOS REDES NEURONALES ................................. 92 ANEXO B - ESTRUCTURA DE LA RED PARA ENSAYOS PRELIMINARES .................................................................................................................... 102 ANEXO C - DATOS DE ENTRENAMIENTO DE LA RED NEURONAL CASO2 .................................................................................................................... 113 ANEXO D – LISTADO DE ERRORES DE LA MODELACIÓN PARA EL CASO2 .................................................................................................................... 122. 2.

(4) INTRODUCCIÓN. Los proyectos de construcción se caracterizan por tener un propósito definible y único a ser alcanzado con unos parámetros de costo, tiempo y calidad determinados.. Después de la etapa de factibilidad, en la cual se toma la decisión de llevar a cabo un proyecto de construcción, se inician las fases de planeación y diseño donde se elaboran el presupuesto y la programación de actividades basándose en los planos y las especificaciones determinadas.. Por otra parte, las empresas contratantes manejan una gran cantidad de proyectos de diferentes contratistas y, en ocasiones, sucede que los valores y los costos de la oferta no coinciden con los ejecutados.. La programación y el presupuesto ejecutado debe compararse con la estimación inicial para realizar un seguimiento de la ejecución del proyecto, este ejercicio es necesario para diseñar las estrategias que permitan corregir los sobrecostos y los atrasos detectados en las actividades.. Debido a la complejidad, unicidad y temporalidad de los proyectos de construcción que no permiten la automatización de los procesos, se genera. 3.

(5) gran incertidumbre para contratistas y contratantes respecto al producto final del proyecto.. Un mecanismo para disminuir la incertidumbre es la realización de seguimientos periódicos y permanentes de aquellos factores que pueden ser controlados por el equipo del proyecto, tales como la cantidad de material requerido para una actividad específica.. Otros factores como el entorno y la complejidad de los proyectos, no pueden ser controlados físicamente, razón por la cual se requiere de un mecanismo que permita realizar una simulación del comportamiento de éstos para predecir la forma en que afectarán el proyecto durante y al final de su ejecución.. Por otra parte, existen herramientas aplicadas a otros sectores como finanzas, mercadeo, salud, etc., las cuales permiten realizar un manejo pertinente de la información reflejado en las variables que afectan los comportamientos analizados. Esta técnica se denomina minería de datos.. La minería de datos es utilizada para representar visualmente una información recolectada, identificando patrones que puedan ser útiles para la toma de decisiones. Una de las herramientas utilizadas para la minería de datos son las redes neuronales artificiales, con las cuales se pueden realizar análisis de información relacionada en forma no lineal. Las redes neuronales identifican patrones y asocian información a partir del aprendizaje mediante ejemplos para calcular los posibles resultados de una nueva información.. Aunque las redes elaboradas requieren de una constante actualización, éstas representan una herramienta de consideración en el proceso de análisis de los proyectos ya que requieren de la identificación de las características más significativas de los proyectos.. 4.

(6) Esta Tesis realiza un análisis de la información recopilada de dos empresas estatales para la aplicación de técnicas de minería de datos, cuyo objetivo es la gerencia de riesgos. Se mostrará una posible forma de utilizar la información concerniente a los proyectos para que, además de llevar un registro tipo reporte de avances, se aumente el conocimiento de los factores de riesgo y de sus causas para, posteriormente aplicar estrategias de mitigación del riesgo en los proyecto.. Este documento empieza describiendo los objetivos del este trabajo, continúa mostrando algunas definiciones como la gerencia del riesgo, la minería de datos, las redes neuronales artificiales, la inferencia estadística. Seguidamente se describe la metodología de acceso y análisis de la información recolectada para posteriormente mostrar los dos casos estudiados.. Finalmente se. presentan las conclusiones, la bibliografía y anexos con un conjunto de tablas con información sobre el CASO 2 .. 5.

(7) MANEJO DEL RIESGO EN COSTOS Y DURACIONES EN PROYECTOS DE CONSTRUCCIÓN. 1. OBJETIVOS. 1.1 GENERAL El objetivo de esta Tesis es el estudio de los diferentes factores que afectan el análisis de cierta información recolectada con el objeto de realizar gerencia del riesgo en la planeación y ejecución de proyectos de construcción. La información se recolecta para introducirla en una herramienta computacional que permita manejar, de forma sencilla y exitosa, los riesgos que afectan la duración y los costos de un proyecto.. 1.2 ESPECÍFICOS Realizar un estudio de las diferentes clases de riesgo que afectan un proyecto de construcción.. Estudiar una herramienta computacional, para realizar un adecuado manejo del riesgo presente en proyectos de construcción y que se reflejen en incertidumbre en la duración y en el costo de los mismos.. Explorar conceptos como el de redes neuronales para una posible aplicación en el manejo del riesgo en costos y duraciones en proyectos de construcción.. Brindar algunas pautas para el manejo de información pertinente relacionada con un grupo de proyectos de dos empresas estatales.. 6.

(8) 2 ANTECEDENTES. La gerencia de riesgo es un mecanismo que permite analizar, evaluar y controlar los riesgos de un proyecto. Los resultados de los análisis, evaluaciones y controles de los proyectos pueden ser recopilados en una base de datos pero, cuando existe una gran cantidad de información, a las personas les es difícil identificar patrones a partir de ésta para ser interpretada y analizada para la toma de decisiones.. El manejo del riesgo en diferentes áreas ha sido de gran interés desde hace muchos años, en el área de la gerencia se han desarrollado varios modelos de manejo del riesgo, tales como “Risk Analisys And Management For Projects”, “Project Risk Manajement” y el “Enterprise-Wide Risk Management” [ORTIZ 2001], entre otros. Por otro lado, software como @RISK permite manejar incertidumbres en costos y duraciones en proyectos, a partir de las probabilidades de ocurrencia de los eventos.. Otras herramientas para el. manejo del riesgo se han desarrollado mediante la simulación de Monte Carlo, utilizando Crystall Ball [TÉLLEZ, PEREZ 2001] ó programas afines.. Por otra parte, cuando se posee una gran cantidad de información en forma de datos, se utiliza una técnica llamada minería de datos (proceso de KDD), la cual tiene. aplicaciones. en. mercadeo,. finanzas,. banca,. manufactura,. telecomunicaciones, etc.. Algunas de las herramientas utilizadas en la minería de datos son la estadística, los árboles de decisión, las redes neuronales y los algoritmos genéticos, entre otros. Productos comerciales como MineSet. . . y Darwing. son especializados. 7.

(9) para el manejo de grandes volúmenes de información y adicionalmente, existen varios grupos de investigación y proyectos en minería de datos a nivel internacional [VILLAMIL 1999].. Las redes neuronales artificiales (RNA) han mostrado un buen desempeño en la solución de problemas no lineales y su metodología consiste en el aprendizaje a partir de ejemplos que se introducen a una red, la red mejora su desempeño en la medida en que se determina la arquitectura mas adecuada y dependiendo de la cantidad y calidad de información suministrada a la red. Una de las aplicaciones más sorprendentes de las RNA es el reconocimiento de patrones para identificación fonética y de imágenes. Otros estudios relacionados con la ingeniería civil se han realizado sobre el comportamiento estructural de edificaciones, el pronóstico de series de tiempo, el comportamiento de fluidos, el pronóstico del costo de edificaciones en la etapa de prediseño, etc. En internet es posible encontrar programas gratuitos tales como SNNS Y winNN (de uso restringido) y otros, mucho más especializados, complejos y costosos, como Matlab y SPSS .. Adicionalmente, se han desarrollado teorías sobre el manejo de bases de datos con información incompleta para la generación de información a partir de otra ya existente, las cuales sirven de soporte al aumentar la confiabilidad de los resultados, apoyadas en los análisis bayesianos para lo cual se recomienda el “Bayesian Spectrum Analysis and Parameters Estimation” disponible en internet.. 8.

(10) 3 MARCO TEÓRICO. 3.1 RIESGO Matemáticamente, el riesgo es la multiplicación de la probabilidad (frecuencia) de un evento por las consecuencias del mismo. En ingeniería, el riesgo está generalmente asociado a consecuencias negativas, definiéndose riesgo como la posibilidad de exposición a las consecuencias adversas de eventos futuros1 expresada de la siguiente manera:. R=AxVx$. (1). Donde: R = Riesgo A = Amenaza V = Vulnerabilidad.. Una amenaza es el grupo de características internas o externas al proyecto que generan la probabilidad de ocurrencia de un evento futuro, es el conjunto de pre-condiciones para la ocurrencia de una falla.. La vulnerabilidad es el grado de afectación o nivel de pérdidas generado por la probabilidad de ocurrencia de una amenaza. Para evaluar la vulnerabilidad es necesario definir el criterio de evaluación, el tipo de pérdida y el escenario de interés. 1. SÁNCHEZ Mauricio. “Confiabilidad de Evaluación de Riesgos”. Universidad de los Andes. 1998.. 9.

(11) La fórmula de riesgo tiene unidades de valor por consecuencias ($/año, $/mes, etc.). Debido a que no es posible hablar de la frecuencia de eventos que no han ocurrido, entonces se aplica el concepto de probabilidad.. La mayoría de las operaciones industriales, de negocios y de ingeniería giran en torno al riesgo. Casi todo lo que se hace involucra probabilidades y consecuencias. El riesgo está asociado a la incertidumbre, la cual se define como la imposibilidad de predecir los eventos futuros con probabilidad de uno; es decir, el futuro se nos presenta como una y/o un conjunto de variables aleatorias sobre las cuales disponemos en el mejor de los casos de estimaciones2.. Existen. muchos. factores. que. contribuyen. con. esta. incertidumbre, por ejemplo:. - Influencias externas (cambios en políticas económicas y políticas, etc.). - Características del equipo (confiabilidad, disponibilidad) . - Materia prima, rendimiento de contratistas y proveedores. - Complejidad de la organización. - Errores humanos y malas comunicaciones . - Otros.. Para interpretar esta información de una forma útil para la empresa, es posible utilizar algunos métodos de cálculo de. áreas de probabilidad y de. reconocimiento de patrones en los sectores empresarial,. industrial y. constructor, etc.. 2. VILLARREAL, JULIO . Riesgo Y Volatilidad En Finanzas (Versión Preliminar). Notas de Clase, Aspectos Financieros en Costrucción, I semestre de 2001.. 10.

(12) 3.2 GERENCIA DEL RIESGO La gerencia de riesgo es el proceso sistemático de identificar, de analizar y de responder al riesgo de los proyectos. Su objetivo es maximizar la probabilidad y las consecuencias de acontecimientos positivos y de reducir al mínimo de la probabilidad y las consecuencias de acontecimientos adversos de un proyecto mediante el análisis, la evaluación y el control de los diferentes factores que participan en los proyectos.. El éxito de un proyecto está relacionado con el alcance del propósito del mismo siguiendo unos parámetros de costo, tiempo y calidad determinados.. El gerente de riesgos planea un sistema estructurado y disciplinado desarrollando estrategias de comunicación, manejo de recursos humanos, físicos y financieros, realiza una revisión del riesgo para posteriormente manejarlo (asumirlo, transmitirlo, mitigarlo o evadirlo) y aplicar las medidas correctivas.. La etapa de planeación debe iniciarse decidiendo cómo acercar y planear las actividades de la gerencia de riesgo para el proyecto.. Posteriormente, se identifican cuáles son los riesgos que pueden afectar el proyecto y la documentación de sus características. Para esto se hace un análisis cualitativo del riesgo dando prioridad a aquellos que afectan los objetivos del proyecto.. El análisis cuantitativo del riesgo mide la probabilidad y las consecuencias de los riesgos y estima sus implicaciones para los objetivos del proyecto.. 11.

(13) El análisis del riesgo determina las situaciones adversas que pueden producirse, identificando todos los escenarios futuros [TÉLLEZ, PEREZ 2001]. La identificación del riesgo consiste en:. 1. Elaborar una lista de los factores situacionales que afectan el proyecto y 2. Analizar la forma en que está interrelacionado con las diferentes actividades del proyecto (grado de complejidad).. La valoración de los factores situacionales generadores de riesgo (planeación de la respuesta del riesgo) permite determinar la estrategia más adecuada para resolverlos.. Las estrategias planeadas se supervisan y se controlan supervisando riesgos residuales, identificando los nuevos riesgos que ejecutan con la implementación de los planes de reducción del riesgo, y la evaluación de su eficacia a través del ciclo vital del proyecto.. El acceso a la información sobre la incidencia, el tiempo y el impacto del riesgo que se es capaz de controlar y el entendimiento del manejo del riesgo son aspectos determinantes en el éxito de la gerencia del riesgo.. El manejo del riesgo se realiza partiendo de premisas lógicas y alineadas con la visión de la empresa con niveles de aceptación de riesgo definidos. Este manejo requiere de la abstracción de las características descriptivas de los proyectos que permiten la clasificación por niveles de riesgo y la definición de estrategias para la reducción del mismo.. Herramientas como el análisis de criticidad y análisis de oportunidades perdidas permiten la identificación de los factores de riesgo que están afectando a la empresa actualmente.. 12.

(14) La estimación de la frecuencia de eventos está muy relacionada a la cantidad y la calidad de la información que se posee. Cuando los eventos en estudio están a cargo de una o de pocas personas, su experiencia personal sobre el tipo de contrato, el manejo del equipo, las estrategias y metodologías utilizadas es una gran fuente de información que permite identificar los factores de riesgo y sus grados de afectación proporcionando un pronóstico sobre el desempeño de las actividades analizadas.. Cuando la cantidad de información es extrema (muy poca o muy grande) y/o de menor calidad, la capacidad humana de estimación deja de ser eficiente y se pueden presentar diferencias en el criterio de interpretación y manejo de la información.. La estimación de eventos también puede realizarse a partir del análisis de la información computacional registrada por la empresa, la cual puede estar clasificada por áreas técnicas, tecnología utilizada, por tipo de contrato, etc. Esta puede ser una fuente de información muy valiosa, aunque muchas veces su información es muy generalizada, para lo cual hay que utilizar métodos de modelación y análisis de sensibilidad. Por otra parte, según el tipo de recopilación de datos, en ocasiones no permite distinguir claramente algunos datos, como por ejemplo, las causas de los eventos.. Otra forma de estimar eventos se realiza a partir del uso de bases de datos generada por terceros. Por ejemplo, manuales de equipos y sus rendimientos, etc. Esta estimación sirve para hacer evaluaciones iniciales.. La valoración de los factores situacionales generadores de riesgo está relacionada con las consecuencias de un evento y pueden ser utilizadas para determinar la estrategia más adecuada para resolverlo. La valoración se realiza. 13.

(15) con base en el conocimiento de la situación, en el registro histórico y en entrevistas.. Desde el punto de vista operacional pueden identificarse los siguientes factores con sus respectivas consecuencias3:. - Fallas del equipo: Son las debidas a la falla del equipo por problemas de confiabilidad. Estas incluyen costos de reparación, costos de producción diferida, etc.. - Caída del rendimiento: En este caso, debido a la ocurrencia del evento, la capacidad de producción (tiempo, cantidad, calidad) del bien es afectada, por lo tanto la venta neta y el margen de ganancia se ve comprometido. Ejemplos típicos el deterioro de la capacidad de producción por acumulación de suciedad en partes como filtros, alabes, etc.. - Aumento de costos de producción: La ocurrencia del evento origina un aumento de costos de producción que puede ser originado por una perdida de eficiencia (como un mayor consumo de energía o materia prima), o tal vez requiere de más personal para realizar las mismas tareas, etc.. - Efectos en el ciclo de vida o inversión de capital: En este caso las consecuencias son debidas a que el ciclo de vida del equipo, se ve afectado por la ocurrencia de los eventos, por ejemplo el tiempo ‘inter-overhaul’ de un equipo puede ser afectado por el numero de paradas y por el número de mantenimientos menores en el mismo. La inversión de capitales (como por ejemplo la compra de equipos nuevos) también puede ser afectada por estos eventos.. 3. Gerencia del Riesgo. Data Hosting C.A.. 14.

(16) - Incumplimiento con leyes: La ocurrencia del evento puede estar asociada al rompimiento de una ley del tipo ambiental o laboral, lo cual desencadena muchas veces en un daño al medio ambiente o al personal y penalizaciones económicas.. - Factor Brillo: Este incluye todos los factores de la vida diaria de una compañía que son difíciles de cuantificar como lo son el bienestar, la buena apariencia, las relaciones comunitarias, entre otros.. La evaluación del riesgo consiste en determinar un conjunto de parámetros que permiten identificar las características de los diferentes escenarios de riesgo. La evaluación contempla la identificación de los eventos adversos, la investigación de las frecuencias/probabilidades de los eventos anteriores, la estimación de las consecuencias y el cálculo de los riesgos asociados a cada evento, la identificación de eventos de mayor riesgo asociado y la preparación de las estrategias para su reducción.. Partiendo de la ecuación del riesgo, se observa que el riesgo puede ser modificado, bien sea disminuyendo la frecuencia de ocurrencia, disminuyendo las consecuencias o disminuyendo ambas cantidades.. Independientemente de la filosofía usada para disminuir el riesgo, se debe tener la capacidad de evaluar el beneficio de los resultados. Una manera muy eficaz es el uso de conceptos de riesgo.. Un análisis costo/riesgo puede realizarse calculando el riesgo antes del estudio y comparándolo con una estimación del riesgo después de la implantación de las nuevas estrategias y los costos del cambio. Análisis más profundos de optimización son requeridos cuando se está estudiando un proceso crítico o una inversión considerable. Estos procesos pueden empezar identificando el tipo de. 15.

(17) comportamiento (lineal/no lineal) existente entre los datos disponibles y sus relevancias (correlación entre los datos del modelo),. su objetivo es la. realización de pronósticos en nuevos escenarios.. La clasificación y pronóstico de los escenarios mejor, peor y más probable surge apoyado de pruebas de sensibilidad para la obtención de resultados más confiables. Otra posible opción es manejar una cifra con un rango de tolerancia. El hecho de presentar rangos de decisión hace que el estudio posea un margen de seguridad bastante razonable, al igual que una credibilidad mayor a la obtenida con resultados determinísticos.. Algunos aspectos a tener en cuanta en el manejo de la información en la gerencia de riesgo son: tener los objetivos claros, identificar los datos relevantes, identificar los eventos que no son posibles y el grado de precisión deseado, entre otros.. Existen herramientas no probabilísticas de procesamiento paralelo que no ajustan los resultados a funciones, tales como algunos de los algoritmos de aprendizaje de las redes neuronales artificiales, las cuales son mucho más recomendables en aquellos casos donde el comportamiento de los datos es no lineal, en este caso, la metodología de gerencia de riesgo, solo se ve modificada en el numeral de cálculo del riesgo, ya que no se utilizan métodos probabilisticos sino el pronóstico de eventos a partir del entrenamiento, la verificación y validación de una red.. 3.3 MINERIA DE DATOS Se ha llamado minería de datos (data mining) al análisis de archivos y bitácoras de datos con el fin de descubrir patrones, relaciones, reglas, asociaciones o incluso excepciones que sean útiles para la toma de decisiones [BERRY 1997][FAYYAD 1996].. 16.

(18) Su objetivo es la representación de datos a través de imágenes, gráficas ó tabulaciones para identificar tendencias en el tiempo o relaciones entre las mediciones de un fenómeno.. La minería de datos se basa en la manipulación (semi-)automática de los datos, obteniendo información clave para conseguir beneficios (información) más relevante y útil que los propios datos de partida. Se ocupa principalmente de la construcción de información no representada explícitamente en los datos.. Dada la tecnología actual, resulta más o menos sencillo coleccionar grandes volúmenes de información y manejarla de forma tal que permitan tomar decisiones [ESTIVILL-CASTRO 1999] de compras, ofertas, publicidad, horarios, inversiones, etc.. La información recolectada en forma de datos puede ser tan abundante y tan cruda que en ocasiones no aporta conocimiento o fundamento para la toma de decisiones. Resulta de gran importancia traducir esos grandes volúmenes de datos en información para su mejor visualización, interpretación y generación de nuevo conocimiento, los métodos utilizados para tal fin son el análisis estadístico, la identificación de patrones comunes, asociaciones y reglas generales. 3.3.1 Descubrimiento de Conocimiento La minería de datos revela patrones o asociaciones que usualmente nos eran desconocidas, se le ha llamado también Descubrimiento de Conocimiento (Knowledge Discovery in Data Bases ó KDD).. El descubrir patrones o relaciones útiles en una colección de datos ha recibido tradicionalmente muchos nombres. El término “data mining” llegó incluso a ser. 17.

(19) muy. desprestigiado. en. la. estadística,. pues. representaba. manipular. suficientemente los datos hasta que los mismos confirmasen lo que uno quería postular. En este sentido, la minería de datos es un proceso que invierte la dinámica del método científico de la siguiente forma:. En el método científico, primero se formula la hipótesis y luego se diseña el experimento para coleccionar los datos que confirmen o refuten la hipótesis. Si esto se hace con la formalidad adecuada (cuidando cuáles son las variables controladas y cuáles experimentales), se obtiene un nuevo conocimiento.. En la minería de datos, se coleccionan los datos y se espera que de ellos emerjan hipótesis. Se desea que los datos describan o indiquen por qué son como son. La más inocente mirada a los datos por un humano, puede inspirarle una hipótesis. Luego entonces, validar esa hipótesis inspirada por los datos en los datos mismos, es numéricamente significativa, pero experimentalmente inválida. Por esta razón, la minería de datos presenta un enfoque exploratorio, y no confirmador. Usar la minería de datos para confirmar nuestras hipótesis puede ser peligroso, pues estamos haciendo una inferencia poco válida.. Afortunadamente, las técnicas de validación desarrolladas a lo largo de los años 80s en el campo del Aprendizaje Automático, hacen posible que las inferencias de la Minería de Datos sean validadas para obtener patrones o asociaciones realmente ciertas y no sólo reflejos de un manipuleo de los datos.. El campo del Descubrimiento de Conocimiento en Bases de Datos, denominado Knowledge Discovery in Data Bases (KDD), es la convergencia del Aprendizaje Automático, la Estadística, el Reconocimiento de Patrones, la Inteligencia Artificial, las Bases de Datos, la Visualización de Datos, los Sistemas para el Apoyo a la Toma de Decisiones, la Recuperación de Información, y otros muchos campos.. 18.

(20) Para aplicar exitosamente las técnicas de minería de datos se sugiere seguir una metodología organizada para definir y reforzar el proceso [BERRY 1997], esta metodología se puede resumir en la figura 3.1.. Tomar acción sobre la información. Uso de software de Data Mining para transformar datos en información. Identificación del Problema. Medir los resultados. Figura 3.1 Proceso de aplicación de minería de datos según Berry. Iniciando por la identificación del problema, este esquema muestra la importancia de adaptar los conceptos de la minería de datos a las características del negocio, se extrae la mejor información de los datos disponibles que guíen al conocimiento de las acciones que se deben tomar. A su vez, las acciones tomadas deben ser evaluadas para cerrar el ciclo y volver a empezar el análisis con las nuevas características del proyecto.. El proceso de KDD recomendado por Fayyad, Piatestsy-Shapiro y Smyth describe el manejo de la información para ser convertida en datos y transformada en nuevo conocimiento. Esta metodología parte de la observación de la realidad de la cual se seleccionan un conjunto de parámetros que son tratados según su pertinencia y relevancia. El proceso finaliza con la. 19.

(21) actualización y retroalimentación para la optimización de datos, tal como se muestra en la tabla 3.1.. PROCESO Selección Preprocesamiento. ENTRADA Bases de datos originales Datos seleccionados. FUNCIÓN SALIDA Elegir un gran conjunto de datos Datos seleccionados enfocado en las actividades relevantes Remover el ruido o los puntos fuera de Datos limpios rango y elegir estrategias para manejar. Transformación. Datos limpios. las ausencias de valores en atributos Reducción de variables o de registros. Minería. Datos transfoirmados. Interpretación Evaluación. y Patrones descubiertos. Incorporar conocimiento. Patrones Relevantes. Representaciones invariantes en los datos Elegir la función de la minería Representación del conocimiento, sus parámetros y los patrones (Clasificación, sumarización, clustering..), descubiertos acerca de los datos transformados sus algoritmos y representación. Interpretar patrones y hacer una Patrones relevantes traducidos entérminos entendibles por los retroalimentación para remover patrones usuarios redundantes o irrelevantes y traducirlos en términos útiles para los usuarios. Incorporar el conocimientos tomando Patroines relevantes decubrimiento acciones o documentándolo y incorporado al conocimiento reportándolo. Tabla 3.1 Metodología de minería de datos según Fayyad, Piatestsy-Shapiro y Smyth. Con tecnología Data Mining es posible realizar tareas de clasificación, predicción, agrupamiento por afinidades, clustering y descripción.. Clasificación: esta técnica consiste en examinar las características del objeto examinado y asignarlo a un conjunto previamente definido. La tarea de clasificación se realiza con tipos de datos discretos.. Predicción: es una técnica similar a la de clasificación. Se examinan las características de un objeto y se estiman de acurde a valores para su comportamiento futuro.. 20.

(22) Agrupamiento por afinidades: Con esta técnica se puede determinar los objetos o eventos que van juntos ó cuales mejoran un evento futuro, busca mejores combinaciones.. Clustering: Consiste en la segmentación de un conjunto de datos heterogéneos en subconjuntos de datos homogéneos, determina cuales datos son parecidos entre si.. Descripción: con esta técnica es posible describir el comportamiento de datos recogidos de un evento determinado para aumentar el entendimiento de las personas con respecto a a dicho evento y con respecto a las características propias del proyecto. Es útil porque brinda una explicación correcta de los registros que se desean analizar.. Por otra parte, el valor táctico o estratégico de los grandes almacenes de datos está en proporción directa con la capacidad de analizarlos, de esta manera, se abre un nuevo mundo de oportunidades a la investigación, al desarrollo de nueva tecnología y aplicaciones nuevas y prácticas[ESTIVILL-CASTRO 1999].. 3.4 LAS REDES NEURONALES ARTIFICIALES 3.4.1 Descripción De Las RNA Es una herramienta de la minería de datos. Las redes neuronales artificiales son una técnica de procesamiento de información basada en la forma en que el cerebro humano realiza el procesamiento.. Las Redes Neuronales Artificiales (RNA) consisten en la interconexión de numerosos elementos de procesamiento que trabajan simultáneamente para resolver problemas específicos.. 21.

(23) Su ventaja principal es poder resolver problemas que son muy complejos para las tecnologías convencionales. Se utilizan para resolver problemas que no tienen un algoritmo de solución ó cuando éste es muy difícil de definir. Son útiles en aquella clase de problemas en que los seres humanos son buenos para. resolver. pero. las. máquinas. no.. Estos. problemas. incluyen. el. reconocimiento de patrones y el pronóstico.. Tradicionalmente, el programador define cada aspecto de la solución a un problema y realiza un código para resolverlo, luego, el computador ejecuta la solución rápidamente. Lo anterior obliga al programador a comprender plenamente el problema y a planear para cada entrada al modelo, una salida, un tipo de dato y una combinación de datos. Cuando el programa no se ajusta a lo anticipado por el programador, el programa se termina o arroja resultados equivocados4.. Las RNA no requieren el entendimiento perfecto y la programación de la solución. Ellas entrenan un conjunto de datos y generan estructuras internas que reproducen ciertos valores de salida a partir de datos de entrada específicos.. Las relaciones entre los datos permiten a la red adquirir el conocimiento suficiente para el entrenamiento y aplicación del conocimiento en el proceso de toma de decisiones, con la habilidad de obtener información de datos complejos. Las RNAs pueden extraer patrones y detectar tendencias muy complicadas de reconocer por técnicas humanas y computacionales.. La clase de problemas que mejor se resuelven con las redes neuronales son los mismos que el ser humano resuelve mejor: asociación, evaluación y reconocimiento de patrones. La redes neuronales artificiales extraen las 4. http://ciberconta.unizar.es/LECCION/visual/. 22.

(24) interrelaciones y regularidades de los datos que procesan, siendo capaces de mantener la información, reproducirla y generar nuevas conclusiones, permitiendo modelar patrones que cambian con el tiempo.. Las redes neuronales son perfectas para problemas que son muy difíciles de calcular pero que no requieren de respuestas perfectas, sólo respuestas rápidas y buenas.. Por otra parte, las redes neuronales son muy malas para cálculos precisos, procesamiento en serie, y no son capaces de reconocer nada que no tenga inherentemente algún tipo de patrón.. Las RNA son una forma de computación capaz de manejar las imprecisiones e incertidumbres que aparecen cuando se trata de resolver problemas relacionados con el mundo real (reconocimiento de formas, toma de decisiones, etc..), ofreciendo soluciones robustas y de fácil implementación. 3.4.2 Funcionamiento De Las Redes Neuronales Artificiales Las redes neuronales son un modelo matemático propio del procesamiento paralelo distribuido (PDP) a partir de múltiples procesadores de información trabajando en forma paralela, asincrónica y estocástica.. El modelo permite el manejo de múltiples restricciones teniendo en cuenta qué aspectos de la información pueden actuar sobre otros aspectos e influenciarse mutuamente5.. Las RNA están compuestas de muchos elementos sencillos que operan en paralelo, el diseño de la red está determinado mayormente por las conexiones 5. MARROQUÍN, Claudia. Redes Neuronales Como Herramienta Para El Modelaje de Problemas de Predicción Financiera. Proyecto de Grado para optar al Título de Ingeniero de Sistemas y Computación. Universidad de los Andes. Santafé de Bogotá. 1996.. 23.

(25) entre sus elementos y puede adquirir información como resultado de un sistema incremental facilitando la producción de nuevos patrones, el almacenamiento de la información se realiza según el peso de conexión correspondiente.. El concepto fundamental de las redes neuronales es la estructura del sistema de procesamiento. Compuesto de un gran número de neuronas (elementos de procesamiento) altamente interconectadas, el sistema de redes neuronales usa la técnica de aprendizaje mediante ejemplo para la resolución de problemas [LOONEY 1997]. Las RNA se configuran para una aplicación específica de reconocimiento de patrones. Ellas pueden variar de la siguiente manera:. - Número de neuronas - Forma de interconexión de las neuronas - Clase de cálculo - Forma de transmisión de los patrones actividad a través de la red. - Forma de aprendizaje. Las redes neuronales se caracterizan por ciertas condiciones6:. a) Aprendizaje adaptativo: poseen la habilidad de aprender la forma de realizar tareas basadas en la información entregada para entrenamiento o experiencia inicial.. b) Auto-organización: pueden crear su propia organización o representación de la información que reciben durante el período de aprendizaje.. c) Operación en tiempo real: el trabajo de las redes neuronales puede ser efectuado en paralelo.. 6. http://members.tripod.com/~gineco/DATAMINI.HTM. 24.

(26) d) Tolerancia a errores a través de codificación de información redundante. 3.4.3 Estructura de las RNA La estructura de una red neuronal está basada en la existencia de una capa con los nodos de entrada que reciben las señales, y una capa de nodos de salida que emiten las señales de respuesta. En el medio, puede haber una cantidad potencialmente ilimitada de capas intermedias que contienen los nodos intermedios, constituyendo la capa oculta. Existen diferentes esquemas de construcción de redes neuronales, las cuales utilizan diferentes arquitecturas y estrategias de aprendizaje. 3.4.4 Tipos de Aprendizaje El aprendizaje en las redes neuronales es producido a través de ejemplos, cambiándose los factores de peso (weights) en cada elemento para reducir el error en la salida. Existen dos categorías de aprendizaje en las redes neuronales:. a) Aprendizaje supervisado, el cual ocurre cuando se le proporciona a la red tanto la entrada como la salida correcta, y la red ajusta sus pesos tratando de minimizar el error de su salida calculada. Incorpora un maestro externo que facilita la explotación de un grupo de datos para el que se conocen valores de todas las variables para clasificar casos en los que sólo algunas variables se han observado. Este tipo de entrenamiento se aplica por ejemplo, en el reconocimiento de patrones.. b) Aprendizaje no supervisado, donde se tiene el objetivo de identificar variables que son útiles para detectar grupos de casos que son similares de una manera significativa (Clustering). Se presenta cuando a la red se le proporcionan únicamente los estímulos, y la red ajusta sus interconexiones basándose únicamente es sus estímulos y la salida de la propia red.. 25.

(27) Las leyes de aprendizaje determinan la forma en que se ajustan los pesos utilizando una función de error o algún otro criterio. La ley de aprendizaje adecuada se determina en base a la naturaleza del problema que se intenta resolver.. 3.4.5 Configuración de las RNA Existen diversas formas de configurar una red neuronal. Las tres formas que mas se han utilizado son:. 1) El perceptron, cuya estructura se basa en 5 elementos básicos: un vector de ingresos; los pesos de las entradas; funciones de sumatoria; dispositivo de transformación; y la salida.. Se considera que una red neuronal de una sola capa puede solucionar el 80 % de los problemas con la única limitación del tiempo necesario para realizar el proceso. Agregando mas redes neuronales, la velocidad aumenta. Pero, si el número de neuronas es muy grande, sistema puede modelar también el ruido.. 2) El mapa de auto-organización de Kohoner, el cual introduce el concepto de "nodos vecinos", y una salida competitiva donde la red es esquematizada como una superficie elástica que sufre deformaciones por tracción.. 3) Las redes basadas en la back-propagation, introducen el concepto de la capa oculta como una mejora al esquema original, logrando de esta forma lo que se llama back propagation network. En las redes neuronales MLPs (multi-layer perceptron), el aprendizaje es supervisado con entrenamiento separado y una fase de retardo.. 26.

(28) 3.4.6 Fases de operación Las RNA adaptables tienen dos fases en su operación.. 1. Entrenamiento de la red. El usuario proporciona a la red un número "adecuado" de estímulos de entrada, y de salida, la red entonces ajusta su pesos de interconexión o sinápsis hasta que la salida de la red está "lo suficientemente cerca" de la salida correcta.. 2. Recuperación de lo aprendido. A la red se le presenta un conjunto de estímulos de entrada y ésta simplemente calcula su salida. Cuando la red emplea entrenamiento no supervisado, algunas veces será necesario que reajuste su sinápsis durante la fase de recuperación.. Durante el entrenamiento, los nodos de la capa oculta se organizan a si mismos. Durante la fase de retardo la red neuronal responderá a las entradas que exhiben características similares a aquellas aprendidas durante la fase de entrenamiento.. Para cada entrada, la red produce una patente de salida (output). Se compara el output actual con el deseado (target) utilizado durante el entrenamiento, y se calcula el error. Backpropagation ( BP) es un algoritmo habitualmente utilizado en las redes MLPs, el cual propaga hacia atrás los errores de las salidas hacia la capa previa. El resultado obtenido al mezclar los pesos con una proporción del último cambio de peso (momento) es la reducción de las fluctuaciones de los resultados.. Si bien es cierto que el entrenamiento de una red neuronal se basa en el intento y el error, el algoritmo back propagation compara los resultados obtenidos con los esperados. Este proceso suele tomar sólo una fracción del tiempo que suelen demandar el intento y error.. 27.

(29) Los pasos que realiza el algoritmo de retropropagación comienzan con el cálculo de la diferencia entre las salidas reales y las de la modelación. Luego calcula el gradiente de error al cuadrado en relación con los pesos que ingresan en la capa de salida. Y posteriormente se repite en cada capa subsiguiente, hacia atrás. 3.4.7 Componentes de las redes neuronales Una red neuronal está compuesta por unidades y por conexiones dirigidas entre ellas. Cada unidad recibe una entrada que se calcula a partir del valor de las unidades que están conectadas con dicha unidad y de los pesos de las conexiones correspondientes.. Las unidades determinan la ubicación y la forma de procesamiento y actualización de la información dentro del modelo.. Unidad de salida. -5 +1. -. +1. 1.5. Unidad oculta. Unidades de entrada. Figura 3.2 Capas de una red neuronal artificial. 28.

(30) Estos elementos de procesamiento también son denominadas capas. Una capa es una colección de neuronas; de acuerdo a la ubicación de la capa en la RNA, esta recibe diferentes nombres:. Capa de entrada: Recibe las señales de la entrada de la red, algunos autores no consideran el vector de entrada como una capa pues allí no se lleva a cabo ningún proceso.. Capas ocultas: Estas capas son aquellas que no tienen contacto con el medio exterior, sus elementos pueden tener diferentes conexiones y son estas las que determinan las diferentes topologías de la red. Capa de salida: Recibe la información de la capa oculta y transmite la respuesta al medio externo.. Pesos Las RNA puede tener factores de peso fijos o adaptables. Las que tienen pesos adaptables emplean leyes de aprendizaje para ajustar el valor de la fuerza de una interconexión con otras neuronas. Si las neuronas utilizan pesos fijos, entonces su tarea deberá estar previamente definida. Los pesos serán determinados a partir de una descripción completa del problema. Por otra parte, los pesos adaptables son esenciales si no se conoce previamente cual deberá de ser su valor correcto.. Cada conexión tiene un valor asignado, si el valor es positivo significa que incrementa la actividad de la unidad de destino y se considera como una conexión excitatoria. Por otro lado, si la conexión tiene un valor negativo significa que decrementa la actividad de la unidad de destino y se considera como una conexión inhibitoria de dicha unidad.. 29.

(31) 3.4.8 Funcionamiento De Una Neurona Biológica A. continuación. se realizará. una analogía. sobre. la. estructura. y el. comportamiento de las redes neuronales biológicas con las redes neuronales artificiales.. El cerebro consta de un gran número (aproximadamente 1011) de elementos altamente interconectados (aproximadamente 104 conexiones por elemento), llamados neuronas.. Las neuronas están formadas por el cuerpo celular y diferentes prolongaciones; el axón, por el que transitan los impulsos nerviosos o potenciales de acción desde el cuerpo celular hacia la siguiente célula y las dendritas, con número y estructura variable según el tipo de neurona, y que transmiten los potenciales de acción desde las neuronas adyacentes hacia el cuerpo celular.. Se unen entre ellas por contacto. Esta unión discontinua se llama sinapsis.. Un esquema simplificado de la interconexión de dos neuronas biológicas se observa en la figura 3.37.. De la observación detallada del proceso biológico se han hallado los siguientes análogos con el sistema artificial:. - Las entradas Xi representan las señales que provienen de otras neuronas y que son capturadas por las dendritas.. 7. http://ciberconta.unizar.es/LECCION/visual. 30.

(32) Figura 3.3 Neuronas Biológicas. Figura 3.4 De la neurona biológica a la neurona artificial. - Los pesos Wi son la intensidad de la sinápsis que conecta dos neuronas; tanto Xi como Wi son valores reales.. 31.

(33) -. θ. es la función umbral que la neurona debe sobrepasar para activarse; este. proceso ocurre biológicamente en el cuerpo de la célula.. Las señales de entrada a una neurona artificial X1, X2,.., Xn son variables continuas. Cada señal de entrada pasa a través de una ganancia o peso, llamado peso sináptico o fortaleza de la conexión. Los pesos pueden ser positivos (excitatorios), o negativos (inhibitorios), el nodo sumatorio acumula todas las señales de entradas multiplicadas por los pesos o ponderadas y las pasa a la salida a través de una función umbral o función de transferencia. La entrada neta a cada unidad puede escribirse de la siguiente manera:. La figura 3.5 muestra el recorrido de un conjunto de señales que entran a la red.. Figura 3.5 Proceso de una red neuronal. Una vez que se ha calculado la activación del nodo, el valor de salida equivale a. 32.

(34) Donde. representa la función de activación para esa unidad, que. corresponde a la función escogida para transformar la entrada netai en el valor de salida y que depende de las características específicas de cada red. 3.4.9 Características De Una Red Neuronal Artificial Topología de una Red: Típicamente una neurona tiene más de una entrada; en la figura 3.6 se observa una neurona con R entradas; las entradas individuales p1,p2,...,pR son multiplicadas por los pesos correspondientes w1,1, w1,2,...w1,R pertenecientes a la matriz de pesos W.. Figura 3.6 Neurona con múltiples entradas. La neurona tiene una ganancia b, la cual llega al mismo sumador al que llegan las entradas multiplicadas por los pesos, para formar la salida n,. Esta expresión puede ser escrita en forma matricial de la siguiente manera:. 33.

(35) Los subíndices de la matriz de pesos representan los términos involucrados en la conexión, el primer subíndice representa la neurona destino y el segundo, representa la fuente de la señal que alimenta a la neurona. Por ejemplo, los índices de w1,2 indican que este peso es la conexión desde la segunda entrada a la primera neurona. Esta convención se hace más útil cuando hay más de una neurona, o cuando se tiene una neurona con demasiados parámetros; de lo contrario, puede resultar inapropiada y se prefiere emplear la notación abreviada.. Figura 3.7 Neurona con múltiples entradas, notación abreviada. El vector de entrada p es representado por la barra sólida vertical a la izquierda. Las dimensiones de p son mostradas en la parte inferior de la variable como Rx1, indicando que el vector de entrada es un vector fila de R elementos. Las entradas van a la matriz de pesos W, la cual tiene R columnas y solo una fila para el caso de una sola neurona. Una constante 1 entra a la neurona multiplicada por la ganancia escalar b. La salida de la red a, es en este caso un escalar, si la red tuviera más de una neurona a sería un vector.. 34.

(36) 3.5 INFERENCIA ESTADÍSTICA La inferencia estadística [SIEGEL 1978]es la parte de la estadística matemática que se encarga del estudio de los métodos para la obtención del modelo de probabilidad (forma funcional y parámetros que determinan la función de distribución) que sigue una variable aleatoria de una determinada población, a través de una muestra obtenida de la misma.. En todos estos problemas que estudia la inferencia estadística juega un papel fundamental la "Teoría de la Probabilidad" (distintas formas funcionales de las distribuciones de probabilidad) y la "Teoría de Muestras" (procedimientos para tomar muestras de manera apropiada).. Teoría de Muestras La teoría de muestras estudia las técnicas y procedimientos que se deben emplear para que las muestras sean representativas de la población que pretendemos estudiar, de forma que los errores en la determinación de los parámetros de la población objeto de estudio sean mínimos.. Para conseguirlo, la muestra tiene que ser representativa de la población. Para que la extracción de la muestra sea representativa se deben cumplir dos principios básicos:. Que haya independencia en la selección de los individuos que forman la muestra. Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra.. A la inferencia estadística le interesa sacar conclusiones de un gran número de acontecimientos fundamentándose en las observaciones de parte de los. 35.

(37) mismos. La estadística proporciona herramientas que formalizan y uniforman nuestros. procedimientos. para. sacar. conclusiones.. La. lógica. de. los. procedimientos supone algunas de las condiciones en que los testimonios deben reunirse, y las pruebas estadísticas determinan cuan grandes deben ser las diferencias observadas antes de que podamos confiar en que representarán diferencias reales en el grupo más grande , del que fueron muestreados sólo unos pocos acontecimientos.. Los procedimientos de la inferencia estadística nos permiten determinar, en términos de probabilidad si la diferencia observada está dentro del rango en el que podría aparecer facilmente por azar, o si es tan grande que significa que las dos muestras son, probablemente de dos poblaciones diferentes.. Las primeras técnicas de inferencia que aparecieron fueron las que hicieron suposiciones sobre la naturaleza de la población de la que se obtuvieron los puntajes,. estas. técnicas. se. denominan. paramétricas. y. no. paramétricas[DICKINSON 1976].. La inferencia estadística paramétrica se utiliza cuando se conoce la forma funcional de la función de distribución que sigue la variable aleatoria objeto de estudio y sólo se desea estimar los parámetros que la determinan.. Por el contrario cuando no se conoce la forma funcional de la distribución que sigue la variable aleatoria objeto de estudio, se trata de un problema de inferencia estadística no paramétrica.. Las pruebas estadísticas paramétricas especifican ciertas condiciones acerca de los parámetros de la muestra investigada, que se suponen que se mantienen. La significación de los resultados dependen de la validez de las suposiciones. De los parámetros analizados son producto de una medición que. 36.

(38) por lo menos tenga la fuerza de una escala de intervalo. (la computación de la media requiere de operaciones aritméticas).. Las pruebas estadísticas no paramétricas no especifican las condiciones de los parámetros de donde se sacó la muestra y no requieren de mediciones tan precisas. La mayoría de estas pruebas se aplican a datos en una escala de rango y algunas a una escala nominal. La escala de rango implica una relación entre los objetos de diferente categoría de escala.. Las pruebas no paramétricas se fijan en el orden ó en el rango de los puntajes, no en sus valores numéricos.. Los modelos paramétricos son aquellos en los que se especifican ciertas condiciones acerca de los parámetros de la población de la que se obtuvo la muestra investigada. La significancia de los resultados de una prueba paramétrica dependen de la validez de éstas suposiciones.. Una prueba no paramétrica es aquella cuyo modelo no especifica las condiciones de los parámetros de la población de la que se sacó la muestra. Las suposiciones de las no paramétricas no requieren mediciones tan fuertes, la mayoría de las pruebas no paramétricas se aplican a datos de una escala ordinal. Otras técnicas de inferencia estadística utilizan los métodos bayesianos, los cuales se explican en el anexo.. 37.

(39) 4 PROCEDIMIENTO PARA LA REALIZACIÓN DE ESTA TESIS. El primer paso fue la revisión bibliográfica de trabajos realizados sobre el tema, tales como journals, conferencias y tesis desarrolladas en la Universidad de los Andes respecto los riesgos en costos y duraciones en proyectos de construcción, con especial interés en el estudio de información de proyectos de construcción desarrollada por el ingeniero Mauricio Bautista en la elaboración de su tesis de maestría, y además, se consultó la tesis de maestría elaborada por los ingenieros civiles Juan Carlos Monterroza y Odette Palis, entre otros.. Al tiempo, se profundizó en el estudio de los conceptos de gerencia del riesgo para identificar y clasificar los riesgos que afectan un proyecto, como también para conocer las actitudes y las formas de evaluarlo y controlarlo.. Adicionalmente, se identificaron los riesgos que no pueden ser controlados en el lugar de ejecución del proyecto (y que son internos al proyecto) ya que éstos entrarían a ser objeto de análisis mediante la modelación con una herramienta computacional. En esta parte del proceso, se identificaron los aspectos claves de las tesis anteriores que aportaron significativamente al presente proyecto, tales como la información seleccionada, herramientas computacionales utilizadas y la descripción estadística del comportamiento de las diferentes actividades involucradas en proyectos de construcción.. Posteriormente, se profundizó en el conocimiento y utilización del modelo de redes neuronales artificiales para el manejo de la información de entrada y definir las datos de salida de las redes.. 38.

(40) En este momento, se investigaron algunas herramientas para facilitar y optimizar el modelo de redes neuronales artificiales.. Seguidamente, se realizaron varias consultas al ingeniero Fredy Segura, encargado del curso de redes neuronales de la Universidad de los Andes para recopilar sus experiencias en el uso de las redes neuronales artificiales, corriendo las muestras obtenidas en la tesis del ingeniero Mauricio Bautista en los programas desarrollados por el ingeniero Segura. Estas corridas dieron como resultado la mala calidad de la base de datos ya que el programa no llegaba a la convergencia. La conclusión fue que el número de muestras era insuficiente ó que los parámetros de las muestras no eran significativos.. Con esas conclusiones, se inició la búsqueda de mayor información en dos empresas estatales. Después de una semana, la EMPRESA1 respondió que ellos no poseen la información requerida en forma consolidada y que era necesaria la consulta a cada coordinador de contrato de cada área técnica para la revisión de las actas de finalización de cada proyecto.. En la EMPRESA 2, la demora fue de ocho semanas buscando la información en la Dirección de Compras y Contratos de la institución, para la misma respuesta de negativa en disposición de la información. Ambas instituciones tienen el registro de los avances de obra (adiciones y prórrogas) pero no poseen un consolidado de características desde el inicio hasta el cierre de los proyectos.. Durante el periodo de búsqueda de la base de datos para alimentar la red neuronal se fue investigando sobre las técnicas de manejo de información, encontrándose los conceptos de minería de datos, mencionados en este documento.. 39.

(41) Al recibir la negativa de la EMPRESA 2, se tomó la decisión, de acuerdo con el asesor del proyecto, de generar una base de datos aleatoria, a partir de la base de datos creada por el ingeniero Mauricio Bautista en su tesis de grado, para determinar el conjunto de parámetros que describen los proyectos de alto, medio y bajo riesgo en cuanto a costos y duraciones de los mismos.. Esta decisión se tomó ya que el objetivo de la tesis no es realizar una consulta exhaustiva sobre los factores de riesgo ni la obtención estricta de una base de datos por parte de las instituciones visitadas (labor realizada por el ingeniero Mauricio Bautista en su tesis de maestría), sino el manejo de información. Como en este caso los datos solicitados no estaban disponibles, se optó por considerar la generación de una base de datos a partir de aquellos con los que se contaba en el momento.. A continuación se desarrolló el proceso de búsqueda de información sobre análisis estadístico para el manejo de información incompleta, siendo una ayuda. importante. las. publicaciones. “Bayesian. Spectrum. Análisis. and. Parameters Estimation” y “An Introduction To Parameter Estimation Using Bayesian Probability Theory” de Larry Bretthorst. De esta investigación, se deduce que la muestra disponible es demasiado pequeña para realizar inferencia de parámetros y que cualquier estimación adicional a partir de ésta sólo aumentará la dispersión de los resultados. La base de 20 muestras aunque es muy mala debido a la poca información, es la mejor base disponible. Por otra parte, se exploraron herramientas como Cristal Ball para definir las característica de la base con 20 muestras, generando una base de datos con diferente distribución con igual varianza y generando nueva información con datos faltantes. Las redes entrenadas aumentaron el error en los resultados, por lo tanto se recomienda aumentar el número de muestras.. 40.

(42) En la semana 9 se obtuvo información de la EMPRESA 2 sobre los datos de oferta y de ejecución de un conjunto de proyectos. La base de datos fue tratada con varias combinaciones y ensayadas en modelos de redes neuronales artificiales.. Los modelos de RNA se desarrollaron en Matlab utilizando el Toolbox de Redes Neuronales, con esta herramienta se realizó el análisis de la información disponible.. Finalmente, se analizaron los procedimientos y los resultados. Es necesario aclarar que las recomendaciones dadas en este documentoestan acompañados de conceptos de la gerencia de riesgos para la realización de seguimiento de aquellos aspectos controlables con el fin de tomar las medidas correctivas necesarias para un oportuno manejo del riesgo en los proyectos de construcción.. 41.

(43) 5. MODELACIÓN DE REDES NEURONALES ARTIFICIALES UTILIZANDO LA INTERFASE GRÁFICA DE MATLAB. La fase preliminar a la modelación consiste en preparar los datos para el aprendizaje de la red. El número de muestras recomendado [LOONEY, 1997] para cada etapa de la modelación es del 65% de las muestras para la etapa de entrenamiento, entre el 15% y el 25% para la etapa de validación y entre el 15% y el 25% para la verificación de la red. Este proceso, consiste en enseñarle a la red unos ejemplos iniciales (entrenamiento), posteriormente introducir otros ejemplos para ajustar la red (simulación) y finalmente la verificación (test) de la capacidad de la red para que, la cual se determina observando las salidas de la red para un conjunto de entradas a las cuales se les conocen las salidas reales.. Como se mencionó anteriormente, existen varios programas con aplicaciones en redes neuronales artificiales, el presente trabajo se realizó utilizando el ambiente gráfico del toolbox de redes neuronales de Matlab. Se escogió Matlab debido a su gran número de algoritmos de entrenamiento y validación; además, cuenta con un toolbox (nntool) que permite una interacción amable con el usuario.. Actualmente, Matlab es una herramienta de gran acogida en la comunidad científica debido a sus múltiples opciones de análisis y al buen soporte que proporciona esta compañía.. Se recomienda desplegar las siguientes ventanas:. 42.

(44) [Workspace] : Es una herramienta gráfica de visualización y administración del espacio de trabajo de Matlab, en la cual se observan todas las variables creadas.. En esta ventana se almacenan las variables con los vectores de. entrenamiento y aprendizaje de la red (entradas, salidas, errores), al igual que las variables que guardan las redes creadas. Estas variables pueden ser cargadas de otros archivos,. ser eliminadas y salvadas. Para observar las. variables, se hace doble clic sobre éstas y se activa un editor de arreglos, el cual funciona únicamente para datos numéricos... [Command window] : Es la ventana de comandos, en la cual se pueden entrar las variables, correr las funciones y los archivos-m y realizar los ajustes de los vectores tales como la normalización y la rotación de las matrices cuando es necesario. Adicionalmente, se activa el ambiente gráfico mediante el comando nntool y se observa la estructura de las redes creadas digitando el nombre de la red y permite ver el listado completo de las variables utilizadas digitando who.. [Command History]: En esta ventana se guardan las líneas entradas en la ventana de comandos. Estas líneas de comando pueden ser vistas previamente y ser copiadas para utilizarse nuevamente.. Figura 5.1 Ventana de presentación de Matlab. 43.

(45) La modelación con redes neuronales artificiales en Matlab puede hacerse de dos maneras: la primera, utilizando la ventana de comandos donde se ingresa cada comando con sus respectivos parámetros; y, la segunda, mediante la utilización del nntool, el cual despliega una ventana gráfica en la cual se puede diseñar y simular la red. Debido a la facilidad en el manejo de la interfase gráfica, ésta fue la forma escogida para realizar la simulación y es la que se describe a continuación.. Figura 5.2 Network/Data Manager. GUI de Redes neuronales de Matlab.. Al activar la interfase gráfica, se despliega la ventana (Network /Data Manager). En esta ventana (Network/Data Manager) es posible crear, manejar e implementar las redes neuronales de una manera muy sencilla, escogiendo los archivos y los algoritmos necesarios. Las opciones disponibles en la ventana Network/Data Manager son las siguientes:. [HELP]: despliega la descripción de las opciones de la ventana Network/Data Manager.. 44.

(46) [IMPORT] – Importa datos y redes desde el espacio de trabajo ó desde una carpeta.. [EXPORT] - Exporta datos y redes desde el espacio de trabajo ó desde alguna carpeta.. [VIEW] – Abre los datos ó redes para ser vistas y editadas.. [DELETE] – Elimina los datos ó redes seleccionadas.. [INITIALIZE] – Abre la red seleccionada para la inicialización.. [TRAIN] – Abre la red seleccionada para el entrenamiento.. [ADAPT] Abre la red seleccionada para el entrenamiento adaptativo.. [NEW DATA]: permite introducir las variable que contienen los vectores de entrada del modelo, Estas se discriminan en:. Networks: Lista las redes. Inputs: son las entradas de la red y corresponde a la información que se ingresa a las capas de entrada de la red.. Targets: son los datos de salida de la red, son los datos deseados que debe arrojar el modelo. Son utilizados para el entrenamiento y la simulación.. Outputs: Son las respuesta de la red a las entradas, son los resultados de la modelación... 45.

(47) Errors: Diferencia entre los targets y las salidas (outputs).. Input delays: son los estados de retardo para redes con entradas retardadas.. Layer Delays – Son los estados de retardo para las redes con retardos en las capas.. Para realizar las modelaciones con redes neuronales artificiales en el ambiente gráfico se sigue el siguiente procedimiento:. 1. Utilizando la opción [New Data], se crean las nuevas entradas [Inputs] y blancos [targets] con el conjunto de datos que se introducen o se importan desde el espacio de trabajo (workspace) ó desde alguna carpeta con la opción [IMPORTAR].. 2.. Se crea una nueva red mediante [NEW NETWORK] ó importándola, para. ver la estructura de la red se digita [View], para cear la red, se hace clic sobre [Create].. Figura 5.3 Ventana para crear las redes neuronales en Matlab en el GUI. 46.

(48) Figura 5.4 Network/Data Manager mostrando las redes creadas. 3. Se selecciona la red de la lista de redes, cuidando que la red a entrenar esté sombreada en gris, y se realiza el entrenamiento haciendo clic en [TRAIN...]. Figura 5.5 Ventana (Network) para el aprendizaje de la red.. 47.

(49) La ventana Network muestra las diferentes opciones para realizar el proceso de aprendizaje de la red. La primera opción de esta ventana es [View], dando un clic sobre ella, se despliega un gráfico que muestra la estructura de la red proporcionando la información sobre los vectores de entrada y salida de la red, y además, sobre las funciones de entrenamiento y transferencia.. Figura 5.6. Visualización de la red. La tabulación [Initialize] permite seleccionar las características de las matrices de pesos y ganancias de la red, las opciones disponibles son la de actualizar las matrices con aquellas matrices que arroja la simulación en el proceso de ajuste ó de lo contrario, mantener fijas las matrices de pesos y ganancias. En este caso, debido a que no se conoce de antemano cuales son las características que más inciden en el comportamiento de la red, se optará por actualizar las matrices con aquellas que resultan del proceso de la modelación. En esta ventana se definen los valores en los que debe estar las salidas de la red.. 48.

(50) Seguidamente se encuentra la opción de simular [Simulate], la cual se utiliza para hacer las pruebas del funcionamiento de la red.. Luego de realizar el. entrenamiento, es necesario comprobar que la red haya realmente aprendido, a partir de la información suministrada. Entonces, con la opción [Simulate], la red entrenada mostrará los resultados para un conjunto de entradas desconocidas para ella y, si ha aprendido correctamente, el vector de salidas de la red deberá coincidir con las respuestas reales.. Figura 5.7 Información para el entrenamiento de la red. La tabulación [Train] contiene las características del entrenamiento de la red, este cuadro está dividido en tres partes. La primera parte corresponde a la información del entrenamiento, donde se definen los vectores de entrada y salida para el entrenamiento, con la descripción del nombre del archivo de salida y el nombre del archivo de errores de la simulación.. 49.

(51) Figura 5.8 Parámetros para el entrenamiento. La segunda parte se refiere a las opciones de entrenamiento. Aquí se definen los parámetros de las funciones de entrenamiento que describen a la red. Se especifican los criterios de finalización de la modelación, los cuales conciernen al desempeño y el número de ciclos empleados.. La tercera parte de la ventana [Train] está destinada a la información adicional para el entrenamiento, en esta sección se introducen los vectores de validación y verificación para conocer la forma en que se desempeña la red respecto a esta información, permite la observación del desempeño de la red para estos vectores.. 50.

(52) Figura 5.9 Información adicional para el entrenamiento de la red. El entrenamiento se realiza con las entradas destinadas para el entrenamiento, en el caso mostrado: ie.. Para la verificación de la red se utiliza la opción. [Simulate], escogiendo la matriz ts.. El entrenamiento se inicia haciendo clic en [Train Network]. El entrenamiento de la red se realiza con dos criterios de finalización: la primera condición de finalización corresponde al momento en que convergen los resultados y el segundo criterio está determinado por el número de ciclos de la modelación (epochs).. El proceso de modelación se observa en la ventana training with .., en la cual se grafican el comportamiento de la salida del modelo, respecto a la red, según el número de ciclos. Los resultados se observan en las ventanas de salidas (outputs) y errores (errors) del Network/Data Manager,. 51.

(53) Figura 5.10 Desempeño de la red y número de ciclos de la modelación. Cuando se introduce información adicional para el entrenamiento de la red, también se puede observar en esta gráfica el comportamiento de la red respecto a la información de verificación y la validación.. La definición de la red resulta de ensayar varias veces actualizando las matrices de pesos y ganancias, como también probando diversos tipos de entrenamiento y número de capas y neuronas por capas. El vector de salidas arrojado por la red se compara con las salidas reales y dependiendo de la diferencia entre la realidad y la modelación (error) se toma la decisión de seguir entrenando ó fijar el modelo.. Para examinar las características de la red, se digita el nombre de la red en la ventana de comandos y se muestra un listado de dichas características. Otra manera de explorar la red se realiza activando el Simulink de matlan con el comando. gensim(net),. con. el. cual. se. despliegan. las. ventanas. 52.