A1
Programa Internacional
Programa Certificado en
Big Data
2
Introducción
La revolución del Mundo Digital ha permitido que las personas encuentren un gran sinnúmero de información, en el cual el problema no radica en cómo obtener datos sino en qué hacer con ellos, por tal razón llega la ciencia de los datos o Big Data que se especializa en la manipulación, administración y análisis de gran información que no puede ser tratada con programas tradicionales.
Gracias a esta nueva tecnología se busca interpretar datos de forma inteligente para la buena toma de decisiones a compañías que día a día trabajan con información para sus procesos internos y externos.
Justificación
Mediante este Programa Certificado el estudiante se le proporcionará los fundamentos de la analítica de datos, elementos predictivos, datos abiertos y el soporte de Big data, en el cual entenderán las técnicas y herramientas clave con mayor impacto que implementa grandes empresas en diferentes campos de acción: el periodismo de datos, ciudades inteligentes, internet de las cosas, salud, administración, etc.
Objetivos
Ofrecer al estudiante una aproximación global y práctica de Big Data, en el cual afiancen los conocimientos necesarios en el análisis y gestión de datos para su comprensión así como las herramientas y estrategias que le permitan entender y rentabilizar el uso de los Big Data.
Conocer y Analizar las nuevas arquitecturas de Big Data (Hadoop/Spark/Map-Reduce) y sus modelos de Bases de Datos NO-SQL.
Examinar grandes cantidades de datos de una variedad de tipos (big data) para descubrir patrones ocultos, correlaciones desconocidas y otra información útil.
3
Dirigido a
Estudiantes o profesionales de ingeniería de sistemas o industrial, Marketing, Publicidad, administración, Estadísticas que desean adquirir las competencias para organizar información a partir del manejo de grandes volúmenes de datos en compañías.
Metodología
La metodología es eminentemente práctica, en el cual se cuanta con diferentes recursos herramientas para fomentar el proceso de aprendizaje:
Clases Presenciales Virtuales: El docente explica ejercicios para desarrolla
la temática y compartir con los estudiantes, asimismo interactúa en el ambiente de aprendizaje realizando preguntas y resolviendo las respuestas
Recursos Educativos Digitales: Dentro del proceso formativo se presentan
diversos materiales didácticos que contribuyen en la construcción del Conocimiento y aportan en actividades propuestas.
Referencia en la Web: Se basa en el aprendizaje colaborativo a través de la
gran información que se encuentra en la web que permiten afianzar y estructurar el conocimiento del participante.
Talleres y Casos prácticos: Se proponen ejercicios y talleres para que el estudiante aplique lo analizado y comprendido en el Material y las Clases Presenciales Virtuales y profundice sobre los temas del Programa Internacional.
Foros y Wikis: El estudiante cuenta con espacios de debate y
retroalimentación, donde se genere y se construya una red de conocimiento en cada uno de las actividades que se proponen en el Proceso formativo.
Tutor Virtual: Dentro del Proceso de Aprendizaje se presentan diversos
expertos temáticos que estarán en el seguimiento continuo del estudiante para que realicen las actividades en cada unidad temática del Programa Internacional.
4
Plan de Estudios
Módulo 1. Introducción a la Analítica Avanzada y Big Data
Objetivo de aprendizaje: Familiarizar a los asistentes al curso con el concepto de analítica avanzada por medio de definiciones, estudios de caso y discusiones dirigidas y relacionadas con el desarrollo de productos basados en datos.
Introducción al Big Data y a la minería de datos. Aplicaciones en el ámbito empresarial y científico
Qué es Big Data?
Los datos. Fuentes; Tratamiento. Aspectos legales del tratamiento del Big Data Las tecnologías Big Data
El mercado del Big Data
Las tres dimensiones de Big Data – Volume, Velocity, Variety Introducción a Data science
Fuentes y estructuras de datos
Consideraciones para el almacenamiento
Módulo 2. Programación en R
Objetivo de Aprendizaje: Profundizar en los conceptos y aplicaciones para el desarrollo
de habilidades de programación en R.
Estructuras de Control en Programming with R Funciones
Reglas de Alcance - Unión de símbolos Scoping Rules - Ejemplo de optimización Normas de Codificación
Fechas y Horarios
Actividad de Programación Práctica Reutilización del análisis
5
Módulo 3. Obtención de Datos
Objetivo de Aprendizaje: Profundizar y ampliar los conocimientos de los asistentes en
el proceso de obtención de información desde diferentes fuentes de información y enfocados a responder diferentes problemas de negocio.
Obtención de la Motivación de Datos
Datos Crudos y Procesados
Componentes de Datos Ordenados
Calidad de datos
ETL (extract, transform, load)
Monitoreo y revisión
Descarga y Lecturas de Archivos (Excel, Xml, Json, MySQL)
Almacenamiento de Datos (MySQL, HDF5, APIs,)
Práctica con R
Extracción desde MySQL
Extracción desde HDF5
Extracción desde la Web
Extracción desde APIs
Extracción desde de otras fuentes
Proyecto de obtención de datos
Módulo 4. Limpieza y transformación de Datos
Objetivo de Aprendizaje: Familiarizar a los asistentes con los procesos de limpieza y transformación de datos relevantes dentro de un proceso de desarrollo de productos basados en datos.
Subconjunto y clasificación
Resumen de datos
Creación de nuevas variables
Reajustar datos
6
Gestión de marcos de datos – Herramientas básicas
Fusión de datos
Practica para Limpieza y Elaboración de Datos
Edición de variables de texto
Expresiones Regulares
Trabajando con fechas
Obtención y limpieza de datos del proyecto del curso
Módulo 5. Análisis Descriptivo y Exploratorio
Objetivo de Aprendizaje: Presentar algunas técnicas de análisis descriptivo y
exploratorio de datos relevantes dentro del proceso de entendimiento de la información y en el pre-procesamiento de ésta como insumo de un proceso analítico. Además Presenta algunas técnicas de visualización para la presentación de resultados de procesos de análisis de grandes conjuntos de datos.
Introducción
Libro: Análisis exploratorio de datos con R
Libro: El arte de la ciencia de los datos
Instalación y Configuración de R
Principios de los gráficos analíticos
Gráficos exploratorios
Sistema de trazado en R
Sistema de trazado Base
Demostración Base Plotting
Proyecto de Gráficos Analíticos y exploratorios
Agrupación Jerárquica
Agrupación K-Means
Reducción de Dimensiones
Trabajar con Color en R Plots
Proyecto en Agrupación Jerárquica, Agrupación K-Means y Reducción de Dimensiones
7
Módulo 6. Análisis Interferencial de Datos (Machine Learning y Estadística)
Objetivo de Aprendizaje: Profundizar en la presentación, tanto teórica como práctica, de técnicas de modelamiento derivadas de la estadística o de Machine Learning.
Introducción al Análisis Interferencial de Datos (Probabilidad, funciones, condicionales, reglas, valores esperados, Modelos de Regresión)
Actividad práctica con R
Introducción al Practice Machine Learning
Predicción Motivación
Importancia relativa de los pasos
Entrada y salida de errores de muestra
Diseño del estudio de predicción
Tipos de errores
Característica de funcionamiento del receptor
Validación cruzada
¿Qué datos debe usar?
Metodologías para predicción de datos (Careth Package, trees, Random Forests, Model Based Predictions and others)
Módulo 7. Programación en Python
Objetivo de Aprendizaje: Presentar los principales conceptos y aplicaciones en Python
dentro del proceso de desarrollo de productos de datos.
Estructura Python
Funciones y Declaraciones condicionales en Python
Bucles e interacción
Listas y Diccionarios
8
Certificado
El estudiante obtiene el Título de Certified Program in Big Data – Data Science con la superación del 80% de cada uno los cursos/módulos que contiene el programa, en el cual se propone una serie actividades y ejercicios prácticos evaluativos.
Información General
Duración: 240 horas en Plataforma Académica certificando la Competencia laboral
Titulación: Programa Internacional
CERTIFIED PROGRAM BIG DATA – DATA SCIENCE
Formas de Pago y Financiación
La Universidad de Catalunya te ofrece diferentes alternativas de pago, donde es más fácil estudiar, entre las opciones puedes:
Tener la posibilidad de financiar el valor total o parcial de tu Diplomado sin necesidad de codeudor ni estudio crediticio.
Tenemos convenios con Bancolombia y Pichincha para financiar hasta el 100% de tu matrícula.
Pagos con Factura Correval, de contado, tarjeta de crédito, cesantías, pago por la empresa para agilizar tu proceso.