• No se han encontrado resultados

Introducción a la Ciencia de Datos

N/A
N/A
Protected

Academic year: 2021

Share "Introducción a la Ciencia de Datos"

Copied!
35
0
0

Texto completo

(1)

Introducción Ejemplo SEP Centros de Trabajo Software Libre avanzado

Introducción a la Ciencia de Datos

Guillermo Valdés Lozano

(2)

Introducción Ejemplo SEP Centros de Trabajo Software Libre avanzado

Documento protegido por GFDL

Copyright (c) 2015 Guillermo Valdés Lozano. e-mail: guillermo(en)movimientolibre.com

http://www.movimientolibre.com/

Se otorga permiso para copiar, distribuir y/o modificar este documento bajo los términos de la Licencia de Documentación Libre de GNU, Versión 1.2 o cualquier otra versión posterior publicada por la Free Software Foundation; sin Secciones Invariantes ni Textos de Cubierta Delantera ni Textos de Cubierta Trasera.

Una copia de la licencia está en

http://www.movimientolibre.com/licencias/gfdl.html

(3)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos?

¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

¿Qué es la Ciencia de Datos?

La Ciencia de Datos pretende abarcar a un conjunto de herramientas (basadas en la ciencia) y habilidades (humanas e informáticas) con un nombre muy atractivo.

Se define como es la extracción de conocimiento a partir de grandes volúmenes de información estructurada o no estructurada.

(4)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos?

¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

Conceptos que involucra

(5)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos?

¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

¿Qué es un Científico de Datos?

Un Científico de Datos (Data Scientists) es una persona con habilidades estadísticas, computacionales (que sabe programar) y de visualización de datos que lo llevan a encontrar los patrones que le servirán a la empresa o institución para capitalizar la información recogida.

(6)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos?

¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

Demanda de C. en D. en aumento

(7)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos? ¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

¿Qué se necesita saber para ser un científico de datos?

Domine las matemáticas, la estadística y la informática.

Aprenda a programar. Conozca las Bases de Datos.

Sea ágil en herramientas de procesamiento y visualización. De el salto alBig Data.

No deje de aprender y practicar.

Colabore con la asociaciones, gobierno o con la iniciativa privada.

(8)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos? ¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

¿Qué se necesita saber para ser un científico de datos?

Domine las matemáticas, la estadística y la informática. Aprenda a programar.

Conozca las Bases de Datos.

Sea ágil en herramientas de procesamiento y visualización. De el salto alBig Data.

No deje de aprender y practicar.

Colabore con la asociaciones, gobierno o con la iniciativa privada.

(9)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos? ¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

¿Qué se necesita saber para ser un científico de datos?

Domine las matemáticas, la estadística y la informática. Aprenda a programar.

Conozca las Bases de Datos.

Sea ágil en herramientas de procesamiento y visualización. De el salto alBig Data.

No deje de aprender y practicar.

Colabore con la asociaciones, gobierno o con la iniciativa privada.

(10)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos? ¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

¿Qué se necesita saber para ser un científico de datos?

Domine las matemáticas, la estadística y la informática. Aprenda a programar.

Conozca las Bases de Datos.

Sea ágil en herramientas de procesamiento y visualización.

De el salto alBig Data.

No deje de aprender y practicar.

Colabore con la asociaciones, gobierno o con la iniciativa privada.

(11)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos? ¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

¿Qué se necesita saber para ser un científico de datos?

Domine las matemáticas, la estadística y la informática. Aprenda a programar.

Conozca las Bases de Datos.

Sea ágil en herramientas de procesamiento y visualización. De el salto alBig Data.

No deje de aprender y practicar.

Colabore con la asociaciones, gobierno o con la iniciativa privada.

(12)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos? ¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

¿Qué se necesita saber para ser un científico de datos?

Domine las matemáticas, la estadística y la informática. Aprenda a programar.

Conozca las Bases de Datos.

Sea ágil en herramientas de procesamiento y visualización. De el salto alBig Data.

No deje de aprender y practicar.

Colabore con la asociaciones, gobierno o con la iniciativa privada.

(13)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos? ¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

¿Qué se necesita saber para ser un científico de datos?

Domine las matemáticas, la estadística y la informática. Aprenda a programar.

Conozca las Bases de Datos.

Sea ágil en herramientas de procesamiento y visualización. De el salto alBig Data.

No deje de aprender y practicar.

Colabore con la asociaciones, gobierno o con la iniciativa privada.

(14)

Introducción

Ejemplo SEP Centros de Trabajo Software Libre avanzado

¿Qué es la Ciencia de Datos? ¿Qué es un Científico de Datos?

¿Qué se necesita saber para ser un científico de datos?

Requerimientos para ser un C. en D.

(15)

Introducción

Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Descargue en Red México Abierto

Configure LibreOffice con PostgreSQL Determine la cantidad por tipo de escuelas

Red México Abierto

(16)

Introducción

Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Descargue en Red México Abierto

Configure LibreOffice con PostgreSQL Determine la cantidad por tipo de escuelas

Busque, encuentre y descargue

Descargue el Catálogo de Centros de Trabajo de la SEP.

(17)

Introducción

Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Descargue en Red México Abierto

Configure LibreOffice con PostgreSQL Determine la cantidad por tipo de escuelas

Tipos de archivos recomendados

(18)

Introducción

Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Descargue en Red México Abierto

Configure LibreOffice con PostgreSQL

Determine la cantidad por tipo de escuelas

LibreOffice Base

Configure la comunicación con PostgreSQL.

(19)

Introducción

Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Descargue en Red México Abierto

Configure LibreOffice con PostgreSQL

Determine la cantidad por tipo de escuelas

Tablas en LibreOffice Base

(20)

Introducción

Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Descargue en Red México Abierto

Configure LibreOffice con PostgreSQL

Determine la cantidad por tipo de escuelas

Consultas con filtros en LibreOffice Base

Criterio: ent 05 (Coah.), mun 035 (Torreón) y loc 0001 (Torreón).

(21)

Introducción

Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Descargue en Red México Abierto

Configure LibreOffice con PostgreSQL

Determine la cantidad por tipo de escuelas

Importe la consulta a LibreOffice Calc

(22)

Introducción

Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Descargue en Red México Abierto Configure LibreOffice con PostgreSQL

Determine la cantidad por tipo de escuelas

Cree consultas por tipo de centro de trabajo

Filtre en Base y ponga cada consulta en su hoja de cálculo.

(23)

Introducción

Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Descargue en Red México Abierto Configure LibreOffice con PostgreSQL

Determine la cantidad por tipo de escuelas

Analize los datos

(24)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python

R Hadoop

Python

Python es un lenguaje de programación creado por Guido van Rossum a principios de los años 90 cuyo nombre está

inspirado en el grupo de cómicos ingleses Monty Python.

Es un lenguaje interpretado o de script, con tipado dinámico, fuertemente tipado, multiplataforma y orientado a objetos. Python es un lenguaje que todo el mundo debería conocer. Su sintaxis simple, clara y sencilla.

Disponibilidad Windows, Mac, Linux.

(25)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python

R Hadoop

Python

Python es un lenguaje de programación creado por Guido van Rossum a principios de los años 90 cuyo nombre está

inspirado en el grupo de cómicos ingleses Monty Python.

Es un lenguaje interpretado o de script, con tipado dinámico, fuertemente tipado, multiplataforma y orientado a objetos.

Python es un lenguaje que todo el mundo debería conocer. Su sintaxis simple, clara y sencilla.

(26)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python

R Hadoop

Python

Python es un lenguaje de programación creado por Guido van Rossum a principios de los años 90 cuyo nombre está

inspirado en el grupo de cómicos ingleses Monty Python.

Es un lenguaje interpretado o de script, con tipado dinámico, fuertemente tipado, multiplataforma y orientado a objetos. Python es un lenguaje que todo el mundo debería conocer. Su sintaxis simple, clara y sencilla.

Disponibilidad Windows, Mac, Linux.

(27)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python

R Hadoop

Python

Python es un lenguaje de programación creado por Guido van Rossum a principios de los años 90 cuyo nombre está

inspirado en el grupo de cómicos ingleses Monty Python.

Es un lenguaje interpretado o de script, con tipado dinámico, fuertemente tipado, multiplataforma y orientado a objetos. Python es un lenguaje que todo el mundo debería conocer. Su sintaxis simple, clara y sencilla.

(28)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python

R

Hadoop

R

Inspirado por el lenguaje S. Desarrollado por John Chambers en los laboratorios Bell.

R es un lenguaje de script para manipulación de datos, análisis estadístico y visualización.

Es comparable y a menudo superior en poder a productos comerciales. Lenguaje de propósito general.

Disponibilidad Windows, Mac, Linux.

(29)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python

R

Hadoop

R

Inspirado por el lenguaje S. Desarrollado por John Chambers en los laboratorios Bell.

R es un lenguaje de script para manipulación de datos, análisis estadístico y visualización.

Es comparable y a menudo superior en poder a productos comerciales. Lenguaje de propósito general.

(30)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python

R

Hadoop

R

Inspirado por el lenguaje S. Desarrollado por John Chambers en los laboratorios Bell.

R es un lenguaje de script para manipulación de datos, análisis estadístico y visualización.

Es comparable y a menudo superior en poder a productos comerciales. Lenguaje de propósito general.

Disponibilidad Windows, Mac, Linux.

(31)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python

R

Hadoop

R

Inspirado por el lenguaje S. Desarrollado por John Chambers en los laboratorios Bell.

R es un lenguaje de script para manipulación de datos, análisis estadístico y visualización.

Es comparable y a menudo superior en poder a productos comerciales. Lenguaje de propósito general.

(32)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python R

Hadoop

Hadoop

Creado por Apache Software Foundation. Fuertemente desarrollado por Yahoo.

Es un framework de software que soporta aplicaciones distribuidas.

Puede usarse en granjas de computadoras y entornos de alto rendimiento.

Hadoop implementa un paradigma computacional llamado map/reduce, donde la aplicación se divide en muchos pequeños fragmentos de trabajo, cada uno de los cuales se pueden ejecutar o volver a ejecutar en cualquier nodo del clúster.

(33)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python R

Hadoop

Hadoop

Creado por Apache Software Foundation. Fuertemente desarrollado por Yahoo.

Es un framework de software que soporta aplicaciones distribuidas.

Puede usarse en granjas de computadoras y entornos de alto rendimiento.

Hadoop implementa un paradigma computacional llamado map/reduce, donde la aplicación se divide en muchos pequeños fragmentos de trabajo, cada uno de los cuales se pueden ejecutar o volver a ejecutar en cualquier nodo del clúster.

(34)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python R

Hadoop

Hadoop

Creado por Apache Software Foundation. Fuertemente desarrollado por Yahoo.

Es un framework de software que soporta aplicaciones distribuidas.

Puede usarse en granjas de computadoras y entornos de alto rendimiento.

Hadoop implementa un paradigma computacional llamado map/reduce, donde la aplicación se divide en muchos pequeños fragmentos de trabajo, cada uno de los cuales se pueden ejecutar o volver a ejecutar en cualquier nodo del clúster.

(35)

Introducción Ejemplo SEP Centros de Trabajo

Software Libre avanzado

Python R

Hadoop

Hadoop

Creado por Apache Software Foundation. Fuertemente desarrollado por Yahoo.

Es un framework de software que soporta aplicaciones distribuidas.

Puede usarse en granjas de computadoras y entornos de alto rendimiento.

Hadoop implementa un paradigma computacional llamado map/reduce, donde la aplicación se divide en muchos pequeños fragmentos de trabajo, cada uno de los cuales se pueden ejecutar o volver a ejecutar en cualquier nodo del clúster.

Referencias

Documento similar

Tras establecer un programa de trabajo (en el que se fijaban pre- visiones para las reuniones que se pretendían celebrar los posteriores 10 de julio —actual papel de los

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

Taller de Analytics y Visualización

En el capítulo de desventajas o posibles inconvenientes que ofrece la forma del Organismo autónomo figura la rigidez de su régimen jurídico, absorbentemente de Derecho público por

Sistema coaxial para un patrón primario empleado en la trazabilidad de fuentes de ruido térmico, que comprende una línea de transmisión coaxial (1) y un anillo (100), estando una

dente: algunas decían que doña Leonor, "con muy grand rescelo e miedo que avía del rey don Pedro que nueva- mente regnaba, e de la reyna doña María, su madre del dicho rey,

Entre nosotros anda un escritor de cosas de filología, paisano de Costa, que no deja de tener ingenio y garbo; pero cuyas obras tienen de todo menos de ciencia, y aun

El opacímetro comprende unos medios de transmisión (1) que comprenden un emisor láser (2) configurado para emitir luz; unos medios de recepción (3) que comprenden un fototransistor