Tableau Specialist
¿Ser un
Tableau
Specialist?
APRENDE A REALIZAR CONSULTAS, A PREPARAR LOS DATOS Y A REPRESENTARLOS VISUALMENTE DE FORMA EFECTIVA A TRAVÉS DE DASHBOARDS.
DESCUBRE LA TÉCNICA DE STORYTELLING PARA QUE LAS COMUNICACIONES CAUSEN IMPACTO EN LAS PERSONAS Y EN LAS DECISIONES QUE ELLAS TOMAN.
DURACIÓN
3 MESES 48 HORAS
ENCUENTROS
24 CLASES
2 HORAS CADA UNA
MODALIDAD
POR ZOOM
100% A DISTANCIA
¿Por qué?
● Acceder a nuevas oportunidades laborales
● Conocer en profundidad el campo real ● Rendir certificación oficial Tableau ● Destacar dentro de tu equipo
● Adquirir nuevas habilidades analíticas ● Vincularte con otros profesionales
Tableau desktop
specialist
ver contenido01
- Inducción a los Datos
+ VARIABLES, CONSTANTES Y TIPOS DE DATOS + DATOS ESTRUCTURADOS Y DATOS NO
ESTRUCTURADOS
- Introducción a SQL
+ INTRODUCCIÓN A LAS BASES DE DATOS RELACIONALES + INTRODUCCIÓN AL MODELADO DIMENSIONAL
+ CONSULTAS BÁSICAS Y SUBCONSULTAS.
+ OPERADORES LÓGICOS, FILTRADO Y ORDENACIÓN + CONSULTAS DE UNIÓN Y CONSULTAS SOBRE MÁS DE UNA TABLA: JOINS.
+ FUNCIONES DE AGREGADO Y CONSULTAS DE AGRUPACIÓN: GROUP BY / HAVING
- Ejercicio integrador SQL CAPÍTULO 1
Los datos y SQL
Manual de
Curso
Documentación en w3Shools
Introducción a los datos
¿Qué son los datos?
Datos es un término que se refiere a hechos, eventos, transacciones, etc., que han sido registrados. Es la entrada sin procesar de la cual se produce la información.
¿Qué es la información?
Información se refiere a los datos que han sido procesados y comunicados de tal manera que pueden ser entendidos e interpretados por el receptor
Documentación en w3Shools
Introducción a los datos
El tipo de dato: Es un atributo de los datos que indica al programa y/o al programador sobre la clase de datos que se va a manejar. Esto incluye imponer restricciones en los datos, como qué valores pueden tomar y qué operaciones se pueden realizar.
Ejemplo:
● INT: 4 bytes -> 32 bits -> 232=4294967296 valores
● FLOAT: 4 bytes ● DOUBLE: 8 bytes
Introducción a los datos
Las constantes: Es un valor que no puede ser alterado/modificado durante la ejecución de un programa, únicamente puede ser leído. Una constante corresponde a una longitud fija de un área reservada en la memoria principal del computador, donde el programa almacena valores fijos
define PI 3.1415926 imprimir(PI)
Documentación oficial MySql
Introducción a los datos
Las variables: Nos permiten almacenar un valor y recuperarlo más adelante para emplearlos en otras sentencias
var RESULTADO int
RESULTADO = ProcesoDeEvaluación(EXAMEN) imprimir RESULTADO;
Introducción a los datos
Datos estructurados: Cuando hablamos de datos estructurados nos referimos a la información que se suele encontrar en la mayoría de bases de datos. Son archivos de tipo texto que se suelen mostrar en filas y columnas con títulos. Son datos que pueden ser ordenados y procesados fácilmente por todas las herramientas de minería de datos.
Los datos estructurados tienen perfectamente definido la longitud, el formato y el tamaño de sus datos Los datos estructurados se almacenan en hojas de cálculo, en bases de datos relacionales (RDBMS), etc...
Introducción a los datos
Datos no estructurados
Los datos no estructurados se caracterizan por no tener un formato específico.
Se almacenan en múltiples formatos como documentos PDF o Word, correos electrónicos, archivos multimedia de imagen, audio o video,…
Introducción a los datos
Datos semi estructurados
Los datos estructurados son una mezcla de los dos anteriores no presenta una estructura perfectamente definida como los datos estructurados pero si presentan una organización
definida en sus metadatos donde describen los objetos y sus relaciones, y que en algunos casos están aceptados por convención, como por ejemplo los formatos HTML, XML o JSON.
Introducción a los datos
¿Qué es una base de datos?
Una base de datos es una colección organizada de datos, típicamente almacenados electrónicamente en un sistema de computadora. Una base de datos es usualmente controlada por un sistema de gestión de base de datos (DBMS). En conjunto, los datos y el DBMS, junto con las aplicaciones que están asociados con ellos, se conocen como un sistema de base de datos, que a menudo se reducen a solo base de datos.
Los datos dentro de los tipos más comunes de bases de datos en funcionamiento hoy en día se modelan típicamente en filas y columnas en una serie de tablas para que el procesamiento y la consulta de datos sean eficientes. Luego se puede acceder,
administrar, modificar, actualizar, controlar y organizar fácilmente los datos. La mayoría de las bases de datos utilizan lenguaje de consulta estructurado (SQL) para escribir y consultar datos.
Introducción a los datos
¿Cuál es la diferencia entre una base de datos y una hoja de cálculo?
Las bases de datos y las hojas de cálculo (como Microsoft Excel) son dos formas convenientes de almacenar información. Las principales diferencias entre las dos son:
● Cómo se almacenan y manipulan los datos ● Quién puede acceder a los datos
● Cuántos datos se pueden almacenar
Las hojas de cálculo se diseñaron originalmente para un usuario, y sus características lo reflejan. Son muy buenas para un solo usuario o un pequeño número de usuarios que no necesitan manipular una gran cantidad de datos complicados. Las bases de datos, por otro lado, están diseñadas para contener colecciones mucho más grandes de información organizada, cantidades masivas en ocasiones. Las bases de datos permiten a múltiples usuarios al mismo tiempo acceder y consultar los datos de forma rápida y segura utilizando una lógica y un lenguaje altamente complejos.
Introducción a los datos
Tipos de bases de datos
Hay muchos tipos diferentes de bases de datos. La mejor base de datos para una organización específica depende de cómo la organización pretende utilizar los datos.
● Bases de datos relacionales. Las bases de datos relacionales se popularizaron en los años ochenta. Los elementos de una base de datos relacional se organizan como un conjunto de tablas con columnas y filas. La tecnología de base de datos relacional proporciona la manera más eficiente y flexible de acceder a información estructurada.
● Bases de datos orientadas a objetos. La información en una base de datos orientada a objetos se representa en forma de objetos, como en la programación orientada a objetos.
● Bases de datos distribuidas. Una base de datos distribuida consta de dos o más archivos ubicados en diferentes sitios. La base de datos puede almacenarse en múltiples computadoras, ubicadas en la misma ubicación física o dispersas en diferentes redes.
● Almacenes de datos. Un almacén de datos es un tipo de base de datos diseñada específicamente para consultas y análisis rápidos, y funciona como un depósito central de datos.
● Bases de datos NoSQL. Una NoSQL, o una base de datos no relacional, permite que los datos no estructurados y semiestructurados se almacenen y manipulen, a diferencia de una base de datos relacional, que define cómo deben componerse todos los datos insertados en la base de datos. Las bases de datos NoSQL se hicieron populares a medida que las aplicaciones web se hacían más comunes y más complejas. ● Bases de datos orientadas a grafos. Una base de datos orientada a grafos almacena datos en términos de entidades y las relaciones entre
entidades.
● Bases de datos OLTP. Una base de datos OLTP es una base de datos analítica y rápida diseñada para un gran número de transacciones realizadas por múltiples usuarios.
Introducción a los datos
¿Qué es OLAP y qué es OLTP?
El procesamiento de transacciones en línea (OLTP) captura, almacena y procesa datos de transacciones en tiempo real.
El procesamiento analítico en línea (OLAP) utiliza consultas complejas para analizar datos históricos agregados de los sistemas OLTP.
Introducción a los datos
¿Por qué OLAP?
OLAP es el acrónimoen inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia de negocios(o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras de datos diversas, normalmente multidimensionales (o Cubos OLAP), que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datosy áreas similares.
La razón de usar OLAP para las consultas es la rapidez de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas (aunque peor desde el punto de vista operativo) es una base de datos multidimensional.
La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQLde tipo SELECT, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y
Introducción a los datos
Introducción a SQL
¿Qué es SQL?
SQL (por sus siglas en inglés Structured Query Language; en
español lenguaje de consulta estructurada) es un lenguaje de dominio específico utilizado en programación, diseñado para administrar, y recuperar información de sistemas de gestión de bases de datos relacionales.
Es usado por casi todas las bases de datos relacionales para consultar, manipular y definir datos, y para proporcionar control de acceso. SQL se desarrolló por primera vez en IBM en la década de 1970 con Oracle como uno de los principales contribuyentes, lo que llevó a la implementación del estándar ANSI de SQL. SQL ha generado muchas extensiones por parte de compañías como IBM, Oracle y Microsoft. Aunque SQL todavía se usa ampliamente en la actualidad, comienzan a aparecer nuevos lenguajes de
programación.
Introducción a SQL
¿Para qué se utiliza?
Las sentencias SQL se utilizan para realizar tareas como actualizar datos en una base de datos o recuperar datos de una base de datos. Algunos sistemas de gestión de bases de datos
relacionales comunes que utilizan SQL son: Oracle, MySQL, Microsoft SQL Server, Access, Ingres, etc.
Introducción a SQL
Algunos ejemplos
- Obtener el listado de todos los actores
SELECT * FROM actor
- Obtener el listado de todos los actores cuyo primer nombre sea BOB
SELECT * FROM actor
Introducción a SQL
Las sentencias SQL
Son instrucciones que nos ayudan a recuperar de la base los elementos específicos que necesitamos para nuestro análisis. Su combinación permite que alcancemos la máxima flexibilidad en la obtención de los datos.
SELECT SELECT DISTINCT WHERE AND HAVING INNER JOIN LEFT JOIN Tutorial de SQL en w3Schools
Introducción a SQL
Los operadores
Son los elementos que permiten realizar las operaciones dentro de las sentencias + SUMAR > MAYOR < MENOR <= MENOR o IGUAL AND Y OR O
Introducción a SQL
Realizando actividades prácticas
IP del servidor MySQL:
193.46.199.53
Base de datos:
sakila
usuario:
dataschool
Introducción a SQL
Introducción a SQL
Creando nuestras primeras consultas
1) Devolver el listado de todos los actores SELECT *
FROM actor
1) Devolver el listado de todos los actores ordenado por apellido SELECT * FROM actor
ORDER BY last_name
1) Devolver el listado de todos los actores cuyo primer nombre sea NICK SELECT * FROM actor
Introducción a SQL
Creando nuestras primeras consultas
4) Devolver el listado de todos los actores (first_name, last_name) SELECT first_name, last_name
FROM actor
5) Devolver el listado de todos los actores (Nombre, Apellido) SELECT first_name as Nombre, last_name as Apellido
FROM actor
6) Devolver el listado de todos los actores (Nombre, Apellido) ordenado descendente por Nombre
SELECT first_name as Nombre, last_name as Apellido FROM actor
Introducción a SQL
Introducción a SQL
Creando nuestras primeras consultas: Enunciado
1) Devolver el listado de todas las películas
1) Devolver el listado de todas las películas cuya descripción (“description”) contenga el texto “Epic”
1) Devolver el listado de todas las películas cuya duración (“length”) sea mayor a 86 minutos 4) Devolver el listado de todas las películas (description, release_year)
5) Devolver el listado de todas las películas (“Descripción”, “AñoLanzamiento”)
6) Devolver el listado de todas las películas (“Descripción”, “AñoLanzamiento”) ordenado por Descripcion
Introducción a SQL
Creando nuestras primeras consultas: Resolución
1) Devolver el listado de todas las películas SELECT *
FROM film
1) Devolver el listado de todas las películas cuya descripción (“description”) contenga en texto “Epic”
SELECT * FROM film
where description like "%Epic%”
1) Devolver el listado de todas las películas cuya duración (“length”) sea mayor a 86 minutos SELECT *
FROM film
Introducción a SQL
Creando nuestras primeras consultas: Resolución
4) Devolver el listado de todas las películas (description, release_year) SELECT description, release_year
FROM film
5) Devolver el listado de todas las películas (“Descripción”, “AñoLanzamiento”) SELECT description as "Descripcion", release_year as "AñoLanzamiento"
FROM film
6) Devolver el listado de todas las películas (“Descripción”, “AñoLanzamiento”) ordenado por Descripcion
SELECT description as "Descripcion", release_year as "AñoLanzamiento" FROM film
Introducción a SQL
ACTOR FILM Hugo Provenzal Diana Valencia La venganza de Tito Loco amorIntroducción a SQL
¿Cómo relacionar a las tablas?
Introducción a SQL
Introducción a SQL
Introducción a SQL
Introducción a SQL
Creando nuestras primeras consultas: Enunciado
1) Devolver el listado de los actores y las películas en las que participaron (ACTOR, PELICULA)
1) Devolver el listado de las películas cuyo título comienza con “A” y los actores que en ellas participaron (ACTOR, PELICULA).
Introducción a SQL
Creando nuestras primeras consultas: Resolución
1) Devolver el listado de los actores y las películas en las que participaron (ACTOR, PELICULA)
SELECT A.first_name AS ACTOR, F.title AS PELICULA FROM film_actor AS FA
INNER JOIN actor AS A ON FA.actor_id = A.actor_id INNER JOIN film AS F ON FA.film_id = F.film_id
1) Devolver el listado de las películas cuyo título comienza con “A” y los actores que en ellas participaron (ACTOR, PELICULA).
SELECT A.first_name, F.title FROM film_actor AS FA
INNER JOIN actor AS A ON FA.actor_id = A.actor_id INNER JOIN film AS F ON FA.film_id = F.film_id WHERE F.title LIKE "A%"