Los alumnos resuelven casos de casos prácticos aplicando metodología de Ralph Kimball.
3.3.1. Desarrollo de un caso aplicando metodología de Ralph Kimball.
Desarrolle el caso Northwind utilizando la metodología de Ralph Kimball. Escenario.-
Northwind es una empresa que comercializa productos gourmet.
Se le pide diseñar una solución de inteligencia de negocios utilizando la metodología de Ralph Kimball que permita satisfacer los requerimientos del negocio.
Solución
Ricardo Marcelo, Gerente de Ventas de la empresa desea efectuar un análisis de las ventas de los últimos doce meses para preparar un plan de acción con miras a optimizarlas. Algunas de las consultas para las que desearía encontrar respuesta son las siguientes:
- ¿Cuáles son los productos de las distintas categorías que menos solicitan los clientes?
- ¿Cuál es el nivel de ventas de los productos según el país de procedencia? - ¿Cuál es el producto de cada proveedor que registra la mayor cantidad de
pedidos?
- ¿Cuánto es el monto mensual transportado por cada empresa de transportes? - ¿Cómo se distribuyen las ventas por regiones y por territorios?
- Los representantes de ventas, ¿tienen el mismo nivel de pedidos colocados? - ¿Cuál es la procedencia de nuestros clientes?
- ¿Cuál es el ranking de productos colocados en el mercado en unidades y en monto?
Objetivo del análisis
Analizar las ventas de la empresa.
- Paso 1: Identificar el hecho (FACT) FACT: la Venta
Origen de datos: Orders y [Order details]
- Paso 2: Identificar la granularidad del hecho Grano 1
La Venta de un Producto
Origen de datos: [Order details] – Cada registro en [Order details] representa la venta de un producto.
Grano 2 Una Venta
Origen de datos: Orders – Cada registro de Orders representa una venta, la misma que puede incluir 1 o más productos.
- Paso 3: Identificar las medidas Cubo 1 (Ventas x Producto)
Unidades vendidas
Origen de datos: [Order details].quantity Monto vendido
Origen de datos: [Order details].quantity, [Order details].unitPrice Cubo 2 (Ventas x Pedido)
Monto vendido
Origen de datos: [Order details].quantity, [Order details].unitPrice
- Paso 4: Analizar los requerimientos puntuales para identificar las dimensiones
¿Cuáles son los productos de las distintas categorías que menos solicitan los clientes? Dimensión PRODUCTO-CATEGORIA
Origen de datos: [Order details].productID Product.productName, Product.categoryID Categories.categoryName
Dimensión CLIENTE
Origen de datos: Orders.customerID Customers.companyName
¿Cuál es el nivel de ventas de los productos según el país de procedencia del producto?
Dimensión PRODUCTO-CATEGORIA
Origen de datos: [Order details].productID Product.productName, Product.categoryID Categories.categoryName
Dimensión PROVEEDOR
Origen de datos: [Order details].productID Product.supplierID
Suppliers.companyName Dimensión PAIS_PRODUCTO
Origen de datos: [Order details].productID Product.supplierID
Suppliers.country
¿Cuál es el producto de cada proveedor que registra la mayor cantidad de pedidos? Dimensión PRODUCTO-CATEGORIA
Origen de datos: [Order details].productID Product.productName, Product.categoryID Categories.categoryName
Dimensión PROVEEDOR
Origen de datos: [Order details].productID Product.supplierID
Suppliers.companyName
¿Cuánto es el monto mensual transportado por cada empresa de transportes? Dimensión TRANSPORTISTA
Origen de datos: Orders.shipVia Shippers.companyName
¿Cómo se distribuyen las ventas por regiones y por territorios? No hay data disponible para responder a este requerimiento.
Los representantes de ventas, ¿tienen el mismo nivel de pedidos colocados? Dimensión EMPLEADO
Origen de datos: Orders.employeeID
Employees.lastName, Employees.firstName
¿Cuál es la procedencia de nuestros clientes? Dimensión PAIS_CLIENTE
Origen de datos: Orders.customerID Customers.country
¿Cuál es el ranking de productos colocados en el mercado en unidades y en monto? Dimensión PRODUCTO-CATEGORIA
Origen de datos: [Order details].productID Product.productName, Product.categoryID Categories.categoryName
Resumen:
Objetivo del análisis Ventas
Medidas unidadesVendidas, montoVendido
Dimensiones
PRODUCTO-CATEGORIA, CLIENTE, PROVEEDOR, PAIS_PRODUCTO, TRANSPORTISTA, EMPLEADO, PAIS_CLIENTE
Cubo 1 Ventas x Producto PRODUCTO-CATEGORIA, CLIENTE, PROVEEDOR, PAIS_PRODUCTO, EMPLEADO, PAIS_CLIENTE
Cubo 2 Ventas x Pedido CLIENTE, TRANSPORTISTA, EMPLEADO, PAIS_CLIENTE
Resumen
1. El “Staging area” es el área más importante de un Data Warehouse, en ella se concentran la mayor parte de los recursos cuando se construye un Data Warehouse.
2. Los procesos ETL son los que permitirán construir el Data Warehouse
3. La herramienta ETL debe ser abierta a todos los tipos de datos y todas las plataformas como sea posible.
4. Las tablas “Look-up” son componentes esenciales de los procesos de transformación.
5. La estandarización y la limpieza de datos está relacionada directamente con la calidad de los datos y se apoya en procesos automáticos y de gestión visual. 6. El problema de estandarización de nombres es común a la mayoría de
implementaciones de Data Warehouse.
7. Los usuarios de los metadatos son básicamente técnicos y de negocio.
8. Los metadatos del negocio deben ser presentados adecuadamente y son los que permiten al usuario explorar la información.
9. La metodología se basa en lo que Kimball denomina Ciclo de Vida Dimensional del Negocio (Business Dimensional Lifecycle). Este ciclo de vida del proyecto de Data Warehouse, está basado en cuatro principios básicos:
a. Centrarse en el negocio: Hay que concentrarse en la identificación de los requerimientos del negocio y su valor asociado, y usar estos esfuerzos para desarrollar relaciones sólidas con el negocio,
agudizando el análisis del mismo y la competencia consultiva de los implementadores.
b. Construir una infraestructura de información adecuada: Diseñar una base de información única, integrada, fácil de usar, de alto rendimiento donde se reflejará la amplia gama de requerimientos de negocio identificados en la empresa.
c. Realizar entregas en incrementos significativos: Crear el almacén de datos (DW) en incrementos entregables en plazos de 6 a 12 meses. Hay que usar el valor de negocio de cada elemento identificado para determinar el orden de aplicación de los incrementos. En esto la metodología se parece a las metodologías ágiles de construcción de software.
d. Ofrecer la solución completa: Proporcionar todos los elementos necesarios para entregar valor a los usuarios de negocios. Para comenzar, esto significa tener un almacén de datos sólido, bien diseñado, con calidad probada, y accesible. También se deberá entregar herramientas de consulta ad hoc, aplicaciones para informes y análisis avanzado, capacitación, soporte, sitio web y documentación. 2. Podemos también ver tres rutas o caminos que se enfocan en tres diferentes
áreas:
a. Tecnología (Camino Superior): Implica tareas relacionadas con software específico, por ejemplo, Microsoft SQL Analysis Services. b. Datos (Camino del medio): En la misma diseñaremos e
implementaremos el modelo dimensional, y desarrollaremos el subsistema de Extracción, Transformación y Carga (Extract, Transformation, and Load - ETL) para cargar el DW.
c. Aplicaciones de Inteligencia de Negocios (Camino Inferior): En esta ruta se encuentran tareas en las que diseñamos y desarrollamos las aplicaciones de negocios para los usuarios finales.
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://www.youtube.com/watch?v=f0SXEIfOx6k o https://www.youtube.com/watch?v=XyFU8qInKl4