• No se han encontrado resultados

Asegurando la Calidad del Dato en nuestros entornos de BI

N/A
N/A
Protected

Academic year: 2021

Share "Asegurando la Calidad del Dato en nuestros entornos de BI"

Copied!
33
0
0

Texto completo

(1)

Asegurando la Calidad del Dato en

nuestros entornos de BI

Mary Arcia

SQL PASS Venezuela

[email protected]

@maryarcia

https://ve.linkedin.com/pub/mary-arcia/

Blog: geeks.ms/blogs/marcia

(2)

Organiza

(3)

Patrocinadores del SQL Saturday

Premier Sponsor

Gold Sponsor

(4)

AGENDA

Introducción a la calidad de datos

Calidad de datos en Poyectos de BI

Metodología de Calidad de Datos en BI

Capacidades de Data Quality Services

Proyectos de Data Quality Services

(5)

Qué es Calidad de Datos?

Algunos problemas

Nuestros envíos postales tienen un grado de

devolución muy alto.

Los datos de ventas no me cuadran.

El sistema está malo

Muchas personas

(6)

Por qué necesito calidad de datos?

Imprescindible para una toma de decisiones

correcta.

Pieza básica en la gestión de información

corporativa.

Impacto directo en el negocio.

ROI inmediato.

“Si los datos son la materia prima con la cual creamos la Información; entonces la confiabilidad de la

información depende directamente de la calidad de los datos utilizados para producirla”

(7)
(8)

A Quién afecta la falta de calidad de datos

Áreas Productivas del Negocio

Ventas no dispone de información correcta.

Marketing realiza segmentaciones erróneas,

campañas no eficientes.

Dirección toma decisiones basándose en

información errónea.

Atención al Cliente sufre y es causante a la vez de

la mala calidad de los datos.

Tecnología toma tiempos muy largos para la

culminación de los proyectos (Time To Market).

(9)

A

quién

afecta la falta de calidad….

Todo es Dinero

….

Caída en ventas

Baja la rentabilidad del negocio

Pérdida de clientes. Segmentación

Poco control sobre el gasto

(10)

Qué nos resuelve calidad de datos

Ahorra dinero.

Aumenta Ventas

Aumenta

rentabilidad del

negocio

(11)

Impacto en Múltiples Proyectos

En BI buenos datos….buenas decisiones

Análisis predictivo

MDM (visión única del cliente/proveedor/producto)

Migraciones: Sistema nuevo con datos buenos

(Garbage In/Garbage Out)

Cumplimiento de normativas y leyes

(12)

Ciclo de Vida en la Calidad de los datos

1.

Descubrir

2. Perfilar

3. Limpiar

4. Match

5.

Consolidar

6.

Monitorizar

Identificar y medir la calidad de los datos

Definir reglas y objetivos

de la calidad de los datos

Diseñar los procesos de mejora de la

calidad de los datos Matcheo de información y estadísticas Implementar los procesos de mejora de calidad Monitorear la calidad de los datos vs los objetivos

(13)

Dimensiones de la calidad de datos

Dimensión Qué mide?

Perfilado de columna

Cuáles son las caracteríticas físicas de los datos?

Relación Qué relación existe entre grupos de datos?

Redundancia Es un dato redundante?

Existencia Qué dato falta o no nos es útil?

Conformidad Qué dato está almacenado en formato no estándar?

Consistencia Qué datos aportan información no conflictiva?

Precisión Qué datos son incorrectos o están caducados?

Duplicados Qué datos o atributos están repetidos?

Integridad Qué información no está referenciada?

Rango Qué resultados, cálculos, valores están fuera de rango?

(14)

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Existencia

Existencia

Existencia

(15)

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Conformidad

Conformidad El dato tiene un formato correcto?

Conformidad Conformidad

Conformidad

(16)

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Consistencia

Consistencia El dato tiene el formato correcto pero rompe las reglas de negocio

Consistencia

(17)

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Duplicidad Los datos aparecen varias veces? Coincidencia difusa

Duplicidad

(18)

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Integridad Las relaciones del dato son consistentes?

(19)

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Rango Se encuentran los valores entre rangos aceptables?

Rango Rango

(20)

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Precisión El dato representa la realidad exacta? Son las fuentes verificables?

Precisión Precisión

(21)

DEMO

(22)

Qué es Data Quality Services?

Data Quality Services (DQS) es una

solución

basada en el conocimiento

de la calidad de datos

que permite a

los administradores de datos y

profesionales de IT la mejora de la

calidad de sus datos fácilmente.

(23)

En qué nos apoya Data Quality Services?

Conocimiento

Limpieza

Consolidación

(24)

Arquitectura de DQS

CLIENTE

Data Quality Services Client Componente Integration Services

SERVIDOR

DQS_MAIN DQS_PROJECT DQS_STAGING

(25)

Arquitectura de DQS

Dominios Reglas de matching Dominios Compuestos

Bases de

Conocimiento

Dominio Reglas y Relacion es Valores Referencias Externas

(26)

Base de Conocimiento

ENTIDAD

Tarjetahabientes

Apellidos y

Nombres

Nacionalidad

Nro. Tarjeta

Tipo Producto

Limite de Crédito

Atributos

DQKB_Tarjetahabiente

Dominios

Tipo de Producto Límite de Crédito Nacionalidad 6 dígitos dentro de un rango Lista de Valores y correcciones Lista de Valores y correcciones

(27)

DEMO

(28)

Proyectos DQS

Proyectos de Cleansing

Limpieza de

Datos

Partiendo de la Base de Conocimiento

Información

Extra

Sobre las decisiones que toma

Base de

Conocimiento

en la nube

(29)

Proyectos DQS

Proyectos de Matching

Creación de

Reglas

Política de comportamiento del motor DQS

Matching

Lógica Difusa Agrega Metadatos

Exportación

Datos que quedan en el modelo

(30)

Ciclo de Vida de Proyectos BI sin DQ

Detectar

Orígenes

Información

Extra

Pruebas

de Carga

de Datos

Desarrollo

de

Informes

Pruebas y

cuadres

UAT

Aceptación Final

(31)

Ciclo de Vida de Proyectos BI con DQ

Detectar

Orígenes

Información

Extra

Análisis de Perfilado de Datos

Procesos

de Carga

Enriqueci

miento y

Matching

UAT

Aceptación Final Monitorear DQ

Pruebas y

cuadres

Desarrollo

de

Informes

(32)

Impacto de DQ en Proyectos de BI

Aumenta la rapidez de implementación

Menor Time To Market del Proyecto

Menor esfuerzo en la fase de pruebas y UAT

Mejora la calidad de la información

decisiones

Genera origenes de datos de calidad para

Campañas

Mayor confianza y usabilidad de la aplicación

Mayor cumplimiento de expectativas y

(33)

[email protected] geeks.ms/blogs/marcia/ @maryarcia

PREGUNTAS Y RESPUESTAS

SQL PASS Venezuela

Mary Arcia

Referencias

Documento similar

Debido al riesgo de producir malformaciones congénitas graves, en la Unión Europea se han establecido una serie de requisitos para su prescripción y dispensación con un Plan

Como medida de precaución, puesto que talidomida se encuentra en el semen, todos los pacientes varones deben usar preservativos durante el tratamiento, durante la interrupción

•cero que suplo con arreglo á lo que dice el autor en el Prólogo de su obra impresa: «Ya estaba estendida esta Noticia, año de 1750; y pareció forzo- so detener su impresión

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi

Por lo tanto, en base a su perfil de eficacia y seguridad, ofatumumab debe considerarse una alternativa de tratamiento para pacientes con EMRR o EMSP con enfermedad activa

o Si dispone en su establecimiento de alguna silla de ruedas Jazz S50 o 708D cuyo nº de serie figura en el anexo 1 de esta nota informativa, consulte la nota de aviso de la