UNIDAD 2: RECURSOS DE TI – Aplicaciones
Sistemas de Información para la
Gestión
Sistemas de Información para la Gestión Año 2014
1
1. Administración de bases de datos e información: Sistemas de administración de bases de datos. 2. Administración del conocimiento. Sistemas de
administración del conocimiento. Técnicas inteligentes.
3. Aplicaciones empresariales: Sistemas de planificación de recursos empresariales ERP.
UNIDAD 3: RECURSOS DE TECNOLOGÍA DE
INFORMACIÓN – Aplicaciones
2 Sistemas de Información para la Gestión
Año 2014
RECURSOS DE TI – Aplicaciones - Bibliografía
3.1. Laudon y Laudon Parte II Cap 6 P Recursos TI -Aplicaciones LyL 225 – 238 LyL 245 – 248 3.2. Laudon y Laudon
Parte II Cap 8 LyL 238 – 243
5
INUNDADOS POR LOS DATOS
Cada vez se generan más datos:Bancos, telecom, otras transacciones
comerciales... Datos científicos: astronomía, biología, … Web, texto y comercio electrónico
Sistemas de Información para la Gestión Año 2014
6
EJEMPLOS DE GRANDES CANTIDADES DE DATOS
Very Long Baseline Interferometry en Europa (VLBI)16 telescopios
cada uno produce 1 Gigabit/secondde datos astronómicos durante una sesión de observación de 25 días
problemas de almacenamiento y análisis AT&T gestiona billones de llamadas al día
tantos datos que no pueden ser almacenados todos – el análisis debe hacerse a medida que llegan los datos (datos en streaming)
Sistemas de Información para la Gestión Año 2014
LAS BDs MÁS GRANDES EN 2012
1. The World Data Centre for Climate (Alemania): 220 TB + 6 PB 2. National Energy Research Scientific computing Center (EEUU): 2,8 PB 3. AT&T
4. Google: búsquedas 5. Sprint
6. Lexix Nexis: 250 TB de datos personales (incluye ADN) 7. YouTube.
8. Amazon: datos de 59 millones de clientes, 250000 libros completos 9. CIA.
10. Biblioteca del Congreso de EEUU.
MONTONES DE DATOS EN TODAS PARTES
Enorme crecimiento en BDs comerciales y científicas debidas a avances en las tecnologías de generación y captura de datos Nuevo mantra: recoge los datos que puedas donde puedas y cuando puedas. Expectativas: los datos recogidos tendrán valor, para el propósito por el que se recogieron o para otro no evidente todavía.
Simulaciones por computadora Negocios
Redes de sensores Datos geo espaciales Seguridad nacional
Big Data
El primer cuestionamiento que posiblemente llegue a su mente en este momento es ¿Qué es Big Data y porqué se ha vuelto tan importante?
Sistemas de Información para la Gestión Año 2014
9
Big Data
Pues bien, en términos generales podríamos referirnos como a la tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos (estructurados, no estructurados y semi-estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a un base de datos relacional para su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales.
Sistemas de Información para la Gestión Año 2014
10
Big Data
Sin embargo, Big Data no se refiere a alguna cantidad en específico, ya que es usualmente utilizado cuando se habla en términos de petabytes y exabytes de datos. Entonces ¿Cuánto es demasiada información de manera que sea elegible para ser procesada y analizada utilizando Big Data? Analicemos primeramente en términos de bytes:
Gigabyte = 109= 1.000.000.000
Terabyte = 1012= 1.000.000.000.000
Petabyte = 1015= 1.000.000.000.000.000
Exabyte = 1018= 1.000.000.000.000.000.000
USO DE BD PARA MEJORAR EL DESEMPEÑO
EMPRESARIAL
Escenario actual
Contamos con un conjunto de tecnologías avanzadas que nos permiten integrar y analizar información de bancos de datos.
Para obtener:
sus tendencias,
para segmentar la información o
para encontrar la correlación en los datos.
Con el objeto de generar acciones con valor agregado para el negocio.
Sistemas de Información para la Gestión Año 2014
13
Expectativas
Necesitamos:la integración de herramientas avanzadas con los datos,
procesos de generación de conocimiento y la segmentación de la información
para obtener tendencias e información oculta.
Sistemas de Información para la Gestión Año 2014
14
¿La solución?
Business Intelligence
Todo esto se hace para lograr lo que denominamos:
FUNDAMENTOS DE LA INTELIGENCIA DE
NEGOCIOS
Administración de Bases de Datos e Información Gestión del Conocimiento
Business Intelligence System es…
Sistemas de Información para la Gestión Año 2014
17
un “conjunto sofisticado de Herramientas y Tecnologías; que brindan soporte a todas las fases del proceso de toma de decisiones de los ejecutivos;
con el objeto de mejorar las ventajas competitivas de la organización, a través de mejores decisiones y que son utilizadas por los llamados Trabajadores del
Conocimiento”.
Howard Dresner (“The Gartner Group”)
Business Intelligence System…
Sistemas de Información para la Gestión Año 2014
18
“Aplicaciones de computación que interpretan datos históricos, analizan tendencias y miden performance y que están orientadas a servir de soporte a los procesos de toma de decisiones”
Business Intelligence es la
Realización eficiente de todas las actividades
relacionadas con la generación, extracción, organización, análisis, compartición y distribución del conocimiento de una organización.
Requerimientos
Capacidades y herramientas especiales para… …analizar extensas cantidades de datos. …acceder a datos desde múltiples sistemas.
Requerimientos
Sistemas de Información para la Gestión Año 2014
21
Tiempo Año, Meses, Semanas, Días,...
Producto Rubro, Artículo, Calidad,...
Geográfica Zona, Sucursales,...
Análisis multidimensional
Requerimientos
…almacenamiento de datos.
…herramientas de análisis predictivo y minería de datos.
…descubrimiento del conocimiento.
Sistemas de Información para la Gestión Año 2014
22
Herramientas o Procesos OLAP vs OLTP
OLAP (On-Line Analytical Processing):Agilizan la consulta de grandes cantidades de datos. Permiten análisis multidimensional.
Utilizado por analistas.
OLTP (On-Line Transactional Processing):
Entrada de datos y recuperación y procesamiento de transacciones.
Acceso masivo.
Almacén de Datos – Data Warehouse
“El Data Warehouse es una colección de datos orientados al tema, integrados, no volátiles ehistoriados, organizados para el apoyo de un proceso de ayuda a la decisión”.
Using the Data Warehouse of Bill Inmon
Sistemas de Información para la Gestión Año 2014
25
10 Claves para el éxito en la implementación de
un Data Warehouse / Mart
1. Desarrolle la cadena patrocinante correcta.
2. Asegúrese de que su Gerente de Data Warehousing entienda las necesidades comerciales de los usuarios. 3. Trate de anticiparse a los problemas políticos que
pudieran obstruir el proyecto.
4. Cargue el Data Warehouse / Data Mart sólo con los datos que necesita.
5. Entienda la diferencia entre desarrollar una BD para un DWH y desarrollarla para procesamiento de transacciones.
Sistemas de Información para la Gestión Año 2014
26
10 Claves para el éxito en la implementación de
un Data Warehouse / Mart
6. Tienda sus redes más allá de datos orientados a registros.
7. Provea a los usuarios definiciones de datos claras y herramientas fáciles de utilizar para ayudarlos a comenzar.
8. Construya un DWH / DM escalable y flexible. 9. Reconozca que el DWH / DM nunca está
“terminado”.
10. Potencie su DWH / DM como una aplicación de soporte de decisiones comerciales.
Es necesario que todas las Organizaciones
implementen un DWH?
El DWH se usa para control de perfomance. El DWH es mandatorio para sobrevivir (control y oportunidad). El DWH es poco probable que se necesite. El DWH se usa para aumentar lasoportunidades. A lt o B aj o Bajo Alto C o m p le jid ad r el at iv a d e la O rg an iz ac ió n
Procesamiento Analítico en Línea
Sistemas de Información para la Gestión Año 2014
29
Herramientas o Procesos OLAP vs OLTP
Sistemas de Información para la Gestión Año 2014 30 Sistemas OLTP BD Corporativa Data Warehouse Herramientas OLAP
Mercado de Datos – Data Mart
Subconjunto del Almacén de Datos, resumido o altamente enfocado.
Conjunto de tecnologías avanzadas susceptibles de analizar la información de un Data Warehouse para obtener sus tendencias, segmentar la información o encontrar la correlación en los datos.
Para una población específica de usuarios.
Se enfoca en un área objetivo o línea del negocio. Menor costo de implementación que un almacén de datos.
Surge una necesidad…
Las herramientas OLTP responden a preguntas concretas: ¿Cuánto se vendió el día ...?
¿Quién compró el producto …? ¿Cuál es el stock del producto …? ¿Cuál es la comisión del vendedor …?
Sistemas de Información para la Gestión Año 2014
33
Quiero saber…
¿Cuánto se vendió del producto X respecto de los objetivos por trimestre y región de ventas en los dos últimos años?
¿Qué clientes compraron simultáneamente los productos X e Y en todas sus operaciones en los dos últimos años?
El incremento / decremento de la venta de autos 0 Km (negocio externo) en los dos últimos años, ¿generó algún hábito de compra en alguna de las regiones?
¿ Cómo se puede ver afectado mi market-share por cada cambio porcentual unitario de la inflación?
Sistemas de Información para la Gestión Año 2014
34
Análisis Predictivo
Utiliza técnicas de:minería de datos, datos históricos y
suposiciones sobre condiciones futuras para… …predecir resultados de eventos.
¿POR QUÉ LA MD? DESDE LO CIENTÍFICO
Se recogen y guardan datos a granvelocidad
Sensores remotos en satélites. Archivos de NASA EOSDIS más de 1PB de datos sobre la Tierra por año. Telescopios.
Datos biológicos.
Simulaciones científicas: generan TBs en solo unas horas
La minería de datos ayuda a los científicos En el análisis automático de enormes conjuntos de datos
GRANDES OPORTUNIDADES PARA RESOLVER
PROBLEMAS SOCIALES
Mejorar la salud y reducir costos
Encontrar energías alternativas
Predecir el impacto del cambio climático
Reducir el hambre, la pobreza aumentando la producción agrícola
Sistemas de Información para la Gestión Año 2014
37 38
Minería de datos
Comprende una serie de técnicas, algoritmos y métodos cuyo fin es la explotación de grandes volúmenes de datos con vistas al descubrimiento de información
previamente desconocida y que pueda servir de ayuda en el proceso de toma de decisiones, formando parte del conjunto de tecnologías de la Inteligencia de Negocio
Sistemas de Información para la Gestión Año 2014
¿QUÉ ES LA MINERÍA DE DATOS?
Minería de datos (descubrimiento de conocimiento en datos): extracción de patrones de conocimiento interesantes (no triviales, implícitos, previamente desconocidos y potencialmente útiles) de cantidades enormes de datos. Otros nombres
Descubrimiento de conocimiento en bases de datos (KDD) Extracción de conocimiento
Análisis de datos, análisis de patrones Arqueología de datos.
Dragado de datos (datos dredging)
Cosecha de información (harvest information)
Inteligencia de negocios (business intelligence)
¿QUÉ ES LA MINERÍA DE DATOS?
Ejemplo real de la NBA
Información jugada a jugada guardada por los equipos Quién está en la cancha.
Quién lanza. Resultados.
Los entrenadores quieren saber qué es lo que funciona Jugadas que van bien contra un rival dado. Combinaciones buenas / malas de jugadores.
DESCUBRIMIENTO DEL CONOCIMIENTO
Sistemas de Información para la Gestión Año 2014
41 42
DATOS, INFORMACIÓN Y CONOCIMIENTO
Conocimiento:
capacidad de convertir datos e información en acciones efectivas
Sistemas de Información para la Gestión Año 2014
TIPOS DE CONOCIMIENTO
Tipos de conocimiento (según su nivel de
abstracción)
Conocimiento evidente: fácilmente recuperable (SQL) Conocimiento multi-dimensional: considera los datos con una cierta estructura (OLAP)
Conocimiento oculto: información no evidente,
desconocida a priori y potencialmente útil (Data Mining) Conocimiento profundo: información que está almacenada en la base de datos, pero que resulta imposible de
recuperar a menos que se disponga de alguna clave que oriente la búsqueda
PIRÁMIDE BASELINE
45 Jill DychéE-data. Transformando los datos en información con Data Warehousing, Prentice Hall, 2001Sistemas de Información para la Gestión
Año 2014
Descubrimiento del conocimiento
46 Jill Dyché , Federico Plancarte
Sistemas de Información para la Gestión Año 2014
EVOLUCIÓN
PASO EVOLUTIVO PREGUNTA TECNOLOGÍA Recolección de
datos (1960s)
¿Cuáles fueron mis ingresos totales en los últimos cinco años?
computadoras, cintas, discos Acceso a los datos
(1980s)
¿Cuáles fueron las ventas unitarias en el NOA en Marzo? computadoras más rápidas, más baratas, más almacenamiento, bds relacionales Almacenes de datos, soporte a la toma de decisiones
¿Cuáles fueron las ventas unitarias en el NOA en Marzo, por producto y por edad? Hacer zoom en Salta.
computadoras más rápidas, más baratas, más almacenamiento, OLAP, bases de datos
multidimensionales, almacenes de datos
Minería de datos ¿Qué es probable que pase respecto a las ventas de Salta el mes que viene? ¿Por qué?
computadoras más rápidas, más baratas, más almacenamiento, algoritmos avanzados
DESCUBRIMIENTO DEL CONOCIMIENTO (KD)
Descubrimiento del Conocimiento: es la extracción no trivial de información:
implícita
previamente desconocida
potencialmente útil a partir de los datos
W. J. Frawley, G.Piatetsky-Shapiro, C. J. Matheus Knowledge Discovery in Databases (KDD)
Nombre técnico con que se denomina al proceso global de extracción de conocimiento de bases de datos.
49
Verificación vs. descubrimiento
Verificación
1. Elaborar una hipótesis sobre la existencia de una información de interés
2. Convertir la hipótesis en una consulta
3. Ejecutar la consulta contra un sistema de información 4. Interpretar los resultados
5. Refinar la hipótesis y repetir la ejecución
Descubrimiento
1. Identificar un objetivo o problema de negocio
2. Habilitar un acceso a los datos de interés y acondicionarlos 3. Seleccionar una técnica de
explotación de los datos adecuada para el problema 4. Ejecutar la técnica contra los
datos
5. Interpretar los resultados Las técnicas de minería de datos son herramientas que facilitan el descubrimiento de la información
Sistemas de Información para la Gestión Año 2014
50
¿Tienen sentido las respuestas obtenidas?
Sistemas de Información para la Gestión Año 2014
¿Tienen sentido las respuestas obtenidas?
Caso de estudio:
Pérdida de clientes (
attrition rate
)
Situación: una compañía de celulares suele
perder del 25 a 30% de sus clientes al año.
Con esto en mente, ¿cuál es nuestra tarea?
Suponga que tenemos información sobre clientes
de los últimos N meses.
53
Caso de estudio: Pérdida de clientes
Tarea:
Predecir quién probablemente dejará el servicio
en el próximo mes.
Estimar el valor de ese cliente y qué oferta nos
conviene hacer a ese cliente para que no se vaya
Sistemas de Información para la Gestión Año 2014
54
Caso de estudio: Pérdida de clientes
Resultados:
Verizon Wireless construyó un almacén de datos de clientes. Identificó posibles desertores.
Desarrolló modelos múltiples, según la región.
Contactó a clientes con alta probabilidad de aceptar la oferta. Redujo la pérdida de clientes de más de 2%/mes a menos de 1.5%/mes (impacto enorme, por tener >30 M clientes) (Datos de 2003)
Sistemas de Información para la Gestión Año 2014
Minería de datos y privacidad
En 2006, se informó que la NSA (National Security Agency) estaba minando años de datos de llamadas para identificar redes terroristas El análisis de redes sociales puede ayudar a encontrar redes terroristas.
Deportes
Análisis del rendimiento de los jugadores, a partir de datos de una o más cámaras; análisis del adversario posterior al partido; fichaje de jugadores
Deportes
57
McLaren también hace análisis retrospectivos del rendimiento del bólido en circuitos particulares para que el conductor entienda la mejor forma de manejar. El circuito de Mónaco es el mismo desde hace 30 años, así que tenemos años de datos para saber qué pasa con la suspensión en una curva determinada (CIO Burrell)
http://blog.sap-tv.com/2012/09/cnn-on-mclaren-f1-racing-team-using-sap/ McLaren F1:
120 sensores/auto 4MB/s enviados del auto al centro de control Hamilton frena una fracción de segundo más tarde que su compañero Button
Sistemas de Información para la Gestión Año 2014
GESTIÓN DEL CONOCIMIENTO - RESUMEN
Sistemas de Información para la Gestión Año 2014
58
…Para tomar decisiones
Conocimientos Data Mart
Decisión BI
Transacciones