1
UNIDAD 3: RECURSOS DE TI – Aplicaciones
Sistemas de Información para la
Gestión
Sistemas de Información para la Gestión Año 2015
1
1. Administración de bases de datos e información: Sistemas de administración de bases de datos. 2. Administración del conocimiento. Sistemas de
administración del conocimiento. Técnicas inteligentes.
3. Aplicaciones empresariales: Sistemas de planificación de recursos empresariales ERP.
UNIDAD 3: RECURSOS DE TECNOLOGÍA DE
INFORMACIÓN – Aplicaciones
2 Sistemas de Información para la Gestión
2
RECURSOS DE TI – Aplicaciones - Bibliografía
3 Sistemas de Información para la Gestión
Año 2015 3.1. Laudon y Laudon Parte II Cap 6 P Recursos TI - Aplicaciones LyL 225 – 238 LyL 245 – 248 3.2. Laudon y Laudon
Parte II Cap 8 LyL 238 – 243
SITUACIÓN ACTUAL: BIG DATA
Sistemas de Información para la Gestión Año 2015
3
5
INUNDADOS POR LOS DATOS
Cada vez se generan más datos:
Bancos, telecom, otras transacciones
comerciales...
Datos científicos: astronomía, biología, …
Web, texto y comercio electrónico
Sistemas de Información para la Gestión Año 2015
6
EJEMPLOS DE GRANDES CANTIDADES DE DATOS
Very Long Baseline Interferometry en Europa (VLBI)
16 telescopios
cada uno produce 1 Gigabit/second de datos astronómicos durante una sesión de observación de 25 días
problemas de almacenamiento y análisis
AT&T gestiona billones de llamadas al día
tantos datos que no pueden ser almacenados todos – el análisis debe hacerse a medida que llegan los datos (datos en streaming)
Sistemas de Información para la Gestión Año 2015
4
LAS BDs MÁS GRANDES EN 2012
1. The World Data Centre for Climate (Alemania): 220 TB + 6 PB 2. National Energy Research Scientific computing Center (EEUU): 2,8 PB 3. AT&T
4. Google: búsquedas 5. Sprint
6. Lexix Nexis: 250 TB de datos personales (incluye ADN) 7. YouTube.
8. Amazon: datos de 59 millones de clientes, 250000 libros completos 9. CIA.
10.Biblioteca del Congreso de EEUU.
7 http://www.siliconindia.com/news/enterpriseit/Top-10-Largest-Databases-in-the-World-nid-118841-cid-7.html
Sistemas de Información para la Gestión Año 2015
MONTONES DE DATOS EN TODAS PARTES
Enorme crecimiento en BDs comerciales y científicas debidas a avances en las tecnologías de generación y captura de datos
Nuevo mantra: recoge los datos que puedas donde puedas y cuando puedas.
Expectativas: los datos recogidos tendrán valor, para el propósito por el que se recogieron o para otro no evidente todavía.
Simulaciones por computadora Negocios
Redes de sensores Datos geo espaciales Seguridad nacional
Sistemas de Información para la Gestión Año 2015
5
Big Data
El primer cuestionamiento que posiblemente llegue a su mente en este momento es ¿Qué es Big Data y porqué se ha vuelto tan importante?
Sistemas de Información para la Gestión Año 2015
9
Big Data
Pues bien, en términos generales podríamos referirnos como a la tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos (estructurados, no estructurados y semi-estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a un base de datos relacional para su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales.
Sistemas de Información para la Gestión Año 2015
6
Big Data
Sin embargo, Big Data no se refiere a alguna cantidad en específico, ya que es usualmente utilizado cuando se habla en términos de petabytes y exabytes de datos. Entonces ¿Cuánto es demasiada información de manera que sea elegible para ser procesada y analizada utilizando Big Data? Analicemos primeramente en términos de bytes:
Gigabyte = 109 = 1.000.000.000 Terabyte = 1012 = 1.000.000.000.000 Petabyte = 1015 = 1.000.000.000.000.000 Exabyte = 1018 = 1.000.000.000.000.000.000
Sistemas de Información para la Gestión Año 2015
11
USO DE BD PARA MEJORAR EL DESEMPEÑO
EMPRESARIAL
Sistemas de Información para la Gestión Año 2015
7
Escenario actual
Contamos con un conjunto de tecnologías avanzadas que nos permiten integrar y analizar información de bancos de datos.
Para obtener:
sus tendencias,
para segmentar la información o
para encontrar la correlación en los datos.
Con el objeto de generar acciones con valor agregado para el negocio.
Sistemas de Información para la Gestión Año 2015
13
Expectativas
Necesitamos:
la integración de herramientas avanzadas con los datos,
procesos de generación de conocimiento y la segmentación de la información
para obtener tendencias e información oculta.
Sistemas de Información para la Gestión Año 2015
8
¿La solución?
Sistemas de Información para la Gestión Año 2015
15
Business Intelligence
Todo esto se hace para lograr lo que denominamos:
FUNDAMENTOS DE LA INTELIGENCIA DE
NEGOCIOS
Administración de Bases de Datos e Información Gestión del Conocimiento
Sistemas de Información para la Gestión Año 2015
9
Business Intelligence System es…
Sistemas de Información para la Gestión Año 2015
17
un “conjunto sofisticado de Herramientas y Tecnologías; que brindan soporte a todas las fases del proceso de toma de decisiones de los ejecutivos;
con el objeto de mejorar las ventajas competitivas de la organización, a través de mejores decisiones y que son utilizadas por los llamados Trabajadores del
Conocimiento”.
Howard Dresner (“The Gartner Group”)
Business Intelligence System…
Sistemas de Información para la Gestión Año 2015
18
“Aplicaciones de computación que interpretan datos históricos, analizan tendencias y miden performance y que están orientadas a servir de soporte a los procesos de toma de decisiones”
10
19
Business Intelligence es la
Realización eficiente de todas las actividades
relacionadas con la generación, extracción, organización, análisis, compartición y distribución del conocimiento de una organización.
Sistemas de Información para la Gestión Año 2015
Requerimientos
Capacidades y herramientas especiales para… …analizar extensas cantidades de datos. …acceder a datos desde múltiples sistemas.
Sistemas de Información para la Gestión Año 2015
11
Objetivos
Que incluyan…
…almacenamiento de datos.
…minería de datos y análisis predictivo. …descubrimiento del conocimiento.
Sistemas de Información para la Gestión Año 2015
21
DATA WAREHOUSE
Sistemas de Información para la Gestión Año 2015
12
Almacén de Datos – Data Warehouse
“El Data Warehouse es una colección de datos orientados al tema, integrados, no volátiles e
historiados, organizados para el apoyo de un proceso de ayuda a la decisión”.
Using the Data Warehouse of Bill Inmon
Sistemas de Información para la Gestión Año 2015
23
Herramientas o Procesos OLAP vs OLTP
OLAP (On-Line Analytical Processing):
Agilizan la consulta de grandes cantidades de datos. Permiten análisis multidimensional.
Utilizado por analistas.
OLTP (On-Line Transactional Processing):
Entrada de datos y recuperación y procesamiento de transacciones.
Acceso masivo.
Sistemas de Información para la Gestión Año 2015
13
Análisis multidimensional
Sistemas de Información para la Gestión Año 2015
25
Tiempo Año, Meses, Semanas, Días,...
Producto Rubro, Artículo, Calidad,...
Geográfica Zona, Sucursales,...
Procesamiento Analítico en Línea
Sistemas de Información para la Gestión Año 2015
14
Herramientas o Procesos OLAP vs OLTP
Sistemas de Información para la Gestión Año 2015 27 Sistemas OLTP BD Corporativa Data Warehouse Herramientas OLAP
Mercado de Datos – Data Mart
Subconjunto del Almacén de Datos, resumido o altamente enfocado.
Conjunto de tecnologías avanzadas susceptibles de analizar la información de un Data Warehouse para obtener sus tendencias, segmentar la información o encontrar la correlación en los datos.
Para una población específica de usuarios.
Se enfoca en un área objetivo o línea del negocio. Menor costo de implementación que un almacén de datos.
Sistemas de Información para la Gestión Año 2015
15
DATA MINING – MINERÍA DE DATOS
Sistemas de Información para la Gestión Año 2015
29
Surge una necesidad…
Las herramientas OLTP responden a preguntas concretas: ¿Cuánto se vendió el día ...?
¿Quién compró el producto …? ¿Cuál es el stock del producto …? ¿Cuál es la comisión del vendedor …?
Sistemas de Información para la Gestión Año 2015
16
Quiero saber…
¿Cuánto se vendió del producto X respecto de los objetivos por trimestre y región de ventas en los dos últimos años?
¿Qué clientes compraron simultáneamente los productos X e Y en todas sus operaciones en los dos últimos años?
El incremento / decremento de la venta de autos 0 Km (negocio externo) en los dos últimos años, ¿generó algún hábito de compra en alguna de las regiones?
Sistemas de Información para la Gestión Año 2015
31
Análisis Predictivo
Utiliza técnicas de: minería de datos, datos históricos y
suposiciones sobre condiciones futuras para… …predecir resultados de eventos.
Sistemas de Información para la Gestión Año 2015
17
¿POR QUÉ LA MD? DESDE LO CIENTÍFICO
Se recogen y guardan datos a gran velocidad
Sensores remotos en satélites. Archivos de NASA EOSDIS más de 1PB de datos sobre la Tierra por año.
Telescopios.
Datos biológicos.
Simulaciones científicas: generan TBs en solo unas horas
La minería de datos ayuda a los científicos
En el análisis automático de enormes conjuntos de datos
En la formación de hipótesis
Sistemas de Información para la Gestión Año 2015
33
GRANDES OPORTUNIDADES PARA RESOLVER
PROBLEMAS SOCIALES
Mejorar la salud y reducir costos
Encontrar energías alternativas
Predecir el impacto del cambio climático
Reducir el hambre, la pobreza aumentando la producción agrícola
Sistemas de Información para la Gestión Año 2015
18
35
Minería de datos
Comprende una serie de técnicas, algoritmos y métodos cuyo fin es la explotación de grandes volúmenes de datos con vistas al descubrimiento de información
previamente desconocida y que pueda servir de ayuda en el proceso de toma de decisiones, formando parte del conjunto de tecnologías de la Inteligencia de Negocio
Sistemas de Información para la Gestión Año 2015
36
¿QUÉ ES LA MINERÍA DE DATOS?
Minería de datos (descubrimiento de conocimiento en datos): extracción de patrones de conocimiento interesantes (no triviales, implícitos, previamente desconocidos y
potencialmente útiles) de cantidades enormes de datos.
Otros nombres
Descubrimiento de conocimiento en bases de datos (KDD)
Extracción de conocimiento
Análisis de datos, análisis de patrones
Arqueología de datos.
Dragado de datos (datos dredging)
Cosecha de información (harvest information)
Inteligencia de negocios (business intelligence)
Sistemas de Información para la Gestión Año 2015
19
37
¿QUÉ ES LA MINERÍA DE DATOS?
Ejemplo real de la NBA
Información jugada a jugada guardada por los equipos
Quién está en la cancha.
Quién lanza.
Resultados.
Los entrenadores quieren saber qué es lo que funciona
Jugadas que van bien contra un rival dado.
Combinaciones buenas / malas de jugadores.
Sistemas de Información para la Gestión Año 2015
DESCUBRIMIENTO DEL CONOCIMIENTO
Sistemas de Información para la Gestión Año 2015
20
39
DATOS, INFORMACIÓN Y CONOCIMIENTO
Conocimiento:
capacidad de convertir datos e información en acciones efectivas
Sistemas de Información para la Gestión Año 2015
40
TIPOS DE CONOCIMIENTO
Sistemas de Información para la Gestión Año 2015
21
41
Tipos de conocimiento (según su nivel de
abstracción)
Conocimiento evidente: fácilmente recuperable (SQL)
Conocimiento multi-dimensional: considera los datos con una cierta estructura (OLAP)
Conocimiento oculto: información no evidente,
desconocida a priori y potencialmente útil (Data Mining)
Conocimiento profundo: información que está almacenada en la base de datos, pero que resulta imposible de
recuperar a menos que se disponga de alguna clave que oriente la búsqueda
Sistemas de Información para la Gestión Año 2015
PIRÁMIDE BASELINE
42
Jill Dyché E-data. Transformando los datos en información con Data WarehousingSistemas de Información para la Gestión , Prentice Hall, 2001
22
Descubrimiento del conocimiento
43
Jill Dyché , Federico Plancarte
Sistemas de Información para la Gestión Año 2015
44
EVOLUCIÓN
PASO EVOLUTIVO PREGUNTA TECNOLOGÍA Recolección de
datos (1960s)
¿Cuáles fueron mis ingresos totales en los últimos cinco años?
computadoras, cintas, discos
Acceso a los datos (1980s)
¿Cuáles fueron las ventas unitarias en el NOA en Marzo? computadoras más rápidas, más baratas, más almacenamiento, bds relacionales Almacenes de datos, soporte a la toma de decisiones
¿Cuáles fueron las ventas unitarias en el NOA en Marzo, por producto y por edad? Hacer zoom en Salta.
computadoras más rápidas, más baratas, más almacenamiento, OLAP, bases de datos
multidimensionales, almacenes de datos
Minería de datos ¿Qué es probable que pase respecto a las ventas de Salta el mes que viene? ¿Por qué?
computadoras más rápidas, más baratas, más almacenamiento, algoritmos avanzados
Sistemas de Información para la Gestión Año 2015
23
45
DESCUBRIMIENTO DEL CONOCIMIENTO (KD)
Descubrimiento del Conocimiento: es la extracción no trivial de información: implícita
previamente desconocida
potencialmente útil a partir de los datos
W. J. Frawley, G.Piatetsky-Shapiro, C. J. Matheus
Knowledge Discovery in Databases (KDD)
Nombre técnico con que se denomina al proceso global de extracción de conocimiento de bases de datos.
Sistemas de Información para la Gestión Año 2015
46
Verificación vs. descubrimiento
Verificación
1. Elaborar una hipótesis sobre la existencia de una información de interés
2. Convertir la hipótesis en una consulta
3. Ejecutar la consulta contra un sistema de información
4. Interpretar los resultados
5. Refinar la hipótesis y repetir la ejecución
Descubrimiento
1. Identificar un objetivo o problema de negocio
2. Habilitar un acceso a los datos de interés y acondicionarlos
3. Seleccionar una técnica de explotación de los datos adecuada para el problema
4. Ejecutar la técnica contra los datos
5. Interpretar los resultados Las técnicas de minería de datos son herramientas que facilitan el descubrimiento de la información
Sistemas de Información para la Gestión Año 2015
24
47
¿Tienen sentido las respuestas obtenidas?
Sistemas de Información para la Gestión Año 2015
48
¿Tienen sentido las respuestas obtenidas?
Sistemas de Información para la Gestión Año 2015
25
49
Caso de estudio:
Pérdida de clientes (
attrition rate
)
Situación: una compañía de celulares suele
perder del 25 a 30% de sus clientes al año.
Con esto en mente, ¿cuál es nuestra tarea?
Suponga que tenemos información sobre clientes
de los últimos N meses.
Sistemas de Información para la Gestión Año 2015
50
Caso de estudio: Pérdida de clientes
Tarea:
Predecir quién probablemente dejará el servicio
en el próximo mes.
Estimar el valor de ese cliente y qué oferta nos
conviene hacer a ese cliente para que no se vaya
Sistemas de Información para la Gestión Año 2015
26
51
Caso de estudio: Pérdida de clientes
Resultados: Verizon Wireless construyó un almacén de datos de clientes.
Identificó posibles desertores.
Desarrolló modelos múltiples, según la región.
Contactó a clientes con alta probabilidad de aceptar la oferta.
Redujo la pérdida de clientes de más de 2%/mes a menos de 1.5%/mes (impacto enorme, por tener >30 M clientes)
(Datos de 2003)
Sistemas de Información para la Gestión Año 2015
52
Minería de datos y privacidad
En 2006, se informó que la NSA (National Security Agency) estaba minando años de datos de llamadas para identificar redes terroristas
El análisis de redes sociales puede ayudar a encontrar redes terroristas.
Sistemas de Información para la Gestión Año 2015
27
Deportes
Análisis del rendimiento de los jugadores, a partir de datos de una o más cámaras; análisis del adversario posterior al partido; fichaje de jugadores
53
http://www.prozonesports.com/folder/prozone/pdf/page_37.pdf
Sistemas de Información para la Gestión Año 2015
Deportes
54
McLaren también hace análisis retrospectivos del rendimiento del bólido en circuitos particulares para que el conductor entienda la mejor forma de manejar. El circuito de Mónaco es el mismo desde hace 30 años, así que tenemos años de datos para saber qué pasa con la suspensión en una curva determinada (CIO Burrell)
http://blog.sap-tv.com/2012/09/cnn-on-mclaren-f1-racing-team-using-sap/
McLaren F1: 120 sensores/auto 4MB/s enviados del auto al centro de control Hamilton frena una fracción de segundo más tarde que su compañero Button
Sistemas de Información para la Gestión Año 2015
28
GESTIÓN DEL CONOCIMIENTO - RESUMEN
Sistemas de Información para la Gestión Año 2015
55
…Para tomar decisiones
Sistemas de Información para la Gestión Año 2015 56 Conocimientos Data Mart Decisión BI Transacciones OLTP
29
GESTIÓN DEL CONOCIMIENTO – EDUCACIÓN
Sistemas de Información para la Gestión Año 2015
57
IECO – 05/13/2010 – Pág. 12 (sección Bonus)
Duchos para revelar el secretos de los números
Sistemas de Información para la Gestión Año 2015
30
UNIVERSIDAD NACIONAL DE BUENOS AIRES
Sistemas de Información para la Gestión Año 2015