• No se han encontrado resultados

Think Big Think Data Think Big Data

N/A
N/A
Protected

Academic year: 2021

Share "Think Big Think Data Think Big Data"

Copied!
40
0
0

Texto completo

(1)

Think Big

Think Data

Think Big Data

Fermín Febrero

Technology Consultant

(2)

En 2000 se generaron

DOS EXABYTES

(3)

Sources: “How Much Information?” Peter Lyman and Hal Varian, UC Berkeley,. 2011 IDC Digital Universe Study.

En 2000 se generaron

DOS EXABYTES

De información

(4)
(5)

Cuales son las causas de esta explosión?

Oil Exploration

Imagen Médica

Video vigilancia

Sensores móviles

Reproducción Video

Secuencia Genómica

Smart Grids

Social Media

FACEBOOK carga

250

MILLIONES

FOTOS cada dia

Coste de secuenciar

UN

GENOMA

Bajo de

$

100M EN

2001

a $10K EN 2011

Leer contadores inteligentes

CADA 15 MINUTOS ES

3000X MAS

INTENSIVO en

DATOS

Extracciones

petroliferas GENERAN

25000

DATOS POR

SEGUNDO

(6)

El valor de los datos crece

Nuevos modelos de negocio basados en nuevos DATOS

1,000,000,000

Consultas / Día

250,000,000

Nuevas Fotos/ Día

290,000,000

Atualizaciones / Día

(7)

Cómo usan BIG DATA en las empresas?

12

13

21

28

30

33

37

39

49

19

18

29

40

39

40

41

36

60%

Improvements to R&D processes

Automation of common or straightforward…

Pricing

New product strategies

Performance management & transparency in…

Customer service/support

Operations, service delivery, or supply chain…

Budgeting, forecasting, or planning

Customer insights, segmentation, or targeting

Ideally

Áreas funcionales en las que empresas utilizan BIG DATA para

mejorar rendimiento.

(8)

Big Data Transformando Banca

“Analizamos datos históricos del sistema

Reducir desgaste en el cliente

Contactos proactivos

Aumentar ingresos por cliente

Recomendar productos en base a

tendencias

Aumentar eficiencia operativa

(9)

1

El Proceso Big Data

(10)
(11)

EMC Isilon.

Escalabilidad.

Simplicidad.

(12)

Isilon: Almacenamiento Scale-Out para Big Data

Lider de la Industria en

Throughput e IOPS

Rendimiento

Gestionar PBs como TBs

Simplicidad

Escalabilidad

15 PB en Single

File System

(13)

Big Data Transforma Biologia



Acceso rápido a los datos

Escalar hasta 12PB con

rendimiento lineal

Colaboración en

investigación

Nuevos tratamientos

Reducción de dispersión

de epidemias

Reducir tiempo de

análisis.

“We’ve been able to grow a single file system to

a PB in less than a year & maintain the

(14)

Atmos

Big Data.

(15)

Big Data Distribuido

Sistemas distribuidos

Administración Manual

Único inquilino, muchos sistemas

Distribución manual de contenidos

Sistema único entre ubicaciones

Políticas automatización

Muchos Inquilinos, un sistema

Acceso autoaprovisionamiento

L.A.

BOSTON

LONDON

L.A.

BOSTON

LONDON

(16)

Big Data Transforma las subastas



Alcanzar audiencia GLOBAL

Escalar múltiples localizaciones



Mejorar la experiencia del

cliente



Reducir TCO

Políticas de activación

automática para expiración de

contenido

“eBay and EMC have worked closely for

more than a year to create a reliable,

(17)
(18)
(19)

Pluggable Storage Layer (HDFS API)

MapReduce Layer

Hadoop Tools

Greenplum Chorus

Solución EMC Enterprise Hadoop

Isilon

Greenplum

HDFS Protocol

lsilon OneFS

G

re

e

n

p

lu

m

C

o

m

m

a

n

d

C

e

n

te

r

(20)

Big Data Transforma Utilities



Predicción de picos y

apagones

Rápida detección de apagones

Reducir la perdida de potencia



Reducción de costes al

consumidor

Vista en tiempo real del

consumo de energía

(21)
(22)

Análisis predictivo: picos de voltaje

(23)

1

El Proceso Big Data

CLOUD

SOCIAL

(24)
(25)

UN NUEVO EQUIPO PARA BIG DATA

(26)

PROCESOS ANÁLITICOS CLÁSICOS

1. Buscar

el dato

2. Acceso al

dato

4. Crear

Sandbox

5. Análisis

6. Modelo Operativo

3. Aprender del

dato

(27)

Chorus: Plataforma SOCIAL para Big Data

Proyecto

Análisis

Datos

Publicar

Iterar

Comprobar

Explorar

Datos

Collaboration

(28)
(29)

Acelerando el proceso de BIG DATA: UAP

1

CLOUD

SOCIAL

(30)

1

El Proceso Big Data

(31)

Documentum xCP

Flujos de trabajo y

(32)

xCP: modelar y representar Big Data

Modelos de decisión

Deliver The Latest Data

Auditoria

Keep IT Audit Happy!

Construcción

(33)

AGILE DEVELOPMENT

(34)

AGILE DEVELOPMENT TOOLS

(35)

El Proceso Big Data

1

CLOUD

AGILE

2

3

SOCIAL

TRANSICIÓN a

EMPRESA

PREDICTIVA

(36)

Resolviendo la ecuación de Big Data

1

2

3

(37)
(38)
(39)

El viaje de Big Data

1

CLOUD

AGILE

2

3

(40)

Referencias

Documento similar

Además, durante la realización de este proyecto se ha diseñado y desarrollado un sistema que permite detectar el uso de herramientas de chat mediante el

Linked data, enterprise data, data models, big data streams, neural networks, data infrastructures, deep learning, data mining, web of data, signal processing, smart cities,

La identificación de relaciones que, a causa de la multitud de circunstancias que acompañan a la acción educativa, no se perciben a simple vista es el argumento

En el siguiente apartado y posteriores incorporamos el sector turístico como objetivo de la gestión del Big Data, el turismo es una rama principal en la economía de nuestro país y

Apache Hadoop es actualmente la herramienta libre más utilizada para el análisis de Big Data, si bien también existen alternativas diseñadas para problemas específicos y, por

Análisis de las características, herramientas, tecnologías y estándares relacionados con Big Data. Sectores que implementan en la actualidad soluciones Big Data en sus

To analyze the available data quality models in the context of Big Data applications and adapt a quality model from the existing ones which can be applied to specific Big

The k Nearest Neighbors (kNN) [32] algorithm is recognized as one of the top ten most influential algorithms in data mining because of its effectiveness on classification and