• No se han encontrado resultados

S11. III Seminari internacional sobre imatge mèdica i les tecnologies de la informació

N/A
N/A
Protected

Academic year: 2021

Share "S11. III Seminari internacional sobre imatge mèdica i les tecnologies de la informació"

Copied!
33
0
0

Texto completo

(1)

PIC port d’informació científica

T E R C E R A E D I C I Ó D E S A B A D E L L U N I V E R S I T A T D E L 5 A L 9 D E J U L I O L D E 2 0 0 4

L'evolució d'internet i la Web cap a una infraestructura Digital Global

S11. III Seminari internacional sobre imatge mèdica i les tecnologies de la informació

Prof. Manuel Delfino, director Port d'Informació Científica (PIC), Universitat Autònoma de

Barcelona

Sabadell, 9 de juliol de 2004

(2)

PIC port d’informació científica

La evolución de la Internet y la Web hacia una Infraestructura Digital Global

III Seminario Internacional sobre Imagen Médica y Tecnologías de la Información

Prof. Manuel Delfino

Director, Port d´Informació Científica (PIC)

Coordinador del área sudoeste proyecto EGEE de la UE

(3)

PIC port d’informació científica

Colaboración fluída:

Clave a la innovación y el bienestar

• La colaboración fluída, interactiva, configurable y segura entre instituciones diversas será una clave para la innovación y el

bienestar en esta década.

• Ejemplos:

– Universidades ↔ Empresas

– Hospitales ↔ Centros de Asistencia ↔ Centros de Investigación – Ciudadanos ↔ Entidades gubernamentales

– Grupos de ciudadanos ↔ Grupos de ciudadanos – etc.

• Para lograr esta meta, necesitamos evolucionar la Internet y la Web hacia una Infraestructura Digital Internacional, de manera similar a la creación del sistema telefónico global en el siglo XX.

• En el caso de la colaboración en el ámbito de la Ciencia y la

Tecnología, se necesita acceso a grandes bancos de datos y a

grandes batería de ordenadores. La Grid es una Infraestructura

Digital Internacional que enfatiza estos aspectos.

(4)

PIC port d’informació científica

Características

de la Internet y la Web

• Característica común:

– Arquitecturas distribuídas sin control central

– Escalables, en principio, a un gigantesco número de nodos

• Arquitectura Internet:

– Interconexión de instancias de red (net)

– Presupone una correlación entre localización geográfica y dominio de administración/seguridad

– Interacción entre iguales (peers) utiliza protocolos

– Los protocolos utilizan voluntariamente puertos determinados

• Arquitectura Web:

– Crea un espacio de nombres uniforme (URL) y entrelazable

– Enfatiza gran facilidad de “leer” páginas de información “ofrecidas” en servidores. Pero todo es visible a todos.

– “Publicar” (“escribir”) es relativamente difícil y el acceso se basa en información de la red local donde se encuentra el servidor.

– Introduce una nueva familia de protocolos en Internet (http, port 80)

(5)

PIC port d’informació científica

¿Qué problemas se han ido

encontrando en la Internet y la Web?

• La Web es una idea brillante y exitosa. Pero su

“unidireccionalidad” limita los esquemas de colaboración.

• Las aplicaciones Internet de hoy están limitadas por:

– Una arquitectura red-red en un mundo persona-persona, lo cual lleva a la necesidad de corta-fuegos (firewalls)

– Muchos protocolos de “escritura” presumen ausencia de abusos, pero los abusos existen tales como el spam

– El modelo de administración/seguridad basado en localización geográfica es demasiado rígido en un mundo de personas en constante movimiento, no existe el roaming Internet

– La mayoría de las transmisiones son sin encriptación, por lo tanto los “pinchazos virtuales” son habituales.

– Quizás el peor peligro todavía no ha sido explotado: Es

relativamente fácil simular ser miembro de una net sin serlo.

(6)

PIC port d’informació

científica Una caricatura para ilustrar…

(7)

PIC port d’informació científica

The Power Grid:

On-Demand Access to Electricity

Quality, economies of scale

Decouple production &

consumption, enabling

• On-demand access

• Economies of scale

• Consumer flexibility

• New devices

Adapted by permission from Ian Foster, University of Chicago and US Argonne National Lab Time

(8)

PIC port d’informació

científica But Computing Isn’t Really Like Electricity!

• How about “access computing resources like we access Web content”?

– We have no idea where a website is, or on what computer or operating system it runs

⇒Two interrelated opportunities

1) Enhance economy, flexibility, access by virtualizing computing resources

2) Deliver entirely new capabilities by integrating distributed resources

Adapted by permission from Ian Foster, University of Chicago and US Argonne National Lab

(9)

PIC port d’informació

científica Virtualization

Servers:

Execution Application

Services:

Distribution

Application Virtualization

• Automatically connect applications to services

• Dynamic & intelligent provisioning

Infrastructure Virtualization

• Dynamic & intelligent provisioning

• Automatic failover

Applications:

Delivery

Source: The Grid: Blueprint for a New Computing Infrastructure (2 nd Edition), 2004

(10)

PIC port d’informació científica

Architecture, Automation and

Quality of Service for the Users

(11)

PIC port d’informació

científica Evolution of data-processing environments

Mainframes

Operating systems Numerical methods Time-sharing computing

Mini-computers, Relational Databases Process Automation

Microprocessors, PC, Mac Personal Productivity

Fiber optics, Ethernet, TCP/IP, Internet The Network Society

Digital ID infrastructure, Grid Infrastructures Virtual Communities sharing Digitized Data Ubiquitous wireless self-configuring devices Ambient Computing

1 10 100 1000 10000 100000 1000000 10000000

1950 1960 1970 1980 1990 2000 2010 2020

Decade

Complexity and Functionality Programming

Computers

Commoditization More users, new markets

(12)

PIC port d’informació

científica Evolution of data-processing environments

Mainframes

Operating systems

Mini-computers, Relational Databases Microprocessors, PC, Mac

Fiber optics, Ethernet, TCP/IP, Internet Digital ID infrastructure, Grid Infrastructures Ubiquitous wireless self-configuring devices

Numerical methods Time-sharing computing Process Automation Personal Productivity The Network Society

Virtual Communities sharing Digitized Data Ambient Computing

1 10 100 1000 10000 100000 1000000 10000000

1950 1960 1970 1980 1990 2000 2010 2020

Decade

Complexity and Functionality Programming

Computers

We are here

WWW invented here

Internet “born” here

First e-mail ever sent

(13)

PIC port d’informació científica

Lead-times and momentum in R+D Internet – Web – Web Services – Grid

DNS, Akamai, SSL,

Yahoo, co-location,

Web Hosting, etc.

(14)

PIC port d’informació

científica La arquitectura Internet y Web

Aplicaciones originales de Internet:

• Transferencia de ficheros (ftp)

• Terminal remota (telnet)

• Correo electrónico (smtp, pop)

Noten que todas estas son “intrusivas” ya que “escriben” en máquinas ajenas

La Web también es una aplicación. Su gran éxito es atribuíble a un cambio de

paradigma:

“Ofrecer” abiertamente páginas a browsers.

Posibilita la construcción dinámica de

“catálogos”. AltaVista (1995), Google hoy

Internet Transporte

Aplicación

Circuito

Arquitectura Internet

(15)

PIC port d’informació

científica La arquitectura Grid

Aplicación

Tejido Digital

Gestión de dispositivos:

ordenadores, almacenamiento, etc.

Interconexión

Re-utilizar Internet entrelazando seguridad y deslocalización

Gestión Recursos

Abstracción y Virtualización de cada servicio. Identidad en red.

Grupo

Acceso a recursos agrupados a

través de infraestructura de servicios

Individuo

Servicios especializados para aplicaciones/usuarios específicos

Internet Transporte

Aplicación

Circuito

Arquitectura Internet

Servicios Grid

Adaptado bajo permiso de Foster and Kesselman

(16)

PIC port d’informació científica

Personas Colaborando

Middleware específico

Middleware general Infraestructura Grid

Infraestructura Grid:

Punto de vista del usuario

Tejidos Digitales que reaccionan a las demandas de una

comunidad

distribuída

(17)

PIC port d’informació científica

Middleware general Infraestructura Grid

Middleware específico

Comunidades de personas de

diversos ámbitos que

colaboran a distancia Tejidos

Computacionales utilizados de manera mas flexible y eficiente

Middleware específico Middleware específico Una Infraestructura Grid

permite la existencia de

muchas “Grids”

(18)

PIC port d’informació científica

Middleware Infraestructura Grid

Computadores y

Almacenamiento en Grid

Infraestructura de Red

“Grids” e Infraestructura Grid:

Perspectiva del Proveedor

Múltiples organizaciones virtuales presentan demandas sobre los

servicios

(19)

PIC port d’informació científica

El próximo paso en el ámbito de apoyo a I+D:

“Catalizador Grid para la e-Ciencia en Europa”

(20)

PIC port d’informació científica

VI Programa Marco de la UE:

Apuesta definitiva por Grid

Proyecto EGEE: 70 instituciones, financiación 32 M€ en 2004-2005

PIC coordina el centro regional de operaciones del Sudoeste de Europa

(21)

PIC port d’informació científica

Status of centers connected to the EGEE Grid Infrastructure

HP Labs Puerto Rico

(22)

PIC port d’informació científica

20.000 colas batch en ordenadores

42.000 Gigabytes de almacenamiento

(23)

PIC port d’informació científica

Sumario: Un dibujo vale mil palabras…

PIC port d’informació científica

Catàleg de Rèpliques

Servidor de cintes

Lecto ra Infraestructura

Grid

Servidor de cintes

Le ct or a Catàleg local

Catàleg local

Transformador de dades

RAIM

(24)

PIC port d’informació científica

PIC: Centro de apoyo a investigación que utilize cantidades masivas de datos

Edifici D – Campus UAB

(25)

PIC port d’informació

científica PIC: 2 Areas: Racks + Robot(s)

(26)

PIC port d’informació

científica PIC: 2 Areas: Racks + Robot(s)

1000 “u” of Racks ready for CPU and disk servers

LAN: All switched Gbps Ether

WAN: Dedicated VLAN 500 Mbps

6000 slot STK L5500 Robot

2 9940B drives (need to get more!)

Space for 3 more Robots with virtually no

construction work.

(27)

PIC port d’informació

científica Farm, Disk+Tape Servers, Grid “Plug”

120 Dell P4 3 GHz HT

Grid UI, RB, BDII, SE, CE SuperMicro

IDE Disk Servers

HP DL140 Pizza Boxes Dell Poweredge Tape Servers

(28)

PIC port d’informació

científica PIC: Electrical safety features

Individual Rack Smoke Detectors connected to

Electrical Breakers

(29)

PIC port d’informació

científica PIC: Safety features

Global Laser-based smoke detection

Potassium Carbonate powder fire

extinguishing “bombs”

(30)

PIC port d’informació científica

Level 1 - Sp

ecial H

ardwa re Level 2 - Em

bedde

d Proc

essors

40 MHz

40 MHz (1000 T

B/sec ) (1000 T

B/sec )

Level 3 – Fa

rm of c ommo dity C PUs

75 KHz 75 KHz

(75 G

B/sec ) (75 G

B/sec )

5 KHz 5 KHz

(5 GB /sec) (5 GB /sec)

100 H z

100 H z (100 M

B/sec ) (100 M

B/sec )

Enormous amount of data to be stored and analyzed (CMS

experiment)

Data R

ecordin g &

Data R

ecordin g &

Offline

Analysi s Offline

Analysi s 4 experiments:

10 Petabytes/year to be analyzed by worldwide community

during >10 years

100 MB/sec ~ 2 Petabytes/year

(31)

PIC port d’informació científica

Economías de escala: Datos de Física de Partículas (PIC tendrá que gestionar un 5%)

Automated Tape Storage Estimates at CERN

0 20 40 60 80 100 120 140

1995 1997 1999 2001 2003 2005 2007 2009 2011 2013 2015

Pe ta b y te s

Accumulation: 10 PB/year

0 0,2 0,4 0,6 0,8 1

1995 1996 1997 1998 1999 2000

Cern fixed target

Cern LEP

LHC

(32)

PIC port d’informació científica

UDIAT – PIC Collaboration on Medical Image Archive

• Build virtualized storage resource to enhance UDIAT online capabilities at low cost

• Make available UDIAT data for research using medical images

• “Proof of principle” and “calibration of effort” for embedding a PACS into a Grid Infrastructure

• Possible long-term benefits:

– Vastly enhanced volume of data for research

– Secure, location independent access to patient data without homogeneization of hardware and software

• Status today:

– Few months to get organized: Build “dictionary” so that we could understand each other.

– Agree on “anonimization protocol” (Spanish Data Privacy law, etc.) – Finally start test of data migration. One week of test (34 Mbps WAN):

200 GB migrated (0.5% of PIC data), 125K files (25% of PIC files)

(33)

PIC port d’informació científica

Mas información: www.pic.org.es y www.eu-egee.org

PIC port d’informació científica

Catàleg de Rèpliques

Servidor de cintes

Lecto ra Infraestructura

Grid

Servidor de cintes

Le ct or a Catàleg local

Catàleg local

Transformador de dades

RAIM

Referencias

Documento similar

Linked data, enterprise data, data models, big data streams, neural networks, data infrastructures, deep learning, data mining, web of data, signal processing, smart cities,

Una de las misiones básicas de la universidad es la formación de sus alumnos en la investiga- ción científica. Esta misión debe alcanzar su máxima expresión en

a) Descriure quines són les TIC més usades en la comunicació dels actors vinculats amb l’esport: organitzacions esportives, organitzacions comercials esportives, mitjans

Jo entenc que en drets i deures, la nostra Constitució es queda curta en aquest moment històric en temes com les noves tecnologies de la informació i les comunicacions, o

La Universitat Jaume I, com altres universitats espanyoles, està realitzant un esforç important en l'aplicació de les tecnologies de la informació i les comunicacions (TIC)en tots

In particular: to apply several improvements in the Distributed Analysis and the Derivation Framework; to provide multicore queues to serve the multicore jobs;

(ii) Trans-national access and/or service activities, to support scientific communities in their access to the identified research infrastructures;. (iii) Joint

[r]