Barcelona Supercomputing Center - Centro Nacional de Supercomputación

(1)

Barcelona Supercomputing Center -

Centro Nacional de Supercomputación

3a Jornada de Usuarios de la RES 1 de julio de 2010

Sergi Girona Director Operaciones

(2)

Centro Nacional de Supercomputación

•

Misión del BSC-CNS

•

Investigar, desarrollar y gestionar la tecnología

para facilitar el avance de la ciencia

•

Objectivos del BSC-CNS

•

I+D en Computer Sciences, Life Sciences y Earth

Sciences.

•

Soporte de supercomputación para la

investigación externa al BSC-CNS

•

BSC-CNS es un consorcio que incluye :

•

Gobierno de España (MICINN) – 51%

•

Generalitat de Catalunña (DIUE) – 37%

(3)

BSC-CNS: vertebrador del servicio de

supercomputación en España

Magerit

Universidad Politécnica Madrid

Atlante ITC La Palma

IAC

CaesarAugusta Picasso _Altamira _Tirant MareNostrum BSC !" #!" $!" %!" &!" '!!" '#!" '$!"

#!!%"(#" #!!%"()" #!!%"($" #!!*"('" #!!*"(#" #!!*"()" #!!&"('" #!!&"(#" #!!&"()" #!!+"('" #!!+"(#" #!!+"()" #!'!"('" #!'!"(#"

!"#$%&'&()*(+*,'*-./** (,-./01,2" 3..,202" !" #!!!!" $!!!!" %!!!!" &!!!!" '!!!!" (!!!!" )!!!!" *!!!!" +!!!!" !"#$%&'$&()*+%&$,&#+&-./& -./01"012340501" -./01"610501" -./01"7852501" 90:.1"0;:60<2=05.1"0""%!>!(>$!#!" ,8/2.5."0;:60<"0;0?0"84"@642."

(4)

BSC-CNS: vertebrador del servicio de

supercomputación en España

•

Formación

•

Usuarios y Administradores de equipos

•

Soporte

•

Paralelización, escalabilidad y mejora de rendimiento

(5)

(6)

(7)

MareNostrum: una mar viva

•

MareNostrum2004

•

4812 PowerPC 970 cores

•

2406 JS20 2.2 GHz

•

10 TB of Memory

•

4 GB per node

•

270 TB Storage Capacity

•

3 networks

•

Myrinet

•

Gigabit

•

10/100 Ethernet

•

Operating System

•

Linux 2.6 (SuSE)

(8)

MareNostrum: una mar viva

•

MareNostrum2006

•

10240 PowerPC 970 cores

•

2560 JS21 2.3 GHz

•

20 TB of Memory

•

8 GB per node

•

480 TB Storage Capacity

•

3 networks

•

Myrinet

•

Gigabit

•

10/100 Ethernet

•

Operating System

•

Linux 2.6 (SuSE)

(9)

Red Española de Supercomputación

MareNostrum

Processor: 10240 PowerPC 970 2.3 GHz

Memory: 20 TBytes

Disk: 280 + 90 TBytes

Network: Myrinet, Gigabit, 10/100

System: Linux

UPM

Processor: 2408 PowerPC 970 2.2 GHz

Memory: 4.7 TBytes

System: Linux

IAC, UMA, UC, UZ, UV

Process: 512 PowerPC 970 2.2 GHz

Memory: 1 TByte

System: Linux

Gobierno Canarias (ITC)

Process: 336 PowerPC 970 2.3 GHz

Memory: 672 GByte

Disk: 3 TBytes

(10)

Robot SL8500: HSM / Backup

•

7500 cintas LTO4 de 800 GB cada una ≈ 6 PB nativos

•

8 Brazos trabajando en 4 niveles de altura

•

23 Unidades lectoras LTO 4

•

5 Servidores (Sun Fire v445, 4 CPU UltraSPARC III, 8 GB RAM)

(11)

Otros sistemas

•

Sistema de memoria compartida

•

64 blades

•

2 Montecito, dual core 1.6, total 256 cores

•

Cache 8 Mbytes

•

2.5 Terabyte main memory

•

Data Bases

(12)

MariCel: Prototipo Español en PRACE

MariCel in 2 racks of MareNostrum computer room

IBM QS22 Blade Center

72 QS22 IBM Blade servers PowerXCell 8i 3.2Ghz cpus 864 GB RAM total

1296 cores

12 JS22 IBM Blade servers

Power6 64 bits 4.0 GHz dual core 96 GB RAM total 48 cores 4xDDR InfiniBand (16Gb) MPI, GPFS 4 x 24 ports switch Peak performance

14.4 Tflops from 2 rack units 20 Kwatts

(13)

CNAG, Centro Nacional de Análisis Genómico

•

National centre of Genomics analysis

•

BSC provides HPC and data IT services to CNAG

•

Next generation sequencing

Aligned results 250-500 GB/run Sequence analysis, Alignment and clustering Raw Data: 1-2TB/run 2 runs/week 10 machines Image processing To generate sequence data Rapid sequencing of whole individuals, Detailed studies of cellular processes

(14)

Infraestructura del CNAG

•

1 PB of Storage in 2 Lustre Filesystems:

•

/project – 400 TB for sequencing results

•

/scratch – 600 TB temporary and intermidiate data

•

5 GB/s of performance in reads and writes shared between both filesystems

FC8 MDS1 MDS2 Metadata Storage 48x SAS 450 GB Data Storage 600x SATA 2 TB OSS 1 OSS 2 OSS 3 OSS 4 Journal 4xSSD + 5xHDD 1/ 10 G E SWITCH Compute Cluster - 104 nodes – 832 cores - 8 cores per node -18 GB DDR3 per node - IB QDR non-blocking for MPI

- Performance peak 9TF

(15)

Infraestructura en el CNAG

MDS1 MDS2 Metadata Storage Data Storage 1 PB OSS 1 OSS 2 OSS 3 OSS 4 Journal 1/ 10 G E SWITCH

CNAG Compute Cluster

18 x 10GE

1 GE link FC8 link 10GE link

10 Sequencers

MareNostrum 6PB Tape Storage

10 x 10GE

(16)

Proyectos científicos en la RES

Astronomía, Espacio y Ciencias de la Tierra Biomedicina y Ciencias de la Vida Física e Ingeniería Química y Ciencia y Tecnología de los Materiales BSC 12 17 12 16 21 14 14 11 14 12 14 11 14 18 16 216 20 26 18 18 26 24 20 28 24 22 23 26 29 24 19 347 19 24 17 20 32 29 22 21 32 26 24 21 23 21 25 356 21 27 23 18 33 32 31 26 29 26 22 22 16 23 26 375 14 19 14 14 22 29 17 17 20 17 17 16 16 17 17 258

(17)

Proyectos de la RES

Red privada RES (a través de RedIris)

Internet

Cabeza Nodo RES Accounting Monitorización rendimiento Sistema de alarmas

Administración Usuarios Centralizada Monitorización de Red

Informes de uso de usuarios Trouble ticket system

INCA: disponibilidad de servicios Perfminer Monitor GPFS Logins Frontend Moab-MC Proceso GPFS-MC Transferencias (SSHFS,gridftp,…) HSM (via NFS from BCN) LAN local (acceso restringido)

(18)

Red de la RES

•

Red privada entre los centros de la RES proporcionada por RedIris

•

Servicios con requerimientos ancho de banda

•

GPFS-MC: Enlace de 1 Gbit mínimo

•

Montaje HSM

•

Transferencia de ficheros

•

Servicios con requerimientos de seguridad

•

Monitorización de la red de la RES

•

Sistema de autenticación distribuido

•

Monitorización de clusters

•

Accounting de horas de computación

•

Repositorio de software de computación

•

Servidores de licencias compartidos para la RES

(19)

Soporte de proyectos/actividades en la RES

• El nivel de soporte que se da a los proyectos que se ejecutan en la RES es :

• Optimización de Código para los supercomputadores de la RES

• Paralelización y mejora de escalabilidad

• Optimización en procesos de Input/Output

• Porting de códigos ( Arquitectura, GridSuperscalar,...)

• Training de usuarios

• Debugging de códigos (Totalview, Paraver, DDT,...)

• Resolución de problemas técnicos y administrativos .

• Creación de cuentas

• Ayuda en la petición de recursos

• Informes semanales

(20)

Soporte de proyectos en la RES

•

A parte de lo comentado anteriormente, existen opciones para

recibir soporte extra :

•

Actividades de test

•

Ayudas ICTS

•

Visitas al site asignado para soporte in-situ

•

Preparación de actividades

•

http://www.bsc.es/plantillaA.php?cat_id=66

•

Movility program HPC-Europa2

(21)

Jornadas de Usuarios

•

Presentación de RES, Difusión de investigaciones en diferentes áreas de la Ciencia, Comité de Acceso

•

1a Jornada: Barcelona, 23 de abril de 2008

•

Speakers: Francisco Javier Luque, Arcadi Navarro, Javier

Jiménez Sendín, Fernando Martín, Gustavo Yepes, Fernando Moreno Insertis, Francesc Illas, Rubén Pérez, Fernado Javier de la Cruz.

•

2a Jornada: Santander, 23 de setiembre de 2009

•

Speakers: Sjors Scheres, Carme Rovira, Assumpta Parreño

García, Francisco Castejón, Marcel Swart, Nuria Lopez, Pablo Fosalba, Enrique Martinez Gonzalez, Ramón Beivide, Joaquin Serrano, Sergi Girona.

(22)

Formación de usuarios

•

User Training: Programming models (STARSs)

•

Fecha: 20-21 Septiembre de 2010. Lugar: Barcelona

•

Fecha: 14-15 Octubre, 2010. Lugar: Tenerife

•

Temas

•

Introducción y objetivos de GridSs/COMPSs

•

Migración de GridSs a COMPSs

•

Introducción a STARSs

(23)

Formación de usuarios

•

Parallel computing

•

Fecha: 20 Octubre de 2010

•

Lugar: Santander

•

Temas:

•

Librerías paralelas de I/O (p.e. Parallel-HDF5, PNETCDF)

•

Sistemas de ficheros paralelos (GPFS, LUSTRE,…)

•

MPI2 centrado en Parallel I/O

•

Uso eficiente de sistemas de ficheros paralelo

(24)

Formación de usuarios

•

Introduction to supercomputing

•

Fecha: 4 de noviembre de 2010

•

Lugar: Barcelona

•

Temas:

•

Introducción a la supercomputación

•

Optimización de código

•

Adaptación de aplicaciones a un entorno paralelo usando

(25)

Formación de usuarios

•

Simulaciones paralelas en la red

•

Fecha: 10 de noviembre de 2010

•

Lugar: Zaragoza

•

Temas:

•

La discretización del espacio (e incluso del tiempo) permite reducir enormemente los grados de libertad y acelerar las simulaciones. Además una discretización apropiada en problemas donde la interacción es relativamente local, permite paralelizar de forma altamente eficiente.

•

Son muchos los problemas donde pasar a trabajar en la red, es posible. Abarcan desde las simulaciones de Dinámica Molecular en Materia Condensada, en péptidos, en proteínas, en docking, etc, las simulaciones Gauge en el Retículo, con y sin ferminoes dinámicos,

simulaciones con elementos finitos, o simulaciones de Monte Carlo de sistemas magnéticos, entre otros muchos.

•

En estos modelos las altas eficiencias paralelas se obtienen no solo por la discretización del espacio o el tiempo, sino también por desarrollos de algoritmos numéricos y

computacionales importantes que se han producido en los últimos años.

•

Speakers:

•

Dinámica molecular: Grupo de Ángel Rubio

•

Proteínas: Grupo de Modesto Orozco

•

Teorías Gauge con Fermiones en la Red: Grupo de Vicente Azcoiti y Grupo de Pilar Hernández

(26)

Seminarios científicos

•

Proteómica

•

Fecha: a determinar

•

Lugar: Málaga

•

Astrofísica

•

Fecha: a determinar

•

Lugar: Valencia

•

Ciencias de la Tierra

•

Fecha: a determinar

•

Lugar: Barcelona

(27)

Seminarios/Formación técnicos

•

Implementación del enfoque ITIL en la gestión técnica de los servicios de la RES

•

Fecha: 18 y 19 de mayo de 2010

•

Lugar: Santander

•

Temas: Certificación ITIL, ITIL en Centros de Supercomputación,

Herramientas básicas, Documentación de ITIL

•

Speakers: Jesús Marco & Ibán Cabrillo (IFCA), Roberto Hidalgo & Carlos San

Martín (CIC-SL), Antonio J. Arévalo Manzano & Miguel A. Sanz (SATEC), Michael Brenner (LRZ), Javier Bartolomé & David Vicente (BSC)

•

Gestión energética y refrigeración de un CPD

•

Fecha: 19 y 20 de mayo de 2010

•

Lugar: Santander

•

Temas: Introducción a la refrigeración de un HPC, Impacto en el coste de los

servicios, Código de conducta en CPDs

•

Speakers: Jesús Marco & Fernando Gómez (IFCA), Ángel García (IBM), Ángel

Pérez (APC), Celestino Güemes (Mundivia-Atos), Henry Daunet & Miquel Pérez (AST), Iván Gimeno (Rittal), Oscar Higuera & David García (Talleres Hidalgo)

(28)

Seminarios/Formación técnicos

•

Gestión de almacenamiento en la RES

•

Fecha: 14 de septiembre de 2010

•

Lugar: Barcelona

•

Temas:

•

Descripción del hardware de almacenamiento en la RES.

•

Tareas típicas de mantenimiento, herramientas de

monitorización, optimización...

•

GPFS: descripción, comandos, cuotas, versión

multicluster...etc.

(29)

Seminarios/Formación técnicos

•

Funcionamiento y aplicación de Perfminer

•

Fecha: 15 de septiembre de 2010

•

Lugar: Barcelona

•

Temas

•

Descripción del funcionamiento y aplicación de Perfminer

para recopilar, almacenar y representar datos sobre el rendimiento del sistema.

•

Seminario técnico: Visualización y realidad virtual

•

Fecha: 15 de diciembre de 2010

•

Lugar: Barcelona

•

Temas

•

Introducción a la visualización científica usando realidad virtual

(30)