Riunione MPI-multicore del 23/03/2012

Location: INFN-CNAF, Via Ranzani Bologna, sala Riunioni Asinelli , dalle 10:30 alle 12:30

Programma

  • Stato dell'infrastruttura
  • Discussione su problematiche di Configurazione
    • Come escludere i job seriali (Role=parallel vs redirezione con submit filter sul Job Manager)
    • Come dedurre in numero di job slot effettivamente disponibili
    • Quali TAG pubblicati per il match making
    • Necessita' di un'area per il checkpoint
    • Quali compilatori e applicativi.
  • Report dall'MPI-VT di EGI MPI_VT_report_for_MPImulticores.ppt (A. Costantini)
  • Selezione delle applicazioni che verranno utilizzate sull'infrastruttura
    • Per ogni applicazione occorre indicare:
    • Breve descrizione dell'applicazione e persone coinvolte
    • requisiti computazionali rilevanti quali:
      • modello di parallelismo (whole-node, puro mpi, ibrido) , tipico numero di nodi/CPU
      • ambiente software e modalita' di compilazione
      • dati coinvolti, eventuale necessita' di area di checkpoint
      • Altre info utili
  • Stato dell'IGI Portal

Minute

Presenti

  • in remoto; da Napoli, Vania Boccia, Giovanni Barone, Luisa Carracciuolo; da Pisa, Enrico Mazzoni; da Catania, Giuseppe Andronico, Ugo Becciani
  • a Bologna, Roberto Alfieri, Roberto De Pietri, Francesco Bedosti, Cristian Degli Esposti, Massimo Drudi , Marco Bencivenni, Alessandro Costantini, Antonia Ghiselli, Luciano Gaido
  • Da Sissa, Stefano Cozzini ha inviato una mail con le info sulle applicazioni di test

Infrastruttura

  • Pisa; la configurazione della nuova release EMI sara' completata entro marzo e sara' un CE di produzione (128 nodi x 8 core)
  • Parma; OK
  • Napoli; OK (8nodix8); ricca configurazione di librerie accessibili dalla VO unina.it. Chi fosse interessato puo' essere inserito in questa VO.
  • SISSA; verificare se la configurazione e' stata completata
  • Perugia; OK
  • CNR/INAF-BO: ancora problemi con il batch system
  • COMETA/INFN-CT; disponibilita' di un cluster con infiniband.

Configurazione servizi

  • come evitare che le risorse siano anche utilizzate per job seriali. Il meccanismo dei ruoli (role=parallel) complica il lavoro dell'utente. Da verificare la possiblita' di avere un unica coda generica, demandando al batch syste la gestione del tipo di job, che potrebbe essere rediretto verso una coda specifica (coinvolgere Valerio). Per ora si utilizzera' un BDII separato. Da verificare il possibile utilizzo del BDII di test del CNAF.

  • importante il monitoraggio dei job attraverso l'accesso ad un'area comune di checkponting via storm. Problemi: Da Storm non si riesce ad accedere a file scritti dai Job (di proprieta' di pool account); Il portale ancora non gestisce i file Storm che non sono in Catalogo.

Applicazioni

  • SISSA, Stefano Cozzini
    • Quantum/espresso: ci sono un paio di studenti SISSA di dottorato che stanno provando ad usare MPI su grid per le loro applicazioni. Cerchero' con loro di portare il codice e di capire quanto riescono a fare sulla grid. L"utilizzo sara' principalmente su nodi multicore ( wholenode) ma non e' escluso che abbiano bisogno di 32/64 core per alcune cose. Il codice richiede Intel compiler per essere efficiente + MKL +FFTW3
    • RegCM: qui continueremo la sperimentazione all'interno di un nodo multicore (wholenode). L'idea e' di girare in grid la verfica e la validazione dei vari modelli: quindi molti run brevi ma non lunghissimi. Le dipendenze software qui sono nulle perche' manderemo in grid il relocatable package che contiene tutto quanto
    • LAMMPS: codice di dinamica molecolare che e' usato da studenti Sissa e con iil quale vorremmo fare qualche esperimento in grid. L"idea anche qui e' di usarlo su architetture multicore per molti runs indipendenti.

  • CNR-BO Quantum/espresso in modalita MPI; primo test su Napoli con inserimento di Degli Esposti nella VO unina.it

  • Parma: Roberto De Pietri con una applicazione di cromodinamica quantistica, e di gravitazione numerica, gia' inproduzione sul cluster Theophys di Pisa

  • INAF: Ugo Becciani, con applicazioni di "GAIA Mission" di tipo parallelo/seriale, disponibilita' di tempo dall'inizio di maggio

  • INGV; Massimiliano Drudi con l' applicazione parallela "NEMO" di OCEANOGRAFIA. Non richiede un elevato numero di nodi e si decide di cominciare a farla girare sul sito di Perugia (A.Costantini). Disponibilita' di Drudi dal 10 di aprile.

Prossima riunione il 20 aprile alle ore 10.30.


Coordinate per l'accesso via EVO:
Meeting Access Information:
- Meeting URL
    http://evo.caltech.edu/evoNext/koala.jnlp?meeting=MvM2Ml2e29DDDn9D9BDe9v
- Phone Bridge
    ID: 497 2516 

Connessione telefonica:
- Chiamare uno dei seguenti numeri: http://server10.infn.it/video/index.php?page=telephone_numbers
- digitare il codice 4000
- Inserire il Phone Bridge ID ( 497 2516 )
Edit | Attach | PDF | History: r14 < r13 < r12 < r11 < r10 | Backlinks | Raw View | More topic actions
Topic revision: r14 - 2012-03-29 - RobertoAlfieri
 
This site is powered by the TWiki collaboration platformCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback