Riunione MPI-multicore del 7/02/2012

Location: INFN-CNAF, dalle ore 14 alle ore 16

Siti presenti:

  • UNI-PR: Roberto Alfieri. Roberto De Pietri (assente giustificato)
  • UNI-PG: Alessandro Costantini (fus) (remoto)
  • UNI-NA: Vania Boccia (fus), Giovanni Barone
  • CNR-BO: Stefano Ottani, (Mauro Nanni, Cristian Degli Esposti, Alessandro Venturini sono assenti giustificati)
  • CNAF: (Davide Salomoni assente giustificato)
  • SISSA: Stefano Cozzini
  • INFN-PI: Alberto Ciampa, Enrico Mazzoni
  • COMETA: ?? (Giuseppe Andronico assente)

  • IGI: Paolo Veronesi (res. operation), Daniele Cesini (res. fus), Valerio Venturi (res. mw), Marco Bencivenni (portale)

Roberto illustra la pagina wiki che ha predisposto per la riunione: http://www.fis.unipr.it/dokuwiki/doku.php?id=grid:mpi-multicore:start

Le possibili attivita' sono suddivise in una parte infrastrutturale, che coinvolge prevalentemente i siti, e una parte applicativa che coinvolge gli utenti. Roberto si sofferma principalmente sulla parte infrastrutturale tra cui: la sperimentazione di iWarp per le comunicazioni a bassa latenza, l'accesso via SRM ai dati dei job in esecuzione, l'ottimizzazione delle risorse fra job seriali e job paralleli, le nuove features a supporto di multicore e wholenodes delle distribuzione EMI.

Riguardo la convivinza tra job seriali e paralleli emergono sostanzialmente due approcci: quello praticato da Napoli (unica coda in cui il job manager determina il tipo i job e applica policy opportune) e quello praticato da Pisa (code separate, con role=parallel nel Proxy Voms per gli utenti MPI ).

Paolo Veronesi conferma che attualmente e' rilasciato per IGI il CE Cream EMI e che entro breve tempo verra' rilasciato anche il profilo per i WN di EMI.

I siti interessati installeranno un cluster di test con la distribuzione EMI e la configurazione che verra' concordata all'interno del presente WG. Si conferma l'uso della VO GRIDIT per i test.

I dettagli saranno inseriti nella pagina twiki.

Stefano Cozzini illustra la sua esperienza con le nuove funzionalita' di CREAM per i multicore. Di particolare interesse l'utilizzo di una soluzione mista HTC/HPC basata su JOB SMP che ottimizzano l'uso dei multicore di un singolo nodo (whole node), distribuiti sui nodi della Grid, con applicazioni tipo quantum espresso. I job sono precompilati (relocated package).

Ha poi inviato i seguenti paper su un paio di esperienze fatte sull'approccio parallelo alla grid:

In conclusione si decide di chiedere conferma di partecipazione ai test ai siti sopra elencati, e di inviare una descrizione sui dettagli HW. Si e' parlato di un questionario ma per l'attivita' di questo gruppo puo' bastare una lista delle caratteristiche HW interessanti per questi test, come la seguente:

  • WN: numero di nodi, numero di core per nodo
  • Interconnessione tra i WN: tecnologia utilizzata (GbE, Infiniband , altro)
  • Home share/non shared: se shared il tipo di FS
  • Il tipo di Batch system
  • Altre informazioni utili, altre sperimentazioni proposte

Si prega di comunicare queste informazioni a questa mailing list entro una settimana, 10 giorni max per avere un'idea del layout di test su cui si puo' lavorare.

Rimane da affrontare quanto segnalato da Davide in contesto WLCG: "Date un'occhiata anche ai piani d'uso del multicore/whole nodes (non MPI) che stiamo discutendo in ambito WLCG nel Workload Managment TEG: https://twiki.cern.ch/twiki/bin/view/LCG/WMTEGMulticore (work in progress)".

In tempo reale Marco ha creato una Sezione Wiki: https://wiki.italiangrid.it/twiki/bin/view/Main/MpiGroup e ha creato la Mailing list: mpi-multicorelists.italiangrid.it.

E' importante che questa sia una iniziativa collaborativa fra varie componenti (utenti, site manager, esperti), fermamente orientata agli obiettivi che possiamo sintetizzare con:

  • "studio dei nodi multicore per ottimizzare il loro uso in un contesto di Grid per job HPC"
  • "applicazioni complesse"
  • "test di igi-portal" per rendere l'accesso alla grid piu' semplice agli utenti.

E' auspicabile che questi obiettivi siano raggiunti nel giro di pochi mesi.

La prossima riunione del gruppo e' stata fissata per il 24 febbraio prossimo alle ore 14.

-- RobertoAlfieri - 2012-02-21

Topic revision: r2 - 2012-02-26 - RobertoAlfieri
 
This site is powered by the TWiki collaboration platformCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback