Speaker
Description
La disponibilità di un sistema di Data Management (DM) è uno degli elementi tecnici indispensabili per la costruzione di un Datalake nazionale. Per sistema di DM si intende un insieme di servizi che permettono la federazione delle diverse risorse di storage realizzando un vero e proprio livello di astrazione. Oltre a federare lo storage, un sistema di DM deve anche orchestrare le varie istanze e coordinare la gestione dei dati utente, permettendo quindi di definire e implementare policy di diverso tipo sui dati (relativamente a dove i dati devono essere memorizzati, al QoS necessario, al lifetime previsto, ecc.)
Datacloud si è proposto di implementare un sistema che risponda a queste esigenze. La strategia seguita è stata quella di far riferimento a esperienze già note, integrando soluzioni in uso in particolare negli esperimenti HEP.
E’ stato realizzato quindi un testbed federando storage manager distribuiti ed eterogenei: sono stati integrati diversi storage system (sia Grid che Cloud) utilizzati in produzione in vari centri di calcolo dell'INFN.
L'implementazione di questo sistema di DM e' stata realizzata attraverso RUCIO e relativi servizi ancillari. Tale sistema pilota è attualmente in fase di test e validazione, con il coinvolgimento di comunità di utenti.
In questo talk sarà fatta una descrizione generale dell’architettura del testbed di DM che e` stato realizzato.
Sarà poi discusso l’impatto previsto sull’infrastruttura dati nazionale e, in particolare, sull’attività dei ricercatori.