26–30 May 2025
Hotel Hermitage - Isola d'Elba
Europe/Rome timezone

Data Management e Storage Federation: verso la realizzazione del Datalake

27 May 2025, 18:30
15m
Sala Maria Luisa (Hotel Hermitage - Isola d'Elba)

Sala Maria Luisa

Hotel Hermitage - Isola d'Elba

La Biodola 57037 Portoferraio (Li) Tel. +39.0565 9740 http://www.hotelhermitage.it/
Presentazione orale Calcolo distribuito Calcolo distribuito

Speaker

Antonino Troja (Istituto Nazionale di Fisica Nucleare)

Description

Il WP6 di DataCloud da tempo conduce un’attività di R&D sul data management e storage federation con l’obiettivo di verificare la fattibilità dell’adozione di un modello basato su tecnologie ben note (RUCIO+FTS) per la gestione dello storage presente nei centri di calcolo dell’ente. L’obiettivo prefissato era duplice: una verifica della funzionalità del sistema insieme ad una valutazione dell'impatto non solo sull’infrastruttura HW, ma anche sui servizi e sulle operazioni.

La prima fase di R&D si è conclusa con successo ed è stato implementato un testbed di Datalake nel quale abbiamo federato storage eterogenei sparsi nel territorio nazionale. Questa infrastruttura permette ad un utente di interagire con i dati in maniera trasparente e dichiarativa (specificando, ad esempio, il numero di repliche necessarie di un data set, il ciclo vita, etc..). Un aspetto chiave di questa prima fase è stato l’on-boarding di alcune comunità scientifiche dell’INFN (Darkside, Dampe ed Euclid) che ha permesso di dimostrare con use case concreti la funzionalità del modello proposto. Queste tecnologie sono inoltre utilizzate nel proof-of-concept ICSC e Terabit, nel quale abbiamo in programma di federare anche uno storage esterno all’infrastruttura INFN (CINECA). In aggiunta, abbiamo testato diverse policy di accesso ai dati, visto l’altissimo livello di personalizzazione del sistema.

In questa presentazione mostreremo lo stato dell’arte dell’infrastruttura e le evoluzioni che prevediamo nel breve futuro. Infine mostreremo i modelli di deployment che pensiamo possano essere messi in produzione a supporto degli esperimenti impegnati nella costruzione del loro computing model e che hanno bisogno di supporto rispetto alla gestione dei dati.

Primary authors

Alessandro Italiano (Istituto Nazionale di Fisica Nucleare) Andrea Rendina (Istituto Nazionale di Fisica Nucleare) Antonino Troja (Istituto Nazionale di Fisica Nucleare) Bernardino Spisso (Istituto Nazionale di Fisica Nucleare) Daniele Spiga (Istituto Nazionale di Fisica Nucleare) Diego Ciangottini (INFN Perugia) Federica Agostini (CNAF-INFN) Federica Fanzago (Istituto Nazionale di Fisica Nucleare) Francesco Di Nucci (Istituto Nazionale di Fisica Nucleare) Lucia Morganti (Istituto Nazionale di Fisica Nucleare) Marco Verlato (Istituto Nazionale di Fisica Nucleare) Massimo Biasotto (Istituto Nazionale di Fisica Nucleare) Massimo Sgaravatto (Istituto Nazionale di Fisica Nucleare) Michele Delli Veneri (Istituto Nazionale di Fisica Nucleare) Nadir Marcelli (Istituto Nazionale di Fisica Nucleare) Roberta Miccoli (Istituto Nazionale di Fisica Nucleare) Stefano Stalio (Istituto Nazionale di Fisica Nucleare)

Presentation materials

There are no materials yet.