Speaker
Description
Titolo: FAIRDATA repository @ INFN-LNGS: sfide, criticità ed opportunità
Autori: Francesca Marchegiani 1, Stefano Stalio 2, Sandra Parlati 3
1 ORCID ID: 0000-0002-2712-560X, ROR: https://ror.org/02s8k0k61
2 ORCID ID: 0009-0005-4829-8007, ROR: https://ror.org/02s8k0k61
3 ORCID ID: 0000-0001-7099-0378, ROR: https://ror.org/02s8k0k61
Abstract
Nell’ambito del progetto PNRR LNGS-FUTURE (IR0000024) e, in particolare, delle attività previste nel Work Package 3.2, è stata sviluppata presso i Laboratori Nazionali del Gran Sasso (LNGS) una piattaforma software pilota per la gestione, conservazione, condivisione e riutilizzo dei dati della ricerca, in linea con i principi FAIR.
Questa piattaforma ha l’obiettivo di supportare i ricercatori nella gestione dei dati durante l’intero ciclo di vita del progetto, anche dopo la sua conclusione. I dati della ricerca, intesi come tutte le informazioni necessarie a sostenere, convalidare o riprodurre i risultati di un progetto scientifico, comprese le informazioni contestuali e i dati secondari, devono infatti essere conservati e, ove possibile, resi accessibili, al fine di promuovere una scienza aperta, riproducibile, trasparente e affidabile.
L’implementazione di questa infrastruttura ha il duplice scopo di valorizzare i dati come patrimonio della ricerca scientifica, essendo spesso unici, costosi e irripetibili, e di garantirne la rintracciabilità, la disponibilità a lungo termine e il riuso, in linea con i principi dell’Open Science. Inoltre, essa intende gettare le basi per una gestione accurata e responsabile dei dati prodotti dai grandi esperimenti ospitati presso i laboratori sotterranei dei LNGS.
Vista l’eterogeneità degli esperimenti ospitati ai LNGS, sono stati intervistati i responsabili della gestione dei dati di vari esperimenti, anche già conclusi, per avere feedback su esigenze specifiche quali ulteriori campi personalizzati, e di definire i vocabolari e le ontologie da integrare nella piattaforma, nonché le licenze da associare ai diversi prodotti della ricerca.
La piattaforma pilota, basata sul software open source InvenioRDM (versione 12.0), è interoperabile con l’archivio istituzionale dell’INFN Open Access Repository tramite il protocollo OAI-PMH.
Infine, tra le soluzioni tecniche adottate vi sono l’uso di vocabolari controllati specifici per disciplina e l’adozione di un sistema di storage a oggetti di tipo S3, con replica remota ed estremamente scalabile, considerando che in futuro i volumi di dati coinvolti potrebbero essere dell’ordine dei petabyte.