Speaker
Description
Negli ultimi anni, l’analisi data-driven è diventata un elemento centrale nella ricerca biomedica. Tuttavia, la gestione di dataset di grandi dimensioni, eterogenei e distribuiti su più centri rappresenta ancora una sfida significativa, soprattutto in termini di integrazione, tracciabilità e riproducibilità dei workflow. In questo contesto, presentiamo una piattaforma computazionale sviluppata nell’ambito del progetto PNRR-THE, progettata per supportare workflow complessi su dataset multi-sorgente.
La piattaforma è basata su XNAT e ne estende le funzionalità attraverso la definizione di un modello dati personalizzato e modulare. L’obiettivo è gestire in modo uniforme dati preclinici relativi alla radioterapia FLASH e MiniBeam altamente eterogenei, includendo parametri numerici, dati tabulari, immagini, file strutturati (XML) e dati grezzi provenienti da differenti pipeline sperimentali e computazionali. È stato definito un modello dati esteso rispetto alla configurazione standard, basato sull’identificazione di entità comuni a basso livello e sulla formalizzazione dei workflow sperimentali e analitici. Questo approccio permette di rappresentare in modo coerente i diversi domini applicativi e di supportare requisiti specifici dei gruppi di ricerca coinvolti.
Un aspetto chiave della piattaforma è l’integrazione di pipeline di elaborazione e analisi dei dati, resa possibile grazie al lavoro di integrazione di XNAT con le risorse HPC dell’INFN di Pisa mediante containerizzazione (Docker, Singularity) e job scheduler (Slurm). Gli utenti possono eseguire analisi statistiche, elaborazioni di immagini e procedure automatizzate direttamente sulla piattaforma, senza necessità di esportare i dati verso ambienti esterni. Questo garantisce maggiore coerenza tra dati e risultati, migliora la gestione delle dipendenze computazionali e abilita workflow riproducibili end-to-end.
L’approccio proposto favorisce l’interoperabilità, la standardizzazione dei dati, la loro gestione centralizzata e l’automazione dei processi, rappresentando una base solida per lo sviluppo di applicazioni avanzate basate su Machine Learning e modelli meccanicistici sviluppati nell’ambito dello studio dell’effetto FLASH nel progetto PNRR-THE.
Ringraziamenti: We acknowledge PNRR-M4C2-I1.5-ECS00000017-Tuscany Health Ecosystem (THE), FLASH_IT cascade call project, INFN - CSN5 under the Minibeam Radiotherapy (MIRO) and Artificial Intelligence in Medicine: focus on Multi-Input Analysis (AIM MIA) projects, Fondazione Pisa prog. n. 134/202, INFN-CSN5.