Meeting federazione ATLAS-IT

Europe/Rome
Vidyo only

Vidyo only

https://vidyoportal.cern.ch/join/ahPINgxdzIgk
  1. Introduzione

    1. Tutti i siti: controllare ed aggiornare le informazioni pubblicate di bdii, Alessandra verifica nuovamente la ricetta e manda mail a tutti.

    2. nuove gare :

      1. Milano e Frascati avrebbero bisogno di uno switch. Capire esattamente il tipo (porte in rame o in fibra?) e quanto costa. Roma ?

      2. Comunque soldi ne avanzano 67k allocati ( 50k spesi )

      3. Incontro Alessandro e Francesco T. per la gara disco

    3. Stato pledges :

      1. CPU ben sopra il pledge

      2. Disco siamo abbastanza sotto (anche se Milano ha quasi 1 PB da mettere online) : sorgenti di informazione http://adc-ddm-mon.cern.ch/ddmusr01/ALL_PLEDGED_DISK.html https://wlcg-cric.cern.ch/wlcg/accdata/list/

    4. Mandare un messaggio su green computing, i siti rispondono se ci sono attività locali interessanti. A Frascati ci sono iniziative

    5. TPC : pagina di controllo https://atlasdistributedcomputing-live.web.cern.ch/ATLASDistributedComputing-live/tpc/ capire nei vari siti italiani cosa non va. Verificare se in AGIS  gli endpoint dei siti sono da aggiornare. 

    6. Unificazione delle code :  ci sono pochi jobs su alcune code (Frascati, Napoli-Recas), verificare dopo il weekend, se persiste segnalare nei rispettivi ticket.

    7. HPC Cineca attività' ripresa. I pilot arrivano ma non ci sono jobs ATLAS. Attività in corso..

  2. Giro T3

    1. Cosenza : nulla da segnalare. Migrazione a coda unificata fatta ma pochi jobs. Monitorare la situazione

    2. Genova : ok. Gia' configurato WebDAV, capire come dichiarare l'endpoint ad ATLAS.

    3. Lecce : Problemi di scrittura su storage locale per i jobs di analisi. Quelli di produzione scrivono su Napoli. Solo jobs di produzione a Lecce ? Aspettiamo risposta.

    4. Roma3 : problema con riempimento di proddisk. Risolto con hardware addizionale. Da capire come mai non c'e' una limitazione automatica.

    5. Capire cosa succede per le code unificate ai T3 ( Cosenza si, altri no )

  3. CNAF : ripresa attività' reprocessing cnaf ( dati 2017 ). Sta andando bene, bunch di errori problema timeout backend dei server del tape risolto anche se a volte si presenta.

    1. TPC : interesse per WebDAV, piu' difficile su XRootD.

    2. Migrazione a condor a rilento che non dipendono da ATLAS. qualche settimana ( o mese ). Unificate sia code condor sia lsf. Migrare completamente a condor approfittando del down.

  4. Giro T2

    1. Frascati : nulla di particolare da segnalare. Migrazione code unificate fatta. Hardware: solo storage in manutenzione viene utilizzato. Probabilmente un pochino di storage addizionale puo' essere messo in linea.

    2. Milano : persistono i problemi con lo storage che vanificano l'attività' di produzione del sito.

      1. Nuovo storage ( quasi 1PB ) configurato secondo i parametri ottimali. Piano per migrare su li tutti i dati esistenti sul vecchio storage.

      2. Terapia d'urto : bloccare la scrittura finche' la migrazione e' terminata. David ci ragione a propone un piano.

      3. Milano in attesa delle CPU aggiuntive.

    3. Napoli nulla da segnalare, migrazione alle code unificate, monitorare numero di jobs. Circa 100TB di disco probabilmente da aggiungere.


 

There are minutes attached to this event. Show them.