Date: 2024-01-22
- Reported incident breaking Jupyter Proxy due to full storage (see slides)
Tracked developments:
Tests on deployments with RKE2 (L. Anderlini, R. Petrini, G. Misurelli, M. Corvo)
- Dal Pra, Misurelli e Corvo hanno iniziato a tirare su un cluster per fare test.
- L’idea è avere tre macchine virtuali di cui una con GPU, un master due worker.
- Serve una T4, Dal Pra ne può liberare due e lo farà a breve. CPU e RAM dovrebbero bastare.
- Creato uno spazio su baltig, chiamato “WP1”.
- Perché non usiamo baltig, ma GitHub? Per policy di autenticazione.
- Perché non usiamo harbor? Lo usiamo.
- Possiamo fare test con A100? Verificare con Marco Serra.
- R. Petrini ha creato un primo cluster kubernetes con RKE2 in Cloud@CNAF. Ancora non la parte GPU.
- Cercheremo di rafforzare coordinamento e sinergia CNAF-Firenze.
- Terraform vs Ansible?
- Terraform è utilizzato per i sistemi nazionali, ma non è compatibile con INFN Cloud.
- INFN Cloud usa Ansible.
- Forse meglio orientarsi verso Ansible.
Port monitoring infrastructure to Helm chart (R. Petrini)
Define a list of libraries for QC simulations in Cloud (S. Giagu, S. Bordoni)
Offloading tests with virtual kubelets (G. Bianchini, D. Ciangottini)
- A VM with a dedicated GPU RTX5000 has been deployed and will serve VK endpoint.
Acquisto FPGA
- Stefano Dal Pra organizza una discussione.
- Lucio manda a Stefano note della precedente riunione.
Status legend
Active
Priority
Problems
Postponed or Blocked by others
Completed
There are minutes attached to this event.
Show them.