Organisation des files d’attente

SLURM

  • La gestion des requêtes (job) se fait selon les ressources demandées par la requête (memoire,cpu(s), time limit,etc...).
  • SLURM contrôle les files d’attente, appelées ici QOS (=Quality Of Service).
  • Le lancement des jobs est organisé suivant la politique déterminée par l’administrateur et les ressources de la machine disponibles.

SLURM sur Olympe

  • Les informations ci-dessous sont susceptibles d’évoluer au cours du temps et en fonction de l’exploitation du système.
  • Les nœuds de calcul (36 cœurs) forment les briques élémentaires du système. Pour des jobs demandant plus de 36 cœurs, le nombre de cœurs réservés doit être un multiple de 36 .

ATTENTION : Ces valeurs sont mises à titre indicatif et peuvent être amenées à changer pendant la mise en production de la machine.

 

File d’attentenombre de cœursnombre de nœudsnombre de gpuswalltimejobs/userramremarquePartition
monomoins de 1810400h3 max96 Go max (10 Go par défaut)   non exclusif - HTShared
nœud3610250h2 max180 Goexclusif - HTExclusive
nœud572 à 1802 à 50150h2 max180 Go/nœudexclusif - HTExclusive
noeud10216 à 3606 à 100110h2 max180 Go/nœudexclusif - HTExclusive
noeud20396 à 72011 à 20075h1 max180 Go/nœudexclusif - HTExclusive
noeud40756 à 144021 à 40036h1 max180 Go/nœudexclusif - HTExclusive
noeud501476 à 180041 à 50024h1 max180 Go/nœudexclusif - HTExclusive
visu1 à 36104h1 max50 Go maxnon exclusif - HT  visu
mesca1 à 1810100h1 max740 Go maxnon exclusif - HT  mesca
voltam1 à 1811 à 2100h4 max180 Go max (192Go par défaut)   non exclusif - HTvolta
volta18 à 3961 à 61 à 44100h2 max370 Go max/noeudexclusif - HTvolta

CPU

Partition exclusive ou partagée ?

  1. Pour une réservation de plus de 18 cœurs, les nœuds sont attribués dans leur intégralité (i.e les 36 cpus de chaque nœud sont réservés) : partition exclusive .

Pour une réservation totale de moins de 18 cœurs et de moins de 96 Go de mémoire (sur un seul nœud), et qui n’utilise pas les GPUs, le nœud est partagé entre plusieurs utilisateurs (sur la QOS "mono") : partition shared .

GPU

  1. Pour une réservation de plus de 18 cœurs, et/ou de plus de de 2 GPU les nœuds sont attribués dans leur intégralité (i.e les 36 cpus de chaque nœud sont réservés ainsi que les 4 GPU) : partition volta .
  2. Pour une réservation totale de moins de 18 cœurs et de moins de 96 Go de mémoire (sur un seul nœud), et de moins de de 2 GPU, le nœud est partagé entre plusieurs utilisateurs (QOS voltam) .

Décompte des heures cpu

Pour plus d’informations sur la manière dont sont décomptées les heures cpus, voir cet article.

Voir aussi

FAQ

Questions fréquentes et messages d'erreurs

Lancer un calcul

Les différentes manières de lancer un calcul