SLURM
- La gestion des requêtes (job) se fait selon les ressources demandées par la requête (memoire,cpu(s), time limit,etc...).
- SLURM contrôle les files d’attente, appelées ici QOS (=Quality Of Service).
- Le lancement des jobs est organisé suivant la politique déterminée par l’administrateur et les ressources de la machine disponibles.
SLURM sur Olympe
- Les informations ci-dessous sont susceptibles d’évoluer au cours du temps et en fonction de l’exploitation du système.
- Les nœuds de calcul (36 cœurs) forment les briques élémentaires du système. Pour des jobs demandant plus de 36 cœurs, le nombre de cœurs réservés doit être un multiple de 36 .
ATTENTION : Ces valeurs sont mises à titre indicatif et peuvent être amenées à changer pendant la mise en production de la machine.
File d’attente | nombre de cœurs | nombre de nœuds | nombre de gpus | walltime | jobs/user | ram | remarque | Partition |
---|---|---|---|---|---|---|---|---|
mono | moins de 18 | 1 | 0 | 400h | 3 max | 96 Go max (10 Go par défaut) | non exclusif - HT | Shared |
nœud | 36 | 1 | 0 | 250h | 2 max | 180 Go | exclusif - HT | Exclusive |
nœud5 | 72 à 180 | 2 à 5 | 0 | 150h | 2 max | 180 Go/nœud | exclusif - HT | Exclusive |
noeud10 | 216 à 360 | 6 à 10 | 0 | 110h | 2 max | 180 Go/nœud | exclusif - HT | Exclusive |
noeud20 | 396 à 720 | 11 à 20 | 0 | 75h | 1 max | 180 Go/nœud | exclusif - HT | Exclusive |
noeud40 | 756 à 1440 | 21 à 40 | 0 | 36h | 1 max | 180 Go/nœud | exclusif - HT | Exclusive |
noeud50 | 1476 à 1800 | 41 à 50 | 0 | 24h | 1 max | 180 Go/nœud | exclusif - HT | Exclusive |
visu | 1 à 36 | 1 | 0 | 4h | 1 max | 50 Go max | non exclusif - HT | visu |
mesca | 1 à 18 | 1 | 0 | 100h | 1 max | 740 Go max | non exclusif - HT | mesca |
voltam | 1 à 18 | 1 | 1 à 2 | 100h | 4 max | 180 Go max (192Go par défaut) | non exclusif - HT | volta |
volta | 18 à 396 | 1 à 6 | 1 à 44 | 100h | 2 max | 370 Go max/noeud | exclusif - HT | volta |
CPU
Partition exclusive ou partagée ?
- Pour une réservation de plus de 18 cœurs, les nœuds sont attribués dans leur intégralité (i.e les 36 cpus de chaque nœud sont réservés) : partition exclusive .
Pour une réservation totale de moins de 18 cœurs et de moins de 96 Go de mémoire (sur un seul nœud), et qui n’utilise pas les GPUs, le nœud est partagé entre plusieurs utilisateurs (sur la QOS "mono") : partition shared .
GPU
- Pour une réservation de plus de 18 cœurs, et/ou de plus de de 2 GPU les nœuds sont attribués dans leur intégralité (i.e les 36 cpus de chaque nœud sont réservés ainsi que les 4 GPU) : partition volta .
- Pour une réservation totale de moins de 18 cœurs et de moins de 96 Go de mémoire (sur un seul nœud), et de moins de de 2 GPU, le nœud est partagé entre plusieurs utilisateurs (QOS voltam) .
Décompte des heures cpu
Pour plus d’informations sur la manière dont sont décomptées les heures cpus, voir cet article.