Obtenir des informations sur un job

Il est possible pour visualiser simplement des information sur son job d'utiliser la commande jobinfo <jobid>.Il peut être utilisé à la fin d'un script sbatch, jobinfo donnera des informations très utiles si vous contactez le support.

jobinfo 6101

Job Infos :
              Name : Test partition volta - 4 noeuds
              User : estana
         Partition : volta
            NNodes : 4
             Nodes : olympevolta[0-3]
             State : COMPLETED
            Submit : 2023-04-14T16:08:02
             Start : 2023-04-14T16:08:02
               End : 2023-04-14T16:08:05
 Reserved walltime : 04:00:00
     Used walltime : 00:00:03
     Used CPU time : 00:01.884
% User Computation) : 0 % (00:00.658)
    % System (I/O) : 100.00 % (00:01.225)
      Mem reserved : 2.0T
      Max Mem used : 24M
    Max Disk Write : 0
     Max Disk Read : 0

Le paramètre “Max Mem used : 24M”, basé sur la variable MaxRSS, représente la quantité maximale de mémoire physique (RAM) utilisée par le processus principal d’un travail ou d’une étape Slurm.

Cependant, cette mesure dépend de la fréquence d’échantillonnage utilisée par Slurm. Comme Slurm ne surveille pas la mémoire en continu mais à des intervalles définis, il est possible que des pics de consommation de mémoire plus élevés passent inaperçus s’ils surviennent entre deux échantillonnages.

De plus, si le travail est un code MPI (Message Passing Interface), la valeur affichée correspond à la mémoire maximale utilisée par le processus individuel qui a consommé le plus, et non à la somme totale de la mémoire utilisée sur l’ensemble du nœud de calcul. Ainsi, la consommation réelle de mémoire sur le nœud peut être bien plus élevée que la valeur rapportée par MaxRSS.

Il peut être utile de mettre une petite temporisation avant la commande jobinfo pour permettre d'avoir les dernières valeurs de l'accounting slurm s'il est utilisé dans un script sbatch.

sleep 10
jobinfo

Voir aussi

La frontale de connexion

Une fois que vous êtes connecté à Olympe, vous êtes sur l’une des trois frontales de connexion : olympelogin1 ou

Obtenir des informations sur un job

Voir aussi

La frontale de connexion

Pour lancer et suivre ses calculs sur Olympe

Organisation des files d’attente

Réservation interactive en batch

Script SLURM pour une réservation de MOINS de 18 cœurs

Script SLURM pour une réservation de PLUS de 18 cœurs

Script SLURM pour Machine à Mémoire Partagée MESCA

Script SLURM pour Application OpenMP ou Multithreadée

calcul "embarrassingly parallel": codes non mpi

calcul "embarrassingly parallel": codes mpi

L’accounting

Réservation des noeuds GPU

The chdb tutorial

Afficher ma consommation sur Olympe

Script SLURM en dépeuplé

L’outil placement

Exécution hybride MPI et OpenMP

Conteneurs Singularity

soumission de jobs avec dépendances

Impact de la maintenance du 11 Janvier 2022 sur la soumission des Jobs / Impact on Job Submission dur to maintenance