SLURM:当我们重新启动节点时,jobID分配是否从0开始?

时间:2017-04-28 16:16:37

标签: slurm

例如:

sacct --start=1990-01-01 -A user返回最新jobID为136的作业表,但当我提交新作业sbatch -A user -N1 run.sh时,提交的bash作业返回100小于136.并且看起来像是sacct -L -A用户返回以100.结尾的列表。

因此,提交的批处理作业似乎会覆盖以前的作业信息,这是我不想要的。

[问] 当我们重新启动节点时,jobID分配是否从0开始?如果是,我应该怎么做才能在重新启动之前从最新的jobID分配继续?

感谢您宝贵的时间和帮助。

1 个答案:

答案 0 :(得分:1)

工作ID可能被回收有两个主要原因:

  • 达到了最大作业ID(请参阅slurm.conf中的MaxJobId
  • 重新启动Slurm控制器,FirstJobId设置为新值

除此之外,Slurm将始终增加工作ID。

请注意,数据库中的作业信息不会被覆盖;他们有一个与工作ID不同的唯一ID。 sacct具有-D, --duplicates选项,可以查看数据库中的所有作业。默认情况下,它仅显示具有相同作业ID的所有那些中最新的一个。