我如何知道正在运行的作业在Slurm上的实时内存使用情况?

时间:2018-11-27 02:58:51

标签: slurm

我对cpu与记忆的通信方式知之甚少,所以我不确定这是否是一个“正确”的问题。

在我提交给Slurm集群的作业脚本中,该脚本需要从存储在工作词典中的数据库中读取数据。我想监视运行此脚本所使用的内存。

如何编写bash脚本来执行此操作?我已经尝试过@CoffeeNerd的脚本。但是,在作业运行时,文件中只有一行输出

AveCPU|AveRSS|MaxRSS

如何修改此脚本以输出实时内存使用情况?

我知道sstat命令,但是不确定sstat -j $JOBID.batch --format=MaxVMSize之类的方法是否可以解决我的问题。

1 个答案:

答案 0 :(得分:1)

Slurm有一个插件,可将作业的“配置文件”(PCU使用情况,内存使用情况等)记录到HDF5文件中。它为每个测量项目保存一个时间序列。

使用

#SBATCH --profile=<all|none|[energy[,|task[,|filesystem[,|network]]]]>

激活它。

请参阅文档here