口吃分割多个单节点

时间:2018-12-19 13:43:18

标签: slurm

我正在设置具有两个“物理”节点的SLURM集群。 两个节点中的每个节点都有两个GPU。

我想提供仅使用一个GPU的选项(而另一个GPU仍可用于计算)。 我设法用gres进行设置,但后来我意识到,即使只使用其中一个GPU,该节点也会被占用,而另一个GPU将无法使用。

是否可以将GPU设置为消耗品,并在单个节点中具有两个“节点”?并为每个分配有限数量的CPU和内存?

1 个答案:

答案 0 :(得分:0)

我遇到了同样的问题,我设法通过允许超额订阅使其正常工作。

这是关于它的文档: https://slurm.schedmd.com/cons_res_share.html

不确定我所做的是否完全正确,但我已经把 SelectType=select/cons_tres, SelectTypeParameters=CR_Core 并为我的分区设置 OverSubscribe=FORCE。现在我可以在同一个节点上启动多个 GPU 作业。

相关问题