在群集上运行MPI作业时出错

时间:2018-08-01 14:44:12

标签: parallel-processing mpi infiniband

我正在运行在集群上完美运行的代码, 当我将内核数增加到3844时,出现以下错误,

“太多重试将消息发送到0x0040:0x00152080,放弃了”

此错误是网络问题吗?还是与代码有关?

不幸的是,我无法在此处发布整个代码

谢谢

0 个答案:

没有答案