sge只能在一个节点

时间:2017-04-11 08:09:43

标签: bash shell cluster-computing centos7 sungridengine

我在四节点集群中构建了SGE以获取源代码。 Centos7中的操作系统。当我在集群中提交一些简单的任务时,我发现在一个节点中只运行了一个任务。有什么问题?这是我的任务代码:

sleep 60
echo "done"

这是我提交任务的cmd:

DIR=`pwd`
option=""
for((i=0;i<5;i++));do
  qsub -q multislots $option -V -cwd -o stdout -e stderr -S /bin/bash $DIR/test.sh
  sleep 1
done

运行qstat -f时,显示:enter image description here

1 个答案:

答案 0 :(得分:0)

鉴于有关作业失败的错误消息,因为:“找不到未使用的add_grp_id”。您应该检查sge配置中的gid_range设置(全局以及每个主机是否有一个)。它应该是一系列未使用的组ID。至少与您希望节点上的作业一样多的gid。

如果不是这样,请尝试在其中一个排队作业上运行qalter -w v和qalter -w p,以了解它们未启动的原因。

相关问题