PBS / TORQUE:如何在多个节点上提交并行作业?

时间:2015-06-17 02:03:26

标签: grid pbs torque grid-computing

所以,现在我在qsub的集群上提交作业,但它们似乎总是在单个节点上运行。我目前通过

运行它们
#PBS -l walltime=10
#PBS -l nodes=4:gpus=2
#PBS -r n
#PBS -N test

range_0_total = $(seq 0 $(expr $total - 1)) 

for i in $range_0_total
do
    $PATH_TO_JOB_EXEC/job_executable &
done
wait

如果你能告诉我是否做错了什么,或者只是因为我的测试任务太小,我将非常感激。

1 个答案:

答案 0 :(得分:2)

使用您的方法,您需要让for循环遍历$ PBS_NODEFILE指向的文件中的所有条目,然后在循环内部,您将需要“ssh $ i $ PATH_TO_JOB_EXEC / job_executable&”。 / p>

另一种更简单的方法是替换for循环并等待:

npm install grunt-contrib-connect grunt-contrib-jshint grunt-ng-annotate  --save-dev

这会在分配给您工作的每个核心上运行您的程序副本。如果需要修改此行为,请查看pbsdsh手册页中提供的选项。