直接在专用的dask worker上运行任务

时间:2018-02-19 11:25:14

标签: dask dask-distributed

一个简单的代码片段如下:注释后跟###很重要..

from dask.distributed import Client

### this code-piece will get executed on a dask worker.
def task_to_perform():
    print("task in progress.")
    ## do something here..
    print("task is over.!")

### whereas the below code will run on client side, 
### assume on a different node than worker
client= Client("127.0.01:8786")
future = client.submit(task_to_perform)
print("task results::", future.result())

所以执行的控制流程是这样的:dask-client将任务提交给dask-scheduler,调度程序将根据可用的worker来调用它必须提交给任务的worker。 / p>

但是我们在dask中是否有任何机制可以绕过dask-scheduler在专用/特定工作者上提交我的任务?

1 个答案:

答案 0 :(得分:5)

您可以使用workers=关键字提交

来选择要运行任务的特定工作人员
client.submit(func, *args, workers='tcp://worker-address:port')

您可以通过查看工作人员的日志或致电client.scheduler_info()来获取地址。有关workers=关键字的更多信息,请访问:http://distributed.readthedocs.io/en/latest/locality.html#user-control

请注意,这仍然会通过调度程序路由任务。客户端只是告诉调度程序在哪里安排任务。