等待所有多处理作业完成后再继续

时间:2015-11-26 08:17:53

标签: python parallel-processing multiprocessing

我希望并行运行一堆作业,然后在所有作业完成后继续。我有类似

的东西
# based on example code from https://pymotw.com/2/multiprocessing/basics.html
import multiprocessing
import random
import time

def worker(num):
    """A job that runs for a random amount of time between 5 and 10 seconds."""
    time.sleep(random.randrange(5,11))
    print('Worker:' + str(num) + ' finished')
    return

if __name__ == '__main__':
    jobs = []
    for i in range(5):
        p = multiprocessing.Process(target=worker, args=(i,))
        jobs.append(p)
        p.start()

    # Iterate through the list of jobs and remove one that are finished, checking every second.
    while len(jobs) > 0:
        jobs = [job for job in jobs if job.is_alive()]
        time.sleep(1)

    print('*** All jobs finished ***')

它有效,但我确信必须有一个更好的方法来等待所有工作完成,而不是反复迭代它们直到它们完成。

2 个答案:

答案 0 :(得分:32)

怎么样?

for job in jobs:
    job.join()

这将阻塞直到第一个进程完成,然后是下一个进程,依此类推。详细了解join()

答案 1 :(得分:5)

您可以使用join。 它让你等待另一个进程结束。

t1 = Process(target=f, args=(x,))
t2 = Process(target=f, args=('bob',))

t1.start()
t2.start()

t1.join()
t2.join()

你也可以使用barrier它适用于线程,让你指定你想要等待的一些进程,一旦达到这个数目就可以屏障它们。这里客户端和服务器被假设为Process。

b = Barrier(2, timeout=5)

def server():
    start_server()
    b.wait()
    while True:
        connection = accept_connection()
        process_server_connection(connection)

def client():
    b.wait()
    while True:
        connection = make_connection()
        process_client_connection(connection)

如果您想要更多功能,例如共享数据和更多流量控制,您可以使用manager