确保subprocess.Popen调用的执行顺序

时间:2013-06-24 02:55:02

标签: python synchronization

我正在使用subprocess.Popen为Scipy堆栈创建自动构建脚本。

我目前的流程如下。

mathbuild.json:

{"suitesparse": {"version": "4.2.1",
         "dependencies": ["metis"],
         "downloads": ["http://www.cise.ufl.edu/research/sparse/SuiteSparse/SuiteSparse-4.2.1.tar.gz"],
         "build": ["cd $DL_DIR",
               "tar xvfz SuiteSparse-4.2.1.tar.gz",
               "cd SuiteSparse",
               "cp -r $DL_DIR/metis-4.0.3 metis-4.0.3"]},

 "metis": {"version": "4.0.3",
       "dependencies": [],
       "downloads": ["http://glaros.dtc.umn.edu/gkhome/fetch/sw/metis/OLD/metis-4.0.3.tar.gz"],
       "build": ["cd $DL_DIR",
             "tar xvfz metis-4.0.3.tar.gz",
             "cd metis-4.0.3",
             "make"]}}

mathbuild.py:

def package_list(package, config):
    for dependency in config[package]['dependencies']:
        yield from package_list(dependency, config)
    yield package

def build_package(package, config):
    command = '; '.join(config[package]['build'])
    build = subprocess.Popen(command, shell=True)


def process_package(package, config, env_dir, dl_dir):
    print('INSTALLING {0}'.format(package))
    print('Downloading...')
    download_package(package, config, dl_dir)
    print('Building...')
    build_package(package, config)


if __name__ == '__main__':
    parser = argparse.ArgumentParser(description='Install Pylab in a new venv.')
    parser.add_argument('env_dir', help='target directory for new environment')
    args = parser.parse_args()
    os.environ['ENV_DIR'], os.environ['DL_DIR'] = create_venv(args.env_dir)
    with open('mathbuild.json') as f:
        cfg = json.load(f)
    processed = []
    for package in package_list('suitesparse', cfg):
        if package not in processed:
            process_package(package, cfg,
                            os.environ['ENV_DIR'],
                            os.environ['DL_DIR'])
            processed += [package]

它创建一个依赖项列表(以便后面的项依赖于前面的项)然后处理每个依赖项(下载然后根据json文件中的命令构建)。

问题是在完全构建依赖项之前,正在通过新的subprocess.Popen调用构建包。在上面的示例中,suitesparse执行甚至在metis构建完成之前就开始了。我假设那是因为我每次都在for package in package_list('suitesparse', cfg)循环周围打开一个新的子进程,而不考虑先前的子进程是否完成。

问题 同步基于循环的Popen调用的最佳方法是什么,以便每次调用仅在前一次调用Popen(即列表中的上一项)完成时启动?

我尝试了什么 我已经尝试更改循环,以便它构建一个组合的Popen(两个包构建),但这似乎是hackish。

1 个答案:

答案 0 :(得分:2)

看起来你想要subprocess.check_call()而不是Popen。来自the docs

  

使用参数运行命令。等待命令完成。如果返回码为零则返回,否则引发CalledProcessError。

您的构建功能类似于:

def build_package(package, config):
    command = '; '.join(config[package]['build'])
    subprocess.check_call(command, shell=True)

如果您实际使用的是Popen对象,则可以调用wait()方法等待子命令完成:

def build_package(package, config):
    command = '; '.join(config[package]['build'])
    build = subprocess.Popen(command, shell=True)
    # do something with the build object
    build.wait()
    # command is done