Question

为了运行多个计划的python脚本并捕获可能出现的错误，我正在使用一个控制器模块，该模块使用以下命令为每个脚本打开一个子进程：

def _process_script(nm_script, return_val):
    try:
        env = os.environ
        p = subprocess.Popen(['python', nm_script], stdout = subprocess.PIPE,
           shell=False, env=env, stderr=subprocess.PIPE)
        p.wait()
        (result, error) = p.communicate()

        if p.returncode != 0:
            cd_exec = -1
            tx_exec = error.decode('utf-8')
        else:
            cd_exec = 1
            tx_exec = None

    except subprocess.CalledProcessError as e:
        cd_exec = -1
        tx_exec = e.output

    return_val += [cd_exec, tx_exec]


def run_script(script):
    return_val = multiprocessing.Manager().list()

    #20 min timeout for the script
    maxDelay = 1200
    p = multiprocessing.Process(target=_process_script, args=(script.nm_script, return_val))
    p.start()
    p.join(maxDelay)

    #Checks if the process is still alive
    if p.is_alive:
        p.terminate()
        p.join()
        cd_exec = -1
        tx_exec = 'Timeout'
    else:
        cd_exec = return_val[0]
        tx_exec = return_val[1]

    return return_val

到目前为止，以上代码已适用于所有脚本。但是，有一个Selenium数据抓取脚本似乎在其执行后挂起，并且我似乎找不到问题。就是这样：

from selenium import webdriver

def main():
    path = r'\\path'
    browser = webdriver.Chrome()
    url = '...'
    browser.get(url)

    #...Several steps that do the necessary scraping and export data to the path

    #I have added the following steps to kill the browser instance:
    browser.get('about:blank')
    browser.find_element_by_tag_name('body').send_keys(Keys.ESCAPE)
    time.sleep(2)
    browser.quit()
    del browser

    return

该过程成功执行。数据将按预期导出，并且已打开的浏览器实例已关闭。但是，主脚本会一直显示有关DevTools的消息，直到达到20分钟的超时：

DevTools listening on ws://...

我还有其他几种硒数据抓取脚本，它们的工作方式与此类似，并且到目前为止没有任何问题。我完全迷失了这个，可能是什么问题？

Answer 1

我在上面的代码中看到作者直接使用Popen（），然后调用“ p.wait（）”，其中“ P”是子进程。

我在代码中使用subprocess.run（），但是Python库参考文档说Popen将等待该过程完成。 “ p.wait（）”是否必要？

子进程未完成，但脚本运行正确

1 个答案: