为什么Python命令“subprocess.Popen”找不到要运行的jar文件?

时间:2017-10-02 21:05:56

标签: python python-2.7 jar subprocess popen

我正在尝试从此repo运行代码:https://github.com/tylin/coco-caption,特别是来自https://github.com/tylin/coco-caption/blob/master/pycocoevalcap/tokenizer/ptbtokenizer.py,第51-52行:

p_tokenizer = subprocess.Popen(cmd, cwd=path_to_jar_dirname, \
            stdout=subprocess.PIPE)

我运行的错误是

OSError: [Errno 2] No such file or directory

我无法弄清楚无法找到该文件的原因。

我正在尝试运行的jar:

stanford-corenlp-3.4.1.jar

您可以转到https://github.com/tylin/coco-caption/tree/master/pycocoevalcap/tokenizer查看目录结构。为了更加具体地说明我运行代码行时我的实际参数:

cmd= ['java', '-cp', 'stanford-corenlp-3.4.1.jar', 'edu.stanford.nlp.process.PTBTokenizer', '-preserveLines', '-lowerCase', 'tmpWS5p0Z'],

path_to_dirname =abs_path_to_folder/tokenizer

我可以看到需要运行的jar,它看起来是在正确的位置,所以为什么python不能找到它。 (注意:我正在使用python2.7。)临时文件'tmpWS5p0Z'应该是它的位置。

编辑:我正在使用Ubuntu

2 个答案:

答案 0 :(得分:0)

尝试绝对路径(意味着从根/开始的路径)

https://en.wikipedia.org/wiki/Path_(computing)#Absolute_and_relative_paths

表示python中的相对路径,请参阅Relative paths in PythonHow to refer to relative paths of resources when working with a code repository in Python

更新:

作为测试,尝试使用subprocess.Popen()选项shell=True,并为任何涉及的文件提供绝对路径,包括tmpWS5p0Z

subprocess.Popen()调用中的

涉及两条路径:

1)python路径,python必须找到java可执行文件和stanford-corenlp-3.4.1.jar,它本质上是一个带有自己路径的java程序

2)stanford-corenlp-3.4.1.jar

的java路径

因为这太复杂了尝试

p_tokenizer = subprocess.Popen(['/absolute_path_to/java -cp /absolute_path_to/stanford-corenlp-3.4.1.jar /absolute_path_to/edu.stanford.nlp.process.PTBTokenizer -preserveLines -lowerCase /absolute_path_to/tmpWS5p0Z' ], shell=True)

Python specify popen working directory via argument

Python subprocess.Popen() error (No such file or directory)

答案 1 :(得分:0)

以防万一它可以帮助某人:

我一直在努力解决相同的问题(相同的https://github.com/tylin/coco-caption代码)。可能与我使用qsub在CentOS上使用python 3.7运行代码有关。所以我改变了

cmd = ['java', '-cp', 'stanford-corenlp-3.4.1.jar', 'edu.stanford.nlp.process.PTBTokenizer', '-preserveLines', '-lowerCase', 'tmpWS5p0Z']

cmd = ['/abs/path/to/java -cp /abs/path/to/stanford-corenlp-3.4.1.jar edu.stanford.nlp.process.PTBTokenizer -preserveLines -lowerCase ', ' /abs/path/to/temporary_file']

使用绝对路径固定OSError: [Errno 2] No such file or directory。请注意,我仍然将'/abs/path/to/temporary_file'作为cmd列表中的第二个元素,因为稍后会添加它。但是随后在tokenizer java子进程中出了点问题,我不知道为什么或什么,只是观察一下,因为:

p_tokenizer = subprocess.Popen(cmd, cwd=path_to_jar_dirname, stdout=subprocess.PIPE, shell=True)
token_lines = p_tokenizer.communicate(input=sentences.rstrip())[0]

这里token_lines是一个空列表(这不是想要的行为)。在IPython中执行此操作会导致以下结果(只是subprocess.Popen(...,而不是communicate)。

Exception in thread "main" edu.stanford.nlp.io.RuntimeIOException: java.io.IOException: Input/output error
    at edu.stanford.nlp.process.PTBTokenizer.getNext(PTBTokenizer.java:278)
    at edu.stanford.nlp.process.PTBTokenizer.getNext(PTBTokenizer.java:163)
    at edu.stanford.nlp.process.AbstractTokenizer.hasNext(AbstractTokenizer.java:55)
    at edu.stanford.nlp.process.PTBTokenizer.tokReader(PTBTokenizer.java:444)
    at edu.stanford.nlp.process.PTBTokenizer.tok(PTBTokenizer.java:416)
        at edu.stanford.nlp.process.PTBTokenizer.main(PTBTokenizer.java:760)
Caused by: java.io.IOException: Input/output error
    at java.base/java.io.FileInputStream.readBytes(Native Method)
    at java.base/java.io.FileInputStream.read(FileInputStream.java:279)
    at java.base/java.io.BufferedInputStream.read1(BufferedInputStream.java:290)
    at java.base/java.io.BufferedInputStream.read(BufferedInputStream.java:351)
    at java.base/sun.nio.cs.StreamDecoder.readBytes(StreamDecoder.java:284)
    at java.base/sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:326)
    at java.base/sun.nio.cs.StreamDecoder.read(StreamDecoder.java:178)
    at java.base/java.io.InputStreamReader.read(InputStreamReader.java:185)
    at java.base/java.io.BufferedReader.read1(BufferedReader.java:210)
    at java.base/java.io.BufferedReader.read(BufferedReader.java:287)
    at edu.stanford.nlp.process.PTBLexer.zzRefill(PTBLexer.java:24511)
    at edu.stanford.nlp.process.PTBLexer.next(PTBLexer.java:24718)
    at edu.stanford.nlp.process.PTBTokenizer.getNext(PTBTokenizer.java:276)
    ... 5 more

同样,我不知道为什么或什么,但我只是想分享一下,这样做可以解决此问题:

cmd = ['/abs/path/to/java -cp /abs/path/to/stanford-corenlp-3.4.1.jar edu.stanford.nlp.process.PTBTokenizer -preserveLines -lowerCase /abs/path/to/temporary_file']

因此,将cmd做成只有1个元素的列表,一次包含带有绝对路径的整个命令。感谢您的帮助!