Question

我正在尝试使用python 3.x中的pdfminer从pdf中提取文本。我使用以下命令安装了它

pip3 install pdfminer.six

当我尝试使用以下命令提取文本时，我收到错误

pdf2txt.py sample.pdf

错误：pdf2txt.py：找不到命令

我已经阅读了他们展示的相同步骤的官方文档，但我仍然无法正常工作。

Answer 1

official documentation假设.py脚本可以自动运行。但对于所有操作系统而言并非如此（如果可能的话，您的本地系统不需要设置以使其正常工作）。

要从命令行手动启动PDFminer，请使用启动Python脚本的常规方法：

python pdf2txt.py sample.pdf

它将运行脚本并在完成后退回到命令行。如果您因某种原因在某处遇到错误或想要留在Python中，可以使用

python -i pdf2txt.py sample.pdf

Answer 2

已经很晚了，但如果仍然可以帮助您，请在终端中执行以下操作：

1。）在终端中键入ls，它将返回文件列表。检查该列表中是否存在pdf2text.py，并且sample.pdf也应该存在。

2。）如果列表中未显示这2个文件，则意味着您位于其他目录中，因此您必须导航到同时存在这两个文件的正确目录，否则您将不得不给出文件名及其路径。

3。）并给出命令：python pdf2text.py sample.pdf

4。）如果参数解析器不需要标识符，它应该可以工作。

5。）如果您有任何疑问，请随时与我联系。

干杯。