如何使用pdfminer.six

时间:2018-02-08 08:37:16

标签: python-3.x pdf text-extraction

我正在尝试使用python 3.x中的pdfminer从pdf中提取文本。我使用以下命令安装了它

pip3 install pdfminer.six

当我尝试使用以下命令提取文本时,我收到错误

pdf2txt.py sample.pdf
  

错误:pdf2txt.py:找不到命令

我已经阅读了他们展示的相同步骤的官方文档,但我仍然无法正常工作。

2 个答案:

答案 0 :(得分:3)

official documentation假设.py脚本可以自动运行。但对于所有操作系统而言并非如此(如果可能的话,您的本地系统不需要设置以使其正常工作)。

要从命令行手动启动PDFminer,请使用启动Python脚本的常规方法:

python pdf2txt.py sample.pdf

它将运行脚本并在完成后退回到命令行。如果您因某种原因在某处遇到错误或想要留在Python中,可以使用

python -i pdf2txt.py sample.pdf

答案 1 :(得分:0)

已经很晚了,但如果仍然可以帮助您,请在终端中执行以下操作:

1。)在终端中键入ls,它将返回文件列表。检查该列表中是否存在pdf2text.py,并且sample.pdf也应该存在。

2。)如果列表中未显示这2个文件,则意味着您位于其他目录中,因此您必须导航到同时存在这两个文件的正确目录,否则您将不得不给出文件名及其路径。

3。)并给出命令:python pdf2text.py sample.pdf

4。)如果参数解析器不需要标识符,它应该可以工作。

5。)如果您有任何疑问,请随时与我联系。

干杯。

相关问题