Question

名称：tabula-py 版本：2.1.1 的Python：3.8.1 Java：8.251

我无法使用以下代码阅读PDF。

from tabula import read_pdf_with_template, read_pdf

filePath = "FilePath/sample.pdf"
df = read_pdf(filePath)

print(df)

执行消息：-

'pages' argument isn't specified.Will extract only from page 1 by default.
[]

Process finished with exit code 0

Pdf来源：

http://www.africau.edu/images/default/sample.pdf

有人可以帮忙为什么不阅读pdf吗？

Answer 1

我认为您应该尝试以这种方式阅读PDF文件，但首先，应首先安装tabula-py。请确保已安装Java，并且将addEventListener的PATH设置为可以。

java

Answer 2

tabula-py是一个Python程序包，用于从PDF提取表，该程序通过使用一些启发式方法提取表。

您的示例PDF仅包含原始文本，因此您需要使用其他软件包来读取PyPDF之类的PDF。