无法使用Tablea阅读PDF

时间:2020-07-04 15:08:17

标签: python tabula

名称:tabula-py 版本:2.1.1 的Python:3.8.1 Java:8.251

我无法使用以下代码阅读PDF。

from tabula import read_pdf_with_template, read_pdf

filePath = "FilePath/sample.pdf"
df = read_pdf(filePath)

print(df)

执行消息:-

'pages' argument isn't specified.Will extract only from page 1 by default.
[]

Process finished with exit code 0

Pdf来源:

http://www.africau.edu/images/default/sample.pdf

有人可以帮忙为什么不阅读pdf吗?

2 个答案:

答案 0 :(得分:0)

我认为您应该尝试以这种方式阅读PDF文件,但首先,应首先安装tabula-py。请确保已安装Java,并且将addEventListener的PATH设置为可以。

java

答案 1 :(得分:0)

tabula-py是一个Python程序包,用于从PDF提取表,该程序通过使用一些启发式方法提取表。

您的示例PDF仅包含原始文本,因此您需要使用其他软件包来读取PyPDF之类的PDF。