名称:tabula-py 版本:2.1.1 的Python:3.8.1 Java:8.251
我无法使用以下代码阅读PDF。
from tabula import read_pdf_with_template, read_pdf
filePath = "FilePath/sample.pdf"
df = read_pdf(filePath)
print(df)
执行消息:-
'pages' argument isn't specified.Will extract only from page 1 by default.
[]
Process finished with exit code 0
Pdf来源:
http://www.africau.edu/images/default/sample.pdf
有人可以帮忙为什么不阅读pdf吗?
答案 0 :(得分:0)
我认为您应该尝试以这种方式阅读PDF文件,但首先,应首先安装tabula-py。请确保已安装Java,并且将addEventListener
的PATH设置为可以。
java
答案 1 :(得分:0)
tabula-py是一个Python程序包,用于从PDF提取表,该程序通过使用一些启发式方法提取表。
您的示例PDF仅包含原始文本,因此您需要使用其他软件包来读取PyPDF之类的PDF。