如何从PDF中提取此表?

时间:2019-05-10 10:34:36

标签: python pdf pdf-parsing tabula

我有一个带有生产图纸的pdf文档。我正在尝试从工程图中提取表格,但不幸的是,我无法这样做。任何帮助将不胜感激。

我想用python来做,因为这是我熟悉的语言。因此,经过研究后,建议将Tabula作为最佳选择。我使用了Web gui,并且能够选择表区域并将表导出到csv。我希望该程序能够自动检测该表并将其转换为csv,到目前为止,我还无法做到这一点。


import tabula

df = read_pdf("example.pdf", area=(52.831,808.83,274.571,1142.184), pages=2)

tabula.convert_into("example.pdf", "output.csv", output_format="csv")

我希望结果会从下面的pdf文件中以csv文件的形式生成表格,但并非不幸。

http://www2.mae.ufl.edu/designlab/Lab%20Assignments/EML2322L%20Assembly%20Drawing%20Organization%20and%20Dimensioning.pdf(示例PDF-第5页和第12页)

0 个答案:

没有答案