从pdf

时间:2016-09-22 15:46:15

标签: adobe ocr pdf-java-toolkit

我收到一张打印好的计算机表格,然后将其打印成PDF格式文件。

我想将PDF转换为某种结构化格式(就像Acrobat在Excel中一样),以便我可以提取数据。我曾尝试过使用Adobe Acrobat Pro DC软件,它可以顺利运行并给我带来理想的效果。问题是我想用Java实现同样的目标。

Using Adobe DC SDK,convert pdf files to html files

Java SDK for Acrobat Pro DC

我已经阅读了上述两个讨论,发现第一个线程在java中是不可能的,第二个线程说Datalogics PDF Java Toolkit不包含导出函数。

我创建了一个试用帐户并导航到" https://cloud.acrobat.com/exportpdf" 订阅服务时出现此错误

enter image description here

有人可以将我路由到ReST端点,以便我可以使用JavaScript进行转换,因为我无法找到它。

备选方案也受到欢迎,但限制条件是从扫描的PDF中提取的数据应与Acrobat提供的输出相似(以某种方式构建),因为稍后我会存储要在其他服务中使用的信息。

0 个答案:

没有答案
相关问题