我收到一张打印好的计算机表格,然后将其打印成PDF格式文件。
我想将PDF转换为某种结构化格式(就像Acrobat在Excel中一样),以便我可以提取数据。我曾尝试过使用Adobe Acrobat Pro DC软件,它可以顺利运行并给我带来理想的效果。问题是我想用Java实现同样的目标。
Using Adobe DC SDK,convert pdf files to html files
我已经阅读了上述两个讨论,发现第一个线程在java中是不可能的,第二个线程说Datalogics PDF Java Toolkit不包含导出函数。
我创建了一个试用帐户并导航到" https://cloud.acrobat.com/exportpdf" 订阅服务时出现此错误
有人可以将我路由到ReST端点,以便我可以使用JavaScript进行转换,因为我无法找到它。
备选方案也受到欢迎,但限制条件是从扫描的PDF中提取的数据应与Acrobat提供的输出相似(以某种方式构建),因为稍后我会存储要在其他服务中使用的信息。