使用Tesseract进行布局分割

时间:2017-08-04 13:25:35

标签: java tesseract

我的目标是导入pdf文档(主要是扫描)并分析IntelliJ / Java中的布局。现在我有一个tesseract的问题来获取文本框。

我不想识别文本(没有OCR),而是文档中文本框的坐标。

两个问题:

  1. 如何在不打开测试类的情况下将Tesseract导入到我当前的Java项目中? 如果我尝试在普通课程中使用它,我总会收到错误:

      

    引起:java.lang.UnsatisfiedLinkError:没有liblept in   的java.library.path

  2. 是否有人使用正确的Tesseract命令来获取文本框和图像框的坐标?

0 个答案:

没有答案