从JPG中提取文本

时间:2014-05-06 00:49:07

标签: java image text apache-poi extract

我已经尝试过这段代码并添加了所需的jar文件,但我仍然在线程" main"中收到类似Exception的错误消息。 java.lang.UnsatisfiedLinkError:无法加载库' libtesseract302'。

是否有完整的教程如何提取文本以及应该采取哪些措施来解决错误?任何帮助表示赞赏...

import net.sourceforge.tess4j.*;
import java.io.File;

public class ExtractTxtFromImg {
    public static void main(String[] args) {
        File imgFile = new File("C:\\Documents and Settings\\rueca\\Desktop\\sampleImg.jpg");
        Tesseract instance = Tesseract.getInstance();  // JNA Interface Mapping
        // Tesseract1 instance = new Tesseract1(); // JNA Direct Mapping

        try {
            String result = instance.doOCR(imgFile);
            System.out.println(result);
        } catch (Exception e) {
            System.err.println(e.getMessage());
        }
    }
}

1 个答案:

答案 0 :(得分:1)

除了添加jar之外,您还需要添加本机。您可以使用Djava.library.path="C:\[absolute path to dir containing *.dll files and such]"

执行此操作

请注意,您需要提供目录,而不是文件本身。

相关问题