如何从图像文件中读取文本

时间:2015-05-20 12:40:25

标签: java swing

我想从图像中搜索一个单词(扫描副本),从图像中检索值,突出显示该位置。是否有可用于处理图像的API或库。我使用Swing来显示图像。

2 个答案:

答案 0 :(得分:1)

您需要将像素转换为字符。这是一个提供OCR的程序。

请记住,您使用的任何程序都会提供其认为该角色的最佳近似值。虽然技术已经有了很大的改进,但是有很多字体,足够的噪音和各种其他混淆因素可能导致错误的输入(角色不是你认为的那样)。还有一些情况是输入无法映射到字符。防御性地编写软件以处理这两种情况,因为这应被视为“未经验证的输入”。

答案 1 :(得分:0)

查看“tesseract”。它不是Java,可用于大多数开源平台,你可以通过System.exec()从java调用命令行程序

https://code.google.com/p/tesseract-ocr/

如果图像格式正确,它的识别率甚至比许多商用OCR软件产品还要好。