当您知道文本的字体和大小时,如何从图像中读取文本

时间:2013-05-30 02:10:18

标签: java ocr

我正在使用Java并尝试从图像中读取文本。我知道文本的字体和大小(小,8pt)。这些不是扫描图像,文本永远不会倾斜或斜体等。我已经研究过基于Java的OCR,但我真的不需要一个完整的OCR库/程序,我想自己编写它。< / p>

我的搜索是否已经问过这个问题已经引导我:Text Extraction from an Image Using java。我真的不知道如何进行区域匹配。

我尝试的解决方案是首先调整对比度/亮度或以其他方式消除抗锯齿,然后使用每个字符之间的空垂直像素线作为分隔符将图像分割成字符图像,然后使用一些算法分别匹配每个字符。问题是我发现一些字母之间没有任何空格来确定一个开始和另一个结束。

以下是文字示例。 'f'字符是在它们之间没有空格的字符的示例 enter image description here

1 个答案:

答案 0 :(得分:0)

如果你设法找到第一个“f”,为什么不停止并继续搜索,给它一个你知道的检查点。使其适用于所有不需要的连接 1.您可以使用最匹配的检查点 2.当你输掉一场比赛时,你可以前进,从最初和最后得分中来回检查,你可以通过simelteniosly检查它们。