创建优化/适合OCR的相机活动

时间:2012-01-27 15:04:01

标签: android ocr android-camera tesseract

我正在尝试制作相机活动,以便将照片拍摄为OCR。这就是我希望实现的目标:

  1. 相机预览中间的可调整大小的框,用于指示将在Bitmap中创建哪个特定区域并由OCR引擎处理。
  2. 连续自动对焦(完成)
  3. 我正在使用tesseract btw。

    如果有人愿意给我一些参考/示例/教程,那就太棒了。

3 个答案:

答案 0 :(得分:3)

答案 1 :(得分:1)

我一直在做类似的事情。现在,我只是将整张照片发送到网络服务并使用OCRfeeder进行处理,这将对图像执行分段并将每个部分中的文本发送到tesseract。我一直在以这种方式获得更好的准确性。此外,您可能希望执行some preprocessing to clean up the image first.

答案 2 :(得分:0)

可以有两种一般方法。

您可以在将图像发送到OCR引擎之前调整图像大小。请记住,您使用的Tesseract引擎具有某种功能 - 它需要在字符和图像边框之间留出一些空间,有时会超出预期。

第二种方法是使用字段级识别,指定文本块的坐标并将完整图像发送到OCR引擎。看看http://www.ocrsdk.com,它是最近由ABBYY推出的带有web api的云OCR SDK,它处于测试阶段,所以现在它可以免费使用。它有一个field level recognition methodsAndroid code samples。我工作@ ABBYY,如有必要可以提供有关我们产品的其他信息

相关问题