iPhone上的数字识别是否可以实时实现?

时间:2011-02-03 14:24:09

标签: iphone ocr tesseract vision

我需要实时识别iPhone上相机图像中的数字。我知道图像上的数字不会超过5位。

鉴于iPhone的计算规格,这个问题是否切合实际? 有没有人有使用Tesseract OCR库的经验,您认为可以通过使用它来解决吗?

5 个答案:

答案 0 :(得分:11)

取决于你对“实时”的定义,但是,应该可以相对快速地识别iPhone 4上的数字0-9,特别是如果你可以使用字体,光照条件等。他们将出现在。

我强烈建议您使用iPhone相机阅读how Sudoku Grab does its recognition of puzzles上的文章。在他们的情况下,使用经过训练的神经网络来识别数字,这在现代iOS硬件上应该相当简单和快速。

当前的识别库,如OpenCV,将使用iPhone的CPU进行处理。我听说他们可以做更复杂的任务,比如面部识别能够快速地使用视频源,同时显示最少量的口吃。

为了获得更好的性能,我相信新款iOS设备上的可编程GPU有很多潜力。在my benchmarks中,当使用iPhone 4的GPU进行简单的图像处理时,我看到了14倍-28倍的加速。虽然现在很少有人在看这个,但像Sudoku Grab的神经网络这样的东西应该是一个足够平行的过程,可以从GPU上运行中受益。

答案 1 :(得分:1)

应该是计算上可行的。有些应用程序可以实时获取条形码,还有一个可以进行实时翻译的应用程序。 (文字镜头)。但是,我不确定他们使用哪些库。

答案 2 :(得分:1)

是的,可以使用tesseract引擎

如果您想查看以下示例代码...

https://github.com/nolanbrown/Tesseract-iPhone-Demo

答案 3 :(得分:1)

有免费的SDK:http://rtrsdk.com/支持iOS和Andorid,实时工作,帮助您捕获任何文本,数字应该不是问题。

免责声明:我为ABBYY工作

答案 4 :(得分:0)

是。 Bender可以帮助您。它允许您在iOS上构建和运行神经网络。因为它在引擎盖下使用金属,它运行快速和平稳。它还支持直接运行TensorFlow模型。

因此,如果您需要帮助,可以在Bender中运行TensorFlow中现有的模型,以便进行数字识别Handwritten Digit Recognition using Convolutional Neural Networks in Python with Keras

免责声明:我参与了这个项目。

相关问题