c# - 在图像中定位文本

时间：2008-08-05 03:04:44

标签： c# image image-processing artificial-intelligence

我目前正在开展一个项目，我的目标是在图片中找到文字。 OCR的文本不是我的意图。我想基本上获取图像中文本的边界。我正在使用AForge.Net成像组件进行操作。在某种意义上的任何帮助？

2009年2月5日更新：我已经在我的项目中沿着另一条路走了。但是我确实尝试使用MODI（Microsoft Office Document Imaging）获取文本。它允许您轻松地OCR图像并从中提取文本。

答案 0 :(得分：12)

这是一个活跃的研究领域。关于这个问题，有很多关于学术论文的文章。给你提供帮助尤其是没有更多的deatails是很困难的。您在寻找特定类型的文字吗？字体？仅限英语？你熟悉学术文献吗？

“文本检测”是任何OCR（光学字符识别）系统中的标准问题，因此在互联网上有许多代码处理它。

我可以开始列出来自谷歌的大量链接，但我建议你只是搜索“文本检测”并开始阅读:)。还有很多示例代码。

答案 1 :(得分：3)

识别图像中的文本确实是该领域研究人员的热门话题，但只有在captcha's成为防御垃圾邮件机器人的“常态”时才开始失控。为什么要使用captcha作为保护？好吧，因为它很难在图像中找到（和读取）文本！

我提到验证码的原因是因为最大进步*是在这个小区域内进行的，我认为你的解决方案最好在那里找到。特别是因为验证码确实是在杂乱的图像中找到文本（或类似文本的东西），然后尝试正确读取字母。

所以，如果你能找到自己a good open source captcha breaking tool，你可能拥有了继续你的任务所需的一切...... 你甚至可以丢弃处理字符识别本身最困难的代码，因为那些OCR用于读取扭曲的文本，这是你不必做的事情。

*：“非研究人员”的可见，可用和实用信息方面的进步

答案 2 :(得分：0)

如果您可以使用在线API，http://www.wisetrend.com/wisetrend_ocr_cloud.shtml的API除了OCR之外还可以进行文本检测。

答案 3 :(得分：0)

Stroke width transform可以为您做到这一点。这至少是MS为他们的手机操作系统开发的。关于实施的讨论是here at https://stackoverflow.com/