有没有办法用tesseract识别图形或图片中的文字?

时间:2011-06-06 23:22:15

标签: tesseract

首先,对不起我的英语。我有关于tesseract的问题。有没有办法识别图形或图片中的文本而无需清理您想要识别的图像?我在那里读到的首先清理图像,删除图形和照片,只留下文字。但我希望用户上传到服务器和剪报,你可以在没有人为干预的情况下识别这个新闻。这可能很棘手。但是,如果你知道其他任何方式我可以做,因为他们感激不尽。非常感谢你

1 个答案:

答案 0 :(得分:0)

不,你不能。

Tesseract用于阅读文本和文本。当您对同时包含文本和图像的主题执行OCR时,Tesseract会将其在图像中找到的内容吐出(乱码)。

可以检测图像区域并将其裁剪掉。我认为这是一个更好的问题。