python - 无法使用tesseract从图像中提取文本

无法使用tesseract从图像中提取文本

时间：2017-02-02 11:32:42

标签： python ocr tesseract

我正在尝试使用tesseract工具从图像中提取文本。但是，对于某些图像，tesseract无法检测到文本。我试图按照页面improve the quality of the output但是徒劳无功。我附上了tesseract失败的样本图片。请让我知道任何其他有助于我提高输出质量的指针。
我正在使用pytesseract来自动化它。

1 个答案:

答案 0 :(得分：1)

众所周知，Tesseract在图像背景上存在文本困难，例如在你的模因中。因此，您需要进行一些预处理才能从后台删除文本。如果您愿意使用OCR api，请尝试使用Google Cloud版本或OCR.space，这两种图像都可以正常使用。

来自ocr.space的叠加。

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？