为什么Tesseract不会识别一个简单的单词?

时间:2016-09-04 11:58:25

标签: tesseract

我正在尝试使用Tesseract,并且在第二次尝试时已经失败了。

这是图像文件:

enter image description here

结果始终为空字符串。代码如下:

from pytesseract import image_to_string

image_file = Image.open('image.png')
print(image_to_string(image_file))

我也直接从终端

尝试
  

tesseract image.png out

再次没有成功。

这张图片有问题还是我做错了什么?

我正在使用安装了apt-get的Tesseract的Ubuntu 14.04以及使用pip安装的pytesseract。

Python版本:3.4

2 个答案:

答案 0 :(得分:0)

应用灰度或单色滤镜后,它会产生" DDownload!"。

答案 1 :(得分:0)

this文档中,我发现了对这些advices的有趣链接,这些链接应该会有所帮助。看看" 4准备图像"在建议页面中。

  

更先进的OCR程序本身就可以做到这一点。毫无疑问,Tesseract   会有所改善。