Python阅读简单的Captcha Tesseract

时间:2016-08-12 15:32:56

标签: python python-imaging-library ocr captcha tesseract

我是验证码解码的新手,我现在正试图解码它。

This

我知道,这很容易。但我无法做到。 我走到这一步。 This

但仍然没有看到这个问题。 输出是6385145(是的,非常接近,但这是20次尝试的最佳结果)。 我到目前为止使用的脚本是。

from PIL import Image,ImageEnhance
import urllib,os,pdb
im1 = Image.open("code.png")
im1.save("orjinal.png","PNG")
width, height = im1.size
im2 = im1.crop((0, 0, width, height-11))
im2 = im2.resize((int(width*3), int(height*3)), Image.BICUBIC)
im2.save("code.png")
img = Image.open('code.png')
img = img.convert("RGBA")
datas = img.getdata()
yo = img.getpixel((1,1))
newData = []
for item in datas:
    if item[0] == yo[0] and item[1] == yo[1] and item[2] == yo[2]:
        newData.append((0, 0, 0, 255))
    else:
        newData.append(item)
img.putdata(newData)
img.save("captcha.png", "PNG")
os.remove("code.png")
os.system("tesseract -psm 8 captcha.png hi")
with open("hi.txt") as f:
    print f.read()

我无法删除该白线,因此我裁剪了图像。

其他图片/结果:

5390?()

结果:5390?()

enter image description here

结果:1​​6009?

0 个答案:

没有答案
相关问题