PyTesseract可以将包含分数的图像转换为文本吗?

时间:2018-09-27 15:25:32

标签: python-3.x fractions python-tesseract

我正在尝试将这样的图像转换为文本:

1'-4 1/8

我从pytesseract得到的输出是1 l_4§ll
我的理想输出是1'-4 1/8"

请注意,这适用于按顺序放置小数的文本图像,例如,即使您裁剪了理想输出的图像,即使有时将引号弄乱并用短划线也可以,但这是我能够使用的。

我如何让pytesseract处理这种分数图像?

我在python中用于读取图像文本的代码:

from PIL import Image
import pytesseract
import cv2

def get_text_from_file(img_path):
    #load image
    image = cv2.imread(img_path)
    text = get_text_from_image(image)
    return text

def get_text_from_image(image):
    text = pytesseract.image_to_string(image)
    return text

0 个答案:

没有答案