如何使用pytesseract从图像中识别文本

时间:2019-04-23 05:35:23

标签: image-processing computer-vision ocr tesseract python-tesseract

pytesseract不会从噪声图像中提取文本。

我正在托盘中使用pytesseract从图像中提取文本。 pytesseract在某些图像上表现良好。 我已经应用了以下预处理技术。

img = cv2.imread('crop.jpg', 0)
blur = cv2.medianBlur(img, 5)
kernel = np.ones((1, 1), np.uint8)
dilate = cv2.dilate(img, kernel, iterations=5)
erode = cv2.erode(dilate, kernel, iterations=5)
img = cv2.threshold(cv2.GaussianBlur(erode, (5, 5), 0), 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

pytesseract.image_to_string(crop)

从图像中提取文本:

enter image description here

0 个答案:

没有答案