我使用tesseract引擎来OCR我的图像,如下所示。 image1 to OCR image2 to OCR
我使用了eng lang,并为引擎配置了一个白色的字符列表:" 0123456789abcdefghijklmnopqrstuvwxyz"
pOCREngine->SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz");
准确性不好,大约10%左右。我试图用大约200个这样的图像训练引擎,并将训练好的数据与eng + mytrainedfont结合起来。准确性没有提高。
有没有人有任何想法改善此类图像的OCR?谢谢你提前。