自定义字体(lang)的Tesseract Segmentation故障

时间:2018-04-05 12:58:55

标签: tesseract

我是Tesseract的新人,可能会错过了解很多事情)。

我跟着this article训练Tesseract获取特定字体。

一切都按预期工作,所以我在/usr/share/tesseract-ocr/tessdata/新文件eve.traineddata(我复制的唯一文件,因为文章没有要求更多)。

但现在,当我跑:

/usr/local/bin/tesseract -l eve image.png textfile

我得到了:

mgr->GetComponent(TESSDATA_INTTEMP, &fp):Error:Assert failed:in file adaptmatch.cpp, line 537
Segmentation fault (core dumped)

这只附加-l eve(显然)。 我没有在互联网上找到任何解释(即使它似乎是一个常见的问题)。

我想至少了解出了什么问题,如果可能的话,学习如何修复它。

在计算eve.traineddata时我做错了什么或者它可能是另一回事吗?

此问题与this one不同,我们遇到同样的错误,但我不想绕过它并且没有覆盖我的eng.traineddata文件

如果需要,我可以链接受过训练的数据文件,但我不确定它是否有用。

1 个答案:

答案 0 :(得分:0)

我收到此错误,因为我的.box和.tif文件没有匹配的名称。确保我有lang.fontName.countNumber.tif和lang.fontName.countNumber.box对后,它开始工作。希望对您有帮助

相关问题