我在Android应用中使用tesseract进行OCR。我专注于中文,但我只需要识别几个关键字,所以我想用jTessBoxEditor创建我的.traineddata文件。我想知道中文繁体TessData文件使用什么字体? https://github.com/tesseract-ocr/tessdata
或者,有没有办法可以编辑chi_tra.traineddata文件,因此它只能识别几个关键字?我这样做的主要原因是文件大小为63.4 MB,tesseract在完成之前大约需要2到3分钟。准确性很好,但速度很慢。