培训tesseract和多页tiff

时间:2012-05-27 00:11:17

标签: ocr tesseract

我在Windows 7 64位上使用tesseract 3.0.1。

有关培训的文件说:

  

每个字体应该放在一个多页tiff中(只有你自己   使用libtiff!

我对libtiff不熟悉。我使用ImageMagick创建多页tiff。到目前为止,这种方法运作良好,或者至少看起来很好。我希望以后能够获得一些路障吗?如果是这样,如何处理libtiff - 是否足以运行其设置或我需要配置什么?

1 个答案:

答案 0 :(得分:1)

Tesseract并不关心你如何制作你的多页tiff,只要它能用leptonica读取它(内部依赖于libtiff)。如果tesseract现在可以处理你的tiff,它可以在剩余的训练过程中运行并运行OCR,所以你很高兴。 我用.Net标准库生成了我的多页tiff,tesseract没有问题。

相关问题