中文的开源OCR

时间:2009-12-15 03:02:20

标签: open-source design-patterns ocr tesseract

我一直在寻找中文的开源OCR。但没有任何运气,似乎很少有一些可用的开源OCR(中文)。

所以我在这里想知道:

  1. 是否有可用于生产环境的中文开源OCR?

  2. 为拉丁语和中文实施OCR时的主要区别是什么?我知道一些好的OCR,如Tesseract或Ocropus,如果我想让它支持中文,我该怎么办?

  3. 任何帮助都表示赞赏,并提前致谢〜

2 个答案:

答案 0 :(得分:4)

您可以选择:

  • Tesseract 3.0支持中文/日文
  • NHOCR支持日语

答案 1 :(得分:0)

汉语比拉丁语有更多的字符。有一些商业产品。其中一种方法是联系他们并获得帮助。

我认为中文或日文字符没有开源。在OCR领域,除了模式识别算法之外还有很多技术,公司擅长,而不是开源社区。