open-source - 中文的开源OCR - Thinbug

中文的开源OCR

时间：2009-12-15 03:02:20

标签： open-source design-patterns ocr tesseract

我一直在寻找中文的开源OCR。但没有任何运气，似乎很少有一些可用的开源OCR（中文）。

所以我在这里想知道：

是否有可用于生产环境的中文开源OCR？
为拉丁语和中文实施OCR时的主要区别是什么？我知道一些好的OCR，如Tesseract或Ocropus，如果我想让它支持中文，我该怎么办？

任何帮助都表示赞赏，并提前致谢〜

2 个答案:

答案 0 :(得分：4)

您可以选择：

Tesseract 3.0支持中文/日文
NHOCR支持日语

答案 1 :(得分：0)

汉语比拉丁语有更多的字符。有一些商业产品。其中一种方法是联系他们并获得帮助。

我认为中文或日文字符没有开源。在OCR领域，除了模式识别算法之外还有很多技术，公司擅长，而不是开源社区。