阿拉伯语的开源OCR库

时间:2011-01-14 21:33:35

标签: image-processing nlp ocr arabic

我正在寻找一个OCR库 - 最好是开源 - 我可以在一些阿拉伯语pdf上使用。谷歌搜索没有产生任何有用的东西。我想知道是否有人知道相关的OCR库,甚至是相关语言(波斯语和乌尔都语可能相关),可以添加阿拉伯语支持。

有关如何处理此问题的任何一般性建议将不胜感激。

3 个答案:

答案 0 :(得分:9)

Tessaract-ocr版本3.01开始,它现在支持阿拉伯语

答案 1 :(得分:0)

我对阿拉伯语OCR质量一无所知,但有些智能谷歌搜索发现Sakhr's Automatic Reader。这是商业软件。

对不起。它是商业的,而且相当昂贵。阿拉伯语可能是世界上最难进行OCR的语言之一 - 我想要激励某人做这件事需要很多。

答案 2 :(得分:0)

由于语言的性质,阿拉伯语在OCR方面很复杂,并且没有免费或商业软件可以100%准确。

根据我的个人经验,您可以尝试IRISREadIRIS pro 14。