您可以使用MODI OCR识别非语言特定项目吗?

时间:2011-03-05 20:56:45

标签: .net ocr modi

我有一个文件OCR处理图像,当页面上有“咖啡”或“432”这样的单词时工作正常,但当我尝试OCR像“abc123”这样的单词时,我得到一个“OCR”运行错误“。

MODI.Document md = new MODI.Document();

md.Create("c:\\temp\\mpk.tiff");

md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);  // <-- Error thrown here
MODI.Image image = (MODI.Image)md.Images[0]; 

FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);

StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();

md.Close();

当然,MS没有将此库构建为识别基于语言的单词?或者他们呢?我错过了MODI.document设置吗?

任何帮助将不胜感激,

1 个答案:

答案 0 :(得分:2)

是的,他们做到了。如果没有相关的字典和不提供上下文的片段,OCR会变得非常不准确。人类也是如此:ABC123,ABCI23,ABCl23。三种不同的字符串这在实践中通过使用特殊字体来解决,这些字体可以最大限度地减少字母和数字不明确的几率,这是您在银行支票上看到的那种。