图像中的半自动文字突出显示?

时间:2011-03-02 05:00:49

标签: image-processing automation ocr

问候Overflowers,

鉴于:

  • 我有包含混合语言文字的文件图片
  • 我希望最终用户能够突出显示此文本(逐字逐句)
  • 我已经以简单的数字格式提供此文本
  • 我会帮助我的程序找出单词的位置
  • 我不希望我的帮助对我来说很乏味
  • 我还会手动修复程序后的小错误

我可以为我的程序提供哪些最好的简单帮助,以便能够在所选单词周围绘制矩形?你会用什么算法来实现这个程序?我尝试过像OmniPage Pro这样的OCR,但它们没有提供这种功能。

此致

1 个答案:

答案 0 :(得分:0)

几年前,我在我的应用程序中实现了一个单词边界框和突出显示的单词。你说“我有这种文本的简单数字格式”。一个关键组件是具有字符或单词的坐标,以便将它们映射到适当的图像区域。与可搜索的PDF一样,当您选择文本时,它会在内部映射到图像层,而图像上的相反选择则选择匹配的文本。但是即使从PDF那些坐标也无法导出我相信。如果您的文本中当前不存在此类坐标信息,则最简单的可能是使用高质量引擎重新OCR图像,该引擎可以生成坐标作为输出的一部分。如果您使用WiseTREND OCR Cloud 2.0,那么XML输出将生成所有详细的元数据。如果存在坐标信息,则所有主要组件都在那里,它只是围绕有效的UI设计工作。

相关问题