ocr - 文档OCR /可读性的图像处理/增强算法？

时间：2009-04-03 19:06:00

标签： ocr

我正在寻找算法，论文或软件来增强传真，手机摄像头的图像以及其他类似的可读性和OCR来源。

我主要对简单的增强感兴趣（例如你可以用ImageMagick做的事情），但我也对更复杂的技术感兴趣。我已经和供应商谈过了，所以对于这个问题，我主要是寻找算法或开源软件。

进一步澄清：我不是在寻找OCR软件或算法;我正在寻找算法来清理图像，使其看起来对人眼更具可读性，并且可以用于OCR。

答案 0 :(得分：5)

当我写一些软件进行书籍扫描时，我遇到了类似的问题;漂浮在互联网上的是一个名为pagetools的程序，它使用一种称为Radon变换的相当聪明的数学技巧来拉直扫描页面。

我还写了一个小例程，它会使页面上的空白变白;当OCR算法不必与背景噪声竞争时，它们往往会做得更好。我所做的是寻找距离深色的像素不到一个小半径的浅色像素，然后将它们提升为纯白色。

但是，已经有几年了，所以我没有准确的实施细节。

答案 1 :(得分：4)

要查看的一个简单的图像过滤器是“中位数过滤器”，它非常简单，易于实现，过滤器有助于清理扫描/拍摄的文本。 http://en.wikipedia.org/wiki/Median_filter

答案 2 :(得分：2)

根据要求，链接到维基百科：Optical character recognition