改善图像的DPI

时间:2017-08-26 19:13:39

标签: image-processing computer-vision imagemagick tesseract

Following up on this post

Hello社区。我正在努力解决上述帖子中提到的同样问题。我想在将图像发送到OCR之前对其进行预处理,以便获得合适的输出。出于这个原因,我想增加图像的DPI,建议的解决方案是使用Imagemagik。有人可以帮我了解如何使用Imagemagick重新采样图像。它有很多重采样过滤器,我不知道如何进一步。 以下是ImageMagick重新采样页面Resampling的链接。

我是信号处理和计算机视觉的新手。我希望有些大师可以告诉我什么以及如何做。

1 个答案:

答案 0 :(得分:4)

DPI是一种非常随意的措施,它只是一块可随意更改的元数据。你想要做的是真正高档的图像(相同物理尺寸的更多像素:更多的​​DPI)。

但恕我直言增加像素的方式不会起作用。 OCR软件需要更多DPI,因为它通常意味着需要处理更多信息。在300DPI时,10点小写字符约为20x20px(400像素),在100DPI时,它只有7x7。

当您放大图片时,您不会在图片中添加信息。新像素只是根据现有像素计算出来的。净效果是放大的图像要么像素化要么模糊,这取决于所使用的算法,并且OCR并不能真正获得更多数据来处理。

TL; DR:你可以尝试重新取样,但它不太可能工作。

在水獭手上,DPI在这里毫无意义。它仅在扫描通常尺寸的打印文本(大约10个点)时作为指示,真正重要的是以像素为单位的字符大小。如果它们已经大约20x20(DPI高的小字体,或DPI低的大字体)那么你应该没问题。