扫描文档扫描仪的最佳设置(TIFF和PDF)

时间:2013-09-04 18:13:09

标签: ocr tiff pdf-conversion

扫描文件的最佳设置是什么?扫描文档(白色和黑色文本)并将其用于OCR转换(以获得最佳效果)以及PDF和TIFF格式的标准设置和规范是什么?

4 个答案:

答案 0 :(得分:2)

对于OCR,最佳扫描设置为:

  • 常规文本的300 dpi分辨率,特别小字体的400 dpi分辨率(精细打印)
  • 黑与...白色为文本,灰度为小字体,颜色为图片
  • TIFF格式。 Group4用于黑&白色(非常小的文件大小)。如果需要颜色,请使用未压缩(非常大的文件大小)。

某些OCR技术可能有特殊的偏好,这可能会有所帮助,但它们通常很小。

答案 1 :(得分:1)

出于OCR目的,我会以300DPI,B / W或灰度以及未压缩的TIFF或PNG格式扫描文档。

答案 2 :(得分:0)

虽然300DPI最适合"完美"输入,如果你使用不完美的输入(例如从打字机或点阵打印机),那么高分辨率实际上会抛出tesseract。在这种情况下,最好使用较低的分辨率来隐藏瑕疵。例如。使用点阵打印机,我在150dpi时的效果明显优于300dpi。

答案 3 :(得分:0)

如果你想得到一般答案,300 DPI是好的。通常用于黑白图像的最佳OCR结果,如果您的图像质量较低,您可以通过应用图像处理来改善它。

另外,如果要保存扫描图像然后将其送入OCR引擎,请不要使用像JPEG这样的有损压缩。请注意,存在无损JPEG压缩,但通常不支持。