Tesseract命令行上的OCR换行符

时间:2016-12-29 13:56:30

标签: tesseract

我在命令行中使用Windows 7中的tesseract.exe,在扫描OCR图像时,我以连续行输出。我希望它在文字中完全按照它在图像中的方式。这些变化是否有命令行参数?任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:1)

这是因为Tesseract只将换行符放在一行的末尾,而不是像Windows记事本那样的回车符+换行符。一个简单的解决方法是将结果输出到stdout并将此输出重定向到文件中:

tesseract.exe eurotext.tif - > result.txt

而不是

tesseract.exe eurotext.tif result