在python中将多行字符串转换为单行字符串

时间:2019-02-08 08:42:10

标签: python tesseract multiline python-tesseract

我正在使用tesseract库,希望图像中的文本在一行中,而没有新行("\n")。

我尝试使用variable.replace("\n"," "),但是它不起作用。它只是给了我相同的多线响应。

下面是我的代码:

img = Image.open('maaan.jpg')
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
kt = pytesseract.image_to_string(img,lang='eng')
kt.replace("\n", " ")
print(kt)

感谢帮忙:D

2 个答案:

答案 0 :(得分:1)

\n写为raw string,例如:

my_variable = my_variable.replace(r"\n"," " )

尝试:

print(kt.replace(r"\n"," ") 

或者,

kt = kt.replace(r"\n", " ")
print(kt)

答案 1 :(得分:0)

kt.replace("\r", "\t")

访问此链接,它具有更多说明:python convert multiline to single line