使用正则表达式删除标点符号

时间:2019-06-02 04:26:02

标签: python regex

我尝试了以下方法,但是

s = '白云区H(52)077楼盘'

''.join(re.findall(u'([\u4e00-\u9fff0-9a-zA-Z]|(?<=[0-9])[^\u4e00-\u9fff0-9a-zA-Z]+(?=[0-9]))', s))

但是我得到了白云区H52)077楼盘而不是白云区H52077楼盘

正确的方法是什么?

谢谢。

2 个答案:

答案 0 :(得分:3)

据我所知,您可以这样做:

print(re.sub(u'[^\w\s]', '', s))

哪个输出:

白云区H52077楼盘

答案 1 :(得分:0)

尝试使用以下类似内容:

replace('白云区H(52)077楼盘', @'[\(\)]', '')

祝你好运!