不要在python中替换包含撇号或&的单词

时间:2018-11-01 13:41:32

标签: python regex

我有以下设置:

fword = "don"
comment_true = "Don is bad. Don't eat nails. Carl&Don. Don&Carl. Don, Don."
comment_false = "Don't do this"
replace_with = "[ANONYMISED]"

首先,我想检查fwordcomment_true还是comment_false中。

接下来,我想将fword替换为replace_with

结果字符串应为:

comment_true:

"[ANONYMISED] is bad. Don't eat nails. Carl&Don. Don&Carl. [ANONYMISED], [ANONYMISED]."

comment_false:

"Don't do this"

目前我正在使用的第一个任务:

 True if re.search(r'\b%s\b' % fword, comment) else False

对于第二项任务,我正在使用

re.compile(r"\b%s\b" % fword, re.IGNORECASE).sub(replace_with, comment)

但是对于这个问题,它们是不够的,因为收缩的部分,例如“不要”或Carl&Don,是匹配的。这个问题不是简单的空格检查,因为我只需要转义一些符号即可。

在此处查看示例: https://regexr.com/42bc8

我该如何实现?

1 个答案:

答案 0 :(得分:1)

尝试使用正则表达式:(?:^|(?<=\s))don(?=,|\.|\s|\Z)

Demo