正则表达式重复单词

时间:2018-06-11 08:28:08

标签: regex google-cloud-dataprep

我需要匹配(NOT DELETE)文本中所有重复的单词。

例如:男装·T恤·衬衫·复古·T·衬衫·1990·深·黑·红·文·深·黑·红·文·X-小

深·黑·红·文·深·黑·红·文字重复。

我找不到正则表达式。

请帮忙!

P.S。有时它只是一个单词匹配:例如棕褐色,有时像我之前提到过的模式。

1 个答案:

答案 0 :(得分:-1)

您可以使用RegEx \b(\w+)\b(?=.*\b\1\b)

  • \b(\w+)\b匹配任何单词字符1次或多次,前后跟单词边界

  • (?=.*\b\1\b)确保在您的比赛结束后重复第一组中匹配的内容。

Demo.

相关问题