Python:正则表达式匹配不能正确结束

时间:2016-11-11 21:29:09

标签: python regex

我正在尝试匹配Python中的正则表达式。

我希望匹配\u01234stringstring\u01234stringstring\u01234等字符串。

我的解决方案是\\u\d+\D+(,|\s|\D+)

点击https://regex101.com/r/gmWALn/1查看我的表情和示例文字。

问题:无论我尝试什么,比赛都拒绝结束。如果我添加$,那么它将无法匹配任何内容。

enter image description here

在此示例中,\u0130stanbulRegi\u00f3n

2 个答案:

答案 0 :(得分:0)

如果你的字符串总是会像上面所示那样有一个unicode char,那么这个正则表达式就可以了:

icon2.*\n.*\n.*>\s*([\s\S]+?)\s*(?=<\/td>)

在此成功测试:http://pythex.org/

答案 1 :(得分:0)

\u00f3不是字面斜杠,&#34; u&#34;和十六进制字符。它只是unicode字符U + 00F3 ó的表示(带有急性的拉丁语小写字母O)。

因此,如果您想匹配它,请使用模式:ur'ó'