unicode URL的正则表达式

时间:2011-05-11 10:36:51

标签: regex unicode

URL有一个正则表达式,但它不支持unicode字符。

^(ht|f)tp(s?)\:\/\/[0-9a-zA-Z]([-.\w]*[0-9a-zA-Z])*(:(0-9)*)*(\/?)([a-zA-Z0-9\-\.\?\,\'\/\\\+&%\$#_]*)?

我想在javascript和C#

中使用它

2 个答案:

答案 0 :(得分:2)

将所有a-zA-Z替换为\pL

感谢@Lesley:

javascript中没有Unicode属性,我们必须使用像regexp这样的包。

答案 1 :(得分:1)

当你使用Unicode字符时,我认为你想要获得非英语语言(如阿拉伯语,希伯来语或波斯语......),所以只需要将a-z A-Z改为{{} 1}}或其他等价物