任何语言的单词字符的正则表达式

时间:2012-09-27 16:44:09

标签: php regex

测试PHP正则表达式引擎,我发现它只将[0-9A-Za-z_]视为单词字符。非ASCII语言(如希伯来语)的字母不与[\w]的字符匹配。是否有任何PHP或Perl正则表达式转义序列符合任何语言的字母?我可以为我希望使用的每个字母添加范围,但是用户总是会用意想不到的语言给我们带来惊喜!

请注意,这不是用于安全过滤,而是用于标记文本。

2 个答案:

答案 0 :(得分:12)

尝试[\pL_] - 请参阅

中的参考资料

http://php.net/manual/en/regexp.reference.unicode.php

答案 1 :(得分:1)

试试\p{L}。它匹配来自任何语言的任何类型的字母。如果您不想使用字符集[]

相关问题