字符串中的无效字符 - 正则表达式

时间:2014-04-04 21:33:44

标签: regex mongodb

我在我的数据库中存储文件名,当使用国际语言时,它会存储下面的内容作为我的文件名。

 平素ãã誠ã«ãä¸è©±ã«ãªã£ã¦ããã¾ã.docx

请有人能给我一个正则表达式来识别这些无效字符吗?

以下字符是可以接受的:

a-z, 0-9 , () <> [] {}  %^&*$#@~"';?:! etc. 

都是可以接受的。只是不是键盘上看不到的那些。

谢谢。

1 个答案:

答案 0 :(得分:1)

一个相当不错的近似值

[^[:ascii:][:print:]]

匹配非ASCII或不可打印的字符。当然,问题是开放的,是否可打印的ASCII代码足以作为文件名的一部分被接受...