如何从字符串中删除非国际字母数字字符?

时间:2015-07-01 09:28:22

标签: c# .net unicode

如何从字符串 中删除(或识别)非字母数字字符,例如'-', '*', '‡', '€', '⁋', '™',而不删除非拉丁文 字母数字字符,例如{{ 1}}?

删除部分很简单,我的问题是区分非拉丁字母和非拉丁符号。


*所有现有的Q& A我发现过滤掉了非拉丁字母。

1 个答案:

答案 0 :(得分:0)

一个简单的解决方案(仅适用于基本BMP字符)是:

construct

Char.IsLetterOrDigit被描述为:

  

指示指定的Unicode字符是分类为字母还是十进制数字。

如果你想支持代理对,那就变得更复杂了:

SuiteTes