字符串比较的可忽略字符列表

时间:2014-01-30 10:51:30

标签: c# string unicode

C#中的文化敏感比较没有考虑“可忽略的字符”:

  

字符集包括可忽略的字符。 Compare(String,String)方法在执行区分文化的比较时不考虑这些字符。例如,对“动物”与“动物”(使用软连字符或U + 00AD)进行文化敏感的比较表明这两个字符串是等效的,如下例所示。

我在哪里可以找到这些字符的完整列表,并且可能是字符串包含可忽略字符的比较的一些细节?

1 个答案:

答案 0 :(得分:5)

所有Unicode代码点都有一个由Unicode联盟指定的“默认可忽略”属性;如果可忽略字符的.NET概念与该属性的值有任何不同,我会感到非常惊讶。

字符可默认忽略的权威资源是Unicode标准,特别是第5.21节(link to chapter 5 PDF for Unicode v6.2.0)。