我想知道是否有任何关系或现有算法允许在UTF8代码页中将国家字符转换为等效的拉丁字符?
例如(波兰语):
Ą - >甲
Ó - > 0
ż - > ž
ź - > ž ...
短语如:'zażółćgęśląjażń'
转换为:'zazolc gesla jazn'
目前我正在使用波兰语的转换数组,但我正在寻找一种处理所有拉丁语言的通用解决方案。
由于
答案 0 :(得分:1)
答案 1 :(得分:1)
为了完成答案,'Unicode分解+ C#'让我看到了这篇CodeProject文章(codeproject.com/KB/cs/UnicodeNormalization.aspx?display=Print),它提供了一个现成的解决方案。无法低估为您所寻找的名称命名的能力;)感谢所有答案。
答案 2 :(得分:0)
不完全确定这是您需要的明确答案,但是当我过去必须这样做时,我已将所有“特殊”字符转换为命名或数字实体,以便它们受到保护在转换过程中。