是否可以将特定于语言的字符转换为UTF8中的拉丁字符

时间:2011-06-14 10:39:31

标签: unicode c#-4.0

我想知道是否有任何关系或现有算法允许在UTF8代码页中将国家字符转换为等效的拉丁字符?

例如(波兰语):

Ą - >甲

Ó - > 0

ż - > ž

ź - > ž ...

短语如:'zażółćgęśląjażń'

转换为:'zazolc gesla jazn'

目前我正在使用波兰语的转换数组,但我正在寻找一种处理所有拉丁语言的通用解决方案。

由于

3 个答案:

答案 0 :(得分:1)

检查一下:

http://sourceforge.net/projects/iconvnet/

一般情况下,搜索名为iconv

的内容

答案 1 :(得分:1)

为了完成答案,'Unicode分解+ C#'让我看到了这篇CodeProject文章(codeproject.com/KB/cs/UnicodeNormalization.aspx?display=Print),它提供了一个现成的解决方案。无法低估为您所寻找的名称命名的能力;)感谢所有答案。

答案 2 :(得分:0)

不完全确定这是您需要的明确答案,但是当我过去必须这样做时,我已将所有“特殊”字符转换为命名或数字实体,以便它们受到保护在转换过程中。

相关问题