UTF8:U +00E9é分为U + 0065 e和U + 00B4'

时间:2013-09-25 11:56:40

标签: c# sql-server vb.net encoding diacritics

我正在努力研究一些UTF8数据。

当我以十六进制视图打开UTF8文件时,é分为两个字符( U + 0065 e U + 00B4'< / strong>)而不是使用明显的字符 U +00E9é

如果我将这些数据存储在我的数据库中(注意:整理设置为 German_PhoneBook_CI_AI ) 那就存储了

Depardieu,Ge'rard(!!)

代替: Depardieu,Gérard

所以我想知道数据本身是否有缺陷或者我缺少什么样的信息。 如果您需要更多信息以及此问题,请与我们联系。

明显的问题是:我该如何解决这个问题?

注意: 我将这个问题标记为C#/ VB.NET,因为可能存在代码片段有用的答案。

1 个答案:

答案 0 :(得分:0)

我们解析unicode的网站没有提供正确的unicode。