将非英语文本转换为可读格式

时间:2010-08-29 21:11:51

标签: c# .net language-features

我从网上获取字符串,这些字符串通常包含我的应用程序中无法识别的重音字符。

编辑 - 我正在使用HtmlAgilityPack获取我的字符串。我正在使用InnerText标记的<title>。虽然这样做,Pack使用与原始HTML文档不同的编码(我不确定哪些编码?)。

        // get the html title inner text and assign to htmlParts object
        HtmlNode titleNode = doc.DocumentNode.SelectSingleNode("//title");
        string docTitle = titleNode.InnerText;
        htmlParts.htmlTitle = docTitle.ToString();

有谁能告诉我如何从"(Subtitulado al español).avi"转到"(Subtitulado al español).avi"

我非常感激。 :)

2 个答案:

答案 0 :(得分:2)

看起来你正在获得UTF-8,但是将其作为ISO-8859-1进行处理。

如果不了解更多有关您系统的信息,就无法提供更具体的信息。

答案 1 :(得分:0)

对您阅读的数据应用适当的编码。究竟怎么样?好问题。为此,您至少需要提供导致问题的代码。