C#下载网页 - 编码

时间:2014-11-02 12:09:57

标签: c# html encoding character-encoding

我对编码问题感到困惑。传统上,我使用HttpWebRequest和HttpWebResponse来下载网页内容。

为什么会混淆?

由于内容的两个部分包含编码:

  1. HttpWebResponse包含文档的编码。
  2. 网页(HTML)它自己包含定义它的编码的标签。
  3. 这两种编码可能会发生冲突,其中一种可能会丢失或错误。

    我应该如何确定哪种编码适合此网页?

    解决方案需要具有通用性 - 适用于任何HTML网页。

    谢谢。

0 个答案:

没有答案