从HTTP请求中提取内容,然后从中获取所选内容

时间:2011-01-08 15:35:28

标签: c# httpwebrequest

仅仅是为了学习目的,我玩页面请求和响应。我需要知道如何实现这一点。我想做的是从Windows应用程序发出HTTP请求并从中提取一些内容。例如

我打电话给http://stackoverflow.com/questions 现在从响应我想提取<div id="questions">中的所有问题节点并格式化,然后在表中显示。有些人可以指导我如何做到这一点。我在这里,我可以从正则表达式中进行格式化和提取,但我不确定如何。

提前致谢 Lura公司

2 个答案:

答案 0 :(得分:2)

我建议使用HTML Agility Pack - 它允许您直接获取页面并使用XPath查询它,类似于XmlDocument的工作方式。

答案 1 :(得分:1)

您可以使用HttpWebRequest获取页面的源内容,如下所示。

string url = @"http://stackoverflow.com/users";

        System.Net.WebRequest request = System.Net.HttpWebRequest.Create(url);

        System.Net.HttpWebResponse  response = (System.Net.HttpWebResponse)request.GetResponse();
        System.IO.StreamReader stream = new System.IO.StreamReader
                (response.GetResponseStream(), System.Text.Encoding.GetEncoding("utf-8"));

         XmlDocument rssDoc = new XmlDocument();
         rssDoc.Load(stream);
相关问题