有没有办法使用HtmlAgilityPack检测404页面?

时间:2013-07-05 21:31:56

标签: c# .net parsing html-agility-pack

我正在解析一些已删除某些线程的论坛。因此,打开它们仍会显示一个页面,但会显示一条消息“线程不再存在”。有没有办法以特殊的方式使用HtmlAgilityPack查询它?

或者我是否必须比较InnerHtml或其他内容?

1 个答案:

答案 0 :(得分:2)

实际上并未返回404。如果是,你可以看一下标题。

也就是说,你在html中得到一个错误的200响应,因此你将不得不解析html,遍历DOM,无论你想调用它,并确定它是否失败。

似乎可能存在多个不同的错误消息,因此我会尝试通过查找“通知管理员”链接使您的比较通用,或者可能只在错误页面上使用class =“blockrow restore”。

希望有所帮助。