从GeckoFX Web浏览器组件获取页面源

时间:2010-10-26 12:58:20

标签: c# geckofx

来自GeckoWebBrowser.Document.DocumentElement.InnerHtml属性的Html代码与从服务器下载的html不同,因为它被转换为DOM,并且可能存在更改文档结构的Javascript。

如何获取真实的网页来源?

2 个答案:

答案 0 :(得分:3)

有一种方法:

GeckoWebBrowser.ViewSource();

GeckoWebBrowser.ViewSource(string url);

打开一个新窗口,其中包含当前(或指定)页面的源代码。如果您只想要文本,请尝试:

GeckoWebBrowser.Navigate("view-source:" + url);

答案 1 :(得分:0)

我有一种解决问题的新方法:

GeckoWebBrowser1.Navigate("about:blank")

Me.Delay(1)让你的功能在这里等待1秒

GeckoWebBrowser1.Navigate("view-source:" + "YourUrl")