如何从WebBrowser控件中提取XML?

时间:2009-11-20 20:37:40

标签: c# .net xml winforms webbrowser-control

我希望与WebBrowser.Document.Body.InnerHtml相同,但是作为XML表示。

3 个答案:

答案 0 :(得分:3)

您是使用WebBrowser浏览XML文档并希望在代码中获取该XML,还是尝试浏览HTML页面并将HTML表示为XML?

如果是前者,您可能只是从WebBrowser获取原始文本(可能是InnerText而不是InnerHTML)并将其解析为XML。

如果是后者,问题是,HTML不是XML(除非它是XHTML)。

您可以使用'tidy'工具将其转换为XML,但表示精确度取决于原始HTML的形成程度。

答案 1 :(得分:0)

TidyCOM会将HTML清理为XHTML。

这是how to use it from C#

答案 2 :(得分:0)

IE's document has an expando property named "XMLDocument"。您可以通过其IDispatchEx界面访问它。

您可以通过Document.DomDocument获取文档的COM界面。