无法使用xpath从html文档中获取body节点

时间:2015-10-12 06:05:21

标签: c# html xpath

我知道这是一个愚蠢的问题,但我无法找到它的问题。无法使用xpath从html文档中的body节点获取内部文本。

我正在使用的代码:

HtmlWeb web = new HtmlWeb();

HtmlDocument doc = web.Load(String.Format(url, companyName));

HtmlNode node = doc.DocumentNode.SelectSingleNode("//body");
string code = null;
try
{
     code = node.FirstChild.InnerText;
}
catch (NullReferenceException e)
{
}

网站结构

<html>
     <body>PYRIX | preston york</body>
</html>

1 个答案:

答案 0 :(得分:0)

我刚试过node.InnerText并且它有效。问题必须在于如何加载文档。

这有效:

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml("<html><body>PYRIX | preston york</body></html>");

var node = doc.DocumentNode.SelectSingleNode("//body");

Console.WriteLine(node.InnerText);