我想在div类中获得一个链接(特定的URL)。这是我的代码,它让我获得div类中的文本(一些文本...... )。
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='content']"))
{
//saves text (node.InnerText) in array
}
这是网站上的HTML。我想获得 www.google.com
<div class="content">
<p>Some text...
<a href="www.google.com">LINK</a>
</p>
</div>
答案 0 :(得分:0)
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='novica']/p/a[@href='www.google.com']"))
{
//saves text (node.InnerText) in array
}
答案 1 :(得分:0)
根据您的写作,该代码无效,但您有两个选择:
获得div
的节点后,使用.GetElementsByTagName("a")
或孩子们取出链接,然后获取它的href属性。
修改您的SelectNodes()
XPath以获取a
代码://div[@class='novica']/p/a
。
第一个显然更好,如果你做需要该元素的.InnerText
来获得Some text...
,但第二个是更快的。
答案 2 :(得分:0)
foreach (var node in doc.DocumentNode.SelectNodes("//div[@class='novica']"))
{
var links = node.Descendants("a").Select(n => n.InnerText).ToList();
}