Html Agility Pack链接和img src提取

时间:2011-09-08 00:14:24

标签: c# html html-agility-pack

我有使用图像作为链接的页面,我正在尝试获取href链接以及图像src。问题是我现在正在收集href的罚款,但它只是获得第一个img src而只是重复。

HtmlWeb hw = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = hw.Load(url);
HtmlNodeCollection linkNodes = doc.DocumentNode.SelectNodes("//a[@href]");
foreach (HtmlNode linkNode in linkNodes)
{
HtmlAttribute link = linkNode.Attributes["href"];
HtmlNode imageNode = linkNode.SelectSingleNode("//img");
HtmlAttribute src = imageNode.Attributes["src"];

string imageLink = link.Value;
string imageUrl = src.Value;
}

有人可以告诉我什么是错的或其他方式吗?感谢。

1 个答案:

答案 0 :(得分:2)

尝试更改

HtmlNode imageNode = linkNode.SelectSingleNode("//img");

HtmlNode imageNode = linkNode.SelectSingleNode(".//img");

希望这有帮助。