Xpath子节点查询

时间:2017-07-15 23:47:16

标签: html xpath

<tr>
  <td><span style="white-space:nowrap">Aug 29, 2016 06:05</span></td>
  <td><a class="A" title="B" href="C">
  <td>....
   ....

</tr>

我有很多&lt; TD&GT;包含在&lt;中的元素TR&GT; html中的元素我想访问第一个中的每个文本&lt; TD&GT;其中的元素&lt; TR&GT;包裹和 每个单独的href用于第二个&lt; TD&GT;元件。

每个人应该使用2个不同的查询。

char = tree.xpath('//tr/td[2]/@href')

这是我为href查询提出的但不会为我做的工作。

更新

感谢劳达的帮助,我走上正轨

这对我有用

first = tree.xpath('//tr/td/span/text()')
second = tree.xpath('//tr/td[2]/a/@href')

2 个答案:

答案 0 :(得分:1)

该文字并非直接在td中,因为您可以使用以下内容:

//tr/td/span

第二个:

//tr/td/a

或者如果你想要href而不是元素那么:

//tr/td/a/@href

答案 1 :(得分:0)

非常感谢,这使我走向了正确的方向    date = tree.xpath(&#39; // tr / td / span / text()&#39;)    hrefs = tree.xpath(&#39; // tr / td [2] / a / @ href&#39;)