如何使用xpath从表中获取表数据

时间:2010-09-02 08:57:16

标签: xpath

我可以使用XPATH个查询来获取html表格中每行的第1个和第3个<td>标记的值。

我用过的XPATH查询是

/table/tr/td[1]|td[3]

这仅返回表格中每行的第一个<td>标记中的值。

示例

我希望从下表中得到值bob,19,jane,11,Cameron和32。但我只得到鲍勃,简,卡梅隆。

<table>
<tr><td>Bob</td><td>Male</td><td>19</td></tr>
<tr><td>Jane</td><td>Feale</td><td>11</td></tr>
<tr><td>Cameron</td><td>Male</td><td>32</td></tr>
</table>

2 个答案:

答案 0 :(得分:8)

@jakenoble的回答

/table/tr/td[1]|/table/tr/td[3] 

是正确的

避免|(union)运算符并且可能更高效的等效XPath表达式是:

/table/tr/td[position() = 1 or position() = 3]

答案 1 :(得分:3)

尝试

 /table/tr/td[1]|/table/tr/td[3]

我记得过去这样做,发现它很烦人,因为它很丑陋而且啰嗦