利用XPath Axes提取兄弟元素的文本

时间:2013-11-05 16:30:47

标签: xpath

鉴于以下html,如何获取XPath的元组列表(TIME,COMMENT,OOXX)?我想我需要使用 XPath Axes ,但不知道如何使用它。此外, OOXX 似乎不属于任何标签!

<div class="contents">
  <p></p>
  <div class="meta">TIME</div>OOXX
  <div class="comment">COMMENT</div>
  <p></p>
  <div class="meta">TIME</div>OOXX
  <div class="comment">COMMENT</div>
  <p></p>
  <div class="meta">TIME</div>OOXX
  <div class="comment">COMMENT</div>
  <p></p>
  <div class="meta">TIME</div>OOXX
  <div class="comment">COMMENT</div>
  <p></p>
</div>

1 个答案:

答案 0 :(得分:1)

如何在输入XML中处理多个这样的元组将取决于您的要求和XPath评估上下文的设施。

然而,这是如何获得第一个TIME:

/div/div[@class="meta"][1]/text()

以下是如何获得第一个评论:

/div/div[@class="comment"][1]/text()

以下是如何获得第一个OOXX:

/div/div[@class="meta"][1]/following-sibling::text()[1]