带后代和后代text()谓词的XPath查询

时间:2010-10-13 05:15:04

标签: xml xpath descendant predicates

我想构造一个XPath查询,它将返回一个“div”或“table”元素,只要它有一个包含文本“abc”的后代即可。一个警告是它不能有任何div或table后代。

<div>
  <table>
    <form>
      <div>
        <span>
          <p>abcdefg</p>
        </span>
      </div>
      <table>
        <span>
          <p>123456</p>
        </span>
      </table>
    </form>
  </table>
</div>

因此,此查询的唯一正确结果是:

/div/table/form/div 

我最好的尝试看起来像这样:

//div[contains(//text(), "abc") and not(descendant::div or descendant::table)] | //table[contains(//text(), "abc") and not(descendant::div or descendant::table)]

但未返回正确的结果。

感谢您的帮助。

3 个答案:

答案 0 :(得分:39)

不同的东西 :: :)

//text()[contains(.,'abc')]/ancestor::*[self::div or self::table][1]

似乎比其他解决方案短很多,不是吗? :)

翻译为简单英语:对于文档中包含字符串"abc"的任何文本节点,请选择其第一个祖先,即div或{{1} }。

效率更高,因为只需要对文档树进行一次完整扫描(而不是任何其他文档),table遍历与{{1}相比非常便宜(树)扫描。

验证此解决方案“确实有效”:

ancestor::*

对提供的XML文档执行此转换

descendent::

产生了想要的正确结果

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>
 <xsl:strip-space elements="*"/>

 <xsl:template match="/">
  <xsl:copy-of select=
  "//text()[contains(.,'abc')]/ancestor::*[self::div or self::table][1] "/>
 </xsl:template>
</xsl:stylesheet>

注意:没有必要使用XSLT - 任何XPath 1.0主机(例如DOM)都必须获得相同的结果。

答案 1 :(得分:1)

你可以尝试:

//div[
  descendant::text()[contains(., "abc")] 
  and not(descendant::div or descendant::table)
] | 
//table[
  descendant::text()[contains(., "abc")] 
  and not(descendant::div or descendant::table)
]

有帮助吗?

答案 2 :(得分:1)

//*[self::div|self::table] 
   [descendant::text()[contains(.,"abc")]]  
   [not(descendant::div|descendant::table)]

contains(//text(), "abc")的问题在于函数转换节点集占用第一个节点。