XPath:查找包含大多数文本内容的元素

时间:2013-02-06 03:14:11

标签: python html xml xpath lxml

我想寻找段落。我会使用p标签来查找这个,但我看到的页面不应该使用p。为了估算这一点,我只想在一个标签中查找最多的文本。任何想法如何找到这个

1 个答案:

答案 0 :(得分:0)

试试这个://div/node()[string-length(following-sibling::node()/text()) < string-length(text())]

实际上只涉及一个方向,请使用此方法:

//div/node()[string-length(following-sibling::node()/text()) < string-length(./text()) and not(string-length(preceding-sibling::node()/text()) > string-length(./text()))]

我正在使用一些废弃的xml来测试它,并且根目录是<div>所以将其更改为您正在检查的xml根目录。