XPATH:段落中的特定单词

时间:2014-11-19 14:03:04

标签: python xpath scrapy

我一直试图找出如何获得确切的xpath,例如段落中的第三个词:

e.g:

<p>Here is some text</p>

然后,如果我想要第三个单词(&#34;一些&#34;),我无法弄清楚如何使用xpath单独输出。然而,这里的焦点不是得到单词&#34;的一些&#34;的完全匹配,而是获得第三个单词(无论它是什么)。

我一直在尝试这个:../ p [3],但没有帮助。我使用python和scrapy框架。

我希望有人能指出我正确的方向。

谢谢。

1 个答案:

答案 0 :(得分:2)

如果您正在使用scrapy,因为此问题已被标记,请考虑使用scrapy的.re()支持,即:

>>> response.xpath('//p/text()').re('\w+')[2]
u'some'