lxml findall()问题

时间:2011-04-25 05:30:52

标签: python mediawiki lxml

试图创建一个简单的程序来获取维基百科的最新变化并解析该XML文件。

我坚持认为findall()无效。我做错了什么?

import urllib2
from lxml import etree as ET

result = urllib2.urlopen('http://en.wikipedia.org/w/api.php?action=query&format=xml&list=recentchanges&rcprop=title|ids|sizes|flags|user|timestamp').read()

xml=ET.fromstring (result)

print xml[0][0][0].attrib # that works!

print xml.findall ('api/query/recentchanges/rc') # that don't!

1 个答案:

答案 0 :(得分:3)

我怀疑根节点是主题节点,因此它正在根节点内寻找名为“api”的节点。如果是这样,以下两个都将起作用:

query/recentchanges/rc

/api/query/recentchanges/rc