带文件的lxml iterparse失败

时间:2015-08-05 08:39:41

标签: python xml-parsing lxml

我正在运行一个python程序来从XML文件中获取子树。以下是我运行以从标记获取子树的代码。

示例文件:

<?xml version="1.0" encoding="utf-8"?>
<nc:data xmlns:nc="urn:ietf:params:xml:ns:netconf:base:1.0">
    <system xmlns="abc.org">
        <context>
            <name>context_1</name>
            <host>
                <name>Name_Node</name>
                <tag1>
                    <name>ABC</name>
                    <tag2>PQR</tag2>
                </tag1>
            </host> 
        </context>
    </system>
</nc:data>

和iterparse的功能

class xml_file_generation: 

    def xml_parse_new(self):
        for event, elem in ET.iterparse('sample.xml', events=events, tag="context"):
                print "In loop"
                print ET.tostring(elem)
                print("%s" % (elem.tag))
                elem.close()


test = xml_file_generation()
test.xml_parse_new()

但是这段代码没有显示任何内容。

如果我运行与下面相同的代码,输出就像预期的那样:

xml = '''\
      <root>
        <element key='value'>text</element>
        <element>text</element>tail
        <empty-element xmlns="testns" />
        <testtag>abc</testtag>
      </root>
      '''

events = ("start", "end")
context = ET.iterparse(StringIO(xml),  events=events, tag='testtag')
for action, elem in context:
    print action, elem.tag
    print elem.text

如果可能,请建议解决方案。

1 个答案:

答案 0 :(得分:0)

在您的xml中,您的元素 - <context> - 具有名称空间 - 'abc.org',它从其父元素获取。在这种情况下,在tag参数中指定标记名时,还需要指定名称空间。

并非真的,确定elem.close()的意思,但删除它,Element没有方法close()

尝试以下示例 -

class xml_file_generation: 
    def xml_parse_new(self):
        for event, elem in ET.iterparse('a.xml', events=events, tag="{abc.org}context"):
                print("In loop")
                print(ET.tostring(elem))
                print("%s" % (elem.tag))


test = xml_file_generation()
test.xml_parse_new()