Funky XML标记解析

时间:2018-05-30 21:44:35

标签: python xml lxml openxml

我正在尝试解析开放式办公室XML。我在Python中使用lxml进行了很好的解析,但我需要抓取的数据位于一个标签内,对我来说结构看起来有点时髦。

<w:sdt Content> Dataaaaa </w:sdt>

通常情况下这很好,因为有很多sdt标签。但是&#34;内容&#34;部分让我失望。这段代码:

for element in tree.iter('{http://schemas.openxmlformats.org/wordprocessingml/2006/main}sdt'):
    print(element.tag, element.attrib)

为多个标签返回以下内容,因此我不知道哪个是:

{http://schemas.openxmlformats.org/wordprocessingml/2006/main}sdt {}

另外,不要担心命名空间,因为我已经想到了这一点。我特意只是试图访问上面的标签和其中的数据。 :)

0 个答案:

没有答案