Question

我正在编写程序来处理xml文件并进行更改。但是当我试图接触它的任何部分时，我得到一些额外的部分。

我的xml文件：

<?xml version="1.0" encoding="UTF-8"?>
<Package xmlns="http://soap.sforce.com/2006/04/metadata">
    <types>
        <members>sbaa__ApprovalChain__c.ExternalID__c</members>
        <members>sbaa__ApprovalCondition__c.ExternalID__c</members>
        <members>sbaa__ApprovalRule__c.ExternalID__c</members>
       <name>CustomField</name>
    </types>
    <version>40.0</version>
</Package>

我有我的代码：

from lxml import etree
import sys

tree = etree.parse('package.xml')
root = tree.getroot()
print( root[0][0].tag )

作为输出，我希望看到成员，但我得到这样的东西：

{http://soap.sforce.com/2006/04/metadata}members

为什么我会看到该网址以及如何阻止它显示？

Answer 1

您已定义默认命名空间（Wikipedia，lxml tutorial）。定义时，它是每个子标记的一部分。

如果你想打印没有命名空间的标签，那很容易

tag = root[0][0].tag
print(tag[tag.find('}')+1:])

如果要从XML中删除命名空间，请参阅this question。

使用lxml lib读取xml从xmlns标记中获取奇怪的字符串

1 个答案: