使用BeautifulSoup解析格式错误的XML而不转换标记

时间:2015-03-17 20:07:10

标签: python xml beautifulsoup

BeautifulSoup非常适合非常简单地修复格式错误的XML:

import bs4
value = unicode(bs4.BeautifulSoup(value, "xml"))

但在处理这种XML时:

<draw:image xlink:href="Pictures/image.png" xlink:type="simple" xlink:show="embed" xlink:actuate="onLoad"/>

它给了我:

<image actuate="onLoad" href="Pictures/image.png" show="embed" type="simple"/>

我想保持原状!如何判断BeautifulSoup不要太聪明?

1 个答案:

答案 0 :(得分:0)

在仔细查看整个文档之后,我看到一些名称空间定义不再存在了。添加它们后,达到了所需的行为。