如何从元素中删除所有属性

时间:2015-12-15 09:25:03

标签: python lxml

如何通过文档删除特定元素的所有属性。我正在尝试这样的事情:

from bs4 import UnicodeDammit
from lxml import html

content = open("source.html").read()
document = UnicodeDammit(content, is_html=True)
parser = html.HTMLParser(encoding=document.original_encoding)
root = html.document_fromstring(content, parser=parser)

for attr in root.xpath('.//table/@*'):
    del attr.attrib

这里我试图使用xpath删除文档中所有表的所有属性,但它不起作用。

1 个答案:

答案 0 :(得分:4)

这是一种可能的方法,假设您要删除某些元素的所有属性,例如table

for table in root.xpath('//table[@*]'):
    table.attrib.clear()

上面的代码循环遍历包含任何属性的所有table,然后调用elemet的clear()属性的attrib方法,因为该属性只是一个python字典。