设置标题标签的字符串属性会清除BeautifulSoup中另一个标签的字符串属性

时间:2012-04-16 11:02:29

标签: python beautifulsoup

我尝试使用BeautifulSoup使用以下代码更改某些html文档的标题标记:

>>> doc = BeautifulSoup(open(filename))
>>> root = doc.find('html') # works only with html parser
>>> hafta = root.find(id="hafta")
>>> content = hafta.find('div', {'class':'convHtml'})
>>> content.find('b').string
u'BAKANLARA N\u0130\xc7\u0130N KURBAN KES\u0130L\u0130R?'
>>> doc.title.string = content.find('b').string
>>> content.find('b').string
>>>  

奇怪的是,语句doc.title.string = content.find('b').string清除content.find('b')内的字符串。为什么会这样?

1 个答案:

答案 0 :(得分:3)

这是a bug in Beautiful Soup。我已经提交了一个修复程序,将在下一个版本中发布。