获取带有美味汤的标签内容

时间:2011-03-04 04:51:01

标签: python beautifulsoup

我有这个HTML:

<a href="/watch?gl=US&amp;client=mv-google&amp;hl=en&amp;v=0C_yXOhJxWg">Miss Black OCU 2011</a>

我的程序读取一个html文件,上面是该文件的块。如何在python中使用BeautifulSoup提取“Miss Black OCU 2011”。

1 个答案:

答案 0 :(得分:3)

这是一个快速修复:

>>> from BeautifulSoup import BeautifulSoup as BS
>>> soup = BS('<a href="/watch?gl=US&amp;client=mv-google&amp;hl=en&amp;v=0C_yXOhJxWg">Miss Black OCU 2011</a>')
>>> tags = soup.findAll('a', href=True)
>>> for tag in tags: tag.renderContents() 
'Miss Black OCU 2011'
>>> 
相关问题