锚标签HREF提取

时间:2012-03-29 10:40:40

标签: python html-parsing

如何使用Python和HTMLParser模块提取锚标记属性(即href值)。

e.g。我有HTML代码,我需要解析它并使用文本找到锚标记的值。

1 个答案:

答案 0 :(得分:1)

Stack Overflow上的

This question显示了如何使用HTMLParser提取链接。

但更方便的方法是使用BeautifulSoupthis question显示一种方法来做到这一点。如果您希望更高级地抓取HTML内容,请查看BeautifulSoup的文档。