使用python代码从网站中删除html标记

时间:2014-11-09 15:30:43

标签: python html

我想知道如何使用python从给定网站中删除HTML标记。我希望能够输出html页面中的所有文本,不包括所有HTML代码

1 个答案:

答案 0 :(得分:0)

试试Beautiful Soup。然后,您可以通过以下方式获取所有剥离的文本:

soup.get_text()