使用BeatifulSoup检查特定属性

时间:2015-09-23 17:08:00

标签: python html beautifulsoup

我试图分析一个html块并尝试提取那些带有样式属性的标签。例如,

<ul class="dropdown-menu" style="text-align:left; width:100%; color:#003; margin-left:-67px;">

那些应该触发我的统治。但内联样式标签不应该被我的规则捕获。像

这样的东西
<style>
.scroll-pane-arrows
    {
        width: 100%;
        height: 235px;
        overflow: auto;
    }
</style>

不应该触发我的规则。现在,我正在考虑找到所有样式属性而不是标签的方法。我必须有一个函数来定位所有标签,然后在其中找到style属性。但是如何单独运行所有标签?像findAll(&#34; tag_name&#34;)这样的东西会得到它,当然。但我无法为每个标签执行此操作。有太多的标签可以使用style属性,使用findAll函数搜索每个标签会有很多开销。我可能会错过一些标签。是否有更简单的方法来查找所有标签,以便我可以进一步搜索样式属性?

1 个答案:

答案 0 :(得分:0)

从文档中,标记名称是可选的。你应该可以使用findAll(True) 有关详细信息:http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html