多选美丽的汤

时间:2014-04-09 22:56:37

标签: python html parsing beautifulsoup

我有一个名为summary的类,它包含许多不同的标签,例如' p',' h2',' img',' li& #39;等...

我想要做的是使用该标准进行搜索。我尝试过使用select和find_all而没有运气。

选择:data = soup.select('summary p')但我不能同时包含多个标签,例如:h2

Find_all:data = soup.find_all(['p', 'h2'])在这里我可以传递一个列表并找到所有标签,但我不知道如何将搜索范围缩小到summary

我该怎么做?

提前谢谢!

1 个答案:

答案 0 :(得分:1)

您使用find_all()的方法是正确的。您只需将该类作为属性传递给find_all()。像这样:

data = soup.find_all(['p', 'h2'], attrs={'class':'summary'})

记录在案here