从 BeautifulSoup 中的 span 标签中提取数据内容

时间:2021-04-21 16:55:28

标签: python web-scraping beautifulsoup

我有这样的 HTML 代码:

<li class="IDENTIFIER"><h5 class="hidden">IDENTIFIER</h5><p>
<span class="tooltip-iws" data-toggle="popover" data-content="SOME TEXT">
other text</span></p></li>

我想从数据内容中获取 SOME TEXT

我写的

target = soup.find('span', {'class' : 'tooltip-iws'})['data-content']

为了得到跨度,我写了

identifier_elt= soup.find("li", {'class': 'IDENTIFIER'})

去上课,但我不知道如何将两者结合起来。

但是类 tooltip-iws 不是唯一的,如果我只是使用它,我会得到无关的结果(在代码片段之前还有其他跨度,具有相同的类) 这就是为什么我想在 IDENTIFIER 类中指定我的搜索。我怎样才能在 BeautifulSoup 中做到这一点?

2 个答案:

答案 0 :(得分:1)

尝试使用 css selector

soup.select_one("li[class='IDENTIFIER'] > p > span")['data-content']

答案 1 :(得分:0)

尝试使用 selectorlib,应该可以解决您的问题,如果您需要进一步的帮助,请发表评论

https://selectorlib.com/

相关问题