提取文本:在带有美丽汤的元素之后

时间:2019-02-17 09:46:47

标签: python web-scraping beautifulsoup html-parsing

我想提取:after元素中的文本<strong>

 <li data-toggle="tooltip" title="" data-original-title=""><strong>06:25</strong> &nbsp;vP</li>

我尝试了以下

 medmar_live_departures_table = list(soup.select('li.tratta'))
 for li in medmar_live_departures_table:     
    info = li.text

但是我同时收到两个文本。我可以使用re来分割字符串,但我想知道是否有更有效,更直接的方式来处理它。

Output
16:40  vP

Desired output
vP

1 个答案:

答案 0 :(得分:1)

您可以获取每个li最后一个文本子节点,如下所示:

medmar_live_departures_table = soup.select('li.tratta')
for li in medmar_live_departures_table :      
    info = [text for text in li.stripped_strings][-1]
    print(info)