在div标签内抓取文字

时间:2016-01-29 15:01:19

标签: python beautifulsoup

我正在使用beautifulsoup来抓取一些基本数据。我需要的源代码部分是:

<div class="header-team">Team name 1</div>

<div class="header-team">Team name 2</div>

两条线并不相邻。

我正在尝试这个:

for team in soup.findAll('div', 'header-team')
    print team

但是返回所有代码。我尝试添加.text但它返回错误。

1 个答案:

答案 0 :(得分:1)

下面的代码对我有用 -

from bs4 import BeautifulSoup as bs

data = """<div class="header-team">Team name 1</div>

<div class="header-team">Team name 2</div>"""

soup = bs(data,'lxml')

for team in soup.findAll('div', 'header-team'):
    print team.text

输出 -

Team name 1
Team name 2