从div标签Python中提取数据

时间:2013-05-28 18:06:20

标签: python python-2.7 beautifulsoup

我正在尝试从包含div标签中嵌入的一些数据的网页中抓取数据。

url = 'http://london2012.fiba.com/pages/eng/fe/12/olym/p/gid/26/grid/A/rid/9087/sid/6233/game.html'
boxurl = urllib2.urlopen(url).read()
soup = BeautifulSoup(boxurl)

linescoreA = soup.find("div", {"class": "scoreA"})

print linescoreA

输出:

<div class="scoreA">
<div class="period">19</div>
<div class="period">22</div>
<div class="period">22</div><div class="period">26</div>
<div class="final">89</div>
<div class="clear"></div>
</div>

这就是我被卡住的地方。如何从div标签获取数据?

2 个答案:

答案 0 :(得分:3)

要获取文字数据,请使用.stripped_strings

print list(linescoreA.stripped_strings)

答案 1 :(得分:1)

尝试

for node in soup.find("div", {"class": "scoreA"}):
    print ''.join(node.findAll(text=True))

以及

for node in soup.find("div", {"class": "scoreA"}):
        print node.string

对不起,我不能为你试试。