Python - 美丽的汤 - 删除标签

时间:2013-09-25 22:45:32

标签: python html beautifulsoup

我使用Beautiful Soup将以下基于网络的数据作为列表提取出来。在原始网站上,它是一个数字表:

[<td class="right">113</td>, <td class="right">
 89 </td>, <td class="right last">
<b>117</b> </td>, <td class="right">113</td>, <td class="right">
 85 </td>, <td class="right last">
<b>114</b> </td>, <td class="right">100</td>, <td class="right">
 56 </td>, <td class="right last">
<b>84</b> </td>]

从这些数据创建数字列表的最有效方法是什么?理想情况下,我想使用Beautiful Soup提取标签,但我无法从文档中弄清楚如何做到这一点。

我原来的汤代码是:

print soup.find_all('td', 'right')             #printing this produces the above data

numbers_data = []                              #my attempt to extract tags
for e in soup.find_all('td', 'right'):
    numbers_data.append(e.extract())

print numbers_data

两者都返回相同的列表。

1 个答案:

答案 0 :(得分:1)

numbers_data = [int(e.text) for e in soup.find_all('td', 'right')]

print numbers_data