使用BeautifulSoup4和Python 3解析html表

时间:2016-02-22 20:51:58

标签: python html parsing beautifulsoup

我正试图从雅虎财经中搜集某些财务数据。特别是在这种情况下,单个收入数字(类型:双倍)

这是我的代码:



from urllib.request import urlopen
from bs4 import BeautifulSoup
  
searchurl = "http://finance.yahoo.com/q/ks?s=AAPL"
f = urlopen(searchurl)
html = f.read()
soup = BeautifulSoup(html, "html.parser")

revenue = soup.find("div", {"class": "yfnc_tabledata1", "id":"yui_3_9_1_8_1456172462911_38"})
print (revenue)




来自Chrome的视图来源检查如下所示: enter image description here

我正试图刮掉" 234.99B"数字,剥离" B",并将其转换为小数。我的汤有什么问题。查找'我觉得哪里错了?

1 个答案:

答案 0 :(得分:1)

使用td文字找到Revenue (ttm):元素并获取next td sibling

revenue = soup.find("td", text="Revenue (ttm):").find_next_sibling("td").text
print(revenue)

打印234.99B