ESPN表没有TR / TD标签

时间:2019-08-11 22:14:14

标签: python beautifulsoup

ESPN Website View

我想将ESPN的实时拍卖/草稿数据提取到一个Python脚本中,该脚本可以调整玩家的估价/被选中的可能性。页面上的表格虽然没有TD / TR标签。它只是有很多Div / Class。在Chrome浏览器的检查器中尝试对很多“类”使用find / findall的不同变体时,我似乎从未返回任何结果。

import requests, bs4
url = "https://fantasy.espn.com/football/draft?leagueId=93589772&seasonId=2019&teamId=17&memberId={19AD42D6-8125-489D-B045-1E535CFC02E4}"
r = requests.get(url)
soup = bs4.BeautifulSoup(r.text, 'lxml')

table = soup.find("main", {"class": "jsx-2236042501 draftContainer"})
print (table)

这些草稿链接只能持续很长时间,因此很遗憾,它们的使用寿命不会更长。

1 个答案:

答案 0 :(得分:1)

表的内容随Java一起加载。在Javascript加载页面内容之后,您必须使用浏览器自动化(例如Selenium)来提取DOM。

相关问题