Python 3.6:如何从动态页面获取内容?

时间:2017-09-03 09:56:06

标签: python-3.x

我试图从此网页获取内容" http://www.fibalivestats.com/u/ACBS/333409/pbp.html"使用此代码:

r = requests.get("http://www.fibalivestats.com/u/ACBS/333409/pbp.html")
if r.status_code != 200:
    print("Error!!!")

html = r.content
soup = BeautifulSoup(html, "html.parser")
print(soup)

我得到了页面的模板,但没有得到与每个标签相关的数据。

我如何获取数据?我是Python的新手。

1 个答案:

答案 0 :(得分:2)

在这种情况下,你没有触发Javascript,因此它没有填充元素。我建议你使用像Selenium这样的网络驱动程序,如here中所示。

它将模仿浏览器并执行Javascript。以下是一个例子。

from selenium import webdriver
browser = webdriver.Firefox()
browser.get("http://www.fibalivestats.com/u/ACBS/333409/pbp.html")
html_source = browser.page_source
soup = BeautifulSoup(html_source, "html.parser")