Question

我试图从此网页获取内容＆＃34; http://www.fibalivestats.com/u/ACBS/333409/pbp.html＆＃34;使用此代码：

r = requests.get("http://www.fibalivestats.com/u/ACBS/333409/pbp.html")
if r.status_code != 200:
    print("Error!!!")

html = r.content
soup = BeautifulSoup(html, "html.parser")
print(soup)

我得到了页面的模板，但没有得到与每个标签相关的数据。

我如何获取数据？我是Python的新手。

Answer 1

在这种情况下，你没有触发Javascript，因此它没有填充元素。我建议你使用像Selenium这样的网络驱动程序，如here中所示。

它将模仿浏览器并执行Javascript。以下是一个例子。

from selenium import webdriver
browser = webdriver.Firefox()
browser.get("http://www.fibalivestats.com/u/ACBS/333409/pbp.html")
html_source = browser.page_source
soup = BeautifulSoup(html_source, "html.parser")

Python 3.6：如何从动态页面获取内容？

1 个答案: