我实际上需要页面中的多个项目,但是它们都在相同的标题下,并且我真的不想每次都重复相同的soup_wash.find("td", headers="tf89c8e5b-5207-48e7-a536-1f50ee7f5088c{}").text.strip()
行,因此我尝试设置{{1 }}作为节省时间的目录。
text
我需要bs4处理item1和item2的字符串,但是我不确定如何处理。
答案 0 :(得分:1)
我个人不会使用值tf89c8e5b-5207-48e7-a536-1f50ee7f5088c{}
来获取Total Cases
和Total Deaths
的值,因为它看起来随时都会改变。
相反,获取第一个表并使用标准的python索引来获取列。例如:
import requests
from bs4 import BeautifulSoup
url = 'https://www.washtenaw.org/3108/Cases'
soup = BeautifulSoup(requests.get(url).content, 'html.parser')
print('{:<15}{}'.format('Total Cases', 'Total Deaths'))
for tr in soup.select('table')[0].select('tr:has(td)'):
tds = [td.get_text() for td in tr.select('td')]
print('{:<15}{}'.format(tds[1], tds[5]))
打印:
Total Cases Total Deaths
1561 107
338 3
1899 110