如何刮下所有产品简短说明如下链接?

时间:2018-04-24 14:46:49

标签: python-3.x beautifulsoup

import requests

page = requests.get("https://www.proflowers.com/mothers-day-flowers-mdf?navContent=T%3aMother%27s+Day%3aBest+Sellers&navLocation=T%3a1-10%3a1-19")


from bs4 import BeautifulSoup
soup = BeautifulSoup(page.content, 'html.parser')

for desc in soup.find_all('div', class_="product-summary__short-description"):
    print(desc.p.get_text())

结果:

有时候农民最了解! 来自卡利的激进玫瑰! 花香相当于一只心眼表情符号。 新的妈妈节日座右铭。 勇敢地做出重大声明。 对于你的榜样,你的英雄。 七彩玫瑰! 为了坚定和强烈的爱。 20%的购买价格捐赠给No Kid Hungry。 Prime粉彩。 我们的高级玫瑰系列天生绽放。 农场新鲜的玫瑰加倍努力! 灯,相机,满意。 当我们说出所有颜色时,我们就意味着所有的颜色。 美丽与美丽糟糕的一天。 颜色的摩天轮。 有时美女耳语。柔软的薰衣草玫瑰。 这个布克令人陶醉。

我想把所有产品“简短描述”刮掉..有人可以帮帮我..谢谢你: - )

1 个答案:

答案 0 :(得分:0)

你可以得到这样的所有描述:

import requests
from bs4 import BeautifulSoup

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:59.0) Gecko/20100101 Firefox/59.0',
}

page = requests.get(r"https://www.proflowers.com/mothers-day-flowers-mdf?navContent=T%3aMother%27s+Day%3aBest+Sellers&navLocation=T%3a1-10%3a1-19", headers=headers)

soup = BeautifulSoup(page.content, 'html.parser')

for desc in soup.find_all('div', class_="name"):
    print(desc.a.get_text().strip())

<强>输出

One Dozen Rainbow Mother's Day Roses
Two Dozen Rainbow Mother's Day Roses
15 Multi-Colored Tulips for Mom
30 Multi-Colored Tulips for Mom with Brilliant Cut Glass Vase and Chocolates
12 Long Stemmed Rainbow Mother's Day Roses
...