用美丽的汤爬一个iframe

时间:2015-08-24 20:13:45

标签: javascript python iframe beautifulsoup web-crawler

我正在尝试从网站抓取特定信息,但它不知何故对我不起作用。

import requests
from bs4 import BeautifulSoup
import csv


user_agent = {'User-agent': 'Chrome/43.0.2357.124'}

output_file= open("Getyourguide.csv", "w", newline='') 
r = requests.get("http://www.getyourguide.de/s/?q=seoul")
soup = BeautifulSoup(r.content)

g_data = soup.find_all("header", {"class": "activity-card-header"})
print(g_data)

只打印这么多:     []

因此,我深入研究了html源代码,并注意到我想收集的信息最有可能来自Iframe:

<!DOCTYPE html>

<html>
<body>
<div style="display:inline;">
<img alt="" height="1"    src="//www.googleadservices.com/pagead/conversion/966398101/?label=ZXUsCLOE-gQQlaHozAM&amp;url=&amp;guid=ON&amp;script=0&amp;data=" style="border-style:none;" width="1"/>

<noscript><iframe src="//www.googletagmanager.com/ns.html?id=GTM-3XTJ" height="0" width="0" style="display:none;visibility:hidden"></iframe></noscript>

我从来没有抓过过iframe。因此,我不确定我的方法应该是什么样的,以便从网站上获取描述,价格等信息。有人能给我一个暗示吗?任何反馈都表示赞赏。

0 个答案:

没有答案