如何刮取网站"检查元素"使用Selenium的HTML源代码?

时间:2017-02-27 20:26:14

标签: python html selenium web-scraping

使用python 2.7,我想弄清楚如何抓取多个网站。我想知道特定关键字是否在网站的源代码中退出。直到最近,我通过使用Chrome的" View-source" 功能(右键单击页面)抓取网站的源代码来尝试此操作

但是,为了准确找到具体的关键字,我了解到需要使用Selenium(我不熟悉)来抓取网站的HTML源代码使用Chrome的Inspect Element工具。对于缺乏更好的术语,我只需将其称为:"检查网站的元素" - 源代码

使用我目前的脚本,我已经开始弄清楚如何抓取网站的" View-source" -code 以提取所需的关键字,例如{ {1}}和@media。通过抓取这个" View-source" -code ,我意识到我在这里没有准确找到所需的关键字,而且它更可靠,准确地抓取一个网站"检查元素" - 源代码

我的剧本:

googleadservices.com/pagead/conversion_async.js

因此,通过使用python 2.7,我如何使用Selenium抓取一个网站" Inspect Element" -source code (最好使用我当前的脚本) )?

0 个答案:

没有答案