Question

使用python 2.7，我想弄清楚如何抓取多个网站。我想知道特定关键字是否在网站的源代码中退出。直到最近，我通过使用Chrome的＆＃34; View-source＆＃34; 功能（右键单击页面）抓取网站的源代码来尝试此操作

但是，为了准确找到具体的关键字，我了解到需要使用Selenium（我不熟悉）来抓取网站的HTML源代码使用Chrome的Inspect Element工具。对于缺乏更好的术语，我只需将其称为：＆＃34;检查网站的元素＆＃34; - 源代码。

使用我目前的脚本，我已经开始弄清楚如何抓取网站的＆＃34; View-source＆＃34; -code 以提取所需的关键字，例如{ {1}}和@media。通过抓取这个＆＃34; View-source＆＃34; -code ，我意识到我在这里没有准确找到所需的关键字，而且它更可靠，准确地抓取一个网站＆＃34;检查元素＆＃34; - 源代码！

我的剧本：

googleadservices.com/pagead/conversion_async.js

因此，通过使用python 2.7，我如何使用Selenium抓取一个网站＆＃34; Inspect Element＆＃34; -source code （最好使用我当前的脚本））？

如何刮取网站＆＃34;检查元素＆＃34;使用Selenium的HTML源代码？

0 个答案: