如何检查html是否已更改?

时间:2015-04-29 15:53:51

标签: javascript html web-scraping firefox-addon web-crawler

道歉,如果这是错误的地方,但不知道在哪里问。

我们正在构建适用于所选网站的Firefox插件。现在,因为这些网站偶尔会改变一次,我想每天运行一次javascript脚本,检查代码的特定部分是否已经更改,如果有,我们会得到一些返回消息(理想情况下直接到我的电子邮件)。

最简单,最简单的方法是什么?我已经阅读了关于webcrawler,webscrappers的文章,但它们似乎做得比我们需要的要多得多。我们基本上希望从我们连接到互联网的PC上运行一个小脚本,只需检测到html正文的特定部分的更改即可进行简单检查并向我们发送电子邮件(或更具体地说 - 所选元素没有被发现了。)

任何帮助非常感谢

1 个答案:

答案 0 :(得分:0)

基本上,您可以使用xpath将Google电子表格设置为通过IMPORTXML function (here with an example)抓取页面的部分。然后,您可以在电子表格中设置通知:工具 - >通知规则 enter image description here

现在,每次抓取功能(IMPORTXML)获取的内容与之前的内容不同时,电子表格都会触发给您的邮件。

作为一种现成的替代方案,我也建议some tools跟踪网页和/或其部分(!)的更改,包括通过电子邮件通知。