HTTrack等到页面搜索完成

时间:2016-04-24 19:32:29

标签: http download web httrack

我尝试使用HTTrack下载此处网址的搜索请求结果

不幸的是,下载立即开始并且没有获得搜索结果(因为页面仍显示轮子)。

问题:是否可以在第一页请求后强制暂停,或者在开始之前定义检查(例如页面上的关键字搜索)?

最坏的情况:是否有其他网站复印机可以做到这一点?

非常感谢,汤姆

1 个答案:

答案 0 :(得分:0)

HTTrack有许多选项可配置为允许或禁止对网站的某些方面进行爬网。使用HTTrack抓取博客的post可能很有用。

HTTrack的另一种可能替代方法是使用wget镜像网站。 Here是使用wget创建镜像的过程。