使用wget时,限制off主机页面的递归

时间:2014-05-06 00:10:28

标签: wget

我试图忘记一个页面以及它链接到网站外的一些页面。我想要做的是在网站(主机)上递归到5的深度,然后一旦我跳到另一个主机限制递归说2页。我似乎无法在手册页中找到任何此类选项,我只是运气不好?

1 个答案:

答案 0 :(得分:3)

可悲的是,是的。如果你只想用一个命令来做这件事,那你就不走运了。 Wget不支持父主机和其他域的不同递归深度。但是,您可以使用以下命令集来有效地获取您要查找的内容:

$ wget -r -H -l 2 www.example.com
$ wget -r -l 5 -c www.example.com

第一个命令尝试以递归方式从所需域中下载所有内容,包括从其他主机到递归深度为2的内容。除此之外,它只是忽略所有文件。

在第二个命令中,我们要求Wget仅从主机服务器下载,但这次的递归深度为5. -c用于请求Wget继续文件传输。这意味着Wget不会尝试重新下载已通过第一个命令下载的所有内容。

以上命令只是概念验证,需要根据您的具体需求进行定制。

相关问题