如何使用wget忽略index.xml下载整个目录?

时间:2013-12-21 01:14:23

标签: linux shell wget

我将从Web服务器下载整个目录,如下所示:

wget -r -nH https://something.com/blah/

但/ blah /下有一个index.xml,它对我想要下载的文件没有正确的href。

因此,当我在上面启动wget命令时,它只会下载index.xml并停止。

我无法修改或删除index.xml文件,因为/ blah /不归我所有。

是否有任何变通方法允许我下载整个目录,忽略index.xml建议的内容?

1 个答案:

答案 0 :(得分:1)

来自man wget

Recursive Accept/Reject Options
   -A acclist --accept acclist
   -R rejlist --reject rejlist
     Specify comma-separated lists of file name suffixes or patterns to accept
     or reject. Note that if any of the wildcard characters, *, ?, [ or ], appear
     in an element of acclist or rejlist, it will be treated as a pattern, rather
     than a suffix.

因此--reject xml应该可以解决您的问题。