如何从网站提取图像链接并使用wget下载它们?

时间:2012-07-29 04:14:43

标签: linux wget

我真的想从网站上下载图片,但我不知道要做很多事情。他们在一个单独的网站上托管图像,我如何使用猫或其他东西从网站上拉图像链接,所以我可以使用wget将它们全部下载。我所知道的只是wget部分。示例是Reddit.com

  wget -i download-file-list.txt

2 个答案:

答案 0 :(得分:9)

试试这个:

wget -r -l 1 -A jpg,jpeg,png,gif,bmp -nd -H http://reddit.com/some/path

它将从页面http://reddit.com/some/path开始递归1级深度,并且它不会创建目录结构(如果你想要目录,删除-nd),它只会下载以...结尾的文件“jpg”,“jpeg”,“png”,“gif”或“bmp”。它将跨越主机。

答案 1 :(得分:2)

我会使用perl模块WWW::Mechanize。以下转储所有指向stdout的链接:

use WWW::Mechanize;

$mech = WWW::Mechanize->new();
$mech->get("URL");
$mech->dump_links(undef, 'absolute' => 1);

URL替换为您想要的实际网址。