如何使用WWW :: Mechanize更改我的正则表达式以获取不同的图像集?

时间:2015-02-06 17:53:52

标签: regex perl www-mechanize

我正在为我必须下载图片的网站制作网络抓取工具。我目前正在使用WWW::Mechanize并执行:

my @images=$mech->find_all_images(url_regex => qr/smallThumb/i);

它为我提供了网址中smallThumb的所有图片。

如何在保留以前smallThumb的链接的同时将zoom更改为smallThumb

1 个答案:

答案 0 :(得分:1)

你可以这样做:

my @smallthumbs = $mech->find_all_images(url_regex => qr/smallThumb/i);
my @zooms       = $mech->find_all_images(url_regex => qr/zoom/i);
my @allimages = (@smallthumbs, @zooms);

此处存在的风险是,您可以拥有一个适合这两个类别的网址,并获得一个骗局。

你也可以使用正则表达式进行修改。

my @smallthumbs_or_zooms = $mech->find_all_images( url_regex => qr/smallThumb|zoom/i );