如何在Nutch中抓取图片?或者,是否有其他开放式搜索引擎使用图像生成结果?
答案 0 :(得分:0)
更改regex-urlfilter.txt
conf
- (ICO |。ICO | CSS | CSS |坐| SIT | EPS | EPS | WMF | WMF |拉链| ZIP | PPT | PPT | XLS | XLS | GZ | GZ |转速| RPM | TGZ | TGZ | exe | EXE | js | JS | gif | GIF | png | PNG || jpg | JPG | jpeg | JPEG | bmp | BMP | mpg | MPG | mov | MOV)$
删除您要 grep 的jpeg
,jpg
,gif
或type
张照片。
然后在suffix-urlfilter.txt
conf
将#
添加到jpeg
,gif
或png
这对我有用!