如何在Nutch中抓取图像?

时间:2010-07-14 15:12:33

标签: solr nutch

如何在Nutch中抓取图片?或者,是否有其他开放式搜索引擎使用图像生成结果?

1 个答案:

答案 0 :(得分:0)

更改regex-urlfilter.txt

中的conf
  

- (ICO |。ICO | CSS | CSS |坐| SIT | EPS | EPS | WMF | WMF |拉链| ZIP | PPT | PPT | XLS | XLS | GZ | GZ |转速| RPM | TGZ | TGZ | exe | EXE | js | JS | gif | GIF | png | PNG || jpg | JPG | jpeg | JPEG | bmp | BMP | mpg | MPG | mov | MOV)$

删除您要 grep jpegjpggiftype张照片。

然后在suffix-urlfilter.txt

中更改conf

#添加到jpeggifpng

这对我有用!

相关问题