Nutch在Windows上执行爬网问题

时间:2016-05-12 08:48:16

标签: windows web-crawler nutch

我想让nutch 1.11执行抓取。我正在使用cygwin在Windows 8中运行这些命令。

我已将 hadoop-core jar 放入lib文件夹,但当我尝试运行爬网时,我获得了:

  

线程中的异常" main" java.lang.NoSuchMethodError:org.apache.commons.cli.OptionBuilder.withArgPattern(Ljava / lang / String; I)Lorg / apache / commons / cli / OptionBuilder;           在org.apache.hadoop.util.GenericOptionsParser.buildGeneralOptions(GenericOptionsParser.java:207)           在org.apache.hadoop.util.GenericOptionsParser.parseGeneralOptions(GenericOptionsParser.java:370)           在org.apache.hadoop.util.GenericOptionsParser。(GenericOptionsParser.java:153)           在org.apache.hadoop.util.GenericOptionsParser。(GenericOptionsParser.java:138)           在org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:59)           在org.apache.nutch.crawl.Injector.main(Injector.java:369)

命令是

  

$ bin / nutch inject crawl / crawldb urls

0 个答案:

没有答案