nutch不能正常工作

时间:2016-01-09 19:39:38

标签: solr web-crawler nutch

大家好,我是Nutch的新手,用于网络抓取。我按照上述步骤操作 Nutch official site tutorial. 我在终端中键入了命令 $ bin / crawl -i -D solr.server.url = http://localhost:8983/solr/ urls / TestCrawl / 2
其中urls有种子文件包含网站名称,TestCrawl是我的db目录。

它给出了错误,退出值为255.我不知道这是什么错误。所以我在这里发布我的终端屏幕截图。enter image description here

1 个答案:

答案 0 :(得分:0)

你是否使用ant cleanant runtime命令构建了nutch? 如果是,那么不要使用位于$NUTCH_HOME/bin/nutch的nutch运行nutch,而是使用位于$NUTCH_HOME/runtime/local/bin/nutch内的from。

如果没有,则首先使用ant runtime命令构建运行。 HTH。