solr - Nutch solrindex命令不索引Solr中的所有URL

我有一个从特定域抓取的Nutch索引，我使用solrindex命令将已爬网数据推送到我的Solr索引。问题是，似乎只有一些已爬网的URL实际上在Solr中被索引。我有Nutch抓取输出到文本文件，所以我可以看到它抓取的网址，但是当我在Solr中搜索一些已抓取的网址时，我没有得到任何结果。

我用来执行Nutch抓取的命令：bin/nutch crawl urls -dir crawl -depth 20 -topN 2000000

此命令成功完成，输出显示我在生成的Solr索引中找不到的URL。

我正在使用命令将已爬网数据推送到Solr：bin/nutch solrindex http://localhost:8983/solr/ crawl/crawldb crawl/linkdb crawl/segments/*

此命令的输出表明它也已成功完成，因此过程终止过程似乎不是问题（这是我最初认为的可能）。

我发现奇怪的最后一件事就是整个Nutch＆amp; Solr配置与我之前在不同服务器上使用的设置完全相同，我没有那么多问题。它实际上是复制到这个新服务器上的相同配置文件。

TL; DR：我在Nutch中成功抓取了一组网址，但是当我运行solrindex命令时，只有部分网址被推送到Solr。请帮忙。

更新：我重新运行了所有这些命令，输出仍然坚持它一切正常。我已经调查过任何我能想到的索引编码器，但仍然没有运气。传递给Solr的URL都是活动的并且可以公开访问，因此这不是问题。我真的在这里碰到一堵墙，所以我会很乐意帮忙。