solr - 如何从Solr下载索引文档？

@Alec 你的理解是正确的。您无法取回原始文件。因此，您可以选择单独存储原始文档，在主数据存储中生成唯一ID，并将该唯一ID链接到文档的SOLR导出，以便链接回搜索结果。事实上，SOLR专为搜索速度而设计，并不像RDBMS那样具有事务友好性。所以在我的项目中，我使用这种策略来维护备用数据存储区作为所有应用程序数据（不仅仅是文档）的权威来源。

为了对文档处理的内部进行一些介绍，我建议您查看Solr Wiki https://wiki.apache.org/solr/ExtractingRequestHandler上的示例。

文档说 Solr的ExtractingRequestHandler使用Tika允许用户将二进制文件上传到Solr并让Solr从中提取文本然后将其编入索引。

这意味着只有提取的文本实际存储在SOLR中。原始二进制内容并不真正用于搜索/索引目的的SOLR（并且可能被丢弃，尽管我还没有找到确切的文本说它们丢弃了这样提取的文档的原始二进制内容）。

如何从Solr下载索引文档？

1 个答案: