Lucene是否将实际文档存储在其索引中?

时间:2013-05-15 19:29:53

标签: java lucene indexing information-retrieval

我打算用Lucene索引一个非常大的文本文档集。我知道倒排索引是如何工作的。

问题:Lucene是否将实际源文档存储在其索引中(除了条款)?因此,如果我搜索一个术语并想要包含该术语的所有文档,那么文档是否来自Lucene,或者Lucene是否只返回指针(例如匹配文档的文件路径)?

1 个答案:

答案 0 :(得分:2)

这取决于你。 Lucene将文档表示为字段集合,对于每个字段,您可以配置它是否存储。通常,在处理较大的文档时,您将存储标题字段,但不存储正文字段,并且您将添加可用于检索实际文档的标识符字段(未编入索引)。

相关问题