删除文档后SOLr索引大小是否减少?

时间:2015-07-22 12:19:32

标签: solr

我有一个SOLr实例,我从客户端索引大量文档,以便用户可以在Web应用程序中搜索它们。

因为我们有大量文件,而且他们只需要搜索最近的文件(大约90天),我们就会有一个从索引中删除旧文档的预定作业。

问题是,即使删除,磁盘空间也每天增加大约2Gb。

这是正常的行为,还是我们应该做些什么来保持索引的稳定大小?

我们正在使用Java应用程序向索引添加和删除文件。

1 个答案:

答案 0 :(得分:7)

删除只会将文档标记为已删除 - 它们仍然存在于索引中。由于删除它们需要重写索引文件,因此不会执行实际删除before you issue an optimize command

当您发出提交时,expungeDeletes还有一个选项,但据我所知,最好在正常工作时间之外发布优化。如果您每晚删除文档,则可以在删除后发布优化,或者甚至更频繁地发布,例如每隔一天或第三天。

优化需要与索引占用的可用磁盘空间相同的数量(因为最坏的情况是整个索引再次被写入)。