在单核或多核上存储多组文档

时间:2011-12-21 15:22:31

标签: search solr indexing full-text-search

我正在从同一个中间件运行多个内容/设计单独的网站,我想使用Solr作为搜索引擎。这些网站的域名不同,但内部结构不同(意思是,网站之间的实际数据库和数据结构相同)。

现在的问题是 - 最好将该站点数据存储在单个Solr索引中,然后将其与“站点”字段分开,还是在单个JVM中为每个站点使用单独的Solr核心?

什么能提供最佳性能(没有跨站点查询)?什么将提供最好的回忆和精确度(我担心由于IDF因素导致的精度损失 - 内容域的差异非常大)?

2 个答案:

答案 0 :(得分:2)

我认为您更担心当您的网站成长时会发生什么。 IMO,多核似乎是更好的选择。

单个大型索引:所有更新和查询都会影响单个点。当它开始变慢时,您必须通过分片或复制来创建一个集群来存储您的大型索引。这是一个单点故障。支持指数将是艰难的。

多核:如果一个站点正在增长并使其他站点相形见绌,您可以轻松地将其迁移到其他服务器,从而确保没有服务器过载。备份个别网站将相对微不足道。

当您拥有非繁忙的网站时,多核会让您的生活更轻松。随着您网站的增长,您可以推迟集群和性能调整,直到以后。

答案 1 :(得分:0)

我会在一个tomcat上做多个Solr核心

相关问题