search - 在单核或多核上存储多组文档

时间：2011-12-21 15:22:31

标签： search solr indexing full-text-search

我正在从同一个中间件运行多个内容/设计单独的网站，我想使用Solr作为搜索引擎。这些网站的域名不同，但内部结构不同（意思是，网站之间的实际数据库和数据结构相同）。

现在的问题是 - 最好将该站点数据存储在单个Solr索引中，然后将其与“站点”字段分开，还是在单个JVM中为每个站点使用单独的Solr核心？

什么能提供最佳性能（没有跨站点查询）？什么将提供最好的回忆和精确度（我担心由于IDF因素导致的精度损失 - 内容域的差异非常大）？

答案 0 :(得分：2)

我认为您更担心当您的网站成长时会发生什么。 IMO，多核似乎是更好的选择。

单个大型索引：所有更新和查询都会影响单个点。当它开始变慢时，您必须通过分片或复制来创建一个集群来存储您的大型索引。这是一个单点故障。支持指数将是艰难的。

多核：如果一个站点正在增长并使其他站点相形见绌，您可以轻松地将其迁移到其他服务器，从而确保没有服务器过载。备份个别网站将相对微不足道。

当您拥有非繁忙的网站时，多核会让您的生活更轻松。随着您网站的增长，您可以推迟集群和性能调整，直到以后。

答案 1 :(得分：0)

我会在一个tomcat上做多个Solr核心