单核或多核Solr

时间:2011-06-22 11:24:47

标签: solr multilingual

我们计划部署Solr以搜索从通用CMS平台发布的多个站点。

每种语言都会有单独的网站,其他语言的内容主要是英文翻译的内容。

搜索要求包括 - 关键字突出显示,建议(“你的意思是?”),停用词,分面。

我们正在评估使用单核与每种语言的多核Solr选项。这里推荐的方法是什么?

2 个答案:

答案 0 :(得分:6)

您需要多核,因为您无法在多语种数据库中执行词干和停用词。

英语中常用的停用词是“by”和“is”,但这些词在许多北欧语言中意为“城镇”和“冰”。

如果你做多核,每种语言都可以在自己的核心上使用自定义的schema.xml来选择正确的词干分析器,停用词和受保护的单词。但是同一个JVM在同一台服务器上运行它,所以你不会为一种特定语言的服务器花费任何额外的钱。然后,如果一个服务器的负载太大,则复制多核设置,所有索引都从副本中受益。

答案 1 :(得分:0)

您应该使用多核方法。 如果要一次查询多个核心,可以使用shards参数 http://wiki.apache.org/solr/DistributedSearch