使用solr索引不同类型的数据

时间:2009-06-16 07:45:39

标签: indexing lucene solr

我正在考虑使用Apache solr来索引新项目中的数据。数据由不同的独立类型组成,这意味着有例如

  • botanicals
  • animals
  • 汽车
  • 计算机

索引。我应该为每种类型使用不同的索引还是只使用一个索引更有意义?如何使用许多索引影响性能? 或者还有其他可能实现这一目标吗?

感谢。

1 个答案:

答案 0 :(得分:7)

两者都是合法的方法,但存在权衡。首先,您的数据集有多大?如果它足够大以至于您可能希望将其分区到多个服务器上,那么拥有不同的索引可能是有意义的。

其次,性能的重要性 - 将它们全部索引在一起可能会导致性能下降,但程度取决于数据量和查询的复杂程度。

第三,您是否需要在同一搜索中查询多种数据类型?如果是这样,将所有内容编入索引可能是一种方便的方法。从技术上讲,这可以通过单独的索引来实现,但获得查询最相关的结果可能是一个挑战(不是它已经不是)

第四,具有单一模式和配置的单个索引可以简化任何将部署和维护系统的人的生命。

要考虑的另一件事是ID - 所有不同的对象在所有类型中都有唯一的标识符吗?如果没有,如果你想将它们一起索引,你可能需要生成它。