两个步骤搜索在Solr中搜索具有相似矢量的文档

时间:2016-10-24 02:57:39

标签: vector solr

我正在考虑在Solr中找到具有类似向量的文档。

  1. 用户输入几个关键字
  2. Solr将根据Solr的评分算法报告具有关键字的文档列表。
  3. 然后,用户选择几个文档作为参考文档。
  4. 然后,Solr将搜索与选定的几个文档具有紧密相关(类似向量)的文档。
  5. 对于前3个步骤,我知道该怎么做。但不知道如何执行第4步。我已阅读[https://cwiki.apache.org/confluence/display/solr/The+Term+Vector+Component][1],但仍不确定如何执行第4步。

2 个答案:

答案 0 :(得分:1)

我可以想到两种方法。第一种是使用搜索结果聚类。首先按关键字搜索,然后让solr对结果进行聚类。向用户呈现群集及其文档的列表。

第二种方法是使用更像这个处理程序的多个请求并合并结果。在每个请求中,您使用用户标记的参考文档中的文档。

答案 1 :(得分:0)

步骤4听起来像More Like This功能,已经与Solr一起提供。