Lucene:如何选择具有较高术语重叠的文档

时间:2018-02-09 17:51:18

标签: lucene

我正在使用lucene来索引和搜索文档。一个标准是选择与搜索项具有更高重叠的文档。文件很小,所以不到10个字。

示例:

  • doc1:“生成有意义的用例”
  • doc2:“有意义的用词”

搜索:“有意义的使用”。

在这种情况下,我希望doc2的排名高于doc1。我通过使每个术语成为一个应用子句来使用bool查询。我也设置min应匹配到75%。

我想给出与搜索重叠程度较高的得分文档以及较不匹配的术语得分较高的条件。

0 个答案:

没有答案