确定满足Lucene查询的确切术语

时间:2013-10-04 15:18:52

标签: lucene

Lucene 4.4是否有办法确切地确定哪些条款满足查询?我只需要突出显示导致文档返回的术语,而不是文档中其他地方的相同术语。例如,给出文件:

We are going to visit the White House today. I hear it is painted white.

和短语查询"white house",我想强调这些术语:

We are going to visit the <b>White</b> <b>House</b> today. I hear it is painted white.

我一直在使用PostingsHighlighter,但它也会在第二句中突出显示“white”这个词。我不希望这样,因为单个术语“白色”不满足短语查询。

看起来从搜索中返回的唯一信息是文档ID和分数。出于相关性排名的目的,我并不关心分数,因为我将使用返回的所有文档。我可以用自定义评分来保存我需要的信息吗?还是有一种我错过的更好的方法?

1 个答案:

答案 0 :(得分:1)

这似乎是PostingsHighlighter的预期行为(请参阅this discussion)。您可以考虑使用Highlighter代替。