ShingleFilter \ n-GramTokenizer的优点?

时间:2016-12-05 12:53:56

标签: solr lucene

我一直在使用标准分析器在Lucene中进行索引和搜索。我最近遇到了Shingles(2个单词shingles \ bigrams),我在研究中发现的唯一优势是短语搜索会更快。 在不利方面,我的指数大小增加了。 我不太确定使用带状疱疹可以使我的应用程序有什么真正的优势\功能。 如果我使用Shingles / NGramTokenizer标记我的文档进行索引,它会如何影响我的其他现有搜索(Stem \ Fuzzy等搜索)?

有人可以就这个话题说清楚吗?

0 个答案:

没有答案