Lucene SpanQueries会自动进行Tokenize,还是我必须自己对查询进行标记?

时间:2017-03-15 17:39:18

标签: lucene

我正在使用标准分析器存储标记特殊字符的信息,并取出诸如'the'之类的停用词。我的问题是:

(1)如果我创建一个SpanQuery并且我搜索“The Best Stuff”,但是没有存储“the”这个词,我是否需要编写代码来取出这个词,所以我只搜索“Best”东西“,还是会自动为我处理?

(2)我自己也必须处理小套管吗?

1 个答案:

答案 0 :(得分:1)

1 - 在查询时,分析通常由查询解析器处理。通常,Queries不做任何分析。因此,如果您自己构建查询,包括SpanQueries,是的,您将不得不处理任何分析问题。这不仅包括删除"",而且最有可能" Best Stuff"将被分析为两个术语("最好"和#34;东西"),并且必须在您的SpanQuery中表示。

2 - 是的。

相关问题