Lucene标准分析仪分期

时间:2011-03-14 12:37:32

标签: lucene tokenize

如何在'。'上使Lucene的标准分析器标记化。炭? 例如,在查询“B”时,我需要它返回“A.B.C”中的B作为结果。我需要按标准分析仪处理它的方式处理数字,因此Simple分析器是不够的。 如果我可以指定标准分析器来标记''',那将是完美的。 char也是。如果我不得不用这个小扩展编写我自己的标记器,我该怎么办? 谢谢, 纳差

1 个答案:

答案 0 :(得分:1)

我认为最简单的方法是创建自己的分析器。它将从StandardAnalyzer获取令牌作为输入,并在点上进一步分割令牌,保持无点令牌完好无损。

The package summary就如何做到这一点给出了一些建议。 This blog post似乎非常相关,但使用旧版本的Lucene,因此您可能需要调整它。另请参阅Lucene FAQ