如何使用带有OrientDb参数的NGramTokenizer创建Lucene索引?

时间:2016-04-15 22:28:43

标签: lucene orientdb

我正在寻找一种在OrientDB中使用NGramTokenizer的方法。我需要的是将minGrammaxGram参数传递给构造函数。 The documentation example展示了如何将分析器与无参数构造函数一起使用:

orientdb> CREATE INDEX City.name ON City(name) FULLTEXT ENGINE LUCENE METADATA
          {"analyzer": "org.apache.lucene.analysis.en.EnglishAnalyzer"}

但是如何使用带有参数的tokenizer?我可以使用这样的东西:

orientdb> CREATE INDEX City.name ON City(name) FULLTEXT ENGINE LUCENE METADATA
          {"analyzer": "org.apache.lucene.analysis.ngram.NGramTokenizer(2,3)"}

1 个答案:

答案 0 :(得分:4)

好吧,NGramTokenizer 不是分析器,它是一个Tokenizer。您需要传入Analyzer作为分析器参数。

您可以使用 NGramTokenizersuch as this one编写自己的自定义分析器