Lucene Solr自定义标记生成器-如何将定界符特殊字符作为标记包括在内?

时间:2019-01-23 17:13:14

标签: solr lucene tokenize

我需要为Solr中的源代码文件编写一个标记器,但是没有选择包括自定义JAR。因此,例如:

输入:foo.bar

令牌:'foo', '.', 'bar'

我如何在schema.xml中有一个自定义标记生成器或过滤器,该标记器或过滤器可以拆分某些字符,但又不能删除该字符?

我尝试过Regex模式令牌生成器,但这会删除分隔符。

0 个答案:

没有答案