在solr索引中存储和导出原始令牌

时间:2013-12-23 11:11:52

标签: csv solr lucene token

我想在索引期间存储Solr生成的令牌,例如DictionaryCompoundWordToken,然后导出它们,希望使用CSVResponseWriter。有没有办法做到这一点?

我知道可以使用Analysis工具提供值并查看它们是如何标记化的,但我不知道如何对整个索引执行此操作,或者至少在查询的基础上执行此操作。

2 个答案:

答案 0 :(得分:2)

让我们看看,我认为您想要的是将某些字段的原始内容与字段值一起存储,但在经过某个分析链后,是吗?

您会认为copyFields会有所帮助,但它们并不像存储它们那样存储原始字段值。您需要使用updateProcessor。看看this talk Erik Hatcher给出的,分钟7:30到20:00 aprox,你会看到这个案例的解释非常好,只有例子和所有。

存储在索引中后,您可以将其返回并执行任何您喜欢的操作。

答案 1 :(得分:0)

查看此内容的一种方法是,您将使用DictionaryCompoundWordToken或任何其他符合您需求的分析将文档内容编入“mytext”字段。然后你可以使用q = *:*在“mytext”上进行分析,你的查询看起来像这样:http://localhost:8983/solr/collection1/select?q=*%3A*&start=0&rows=1&wt=xml&indent=true&facet=true&facet.field=mytext这应该给出mytext中的所有标记。但我对你在问题中所说的内容并不是100%肯定你的期望。让我知道这有帮助。

相关问题