Solr字段映射?

时间:2014-09-18 11:25:09

标签: solr

我正在将文档索引到源代码中的solr。在源头,对于每个文档,我都有一些相关的属性,我正在索引&进入solr。

我正在做的是我从源属性映射一些字段与solr架构字段。但我可以在solr日志中看到几个额外的字段,我没有映射。在solr admin UI中查询时,我只能看到映射的字段。

E.g。在下面的日志中,我只使用content_name& content content_modifier但我也可以看到模板字段。

  

INFO - 2014-09-18 12:07:47.185; org.apache.solr.update.processor.LogUpdateProcessor; [collection1] webapp = / solr path = / update / extract params = {literal.content_name = 1_.000& literal.content_modifier = System& literal.Template = {8ad4d8f0-93a7-4941-9657-cf3706f00409} {add = [1_ .000(1479581071766978560)]} 0 0

所以这里发生了什么? solr索引仅映射字段并跳过其余未映射的字段吗?或者将solr索引所有字段,包括映射&非映射但在管理UI上,它只显示映射的字段?

请建议。

1 个答案:

答案 0 :(得分:0)

您的问题由您的solrconfig和架构所说的定义,因为您可以按照您想要的任何方式对其进行配置。以下是它对Solr 4.10的示例模式的工作原理:

1)在solrconfig.xml中,the handler use "uprefix" parameter将非模式中的所有字段映射到动态字段忽略_ *

2)在schema.xml中,该动态字段has type ignored

3)Type ignored (in the same file)定义为 stored = false indexed = false 。这意味着如果你得到一个具有匹配模式的字段,但没有做任何事情就不要抱怨,实际上是忽略。

因此,如果您不喜欢这样,您可以修改该管道的任何部分。最简单的测试是更改动态字段以使用类型字符串和重新索引。然后,您应该看到其余的字段。